AI「Claude」の応答品質が低下した原因は3つのバグだった 🐞🤖

AI「Claude」の応答品質が低下した原因は3つのバグだった 🐞🤖 #news

2025年8月上旬から9月上旬にかけて、Anthropicが提供するAI「Claude」の応答品質が断続的に低下したという報告が相次ぎました。ユーザーの中には「返答が遅い」「文脈に合わない文章が返ってきた」といった不具合を体験した人も多かったようです。Anthropicが調査した結果、3つのインフラ関連のバグが原因であったことが判明しました。

公式ポストモーテム(英語)はこちら

1つ目のバグ:サーバー間のルーティングエラー ⚡

最初の問題は、コンテキストウィンドウを処理するサーバーへのデータ転送ミスでした。

  • 2025年8月5日、20万トークン対応の「Sonnet 4」モデルへのリクエストが、誤って100万トークン用サーバーに送信。
  • この時点でユーザーリクエストの約**0.8%**に影響が発生。
  • 8月29日には負荷分散処理の影響で短いコンテキストのリクエストまで長コンテキスト用サーバーに送られるようになり、8月31日には16%のリクエストが影響を受けました。

特に問題だったのは、一度誤ったサーバーに転送されると次回以降も同じサーバーに繋がる可能性が高かったこと。結果として、同じユーザーが繰り返し遅延や品質低下を体験してしまいました。
➡️ Anthropicはルーティングロジックを修正し、9月4日に修正版をデプロイしています。

2つ目のバグ:TPUサーバーの誤設定 🔧

次の問題はTPUサーバーの誤った設定によるものでした。

  • 8月25日のデプロイでエラーが発生し、トークン生成時に**文脈に不適切な言語(英語プロンプトから中国語やタイ語が出力されるなど)**が紛れ込む現象が発生。
  • 影響期間:
    • Opus 4 / Opus 4.1 → 8月25日〜28日
    • Sonnet 4 → 8月25日〜9月2日

この問題は9月2日に特定され、ロールバックが実施されました。加えて、今後は「不自然な文字列が混入していないか」を検出するテストも追加されています。

3つ目のバグ:XLAコンパイラの潜在不具合 🖥️

最後の問題は、新しいトークン選択改善コードのデプロイがきっかけでした。

  • 2025年8月25日に導入されたコードにより、機械学習コンパイラ「XLA」に潜んでいたバグが発動。
  • 本来選ばれるべき「最も確率が高いトークン」が意図せず除外される事態が発生。
  • 影響範囲:
    • Claude Haiku 3.5 → 明確に影響確認
    • Sonnet 4 / Opus 3 → 一部で影響報告あり

Anthropicは順次ロールバックを実施:

  • Haiku 3.5 → 9月4日修正
  • Opus 3 → 9月12日修正
  • Sonnet 4 → 再現性は確認されなかったが、安全策として修正

なぜ発見が遅れたのか?🔍

Anthropicは、今回の問題発見が遅れた理由として以下を挙げています。

  • プライバシー保護の徹底:エンジニアがユーザーとClaudeのやり取りを直接見ることが制限されており、未報告の不具合を検出しにくかった。
  • 複雑なインフラ構成:Claudeは複数のハードウェアプラットフォームに分散されているため、特定のユーザーには不具合が出ても、他のユーザーには出ないという状況が混乱を招いた。

今後の対策とユーザーへのメッセージ 📢

Anthropicは再発防止策として、以下を進めています。

  • 不具合を正確に切り分ける評価手法の開発
  • プライバシーを守りながら効率的にデバッグできるインフラとツールの整備

さらに、公式声明で次のようにコメントしています。

「ユーザーの皆様がClaudeに一貫した品質を期待していることを十分認識しています。今回の不具合ではその基準を満たすことができませんでした。引き続き直接のフィードバックをいただけると大変助かります。」


まとめ ✅

  • 2025年8月〜9月にかけてClaudeの品質が低下
  • 原因は3つのバグ(サーバー誤ルーティング、TPU誤設定、XLA潜在バグ)
  • 影響は複数のモデル(Sonnet 4、Opus 4.1、Opus 3、Haiku 3.5など)に及んだ
  • Anthropicは修正を完了し、再発防止のための新体制を整備中

ユーザーとしては、今後の安定稼働に期待すると同時に、フィードバックを積極的に送ることが品質向上に繋がるでしょう。

タイトルとURLをコピーしました