AI「Claude」の応答品質が低下した原因は3つのバグだった 🐞🤖

2025年8月上旬から9月上旬にかけて、Anthropicが提供するAI「Claude」の応答品質が断続的に低下したという報告が相次ぎました。ユーザーの中には「返答が遅い」「文脈に合わない文章が返ってきた」といった不具合を体験した人も多かったようです。Anthropicが調査した結果、3つのインフラ関連のバグが原因であったことが判明しました。

公式ポストモーテム（英語）はこちら

1つ目のバグ：サーバー間のルーティングエラー ⚡
2つ目のバグ：TPUサーバーの誤設定 🔧
3つ目のバグ：XLAコンパイラの潜在不具合 🖥️
なぜ発見が遅れたのか？🔍
今後の対策とユーザーへのメッセージ 📢
まとめ ✅

1つ目のバグ：サーバー間のルーティングエラー ⚡

最初の問題は、コンテキストウィンドウを処理するサーバーへのデータ転送ミスでした。

2025年8月5日、20万トークン対応の「Sonnet 4」モデルへのリクエストが、誤って100万トークン用サーバーに送信。
この時点でユーザーリクエストの約**0.8％**に影響が発生。
8月29日には負荷分散処理の影響で短いコンテキストのリクエストまで長コンテキスト用サーバーに送られるようになり、8月31日には16％のリクエストが影響を受けました。

特に問題だったのは、一度誤ったサーバーに転送されると次回以降も同じサーバーに繋がる可能性が高かったこと。結果として、同じユーザーが繰り返し遅延や品質低下を体験してしまいました。
➡️ Anthropicはルーティングロジックを修正し、9月4日に修正版をデプロイしています。

2つ目のバグ：TPUサーバーの誤設定 🔧

次の問題はTPUサーバーの誤った設定によるものでした。

8月25日のデプロイでエラーが発生し、トークン生成時に**文脈に不適切な言語（英語プロンプトから中国語やタイ語が出力されるなど）**が紛れ込む現象が発生。
影響期間：
- Opus 4 / Opus 4.1 → 8月25日〜28日
- Sonnet 4 → 8月25日〜9月2日

この問題は9月2日に特定され、ロールバックが実施されました。加えて、今後は「不自然な文字列が混入していないか」を検出するテストも追加されています。

3つ目のバグ：XLAコンパイラの潜在不具合 🖥️

最後の問題は、新しいトークン選択改善コードのデプロイがきっかけでした。

2025年8月25日に導入されたコードにより、機械学習コンパイラ「XLA」に潜んでいたバグが発動。
本来選ばれるべき「最も確率が高いトークン」が意図せず除外される事態が発生。
影響範囲：
- Claude Haiku 3.5 → 明確に影響確認
- Sonnet 4 / Opus 3 → 一部で影響報告あり

Anthropicは順次ロールバックを実施：

Haiku 3.5 → 9月4日修正
Opus 3 → 9月12日修正
Sonnet 4 → 再現性は確認されなかったが、安全策として修正

なぜ発見が遅れたのか？🔍

Anthropicは、今回の問題発見が遅れた理由として以下を挙げています。

プライバシー保護の徹底：エンジニアがユーザーとClaudeのやり取りを直接見ることが制限されており、未報告の不具合を検出しにくかった。
複雑なインフラ構成：Claudeは複数のハードウェアプラットフォームに分散されているため、特定のユーザーには不具合が出ても、他のユーザーには出ないという状況が混乱を招いた。