当日夕方5時21分の指令
予告はありませんでした。2026年6月12日の夕方5時21分(東部時間)、Anthropicは米政府から一通の文書を受け取ります。国家安全保障上の権限を根拠とした輸出規制の指令であり、Fable 5およびMythos 5について、外国籍のすべての人物へのアクセスを停止するよう求めるものでした。米国内に在住する外国籍のAnthropic従業員も対象に含まれます。コンプライアンスを確実にするには、すべての顧客のアクセスを遮断するほかありません。Fable 5とMythos 5は即日停止されています。他のAnthropicモデルへのアクセスは引き続き維持されています。
政府が示したジェイルブレイクの中身
指令の文書には、具体的な国家安全保障上の懸念が記されていませんでした。Anthropicが把握している限りでは、政府はFable 5のセーフガードを回避するジェイルブレイク手法を入手したと主張しています。ただしこの時点で政府が提供したのは、文書ではなく口頭での証拠のみでした。
その手法の実態はどういうものだったのか。Anthropicが確認した報告書によると、それは「特定のコードベースを読んでソフトウェアの欠陥を修正するよう求める」という、極めて限定的な手法でした。OpenAIのGPT-5.5を含む他の公開モデルでも同等の能力が確認できるものであり、セキュリティ専門家が日常的にシステムを守るために使っているものです。これまでのところ有害な結果につながった深刻なジェイルブレイクの情報開示はなく、発見されたのはいずれも軽微な脆弱性で、Fable固有の危険な能力を引き出すものではないというのが同社の見解です。
完璧ではないと認めたうえでの多層防御
Anthropicはローンチ時から、Fable 5の完全なジェイルブレイク耐性を保証していませんでした。現時点ではどのプロバイダーも完璧な耐性を実現することは不可能だと公式に認めており、その前提のうえで多層防御の戦略を採用しています。
目指したのは、ジェイルブレイクの影響範囲を狭いものに限定するか、生成コストを非常に高くすることで現実的な脅威にしないことでした。万一突破された場合に備えた監視体制も組み合わせています。Fable 5の利用条件として顧客データの30日間保持を義務づけたのも同じ理由からで、ジェイルブレイクの兆候を早期に検知して対処するためです。顧客側に負担を強いる選択でしたが、Anthropicはそれを意図的に選びました。ローンチ前には米政府、英国のAISI、複数の民間機関が合計数千時間にわたってレッドチームテストを実施しており、Fable 5のセーフガードは既存のどのモデルよりも強固だという評価が出ています。
遵守しながらも突きつけた異議
Anthropicは法的指令に従い、Fable 5とMythos 5を停止しました。ただし、今回の判断には正面から異議を唱えています。非普遍的で狭い範囲のジェイルブレイクが見つかっただけで数億人規模のユーザーに展開した商用モデルの提供を停止する、という基準を業界全体に適用すれば、フロンティアモデルの新規展開はほぼ止まるでしょう。
同社が求めているのは、政府がモデルの展開を止める権限そのものを放棄することではありません。その判断が透明で、公正で、技術的な事実に根ざした法的プロセスのもとで行われることです。今回の命令はその要件を満たしていないとAnthropicは見ています。同社は24時間以内にさらなる詳細を公表するとしており、アクセス回復に向けた取り組みを続けています。Anthropicがどれだけ事前に準備を重ね、透明性を保とうとしても、一通の指令で全展開が止まり得るという現実を、業界はまだ消化しきれていないでしょう。

