3日で消えたトップモデルが世界に戻る
6月9日に華々しく登場したFable 5が、わずか3日後に世界中から姿を消しました。原因は米政府による輸出規制の指示です。Amazonの研究者が、このモデルの安全装置をすり抜けさせ、ソフトウェアの欠陥を突くコードまで書かせる手口を見つけたと報告したのが引き金でした。もっとも、Anthropicの受け止めは違います。実際にやらせたのはコードベースを読んで欠陥を指摘させる程度で、GPT-5.5など他社のモデルでも普通にこなせる範囲だと会社側は反論しています。同じ現象を、政府は危険な突破口と見なし、会社は日常的な防御作業と見なしました。この温度差こそ、今回いちばんの火種です。
一部のユーザーだけを止められないなら、全員を止めるしかありません。国籍をその場で確かめる仕組みがないという一点が、世界中のアクセスをまるごと巻き込みました。
18日間の空白を経て、7月1日、Fable 5とMythos 5はようやく戻ってきました。戻ってきたのは、以前とそっくり同じ姿ではありません。ここが今回いちばん語られていない肝だと筆者は見ています。
安全装置を足した代償は開発者が払う
変わったのは、守り方の細かさです。Anthropicは、Amazonが報告した抜け道だけを狙い撃ちする自動分類器を、新たに訓練しました。社内の検証では、報告された悪用手法を99パーセント以上の試行で止められたといいます。厄介なのはここからです。この分類器はかなり広めに網を張るため、悪意がありそうな曖昧な指示を、疑わしいという段階で先回りしてはじきます。境界に触れた処理は、ひとつ前のOpus 4.8へ自動で振り替えられる仕組みです。安全側へ大きく倒した代償もはっきりしています。ふつうのアプリ開発やコードの不具合探しの最中に、害のない依頼まで巻き添えで止められる場面が増えました。守りを固めるほど、日々手を動かす開発者ほど不便を背負わされます。
本当の主役は安く動くSonnet 5
規制の話題に隠れがちですが、Anthropicが今回いちばん売りたいのはFable 5ではありません。同時に発表されたClaude Sonnet 5です。狙いははっきりしています。自律的に動くエージェントを、実行力を落とさずに安く走らせること。ブラウザを操り、ターミナルを叩き、複数の手順を人の介在なしにこなします。その中身はOpus 4.8にかなり近づきました。SWE-bench Proで63.2パーセント、Terminal-Bench 2.1では80.4パーセントと、前世代のSonnet 4.6を明確に上回ります。料金は据え置きのうえ、8月31日までは入力100万トークンあたり2ドル、出力10ドルという導入価格が付きました。この導入期間に限れば、Opus 4.8の半額以下です。9月以降の通常価格でも、四割ほど安く収まります。エージェントを回し続けるチームが飛びつくのも当然でしょう。
Zapierが途中で止まらなくなった自動化
数字よりも、現場の声のほうが雄弁です。ZapierのシニアエンジニアであるDaniel Shepardは、二段階の自動化をこのモデルに丸ごと任せたと語っています。Salesforceの顧客ランクを更新し、その流れで告知文を作って企業の担当者へ送り出す。以前のモデルは、この手の作業を決まって途中で放り出していました。それが一度も止まらず、最後まで走り切ったといいます。日々の自動化なら迷う理由がない、というのが彼の評価です。開発現場からも同じ手応えが上がっています。コードエディタCursorの共同創業者Sualeh Asifは、エージェントが計画から外れず、自分たちの流儀を守ったまま、複数の手順にまたがる変更をきれいに仕上げると述べました。しかも安く。途中で崩れないという一点が、試験導入から本番投入への壁を確実に下げています。
政府が実力行使に踏み切った前例
今回の一件は、単なる一社の混乱では終わりません。商業展開ずみのフロンティアモデルを、ジェイルブレイクの懸念だけを理由に政府が引きずり下ろした。おそらく世界で初めての事例です。商務長官のHoward Lutnickは、Anthropicが安全上のリスクを自ら進んで見つけて手を打つと約束したから解除に踏み切った、と説明しています。会社の側は、数億人が使うモデルを狭い抜け道ひとつで丸ごと止める判断に、公然と異を唱えました。守る側の論理と、動かし続けたい側の論理。両者の綱引きは、今回の解除で終わったわけではありません。次に政府が動くとき、AI各社はもう同じようには身構えないはずです。ひとつのジェイルブレイク報告が、モデルの止め方をめぐる力関係を、はっきり書き換えました。

