Anthropicが最新AIモデルを非公開にした理由

AI

数千件の脆弱性を発見したモデルの正体

新しいAIモデルが完成したとき、普通の企業ならプレスリリースを打ち、デモを公開し、競合と比較するベンチマークスコアを誇示します。Anthropicが今回選んだのは、まったく逆の道でした。最新モデル「Claude Mythos Preview」を、静かに40以上の組織へ渡し、一般には公開しないと発表したのです。

その理由は、このモデルがすでに主要なオペレーティングシステムとウェブブラウザにまたがる数千件のサイバーセキュリティ脆弱性を発見してしまったから。Amazon Web Services、Apple、Google、Microsoft、Nvidiaをはじめとする大手が参加するプロジェクト「Glasswing」の下、インターネット基盤を守る立場の組織にだけ、このモデルへのアクセスが与えられています。

27年間誰も気づかなかったバグを掘り起こした

Mythos Previewはサイバーセキュリティ専用に訓練されたモデルではありません。Anthropicによれば、コーディング、推論、自律行動における汎用的な改善の「副産物」としてこの能力が生まれたといいます。そして、脆弱性を塞ぐ力と、悪用する力は表裏一体です。

現実の成果として、セキュリティ面で定評のあるOSであるOpenBSDに潜む27年前のバグを発見。さらに FreeBSD では、CVE-2026-4747と識別される17年前のリモートコード実行の脆弱性を、人間の介入なしに完全自律で特定・悪用してみせました。インターネット上の認証されていないユーザーが、NFSを動かすサーバーを完全制御できてしまうという、実害の大きな欠陥です。

Anthropicの研究者ニコラス・カーリーニはこう述べています。

このモデルは三つ、四つ、時には五つの脆弱性を連鎖させて、非常に高度な攻撃シナリオを構築できます。ここ数週間で、それまでの人生で見つけた数より多くのバグを発見しました。

既存のセキュリティベンチマークはほぼ飽和状態になり、Anthropicは評価の軸をゼロデイ脆弱性、つまり開発者さえ知らなかった欠陥の発見に移しています。モデルの能力がベンチマークを追い越した、ということです。

公開しない判断の重さ

Anthropicのフロンティア・レッドチーム・サイバーリードであるニュートン・チェンは率直にこう言い切っています。「サイバーセキュリティ能力を理由に、Mythos Previewを一般公開する予定はありません。AIの進歩の速度を考えると、同様の能力が、安全な運用にコミットしていないアクターにも広がるまで、そう長くはかからないでしょう。その影響は経済、公共の安全、国家安全保障にとって深刻なものになりえます」。

これは仮定の話ではありません。Anthropicはすでに、中国の国家支援グループがAIエージェントを使って世界30か所以上の標的へ自律的に侵入した事件を、AIが主導した最初のサイバー攻撃として記録しています。米政府の情報機関にもMythos Previewの全能力についてブリーフィングが行われており、攻撃・防御の双方でこのモデルが何を変えるか、現在も検討が続いています。

オープンソースが抱えてきた格差への回答

Glasswingが見えないところで届かせようとしているのが、オープンソースの世界です。Linux財団のCEO、ジム・ゼムリンはこう指摘します。「これまでセキュリティの専門知識は、大きなセキュリティチームを持つ組織だけの贅沢品でした。世界のインフラを支えるオープンソースのメンテナーたちは、セキュリティを自力で何とかするしかなかった」。

Anthropicはこの問題に、Linux財団傘下のAlpha-OmegaとOpenSSFへ250万ドル、Apacheソフトウェア財団へ150万ドルを寄付する形で応えます。加えてMythos Previewの利用クレジットとして最大1億ドルを提供し、規模の脆弱性スキャンを初めて現実のものにしようとしています。

「制御された展開」が新しい基準になる日

Anthropicは将来的にMythos級モデルを広く展開する意向を示しつつ、先に新たな安全策を次期Claude Opusモデルで試験運用する計画です。リスクの低いモデルで仕組みを磨いてから、高リスクモデルへ適用するという順序には、慎重さよりも戦略的な意図を感じます。

OpenAIも2月にGPT-5.3-Codexを「Preparednessフレームワーク上で高能力と分類した最初のモデル」と位置づけて公開しており、フロンティアラボが「能力の高いモデルは限定公開」という方向に舵を切りつつあることは明らかです。問題は、その判断を下せる立場にない組織や国家が同等の能力を手にしたとき、誰がどう対処するかという点にあります。Glasswingはその問いに答える試みですが、一つのプロジェクトで封じられる問題でないことも、Anthropic自身がよく知っているはずです。

タイトルとURLをコピーしました