2026年6月12日、AI企業のAnthropicは、米国政府から輸出管理指令を受け、同社の主力モデルである「Fable 5」および「Mythos 5」への全ユーザーのアクセスを一時停止したことを公式に発表しました。
この指令は国家安全保障当局の指示に基づくもので、外国人(Anthropicの外国人従業員を含む)によるこれらモデルへのアクセスをすべて停止する内容です。対象は米国内外を問わず、実質的にグローバルでのサービス提供が停止された形となっています。なお、Anthropicのほかのモデルへのアクセスへはに影響はないとされています。
政府の懸念と、Anthropicの反論
政府からの通知は東部時間の午後5時21分に届いたとされ、国家安全保障上の懸念の具体的な詳細は書簡に記載されていませんでした。政府はFable 5をバイパスする、いわゆる「ジェイルブレイク(脱獄)」の手法を把握したと主張しているとみられます。
これに対しAnthropicは、確認されたジェイルブレイクの手法はいずれも限定的かつ非普遍的なものであり、他の公開モデル(OpenAIのGPT-5.5を含む)でも同様の能力が確認できると反論しています。また、政府に共有されたとされる脱獄手法は、「特定のコードベースをモデルに読み込ませてソフトウェアの欠陥を修正させる」という限定的なものであり、汎用的な脱獄には当たらないという立場です。
同社はFable 5のリリース時点から、完全な脱獄耐性はどのモデルプロバイダーにとっても現実的に不可能であることを明示していました。その前提のもとで「多層防御」戦略を採用し、脱獄の発生を限定的なものにとどめつつ、監視体制によって迅速に検知・対処する設計を取ってきたとしています。Fableで顧客データを30日間保持することを義務付けた背景にも、この方針があると説明しています。
さらにAnthropicは、政府の措置がこれまで同社が公に述べてきた「透明性・公平性・明確性を備えた法的手続き」という原則に反するとして、異議を表明しています。
AIガバナンスの未整備が浮き彫りにした構造的な問題
今回の件が示唆するのは、生成AIの能力が急速に拡張するなかで、それを評価・規制するための枠組みがまだ十分に整備されていないという現実です。
Anthropicは発売前に、米国政府・英国AISI・複数の民間第三者機関・社内チームと連携し、数千時間規模のレッドチーム演習を実施しています。その結果として「これまで導入されたどのモデルよりも安全対策が効果的」と評価されたモデルが、発売からわずかな期間でアクセス停止命令を受けたことは、AI安全性の「評価基準」そのものへの問いを投げかけているとも捉えられます。
生成AIの安全性評価は、技術的な実証だけでなく、どの基準を用いるか・誰が評価するか・どの水準を「許容」とするか、という政策的・社会的判断と深く結びついています。今回の措置は、そうした基準の不透明さや非対称性が、実際のサービス運営に直接影響を与えうることを示した事例といえます。
生成AIを業務活用している企業にとっては、特定モデルへの依存リスクを改めて考慮するきっかけになるかもしれません。生成AIの導入・選定を検討している場合は、モデルの性能だけでなく、提供企業のガバナンス体制や、規制リスクへの対応力も評価軸に加えることが今後重要になってくると考えられます。
まとめ
AnthropicがFable 5・Mythos 5へのアクセスを一時停止した今回の件は、単なるセキュリティインシデントではなく、生成AIをめぐる政府・企業・社会の関係性が本格的に問われはじめた局面を示すものと受け取れます。
Anthropicは「誤解によるものと考えており、できる限り早く復旧できるよう努める」と述べており、今後24時間以内に追加情報を開示する意向も示しています。状況は流動的であり、今後の政府との交渉や技術的な説明がどのように展開するかが注目されます。
AIガバナンスのあり方はまだ模索段階にあります。今回のような事例が、業界全体のルール形成にどう影響していくのか、引き続き動向を見守る必要があります。

