---
source_url: https://stratechery.com/2026/anthropics-safety-superpower/
source_title: "Anthropic’s Safety Superpower"
source_site: "Stratechery by Ben Thompson"
source_published_at: 2026-06-15T10:00:00+00:00
hero_image: https://s0.wp.com/_si/?t=eyJpbWciOiJodHRwczpcL1wvaTAud3AuY29tXC9zdHJhdGVjaGVyeS5jb21cL3dwLWNvbnRlbnRcL3VwbG9hZHNcLzIwMThcLzAzXC9jcm9wcGVkLWFuZHJvaWQtY2hyb21lLTUxMng1MTItMS5wbmc_Zml0PTUxMiUyQzUxMiZzc2w9MSIsInR4dCI6IlN0cmF0ZWNoZXJ5IGJ5IEJlbiBUaG9tcHNvbiIsInRlbXBsYXRlIjoiZWRnZSIsImZvbnQiOiIiLCJibG9nX2lkIjoxODgwNDM0MTV9.5VWck4PcKPWCTPe_HVznn3n3xsgn-G0b3d2OeiNNC7cMQ
tags: anthropic,ai-safety,government-regulation,language-models
generated_at: 2026-06-15T12:00:54.295Z
model: claude-haiku-4-5
---
# Anthropicの安全政策が政府規制との衝突を招く

米AI企業Anthropicが発表した新モデル「Fable」をめぐり、ジェイルブレイク発見から政府の輸出規制指令まで、わずか数時間で事態が急展開した。同社は安全性の名目で利用者データ保持ポリシーを変更し、LLM開発への制限を強化している。

## 発表から規制指令まで

Anthropicは2ヶ月前に「Mythos Preview」をサイバーセキュリティ能力の危険性を理由に非公開としていたが、安全ガードレール付きの「Fable」を公開リリースした。リリース直後にジェイルブレイク手法が発見され、政府は国家安全保障を根拠にFable 5とMythos 5へのアクセス停止を指令した。Anthropicは「本日5:21pm(ET)に指令を受けた」と述べ、「政府はFable 5の迂回またはジェイルブレイク方法の認識を得たと理解している」と説明した。

同社によると、「政府の書簡は国家安全保障上の懸念の詳細を示さなかった」とのことだ。Amazonが当該のジェイルブレイクを報告した。Amazonはサービス事業者としてInference基盤を提供し、Anthropicへの投資企業でもある。

## データ保持ポリシーとLLM開発制限

Anthropicは利用者データの保持期間を30日間に変更した。従来のエンタープライズプランではデータ保持なしを約束していたが、この新ポリシーでは全利用データを30日間保持することになる。同社は「保持データでの学習は行わない」と述べたが、「将来的に行わないことを保証するセーフガード」は実装していない。

また、LLM開発リクエストに対する制限も導入した。当初は性能の無言的低下(silent degradation)を実装したが、後にOpus 4.8への可視的な振り替えに変更した。この制限の影響は全トラフィックの約0.03%であり、0.1%未満の組織に集中していると推定される。

## 競争戦略としての安全性

Satya Nadella (マイクロソフト) は「すべての企業は人的資本とトークン資本を構築する必要がある」と述べ、「すべての価値が少数のモデルにのみ蓄積されるなら、政治経済はそれを許容しないだろう」と指摘した。Anthropicは利用規約でClaude を競合モデル開発に使用することを禁止し、「この制限をセーフガード経由で実装することで、利用規約違反に最も積極的な関係者の加速を回避する」と説明した。

## 筆者の見立て

- Fableが新しい世代の先制学習の下流にあるとみられていることに加え、安全性という名目でのビジネス上の制限が正当化されている
- Anthropicの現在のデータ保持政策変更が顧客の大幅な流出につながらなければ、将来的に学習用途のデータ利用を開始する可能性がある
- Anthropicはフロンティアモデル開発を自社のみが行うべきと考えており、AIの用途に対して最終的な決定権を持ちたいという解釈が可能である
- Anthropicの安全性に関する正当化は、理由付けというより同社の中核的な信念に基づいているとみられる
- フロンティアAI企業とソフトウェア企業は衝突コースにあるという解釈ができる
- Anthropicは安全性の名目で、段階的にモデル機能を限定的なエンドポイント経由で露出させながらAPI アクセスを制限する戦略を強化する可能性がある

*この記事は元記事の事実のみに基づいて自動生成されました。*

## 出典

Stratechery by Ben Thompson「Anthropic's Safety Superpower」https://stratechery.com/2026/anthropics-safety-superpower/
