
Anthropic のサイバーセキュリティ AI「Fable」、研究者から制限が厳しすぎると批判
TechCrunch の報道によると、Anthropic が火曜日(6月10日)にサイバーセキュリティ向けモデル「Mythos」の公開限定版「Fable」をリリースしたが、セキュリティ研究者から安全ガードレールが過度に制限的だとの不満が上がっている。
Fable は Mythos の公開・限定版として提供されているが、サイバーセキュリティおよび生物学関連のプロンプトに敏感に反応し、正当なセキュリティエンジニアリングタスクまで遮断しているとされる。研究者らは、制限がキーワードベースで雑に実装されているように見えると指摘している。
Fable の制限内容
IBM X-Force に所属するセキュリティ研究者 Valentina Palmiotti は「Fable はサイバーセキュリティに関連する可能性のあるリクエストを拒否する。ブログ記事を読むといった無害なタスクさえも」とコメントした。
Fable がガードレールに触れると、Claude Opus 4.8 へのフォールバックが発動する。ガードレールは、マルウェア開発やソフトウェア侵害のリスクを制限するため、およびサイバーセキュリティと生物兵器開発に関連するトピックをカバーするために導入されている。
研究者からの指摘
Matt Suiche は「セキュアなコードを書くよう求めても、サイバーセキュリティ関連の作業と判断されず、ソフトウェアエンジニアリングのベストプラクティスと見なされ、ダウングレードされる」と述べた。また「キーワードベースであるようで、『サイバーセキュリティ』という語彙領域に属する何でもがガードレールをトリガーする」と指摘している。
認証プログラムとの競争
Anthropic はサイバーセキュリティ専門家向けに「Cyber Verification Program」への応募を要求し、より少ない制限を提供している。同様に OpenAI も「Trusted Access for Cyber」という同様のプログラムを運営している。
一方で Suiche は「初期段階であり、Anthropic がまだガードレールを適応させている最中であることは理解できる。Anthropic と他のフロンティアモデル企業が次世代のサイバーセキュリティ企業とさらに協力すれば、時間とともに進化するだろう」とコメント。「こうしたリリースをする場合、十分でないより多くの人をキャッチする方が良く、時間をかけてガードレールを緩和することが望ましい」と述べた。
Mythos のロールアウト
Mythos は4月にリリースされ、当初は Project Glasswing の限定的な企業・組織に制限されていた。先週、15 カ国の数百の組織へのアクセスが拡張された。
筆者の見立て
- ガードレールの雑な性質が多くのセキュリティ専門家を遠ざけているとの見方を示している
この記事は元記事の事実のみに基づいて自動生成されました。
出典
TechCrunch「Cybersecurity researchers aren't happy about the guardrails on Anthropic's Fable」 https://techcrunch.com/2026/06/10/cybersecurity-researchers-arent-happy-about-the-guardrails-on-anthropics-fable/