GPT-5.5がMythosと同等のサイバー攻撃能力と判明

2026年05月01日 OpenAI Anthropic ネットワークシミュレーション GPT-5 リスク

英国AISIの評価結果

Expert課題でGPT-5.5が71.4%達成

Mythos Previewは68.6%で誤差範囲内

企業ネットワーク侵入試験も同水準

発電所制御への攻撃は両モデルとも失敗

AIサイバー脅威の実態

Anthropicの制限公開判断に疑問符

GPT-5.5は一般公開済みで同等性能

サイバー能力の誇張リスクが浮上

出典：Ars Technica

詳細を読む

英国AI安全研究所（AISI）は2026年5月1日、OpenAIが前週に一般公開したGPT-5.5のサイバーセキュリティ能力評価を公表しました。95種類のCapture the Flag課題を用いたテストで、GPT-5.5はAnthropicが「突出したサイバー脅威」として限定公開したMythos Previewと同等の性能を示しました。

最高難度のExpert課題では、GPT-5.5が平均71.4%を達成し、Mythos Previewの68.6%をわずかに上回りました。ただし統計的な誤差範囲内です。特に注目すべきは、Rustバイナリを逆アセンブルする高難度課題をGPT-5.5が10分22秒、API費用わずか1.73ドルで解いた点です。

企業ネットワークへの32段階のデータ窃取攻撃を再現した「The Last Ones」テストでは、GPT-5.5が10回中3回、Mythos Previewが10回中2回成功しました。過去にこのテストを突破したAIモデルは存在せず、両モデルとも画期的な結果です。一方、発電所の制御ソフトウェアを標的とした「Cooling Tower」シミュレーションには両モデルとも失敗しています。

この結果は、Anthropicが先月Mythosの公開を「重要な業界パートナー」に限定した判断に疑問を投げかけます。同等の能力を持つGPT-5.5がすでに一般公開されている以上、アクセス制限だけではサイバー脅威の抑止にならないことが明らかになりました。AIモデルのサイバー能力に関する誇大な主張と、実際のリスク評価との間にある乖離が改めて浮き彫りになっています。