詳細を見る
Anthropicは2026年4月16日、大規模言語モデルの最新版Claude Opus 4.7を一般公開しました。同社によると、前世代のOpus 4.6から高度なソフトウェアエンジニアリング能力が大幅に向上し、複雑で長時間にわたるタスクを高い精度で自律的に処理できるようになっています。価格はOpus 4.6と同じ入力100万トークンあたり5ドル、出力100万トークンあたり25ドルで、APIのほかAmazon Bedrock、Google Cloud Vertex AI、Microsoft Foundryで利用可能です。
主要ベンチマークでは、知識労働を評価するGDPVal-AAでEloスコア1753を記録し、OpenAIのGPT-5.4(1674)やGoogleのGemini 3.1 Pro(1314)を上回りました。エージェント型コーディング評価のSWE-bench Proでは64.3%のタスクを解決し、Opus 4.6の53.4%から大きく改善しています。ただし、エージェント検索やマルチリンガルQAなど一部の領域ではGPT-5.4がなお優位であり、全分野で圧倒する結果ではありません。
視覚処理面では、画像の最大解像度が長辺2,576ピクセル(約375万画素)まで拡大され、従来比3倍以上の高解像度入力に対応しました。XBOWの視覚精度ベンチマークでは成功率が54.5%から98.5%に跳ね上がり、画面操作エージェントや複雑な図面からのデータ抽出といった用途の実用性が大きく高まっています。また、自身の出力を検証してから報告する「自己検証」行動が確認されており、ハルシネーションの抑制にも寄与しています。
安全面では、同社が先日発表した高性能モデルMythos Previewはセキュリティ上の理由で限定提供のままですが、Opus 4.7にはサイバー攻撃に関する高リスクな要求を自動検知・ブロックする仕組みが組み込まれました。脆弱性調査やペネトレーションテストなど正当な目的で利用したいセキュリティ専門家向けには、新たに「Cyber Verification Program」が設けられています。
開発者向けの新機能も複数追加されています。思考の深さを調整する「effort」パラメータにxhighレベルが加わり、性能とレイテンシのバランスをより細かく制御できます。APIではタスクバジェット機能がパブリックベータとして提供され、トークン消費量に上限を設定できるようになりました。早期テスターのIntuit、Replit、Notion、Cursorなど多数の企業が、コード品質やワークフロー効率の改善を報告しています。