詳細を見る
AnthropicはAIコーディングエージェント「Claude 4 Codex」を正式リリースしました。複数ファイルにわたる複雑な実装タスクを高い精度で自律的にこなします。
コンテキスト圧縮技術により、大規模リポジトリを横断する長期セッションでも文脈を正確に保ちながら継続作業ができ、複雑なタスクの長時間自律実行を安定して実現しています。
サイバーセキュリティ評価のCVE-Benchでは87%のスコアを記録し、従来モデルを大幅に上回る性能を示すことで防衛的セキュリティ用途への適用可能性を証明しました。
OpenAIは信頼できるセキュリティ研究者向けに防衛的サイバーセキュリティのパイロットプログラムを開始し、審査を通過したパートナーから順次利用範囲を段階的に拡大していく方針を明示しています。
ReplitはAIエージェントを安全に運用するための「スナップショットエンジン」の技術詳細を公式ブログで公開し、オープンソースコミュニティへの知見共有に貢献しました。
このスナップショット技術により、AIエージェントが誤った変更を加えた場合でも即座に以前の正常な状態へロールバックすることが技術的かつ確実に保証されており、安全性が大きく高まります。
今後は並列サンドボックスで複数の解法を同時試行する「並列サンプリング」機能の拡充も開発ロードマップに含まれており、エージェントの問題解決精度のさらなる向上が幅広い領域で期待されています。