カーネギーメロン大学の研究チームがAIエージェントの安全性を評価するための標準化ベンチマークを開発しました。有害行動の検出に特化した評価指標を提供します。 AIエージェントの安全性評価の標準化は、産業界や規制当局がエージェント展開を判断する際の共通基準として重要な意義を持ちます。