Anthropicが新しいClaudeの行動規範「憲法」を公開

AnthropicClaude

憲法の核心原則

役立つ・正直・無害の三原則
人類の破滅的損害を回避
AIの自律的権力拡大を禁止
人間の監督権を常に尊重

産業への影響

AI安全の公開基準として機能
他社の参照モデルに
モデル仕様書という形式を確立
エンタープライズ採用の信頼材料
詳細を読む

Anthropicは2026年1月21日、Claudeの行動を規定する新しい「モデル仕様書(憲法)」を公開した。役立つこと・正直であること・人類を破滅させないことの三原則を中核に置いた包括的なガイドラインだ。

この仕様書は、AIが自律的に権力や資源を蓄積することを明示的に禁じており、人間の監督を最優先に設計されている。AIが誠実さより服従を選ぶ場面を具体的に例示している点が注目される。

業界標準として参照される可能性が高く、他のAI企業がモデルの行動原則を文書化する潮流を加速させると見られる。Anthropicはこの公開によりAI安全における信頼性を高める狙いがある。