AIモデルが自問自答で自力学習——推論能力の新パラダイム
出典:WIRED
詳細を読む
Wiredが報じた新しい研究では、AIモデルが自分自身に問題を生成・解答することで推論能力を向上させる新手法が紹介されています。従来は人間がラベル付けしたデータで学習するのに対し、この自己問答学習は人間の監督なしにモデルが自力で能力を伸ばすアプローチです。
数学、コーディング、論理的推論の分野で特に効果が高く、モデルが自ら難しい問題を見つけて繰り返し学習するサイクルが形成されます。強化学習の枠組みと組み合わせることで、モデルが間違いから自律的に学ぶ仕組みが実現します。
この技術はアノテーションコストの削減とモデルの自律的な能力向上という二つの効果をもたらします。OpenAIのo3やDeepSeekのR1に代表される「考える」AIモデルの発展トレンドと合流し、2026年以降のAI能力向上の加速を支える基盤技術となりうるものです。