OpenAIがAI学習効果の長期測定フレームワークを開発

測定スイートの概要

学習成果測定スイートを新開発
タルトゥ大学・スタンフォードと共同設計
学習者の縦断的な変化を追跡
認知・メタ認知の標準指標を統合
エストニアで2万人規模の検証開始

スタディモード研究成果

300人超の大学生無作為化試験実施
経済学で約15%のスコア向上確認
長期的な学習定着が今後の課題
詳細を読む

OpenAIは、AI が学習成果に与える影響を長期的に測定するための「学習成果測定スイート」を開発したと発表しました。エストニアのタルトゥ大学およびスタンフォード大学のSCALEイニシアティブと共同で設計されたこのフレームワークは、教育機関や研究者が多様な文脈でAIの学習効果を評価できるよう支援します。

従来の研究手法はテストスコアなど短期的な指標に依存しており、AIが学習者の思考力や自律性に与える長期的な影響を捉えることができませんでした。同スイートはこの課題を解決するため、モデルの振る舞い・学習者の反応・認知的成果という三つのシグナルを統合的に分析する仕組みを備えています。

先行研究として、OpenAIChatGPTのスタディモードを用いた300人超の大学生対象の無作為化比較試験を実施しました。ミクロ経済学の試験では、スタディモードを利用した学生が対照群と比較して約15%高いスコアを記録するなど、教育的に設計されたAI対話が成績向上に寄与する可能性が示されました。

測定スイートには、学習中の重要な瞬間を自動検出するインタラクション分類器、教育学的原則に基づいて各学習場面を評価するグレーダー、そして同一学習者の経時的変化を追跡する縦断的グレーダーが含まれます。自律的動機づけ・課題への粘り強さ・メタ認知・記憶の正確性といった包括的な学習能力の変化を捉えることが可能です。

現在、エストニアで16〜18歳の学生2万人を対象とした大規模検証が進行中です。今後はアリゾナ州立大学・UCL・MITメディアラボなどLearning Labの参加機関とも研究を拡大し、測定スイートを世界中の教育機関が利用できる公共リソースとして公開する計画です。