MIT、3択順位付けで選好予測を高精度化

研究の核心

100年続く2択比較の限界を証明
選好間の相関は2択では検出不能
3択順位付けで相関を抽出可能

AIへの応用

ランダム効用モデルの精度向上
LLMの選好学習と整合に直結
実験数は項目数に対し非指数的
詳細を読む

マサチューセッツ工科大学(MIT)の研究チームが2026年6月11日、人の選好を予測する数理手法を改良する成果を発表しました。従来の2項比較では選択肢間の相関を捉えられないと数学的に証明し、3つの選択肢を順位付けさせる方式が高精度な予測を可能にすると示しました。経営者エンジニアにとって、推薦システムやAIの精度を左右する基盤技術となります。

土台にあるのは、約100年前に心理学者サーストンが提唱したランダム効用モデル(RUM)です。人が複数の選択肢から最も価値の高いものを選ぶという前提に立ち、行政や産業界で「ある幹線道路が封鎖されたら人々はどう通勤するか」といった反実仮想の予測に広く使われてきました。AIアシスタントのGabriele Farina氏は、人それぞれ好みが異なり時間でも変わるため、モデルは本質的に確率的だと説明します。

問題は、モデルの推定に使うデータがサーストン以来ほぼ2択比較に偏ってきた点にあります。AかBのどちらを選ぶかは答えやすい一方、Constantinos Daskalakis教授は「2つずつ見る方式では多数の選択肢間の相関を見つけられない」と指摘します。たとえば独立系映画を好む人は外国映画も好む傾向がありますが、2択データだけではこうした結びつきが見えないのです。

チームは、2択比較のみから相関情報を得るのは不可能だと証明しました。一方、多数の人が3つの選択肢を好みの順に評価すれば相関を識別でき、3択ベストと2択ベストの組み合わせでも同じ情報が得られます。PhD学生のSobhan Mohammadpour氏は、個々の順位結果を一つの大きなモデルに統合する手法を開発したと述べています。

実用面でも追い風があります。Farina氏によれば、必要な実験数はカタログの項目数に対して指数的に増えないため、効率的なアルゴリズムが成立します。この成果は4月にリオデジャネイロで開かれた国際会議ICLRで発表されました。

Daskalakis教授は、RUMが1990年代後半以降のインターネット経済に不可欠だったように、今後はAIモデルの整合(アライメント)にも中心的役割を果たすと強調します。LLMの学習では人が候補出力を順位付けし、モデルが好まれる文体や内容を学びます。なぜ3択が鍵なのか。膨大な選択肢すべてを聞き出せない以上、少ない問いで相関まで捉える設計が、より正確な予測モデルへの実践的な道筋になるからです。