MIT、空間データの信頼区間推定を刷新する新手法を開発
既存手法の限界と問題の発見
空間的平滑性を活用した新手法の優位性
詳細を読む
MITの研究チームは、空間データを対象とした統計的関連性推定において、従来の機械学習手法が生成する信頼区間が根本的に誤っている問題を発見し、それを解決する新しい手法を開発しました。
従来手法は、データが独立同分布であること、モデルが完全に正しいこと、学習データと推定対象データが類似していることを前提としています。しかし空間データではこれらの前提が成立しないため、信頼区間が完全に外れてしまうことがあります。
たとえば、EPA(米国環境保護庁)の大気センサーは都市部に集中して設置されていますが、そのデータを使って農村部の健康アウトカムを推定しようとすると、データの性質が根本的に異なるためバイアスが生じます。
新手法は「空間的平滑性」という仮定を採用しています。たとえば微粒子大気汚染は一つのブロックから次のブロックへ急激に変化せず、汚染源から遠ざかるにつれ緩やかに減少するという性質です。この仮定は空間問題の実態により即した合理的なものです。
主任研究者のタマラ・ブロダリック准教授(MIT EECS)は、「天気や森林管理など、空間的な現象の理解が求められる問題は非常に多い。この種の問題群に対して、より適切な手法が存在し、より良いパフォーマンスと信頼性の高い結果をもたらせることを示した」と述べています。
シミュレーションと実データを用いた比較実験において、この新手法は既存の複数の手法の中で唯一、空間分析において一貫して信頼できる信頼区間を生成することが確認されました。観測データにランダムな誤差が混入している場合でも安定した性能を発揮します。
今後の研究として、チームは本手法をさまざまな変数タイプに適用し、他の応用分野への展開も探る予定です。本研究は、MIT社会的・倫理的コンピューティング責任(SERC)シード助成金、海軍研究局、Generali、Microsoft、全米科学財団(NSF)の支援を受けています。