世界モデル3方式が物理AI基盤として急浮上
LLMの物理的限界
産業応用と今後
詳細を読む
大規模言語モデル(LLM)がロボティクスや自動運転など物理世界の理解を要する領域で限界に直面しており、投資家の関心が「世界モデル」へ急速にシフトしています。AMI Labsが10.3億ドル、World Labsが10億ドルのシード資金を相次いで調達しました。
チューリング賞受賞者のリチャード・サットン氏はLLMが人間の発言を模倣するだけで世界をモデル化していないと警告しました。Google DeepMindのデミス・ハサビスCEOも、現在のAIは数学五輪を解けるのに基本的な物理で失敗する「不均一な知性」を抱えていると指摘しています。
第1のアプローチ「JEPA」は、ピクセルレベルの予測ではなく潜在的な抽象表現を学習する手法です。人間が車の軌道と速度を追跡し背景の細部を無視するように、核心的な物理法則のみを捉えます。計算効率が高くリアルタイム推論に適しており、AMIは医療企業Nablaと提携してヘルスケア分野での活用を進めています。
第2のアプローチはWorld Labsが採用する「ガウシアンスプラット」で、画像やテキストから完全な3D空間環境を生成します。Unreal Engineなどに直接インポートでき、Autodeskが産業設計への統合を目的に同社を強力に支援しています。第3のアプローチはDeepMindのGenie 3やNvidiaのCosmosに代表されるエンドツーエンド生成で、モデル自体が物理エンジンとして機能します。
今後は各アプローチの長所を組み合わせたハイブリッドアーキテクチャの台頭が見込まれます。サイバーセキュリティ企業DeepTempoはLLMとJEPAを統合した「LogLM」でログ異常検知を実現しており、LLMが推論・対話層を担い世界モデルが物理・空間データ基盤となる構図が形成されつつあります。