ワールドモデルに関する最新ニュース（14件） | 【AI Times】生成AIやLLMの最新情報・ニュース

NVIDIA、次世代AI基盤Vera Rubinと1兆ドル売上見通しを発表

Vera Rubin全貌

7チップ統合の新プラットフォーム

専用CPU「Vera」とBlueField-4搭載

次世代Feynmanアーキテクチャも予告

宇宙データセンター構想を公開

エージェントAI戦略

OpenClaw対応を全社に要求

NemoClawでエージェント安全運用

Nemotron Coalitionで6モデル群展開

産業・医療への展開

BYD・日産ら自動運転新提携

IGX Thorで手術ロボット本格化

AWS・Microsoftと大規模GPU展開

詳細を見る

NVIDIAは2026年3月16日、サンノゼで開催したGTC 2026の基調講演で、創業者兼CEOのジェンスン・ファン氏が次世代フルスタックAIプラットフォーム「Vera Rubin」を発表し、2025年から2027年にかけて少なくとも1兆ドルの売上を見込むと宣言しました。

Vera Rubinは7つのチップ、5つのラックスケールシステム、1台のスーパーコンピュータで構成されるエージェントAI向け統合プラットフォームです。専用CPU「Vera」と新ストレージ基盤「BlueField-4 STX」を搭載し、さらに次世代アーキテクチャ「Feynman」や宇宙AI「Space-1」構想も予告されました。

エージェントAI分野では、オープンソースのOpenClawを全企業が戦略として持つべきだと強調し、エンタープライズ向けにポリシー制御やガードレールを備えた「NemoClaw」スタックとOpenShellランタイムを発表しました。DGX SparkやDGX Stationと組み合わせ、デスクトップで自律エージェントを安全に構築・運用できる環境を提供します。

クラウド基盤ではAWSが100万台超のNVIDIA GPUを展開する大型提携を発表し、MicrosoftもAzureデータセンターにVera Rubin NVL72を世界初導入しました。物理AI領域ではBYD、日産、現代、吉利が自動運転プラットフォームに参画し、Uberとのロボタクシー配車連携も明らかになりました。

医療分野では初のヘルスケア特化型物理AIプラットフォームを公開し、外科手術ロボット向けにCosmos-HやGR00T-Hなどのモデル群を整備しました。Johnson & JohnsonやCMR Surgicalが早期採用を表明しています。さらにAlphaFoldタンパク質構造データベースの大規模拡張や、Nemotronモデルによるデジタルヘルスエージェントの構築支援など、ライフサイエンス領域でも多数の発表がありました。

オープンモデル戦略では「Nemotron Coalition」を立ち上げ、言語・推論、ワールドモデル、ロボティクス、自動運転、バイオ、気象の6つのフロンティアモデル群でパートナーを結集しました。基調講演ではディズニーのオラフが物理AIで自律歩行するデモで締めくくり、シミュレーションから現実世界への移行を印象づけました。

出典：NVIDIA公式 | TechCrunch | TechCrunch

ルカン氏のAMI Labs、ワールドモデル開発で約1500億円調達

2026年03月09日 NVIDIA Meta サムスンワールドモデル投資家リスクスタートアップ医療投資資金調達評価額 Alexa

資金調達の概要

10.3億ドルの大型調達

プレマネー評価額35億ドル

当初予定の約2倍の規模

ベゾス・エクスペディションズら共同主導

技術と事業戦略

JEPAアーキテクチャが基盤技術

言語でなく現実世界から学習

医療スタートアップNablaが第1パートナー

オープンソース方針で研究公開

パリ・NY・モントリオール・シンガポールで展開

詳細を見る

チューリング賞受賞者のヤン・ルカン氏がMetaを退社後に共同設立した仏AIスタートアップAMI Labsは、2026年3月、10.3億ドル（約1500億円）の資金調達を完了したとTechCrunchが報じた。プレマネーバリュエーションは35億ドルで、投資家にはベゾス・エクスペディションズやNvidia、Samsung、Toyotaベンチャーズらが名を連ねる。

AMI Labsが開発するワールドモデルとは、テキストではなく現実世界のデータから学習するAIであり、大規模言語モデル（LLM）とは根本的に異なるアプローチを取る。技術基盤には、ルカン氏が2022年に提唱したJEPA（Joint Embedding Predictive Architecture）を採用している。

CEOのアレクサンドル・ルブラン氏は、LLMの幻覚問題が医療現場で生命に関わるリスクをもたらすと指摘し、その限界を克服する代替技術としてワールドモデルへの移行を決断したと述べた。最初のパートナーは医療スタートアップのNablaであり、実世界データでの早期検証を進める。

同社は「基礎研究からスタートする野心的プロジェクト」と位置づけており、商用化まで数年単位の時間軸を想定している。チームはルカン氏（会長）、元MetaのVPローラン・ソリー氏（COO）、著名研究者のサイニン・シェ氏（最高科学責任者）らで構成され、人材の質を最優先に採用を進める方針だ。

ルブラン氏は「研究は公開した方が進みが速く、コミュニティ形成が自社の利益にもなる」と語り、論文発表とコードのオープンソース化を積極的に行う姿勢を示した。ワールドモデル分野ではFei-Fei Li氏のWorld Labsも先月10億ドルを調達しており、次のAI投資テーマとして急速に注目が高まっている。

出典：TechCrunch

NvidiaがDreamDojo公開、ロボット訓練を人間動画で革新

2026年02月09日 NVIDIA ワールドモデル動画ロボットヒューマノイド医療スタンフォード

技術概要と特徴

DreamDojoは人間動画4万4000時間で訓練

ロボット用「ワールドモデル」として初の汎化型

多様な物体・環境への強い汎化能力を実証

UC Berkeley・Stanford等との共同研究

ヒューマノイドロボット訓練コストを大幅削減

ロボットAI分野への影響

実世界動作の逆問題解析に新たな手法

物体との相互作用学習をビデオから獲得

合成データ不要でリアルな動作パターンを習得

訓練時間と費用の削減が商用ロボット普及を加速

次世代ヒューマノイドロボット開発の基盤技術に

詳細を見る

Nvidiaを中心とする研究チームは、4万4000時間の人間の動画データで訓練したロボット用「ワールドモデル」DreamDojoを公開しました。UC Berkeley、Stanford大学、テキサス大学オースティン校などが参加した共同研究成果です。

DreamDojoは、ロボットが物理的な世界でどのように物体と相互作用するかを学習するために、人間の行動映像を直接活用します。従来の合成データや手作業によるデモンストレーションに頼る手法と比べ、現実の動作パターンをより豊富に学習できます。

研究チームは「多様な物体への強い汎化能力を実証した初のロボットワールドモデル」と位置付けており、特定のタスク向けに設計されたロボットではなく、汎用的な物理的インタラクションを習得できる点が画期的です。

この技術は次世代のヒューマノイドロボット訓練の時間とコストを大幅に削減する可能性を持っています。物理AIの急速な発展の中で、Nvidiaが研究フロントでの主導権を確立しようとする戦略的意図も読み取れます。

ロボット訓練の民主化は、製造・物流・医療などの現場で使えるロボットの普及を加速させます。DreamDojoは人間の知識をロボットへ転移する効率的な経路として、今後の産業界に大きな影響を与えそうです。

出典：VentureBeat

WaymoがGenie 3ワールドモデルで自動運転の訓練を革新

2026年02月06日シミュレーションワールドモデル認証

技術の詳細

Genie 3を自動運転訓練に活用

ワールドモデルで仮想環境を構築

竜巻・象などエッジケースに対応

実走行データ不要で多様な状況を学習

Arstechnica・The Vergeが詳細報道

自動運転の安全性が大幅向上

自動運転業界への影響

シミュレーション訓練の精度革命

希少シナリオへの対応力向上

テスト工数の大幅削減

詳細を見る

ArstechnicaとThe Vergeは2026年2月6日、Waymoがゲームワールド生成AI「Genie 3」を活用して自動運転車の訓練用ワールドモデルを構築していると報じた。

ワールドモデルとは、自動運転システムが現実世界をシミュレートして无数の仮想シナリオで訓練できる仮想環境で、竜巻や象のような実際に収集困難な極端な状況での挙動を学習できる。

従来の自動運転訓練は実際の道路走行データに依存していたが、Genie 3を用いたワールドモデルにより膨大な仮想シナリオでの訓練が可能になった。

エッジケース（極めてまれな状況）への対応は自動運転の安全認証において最大の課題の一つであり、仮想訓練による解決策は業界全体への影響が大きい。

WaymoのGenie 3活用は自動運転開発のコストと期間を大幅に短縮する可能性があり、完全自律型モビリティサービスの商用化加速につながる。

出典：Ars Technica | The Verge

2026年予測：AIエージェント・IPO・VCの未来を展望

2025年12月26日 OpenAI Anthropic ワールドモデルリスクポリシーサム・アルトマンスタートアップ投資資金調達ベンチャーキャピタル IPO エージェントトランプ

AIエージェントの本格普及

2025年はエージェントAIが期待外れに終わった

2026年こそエージェントが本格化する見通し

ワールドモデルが次世代の核心技術に

LLMとの根本的違いが注目される

物理AIの台頭がAI応用の幅を広げる

ステルスモード廃止でオープンな資金調達へ

VC市場とIPO展望

AI投資ラウンドは期待を超える規模に拡大

OpenAI・AnthropicのIPOが2026年の焦点

VCの流動性危機が顕在化している

AIポリシーの混乱が規制リスクを高める

ジョニー・アイブとサム・アルトマンの動向に注目

代替資金調達源の台頭がVC生態系を変える

詳細を見る

TechCrunchのEquityポッドキャストが2025年を総括し、2026年の大胆な予測を公開しました。AIエージェントは2025年に期待を裏切ったものの、2026年には本格的なブレークスルーが訪れると予測されています。

特に注目されるのがワールドモデルの台頭です。単なる言語モデルとは異なり、世界の物理的ダイナミクスを理解できるこのアーキテクチャが次世代AIの核心になると見られています。

VC業界では流動性危機が深刻化しており、IPO市場の回復が急務となっています。OpenAIとAnthropicの2026年上場は業界全体の試金石になるでしょう。

AI政策の混乱はトランプ政権の大統領令を含め、スタートアップにとって予測困難なリスク要因となっています。AIネイティブという肩書きが2026年にはビジネス標準語になるという大胆な予測も飛び出しました。

出典：TechCrunch

LeCunがワールドモデルAIの新会社を設立

2025年12月19日 Google ワールドモデル創業者推論スタートアップ医療提携資金調達評価額 Intel Google DeepMind

AMI Labsの概要

社名はAMI Labs、会長に就任

Nabla元CEOが経営トップに

€500Mの大型調達を計画

€30億評価でのシード前調達

LLMを超える研究方針

幻覚問題をLLMは解決できない

因果推論を可能にする新設計

DeepMindも同分野に参入

Nablaが医療AIで提携

詳細を見る

著名なAI科学者Yann LeCunは、「Advanced Machine Intelligence（AMI Labs）」という新スタートアップの設立を正式に確認しました。LeCun自身は会長として参画し、元NablaのCEO、Alex LeBrunが経営トップを担います。

Financial Timesの報道によると、AMI Labsは設立前の段階でユーロ500百万（約5.86億ドル）の資金調達を3.5億ドル（ユーロ30億）超の評価額で目指しています。Mira Muratiのスタートアップが12億ドルのシード評価を得た事例と比較しても、野心的ですが不当ではない水準です。

AMI Labsはワールドモデル型AIの研究・開発を中心とします。LLMとは異なるアーキテクチャで、AIが環境を理解し、因果関係と仮定シナリオをシミュレートして結果を予測できるようにするものです。

LeCunが長年訴えてきた主張は、LLMは「非決定論的」である本質上、幻覚を完全になくすことができないというものです。Google DeepMindやFei-Fei Li氏のWorld Labsも同様のワールドモデル研究を進めており、競争が激化しています。

NablaはAMI Labsとの独占的パートナーシップを締結し、開発されるモデルを医療AIの分野に活用する計画です。LeBrunの後任CEO探しが進む一方、共同創業者のDelphine Grollが暫定的に経営を担っています。

出典：TechCrunch

MetaがAI画像・動画モデルを2026年前半に公開

2025年12月19日 Google OpenAI Anthropic Meta Instagram Facebook アシスタント動画生成ワールドモデル創業者推論画像動画コーディングスタートアップ Alexa Scale AI

新モデルの全容

画像・動画モデルMangoを開発中

テキストモデルAvocadoもコード強化

視覚的推論のワールドモデル探求

2026年前半のリリースを目標

Metaが抱える課題

OpenAI・GoogleにAI競争で後れ

MSLから研究者が離脱相次ぐ

LeCunが独立しスタートアップ設立

SNS頼みのユーザー基盤に依存

詳細を見る

Metaは2026年前半のリリースを目指して、画像・動画生成の新AIモデル「Mango」とテキストベースの新モデル「Avocado」の開発を進めていることが報じられました。

発表はScale AIの共同創業者でMeta超知性ラボ（MSL）を率いるAlexandr WangとCPOのChris Coxが行ったとされます。Avocadoはコーディング能力の向上を目指すほか、視覚情報の理解や推論・計画を可能にするワールドモデルの探求も進めます。

Metaは近年、OpenAI・Anthropic・Googleに対してAI競争で後れを取っており、2025年に入ってMSLの大規模再編が複数回行われました。研究者の引き抜きや離脱も相次いでいます。

首席AIサイエンティストのYann LeCunも2025年後半にMetaを離れ、独立したAIスタートアップ「AMI Labs」を設立することを発表しました。

現在のMeta AIアシスタントはInstagramやFacebookのサーチバーへの組み込みでユーザー数を維持していますが、独自の競争力ある製品としての地位は未確立です。MangoとAvocadoはMSLの最初の本格成果物として大きなプレッシャーを背負っています。

出典：TechCrunch

Runway、初のワールドモデルGWM-1を公開

2025年12月11日動画生成シミュレーションワールドモデルコンテンツ動画音声 Runway

ワールドモデルと音声の二重発表

初のワールドモデルGWM-1をリリース

シミュレーション用途に特化した設計

ワールドモデル競争に本格参入

Gen 4.5にネイティブ音声生成を追加

動画と音声の同期生成が可能に

マルチメディア出力の統合を実現

詳細を見る

Runwayは初のワールドモデル「GWM-1」を発表しました。物理環境の理解とシミュレーションを目的としたモデルで、より現実的で制御可能な映像生成を可能にします。World Labsなど他社も参入するワールドモデル開発競争に、Runwayが本格的に加わりました。

同時に、Gen 4.5動画生成モデルにネイティブ音声生成機能も追加されました。生成された動画に同期した音声トラックが自動付与されるため、別途音声ツールを使う必要がなくなります。映像と音声の統合により、より完成度の高いマルチメディアコンテンツの生成が一つのプラットフォームで可能になりました。

出典：TechCrunch

World Labs、編集可能な3D世界生成AI「Marble」公開

2025年11月12日デザインシミュレーションワールドモデル創業者クリエイターコンテンツ画像動画ロボットスタートアップ医療

3D世界を自在に生成

テキストや画像から3D環境を自動生成

永続的でダウンロード可能な高品質な世界

ゲーム・VFX・VRでの活用に期待

直感的なAIネイティブ編集

構造とスタイルを分離した柔軟な編集

AI編集ツール「Chisel」を搭載

生成した世界の拡張・合成も可能

空間知能への第一歩

AIの権威フェイフェイ・リ氏が主導

フリーミアム含む4プランで提供

詳細を見る

AI研究の権威フェイフェイ・リ氏が率いるスタートアップWorld Labsは、初の商用製品であるワールドモデル「Marble」を正式に発表しました。テキスト、画像、動画などから編集・ダウンロード可能な3D環境を生成するサービスで、ゲームやVFX業界のコンテンツ制作を革新する可能性を秘めています。フリーミアムモデルで提供を開始し、ワールドモデル開発競争で一歩リードする形です。

Marbleの最大の特徴は、一貫性が高く永続的でダウンロード可能な3D環境を生成する点にあります。リアルタイムで世界を生成し続ける他のモデルとは異なり、高品質なアセットとして出力できるのです。ガウシアン・スプラッティングやメッシュ形式でのエクスポートに対応し、UnityやUnreal Engineといった既存のゲームエンジンに直接組み込めます。

さらに、独自のAIネイティブ編集ツールがクリエイターに高度な制御をもたらします。実験的な3Dエディタ「Chisel」を使えば、まず大まかな空間構造をブロックで組み、その後AIに詳細なビジュアルを生成させることが可能です。これにより、ウェブサイトにおけるHTMLとCSSのように、構造とデザインを分離して効率的に編集できます。

ユーザーは生成した世界を拡張したり、複数の世界を合成したりすることも可能です。これにより、広大な空間の作成や、異なるスタイルの世界を組み合わせるなど、創造性の幅が大きく広がります。このような柔軟な編集機能は、クリエイターがAIに主導権を奪われることなく、創造性を最大限に発揮できるよう設計されています。

Marbleはフリーミアムを含む4つの料金プランで提供されます。ゲーム開発や映像制作での背景アセット生成が当面の主な用途と見られています。また、VR業界もコンテンツ不足から大きな期待を寄せており、Vision ProやQuest 3にも既に対応済みです。クリエイターにとって、制作パイプラインを加速させる強力なツールとなるのではないでしょうか。

World Labsの創業者であるリ氏は、Marbleを単なる3D生成ツールではなく、「空間知能」を持つAIへの重要な一歩と位置付けています。将来的には、ロボット工学のシミュレーション環境や、科学・医療分野でのブレークスルーにも貢献する可能性があると期待を示しており、その動向から目が離せません。

出典：TechCrunch

ゲームデータで次世代AI、新興企業に200億円超

2025年10月17日 Google OpenAI ワールドモデル創業者投資家リスク AGI 動画ロボットドローン投資資金調達買収エージェント Google DeepMind

次世代AI「ワールドモデル」

人間のような空間認識を持つAI

物理世界の因果関係を予測する技術

ロボットや自動運転への応用

General Intuitionの強み

ゲーム動画データ年間20億本

AIが行動を学ぶ検証可能な環境

OpenAIも欲したデータの価値

大型シード資金調達

調達額は1億3370万ドル

OpenAI初期投資家が主導

詳細を見る

ビデオゲームのプレイ動画からAIが世界を学ぶ。新興AIラボ「General Intuition」は2025年10月17日、ゲームデータを用いてAIに物理世界を理解させる「ワールドモデル」を開発するため、シードラウンドで1億3370万ドル（約200億円）を調達したと発表しました。この動きは、AIエージェント開発における新たなフロンティアを開拓する試みとして、業界の大きな注目を集めています。

「ワールドモデル」とは、AIが人間のように空間を認識し、物事の因果関係を予測する能力を指します。例えば、テーブルから落ちるコップを事前に掴むといった、物理世界での直感的な判断を可能にします。Google DeepMindなどが研究を主導しており、自律型AIエージェント実現の鍵と見なされています。汎用人工知能（AGI）への道筋としても期待される重要技術です。

同社の強みは、親会社であるゲーム録画プラットフォーム「Medal」が保有する膨大なデータにあります。年間約20億本アップロードされるプレイ動画は、AIが3次元空間での「良い行動」と「悪い行動」を学ぶための検証可能な学習データセットとなります。このデータの価値は非常に高く、過去にはOpenAIが5億ドルでの買収を提案したとも報じられています。

今回の大型資金調達を主導したのは、OpenAIの初期投資家としても知られるKhosla Venturesです。創業者のヴィノド・コースラ氏は「彼らは独自のデータセットとチームを持っている」と高く評価。General Intuitionが、LLMにおけるOpenAIのように、AIエージェント分野で破壊的な影響をもたらす可能性があると大きな期待を寄せています。

General Intuitionは、開発したモデルをまず捜索救助ドローンに応用し、将来的には人型ロボットや自動運転車への展開を目指します。しかし、この分野はGoogleのような資金力豊富な巨大企業との競争が激しく、技術的なアプローチもまだ確立されていません。どのデータや手法が最適かは未知数であり、大きなリスクも伴います。

今回の動きは、ゲーム業界に新たな可能性を示唆しています。ワールドモデルへの関心が高まるにつれ、ゲーム企業が保有するデータはAI開発の宝庫となり、大手AIラボの買収対象となる可能性があります。自社データの価値を正しく理解し、戦略を立てることが、今後のAI時代を勝ち抜く上で重要になるでしょう。

出典：The Verge

ゲーム動画でAI訓練、時空間推論へ200億円調達

2025年10月16日 OpenAI シミュレーションワールドモデルエンジニア推論リスクコンテンツ著作権 AGI 動画ロボットドローン資金調達買収エージェント

巨額調達の背景

シードで約200億円という巨額調達

ゲーム動画共有Medal社からスピンアウト

年間20億本の動画を学習データに活用

OpenAIも買収を試みた優良データ

AIの新たな能力

LLMが苦手な物理世界の直感を学習

未知の環境でも行動を的確に予測

想定される応用分野

ゲーム内の高度なNPC開発

捜索救助ドローンやロボットへの応用

詳細を見る

ゲーム動画共有プラットフォームのMedal社からスピンアウトしたAI研究所「General Intuition」が、シードラウンドで1億3370万ドル（約200億円）という異例の資金調達を発表しました。同社は、Medalが持つ年間20億本ものゲーム動画を学習データとし、AIに現実世界での動きを直感的に理解させる「時空間推論」能力を訓練します。これは現在の言語モデルにはない能力で、汎用人工知能（AGI）開発の新たなアプローチとして注目されています。

同社が活用するゲーム動画データは、その質の高さからOpenAIも過去に買収を試みたと報じられるほどです。CEOのピム・デ・ウィッテ氏によれば、ゲーマーが投稿する動画は成功や失敗といった極端な事例（エッジケース）が多く、AIの訓練に非常に有用なデータセットとなっています。この「データ・モート（データの堀）」が、巨額の資金調達を可能にした大きな要因です。

「時空間推論」とは、物体が時間と空間の中でどのように動き、相互作用するかを理解する能力を指します。文章から世界の法則を学ぶ大規模言語モデル（LLM）に対し、General Intuitionは視覚情報から直感的に物理法則を学ばせるアプローチを取ります。同社は、この能力こそが真のAGIに不可欠な要素だと考えています。

開発中のAIエージェントは、訓練に使われていない未知のゲーム環境でも、人間のプレイヤーが見るのと同じ視覚情報のみで状況を理解し、次にとるべき行動を正確に予測できる段階にあります。この技術は、ゲームのコントローラーで操作されるロボットアームやドローン、自動運転車といった物理システムへ自然に応用できる可能性があります。

初期の実用化分野として、2つの領域が想定されています。一つは、ゲーム内でプレイヤーの習熟度に合わせて難易度を動的に調整し、常に最適な挑戦を提供する高度なNPC（ノンプレイヤーキャラクター）の開発です。もう一つは、GPSが使えない未知の環境でも自律的に飛行し、情報を収集できる捜索救助ドローンの実現です。

競合他社がシミュレーション環境（ワールドモデル）そのものを製品化するのに対し、General Intuitionはエージェントの応用事例に注力する戦略をとります。これにより、ゲーム開発者のコンテンツと競合したり、著作権問題を引き起こしたりするリスクを回避する狙いもあります。

今回の資金調達はKhosla VenturesとGeneral Catalystが主導しました。シードラウンドとしては異例の規模であり、ゲームから生まれたデータが次世代AI開発の鍵を握るという期待の大きさを物語っています。同社の挑戦は、AI技術の新たな地平を切り開くかもしれません。

出典：TechCrunch

AI開発の主戦場、「ワールドモデル」へ移行加速

2025年09月29日 Google OpenAI NVIDIA Meta ChatGPT シミュレーションワールドモデル動画ロボット医療ロボティクスエージェント Google DeepMind

LLMの次なるフロンティア

LLMの性能向上に頭打ち感

物理世界を理解する新モデルに注目

動画やロボットデータから学習

Google・Meta・Nvidiaが開発を主導

100兆ドル市場への期待と課題

自動運転やロボティクスの進化を加速

製造・医療など物理領域への応用

Nvidia幹部が100兆ドル市場と試算

実現には膨大なデータと計算能力が壁

詳細を見る

Google DeepMindやMeta、Nvidiaなどの大手AI企業が、大規模言語モデル（LLM）の進歩が鈍化する中、次なる飛躍を求めて「ワールドモデル」の開発に注力し始めています。この新モデルは、言語データではなく動画やロボットデータから物理世界を学習し、人間環境への深い理解を目指します。これは機械による「超知能」実現に向けた新たなアプローチとして注目されています。

OpenAIのChatGPTなどに代表されるLLMは、目覚ましい進化を遂げてきました。しかし、各社が投入する最新モデル間の性能差は縮小傾向にあり、開発に投じられる莫大な資金にもかかわらず、進歩に頭打ち感が見え始めています。この状況が、AI開発の新たな方向性を模索する動きを加速させているのです。

ワールドモデルは、LLMとは根本的に異なるアプローチを取ります。テキストデータから言語のパターンを学ぶLLMに対し、ワールドモデルは動画やシミュレーション、ロボットの動作データといった物理世界のデータストリームから学習します。これにより、現実世界の法則や因果関係を理解し、将来を予測する能力の獲得を目指します。

この技術が秘める経済的インパクトは計り知れません。Nvidiaの担当副社長であるレヴ・レバレディアン氏は、ワールドモデルが物理世界を理解し操作できるようになれば、その潜在市場は「本質的に100兆ドル」規模、つまり世界経済に匹敵する可能性があると指摘しています。

ワールドモデルは、自動運転車やロボティクス、いわゆる「AIエージェント」の進化に不可欠な一歩と見なされています。製造業やヘルスケアなど、物理的な操作を伴う産業での活用も期待されます。しかし、その実現には膨大なデータと計算能力が必要であり、依然として技術的に未解決の挑戦であることも事実です。

出典：Ars Technica

Meta、ロボットOSで覇権狙う AR級の巨額投資

2025年09月26日 Google Meta Android エコシステムシミュレーションワールドモデルエンジニア専門家ハードウェアロボットヒューマノイドロボティクス MIT 投資 Intel Tesla

ボトルネックはソフトウェア

ARに次ぐ数十億ドル規模の投資

ハードウェアではなくソフトウェアが開発の鍵

器用な操作を実現するAIモデルが不可欠

「ロボット界のAndroid」構想

自社製ロボット「Metabot」も開発

他社へソフトウェアをライセンス供与

プラットフォームで業界標準を狙う

専門家集団による開発体制

元Cruise CEOがチームを統括

MITなどからトップ人材を結集

詳細を見る

米Metaは、ヒューマノイドロボット開発を拡張現実（AR）に次ぐ大規模な投資対象と位置付けていることを明らかにしました。同社のアンドリュー・ボスワースCTOによると、数十億ドル規模を投じ、ハードウェアではなくソフトウェア開発に注力します。開発したプラットフォームを他社にライセンス供与する「ロボット版Android」とも言える戦略で、急成長する市場の主導権を握る構えです。

なぜソフトウェアが重要なのでしょうか。ボスワース氏は「ハードウェアは難しくない。ボトルネックはソフトウェアだ」と断言します。ロボットがコップを絶妙な力加減で掴むといった器用な操作は極めて困難であり、この課題を解決するため、AIが現実世界をシミュレーションする「ワールドモデル」の構築が不可欠だと説明しています。

Metaの戦略は、自社でハードウェアを製造し販売することではありません。社内で「Metabot」と呼ばれるロボットを開発しつつも、その核心技術であるソフトウェアを他社ロボットメーカーに広くライセンス供与する計画です。これはGoogleがAndroid OSでスマートフォン市場のエコシステムを築いた戦略と類似しており、オープンなプラットフォームで業界標準となることを目指します。

この野心的な計画を支えるのが、Metaが新設した「Superintelligence AI lab」です。このAI専門組織がロボティクスチームと緊密に連携し、ロボットの知能を司るAIモデルを開発します。ボスワース氏は「このAIラボがなければ、このプロジェクトは実行しなかった」と述べ、AI開発能力が自社の最大の強みであるとの認識を示しました。

このアプローチは、テスラが開発する「Optimus」とは一線を画します。ボスワース氏は、人間の視覚を模倣してデータを集めるテスラの手法について「ロボット用のデータをどうやって十分に集めるのか疑問だ」と指摘。Metaはシミュレーションとワールドモデルを駆使して、このデータ問題を解決しようとしています。

Metaの本気度は、集結した人材からも伺えます。自動運転企業Cruiseの元CEOであるマーク・ウィッテン氏がチームを率い、MITから「現代最高の戦術ロボット工学者」と評されるキム・サンベ氏を招聘。社内のトップエンジニアも結集させ、盤石な体制でこの巨大プロジェクトに挑みます。

出典：The Verge

OpenAI、人型ロボット開発を強化 AGI競争の新局面へ

2025年09月18日 OpenAI Amazon ワールドモデルハードウェア AGI 動画ロボット中国ロボティクス Tesla

詳細を見る

AI開発をリードするOpenAIが、AGI（汎用人工知能）実現に向けた次の一手として人型ロボット開発を本格化させています。同社は最近、人型ロボット向けAIシステムの専門研究者の採用を開始しました。これは、物理世界でタスクを実行する能力がAGI開発の鍵になるとの認識が業界で高まっていることを示唆します。TeslaやFigure AIなど先行企業との競争が激化しそうです。なぜ今、人型ロボットなのでしょうか。その理由は、ロボットが人間用に設計された環境で活動できる点にあります。階段を上るなど物理的なタスクを通じた学習が、より高度な知能の獲得につながると考えられています。文章生成は得意でも「コーヒーを淹れる」ことができない現在のAIの限界を超える狙いです。 OpenAIは2021年にロボティクス部門を一度閉鎖しましたが、再びこの分野に注力し始めました。AIの次なるブレークスルーとして、物理世界を理解する「ワールドモデル」の構築が重要視されています。ロボット開発はその鍵を握るプロジェクトと位置づけられているのです。人型ロボット市場では、すでに多くの企業が開発競争を繰り広げています。TeslaやFigure AI、Boston Dynamicsなどが有力なプレイヤーです。中国のUnitreeは低コストなロボットで市場に参入。OpenAIは先行するハードウェア企業に対し、得意のAIアルゴリズムで優位性を築く戦略です。人型ロボット市場は2050年までに5兆ドル規模に達するとの予測もあり、期待が高まっています。しかし、SNSで目にする見事なデモ動画は、特定の条件下でしか成功しない場合も少なくありません。未知の環境で安定して動作する信頼性の確保が、実用化に向けた最大の課題と言えるでしょう。実用化はまず、工場や倉庫といった産業現場から進む見通しです。Amazonは倉庫内で、現代自動車は工場で人型ロボットの試験導入を開始しています。危険で単調な作業の代替が主な目的です。各家庭で活躍する「ロボット執事」の実現はまだ先になりそうです。今後の技術的な焦点は、ハードとソフトの両面にあります。人間の手のように繊細な作業をこなすハードウェアは依然として難題です。また、未知の状況にも対応できる汎用的なAIモデルも欠かせません。AIの「幻覚」が物理世界で起きないよう、安全性と信頼性の確保が最優先されます。

出典：WIRED

ワールドモデル（ユースケース）に関するニュース一覧

ワールドモデル（ユースケース）に関するニュース一覧

Vera Rubin全貌

エージェントAI戦略

産業・医療への展開

資金調達の概要

技術と事業戦略

技術概要と特徴

ロボットAI分野への影響

技術の詳細

自動運転業界への影響

AIエージェントの本格普及

VC市場とIPO展望

AMI Labsの概要

LLMを超える研究方針

新モデルの全容

Metaが抱える課題

ワールドモデルと音声の二重発表

3D世界を自在に生成

直感的なAIネイティブ編集

空間知能への第一歩

次世代AI「ワールドモデル」

General Intuitionの強み

大型シード資金調達

巨額調達の背景

AIの新たな能力

想定される応用分野

LLMの次なるフロンティア

100兆ドル市場への期待と課題

ボトルネックはソフトウェア

「ロボット界のAndroid」構想

専門家集団による開発体制

関連キーワード

同じカテゴリ

他カテゴリ