ワールドモデル(ユースケース)に関するニュース一覧

NVIDIA、次世代AI基盤Vera Rubinと1兆ドル売上見通しを発表

Vera Rubin全貌

7チップ統合の新プラットフォーム
専用CPU「Vera」とBlueField-4搭載
次世代Feynmanアーキテクチャも予告
宇宙データセンター構想を公開

エージェントAI戦略

OpenClaw対応を全社に要求
NemoClawでエージェント安全運用
Nemotron Coalitionで6モデル群展開

産業・医療への展開

BYD・日産ら自動運転提携
IGX Thorで手術ロボット本格化
AWSMicrosoft大規模GPU展開

NVIDIAは2026年3月16日、サンノゼで開催したGTC 2026の基調講演で、創業者兼CEOのジェンスン・ファン氏が次世代フルスタックAIプラットフォーム「Vera Rubin」を発表し、2025年から2027年にかけて少なくとも1兆ドルの売上を見込むと宣言しました。

Vera Rubinは7つのチップ、5つのラックスケールシステム、1台のスーパーコンピュータで構成されるエージェントAI向け統合プラットフォームです。専用CPU「Vera」と新ストレージ基盤「BlueField-4 STX」を搭載し、さらに次世代アーキテクチャ「Feynman」や宇宙AI「Space-1」構想も予告されました。

エージェントAI分野では、オープンソースのOpenClawを全企業が戦略として持つべきだと強調し、エンタープライズ向けにポリシー制御やガードレールを備えた「NemoClaw」スタックとOpenShellランタイムを発表しました。DGX SparkやDGX Stationと組み合わせ、デスクトップで自律エージェントを安全に構築・運用できる環境を提供します。

クラウド基盤ではAWS100万台超のNVIDIA GPUを展開する大型提携を発表し、MicrosoftもAzureデータセンターにVera Rubin NVL72を世界初導入しました。物理AI領域ではBYD、日産、現代、吉利が自動運転プラットフォームに参画し、Uberとのロボタクシー配車連携も明らかになりました。

医療分野では初のヘルスケア特化型物理AIプラットフォームを公開し、外科手術ロボット向けにCosmos-HやGR00T-Hなどのモデル群を整備しました。Johnson & JohnsonやCMR Surgicalが早期採用を表明しています。さらにAlphaFoldタンパク質構造データベースの大規模拡張や、Nemotronモデルによるデジタルヘルスエージェントの構築支援など、ライフサイエンス領域でも多数の発表がありました。

オープンモデル戦略では「Nemotron Coalition」を立ち上げ、言語・推論ワールドモデルロボティクス、自動運転、バイオ、気象の6つのフロンティアモデル群でパートナーを結集しました。基調講演ではディズニーのオラフが物理AIで自律歩行するデモで締めくくり、シミュレーションから現実世界への移行を印象づけました。

ルカン氏のAMI Labs、ワールドモデル開発で約1500億円調達

資金調達の概要

10.3億ドルの大型調達
プレマネー評価額35億ドル
当初予定の約2倍の規模
ベゾス・エクスペディションズら共同主導

技術と事業戦略

JEPAアーキテクチャが基盤技術
言語でなく現実世界から学習
医療スタートアップNablaが第1パートナー
オープンソース方針で研究公開
パリ・NY・モントリオール・シンガポールで展開

チューリング賞受賞者のヤン・ルカン氏がMetaを退社後に共同設立した仏AIスタートアップAMI Labsは、2026年3月、10.3億ドル(約1500億円)の資金調達を完了したとTechCrunchが報じた。プレマネーバリュエーションは35億ドルで、投資家にはベゾス・エクスペディションズやNvidiaSamsung、Toyotaベンチャーズらが名を連ねる。

AMI Labsが開発するワールドモデルとは、テキストではなく現実世界のデータから学習するAIであり、大規模言語モデル(LLM)とは根本的に異なるアプローチを取る。技術基盤には、ルカン氏が2022年に提唱したJEPA(Joint Embedding Predictive Architecture)を採用している。

CEOのアレクサンドル・ルブラン氏は、LLMの幻覚問題医療現場で生命に関わるリスクをもたらすと指摘し、その限界を克服する代替技術としてワールドモデルへの移行を決断したと述べた。最初のパートナーは医療スタートアップNablaであり、実世界データでの早期検証を進める。

同社は「基礎研究からスタートする野心的プロジェクト」と位置づけており、商用化まで数年単位の時間軸を想定している。チームはルカン氏(会長)、元MetaのVPローラン・ソリー氏(COO)、著名研究者のサイニン・シェ氏(最高科学責任者)らで構成され、人材の質を最優先に採用を進める方針だ。

ルブラン氏は「研究は公開した方が進みが速く、コミュニティ形成が自社の利益にもなる」と語り、論文発表とコードのオープンソース化を積極的に行う姿勢を示した。ワールドモデル分野ではFei-Fei Li氏のWorld Labsも先月10億ドルを調達しており、次のAI投資テーマとして急速に注目が高まっている。

NvidiaがDreamDojo公開、ロボット訓練を人間動画で革新

技術概要と特徴

DreamDojoは人間動画4万4000時間で訓練
ロボット用「ワールドモデル」として初の汎化型
多様な物体・環境への強い汎化能力を実証
UC BerkeleyStanford等との共同研究
ヒューマノイドロボット訓練コストを大幅削減

ロボットAI分野への影響

実世界動作の逆問題解析に新たな手法
物体との相互作用学習をビデオから獲得
合成データ不要でリアルな動作パターンを習得
訓練時間と費用の削減が商用ロボット普及を加速
次世代ヒューマノイドロボット開発の基盤技術に

Nvidiaを中心とする研究チームは、4万4000時間の人間の動画データで訓練したロボット用「ワールドモデルDreamDojoを公開しました。UC Berkeley、Stanford大学、テキサス大学オースティン校などが参加した共同研究成果です。

DreamDojoは、ロボットが物理的な世界でどのように物体と相互作用するかを学習するために、人間の行動映像を直接活用します。従来の合成データや手作業によるデモンストレーションに頼る手法と比べ、現実の動作パターンをより豊富に学習できます。

研究チームは「多様な物体への強い汎化能力を実証した初のロボットワールドモデル」と位置付けており、特定のタスク向けに設計されたロボットではなく、汎用的な物理的インタラクションを習得できる点が画期的です。

この技術は次世代のヒューマノイドロボット訓練の時間とコストを大幅に削減する可能性を持っています。物理AIの急速な発展の中で、Nvidiaが研究フロントでの主導権を確立しようとする戦略的意図も読み取れます。

ロボット訓練の民主化は、製造・物流・医療などの現場で使えるロボットの普及を加速させます。DreamDojoは人間の知識をロボットへ転移する効率的な経路として、今後の産業界に大きな影響を与えそうです。

WaymoがGenie 3ワールドモデルで自動運転の訓練を革新

技術の詳細

Genie 3を自動運転訓練に活用
ワールドモデルで仮想環境を構築
竜巻・象などエッジケースに対応
実走行データ不要で多様な状況を学習
Arstechnica・The Vergeが詳細報道
自動運転の安全性が大幅向上

自動運転業界への影響

シミュレーション訓練の精度革命
希少シナリオへの対応力向上
テスト工数の大幅削減

ArstechnicaとThe Vergeは2026年2月6日、Waymoがゲームワールド生成AI「Genie 3」を活用して自動運転車の訓練用ワールドモデルを構築していると報じた。

ワールドモデルとは、自動運転システムが現実世界をシミュレートして无数の仮想シナリオで訓練できる仮想環境で、竜巻や象のような実際に収集困難な極端な状況での挙動を学習できる。

従来の自動運転訓練は実際の道路走行データに依存していたが、Genie 3を用いたワールドモデルにより膨大な仮想シナリオでの訓練が可能になった。

エッジケース(極めてまれな状況)への対応は自動運転の安全認証において最大の課題の一つであり、仮想訓練による解決策は業界全体への影響が大きい。

WaymoのGenie 3活用は自動運転開発のコストと期間を大幅に短縮する可能性があり、完全自律型モビリティサービスの商用化加速につながる。

2026年予測:AIエージェント・IPO・VCの未来を展望

AIエージェントの本格普及

2025年はエージェントAIが期待外れに終わった
2026年こそエージェントが本格化する見通し
ワールドモデルが次世代の核心技術に
LLMとの根本的違いが注目される
物理AIの台頭がAI応用の幅を広げる
ステルスモード廃止でオープンな資金調達

VC市場とIPO展望

AI投資ラウンドは期待を超える規模に拡大
OpenAIAnthropicIPOが2026年の焦点
VCの流動性危機が顕在化している
AIポリシーの混乱が規制リスクを高める
ジョニー・アイブとサム・アルトマンの動向に注目
代替資金調達源の台頭がVC生態系を変える

TechCrunchのEquityポッドキャストが2025年を総括し、2026年の大胆な予測を公開しました。AIエージェントは2025年に期待を裏切ったものの、2026年には本格的なブレークスルーが訪れると予測されています。

特に注目されるのがワールドモデルの台頭です。単なる言語モデルとは異なり、世界の物理的ダイナミクスを理解できるこのアーキテクチャが次世代AIの核心になると見られています。

VC業界では流動性危機が深刻化しており、IPO市場の回復が急務となっています。OpenAIAnthropicの2026年上場は業界全体の試金石になるでしょう。

AI政策の混乱はトランプ政権の大統領令を含め、スタートアップにとって予測困難なリスク要因となっています。AIネイティブという肩書きが2026年にはビジネス標準語になるという大胆な予測も飛び出しました。

LeCunがワールドモデルAIの新会社を設立

AMI Labsの概要

社名はAMI Labs、会長に就任
Nabla元CEOが経営トップ
€500Mの大型調達を計画
€30億評価でのシード前調達

LLMを超える研究方針

幻覚問題をLLMは解決できない
因果推論を可能にする新設計
DeepMind同分野に参入
Nablaが医療AI提携

著名なAI科学者Yann LeCunは、「Advanced Machine Intelligence(AMI Labs)」という新スタートアップの設立を正式に確認しました。LeCun自身は会長として参画し、元NablaのCEO、Alex LeBrunが経営トップを担います。

Financial Timesの報道によると、AMI Labsは設立前の段階でユーロ500百万(約5.86億ドル)の資金調達を3.5億ドル(ユーロ30億)超の評価額で目指しています。Mira Muratiのスタートアップが12億ドルのシード評価を得た事例と比較しても、野心的ですが不当ではない水準です。

AMI Labsはワールドモデル型AIの研究・開発を中心とします。LLMとは異なるアーキテクチャで、AIが環境を理解し、因果関係と仮定シナリオをシミュレートして結果を予測できるようにするものです。

LeCunが長年訴えてきた主張は、LLMは「非決定論的」である本質上、幻覚を完全になくすことができないというものです。Google DeepMindやFei-Fei Li氏のWorld Labsも同様のワールドモデル研究を進めており、競争が激化しています。

NablaはAMI Labsとの独占的パートナーシップを締結し、開発されるモデルを医療AIの分野に活用する計画です。LeBrunの後任CEO探しが進む一方、共同創業者のDelphine Grollが暫定的に経営を担っています。

MetaがAI画像・動画モデルを2026年前半に公開

新モデルの全容

画像動画モデルMangoを開発中
テキストモデルAvocadoもコード強化
視覚的推論ワールドモデル探求
2026年前半のリリースを目標

Metaが抱える課題

OpenAIGoogleAI競争で後れ
MSLから研究者が離脱相次ぐ
LeCunが独立スタートアップ設立
SNS頼みのユーザー基盤に依存

Metaは2026年前半のリリースを目指して、画像動画生成の新AIモデル「Mango」とテキストベースの新モデル「Avocado」の開発を進めていることが報じられました。

発表はScale AIの共同創業者Meta超知性ラボ(MSL)を率いるAlexandr WangとCPOのChris Coxが行ったとされます。Avocadoはコーディング能力の向上を目指すほか、視覚情報の理解や推論・計画を可能にするワールドモデルの探求も進めます。

Metaは近年、OpenAIAnthropicGoogleに対してAI競争で後れを取っており、2025年に入ってMSLの大規模再編が複数回行われました。研究者の引き抜きや離脱も相次いでいます。

首席AIサイエンティストのYann LeCunも2025年後半にMetaを離れ、独立したAIスタートアップ「AMI Labs」を設立することを発表しました。

現在のMeta AIアシスタントInstagramFacebookのサーチバーへの組み込みでユーザー数を維持していますが、独自の競争力ある製品としての地位は未確立です。MangoとAvocadoはMSLの最初の本格成果物として大きなプレッシャーを背負っています。

Runway、初のワールドモデルGWM-1を公開

ワールドモデルと音声の二重発表

初のワールドモデルGWM-1をリリース
シミュレーション用途に特化した設計
ワールドモデル競争に本格参入
Gen 4.5にネイティブ音声生成を追加
動画音声の同期生成が可能に
マルチメディア出力の統合を実現

Runwayは初のワールドモデル「GWM-1」を発表しました。物理環境の理解とシミュレーションを目的としたモデルで、より現実的で制御可能な映像生成を可能にします。World Labsなど他社も参入するワールドモデル開発競争に、Runwayが本格的に加わりました。

同時に、Gen 4.5動画生成モデルにネイティブ音声生成機能も追加されました。生成された動画に同期した音声トラックが自動付与されるため、別途音声ツールを使う必要がなくなります。映像と音声の統合により、より完成度の高いマルチメディアコンテンツの生成が一つのプラットフォームで可能になりました。

World Labs、編集可能な3D世界生成AI「Marble」公開

3D世界を自在に生成

テキストや画像から3D環境を自動生成
永続的でダウンロード可能な高品質な世界
ゲーム・VFX・VRでの活用に期待

直感的なAIネイティブ編集

構造とスタイルを分離した柔軟な編集
AI編集ツール「Chisel」を搭載
生成した世界の拡張・合成も可能

空間知能への第一歩

AIの権威フェイフェイ・リ氏が主導
フリーミアム含む4プランで提供

AI研究の権威フェイフェイ・リ氏が率いるスタートアップWorld Labsは、初の商用製品であるワールドモデル「Marble」を正式に発表しました。テキスト、画像動画などから編集・ダウンロード可能な3D環境を生成するサービスで、ゲームやVFX業界のコンテンツ制作を革新する可能性を秘めています。フリーミアムモデルで提供を開始し、ワールドモデル開発競争で一歩リードする形です。

Marbleの最大の特徴は、一貫性が高く永続的でダウンロード可能な3D環境を生成する点にあります。リアルタイムで世界を生成し続ける他のモデルとは異なり、高品質なアセットとして出力できるのです。ガウシアン・スプラッティングやメッシュ形式でのエクスポートに対応し、UnityやUnreal Engineといった既存のゲームエンジンに直接組み込めます。

さらに、独自のAIネイティブ編集ツールクリエイターに高度な制御をもたらします。実験的な3Dエディタ「Chisel」を使えば、まず大まかな空間構造をブロックで組み、その後AIに詳細なビジュアルを生成させることが可能です。これにより、ウェブサイトにおけるHTMLとCSSのように、構造とデザインを分離して効率的に編集できます。

ユーザーは生成した世界を拡張したり、複数の世界を合成したりすることも可能です。これにより、広大な空間の作成や、異なるスタイルの世界を組み合わせるなど、創造性の幅が大きく広がります。このような柔軟な編集機能は、クリエイターがAIに主導権を奪われることなく、創造性を最大限に発揮できるよう設計されています。

Marbleはフリーミアムを含む4つの料金プランで提供されます。ゲーム開発や映像制作での背景アセット生成が当面の主な用途と見られています。また、VR業界もコンテンツ不足から大きな期待を寄せており、Vision ProやQuest 3にも既に対応済みです。クリエイターにとって、制作パイプラインを加速させる強力なツールとなるのではないでしょうか。

World Labsの創業者であるリ氏は、Marbleを単なる3D生成ツールではなく、「空間知能」を持つAIへの重要な一歩と位置付けています。将来的には、ロボット工学のシミュレーション環境や、科学・医療分野でのブレークスルーにも貢献する可能性があると期待を示しており、その動向から目が離せません。

ゲームデータで次世代AI、新興企業に200億円超

次世代AI「ワールドモデル」

人間のような空間認識を持つAI
物理世界の因果関係を予測する技術
ロボットや自動運転への応用

General Intuitionの強み

ゲーム動画データ年間20億本
AIが行動を学ぶ検証可能な環境
OpenAIも欲したデータの価値

大型シード資金調達

調達額は1億3370万ドル
OpenAI初期投資家が主導

ビデオゲームのプレイ動画からAIが世界を学ぶ。新興AIラボ「General Intuition」は2025年10月17日、ゲームデータを用いてAIに物理世界を理解させる「ワールドモデル」を開発するため、シードラウンドで1億3370万ドル(約200億円)を調達したと発表しました。この動きは、AIエージェント開発における新たなフロンティアを開拓する試みとして、業界の大きな注目を集めています。

ワールドモデル」とは、AIが人間のように空間を認識し、物事の因果関係を予測する能力を指します。例えば、テーブルから落ちるコップを事前に掴むといった、物理世界での直感的な判断を可能にします。Google DeepMindなどが研究を主導しており、自律型AIエージェント実現の鍵と見なされています。汎用人工知能(AGI)への道筋としても期待される重要技術です。

同社の強みは、親会社であるゲーム録画プラットフォーム「Medal」が保有する膨大なデータにあります。年間約20億本アップロードされるプレイ動画は、AIが3次元空間での「良い行動」と「悪い行動」を学ぶための検証可能な学習データセットとなります。このデータの価値は非常に高く、過去にはOpenAIが5億ドルでの買収を提案したとも報じられています。

今回の大型資金調達を主導したのは、OpenAIの初期投資家としても知られるKhosla Venturesです。創業者のヴィノド・コースラ氏は「彼らは独自のデータセットとチームを持っている」と高く評価。General Intuitionが、LLMにおけるOpenAIのように、AIエージェント分野で破壊的な影響をもたらす可能性があると大きな期待を寄せています。

General Intuitionは、開発したモデルをまず捜索救助ドローンに応用し、将来的には人型ロボットや自動運転車への展開を目指します。しかし、この分野はGoogleのような資金力豊富な巨大企業との競争が激しく、技術的なアプローチもまだ確立されていません。どのデータや手法が最適かは未知数であり、大きなリスクも伴います。

今回の動きは、ゲーム業界に新たな可能性を示唆しています。ワールドモデルへの関心が高まるにつれ、ゲーム企業が保有するデータはAI開発の宝庫となり、大手AIラボの買収対象となる可能性があります。自社データの価値を正しく理解し、戦略を立てることが、今後のAI時代を勝ち抜く上で重要になるでしょう。

ゲーム動画でAI訓練、時空間推論へ200億円調達

巨額調達の背景

シードで約200億円という巨額調達
ゲーム動画共有Medal社からスピンアウト
年間20億本動画を学習データに活用
OpenAI買収を試みた優良データ

AIの新たな能力

LLMが苦手な物理世界の直感を学習
未知の環境でも行動を的確に予測

想定される応用分野

ゲーム内の高度なNPC開発
捜索救助ドローンロボットへの応用

ゲーム動画共有プラットフォームのMedal社からスピンアウトしたAI研究所「General Intuition」が、シードラウンドで1億3370万ドル(約200億円)という異例の資金調達を発表しました。同社は、Medalが持つ年間20億本ものゲーム動画を学習データとし、AIに現実世界での動きを直感的に理解させる「時空間推論」能力を訓練します。これは現在の言語モデルにはない能力で、汎用人工知能(AGI)開発の新たなアプローチとして注目されています。

同社が活用するゲーム動画データは、その質の高さからOpenAIも過去に買収を試みたと報じられるほどです。CEOのピム・デ・ウィッテ氏によれば、ゲーマーが投稿する動画は成功や失敗といった極端な事例(エッジケース)が多く、AIの訓練に非常に有用なデータセットとなっています。この「データ・モート(データの堀)」が、巨額の資金調達を可能にした大きな要因です。

「時空間推論」とは、物体が時間と空間の中でどのように動き、相互作用するかを理解する能力を指します。文章から世界の法則を学ぶ大規模言語モデル(LLM)に対し、General Intuitionは視覚情報から直感的に物理法則を学ばせるアプローチを取ります。同社は、この能力こそが真のAGIに不可欠な要素だと考えています。

開発中のAIエージェントは、訓練に使われていない未知のゲーム環境でも、人間のプレイヤーが見るのと同じ視覚情報のみで状況を理解し、次にとるべき行動を正確に予測できる段階にあります。この技術は、ゲームのコントローラーで操作されるロボットアームやドローン、自動運転車といった物理システムへ自然に応用できる可能性があります。

初期の実用化分野として、2つの領域が想定されています。一つは、ゲーム内でプレイヤーの習熟度に合わせて難易度を動的に調整し、常に最適な挑戦を提供する高度なNPC(ノンプレイヤーキャラクター)の開発です。もう一つは、GPSが使えない未知の環境でも自律的に飛行し、情報を収集できる捜索救助ドローンの実現です。

競合他社がシミュレーション環境(ワールドモデル)そのものを製品化するのに対し、General Intuitionはエージェントの応用事例に注力する戦略をとります。これにより、ゲーム開発者コンテンツと競合したり、著作権問題を引き起こしたりするリスクを回避する狙いもあります。

今回の資金調達はKhosla VenturesとGeneral Catalystが主導しました。シードラウンドとしては異例の規模であり、ゲームから生まれたデータが次世代AI開発の鍵を握るという期待の大きさを物語っています。同社の挑戦は、AI技術の新たな地平を切り開くかもしれません。

AI開発の主戦場、「ワールドモデル」へ移行加速

LLMの次なるフロンティア

LLMの性能向上に頭打ち感
物理世界を理解する新モデルに注目
動画ロボットデータから学習
GoogleMetaNvidiaが開発を主導

100兆ドル市場への期待と課題

自動運転やロボティクス進化を加速
製造・医療など物理領域への応用
Nvidia幹部が100兆ドル市場と試算
実現には膨大なデータと計算能力が壁

Google DeepMindMetaNvidiaなどの大手AI企業が、大規模言語モデル(LLM)の進歩が鈍化する中、次なる飛躍を求めて「ワールドモデル」の開発に注力し始めています。この新モデルは、言語データではなく動画ロボットデータから物理世界を学習し、人間環境への深い理解を目指します。これは機械による「超知能」実現に向けた新たなアプローチとして注目されています。

OpenAIChatGPTなどに代表されるLLMは、目覚ましい進化を遂げてきました。しかし、各社が投入する最新モデル間の性能差は縮小傾向にあり、開発に投じられる莫大な資金にもかかわらず、進歩に頭打ち感が見え始めています。この状況が、AI開発の新たな方向性を模索する動きを加速させているのです。

ワールドモデルは、LLMとは根本的に異なるアプローチを取ります。テキストデータから言語のパターンを学ぶLLMに対し、ワールドモデル動画シミュレーションロボットの動作データといった物理世界のデータストリームから学習します。これにより、現実世界の法則や因果関係を理解し、将来を予測する能力の獲得を目指します。

この技術が秘める経済的インパクトは計り知れません。Nvidiaの担当副社長であるレヴ・レバレディアン氏は、ワールドモデルが物理世界を理解し操作できるようになれば、その潜在市場は「本質的に100兆ドル」規模、つまり世界経済に匹敵する可能性があると指摘しています。

ワールドモデルは、自動運転車やロボティクス、いわゆる「AIエージェント」の進化に不可欠な一歩と見なされています。製造業やヘルスケアなど、物理的な操作を伴う産業での活用も期待されます。しかし、その実現には膨大なデータと計算能力が必要であり、依然として技術的に未解決の挑戦であることも事実です。

Meta、ロボットOSで覇権狙う AR級の巨額投資

ボトルネックはソフトウェア

ARに次ぐ数十億ドル規模投資
ハードウェアではなくソフトウェアが開発の鍵
器用な操作を実現するAIモデルが不可欠

「ロボット界のAndroid」構想

自社製ロボットMetabot」も開発
他社へソフトウェアをライセンス供与
プラットフォームで業界標準を狙う

専門家集団による開発体制

元Cruise CEOがチームを統括
MITなどからトップ人材を結集

Metaは、ヒューマノイドロボット開発を拡張現実(AR)に次ぐ大規模な投資対象と位置付けていることを明らかにしました。同社のアンドリュー・ボスワースCTOによると、数十億ドル規模を投じ、ハードウェアではなくソフトウェア開発に注力します。開発したプラットフォームを他社にライセンス供与する「ロボットAndroid」とも言える戦略で、急成長する市場の主導権を握る構えです。

なぜソフトウェアが重要なのでしょうか。ボスワース氏は「ハードウェアは難しくない。ボトルネックはソフトウェアだ」と断言します。ロボットがコップを絶妙な力加減で掴むといった器用な操作は極めて困難であり、この課題を解決するため、AIが現実世界をシミュレーションする「ワールドモデル」の構築が不可欠だと説明しています。

Metaの戦略は、自社でハードウェアを製造し販売することではありません。社内で「Metabot」と呼ばれるロボットを開発しつつも、その核心技術であるソフトウェアを他社ロボットメーカーに広くライセンス供与する計画です。これはGoogleAndroid OSでスマートフォン市場のエコシステムを築いた戦略と類似しており、オープンなプラットフォームで業界標準となることを目指します。

この野心的な計画を支えるのが、Metaが新設した「Superintelligence AI lab」です。このAI専門組織がロボティクスチームと緊密に連携し、ロボット知能を司るAIモデルを開発します。ボスワース氏は「このAIラボがなければ、このプロジェクトは実行しなかった」と述べ、AI開発能力が自社の最大の強みであるとの認識を示しました。

このアプローチは、テスラが開発する「Optimus」とは一線を画します。ボスワース氏は、人間の視覚を模倣してデータを集めるテスラの手法について「ロボット用のデータをどうやって十分に集めるのか疑問だ」と指摘。Metaシミュレーションワールドモデルを駆使して、このデータ問題を解決しようとしています。

Metaの本気度は、集結した人材からも伺えます。自動運転企業Cruiseの元CEOであるマーク・ウィッテン氏がチームを率い、MITから「現代最高の戦術ロボット工学者」と評されるキム・サンベ氏を招聘。社内のトップエンジニアも結集させ、盤石な体制でこの巨大プロジェクトに挑みます。

OpenAI、人型ロボット開発を強化 AGI競争の新局面へ

AI開発をリードするOpenAIが、AGI(汎用人工知能)実現に向けた次の一手として人型ロボット開発を本格化させています。同社は最近、人型ロボット向けAIシステムの専門研究者の採用を開始しました。これは、物理世界でタスクを実行する能力がAGI開発の鍵になるとの認識が業界で高まっていることを示唆します。TeslaやFigure AIなど先行企業との競争が激化しそうです。 なぜ今、人型ロボットなのでしょうか。その理由は、ロボットが人間用に設計された環境で活動できる点にあります。階段を上るなど物理的なタスクを通じた学習が、より高度な知能の獲得につながると考えられています。文章生成は得意でも「コーヒーを淹れる」ことができない現在のAIの限界を超える狙いです。 OpenAIは2021年にロボティクス部門を一度閉鎖しましたが、再びこの分野に注力し始めました。AIの次なるブレークスルーとして、物理世界を理解する「ワールドモデル」の構築が重要視されています。ロボット開発はその鍵を握るプロジェクトと位置づけられているのです。 人型ロボット市場では、すでに多くの企業が開発競争を繰り広げています。TeslaやFigure AI、Boston Dynamicsなどが有力なプレイヤーです。中国のUnitreeは低コストなロボットで市場に参入。OpenAIは先行するハードウェア企業に対し、得意のAIアルゴリズムで優位性を築く戦略です。 人型ロボット市場は2050年までに5兆ドル規模に達するとの予測もあり、期待が高まっています。しかし、SNSで目にする見事なデモ動画は、特定の条件下でしか成功しない場合も少なくありません。未知の環境で安定して動作する信頼性の確保が、実用化に向けた最大の課題と言えるでしょう。 実用化はまず、工場や倉庫といった産業現場から進む見通しです。Amazonは倉庫内で、現代自動車は工場で人型ロボットの試験導入を開始しています。危険で単調な作業の代替が主な目的です。各家庭で活躍する「ロボット執事」の実現はまだ先になりそうです。 今後の技術的な焦点は、ハードとソフトの両面にあります。人間の手のように繊細な作業をこなすハードウェアは依然として難題です。また、未知の状況にも対応できる汎用的なAIモデルも欠かせません。AIの「幻覚」が物理世界で起きないよう、安全性と信頼性の確保が最優先されます。