ヒューマノイド(ロボット)に関するニュース一覧

Agile RobotsがGoogle DeepMindと戦略提携を発表

提携の概要

Gemini Roboticsモデルをロボットに統合
製造・自動車・物流など産業用途で展開
ロボット収集データでGemini改善に活用
世界で2万台超ロボット導入実績

業界の提携加速

Boston DynamicsもDeepMind提携済み
Neura RoboticsはQualcomm協業開始
物理AIが次の市場フロンティアに
ハード・ソフト企業間の補完連携が拡大

Agile Robotsは2026年3月、米Google DeepMindと戦略的研究パートナーシップを締結したと発表しました。同社のロボットDeepMindGemini Robotics基盤モデルを統合し、産業分野での自律ロボット開発を共同で進めます。

提携の対象分野は電子機器製造、自動車、データセンター、物流など多岐にわたります。両社はGemini基盤モデルを活用したロボットのテスト、微調整、実環境への展開を協力して行う方針です。契約は長期とされていますが、具体的な期間や金額は非公開です。

Agile Robotsは2018年創業のミュンヘン拠点企業で、SoftBank Vision FundやXiaomiなどから累計2億7000万ドル超を調達しています。共同創業者兼CEOのZhaopeng Chen氏は「自律型インテリジェント生産システムが産業全体を変革する大きな機会がある」と述べました。

ロボット業界では同様の提携が相次いでいます。Hyundai傘下のBoston Dynamicsは今年初め、ヒューマノイドロボットAtlasの開発にDeepMindのAI基盤モデルを活用すると発表しました。また独Neura Roboticsも3月にQualcommIQ10プロセッサを採用する提携を公表しています。

NVIDIAJensen Huang CEOをはじめ業界関係者の多くが物理AIをAI市場の次なるフロンティアと位置づけています。ハードウェアとソフトウェアそれぞれの強みを持つ企業同士の補完的な提携は今後さらに加速する見通しです。

NvidiaがGTCでディズニーのオラフ型ロボットを披露

GTC基調講演の全容

売上1兆ドル規模の予測を提示
DLSS 5で生成AI活用
全企業にOpenClaw戦略を提唱
NemoClawをOSSとして公開

オラフロボットの課題

デモ中にマイクを強制オフ
ディズニーパークでの社会的課題未解決
ヒューマノイド全般に共通する問題
ロボット監視の雇用創出可能性

Nvidiaは2026年3月のGTCカンファレンスで、CEOジェンスン・ファン氏が基調講演を行い、売上1兆ドル規模の予測やDLSS 5の生成AI活用、全企業へのOpenClaw戦略の必要性を訴えました。

講演の目玉として、ディズニー映画「アナと雪の女王」のオラフを模したロボットが登場しました。Nvidiaロボティクス技術を実演する目的でしたが、デモ終盤でオラフが暴走して観客に話し続けたため、スタッフがマイクを切る一幕がありました。

TechCrunchのポッドキャスト「Equity」では、このデモについて議論が交わされました。記者のショーン・オケイン氏は、こうしたロボティクスのプレゼンが常に工学的課題にのみ焦点を当て、社会的な問題を無視していると指摘しています。

具体的には「子供がオラフを蹴り倒したらどうなるのか」という問題が提起されました。ディズニーパークでのブランド毀損リスクや、ヒューマノイドロボット全般が抱える人間社会への統合という課題は、技術的な進歩の議論に比べて大幅に遅れていると警鐘を鳴らしています。

一方、記者のキルステン・コロセク氏は反論として、オラフには人間の監視役が必要になるため、むしろ新たな雇用を生む可能性があると述べました。NvidiaにとってはOpenClaw関連の投資リスクが低く、何もしないことの方が大きなリスクだとの見解も示されています。

DoorDash、AI訓練データ収集の新ギグアプリ「Tasks」を開始

Tasksアプリの概要

身体動作の録画が主業務
時給15ドル・上限20分の報酬体系
家事・料理・散策など5分野
ロボット訓練用の動画データ収集
一部州では利用が明示的に禁止

ギグワーカーの現実

3タスク完了で推定報酬10ドル未満
撮影中のプライバシー問題が深刻
低賃金AIギグ経済の拡大懸念

DoorDashは、生成AIやヒューマノイドロボットの訓練データを人間が収集する新アプリ「Tasks」を米国で公開しました。フードデリバリーとは無関係で、スマートフォンを胸に装着し、手の動きを録画する作業が中心です。

アプリで提供されるタスクは家事・日曜大工・料理・ナビゲーション・外国語会話の5カテゴリに大別されます。洗濯物の投入からセメント打ち、卵料理、公園の散策、ロシア語や中国語での自然な会話まで、幅広い作業が含まれています。

報酬は時給15ドルで1タスクの上限は20分に設定されています。記者が実際に洗濯物の投入タスクを試したところ、約1分半で完了し推定報酬はわずか0.37ドルでした。卵料理のタスクも最大報酬は5ドルにとどまります。

公園のナビゲーションタスクでは、他人を撮影しないというDoorDashのルール順守が極めて困難であることが判明しました。ベビーカーを押すジョギング中の母親に遭遇し、記者は5分でタスクを中断。混雑した場所でのタスク遂行は現実的に不可能に近いと指摘しています。

サンフランシスコの開発者らはこうした低賃金の一時的作業をギグエコノミーの次なる進化と見ています。しかし記者が3タスクを完了して得た推定報酬は10ドル未満であり、AI産業への巨額投資とは対照的な、労働者側の厳しい現実が浮き彫りになっています。

Rivian発のMind Robotics、産業用AIロボットで500億円調達

巨額資金調達の全容

シリーズAで5億ドル調達
Accela16zが共同リード
企業評価額約20億ドル
シード含め総額6.15億ドル

産業用ロボットの新戦略

Rivian工場データで訓練
人型ロボットではなく実用設計重視
年内に大規模配備を計画
独自チップ転用も視野

RivianのCEO兼創業者RJ・スカリンジ氏が設立した産業用ロボティクス企業Mind Roboticsが、シリーズAラウンドで5億ドル(約750億円)資金調達を完了しました。AccelとAndreessen Horowitzが共同でリードし、企業評価額は約20億ドルに達しています。

同社は2025年11月にRivianからスピンアウトし、シードラウンドの1.15億ドルと合わせて総額6.15億ドルを数カ月で調達しました。スカリンジ氏は会長を務め、Rivianでの垂直統合型ハードウェア企業の経験を産業用ロボティクスに応用する構想です。

現在の産業用ロボット反復的で安定した作業には優れていますが、工場における付加価値の高い作業の多くは人間のような器用さや適応力、物理的推論を必要とします。Mind Roboticsはこの構造的なギャップを埋めるAI基盤の構築を目指しています。

スカリンジ氏はTeslaなどが開発するヒューマノイドロボットとは一線を画し、より伝統的な工場向けロボット設計に注力する方針を示しています。「バク転ができても製造業には価値を生まない」と同氏は述べ、実用性を最優先する姿勢を明確にしました。

Rivianの工場はデータフライホイールの役割を果たし、大量生産環境での豊富なデータがモデル改善に活用されます。さらにRivianが開発中の自動運転向け独自チップをMind Roboticsに供給する可能性もあり、両社の連携による競争優位の構築が期待されています。

NVIDIAジェットソンがエッジAIの新標準に、重機から家庭まで展開

エッジ推論の実用例

キャタピラー重機に音声AIアシスタント搭載
クラウド不要のローカル推論を実現
Jetson Thorがリアルタイム処理を担保
ロボット・スマートホームにも展開

対応オープンモデル群

GemmaMistralQwen主要モデルに対応
GR00T N1.6でロボット動作を自律制御
vLLMで最大273トークン/秒を達成
2B〜30Bパラメータを柔軟に切り替え

NVIDIAは2026年のCESにおいて、エッジAIプラットフォーム「Jetson Thor」上でキャタピラーの小型油圧ショベル向け音声AIアシスタントのデモを公開した。Qwen3 4BモデルをvLLC経由でローカル動作させ、クラウド接続なしで低遅延な自然言語応答を実現している。

従来のオープンモデルはデータセンターで運用されてきたが、クラウド依存はレイテンシとコストの課題を抱える。Jetsonはシステムオンモジュールにコンピュートとメモリを統合し、メモリ不足による調達難を解消しながら、産業機器向けに安定したエッジ推論環境を提供する。

ロボティクス分野ではFranka RoboticsのFR3 DuoがオンボードでGR00T N1.6モデルを実行し、タスクスクリプト不要で知覚から動作まで完結させた。NYU・UIUCなどの研究機関もJetson Thor上でヒューマノイド制御や抹茶製造ロボットの開発に成功している。

個人開発者レベルでも活用が広がっており、Hugging FaceのAndré Marafiotiはエージェント型AIシステムをJetson AGX Orin上で構築し、タスク自律スケジューリングを実現した。CollabnixのAjeet Singh RainaはOpenClawをJetson Thor上で24時間稼働させ、メール・カレンダー管理を自動化している。

Jetson Thorは現在、Gemma 3・Mistral 3・Qwen 3.5・gpt-oss-20B・NVIDIA Cosmosなど主要オープンモデルを広くサポートしており、開発者はvLLM・Ollamallama.cppなど多様なフレームワークを選択できる。GTC 2026では産業自律化の未来をテーマにした展示も予定されている。

HuggingFace、LeRobot v0.5.0でヒューマノイド対応と6つの新ポリシーを追加

ハードウェア拡張

Unitree G1ヒューマノイド初対応
全身協調制御(WBC)の実現
OpenArmロボットアームの統合
CANバスモーター対応で高性能化

AIポリシーと高速化

Pi0-FAST自己回帰VLAの導入
Real-Time Chunkingで推論の応答性向上
LoRA/PEFTで大規模VLAの効率微調整
画像学習10倍高速化を実現

エコシステム整備

EnvHubでHub上のシミュレーション環境を直接利用
NVIDIA IsaacLabとのGPU並列学習統合
サードパーティポリシープラグイン対応
ICLR 2026採択で学術的評価を獲得

Hugging Faceは2026年3月にオープンソースロボット学習フレームワーク「LeRobot」のv0.5.0をリリースした。同バージョンでは初のヒューマノイドロボット対応や6つの新ポリシー追加、データパイプラインの大幅な高速化など、あらゆる次元でのスケールアップが実現されています。

最大のハードウェア追加はUnitree G1ヒューマノイドの全面サポートです。歩行・ナビゲーション・物体操作・遠隔操作に加え、全身協調制御(WBC)により移動と操作を同時実行できる。これはLeRobotが卓上アームを超えた汎用ロボティクスへ踏み出す重要な一歩となっています。

ポリシー面ではPi0-FASTが注目されます。Gemma 300Mベースの自己回帰型アクションエキスパートを採用し、FASToトークン化によって離散化されたアクション列を生成します。また推論技術のReal-Time Chunking(RTC)は、フローマッチングポリシーの応答性を劇的に改善し、実世界デプロイでのレイテンシ問題を解消します。

データセットパイプラインではストリーミングビデオエンコーディングの導入により、エピソード記録後のエンコード待ち時間がゼロになりました。さらに画像学習が最大10倍、エンコードが3倍高速化されており、データ収集からモデル訓練までのサイクルが大幅に短縮されています。

コードベース面ではPython 3.12+とTransformers v5への移行が完了し、サードパーティポリシープラグインシステムの導入でエコシステムの拡張性が向上しました。EnvHubとNVIDIA IsaacLab-Arenaの統合により、シミュレーション環境の共有・活用も容易になっています。同論文はICLR 2026にも採択されており、学術コミュニティからの評価も高まっています。

ボストン・ダイナミクスCEOが退任

退任の経緯

Playter氏が退任を発表
30年間の貢献に区切り
社内メモで通知

ロボティクスの今後

人型ロボット市場が活況
次期リーダーの方針に注目
Hyundai傘下での新展開

Boston DynamicsのCEO、Robert Playter氏が30年間の在籍を経て退任を発表しました。社内メモで従業員に通知されています。

同氏は四足歩行ロボットヒューマノイドの開発で知られるBoston Dynamicsの成長を牽引してきました。ロボティクス業界の象徴的なリーダーの交代です。

現在Boston DynamicsはHyundai傘下にあり、商用ロボットの展開を加速しています。新CEOの戦略方針が今後の方向性を左右します。

人型ロボット市場ではFigure、Apptronikなどの新興企業も台頭しており、競争環境が急速に変化しています。リーダー交代はこの流れに影響を与えます。

ロボティクスとAIの融合が進む中、Boston Dynamicsの次のステージがどのような形になるかが業界の注目を集めています。

NvidiaがDreamDojo公開、ロボット訓練を人間動画で革新

技術概要と特徴

DreamDojoは人間動画4万4000時間で訓練
ロボット用「ワールドモデル」として初の汎化型
多様な物体・環境への強い汎化能力を実証
UC BerkeleyStanford等との共同研究
ヒューマノイドロボット訓練コストを大幅削減

ロボットAI分野への影響

実世界動作の逆問題解析に新たな手法
物体との相互作用学習をビデオから獲得
合成データ不要でリアルな動作パターンを習得
訓練時間と費用の削減が商用ロボット普及を加速
次世代ヒューマノイドロボット開発の基盤技術に

Nvidiaを中心とする研究チームは、4万4000時間の人間の動画データで訓練したロボット用「ワールドモデルDreamDojoを公開しました。UC Berkeley、Stanford大学、テキサス大学オースティン校などが参加した共同研究成果です。

DreamDojoは、ロボットが物理的な世界でどのように物体と相互作用するかを学習するために、人間の行動映像を直接活用します。従来の合成データや手作業によるデモンストレーションに頼る手法と比べ、現実の動作パターンをより豊富に学習できます。

研究チームは「多様な物体への強い汎化能力を実証した初のロボットワールドモデル」と位置付けており、特定のタスク向けに設計されたロボットではなく、汎用的な物理的インタラクションを習得できる点が画期的です。

この技術は次世代のヒューマノイドロボット訓練の時間とコストを大幅に削減する可能性を持っています。物理AIの急速な発展の中で、Nvidiaが研究フロントでの主導権を確立しようとする戦略的意図も読み取れます。

ロボット訓練の民主化は、製造・物流・医療などの現場で使えるロボットの普及を加速させます。DreamDojoは人間の知識をロボットへ転移する効率的な経路として、今後の産業界に大きな影響を与えそうです。

歯ブラシを持ってくるヒューマノイドロボットのデモが話題に

デモの概要

歯ブラシを自律取得するロボット
日常物品の把持精度向上
家庭用ロボット実現への一歩

技術的意義

汎用マニピュレーションの進歩
AI制御の安定性
商業化近接の証明

新しいヒューマノイドロボットが歯ブラシなどの日常的な家庭用品を自律的に取って持ってくるデモを披露し、物理的AIの実用性を示しました。

このデモは汎用ロボット操作の精度が実用レベルに近づいていることを示しており、家庭用ロボット商業化の現実性が高まっています。

最初のヒューマノイドロボット同僚はおそらく中国製になる

中国ロボット産業の台頭

中国メーカーがコスト優位を確立
Unitree・Agilityなどが世界展開
製造ラインへの先行導入
政府補助で開発が加速
欧米より低価格で高性能

職場への影響

倉庫・工場から導入が始まる
危険作業の代替が最初
人間との協働モデルが普及
雇用への影響が議論に
規制整備が後追いになる

ヒューマノイドロボットの商用展開が現実化しつつある中、初期の「職場のロボット同僚」は中国製になる可能性が高いという分析が出ています。コスト競争力と製造能力の面で中国が先行しています。

中国ロボティクス企業は政府の強力な支援を受けており、ハードウェアコストの低下とAI能力の向上が組み合わさって急速な製品化が進んでいます。

倉庫の荷物運搬や工場での組み立て作業など、繰り返し作業から導入が始まり、次第により複雑なタスクへと展開されていくと予想されます。

雇用への影響は避けられない問題であり、政府・企業・労働組合が協議して職場のロボット化に向けた社会的枠組みを整備する必要があります。

ロボティクスソフトウェアのSkild AIが評価額1兆4000億円超で資金調達

調達の規模と背景

評価額140億ドルで資金調達完了
ロボティクスソフトウェア市場の高成長を反映
汎用ロボット制御ソフトウェアに特化
製造業・物流向けの需要が急増
大手投資家が参加する規模

ロボティクスソフトウェアメーカーのSkild AIが140億ドル評価額資金調達を完了しました。TechCrunchが報じたこの評価額は、物理AIとロボティクス市場への投資家の高い期待を反映しています。

Skild AIは汎用ロボット制御ソフトウェアに特化しており、製造業、物流、医療など多様な産業向けのロボットに対応します。ヒューマノイドロボット市場の急拡大と合わせて、ロボット制御ソフトウェアの市場規模も急増しています。

Google GeminiがBoston Dynamicsの人型ロボットを自動車工場で制御

DeepMindとBoston Dynamicsの連携

Google DeepMindとBoston Dynamicsが協業開始
AtlasロボットGeminiによる知性を付与
自動車工場のフロアでの自律ナビゲーション
複雑なインストラクション理解が可能に
汎用ロボットとしての能力が大幅に向上
ゼネラルモーターズなど自動車大手と連携

産業ロボットのAI化が加速

GeminiロボットへのAI頭脳として機能
自然言語での作業指示に対応
センサー融合推論の統合が精度を向上
工場内での人間との安全な協働を実現
訓練コスト削減にシミュレーションを活用
2026年中に実際の工場ラインへの展開を計画

Google DeepMindとBoston DynamicsがGeminiを活用した産業向けヒューマノイドロボットの開発で協業を開始した。AtlasロボットGemini推論・言語理解・マルチモーダル認識能力を統合することで、複雑な工場環境でも自律的に動作できる能力を実現している。

自動車工場でのパイロット展開では、ロボット自然言語での作業指示を理解し、部品の搬送・組み立てアシスト・品質確認などの作業を半自律的に実行することが実証された。GeminiのマルチモーダルAIが周囲環境の認識精度を大幅に向上させた。

技術的には視覚・力覚・位置センサーの融合データをGeminiがリアルタイムで処理し、最適な行動を選択する構成になっている。従来のルールベースロボットでは対応できなかった予期しない状況への適応が可能になっている。

安全性の面では、ロボットが人間と同じ空間で作業する「協調ロボット(コボット)」として機能するための制御が重要課題だ。AIによる意図認識と衝突回避が従来のセンサーベース安全機能を補完し、人間との安全な協働を実現している。

Googleにとってこの連携は、Geminiを単なるチャットAIから物理世界のインターフェースへと拡張する重要なショーケースだ。また、Boston DynamicsはHyundai傘下でありながらGoogleとの技術統合が進むという複雑な構造も注目される。

ヒューマノイドロボットの夢と現実、Waymoが停電で立往生

ヒューマノイドの現状と課題

テスラOptimus発表イベントで転倒映像が拡散
過去の「自律」デモが実は遠隔操作と発覚
中国・米欧で大規模な資金流入が継続
1Xの20,000ドルNeOも遠隔操作が前提
ロボット訓練データ不足が普及の壁に
中国の計画機関がバブル形成を警告済み

Waymo停電事件の教訓

SF大規模停電でWaymoロボタクシーが道路上に立往生
信号機が機能不全のため4方向停止として処理
大半のトリップは正常に完了したとWaymoは主張
インフラ依存が自動運転の隠れたリスクを露呈
週45万回のライドを提供する規模まで成長
停電後に学習を迅速統合すると約束

テスラのOptimus転倒映像が拡散し、ヒューマノイドロボットの現実が改めて問われています。テスラは過去にも自律デモが実際は遠隔操作だったことが明らかになっており、信頼性への懸念が高まっています。

それでも業界への投資は活発で、NVIDIAMetaAmazonMicrosoftなど主要テック企業すべてがヒューマノイド次のフロンティアと位置付けています。中国では政府主導の大規模投資と補助金が展開されています。

技術的な課題の核心は訓練データ不足です。LLMはインターネット上のテキストで訓練できましたが、ロボットが必要とするリアルワールドのモーションデータは希少であり、企業は人間にカメラを装着させるなどの苦肉の策を採っています。

1Xが20,000ドルで販売するNeoロボットも、実際には遠隔操作者が自宅に「テレコミュート」する仕組みであることが明らかになっています。完全自律動作への道のりは依然として長いと言えます。

一方、自動運転のWaymoは別の現実に直面しました。サンフランシスコで発生した大規模停電により、ロボタクシーが道路上に立往生する事態が発生。インフラへの依存が自動運転の隠れたリスクであることを露呈しました。

Waymoは大半のトリップを正常完了させたと主張していますが、この事件は自動運転車が想定外の環境変化に対していまだ脆弱であることを示しています。週45万回のライドを提供する規模に成長した同社は、迅速な学習統合を約束しています。

1X、EQTに最大1万台のロボット供給

提携の概要

最大1万台のNeoロボットを供給
2026〜2030年の長期契約
EQTの300社以上が対象
製造・物流・倉庫向け

戦略的転換点

Neoは元々家庭用として販売
価格は$20,000で予約受付中
産業用途への大胆な方向転換
投資家関係を活用した販路確保

ロボティクス企業1Xが、スウェーデンの大手投資会社EQTの出資先企業向けに、最大1万台のNeoヒューマノイドロボットを供給する戦略的パートナーシップを発表しました。2026年から2030年にかけて、製造、倉庫、物流などの産業用途で展開されます。

この提携が注目される理由は、Neoが元々「家庭での生活を変える初の消費者向けヒューマノイドロボット」として10月に2万ドルで予約受付を開始していたことです。産業用ロボットEve Industrialを別に持ちながら、あえて家庭用Neoを産業向けに展開する戦略的転換です。

1XはEQTの出資先企業それぞれと個別に契約を結ぶ形式を取ります。投資家との関係を活用した販路確保であり、ヒューマノイドロボットの企業環境での商業的需要の高まりを示す象徴的な取引と言えます。

Google、元ボストン・ダイナミクスCTO採用でロボットAI加速

ロボット版「Android」構想

元ボストン・ダイナミクスCTOを採用
VPとしてハードウェア部門を統括
スマホのAndroid戦略を踏襲

AI脳への注力と市場展望

ハードは問わず汎用AIで制御
今後数年で技術的飛躍を予測
テスラ中国勢と競争激化
焦点はハードよりソフトウェア

Google DeepMindは2025年11月、ボストン・ダイナミクスの元CTOであるアーロン・サンダース氏をハードウェア担当VPとして採用しました。AIモデル「Gemini」をロボットのOSとして普及させるための戦略的な人事といえます。

デミス・ハサビスCEOは、スマートフォン市場におけるAndroidのように、多様なロボット「箱から出してすぐに」動かせるAI基盤の構築を目指しています。サンダース氏の知見を得て、ヒューマノイドを含むあらゆる機体への対応を加速させます。

テスラ中国企業が安価なハードウェア開発で先行する中、Google「AI脳」の開発に注力して差別化を図る方針です。ハサビス氏は、AIとロボット工学の融合が数年以内にブレイクスルーを迎えると予測し、競争力の強化を急いでいます。

「ヒューマノイド五輪」提唱、実用化への挑戦状

現行技術が抱える限界

デモンストレーションからの学習が主流
力覚フィードバックの欠如
指先の細かい制御が困難
人間並みの触覚センサーが未搭載

5つの実用的な挑戦課題

ドア開閉と全身協調
洗濯物の複雑な取り扱い
道具の力強い・器用な使用
水回りでの濡れた物体の操作

ロボット工学者のベンジー・ホルソン氏が、ロボットの器用さと操作能力の限界を押し上げるため、新たな競技会「ヒューマノイド・オリンピック」を提唱しました。日常生活に即した5つのタスクを通じて、現在の技術的課題を浮き彫りにし、真に実用的なロボット開発を加速させることが狙いです。成功者には実物のメダルが授与されるとしています。

この提案の背景には、既存のロボット競技への課題意識があります。ホルソン氏は、単なるエンターテイメントではなく、洗濯や掃除といった実生活で役立つ能力こそが重要だと指摘。現在の主流である「デモンストレーションからの学習」という手法だけでは、汎用的なタスクの実現は難しいとして、新たな技術開発の必要性を訴えています。

現在のロボット技術には明確な限界が存在します。人間による遠隔操作データに頼るため、力覚のフィードバックや繊細な指の制御、人間のような触覚が欠けているのです。これにより、タスクの精度は数センチ単位にとどまり、複雑な作業の完全自動化を妨げる一因となっています。

そこで提案されたのが5つの競技です。「ドアの開閉」「洗濯」「道具の使用」「指先での操作」「水回りの作業」といった、日常生活に根差したタスクが並びます。これらは、現在のロボットが苦手とする力加減や全身協調、濡れた物体の扱いなど、具体的な技術課題を克服するマイルストーンとして設定されています。

例えば「道具の使用」では、ピーナッツバターを塗るためにナイフを強く握り直す動作や、鍵束から正しい鍵を選んで鍵穴に挿すといった、高い精度と力が同時に要求されます。また「洗濯」では、裏返しのTシャツを元に戻して畳むなど、複雑な手順が求められます。これらはロボットハンドの設計や制御アルゴリズムに革新を迫る課題です。

ホルソン氏は、これらの課題をクリアしたチームに実物のメダルを授与すると宣言し、世界中の研究開発コミュニティに参加を呼びかけています。このユニークな挑戦は、ロボットが真に汎用的で役立つ存在になるための、具体的かつ刺激的なロードマップとなるのでしょうか。今後の動向が注目されます。

フィジカルAI、次世代自動化の核心

AIの能力スペクトル

基本物理オートメーション
適応的物理オートメーション
部分的自律フィジカルAI
完全自律フィジカルAI

市場と実用化の動向

市場は124億ドル規模に
製造業の64%がプラスROI
デジタルツインで開発を加速

AIが物理システムと融合する「フィジカルAI」が、産業の次なるフロンティアになっています。これはアルゴリズムがデジタルの境界を越え、現実世界を認識・操作する技術で、企業のオペレーションや顧客体験を根本から変革する力を持ちます。

フィジカルAIの能力は4つのレベルに分類されます。レベル1は決められた作業を行う基本オートメーション、レベル2は環境に応じて順序を変える適応型、レベル3は限定的な人間の介入で計画・実行する部分自律型、そしてレベル4はほぼ完全な自律型です。

この進化を支えるのが、高度な制御理論やマルチモーダルセンサーによる高精細な認識モデルです。エッジAIアクセラレータによるリアルタイム推論や、汎用的な知能を提供するファウンデーションモデルも不可欠です。

市場もこのポテンシャルに注目しています。AIロボット市場は2034年までに1240億ドル規模に達すると予測され、特に汎用ロボット開発を目指すヒューマノイドロボット分野に活発な投資が集まっています。

その効果はすでに現れています。アマゾンはサプライチェーン効率を25%向上させ、ある製造業者は導入時間を40%短縮。製造業では64%がプラスの投資収益率を報告しており、具体的なビジネス価値が証明されています。

フィジカルAIは単なる自動化の進化ではなく、事業モデルそのものを再定義するものです。この技術をいかに戦略的に活用するかが、今後の業界リーダーを分ける鍵となるでしょう。

ヒューマノイド投資に警鐘、実用化への高い壁

立ちはだかる技術的な壁

人間の手のような器用さの習得
60自由度を超える複雑なシステム制御
デモはまだ遠隔操作の段階も

市場と安全性の現実

人間と共存する際の安全確保が課題
宇宙など限定的なユースケース
VCが懸念する不透明な開発計画

iRobot創業者のロドニー・ブルックス氏をはじめとする複数の専門家が、ヒューマノイドロボット分野への過熱投資に警鐘を鳴らしています。巨額の資金が投じられる一方、人間の手のような「器用さ」の欠如や安全性の懸念から、実用化はまだ遠いとの見方が大勢です。広範な普及には、少なくとも数年から10年以上かかると予測されています。

最大の課題は、人間の手のような繊細な動き、すなわち「器用さ」の習得です。ブルックス氏は、現在の技術ではロボットがこの能力を学習することは極めて困難であり、これができなければ実質的に役に立たないと指摘します。多くのデモは華やかに見えますが、実用レベルには達していないのが現状です。

人間と共存する上での安全性も大きな障壁です。ロボティクス専門のベンチャーキャピタルは、工場や家庭内でヒューマノイドが人に危害を加えるリスクを懸念しています。ロボットの転倒による事故や、ハッキングされて予期せぬ行動を取る危険性など、解決すべき課題は山積しています。

開発のタイムラインも不透明です。Nvidiaの研究者は、ヒューマノイド開発の現状をかつての自動運転車の熱狂になぞらえています。実用化までには想定以上に長い年月を要する可能性があり、これは投資家の回収サイクルとも合致しにくく、ビジネスとしての持続可能性に疑問を投げかけています。

期待の大きいテスラの「Optimus」でさえ、開発は遅れ、最近のデモでは人間が遠隔操作していたことが明らかになりました。高い評価額を受けるスタートアップFigureも、実際の配備数については懐疑的な目が向けられており、期待と現実のギャップが浮き彫りになっています。

もちろん、専門家ヒューマノイドの未来を完全に否定しているわけではありません。しかし、その登場は10年以上先であり、形状も人型ではなく車輪を持つなど、より実用的な形になる可能性が指摘されています。現在の投資ブームは、技術の成熟度を見誤っているのかもしれません。

Meta、ロボットOSで覇権狙う AR級の巨額投資

ボトルネックはソフトウェア

ARに次ぐ数十億ドル規模投資
ハードウェアではなくソフトウェアが開発の鍵
器用な操作を実現するAIモデルが不可欠

「ロボット界のAndroid」構想

自社製ロボットMetabot」も開発
他社へソフトウェアをライセンス供与
プラットフォームで業界標準を狙う

専門家集団による開発体制

元Cruise CEOがチームを統括
MITなどからトップ人材を結集

Metaは、ヒューマノイドロボット開発を拡張現実(AR)に次ぐ大規模な投資対象と位置付けていることを明らかにしました。同社のアンドリュー・ボスワースCTOによると、数十億ドル規模を投じ、ハードウェアではなくソフトウェア開発に注力します。開発したプラットフォームを他社にライセンス供与する「ロボットAndroid」とも言える戦略で、急成長する市場の主導権を握る構えです。

なぜソフトウェアが重要なのでしょうか。ボスワース氏は「ハードウェアは難しくない。ボトルネックはソフトウェアだ」と断言します。ロボットがコップを絶妙な力加減で掴むといった器用な操作は極めて困難であり、この課題を解決するため、AIが現実世界をシミュレーションする「ワールドモデル」の構築が不可欠だと説明しています。

Metaの戦略は、自社でハードウェアを製造し販売することではありません。社内で「Metabot」と呼ばれるロボットを開発しつつも、その核心技術であるソフトウェアを他社ロボットメーカーに広くライセンス供与する計画です。これはGoogleAndroid OSでスマートフォン市場のエコシステムを築いた戦略と類似しており、オープンなプラットフォームで業界標準となることを目指します。

この野心的な計画を支えるのが、Metaが新設した「Superintelligence AI lab」です。このAI専門組織がロボティクスチームと緊密に連携し、ロボット知能を司るAIモデルを開発します。ボスワース氏は「このAIラボがなければ、このプロジェクトは実行しなかった」と述べ、AI開発能力が自社の最大の強みであるとの認識を示しました。

このアプローチは、テスラが開発する「Optimus」とは一線を画します。ボスワース氏は、人間の視覚を模倣してデータを集めるテスラの手法について「ロボット用のデータをどうやって十分に集めるのか疑問だ」と指摘。Metaシミュレーションワールドモデルを駆使して、このデータ問題を解決しようとしています。

Metaの本気度は、集結した人材からも伺えます。自動運転企業Cruiseの元CEOであるマーク・ウィッテン氏がチームを率い、MITから「現代最高の戦術ロボット工学者」と評されるキム・サンベ氏を招聘。社内のトップエンジニアも結集させ、盤石な体制でこの巨大プロジェクトに挑みます。

ロボットの安全性向上へ 3D超音波センサー「ADAR」が6億円調達

新世代の<span class='highlight'>知覚技術</span>

人間空間に進出するロボット安全確保
高周波音波(ADAR)による3D空間把握
LiDARより安価かつ高性能な代替策

LiDARとの<span class='highlight'>優位性</span>

レーザー点状測定に対し空間全体を充填
カメラの弱点を補う高精度な深度知覚
業界標準フォーマットで多様なシステムに連携

<span class='highlight'>市場からの評価</span>

ロボティクス産業安全分野で需要拡大
スケールアップに向け600万ドル調達完了

Sonairは、ロボットの安全性向上を目的とした3D超音波センサー「ADAR (Acoustic Detection and Ranging)」の開発資金として、600万ドル(約9億円超)を調達しました。このオスロ拠点のスタートアップは、従来のLiDAR技術よりも安価かつ包括的に環境を認識できるソリューションを提供し、人間と協働するロボットの普及を加速させます。

ADARセンサーは、高周波の超音波を発信し、その反響を捉えることで周囲の3次元データを取得します。共同創業者兼CEOのサンドヴェン氏は、LiDARがレーザー点状測定であるのに対し、「部屋全体を音で満たす」イメージだと説明し、より信頼性の高い深度知覚を実現します。

ロボットの知覚は通常、カメラに大きく依存しますが、カメラは悪条件下での物体検出に課題があります。ADARは、他のセンサーやカメラでは捉えきれない、高精度な深度情報を提供することで、ロボットのオペレーティングシステムが環境をより正確に把握する手助けをします。

Sonairは今年初めにセンサーをリリースして以来、ロボティクス分野から強い需要を受けています。複数の企業が次期モデルへの組み込みを計画するほか、産業安全セクターでの活用も開始。重機エリアへの侵入者を検知し、自動で機械を停止させる安全対策に貢献しています。

自動運転車の初期と同様に、人型ロボットヒューマノイド)の普及に伴い、安全性が最大の懸念事項となることが確実視されています。投資家たちはこの課題を理解しており、Sonairはカメラのように全てのロボットに搭載される標準センサーとなることを目指しています。

NVIDIAが英国の「AIメーカー」戦略を加速 物理AI・創薬・ロボティクス分野で広範に連携

英国の国家AI戦略を支援

英国のAI機会行動計画を後押し
世界クラスの計算基盤への投資
AI採用を全経済分野で推進
AIユーザーでなくAIメーカーを目指す

重点分野での協業事例

スパコンIsambard-AI」で基盤構築
ロボティクス:自律走行、製造、ヒューマノイド開発
ライフサイエンス:AI創薬デジタルツインを活用

NVIDIA英国のAIエコシステムとの広範なパートナーシップを強調し、英国の国家戦略である「AIメーカー」としての地位確立を強力に支援しています。ジェンスン・ファンCEOの英国訪問に際し、物理AI、ロボティクス、ライフサイエンス、エージェントAIなど最先端領域における具体的な協業事例が公表されました。

英国のAI基盤強化の核となるのは、NVIDIA Grace Hopper Superchipsを搭載した国内最速のAIスーパーコンピューター「Isambard-AI」です。これにより、公的サービスの改善を目指す独自の多言語LLM(UK-LLM)や、早期診断・個別化医療に向けた医療基盤モデル(Nightingale AI)など、重要な国家プロジェクトが推進されています。

特に物理AIとロボティクス分野での応用が加速しています。Extend Roboticsは製造業向けに安全なロボット遠隔操作システムを開発。Humanoid社は倉庫や小売店向けの汎用ヒューマノイドロボットを開発しており、いずれもNVIDIAのJetsonやIsaacプラットフォームが活用されています。

ライフサイエンス分野では、AIによる創薬の加速が目覚ましいです。Isomorphic LabsはAI創薬エンジンを構築し、英国CEiRSIはNVIDIA技術を用いて複雑な患者のデジタルツインを作成。これにより、大規模かつ多様な患者集団に対する新しい治療法のテストを可能にしています。

エージェントAIおよび生成AIのイノベーションも活発です。Aveniは金融サービスに特化したLLMを開発し、コンプライアンスを確保しながら顧客対応やリスク助言を行うエージェントフレームワークを構築しました。ElevenLabsやPolyAIは、超リアルな音声生成や、大規模な顧客サポート自動化を実現しています。

また、AIスキルギャップ解消への取り組みも重要です。技術ソリューションプロバイダーのSCANは、NVIDIA Deep Learning Instituteと連携し、コミュニティ主導型のトレーニングプログラムを展開しています。これにより、英国全土でAIや専門的なワークロードに対応できる人材育成が進められています。