Spot、Gemini搭載でゲージ読取精度98%に

Gemini Robotics-ER 1.6の性能

計器読取精度が23%から98%に向上
コード実行による視覚スクラッチパッド機能
マルチビュー推論で環境認識を強化

産業現場への展開

Boston DynamicsGoogle DeepMindが共同開発
工場・倉庫での自律巡回検査に活用
親会社Hyundaiの自動車工場でも試験運用
アナログ計器やサイトグラスの目視検査を代替
詳細を読む

Google DeepMindは2026年4月14日、ロボット向けAIモデル「Gemini Robotics-ER 1.6」を発表しました。Boston Dynamicsの四足歩行ロボットSpot」に搭載することで、工場や倉庫内のアナログ温度計や圧力ゲージを高精度に読み取る能力を実現しています。産業施設の自律巡回検査における「身体化推論(embodied reasoning)」の大幅な性能向上を目指した取り組みです。

新モデルの最大の特徴は「エージェンティック・ビジョン」と呼ばれる機能です。視覚的な推論とコード実行を組み合わせ、画像を検査・操作するための「視覚スクラッチパッド」を生成します。この機能により、計器読取の精度は旧モデル(ER 1.5)の23%から98%へと飛躍的に向上しました。比較対象として、Gemini 3.0 Flashでは67%にとどまっています。

エージェンティック・ビジョンを使用しないベースラインの状態でも、ER 1.6は86%の読取精度を達成しています。これは画像内の各要素を指し示しながら処理する「ポインティング」手法によるものです。さらに、複数のカメラストリームを活用するマルチビュー推論機能により、ロボットの環境理解能力も改善されています。

Boston Dynamicsは親会社であるHyundai Motor Groupの自動車工場を含む、幅広い産業施設での四足歩行・ヒューマノイドロボットの活用を進めています。Spotは施設内を巡回し、複雑な目盛り・液面・テキストが混在する計器類の検査を担当します。今回のAIモデルの進化により、これまで人手に頼っていた目視検査業務の自動化が現実的な段階に入りました。