基盤モデルに関する最新ニュース（65件） | 【AI Times】生成AIやLLMの最新情報・ニュース

Runway、AI動画の先へ　1000万ドルのVC基金と開発者支援を開始

VC基金の投資方針

1000万ドル規模のファンド設立

プレシード〜シード企業に最大50万ドル出資

AI・メディア・世界シミュレーションが対象

LanceDBやTamarind Bioなど既に投資実績

Builders支援プログラム

50万APIクレジットを無償提供

Characters APIへのアクセス開放

リアルタイム映像エージェント活用を促進

エコシステム戦略の狙い

自社では追えない用途を外部に委ねる構想

医療・教育・ゲーム分野への展開を期待

詳細を見る

AI動画生成の大手Runwayは2026年3月、早期段階のスタートアップを支援する1000万ドル規模のベンチャーファンドと、APIクレジットを無償提供する「Builders」プログラムの立ち上げを発表しました。同社は動画生成ツールからより広い「映像知能」のエコシステム構築へと事業を拡大します。

ファンドは既存投資家やパートナーの出資で組成され、プレシードからシード段階の企業に最大50万ドルを投じます。投資対象は、AIの技術的フロンティアを開拓するチーム、基盤モデル上のアプリケーション層を構築する開発者、新しいメディア創作や配信に取り組む企業の3分野です。

過去1年半にわたり、Runwayは非公開で複数のスタートアップに出資してきました。AI向けデータベースのLanceDBや、AIでたんぱく質設計を行う創薬企業Tamarind Bio、リアルタイム音声生成のCartesiaなどが含まれます。

Buildersプログラムでは、シードからシリーズCの企業が50万APIクレジットと、同社の「Characters」APIを利用できます。Charactersはリアルタイムで対話可能な映像エージェントを生成する技術で、顧客対応やブランドキャラクター、遠隔医療、教育など幅広い活用が見込まれています。

Runwayはこれまでに約8億6000万ドルを調達し、評価額は約53億ドルに達しています。AI企業がVC活動に乗り出す動きは、OpenAIのStartup FundやPerplexityの5000万ドルファンドなど業界全体に広がっており、Runwayもこの潮流に本格参入した形です。

出典：TechCrunch

NVIDIA GTCで物理AI新時代、工場丸ごとシミュレーション基盤を発表

2026年03月26日 NVIDIA ネットワークシミュレーションデジタルツイン推論クラウドエネルギーロボット基盤モデル

物理AIの新基盤

Cosmos 3等の最新モデル群発表

データファクトリー設計図を公開

Azure・Nebiusがクラウド提供開始

デジタルツイン実用化

Omniverse DSXでAI工場を事前検証

CADからOpenUSDへの変換自動化

KIONが倉庫twin構築に採用

産業ロボット連携拡大

ABB・FANUC等200万台基盤と統合

Isaacシミュレーションで政策検証

詳細を見る

NVIDIAは2026年3月のGTCカンファレンスにおいて、ロボット・自動運転車・工場を対象とした物理AIの新たな基盤技術群を発表しました。Cosmos 3、Isaac GR00T N1.7、Alpamayo 1.5などのフロンティアモデルが公開され、単一用途から本格的な企業ワークロードへの拡大が示されました。

注目の発表の一つがPhysical AIデータファクトリーブループリントです。これは計算資源を大規模かつ高品質な学習データに変換するオープンな参照アーキテクチャで、Cosmos世界基盤モデルとOSMOオペレーターを基盤に、データのキュレーション・拡張・評価を単一パイプラインに統合します。

Omniverse DSXブループリントも発表され、AIファクトリーの熱設計・電力・ネットワーク負荷・機械系統をデジタルツインで一元的にシミュレーションできるようになります。ラック設置前に性能と効率を最適化でき、建設の時間とコストを大幅に削減します。

製造・物流分野ではMega Omniverseブループリントにより、工場全体をロボットシステムとして扱うデジタルツインの構築が可能になりました。KIONはAccentureやSiemensと協力し、GXO向けの自律フォークリフト群を訓練・検証する大規模倉庫デジタルツインを構築しています。

産業ロボット大手のABB、FANUC、KUKA、安川電機は、合計200万台超のロボット設置基盤を持ち、OmniverseライブラリとIsaacシミュレーションを活用して複雑なロボットアプリケーションの検証を進めています。各社はJetsonモジュールをコントローラーに統合し、リアルタイムAI推論を実現しています。

出典：NVIDIA公式

Intercom、独自AIモデルでGPT-5.4超えを主張

2026年03月26日 OpenAI Anthropic Salesforce Claude GPT-5 Sonnet Opus 強化学習オープンウェイト事前学習事後学習ハルシネーション ARR エージェントベンチマーク基盤モデル

Apex 1.0の性能

解決率73.1%でGPT-5.4超え

応答速度3.7秒で最速

幻覚を65%削減

フロンティアモデルの5分の1のコスト

ポストトレーニング戦略

オープンウェイト基盤モデルを活用

顧客対応データで強化学習実施

ベースモデル名は非公開

事業への影響

Fin ARR1億ドルに迫る成長

来年には売上の半分を占める見通し

詳細を見る

Intercomは2026年3月、顧客対応に特化した独自AIモデル「Fin Apex 1.0」を発表しました。同社のベンチマークによれば、顧客問い合わせの解決率は73.1%に達し、OpenAIのGPT-5.4やAnthropicのClaude Opus 4.5の71.1%を上回ると主張しています。

Apex 1.0は応答速度でも優位性を示し、3.7秒で回答を生成します。これは競合より0.6秒速い数値です。さらにClaude Sonnet 4.6と比較して幻覚（ハルシネーション）を65%削減したとされ、フロンティアモデルを直接利用する場合の約5分の1のコストで運用できます。

同社CEOのイーガン・マッケイブ氏は「事前学習はコモディティ化した。フロンティアはポストトレーニングにある」と語ります。Intercomは週200万件の顧客対話から蓄積した独自データを用いて強化学習を実施し、適切なトーンや会話構造、解決判断を学習させました。

一方で、ベースとなるモデル名の公開を拒否している点は議論を呼んでいます。同社はオープンウェイトモデルを使用したことは認めつつも、競争上の理由から具体名を明かしていません。「透明性」を掲げながら核心を伏せる姿勢には、業界から厳しい目が向けられる可能性があります。

ビジネス面では、AIエージェント「Fin」の年間経常収益が1億ドルに迫り、前年比3.5倍の成長を遂げています。Intercomは今後、顧客対応だけでなく営業・マーケティング領域への拡大を計画しており、Salesforceの「Agentforce」と直接競合する構えです。ドメイン特化モデルの優位性が持続するか、汎用モデルが追いつくかが今後の焦点となります。

出典：VentureBeat

NVIDIA、オープンAI基盤モデル連合を設立

2026年03月25日 NVIDIA Perplexity LangChain エコシステムエージェント基盤モデル Cursor Hugging Face Mistral Jensen Huang

連合の概要と初動

Nemotron Coalition発足

Mistral AIと基盤モデル共同開発

データ・評価・専門知識を共有

Hugging Face最大組織に成長

業界リーダーの展望

AIエージェントが高度な同僚に

マルチモデルオーケストレーション時代

オープンと独自の共存が不可欠

専門特化モデルで差別化実現

詳細を見る

NVIDIAは2026年3月のGTCカンファレンスにおいて、オープンなフロンティアAI基盤モデルの開発を推進する国際連合「Nemotron Coalition」の設立を発表しました。Mistral AIをはじめとする主要AI研究機関が参画し、データや計算資源を共有します。

CEOのジェンスン・フアン氏は「独自かオープンかではなく、独自もオープンも」と述べ、両方のアプローチの共存が不可欠であるとの見解を示しました。NVIDIAは現在Hugging Faceで最大の組織となり、約4,000人のチームメンバーを擁しています。

連合の最初のプロジェクトとして、Mistral AIとNVIDIAが基盤モデルを共同開発します。連合メンバーがデータ提供や評価、ドメイン専門知識で貢献し、オープンエコシステムに公開される予定です。Nemotronモデルはすでに4,500万回以上ダウンロードされています。

GTCのパネルではCursor、Perplexity、LangChain、Thinking Machines LabなどのAI業界リーダーが登壇しました。AIエージェントが数時間・数日かかるタスクを処理する「同僚」になるとの見通しや、複数モデルの自動オーケストレーションの重要性が議論されました。

パネリストらは、汎用モデルと専門特化モデルの両立が社会に価値をもたらすと強調しました。オープンな基盤の上に各組織が独自データを組み合わせることで差別化が可能になり、学術界を含む幅広い参加者がAIの進歩に貢献できる環境が整うと述べています。

出典：NVIDIA公式

Agile RobotsがGoogle DeepMindと戦略提携を発表

2026年03月24日 Google NVIDIA ソフトバンク Gemini 創業者ハードウェアデータセンターロボットヒューマノイド提携基盤モデル Qualcomm Jensen Huang Google DeepMind

提携の概要

Gemini Roboticsモデルをロボットに統合

製造・自動車・物流など産業用途で展開

ロボット収集データでGemini改善に活用

世界で2万台超のロボット導入実績

業界の提携加速

Boston DynamicsもDeepMindと提携済み

Neura RoboticsはQualcommと協業開始

物理AIが次の市場フロンティアに

ハード・ソフト企業間の補完連携が拡大

詳細を見る

独Agile Robotsは2026年3月、米Google DeepMindと戦略的研究パートナーシップを締結したと発表しました。同社のロボットにDeepMindのGemini Robotics基盤モデルを統合し、産業分野での自律ロボット開発を共同で進めます。

提携の対象分野は電子機器製造、自動車、データセンター、物流など多岐にわたります。両社はGemini 基盤モデルを活用したロボットのテスト、微調整、実環境への展開を協力して行う方針です。契約は長期とされていますが、具体的な期間や金額は非公開です。

Agile Robotsは2018年創業のミュンヘン拠点企業で、SoftBank Vision FundやXiaomiなどから累計2億7000万ドル超を調達しています。共同創業者兼CEOのZhaopeng Chen氏は「自律型インテリジェント生産システムが産業全体を変革する大きな機会がある」と述べました。

ロボット業界では同様の提携が相次いでいます。Hyundai傘下のBoston Dynamicsは今年初め、ヒューマノイドロボットAtlasの開発にDeepMindのAI基盤モデルを活用すると発表しました。また独Neura Roboticsも3月にQualcommのIQ10プロセッサを採用する提携を公表しています。

NVIDIAのJensen Huang CEOをはじめ業界関係者の多くが物理AIをAI市場の次なるフロンティアと位置づけています。ハードウェアとソフトウェアそれぞれの強みを持つ企業同士の補完的な提携は今後さらに加速する見通しです。

出典：TechCrunch

NVIDIA、多言語・マルチモーダル対応のAI安全モデルを公開

2026年03月20日 NVIDIA アシスタント推論 GPU コンテンツ画像中国日本韓国エージェントベンチマーク基盤モデル Hugging Face Gemma LoRA

モデルの特徴

140以上の言語に対応

画像とテキストの複合判定

Gemma-3 4B基盤で軽量高速

文化的文脈を考慮した安全判定

性能と実用性

有害コンテンツ検出精度84%

競合モデルの約半分の遅延

12言語で安定した精度を維持

8GB VRAMのGPUで動作可能

詳細を見る

NVIDIAは2026年3月20日、マルチモーダル・多言語対応のコンテンツ安全モデル「Nemotron 3 Content Safety 4B」をHugging Faceで公開しました。従来の英語中心・テキストのみの安全モデルが抱えていた文化的ニュアンスの見落としを解消することを目指しています。

同モデルはGemma-3 4B-ITビジョン言語基盤モデル上に構築され、LoRAアダプターで安全分類機能を追加しています。テキスト・画像またはその両方を入力として受け取り、安全・危険の判定を出力します。アシスタント応答が含まれる場合はやり取り全体の文脈を評価し、複合的に生じる違反も検出できます。

訓練データにはNemotron Safety Guard Dataset v3の文化的に適応された多言語データ、人手でアノテーションされたマルチモーダルデータ、合成データなどが含まれます。英語データは日本語・中国語・韓国語を含む12言語に翻訳され、実運用環境を反映した多言語カバレッジを実現しています。

ベンチマーク評価では、Polyguard・VLGuard・MM SafetyBenchなど主要テストで平均84%の精度を達成し、同規模のオープン安全モデルを上回りました。さらにポルトガル語やロシア語など訓練外言語でも強力なゼロショット汎化性能を示しています。推論遅延は大型モデルの約半分で、エージェントループやリアルタイム用途にも適しています。

4月にはNVIDIA NIMとしても提供予定で、GPU最適化された推論マイクロサービスとして本番環境への迅速な導入が可能になります。企業のAIエージェントやグローバルサービスにおけるコンテンツモデレーション基盤として、実用性の高い選択肢となりそうです。

出典：Hugging Face

a16z、AI市場は独占でなく寡占に向かうと分析

2026年03月20日 Google OpenAI Anthropic Meta Llama 投資家経営者インフラ投資ベンチャーキャピタル基盤モデルオープンソースモデル Andreessen Horowitz

AI市場の競争構造

a16zがAI市場構造を分析

独占か寡占かの論点を整理

複数プレイヤーの共存を予測

寡占化の背景と展望

基盤モデルの開発競争が継続

参入障壁は高いが独占困難

オープンソースが競争を促進

レイヤー別に競争環境が異なる

詳細を見る

Andreessen Horowitz（a16z）は、AI市場が独占（モノポリー）ではなく寡占（オリゴポリー）に向かうとの見解を発表しました。大手VCとしてAI業界を俯瞰した分析です。

AI業界ではOpenAI、Google、Anthropicなど複数の有力企業が基盤モデル開発で競争しています。一社が市場を完全に支配する独占状態にはなりにくいとa16zは指摘しています。

その背景にはオープンソースモデルの台頭があります。MetaのLlamaシリーズなどが無償公開され、新規参入者にも高性能モデルの活用機会が広がっており、独占を阻む要因となっています。

一方で計算資源や大規模データセットの確保には莫大な投資が必要であり、参入障壁は依然として高い状態です。結果として少数の大手企業による寡占構造が形成されつつあります。

a16zはAIのバリューチェーンをレイヤー別に分析し、インフラ層・モデル層・アプリケーション層でそれぞれ異なる競争環境が生まれると見ています。投資家や経営者にとって市場構造の理解が戦略策定の鍵となります。

出典：a16z.com

NVIDIA、ロボット開発基盤Isaacを大幅刷新しGTCで発表

2026年03月18日 Google NVIDIA ワークフローシミュレーションエンジニア推論ディープラーニングハードウェアクラウドロボットロボティクス基盤モデル Google DeepMind

開発基盤の全体像

Isaacプラットフォーム全面刷新

クラウドからエッジまで一貫開発

GR00T NのVLAモデル公開

合成データ工場の参照設計提供

シミュレーションと学習

NuRecで実環境を3D再現

Isaac Lab 3.0で大規模並列訓練

Newton物理エンジンをOSS公開

Isaac Lab-Arenaで多タスク評価

実機展開と安全性

Jetson Thorでエッジ推論対応

SOMA-Xで骨格表現を標準化

エンドツーエンドの安全ガードレール構築

詳細を見る

NVIDIAは2026年3月のGTCにおいて、ロボティクス開発基盤Isaacプラットフォームの大幅刷新を発表しました。クラウドからエッジまで一貫したワークフローを提供し、データ収集・訓練・シミュレーション・実機展開を統合的に支援します。

新たに公開されたGR00T Nは、視覚・言語・行動を統合する推論VLAモデルで、開発者が独自のロボット知能を構築する基盤となります。汎用的な理解力と特定タスクへの専門訓練を両立する「ゼネラリスト・スペシャリスト」型ロボットの実現を目指しています。

Omniverse NuRecのGA提供により、実世界のセンサーデータからOpenUSDベースの3Dシミュレーション環境を構築可能になりました。Gartnerの予測では、2030年までにエッジシナリオの訓練データの90%以上が合成データになるとされ、NVIDIAはこの転換を加速する合成データ工場の参照設計をCosmos基盤モデルとともに提供します。

Isaac Lab 3.0では数千の軽量シミュレーション環境を並列実行し、実世界では数年かかる学習を数日で完了できます。オープンソース物理エンジンNewtonやGoogle DeepMindのMujocoにも対応し、布や砂利など多様な物体との相互作用を再現します。

実機展開ではJetson ThorやJetson Orinがリアルタイム推論を担い、cuVSLAMライブラリで自己位置推定と地図構築を実現します。新フレームワークSOMA-Xは骨格・動作・アイデンティティの表現を標準化し、ハードウェア変更時の再統合作業を大幅に削減します。

安全面では、クラウドからロボット本体までのエンドツーエンド安全ガードレールを整備しました。教育リソースとしてIsaac Sim/Labの学習パスやNVIDIA Deep Learning Instituteの講座も提供し、新規参入の開発者を包括的に支援する体制を構築しています。

出典：NVIDIA公式

Mistral AI、独自モデル構築基盤「Forge」を発表

2026年03月17日 NVIDIA 強化学習ファインチューニング事前学習事後学習 GPU クラウドポリシーデプロイ欧州提携 ARR エージェント基盤モデル教師 Mistral Palantir

Forgeの主要機能

フルサイクルのモデル訓練を支援

事前学習から強化学習まで対応

オンプレミス環境での完全運用が可能

データ非公開のまま独自モデル構築

競合との差別化戦略

組込み型AIサイエンティストを派遣

クラウド大手のAPI微調整を超える深度

Apache 2.0のオープンソース基盤

Nvidia連合で基盤モデル共同開発

詳細を見る

仏Mistral AIは2026年3月17日、企業が自社の独自データを使ってAIモデルを構築・カスタマイズできるエンタープライズ向けモデル訓練基盤「Forge」を発表しました。NvidiaのGTCカンファレンスで披露され、クラウド大手への対抗姿勢を鮮明にしています。

Forgeは従来のファインチューニングAPIを大幅に超え、大規模内部データでの事前学習、教師ありファインチューニング、DPO、ODPOによるポストトレーニング、さらに社内ポリシーや評価基準に沿った強化学習パイプラインまでフルサイクルで対応します。製品責任者のサラマンカ氏は「AIサイエンティストはもはやファインチューニングAPIを使っていない」と述べています。

早期導入企業の事例では、Ericssonがレガシーコードの現代化に活用し、年単位の手作業を大幅に短縮しました。また古文書の欠損テキスト復元や、ヘッジファンドの独自定量言語への対応など、汎用モデルでは解決できない高度な専門領域での成果が報告されています。

ビジネスモデルは顧客が自社GPU上で訓練する場合、ライセンス料とデータパイプラインサービス料を課金し、計算資源は非課金とします。最大の特徴は「フォワードデプロイド・サイエンティスト」と呼ばれる組込み型AI研究者の派遣で、Palantir型の伴走支援モデルを採用しています。

同週にはMistral Small 4、オープンソースコードエージェントLeanstral、NvidiaとのNemotron Coalition参画も発表されました。ARRは2026年中に10億ドル突破を見込んでおり、ASMLや欧州宇宙機関など機密性の高い組織との提携を通じ、「AIを借りるのではなく所有する」という戦略を加速させています。

出典：VentureBeat | TechCrunch

Google DeepMind、鳥の鳴き声AIでクジラも識別可能と発表

2026年03月17日 Google 音声基盤モデル Google DeepMind

Perch 2.0の成果

鳥類AIがクジラ音声にも有効

転移学習で専用モデル不要に

3種の海洋データセットで最高精度達成

最少4サンプルで分類器訓練が可能

鳥とクジラの共通性

発声メカニズムの進化的類似性

大規模学習による汎化能力の発現

微細な音響特徴の識別力が鍵

シャチの鳴き声と鳥の周波数帯が近似

詳細を見る

Google DeepMindは、鳥類の鳴き声を分類するために開発した音響AI基盤モデル「Perch 2.0」が、クジラの鳴き声の識別にも高い性能を発揮することを明らかにしました。この研究成果は2025年12月のNeurIPSワークショップで発表されています。

Perch 2.0は数百万件の鳥類・陸上動物の録音データで訓練された生物音響基盤モデルです。研究チームがこのモデルをクジラの音声分類に転用したところ、既存の専用モデルと同等以上の精度を達成しました。転移学習により新たなモデル構築の手間を大幅に削減できます。

評価では音声を5秒ごとのスペクトログラムに変換し、モデルが生成する埋め込み表現から分類器を訓練しました。わずか4〜32個のサンプルでもロジスティック回帰分類器が有効に機能し、サンプル数の増加に伴い精度が向上することが確認されています。

鳥類モデルがクジラにも有効な理由として、研究者は3つの仮説を提示しています。第一に鳥類と海洋哺乳類の発声機構の進化的類似性、第二に大規模モデルが持つ汎化能力、第三に鳥類分類の難しさがモデルに微細な音響特徴の識別力を獲得させた可能性です。

Google Researchのデータサイエンティスト、Lauren Harrell氏は「海中には未知の音が多く、固定的なモデルでは対応できない」と語ります。同チームはPerch 2.0を活用し、受動的音響モニタリングによるクジラの個体群保護や、海洋生物の未解明な音声の研究に貢献することを目指しています。

出典：spectrum.ieee.org

ロシュがNVIDIA Blackwell GPU3500基超を導入し創薬加速

2026年03月16日 NVIDIA AI活用デジタルツイン GPU インフラクラウド品質保証画像米国欧州医療創薬基盤モデル

創薬へのAI活用

Blackwell GPU3500基超導入

ハイブリッドクラウド環境を構築

低分子プログラムの90%にAI統合

創薬期間を25%短縮した事例

製造・診断への展開

Omniverseで工場デジタルツイン構築

ノースカロライナ新工場で先行導入

デジタル病理で疾患パターン検出

AIを全社基盤能力として定着

詳細を見る

スイス製薬大手ロシュは、NVIDIA GTC 2026において、NVIDIA Blackwell GPUを3500基以上導入し、米国と欧州のハイブリッドクラウド環境でAI基盤を大幅に拡張すると発表しました。製薬企業として公表ベースで最大規模のGPU インフラとなります。

創薬部門では、傘下のジェネンテックが推進する「Lab-in-the-Loop」戦略の中核にAIを据えています。対象となる低分子プログラムの約90%にAIが統合されており、あるオンコロジー向け分解誘導剤の設計では開発期間を25%短縮する成果を上げています。

別のプログラムでは、従来2年以上かかっていたバックアップ分子の開発をわずか7カ月で完了しました。NVIDIA BioNeMoプラットフォームを活用し、生物学的・分子的基盤モデルの学習と微調整を自社データで行う体制を整えます。

NVIDIA Omniverseを用いた製造施設のデジタルツイン構築にも着手しています。ノースカロライナ州の新しいGLP-1製造工場では、稼働前に仮想環境でシステムの最適化を進めており、規制文書作成や品質保証、生産スケジューリングにもAI活用を拡大しています。

診断事業では、デジタル病理分野で大量の画像から微細な疾患パターンを検出する技術を開発中です。NVIDIA NeMo Guardrailsを用いて医療グレードのAI安全性を確保しつつ、ラボ運営の効率化や臨床意思決定支援にもAIを展開し、創薬から診断・製造まで一貫したAI活用体制の構築を目指しています。

出典：NVIDIA公式

NVIDIA主導で医療ロボット初の大規模オープンデータセット公開

2026年03月16日 NVIDIA GitHub シミュレーション推論ポリシーロボット医療ロボティクスベンチマーク基盤モデル Hugging Face

データセットと規模

778時間の医療ロボットデータ

手術・超音波・内視鏡を網羅

35組織が国際共同構築

CC-BY-4.0で完全公開

基盤AIモデル2種

GR00T-H：手術用VLAモデル

縫合タスクの端到端実行を実証

Cosmos-H：手術シミュレータ

実機2日分を40分で再現

詳細を見る

NVIDIAとジョンズ・ホプキンス大学、ミュンヘン工科大学らが主導する国際コミュニティが、医療ロボティクス分野初の大規模オープンデータセット「Open-H-Embodiment」を公開しました。35組織が参加し、778時間分のCC-BY-4.0ライセンスデータを提供しています。

データセットは手術ロボティクスを中心に、超音波検査や大腸内視鏡の自律制御データも含みます。シミュレーション、ベンチトップ訓練、実臨床手術にまたがり、CMR SurgicalやRob Surgicalなどの商用ロボットおよびdVRK、Frankaなどの研究用ロボットのデータを収録しています。

同時に公開されたGR00T-Hは、NVIDIAのVision-Language-Actionモデルを手術ロボット向けに特化させた初のポリシーモデルです。約600時間のデータで訓練され、SutureBottベンチマークで端到端の縫合タスクを完遂する能力を実証しました。異なるロボット間の運動学的差異を吸収する独自の設計が特徴です。

Cosmos-H-Surgical-Simulatorは、運動指令から物理的に妥当な手術映像を生成するワールド基盤モデルです。従来のシミュレータでは再現困難な軟組織変形や反射、出血を暗黙的に学習します。実機で2日かかる600回のロールアウトをわずか40分で完了でき、データ拡張にも活用可能です。

次期バージョンでは、意図・結果・失敗モードを注釈した推論対応データへの拡張を目指しています。手術ロボットが状況を説明し、計画を立て、長時間の手術に適応できる推論能力付き自律制御の実現が目標です。データセットとモデルはHugging FaceおよびGitHubで公開されており、コミュニティへの参加を呼びかけています。

出典：Hugging Face

買収と技術の概要

InterPositiveを最大6億ドルで吸収

撮影現場の専用データセットで学習

プロジェクト別にモデルをカスタマイズ

照明調整や背景置換などポスプロ支援

業界への波及と課題

Asteriaも類似の倫理的AIモデル提供

Adobeが複数スタジオとIP安全モデル開発

クリエイター雇用への具体的恩恵は不透明

コスト削減優先の姿勢に懐疑的視点も

詳細を見る

Netflixは2026年3月、俳優ベン・アフレック氏が2022年に設立したAIスタートアップInterPositiveの買収を発表しました。Bloombergの報道によると買収額は最大約6億ドルに達する可能性があります。

InterPositiveの技術的特徴は、管理されたサウンドステージで撮影した独自データセットを基盤モデルの学習に用いる点です。撮影監督や監督が日常的に使う用語や操作体系に合わせて設計されており、映画制作の技法に特化した小規模モデルを構築しています。

実際の制作では、進行中の撮影から得られるデイリー映像でモデルを追加学習し、プロジェクト専用のカスタムモデルを生成します。これにより照明の微調整、小道具リグの除去、背景の完全置換などポストプロダクション工程を効率化できるとされています。

同様のアプローチを採るAIスタジオAsteriaは、ライセンス取得済み素材のみで学習した「倫理的」モデルを提供し、ナターシャ・リオン主演の長編映画を制作中です。またAdobeも複数スタジオと連携しIP安全なAIモデルの開発パートナーシップを発表しています。

一方で、こうした技術がクリエイターの雇用維持や待遇改善に直結するかは不透明です。各社は「クリエイターの力を引き出す」と強調しますが、具体的な還元策は示されておらず、コスト削減と制作効率化が主目的である現状には慎重な見方が必要です。

出典：The Verge

モデルと創作ツール

Gemini 3.1 Proの推論性能が2倍超

Deep Thinkが科学・工学向けに大幅強化

Nano Banana 2で高速画像生成を実現

Lyria 3でカスタム音楽生成が可能に

グローバル戦略と社会実装

インドAI Impact Summitで新投資発表

Pichai CEOがAI人材育成を宣言

冬季五輪向けAI動作分析ツール提供

ミュンヘン安全保障会議でデジタル耐性提唱

詳細を見る

Googleは2026年2月に行った主要なAI関連発表を公式ブログで総まとめしました。モデル刷新からクリエイティブツール、グローバル投資まで多岐にわたる内容で、同社のAI戦略の全体像が示されています。

Gemini 3.1 Proは、前世代の3 Proと比較して推論性能が2倍以上に向上した基盤モデルです。複雑な問題解決やデータ統合に特化しており、開発者・企業・一般ユーザーに広く提供が開始されました。科学技術向けのDeep Thinkも大幅に改良されています。

クリエイティブ分野では、Nano Banana 2がPro品質の画像生成をFlash並みの速度で実現し、Geminiアプリや検索で利用可能になりました。音楽生成のLyria 3はテキストや画像から30秒の楽曲を自動作成でき、ProducerAIもGoogle Labsに加わっています。

インドのニューデリーで開催されたAI Impact Summitでは、CEOのサンダー・ピチャイ氏が基調講演を行い、大規模インフラ投資やAIスキル研修プログラムを発表しました。科学振興や政府向けイノベーション支援の新たな助成制度も始動しています。

スポーツ分野では、Google CloudとDeepMindが冬季五輪に向けてアメリカチームのスキー選手向けにAI動画分析ツールを開発しました。2D映像から選手の動きを空間的にマッピングし、ほぼリアルタイムでフィードバックを提供する仕組みで、競技パフォーマンスの向上を支援しています。

出典：Google公式

Raycast、AIコーディング統合アプリ基盤「Glaze」を発表

2026年03月04日 OpenAI Claude Claude Code App Store Codex Windows デザイン創業者クラウドコーディングバイブコーディングプロンプト基盤モデル

Glazeの基本機能

プロンプト入力だけでアプリ生成

Claude CodeとCodexが基盤モデル

クラウド保存やAPI管理を自動化

他人のアプリを取得しカスタマイズ可能

事業戦略と展望

Mac版先行、Windows・モバイル展開予定

無料版と月額20〜30ドルの有料プラン

Glaze Storeでアプリ共有・発見

Mac・WindowsApp Storeへの挑戦を表明

詳細を見る

Raycastは、Mac向けランチャーアプリの開発元として知られる企業です。同社は新製品Glazeを発表し、AIを活用した「バイブコーディング」によるアプリの構築・利用・共有・発見を一元化するプラットフォームを提供します。

Glazeの最大の特徴は、プロンプトを入力するだけでアプリを一発生成できる点です。基盤モデルにはClaude CodeとOpenAIのCodexを採用しており、クラウドストレージやAPI連携、デザイン原則の適用といった技術的な作業をすべて自動で処理します。

共同創業者のトーマス・ポール・マン氏は「コードを触る必要があるなら、それは我々の失敗だ」と述べています。Glaze Storeというディレクトリでは、他のユーザーが作成したアプリを閲覧・取得でき、さらに自分好みにカスタマイズして使うことも可能です。

GlazeはRaycastのランチャー機能と深く統合されており、生成したアプリはRaycastの拡張機能として自動的に連携します。現在はMac版のみですが、今後Windowsやモバイルにも対応予定で、無料版に加え月額20〜30ドルの有料プランを計画しています。

マン氏は現在を「ソフトウェアのiTunesモーメント」と表現し、あらゆるアプリが一か所で手に入る時代の到来を予見しています。MacやWindowsのApp Storeに挑戦する意欲を示しており、個人の小さなユーティリティからチーム専用ツールまで、ソフトウェアの在り方を根本から変える可能性を秘めています。

出典：The Verge

MIT、数百変数の最適化を最大100倍高速化する基盤モデル手法を開発

2026年03月04日 ChatGPT シミュレーションエンジニア事前学習エネルギー画像ロボット創薬 MIT ベンチマーク基盤モデル

手法の核心

表形式基盤モデルを代理モデルに活用

重要変数を自動特定し探索を集中

再学習不要で異なる問題に即適用

従来比10〜100倍の高速化を実証

応用と展望

電力系統や衝突安全設計で検証

高次元ほど性能優位が拡大

創薬・材料開発への応用を視野

将来は数百万変数規模を目指す

詳細を見る

MITの研究チームは、数百の設計変数を持つ複雑なエンジニアリング問題を従来手法の10〜100倍の速度で解く新たな最適化手法を開発しました。国際学習表現会議（ICLR）で発表される本研究は、古典的なベイズ最適化に基盤モデルを組み合わせた点が革新的です。

本手法の中核は「表形式基盤モデル」と呼ばれる生成AIです。大規模言語モデルがテキストを扱うように、この基盤モデルは膨大な表形式データで事前学習されており、スプレッドシート版ChatGPTとも形容されます。エンジニアリング分野ではテキストより表形式データが一般的であり、実務との親和性が高い点が特徴です。

従来のベイズ最適化では反復ごとに代理モデルの再学習が必要で、変数が増えると計算コストが急増していました。新手法では事前学習済みの基盤モデルをそのまま使用するため再学習が不要であり、異なる問題にも一つのアルゴリズムで対応できます。設計空間のうち結果に最も影響する変数を自動的に特定し、探索を集中させる工夫も施されています。

60件のベンチマーク問題で5つの最先端手法と比較した結果、電力系統設計や自動車の衝突試験シミュレーションなど現実的な課題で一貫して最良の解を高速に発見しました。問題の次元数が増えるほど優位性が拡大する傾向も確認されています。ただしロボット経路計画など一部の課題では既存手法を上回れず、訓練データの網羅性が課題として残ります。

研究チームは今後、表形式基盤モデルの性能向上手法を研究するとともに、数千から数百万変数を持つ艦船設計などへの適用を目指しています。基盤モデルを言語や画像認識だけでなく科学・工学ツール内部のアルゴリズムエンジンとして活用する潮流を示す成果として、創薬や材料開発など高コスト評価を伴う分野への波及が期待されます。

出典：MIT News

Alibaba Qwen技術リーダー林氏が突然退任、チーム再編へ

2026年03月03日 Google Gemini Qwen エコシステムオープンウェイト中国投資基盤モデルオープンソースモデル Hugging Face Google DeepMind

主要メンバーの相次ぐ離脱

林駿洋氏がQwen技術リーダーを退任

研究員Hui氏やインターンも同時離脱

Qwen3.5小型モデル発表の翌日の退任

同僚が「本人の意思ではない」と示唆

Alibabaの組織再編と戦略転換

Google DeepMind出身の周昊氏が後任に

CEOが基盤モデルタスクフォース設立を発表

垂直統合型R&D;から水平分業型へ転換

オープンソース戦略の継続を表明

オープンソースAIへの影響

Qwenモデルの累計6億DL超の実績

9万社超の企業導入への信頼性懸念

将来モデルの有料API限定化の可能性

中国発オープンソースAIの転換点

詳細を見る

AlibabaのAIモデルQwenの技術リーダーである林駿洋（ジャスティン・リン）氏が2026年3月上旬に退任を発表しました。退任はQwen3.5小型モデルシリーズの発表からわずか1日後のことで、同僚の研究員やインターンも相次いで離脱しています。

林氏はXに「me stepping down. bye my beloved qwen」と短い投稿を残しました。同僚の陳成氏は「辞めるのは本人の選択ではなかった」と示唆し、チーム内外に衝撃が広がっています。Hugging FaceのAPACエコシステム責任者も「計り知れない損失」と評しました。

Alibaba CEOのエディ・ウー氏は社内書簡で林氏の貢献に感謝を示すとともに、自身を含む基盤モデルタスクフォースの設立を発表しました。オープンソースモデル戦略の継続とAI研究開発への投資拡大を約束しています。

背景には組織方針の対立があるとされます。林氏が推進した垂直統合型の自律的チーム運営に対し、経営側は数百人規模のプロジェクトを「一人の頭脳」で管理することへの限界を指摘しました。Google DeepMind Geminiチーム出身の周昊氏が後任に就任し、研究重視から指標重視への転換が進む見通しです。

Qwenモデルは累計6億ダウンロードを超え、9万社以上の企業が導入する中国最大級のオープンウェイトAIです。業界では今後のモデルが有料APIに限定される可能性が指摘されており、オープンソースAIコミュニティにとって大きな転換点となっています。

出典：TechCrunch | VentureBeat

LLMラッパーは消えるとGoogle VPが警告

2026年02月21日 Google Perplexity Gemini ワークフロー GPT-4 スタートアップ医療プロンプト基盤モデル Google DeepMind

消滅する二つのAIビジネスモデル

LLMラッパースタートアップは基盤モデル進化で陳腐化

AIアグリゲーターもコモディティ化の危機に直面

Google Global Startup担当VPDarren Mowryが警告

差別化なきミドルウェア層は消えゆく運命

独自のデータ・ユーザー基盤なき企業は存在できない

生き残るAIスタートアップの条件

独自データまたは独自ワークフローによる深い統合

垂直業界での専門知識とAI能力の組み合わせ

単純なAPI呼び出しを超えた価値創出が必要

ユーザーの習慣と信頼の獲得が競争優位に

基盤モデル企業との競争でなく補完する立ち位置

詳細を見る

TechCrunchのインタビューで、Google Cloud、DeepMind、Alphabetにわたるグローバルスタートアップ組織を率いるDarren Mowry副社長は、かつて急増したAIスタートアップの二つのカテゴリーが存在の危機に直面していると警告しました。LLMラッパー（GPT等のAPIをラップするだけのサービス）とAIアグリゲーター（複数のAIを束ねるサービス）がその対象です。

LLMラッパーが危険な理由は明快です。GPT-4がo3やGemini 2.0に進化するたびに、ラッパーが提供する付加価値の多くが基盤モデルに吸収されます。「プロンプトを整える」「UIを整える」だけでは、基盤モデルが直接その機能を提供し始めると差別化が消失します。

より微妙なのはAIアグリゲーター（複数のAIモデルを横断してアクセスできるサービス）の問題です。OpenRouterやPerplexityのようなサービスは、基盤モデルがコモディティ化する中で、どこで価値を作るかという問いに常にさらされます。ルーティングの知性だけでは持続的な競争優位にはなりにくいです。

生き残るスタートアップに必要なのは、特定業界の深い専門知識と固有データを持つことです。医療のカルテデータ、製造の設備データ、法律の判例データなど、基盤モデル企業が簡単には入手・学習できないプロプライエタリデータと組み合わせた垂直特化が最も有望な戦略です。

Googleの視点からこの発言を読むと、スタートアップコミュニティへの助言であると同時に、Google自身がAIスタック全体をカバーしようとする戦略の反映でもあります。水平的プラットフォームは基盤モデル企業に押さえられ、スタートアップは垂直に特化するしか差別化の余地がないという冷厳な市場構造を示しています。

出典：TechCrunch

Unsloth×HFでLLM微調整が無料開放へ

2026年02月20日 AI活用エコシステムエンジニア推論ファインチューニング GPU インフラクラウドデプロイ医療中小企業提携基盤モデル Hugging Face LoRA

無料LLMファインチューニングの実現

Hugging Face JobsプラットフォームでUnslothを無料利用可能

高速かつ低メモリなLLMファインチューニングが一般開放

LoRA/QLoRAベースの効率的な訓練手法に対応

GPUアクセスのない研究者・開発者に訓練機会を提供

クラウドコストの民主化でドメイン特化モデルが普及

エコシステムへの影響

ファインチューニングの参入コストが実質ゼロに低下

企業・研究機関がカスタムモデルを低コストで構築可能

Unslothの速度最適化技術がHFのスケールで利用可能に

HFのモデルハブとの統合でデータセット→訓練→公開が一貫

オープンソースファインチューニングエコシステムが強化

詳細を見る

Hugging FaceとUnslothは、Hugging Face Jobsプラットフォームを通じてLLMのファインチューニングを無料で提供するパートナーシップを発表しました。Unslothはその高速化（通常の2〜5倍速）とメモリ効率（最大80%削減）で知られており、これをHFのクラウドインフラと組み合わせることで、GPUを持たない開発者や研究者に訓練機会を開放します。

ファインチューニングの民主化は、AI活用の次のフロンティアを拓きます。汎用的な基盤モデルをドメイン特化させる能力は、医療、法律、製造など特定業界でのAI活用精度を大幅に向上させます。これまでこの作業には高額なGPUクラスターが必要でしたが、今後は個人や中小企業でも実施可能になります。

HuggingFaceにとってこの提携は、モデルハブ（保管）からトレーニング基盤（構築）、さらにはデプロイメントまでをカバーするフルスタックMLプラットフォームとしての地位を強化します。Unslothのユーザーベースを取り込む獲得戦略でもあります。

Unslothの側では、有料の商用サービスへの入口としてHF経由の無料ティアを活用する戦略です。無料で試したユーザーが高度な機能や大規模訓練のために有料プランに移行するフリーミアムモデルを狙っています。

この動きはより広いトレンドの一部です。LLMの推論コストが下がり続ける中、次の競争軸は専用化・個別最適化にシフトしています。ファインチューニングの民主化が進むことで、汎用LLMよりもドメイン特化モデルが主流になる時代が近づいています。

出典：Hugging Face

Ricursive Intelligenceが4ヶ月で4B評価額3億3500万ドル調達

2026年02月16日 Google 創業者投資家投資資金調達評価額基盤モデル Intel Google DeepMind

急速な資金調達

設立4ヶ月で4B USDバリュエーション達成

Goldie・Mirhoseini両CEOはGoogle DeepMind出身

創業者の知名度による信頼プレミアム

335M USDを調達、資本効率が際立つ

研究者起業の勝機

トップAI研究者の独立創業ブームが継続

Zuckerbergからもスカウトメールが届いた

AI基盤モデルの次の突破口を目指す

投資家のトップタレント争奪が過熱

詳細を見る

Google DeepMind出身のAI研究者Anna Goldie（CEO）とAzalia Mirhoseini（CTO）が共同創業した「Ricursive Intelligence」が、設立からわずか4ヶ月で335M USD（約500億円）を40億ドルバリュエーションで調達しました。

両創業者はAIコミュニティで高く評価されているトップ研究者であり、記事によるとZuckerbergが直接スカウトのメールを送ったほどの人材です。この知名度と研究実績が短期間での大型調達を可能にしました。

2025〜2026年にかけて、大手AIラボからの研究者独立創業が相次いでいます。Ilya SutskeverのSafe Superintelligence、Andrej KarpathyのKarpathy AI等と同様のトレンドです。

Ricursive Intelligenceは具体的な製品詳細を公開していませんが、AI基盤モデルの次世代アーキテクチャの研究開発に集中していると見られています。資金調達のペースは投資家の先行き期待の高さを示しています。

このような早期段階での巨大バリュエーションは、AI研究の商業化加速というトレンドを体現しており、トップ研究者の市場価値が過去に比べて桁違いに高まっていることを示しています。

出典：TechCrunch

JointFMが多変量時系列のゼロショット予測でリアルタイム投資判断を実現

2026年02月16日シミュレーションリスクエネルギー暗号資産投資基盤モデル

モデルの革新性

多変量時系列ゼロショット予測の基盤モデル

従来の数値シミュレーション比でミリ秒処理

ポートフォリオ最適化をリアルタイム化

JointFMが業界初の試みと主張

金融AIへの示唆

量的ファンドの意思決定速度を革新

モンテカルロシミュレーションの代替手段

コヒーレントシナリオ生成で精度向上

リスク管理への応用展開が期待

詳細を見る

JointFMは多変量時系列システムのゼロショット同時分布予測を行うAI基盤モデルとして発表されました。従来の数値シミュレーションが数分かかる計算をミリ秒単位で実行し、リアルタイムでのポートフォリオ意思決定を可能にします。

JointFMの核心は、複数の資産間の相関関係を維持しながら将来シナリオを同時に生成できる点です。従来の確率的モデルでは各変数を独立に予測するため、相関の崩壊という問題がありましたが、JointFMはこれを克服します。

量的ファンドやアルゴリズムトレーディング分野では、高速かつ整合性のある市場シミュレーションが競争優位の源泉です。JointFMのリアルタイム性能は従来のモンテカルロ法に代わる手法として注目されます。

ゼロショット能力は学習に使われていない新しい市場や資産クラスにも適用できることを意味しており、新興市場や新規資産クラス（暗号資産等）への展開可能性を高めています。

金融以外にも、エネルギー需要予測や物流最適化など、複数変量の同時予測が求められる産業領域への応用可能性も示唆されており、基盤モデルとしての汎用性が評価されます。

出典：datarobot.com

Fundamentalが2.55億ドル調達、ETL不要のテーブルデータ基盤モデルNEXUSを発表

2026年02月05日エンジニアスタートアップ基盤モデル Databricks Snowflake

NEXUS技術と調達

Series Aで2.55億ドル調達

ETL不要のネイティブ基盤モデル

表形式データ専用の設計思想

手動データ前処理を自動化

大規模データ分析の民主化

既存データウェアハウスとの統合

データ分析市場への影響

データエンジニアリングコストを削減

意思決定スピードの大幅向上

Snowflake・Databricksとの競合

詳細を見る

データ分析スタートアップのFundamentalは2026年2月5日、Series Aで2億5500万ドルを調達したと発表した。また、テーブルデータ専用の基盤モデル「NEXUS」を公開した。

NEXUSは従来のビッグデータ分析で必須だったETL（抽出・変換・ロード）プロセスをネイティブに回避する設計となっており、手動のデータ前処理工程を大幅に削減できる。

テーブルデータ（スプレッドシート・データベース・CSVなど）を直接理解できるファウンデーションモデルの登場は、分析の民主化を次の段階に進める可能性がある。

VentureBeatは「大規模データ分析の在り方を根本から変える可能性がある」と評し、データエンジニアの役割が変化するきっかけになりうると分析した。

SnowflakeやDatabricksが支配するデータウェアハウス市場への挑戦となるが、NEXUSのようなAIファースト設計のデータ処理層は新しいカテゴリを作る可能性がある。

出典：TechCrunch | VentureBeat

強化学習は表現深度なしに頭打ち、新研究が明らかにした重要な知見

2026年01月17日 ChatGPT Claude 強化学習ファインチューニングスケーリング則エージェント基盤モデル RLHF

研究の主要発見

表現の深さがRLの限界を決定

単純な報酬設計だけでは不十分

特徴抽出層の品質が鍵

マルチタスク学習で改善の余地

スケーリング則とは異なる知見

実践的な示唆

エージェント設計への応用

アーキテクチャの再考が必要

ファインチューニング戦略に影響

RLHFの限界も示唆

基盤モデルの選択が重要

詳細を見る

新しい研究によると、強化学習(RL)は表現の深さ（representation depth）が不十分な場合に性能が頭打ちになることが明らかになりました。これはAIエージェントの設計において重要な知見です。

従来の研究が報酬設計やアルゴリズムの改善に注目してきた中で、本研究は特徴抽出の質こそが強化学習の性能を決定的に左右することを示しています。

この知見はRLHF（人間フィードバックによる強化学習）を用いるChatGPTやClaudeなどのLLM改善にも重要な示唆を与えます。基盤となるモデルの表現能力が上限を決める可能性があります。

AIエージェントの自律性向上に取り組む研究者にとって、今後のアーキテクチャ設計の指針となる成果として注目されています。

出典：VentureBeat

Apple-GoogleのGemini契約が両社の競争戦略に与える深い意味を分析

2026年01月13日 Google OpenAI Apple Gemini ChatGPT iOS Siri 提携基盤モデル Intel

両社にとっての意義

AppleはAI開発の外部依存を深める

GoogleはiOSという巨大配布チャネルを獲得

Apple Intelligenceの限界を補完

Geminiの普及率が急上昇

OpenAIとの競争でGoogleが優位に

詳細を見る

Apple-Google間のGemini契約を詳細に分析すると、両社にとって異なる戦略的意味があることがわかります。Appleは独自AI開発の遅れを外部調達で補完する戦略を継続しており、Googleはアクティブユーザー数十億人のAppleデバイスを通じてGeminiの展開規模を劇的に拡大できます。

この提携はOpenAIへの対抗関係でも重要です。昨年からiOSに統合されていたChatGPTと比較して、GoogleはよりSiriの中核に近い位置を得ることになります。基盤モデルの配布争いにおいて、プラットフォーマーとの提携が競争優位を左右する新たなフェーズを示しています。

出典：The Verge

NvidiaがロボティクスAIスタック全体を公開：物理AIの時代が本格化

2026年01月05日 NVIDIA Android エコシステムネットワークシミュレーションエンジニア推論ハードウェアロボット医療ロボティクスベンチマーク基盤モデルオープンソースモデル Hugging Face Jensen Huang

Cosmos Reason 2とAlpamayoの革新

Cosmos Reason 2がロボット向け推論VLMを実現

自律走行車・産業ロボット双方に適用可能

Alpamayoオープンソースモデルが自動車に思考力を

「人間のように考える」自動運転AIが目標

Isaac Lab-Arenaでシミュレーション評価を自動化

LeRobotとの統合で汎用ロボット政策を評価

NvidiaがロボティクスのAndroidを目指す

ロボット向け共通基盤モデルを標準化

シミュレーション→実機の移行コスト削減

エッジAIハードウェアとの統合が鍵

ロボット開発者エコシステムの構築が戦略

MobileNet的な役割をロボティクスで担う

物理AIが製造・物流・農業を変革

詳細を見る

Nvidiaは「物理AI」（Physical AI）という概念を中心に、ロボティクス向けAIスタック全体を公開した。Cosmos Reason 2は視覚言語モデル（VLM）に推論能力を組み合わせ、自動運転車や産業ロボットが複雑な物理環境を理解・判断できる基盤を提供する。

Alpamayoは自律走行車向けのオープンソースAIモデル群で、「人間のように考える」能力の実現を目指している。複数シナリオの推論・予測・意思決定を組み合わせることで、従来のルールベース自動運転からAI推論型へのパラダイムシフトを促進する。

Isaac Lab-Arenaはシミュレーション環境でロボット政策（Policy）を自動評価するツールで、実機テストのコストと時間を大幅に削減できる。LeRobot（Hugging Face）との統合により、汎用ロボット政策の標準的なベンチマーク基盤として機能する。

Jensen HuangのビジョンはNvidiaを「ロボティクスのAndroid」として位置づけることだ。スマートフォンでAndroidが共通プラットフォームとして機能したように、Nvidiaのロボットスタックがさまざまなハードウェアメーカーの共通基盤になることを目指している。

物理AIの普及は製造・物流・農業・医療など多岐にわたる産業に変革をもたらす。Nvidiaのロボティクスエコシステムへの参加企業数が増加するにつれ、ネットワーク効果が働き業界標準としての地位が強固になる見通しだ。

出典：TechCrunch | Hugging Face | VentureBeat | Hugging Face | TechCrunch

2026年のAIトレンド：音声AI台頭とエンタープライズ実用化

2026年01月01日 Google OpenAI Apple 推論推論モデルハードウェア音声サム・アルトマンシリコンバレー医療投資エージェントコンテキストベンチマーク基盤モデル

企業が注目すべき4大研究トレンド

推論モデルがエンタープライズの主要関心事に

マルチエージェントシステムの実務活用が加速

評価フレームワークの成熟が導入判断を支援

コンテキスト長の拡大が業務文書処理を変革

AIガバナンスと説明可能性への投資増加

基盤モデルからタスク特化モデルへのシフト

OpenAIの音声AI戦略と脱スクリーン

OpenAIが音声専用LLMを2026年Q1に発表予定

音声AIハードウェア製品開発チームを新設

スクリーン不要の環境型インターフェースを推進

サム・アルトマンの「スクリーン廃止」ビジョン

音声AIが次世代コンピューティングの主役候補

補聴器・車載・スマートホームへの展開強化

詳細を見る

2026年のAI研究の焦点は、ベンチマーク性能の競争から実務応用の品質へと移行している。エンタープライズチームが注目すべき4つのトレンドとして、推論モデルの精度向上・マルチエージェント実務活用・評価フレームワークの整備・コンテキスト長の実用化が挙げられる。

特に推論モデル（Reasoning Models）は、複雑な分析タスクや多段階の意思決定プロセスに対応する能力が向上しており、法務・財務・医療分野での実証実験が増加している。単なる回答生成から、思考プロセスの透明化・検証可能性が重要視される段階に入った。

OpenAIは音声AI分野への大規模投資を表明しており、2026年第1四半期に音声専用の新言語モデルを発表する計画だ。このモデルは将来的なAIハードウェアデバイスの中核コンポーネントとして位置づけられており、スクリーンに依存しないコンピューティングへの移行を促進する。

シリコンバレーでは「脱スクリーン」が新たなビジョンとして語られており、音声・触覚・周辺環境との統合インターフェースが次世代の人機インタラクションの形とされる。OpenAI、Apple、Googleがこの方向で競い合っている。

エンタープライズ向けには、AIのガバナンスと説明可能性への需要が高まっている。規制対応・監査可能性・意思決定の透明性を確保しながらAIを活用するための専門ツールと体制づくりが、2026年の重要な投資領域となるだろう。

出典：VentureBeat | TechCrunch

2025年AI総括：ハイプから現実へ、VCは2026年企業導入に集中

2025年12月29日 OpenAI ChatGPT ワークフローチャットボット AI採用投資資金調達ベンチャーキャピタルエージェント基盤モデル Intel

2025年AI業界の総評

前半は400億ドル調達など熱狂が最高潮

後半に「バイブチェック」が訪れた

エージェントAIは期待に届かなかった

大量の企業向けアプリが実証段階に留まる

収益化の難しさが改めて露呈した

モデル性能よりビジネス実装が課題に

VCの2026年エンタープライズAI予測

企業がAI採用を本格化する最良の年と予測

3年間の実証実験が決断フェーズに移行

基盤モデル依存から独自能力構築へ

統合・オーケストレーション層に投資が集中

コスト削減ではなく収益増加のROIを重視

AI専門人材の確保競争が激化する見通し

詳細を見る

2025年のAI業界は前半と後半で劇的なコントラストを描きました。OpenAIが4000億ドル評価で400億ドルの調達を達成し、Safe Superintelligenceが10億ドルを集めるなど、前半は資金調達の熱狂が続きました。しかし後半は「バイブチェック」と呼ばれる現実直視の時間が訪れました。

エージェントAIは最も期待外れとなった分野です。チャットボットとワークフロー自動化の間の溝を埋める存在として期待されましたが、実際の企業展開では信頼性と統合の難しさが壁となりました。ChatGPTの週間利用者は8億人に達しますが、エンタープライズROIの実証は限定的でした。

VCは2026年をエンタープライズAI本格普及の年と予測しています。過去3年間の実証実験を経た企業がついて本番投資を決断する段階に移行するという見立てです。特に統合・オーケストレーション層への投資が2026年の主役になるとされています。

収益化の軸も変化しています。コスト削減中心から収益増加に貢献するAIへの需要シフトが起きており、AI専門人材の確保競争が2026年の人材市場を塗り替えると予測されています。

出典：TechCrunch | TechCrunch

AI投資ブーム継続、消費者向けスタートアップの持続力に懐疑論も

2025年12月15日 OpenAI Mercor エコシステム投資家画像動画音声スタートアップ創薬投資資金調達評価額ベンチャーキャピタルバブル基盤モデル Andreessen Horowitz ElevenLabs

相次ぐ大型資金調達

Lightspeedが同社史上最大の90億ドルを調達、AI特化投資家として165社超を支援

OpenAI出資のバイオテックChai DiscoveryがシリーズB 1億3,000万ドルを調達、評価額13億ドルに到達

AI動画向け音響スタートアップMireloがIndex・a16zから4,100万ドルのシード調達

AIコンパニオンアプリ「Momo」のFirst Voyageが250万ドル調達、習慣形成市場に参入

消費者AI vs. エンタープライズAI：VCの視点

VC各社「生成AI登場から3年、消費者向け特化アプリはいまだ定着せず」と分析

動画・音声・画像アプリはプラットフォーム側の機能統合で競争優位を失いやすい構造

「スマートフォン黎明期の2009〜2010年相当」——消費者AIが本格普及する転換点が近いとの見方も

AIで最も稼いでいるのはモデル企業でなくデータ供給・仲介事業者——Mercorが年商5億ドルを達成

詳細を見る

Lightspeed Venture Partnersは創業25年で過去最大となる総額90億ドルのファンドを組成しました。2021年のバブル崩壊後、LPは実績ある一部の有力VCへ資本を集中させており、Lightspeedはその恩恵を受けた格好です。

AIバイオテクのChai Discoveryは、OpenAIをはじめGeneral CatalystやThrive Capitalらが参加するシリーズBで1億3,000万ドルを調達しました。同社は創薬向けの基盤モデル「Chai 2」を開発しており、評価額は13億ドルに達しています。

ベルリン発のMireloは、AI生成動画に同期した効果音を自動付与する技術に特化したスタートアップです。IndexとAndreessen Horowitzが共同でリードした4,100万ドルのシードラウンドを獲得し、SonyやTencent、ElevenLabsなど大手との競争に備えます。

AIコンパニオンアプリ「Momo」を手がけるFirst Voyageはa16z speedrunなどから250万ドルを調達しました。ユーザーがデジタルペットを世話することで習慣形成を促す仕組みで、すでに200万件超のタスクが作成されています。

TechCrunchのStrictlyVCイベントでは、VCが消費者向けAIスタートアップの持続力について議論しました。Goodwater CapitalのCo-founder Chi-Hua Chienは「多くの初期AIアプリはプラットフォームに吸収されてしまった」と指摘し、スマートフォン普及初期と同様の「安定化期間」が必要だと述べています。

一方で、AIエコシステムの中で最も急速に収益を伸ばしているのはモデル企業ではなく、AIトレーニングデータの供給・仲介を担う事業者だという見方も広がっています。Mercorは年商5億ドルを達成し、「史上最速の成長企業」を自称するに至りました。

今回の一連の動向は、生成AI投資が依然として活況である一方、勝者が絞られつつあることを示しています。大型VCへの資本集中と、ビジネスモデルの持続性を重視する投資判断の変化が、次のAIスタートアップ世代の姿を規定していくと考えられます。

Rivian、独自AI助手を開発　車両制御と統合しVW提携外

2025年12月09日アシスタントクラウド音声提携エージェント基盤モデル

車両制御と統合する独自AI

2年前から開発、VW提携とは独立したプロジェクト

単なる対話ではなく車両制御と深く統合

特定のモデルに依存しない柔軟なアーキテクチャ

エッジとクラウドの最適化

端末側とクラウド側を組み合わせたハイブリッド構成

タスクに応じて処理を振り分けるオーケストレーション

顧客の信頼とエンゲージメント向上を重視

詳細を見る

米新興EVメーカーRivianが、VWとの提携とは別枠で独自のAIアシスタントを開発していることが明らかになりました。約2年前から極秘に進められてきたこのプロジェクトは、単なる音声対話機能にとどまらず、車両制御システムと高度に統合されたエージェント型AIです。

このAIアシスタントは、特定の基盤モデルに依存しない柔軟な設計が特徴です。Rivianのソフトウェア責任者によれば、業界で「エージェント・フレームワーク」と呼ばれる構造を早期から採用し、複数の異なるAIモデルと連携できるようアーキテクチャを構築しました。

システムは、車両内で処理するエッジAIと、高度な計算を要するクラウドAIを組み合わせたハイブリッド構成です。独自開発のオーケストレーション層が交通整理役となり、タスクに応じて最適な処理場所とモデルを瞬時に判断して割り振ります。

本開発はRivianが進める垂直統合戦略の一環であり、顧客エンゲージメントの向上が狙いです。VWとの58億ドル規模の提携は電気アーキテクチャ等に焦点を当てており、現時点でAIアシスタントは対象外ですが、将来的な連携の可能性も残されています。

出典：TechCrunch

Amazon新AI発表とDOGE潜伏の実態

2025年12月05日 OpenAI Amazon Facebook AWS 生産性チャットボット業務効率エンジニアリスク脆弱性セキュリティデバッグイーロン・マスク基盤モデル

AmazonのAI戦略と課題

独自モデルNovaシリーズを発表

AWS基盤でOpenAIに対抗

AIツール強制で開発現場が疲弊

AI脆弱性とDOGEの真実

詩的表現で安全策を突破可能

DOGEは解散せず各省庁に浸透

FBデート機能が2100万人利用

詳細を見る

今週、Amazonが独自AIモデル「Nova」を発表し、OpenAIへの対抗姿勢を鮮明にしました。一方、米政府効率化省（DOGE）は解散報道を覆し、実際には各省庁へ深く浸透している実態が明らかになりました。本記事では、AI開発競争の新たな局面と、政府機関におけるテック的合理化の波、さらにAIセキュリティの脆弱性について、ビジネスリーダーが知るべき核心を伝えます。

Amazonは長らくの沈黙を破り、高性能な新基盤モデル「Nova」シリーズを発表しました。AWSの計算資源を垂直統合的に活用し、企業向けに特化したAIソリューションを展開することで、OpenAIへの依存脱却を図る狙いです。しかし社内では、エンジニアに対しAIツールの利用が半ば強制され、デバッグや「AIの世話」による業務効率の悪化と士気低下が報告されており、生産性向上への課題も浮き彫りになっています。

大規模言語モデル（LLM）の安全性に関しては、ユニークかつ深刻な脆弱性が発覚しました。最新の研究によると、悪意ある質問を「詩」の形式に変換するだけで、主要なAIチャットボットの安全ガードレールを約62%の確率で突破可能です。爆弾製造法などの危険情報が容易に引き出せるこの事実は、AIの検閲回避テクニックが高度化していることを示唆しており、企業導入時のリスク管理において重要な教訓となります。

政治分野ではDOGE（政府効率化省）の動向に注意が必要です。「解散した」との一部報道に反し、実際には組織を分散させ、関係者が各連邦機関の要職に配置されていることが判明しました。イーロン・マスク氏の影響下にあるメンバーが財務省やその他の機関でコスト削減や規制撤廃を推進しており、単なる組織再編ではなく、特定の思想が政府運営のOSレベルにまで浸透しつつある現状が明らかになっています。

その他、メタ社のFacebook Datingが利用者2,100万人を突破し、競合アプリHingeを凌駕する規模に成長しました。既存の巨大なユーザー基盤とAIによるマッチング精度の向上が勝因と見られ、後発でもプラットフォームの規模を活かせば市場を席巻できる好例です。テック業界の勢力図は、AIの実装力と既存アセットの掛け合わせによって、依然として激しく変動しています。

出典：WIRED

AWS re:Invent 2025開幕、AI戦略の全貌を配信で

2025年12月02日 Amazon AWS スケジュール調整エンジニアインフラセキュリティ基盤モデル

ラスベガスで年次総会が開幕

re:Invent 2025が開始

注力領域はAgentic AIや保安

Fortniteでも基調講演を配信

注目の基調講演スケジュール

12/2朝: Matt Garman CEO

12/3朝: AI担当Swami副社長

12/4午後: Werner Vogels CTO

詳細を見る

AWSの最大イベント「re:Invent 2025」が12月2日、ラスベガスで開幕しました。今年の焦点は昨年に続きAIで、特にAgentic AIやセキュリティの新発表が期待されます。現地に行けない方も、主要セッションをオンラインで視聴可能です。

今年の基調講演は、通常のライブストリームに加え、人気ゲームFortnite上の特設島でも生配信されるというユニークな試みが行われています。チケット不要で誰でもアクセスでき、業界別のショーケースや連携配信も多数用意されています。

注目の基調講演は5つです。初日12月2日朝にはAWS CEOのMatt Garman氏が登壇し幕を開けました。続く3日朝にはAI担当副社長のSwami Sivasubramanian氏が、最新のAI戦略や基盤モデルについて語る予定です。

技術的な深堀りとして、4日は見逃せません。午前9時からは計算部門トップのPeter DeSantis氏が、午後3時半からはAmazon CTOのWerner Vogels氏が登壇します。エンジニア必見のインフラや未来予測が語られるでしょう。

出典：TechCrunch

AWS、自社データで「特化型AI」を創る新基盤を発表

2025年12月02日 AWS エコシステム専門家推論ファインチューニング推論モデルインフラクラウドコンテンツ音声エージェントベンチマーク基盤モデル Reddit

特化型AI構築サービス

独自データを学習過程に注入可能

ファインチューニングの限界を突破

開発コストと時間を大幅削減

新モデル「Nova」4種

高コスパな推論モデル「Lite」

複雑なタスク処理の「Pro」

音声・マルチモーダルも網羅

AWSのAI戦略

数値性能より実用性を重視

Reddit等が導入を開始

詳細を見る

米AWSは2日、新基盤モデル「Nova」と、企業が自社データで特化型AIを構築できる「Nova Forge」を発表しました。単なる性能競争から脱却し、ビジネス現場での「実用性」と「カスタマイズ」を最優先する戦略を鮮明にしています。

目玉の「Nova Forge」は、学習の初期段階から独自データを注入できる点が画期的です。既存モデルの微調整で起きがちな知識の消失を防ぎつつ、ゼロからの開発より低コストで、自社ビジネスに特化した「専門家モデル」を構築できます。

既にRedditが導入し、過去の投稿データを学習させた自社専用モデルを開発しました。汎用モデルでは理解が難しいコミュニティ特有の文脈やルールをAIに習得させ、コンテンツ管理の自動化と精度向上という実利を得ています。

同時発表の「Nova」モデル群は、高速な「Lite」や複雑な推論が得意な「Pro」など4種です。これらは他社とのベンチマーク競争よりも、コスト効率やエージェント機能としての使いやすさに主眼を置いた設計となっています。

AWS幹部は「ベンチマークは現実を反映していない」とし、数値上の性能より企業が制御可能なインフラとしての価値を強調します。AI開発の民主化を通じて顧客をエコシステムに定着させ、クラウド市場での優位性を盤石にする狙いです。

出典：WIRED | TechCrunch | VentureBeat | The Verge | WIRED

AWS最大イベント開幕、自律型AIとインフラが焦点

2025年12月01日 Amazon AWS エンジニアハルシネーションインフラクラウドセキュリティ基盤モデル

AIとインフラの最新動向

ラスベガスで年次イベントが開幕

自律型AIやインフラに焦点

セキュリティ対策の新機能も公開

基調講演と視聴方法

CEOやCTOら5名の基調講演

公式サイトで無料ライブ配信

フォートナイト上でも視聴可能

詳細を見る

アマゾン・ウェブ・サービス（AWS）は2025年12月、年次最大イベント「re:Invent 2025」を米ラスベガスにて開催します。本イベントでは、昨年に引き続きAI技術が主要テーマとなり、特に「自律型AI（Agentic AI）」やクラウドインフラ、セキュリティの新機能に注目が集まっています。現地参加に加え、基調講演のオンライン配信も行われ、世界中のリーダーやエンジニアに向けた最新戦略が発表されます。

今年のre:Inventは、生成AIの次のフェーズとも言える自律型AIへのシフトを鮮明にしています。AWSは基盤モデルの拡充だけでなく、AIハルシネーション（幻覚）対策や新たなセキュリティサービスの提供を通じて、企業がAIを実務で安全に活用するための環境整備を加速させています。

注目の基調講演は12月2日から4日にかけて行われます。AWS CEOのマット・ガーマン氏による戦略発表を皮切りに、自律型AI担当VPのスワミ・シバスブラマニアン氏、Amazon.com CTOのワーナー・ボーゲルス氏らが登壇予定です。これらのセッションでは、今後の技術トレンドやAWSの長期的なビジョンが語られるため、見逃せません。

ユニークな試みとして、今年は人気ゲーム「フォートナイト」上でも基調講演のライブ視聴が可能になりました。従来の公式サイトでの配信に加え、新たな視聴体験を提供することで、より幅広い層へのリーチを狙っています。技術者だけでなく、ビジネスリーダーにとっても必須のイベントといえるでしょう。

出典：TechCrunch

Anthropic、長期AIエージェントの「記憶」問題を解決

2025年11月28日 Anthropic Claude エンジニアコーディングエージェントコンテキスト基盤モデル

コンテキスト制限の壁

AIは長時間稼働で指示や文脈を忘却

複雑なタスクは単一窓で完了不能

2段階の解決アプローチ

環境設定を行う初期化エージェント

進捗を刻むコーディングエージェント

人間の作業フローを模倣

セッション間で構造化データを引き継ぐ

テスト自動化でバグ修正能力も向上

詳細を見る

2025年11月28日、米AnthropicはAIエージェントが長時間稼働する際に文脈を失う問題を解決する新たな手法を発表しました。同社のClaude Agent SDKに実装されたこのアプローチは、エージェントが複数のセッションをまたいで記憶を保持し、大規模な開発プロジェクトなどの複雑なタスクを完遂できるようにするものです。

同社が提案するのは、役割を分担する「2段階アプローチ」です。まず「初期化エージェント」が開発環境をセットアップしてログを記録し、次に「コーディングエージェント」が実作業を行います。重要なのは、各作業セッションの終了時に構造化された更新情報（アーティファクト）を残し、次のセッションへ確実にバトンタッチする点です。

これまでAIエージェントは、基盤モデルの「コンテキストウィンドウ（扱える情報量）」の制限により、長時間稼働すると初期の指示を忘れたり、挙動が不安定になったりする課題がありました。Anthropicの新手法は、人間のソフトウェアエンジニアが日々の業務で行う「段階的な進捗管理」に着想を得ており、記憶の断絶を防ぐことに成功しています。

この手法により、エージェントは「一度にすべてをやろうとして失敗する」ことや「中途半端な状態で完了と誤認する」ことを回避できます。また、コーディングエージェントにはテストツールも組み込まれており、コード単体では発見しにくいバグの特定と修正能力も向上しています。

現在はWebアプリ開発での実証が中心ですが、Anthropicはこの手法が科学研究や財務モデリングなど、他の長期タスクにも応用可能であるとしています。AIエージェントが単なる対話相手から「長期的なプロジェクトを任せられるパートナー」へと進化するための、重要な技術的マイルストーンとなるでしょう。

出典：VentureBeat

特化型AIエージェントが業務変革、精度と生産性が劇的向上

2025年11月24日 NVIDIA 生産性 AI活用ワークフロー業務効率半導体セキュリティ知的財産エージェント基盤モデル

汎用から特化型へのシフト

汎用モデルから特化型エージェントへ移行

自社データとオープンモデルを結合

先行企業の導入成果

CrowdStrikeは手作業を10分の1に

警告の選別精度が80%から98.5%へ

PayPalは処理遅延を50%削減

Synopsysは設計生産性が72%向上

詳細を見る

NVIDIAは2025年11月、企業が汎用的なAIから特定の業務に特化した「AIエージェント」へとシフトしている傾向を明らかにしました。CrowdStrikeやPayPalなどの先進企業は、NVIDIAのオープンモデルと自社の独自データを組み合わせることで、業務効率や精度を劇的に向上させています。特化型AIは今や、企業の競争力を左右する重要な要素です。

企業におけるAI活用の鍵は「特化」にあります。万能なモデルに頼るのではなく、特定のユースケースを深く理解し行動できる特化型AIエージェントを開発する動きが加速しています。自社の知的財産やワークフローを学習させることで、汎用モデルでは実現できない高い専門性とビジネスインパクトを創出可能です。

サイバーセキュリティ大手のCrowdStrikeは、AIエージェントによりアラート選別の精度を80%から98.5%へと向上させました。これにより、セキュリティアナリストの手作業を10分の1に削減し、より高度な意思決定に集中できる環境を実現しています。スピードと正確性が求められる現場での成功例です。

他業界でも成果が顕著に表れています。PayPalはエージェント導入により決済処理の遅延を50%削減しつつ高精度を維持しており、Synopsysは半導体設計の生産性を72%向上させました。各社はNVIDIA Nemotronなどの基盤モデルを活用し、それぞれのドメイン知識をAIに実装することで生産性を最大化しています。

出典：NVIDIA公式

世界最大級の生物学AI「BioCLIP 2」始動、2億枚で学習

2025年11月20日 NVIDIA シミュレーションデジタルツイン推論 GPU 画像基盤モデル

圧倒的なデータと学習基盤

2億1400万枚の画像を学習

92万以上の分類群を網羅

NVIDIA H100で高速学習

概念を理解する高度な推論

性別や健康状態まで識別可能

種間の関係性を自律的に学習

教示なしで特徴の順序を理解

生態系保全と未来への応用

データ不足解消で保全に貢献

デジタルツイン構築への布石

詳細を見る

オハイオ州立大学の研究チームは、NVIDIAなどの支援を受け、世界最大級の生物学基盤モデル「BioCLIP 2」を発表しました。2億枚以上の画像データで学習されたこのAIは、従来の画像認識を超え、生物の複雑な関係性や特性を理解する能力を備えています。

基盤となるデータセット「TREEOFLIFE-200M」は、サルの仲間から植物まで92万以上の分類群を網羅しています。スミソニアン博物館などと協力して構築されたこの膨大なデータを、NVIDIA H100 GPUを用いてわずか10日間で学習させました。

特筆すべきは、教えられていない概念を理解する推論能力です。例えば、鳥のくちばしの大きさ順に並べたり、同種内のオスとメス、あるいは成体と幼体を区別したりできます。さらには、植物の葉の画像から病気の有無や種類を特定することさえ可能です。

このモデルは、絶滅危惧種の個体数推定など、データが不足している分野での活用が期待されています。既存のデータを補完することで、より効果的な生物多様性の保全活動を支援する「科学的プラットフォーム」としての役割を担います。

研究チームは次なる段階として、野生生物の「デジタルツイン」開発を見据えています。生態系の相互作用を仮想空間でシミュレーションすることで、実際の環境を破壊することなく、複雑な生態系の研究や教育が可能になるでしょう。

出典：NVIDIA公式

百度ERNIE 5.0、画像・文書処理でGPT-5超えを主張

2025年11月13日 Google OpenAI Gemini 検索 OCR GPT-5 エンジニアクラウド品質保証画像動画音声米国中国ベンチマーク基盤モデルオープンソースモデルノーコード

ERNIE 5.0の性能

ネイティブなオムニモーダルAI

画像・文書理解でGPT-5超え

チャート読解など企業向け機能に強み

テキスト処理特化版も同時公開

百度のグローバル戦略

API経由のプレミアム提供

国際版ノーコードツールも展開

商用利用可能なOSSモデルも公開

オープンとクローズドの二刀流

詳細を見る

中国の検索大手、百度（バイドゥ）は年次イベント「Baidu World 2025」で、最新の独自基盤モデル「ERNIE 5.0」を発表しました。このモデルは、OpenAIのGPT-5やGoogleのGemini 2.5 Proを、特にグラフや文書の理解といった視覚タスクで上回る性能を持つと主張しており、激化するエンタープライズAI市場での世界的な優位性を目指します。

百度が公開したベンチマークによれば、ERNIE 5.0は特に文書認識（OCRBench）やグラフの質疑応答（ChartQA）といった分野で、欧米の最先端モデルを凌駕する結果を示したとされています。これは、自動文書処理や財務分析など、企業のコア業務における実用性の高さを強くアピールするものです。

ERNIE 5.0は、テキスト、画像、音声、動画を統合的に処理・生成できる「ネイティブ・オムニモーダル」モデルとして設計されています。同社が最近公開したオープンソースモデルとは異なり、独自のプロプライエタリモデルとして、クラウドプラットフォーム「Qianfan」のAPIを通じて企業向けに提供されます。

料金体系はプレミアムモデルとして位置づけられていますが、米国の主要モデルと比較すると競争力のある価格設定が特徴です。例えば、GPT-5.1と比較して入力トークン単価が約3割安く、高性能とコスト効率の両立を目指す企業にとって魅力的な選択肢となり得るでしょう。

注目すべきは、高性能なプロプライエタリモデルと並行して、商用利用が可能な高性能オープンソースモデル「ERNIE-4.5-VL」も提供している点です。このオープンとクローズドの「二刀流」戦略により、大企業から開発者コミュニティまで幅広い層への浸透を図っています。

ERNIE 5.0の発表は、世界の基盤モデル開発競争が新たな段階に入ったことを示唆しています。性能評価の第三者による検証が待たれますが、百度の明確な企業向け戦略とグローバル展開への野心は、既存のAI市場の勢力図を塗り替える可能性を秘めています。

出典：VentureBeat

SAP、調整不要の表計算AI発表業務予測を即実現

2025年11月04日 AI活用 AI導入専門家ファインチューニング事前学習基盤モデルオープンソースモデルノーコード

「調整不要」の表計算AI

ファインチューニング不要

導入後すぐに予測分析へ活用

数十年のビジネスデータで学習

LLMとの明確な違い

テキストでなく表データから学習

数値間の関係性を深く理解

構造的で正確な回答を生成

提供計画と今後の展望

2025年第4四半期に一般提供

ノーコード環境での実験も可能

詳細を見る

独ソフトウェア大手のSAPは、企業のAI導入を簡素化する新たな基盤モデル「RPT-1」を発表しました。このモデルは表形式データに特化しており、従来のLLMのように時間とコストのかかるファインチューニングが不要な点が最大の特徴です。導入後すぐに予測分析などの高度な業務に活用できるとしており、2025年第4四半期の一般提供開始を予定しています。

RPT-1は「リレーショナル基盤モデル」と名付けられ、リレーショナルデータベースやExcelのようなスプレッドシートのデータから学習します。SAPが数十年にわたり蓄積したビジネス取引データを基に事前学習済みのため、企業は自社の個別データを追加学習させることなく、「すぐに使える（out-of-the-box）」状態で業務アプリケーションに直接組み込むことが可能です。

テキストやコードを学習する大規模言語モデル（LLM）とは一線を画します。RPT-1は、数値や異なるセル間の関係性を深く理解することで、より構造的で正確な回答を生成できます。この特性は、特に金融分野や企業の業績管理など、精密な分析が求められる業務で真価を発揮するでしょう。汎用LLMでは対応が難しいユースケースを切り拓きます。

このモデルの基盤となっているのは、SAPの研究者が提唱した「ConTextTab」というアーキテクチャです。これは、テーブルのヘッダーや列の型といった意味情報（セマンティックシグナル）を手がかりに学習を進めることで、データ間の関連性を構造的に把握します。この仕組みが、RPT-1の精度の高さを支えています。

RPT-1は2025年第4四半期に、SAPのAI基盤サービス「AI Foundation」を通じて一般提供が開始される予定です。また、専門家でなくてもモデルを試せるノーコードの実験環境（プレイグラウンド）も提供されます。SAPは今後、オープンソースモデルを含む他のモデルも順次リリースする計画で、企業のAI活用をさらに加速させそうです。

出典：VentureBeat

NVIDIA、フィジカルAI設計図で都市DXを加速

2025年11月04日 NVIDIA デロイト AI活用エコシステムシミュレーションデジタルツインエンジニア経営者インフラ基盤モデル

フィジカルAI設計図とは

デジタルツインとAIを統合

現実世界をOmniverseで再現

合成データでAIモデルを訓練

リアルタイムの映像解析を実現

グローバルな都市での実装

交通管理やインフラ監視に活用

ダブリンやホーチミン市で導入

Esriなど多様なパートナーと連携

インシデント対応時間を80%削減

詳細を見る

NVIDIAは、バルセロナで開催中の「スマートシティエキスポ」で、都市が抱える課題を解決する「フィジカルAIブループリント」を発表しました。この設計図は、デジタルツイン技術と最新のAIを組み合わせ、交通渋滞の緩和やインフラ管理の効率化を実現します。Esriやデロイトといったグローバルパートナーとの協業を通じて、すでに世界各国の都市で具体的な成果を上げています。

「フィジカルAIブループリント」の中核をなすのが、現実世界を仮想空間に忠実に再現するデジタルツイン技術「NVIDIA Omniverse」です。ここに、世界基盤モデル「NVIDIA Cosmos」や映像解析AI「NVIDIA Metropolis」を統合。これにより、現実では困難なシミュレーションや、高精度なAIモデルの迅速な訓練が可能になります。

なぜ今、都市DXが急務なのでしょうか。国連は2050年までに世界人口の3分の2が都市に集中すると予測しており、インフラや公共サービスへの負荷増大は避けられません。特にスマート交通管理市場は2027年までに200億ドル規模に達する見込みで、AI活用による効率化は都市の持続可能性を左右する重要な鍵となります。

パートナー企業による導入事例も次々と生まれています。例えば、地理情報システムのEsriは、ノースカロライナ州ローリー市で、膨大なカメラデータをAIがリアルタイムで分析し、交通状況を地図上に可視化するシステムを構築。これにより、問題発生時の迅速な対応や、渋滞緩和によるCO2排出量削減を目指します。

台湾のLinker Visionは、このブループリントを全面的に採用し、高雄市でインシデント対応時間を最大80%削減する成果を上げました。この成功を足掛かりに、ベトナムのホーチミン市やダナン市へも展開。交通量や建設状況をシミュレーション・監視し、都市の運営効率を飛躍的に高めようとしています。

他にも、アイルランドのダブリンでは、Bentley SystemsやVivaCityが協力し、自転車や歩行者などの移動データをデジタルツイン上で分析。また、デロイトはAIによる横断歩道の自動点検システムを開発するなど、世界中のエコシステムパートナーがNVIDIAの技術基盤の上で革新的なソリューションを生み出しています。

NVIDIAとそのパートナーが示す未来は、データとAIが都市の神経網のように機能し、より安全で効率的な市民生活を実現する世界です。この「フィジカルAI」という新たな潮流は、都市運営のあり方を根本から変革する可能性を秘めており、経営者やエンジニアにとって見逃せない動きと言えるでしょう。

出典：NVIDIA公式

確実性でLLM超え狙うAI、30億円調達

2025年11月03日 ChatGPT エンジニアカスタマーサービス推論インフラクラウドポリシースタートアップ医療資金調達評価額基盤モデルトランスフォーマー Intel

ポストTransformer技術

LLMの言語能力と記号AIの論理推論を融合

ニューロシンボリック方式を採用

確率的なLLMの予測不能性を克服

タスク指向の対話に特化した設計

企業AUIと新モデル

NYの新興企業、評価額1125億円

新基盤モデル「Apollo-1」を開発

総調達額は約90億円に到達

2025年末に一般提供を予定

詳細を見る

ニューヨークのAIスタートアップ、Augmented Intelligence Inc (AUI)は2025年11月3日、2000万ドル（約30億円）の資金調達を発表しました。これにより企業評価額は7億5000万ドル（約1125億円）に達します。同社は、ChatGPTなどが用いるTransformerアーキテクチャの課題である予測不可能性を克服するため、ニューロシンボリックAI技術を開発。企業が求める確実で信頼性の高い対話AIの実現を目指します。

AUIが開発する基盤モデル「Apollo-1」の核心は、そのハイブリッドな構造にあります。ユーザーの言葉を理解する「ニューラルモジュール」と、タスクの論理構造を解釈し、次に取るべき行動を決定論的に判断する「シンボリック推論エンジン」を分離。これにより、LLMの持つ言語の流暢さと、従来型AIの持つ厳密な論理実行能力を両立させています。

なぜ今、この技術が注目されるのでしょうか。既存のLLMは確率的に応答を生成するため、常に同じ結果を保証できません。これは、金融やヘルスケア、顧客サービスなど、厳格なルール遵守が求められる業界では大きな障壁となります。Apollo-1は、組織のポリシーを確実に適用し、タスクを最後まで間違いなく遂行する能力でこの課題を解決します。

Apollo-1の強みは、その汎用性と導入のしやすさにもあります。特定の業界に特化せず、ヘルスケアから小売まで幅広い分野で応用可能です。また、特別なインフラを必要とせず、標準的なクラウド環境で動作するため、導入コストを抑えられる点も企業にとっては魅力的です。開発者は使い慣れたAPI経由で簡単に統合できます。

今回の調達は、より大規模な資金調達の前段階と位置付けられており、同社への期待の高さをうかがわせます。Fortune 500企業の一部では既にベータ版が利用されており、2025年末までの一般公開が予定されています。LLM一強の時代から、用途に応じた多様なAIが選択される新時代への転換点となるかもしれません。

出典：VentureBeat

Apple CEO、AI分野のM&Aに意欲表明

2025年10月31日 OpenAI Apple ChatGPT Siri 投資家インフラクラウドデータセンタープライバシー投資提携買収基盤モデル Intel

AI強化へ3本柱の方針

AI分野でのM&A;や提携に前向き

自社開発・提携・買収の3本柱を継続

OpenAIに続く新たな提携も準備

次世代Siriと独自技術

AI搭載の次世代Siriは2026年公開予定

独自技術Private Cloud Compute活用

AI機能がスマホ選びの重要要素に

詳細を見る

Appleのティム・クックCEOは、2025年第4四半期の決算発表において、AI分野でのM&A;（合併・買収）や提携に前向きな姿勢を改めて示しました。同社はAI開発を加速させるため、戦略的な選択肢を常に検討していると強調。また、AIを搭載した次世代Siriが2026年にリリース予定であることも明言し、開発が順調に進んでいることを投資家にアピールしました。

クックCEOは、AppleのAI開発が「自社基盤モデル」「サードパーティとの提携」「企業買収」の3本柱で進められていることを再確認しました。「我々のロードマップを前進させるM&A;であれば、追求する用意がある」と述べ、市場を継続的に監視している姿勢を明らかにしました。これは、AI分野での競争力維持に向けた強い意志の表れと言えるでしょう。

パートナーシップの拡大にも意欲的です。AppleはすでにOpenAIと提携し、ChatGPTをSiriや「Apple Intelligence」に統合しています。クックCEOは決算発表前のインタビューで「将来的には、より多くの企業と統合していく」と語っており、特定の技術に固執せず、最適なパートナーと協力していく戦略を明確にしました。

自社技術の中核となるのが、プライバシー保護に特化したクラウドシステム「Private Cloud Compute」です。クックCEOは、この技術がすでに多くのSiriのクエリ処理に使われていると説明。このインフラを支えるサーバーの製造も数週間前にヒューストンで開始されており、データセンターでの活用に向けた増産体制が計画されています。

最後にクックCEOは、AI機能が消費者のスマートフォン選びに与える影響についても言及しました。「Apple Intelligenceは（購入の）一因であり、今後さらに大きな要因になると非常に強気に見ている」と述べ、AI機能が製品の競争力を左右する重要な要素になるとの認識を示しました。

出典：TechCrunch

OpenAI、推論で安全性を動的分類する新モデル公開

2025年10月29日 OpenAI Sora 画像生成 GPT-5 gpt-oss エンジニア推論機械学習オープンウェイトリスクコンテンツポリシー画像ベンチマーク基盤モデル CoT Hugging Face

新モデルの特長

開発者が安全方針を直接定義

推論でポリシーを解釈し分類

判断根拠を思考過程で透明化

商用利用可能なオープンモデル

従来手法との違い

ポリシー変更時の再学習が不要

大量のラベル付きデータが不要

新たな脅威へ迅速な対応が可能

性能と実用上の課題

小型ながら高い分類性能を発揮

処理速度と計算コストが課題

詳細を見る

米OpenAIは2025年10月29日、開発者が定義した安全方針に基づき、AIが推論を用いてコンテンツを動的に分類する新しいオープンウェイトモデル「gpt-oss-safeguard」を発表しました。このモデルは、従来の大量データに基づく分類器とは異なり、ポリシー自体を直接解釈するため、柔軟かつ迅速な安全対策の導入を可能にします。研究プレビューとして公開され、コミュニティからのフィードバックを募ります。

最大の特徴は、AIの「推論能力」を活用する点です。開発者は自然言語で記述した安全方針を、分類対象のコンテンツと共にモデルへ入力します。モデルは方針を解釈し、コンテンツが方針に違反するかどうかを判断。その結論に至った「思考の連鎖（Chain-of-Thought）」も示すため、開発者は判断根拠を明確に把握できます。

このアプローチは、従来の機械学習手法に比べて大きな利点があります。従来、安全方針を変更するには、数千件以上の事例データを再ラベル付けし、分類器を再学習させる必要がありました。しかし新モデルでは、方針テキストを修正するだけで対応可能です。これにより、巧妙化する新たな脅威や、文脈が複雑な問題にも迅速に適応できます。

例えば、ゲームのコミュニティサイトで不正行為に関する投稿を検出したり、ECサイトで偽レビューを特定したりと、各サービスの実情に合わせた独自の基準を容易に設定・運用できます。大規模なデータセットを用意できない開発者でも、質の高い安全分類器を構築できる道が開かれます。

性能評価では、社内ベンチマークにおいて、基盤モデルである「gpt-5-thinking」を上回る精度を示しました。一方で、特定の複雑なリスクに対しては、大量のデータで専用に訓練された従来の分類器に劣る場合があることや、推論プロセスに伴う計算コストと処理遅延が課題であることも認めています。

OpenAIは、社内ツール「Safety Reasoner」で同様のアプローチを既に採用しており、GPT-5や画像生成AI「Sora 2」などの安全システムの中核を担っています。今回のオープンモデル公開は、こうした先進的な安全技術を広く共有し、コミュニティと共に発展させることを目指すものです。モデルはHugging Faceからダウンロード可能で、Apache 2.0ライセンスの下で自由に利用、改変、配布ができます。

出典：OpenAI公式 | OpenAI公式

NVIDIA、物理AI開発を加速する新基盤モデル

2025年10月29日 NVIDIA シミュレーションデジタルツイン気象エンジニア経営者画像動画ロボット基盤モデル

物理AI開発の課題

現実世界のデータ収集コスト

開発期間の長期化

多様なシナリオの網羅性不足

新Cosmosモデルの特長

テキスト等から動画世界を生成

気象や照明など環境を自在に変更

従来比3.5倍小型化し高速化

期待されるビジネス効果

開発サイクルの大幅な短縮

AIモデルの精度と安全性の向上

詳細を見る

NVIDIAは2025年10月29日、物理AI開発を加速させるワールド基盤モデル「NVIDIA Cosmos」のアップデートを発表しました。ロボットや自動運転車の訓練に必要な多様なシナリオのデータを、高速かつ大規模に合成生成する新モデルを公開。これにより、開発者は現実世界でのデータ収集に伴うコストや危険性を回避し、シミュレーションの精度を飛躍的に高めることが可能になります。

ロボットなどの物理AIは、現実世界の多様で予測不能な状況に対応する必要があります。しかし、そのための訓練データを実世界で収集するのは、莫大な時間とコスト、そして危険を伴います。特に、まれにしか起こらない危険なシナリオを網羅することは極めて困難です。この「データ収集の壁」を打ち破る鍵として、物理法則に基づいた合成データ生成が注目されています。

今回のアップデートでは、2つの主要モデルが刷新されました。「Cosmos Predict 2.5」は、テキストや画像、動画から一貫性のある仮想世界を動画として生成します。一方「Cosmos Transfer 2.5」は、既存のシミュレーション環境に天候や照明、地形といった新たな条件を自在に追加し、データの多様性を飛躍的に高めます。モデルサイズも従来比3.5倍小型化され、処理速度が向上しました。

これらの新モデルは、NVIDIAの3D開発プラットフォーム「Omniverse」やロボットシミュレーション「Isaac Sim」とシームレスに連携します。開発者は、スマートフォンで撮影した現実空間からデジタルツインを生成し、そこに物理的に正確な3Dモデルを配置。その後、Cosmosを用いて無限に近いバリエーションの訓練データを生成する、という効率的なパイプラインを構築できます。

すでに多くの企業がこの技術の活用を進めています。汎用ロボット開発のSkild AI社は、ロボットの訓練期間を大幅に短縮。また、配送ロボットを手がけるServe Robotics社は、Isaac Simで生成した合成データを活用し、10万件以上の無人配送を成功させています。シミュレーションと現実のギャップを埋めることで、開発と実用化のサイクルが加速しています。

NVIDIAの今回の発表は、物理AI開発が新たな段階に入ったことを示唆します。合成データ生成の質と量が飛躍的に向上することで、これまで困難だった複雑なタスクをこなすロボットや、より安全な自動運転システムの開発が現実味を帯びてきました。経営者やリーダーは、この技術革新が自社の競争優位性にどう繋がるか、見極める必要があります。

出典：NVIDIA公式

NVIDIA、AI工場設計図と新半導体を一挙公開

AI工場構築の設計図

政府向けAI工場設計図を公開

ギガワット級施設のデジタルツイン設計

次世代DPU BlueField-4発表

産業用AIプロセッサ IGX Thorも

オープンなAI開発

高効率な推論モデルNemotron公開

物理AI基盤モデルCosmosを提供

6G研究用ソフトをオープンソース化

詳細を見る

NVIDIAは10月28日、ワシントンD.C.で開催の技術会議GTCで、政府・規制産業向けの「AIファクトリー」参照設計や次世代半導体、オープンソースのAIモデル群を一挙に発表しました。これは、セキュリティが重視される公共分野から創薬、エネルギー、通信といった基幹産業まで、AIの社会実装をあらゆる領域で加速させるのが狙いです。ハード、ソフト、設計思想まで網羅した包括的な戦略は、企業のAI導入を新たな段階へと導く可能性があります。

発表の核となるのが、AI導入の設計図です。政府・規制産業向けに高いセキュリティ基準を満たす「AI Factory for Government」を発表。PalantirやLockheed Martinなどと連携します。また、Omniverse DSXブループリントは、ギガワット級データセンターをデジタルツインで設計・運用する手法を提示。物理的な建設前に効率や熱問題を最適化し、迅速なAIインフラ構築を可能にします。

AIインフラの性能を根幹から支える新半導体も発表されました。次世代DPU「BlueField-4」は、AIデータ処理、ネットワーキング、セキュリティを加速し、大規模AI工場の中枢を担います。さらに、産業・医療のエッジ向けには、リアルタイム物理AIプロセッサ「IGX Thor」を投入。従来比最大8倍のAI性能で、工場の自動化や手術支援ロボットの進化を後押しします。

開発者エコシステムの拡大に向け、AIモデルのオープンソース化も加速します。高効率な推論でAIエージェント構築を容易にする「Nemotron」モデル群や、物理世界のシミュレーションを可能にする「Cosmos」基盤モデルを公開。さらに、次世代通信規格6Gの研究開発を促進するため、無線通信ソフトウェア「Aerial」もオープンソースとして提供します。

これらの技術は既に具体的な産業応用へと結実しています。製薬大手イーライリリーは、1000基以上のNVIDIA Blackwell GPUを搭載した世界最大級の創薬AIファクトリーを導入。General Atomicsは、核融合炉のデジタルツインを構築し、シミュレーション時間を数週間から数秒に短縮するなど、最先端科学の現場で成果を上げています。

今回の一連の発表は、AIが研究開発段階から、社会を動かす基幹インフラへと移行する転換点を示唆しています。NVIDIAが提示する「AIファクトリー」という概念は、あらゆる産業の生産性と競争力を再定義する可能性を秘めています。自社のビジネスにどう取り入れ、新たな価値を創造するのか。経営者やリーダーには、その構想力が問われています。

米政府、AMDと組み国家主権AIスパコン開発へ

2025年10月27日半導体エネルギースーパーコンピューター安全保障米国提携基盤モデル

10億ドルの大型プロジェクト

米エネルギー省とAMDが提携

総額10億ドルの契約を締結

2基のAIスパコンを開発

オークリッジ国立研究所に設置

2基の新スパコンの役割

Lux：国家初のAIファクトリー

Luxは2026年初頭に稼働

Discovery：科学研究を加速

Discoveryは2029年稼働予定

詳細を見る

米半導体大手AMDは10月27日、米エネルギー省と10億ドル規模の契約を締結したと発表しました。この提携に基づき、テネシー州のオークリッジ国立研究所に2基のAIスーパーコンピュータ「Lux」と「Discovery」を開発します。「Lux」は2026年初頭、「Discovery」は2029年の稼働を目指しており、米国の科学技術と国家安全保障の強化が目的です。

「Lux」は、米国初となる科学、エネルギー、国家安全保障に特化した「AIファクトリー」と位置づけられています。AI基盤モデルの訓練や微調整、展開に特化しており、データ集約的なワークロードに最適化された設計です。これにより、発見や技術革新を加速させることが期待されます。

一方の「Discovery」は、エネルギー、生物学、先端材料、製造業など、幅広い分野での画期的な研究を推進します。次世代原子炉やバッテリー、半導体などの設計支援が主な用途です。「Bandwidth Everywhere」設計により、既存のスパコン「Frontier」を上回る性能とエネルギー効率を実現します。

AMDと米政府の協力は今回が初めてではありません。同研究所に設置されている世界最速級のスパコン「Frontier」の開発にもAMDは関与しています。今回のプロジェクトは、これまでの協力関係を基盤とし、米国のAI覇権と科学技術力をさらに強化する戦略的な一手と言えるでしょう。

出典：The Verge

OpenAI、韓国AI成長戦略を提言『主権』と『協力』が鍵

2025年10月23日 OpenAI サムスンエコシステムアシスタント AI導入エンジニア半導体インフラデータセンター韓国医療中小企業基盤モデル

韓国の強みと機会

世界有数の半導体製造能力

高密度なデジタルインフラ

政府主導のAI国家戦略

OpenAIのデュアル戦略

自国のAI主権を構築

最先端企業との戦略的協力

主要分野への波及効果

輸出・製造業の競争力向上

医療・教育の高度化と効率化

中小企業・地方経済の活性化

詳細を見る

米OpenAIは10月23日、韓国がAIによる経済的利益を最大化するための政策提言「経済ブループリント」を発表しました。韓国が持つ半導体製造能力やデジタルインフラといった強みを活かし、世界有数のAI大国へと飛躍するための道筋を示すものです。提言の核心は、自国でAI基盤を固める「AI主権」の構築と、最先端企業と連携する「戦略的協力」を両立させるアプローチにあります。

なぜ今、韓国が注目されるのでしょうか。同国は世界トップクラスの半導体製造技術、高密度なデジタルインフラ、優秀な人材、そしてAIを国家の優先課題とする政府の強力な支援という、AI先進国となるための要素を兼ね備えています。OpenAIは既にサムスンやSKと連携し、次世代AIデータセンターの構築も視野に入れています。

提言の中心となるのが「デュアルトラック・アプローチ」です。一つは、基盤モデルやインフラ、データ統治において自国の能力を高める「AI主権」の追求。もう一つは、OpenAIのような最先端AI開発者と協業し、最新技術へのアクセスを確保する「戦略的協力」です。これらは相互に補完し合い、韓国独自のAIエコシステムを強化すると分析されています。

この戦略が実現すれば、経済全体に大きな効果が期待されます。例えば、半導体や自動車といった輸出産業では、AIによる設計最適化やスマート工場化で国際競争力が高まります。また、高齢化が進む医療分野では臨床医の負担軽減、教育分野では個別最適化された学習の提供が可能になるでしょう。

中小企業や地方経済の活性化も重要なテーマです。手頃な価格のAIアシスタントが事務作業や輸出関連手続きを代行することで、中小企業はより付加価値の高い業務に集中できます。これにより、ソウル一極集中ではない、均衡の取れた成長を促進する狙いがあります。

成功の鍵は「安全な導入のスピード」です。そのためには、大規模な計算インフラの整備、データガバナンスの確立、国際標準に準拠した政策環境の整備が不可欠となります。これらを迅速に進めることで、韓国は単なるAI導入国に留まらず、他国に輸出可能な「AI国家パッケージ」を開発できるとOpenAIは見ています。

OpenAIのクリス・レヘインCGAO（最高国際渉外責任者）は「韓国はその強みを活かし、歴史的なリーダーシップを発揮する機会を得た」とコメント。このブループリントは、韓国がAI分野で世界をリードする「標準設定者」となるための、具体的かつ野心的なロードマップと言えるでしょう。

出典：OpenAI公式

3Dで思考するロボットAI、欧州からオープンソースで登場

2025年10月22日 Llama 専門家画像ロボット欧州スタートアップベンチマーク基盤モデルオープンソースモデル Intel

3Dデータで物理世界を理解

3Dデータを取り入れた独自学習

物理空間における物体の動きを把握

2D画像ベースモデルとの明確な差別化

商用版に匹敵する性能

オープンソースで誰でも利用可能

研究開発の加速と民主化に貢献

ベンチマークで商用モデル並みのスコア

スタートアップの実験・改良を促進

詳細を見る

ブルガリアの研究所INSAITを中心とする欧州の研究者チームが22日、産業用ロボットの頭脳として機能する新たなAI基盤モデル「SPEAR-1」をオープンソースで公開しました。このモデルは3次元（3D）データで訓練されており、物体をより器用に掴み、操作する能力を飛躍的に向上させます。研究開発の加速が期待されます。

SPEAR-1の最大の特徴は、3Dデータを学習に取り入れた点です。従来のモデルは2D画像から物理世界を学んでいましたが、これではロボットが活動する3D空間との間に認識のズレが生じていました。このミスマッチを解消し、より現実に即した物体の動きを理解します。

このモデルがオープンソースで公開された意義は大きいでしょう。言語モデルの世界でLlamaなどが革新を民主化したように、SPEAR-1はロボット工学の研究者やスタートアップが迅速に実験を重ねる土台となります。身体性を持つAI分野の発展を加速させる起爆剤となりそうです。

性能も注目に値します。ロボットのタスク遂行能力を測るベンチマーク「RoboArena」では、商用の基盤モデルに匹敵する高いスコアを記録しました。特に、有力スタートアップPhysical Intelligence社の最先端モデルにも迫る性能を示しており、その実用性の高さが伺えます。

ロボット知能の開発競争は激化し、数十億ドル規模の資金が動いています。SPEAR-1の登場は、クローズドな商用モデルとオープンソースモデルが共存しながら技術を進化させる可能性を示唆します。専門家は「1年前には不可能だった」と述べ、この分野の急速な進歩に驚きを見せています。

出典：WIRED

MITとIBM、小型・効率AIで産業応用を加速

2025年10月21日 AI活用推論オンデバイス画像医療 MIT 基盤モデル

産学連携が生む圧倒的成果

特許54件、引用12万件超

産業ユースケース50件以上を創出

医療や化学など多分野へ応用

「巨大」から「小型・効率」へ

巨大モデルからタスク特化型へ転換

性能を維持しモデルを小型化

エッジデバイスでの高速処理実現

少ないデータで賢く学習

自己修正で推論精度を高める新手法

PoCで終わらせない実用化を推進

詳細を見る

マサチューセッツ工科大学（MIT）とIBMが共同で運営する「MIT-IBM Watson AI Lab」は、AI開発の新たな方向性を示しています。設立8周年を迎えた同ラボは、巨大な基盤モデルから、より小さく効率的でタスクに特化したモデルの開発に注力。研究と実用化のギャップを埋め、産業界でのAI活用を加速させることを目指します。これは、AIプロジェクトの多くが概念実証（PoC）で頓挫する現状への明確な回答と言えるでしょう。

この産学連携は目覚ましい成果を上げています。これまでに特許54件を出願し、論文の引用数は12万8000件を超えました。さらに、ヘルスケアや金融、化学など多岐にわたる分野で50件以上の産業ユースケースを創出。AI画像技術によるステント留置の改善や、計算コストの大幅な削減など、具体的なイノベーションを生み出し続けています。

なぜ今、「小型・効率化」が重要なのでしょうか。調査会社ガートナーによると、生成AIプロジェクトの少なくとも30%が2025年末までに概念実証（PoC）の段階で中止されると予測されています。多くの企業がAIへの期待を抱きつつも、価値ある成果に繋げられていないのです。同ラボは、この研究と実用の間の「死の谷」を埋める役割を担っています。

小型化の鍵を握るのが、`once-for-all`や`AWQ`といった革新的な技術です。これらの手法は、モデルのアーキテクチャを最適化し、性能を維持したままサイズを圧縮します。これにより、スマートフォンなどのエッジデバイス上でもAIを高速に実行できるようになります。遅延を減らし、リアルタイムでの応用範囲を大きく広げる可能性を秘めています。

さらに、少ないデータで賢く学習する技術も進化しています。例えば`COAT`（Chain-of-Action-Thought）と呼ばれる手法は、AIが自らの推論プロセスを反復的に自己修正することで、より正確な答えを導き出します。これは、限られた計算資源とデータで、現実世界の複雑な課題を解決するための重要なアプローチです。

これらの研究成果は、IBMのプラットフォーム`watsonx`などを通じて実用化されています。一例が、コンパクトながら高精度な文書理解能力を持つ`Granite Vision`モデルです。企業が保有する膨大な文書から、信頼性の高い情報を抽出し、要約するニーズに応えます。

MIT-IBM Watson AI Labが目指すのは「有用で効率的な知能」の創出です。巨大モデルの開発競争から一歩進み、目的に合わせて最適化されたAIこそが、真の経済的・社会的価値を生み出すと彼らは考えています。この産学連携の取り組みは、AIの実用化を目指す全ての企業にとって、重要な指針となるでしょう。

出典：MIT News

GoogleのAI、がん治療の新たな道を拓く

2025年10月15日 Google 推論創薬基盤モデル Gemma

新AIモデル「C2S-Scale」

GoogleのGemmaベースで開発

270億パラメータの大規模モデル

個々の細胞の言語を解読

がん治療への新アプローチ

免疫から隠れる「コールド」腫瘍が標的

4000超の薬剤を仮想スクリーニング

新薬候補silmitasertibを特定

AIの予測を実験で証明

AIの仮説を実験室で検証

免疫反応を約50%増強する効果を確認

詳細を見る

Googleとイェール大学の研究チームは、オープンソースAIモデル「Gemma」を基に開発した新モデル「C2S-Scale 27B」を用い、がん治療の新たな経路を発見しました。このAIは、これまで免疫システムから見えなかった「コールド」腫瘍を、免疫が攻撃しやすい「ホット」な状態に変える可能性のある薬剤候補を特定。実験でもその効果が確認され、がん免疫療法の開発を加速させるブレークスルーとして期待されています。

今回開発された「C2S-Scale 27B」は、270億という膨大なパラメータを持つ基盤モデルです。個々の細胞が発する複雑な「言語」を解読するために設計されました。特筆すべきは、モデルの大規模化によって獲得された「創発的能力」です。これにより、小規模モデルでは不可能だった、特定の条件下でのみ薬が効果を発揮する、という複雑な因果関係の推論が可能になりました。

がん免疫療法の大きな課題は、多くの腫瘍が免疫細胞から身を隠す「コールド」な状態にあることです。研究チームはAIに対し、「低レベルの免疫信号（インターフェロン）が存在する環境下でのみ、免疫反応を増幅する薬剤」という非常に高度な条件を付けて探索させました。これは、腫瘍を特異的に「ホット」な状態に変えるための重要な戦略です。

AIは4,000種類以上の既存薬データを仮想スクリーニングし、キナーゼCK2阻害剤「silmitasertib」が上記の条件を満たすと予測しました。驚くべきことに、この薬剤が免疫反応を高めるという事実はこれまで文献で報告されておらず、AIが単なる既知の事実の再現ではなく、全く新しい科学的仮説を生成したことを意味します。

このAIの予測を検証するため、研究チームは実験室でヒトの細胞を用いてテストを実施しました。その結果、silmitasertibと低用量のインターフェロンを組み合わせることで、免疫システムが腫瘍を認識する目印となる「抗原提示」が約50%も増加することが確認されました。AIの予測は見事に証明されたのです。

今回の成果は、AIが創薬研究において、有望な仮説を高速に生成し、実験の方向性を示す強力なツールとなり得ることを示しました。GoogleはC2S-Scale 27Bモデルを研究コミュニティに公開しており、今後、この技術を応用した新しい併用療法の開発が世界中で加速することが期待されます。

出典：Google公式

ソブリンAI、米中技術覇権の新たな主戦場に

2025年10月14日 OpenAI DeepSeek Qwen インフラデータセンター米国中国日本米中スタートアップ提携基盤モデルオープンソースモデル Hugging Face

米国のソブリンAI戦略

OpenAIが各国政府と提携

国家によるAI統制を支援

非民主主義国との連携に懸念も

中国のオープンソース攻勢

オープンソースモデルで世界席巻

Alibabaのモデルは3億DL超

来年には米国を凌駕する可能性

真のAI主権をめぐる論点

主権にはオープンソースが必須との声

クローズドとオープンの両立も可能

詳細を見る

米OpenAIをはじめとするテクノロジー企業が、「ソブリンAI」の構築支援を各国で進めています。ソブリンAIとは、各国が自国の管理下でAIインフラを開発・運用する能力を指し、米中間の技術覇権争いの新たな主戦場となりつつあります。米国が同盟国との連携を深める一方、中国はオープンソースモデルで世界的な影響力を急速に拡大しています。

OpenAIはアラブ首長国連邦（UAE）などの政府と提携し、大規模なデータセンター建設を含むソブリンAIシステム構築を支援しています。この動きは米国政府とも連携しており、同盟国が中国の技術に依存するのを防ぐという戦略的な狙いがあります。米国の技術を世界に普及させることで、地政学的な優位性を確保しようとしています。

しかし、UAEのような非民主主義国との提携には懸念の声も上がっています。かつて米国は、経済的な関与が中国の民主化を促すと期待しましたが、結果的に権威主義体制を強めることになりました。AI技術の提供が同様の結果を招かないか、過去の教訓が問い直されています。OpenAIは政府からの要請があっても情報検閲は行わないと明言しています。

対する中国は、オープンソース戦略で猛追しています。AlibabaやTencent、DeepSeekといった企業が公開した高性能な基盤モデルは、世界中で広く採用されています。特にAlibabaの「Qwen」ファミリーは3億回以上ダウンロードされ、日本を含む各国のスタートアップが自国語対応モデルの開発基盤として活用しています。

オープンソースAIモデルをホストするHugging FaceのCEOは、「真の主権はオープンソースなしにはあり得ない」と指摘します。モデルの内部を完全に検証・制御できるためです。中国企業はこの戦略により驚異的な速さで技術力を向上させ、5年前の遅れを取り戻し、今や米国と互角のレベルに達したと分析されています。

AIの国家主権をめぐる競争は、クローズドモデルを推進する米国勢と、オープンソースで勢力を拡大する中国勢という構図を呈しています。OpenAIは両アプローチの共存が可能との見方を示していますが、どちらが次世代のグローバルスタンダードを握るのか。この動向は、各国の事業戦略を左右する重要な要素となるでしょう。

出典：WIRED

Salesforce、規制業界向けにAI『Claude』を本格導入

2025年10月14日 Anthropic Amazon Salesforce Slack Claude Claude Code 生産性 CRM エンジニアクラウドセキュリティ医療提携基盤モデル

提携で実現する3つの柱

AgentforceでClaudeを優先モデルに

金融など業界特化AIを共同開発

SlackとClaudeの統合を深化

安全なAI利用と生産性向上

Salesforceの信頼境界内で完結

機密データを外部に出さず保護

Salesforceは開発にClaude活用

Anthropicは業務にSlack活用

詳細を見る

AI企業のAnthropicと顧客管理（CRM）大手のSalesforceは2025年10月14日、パートナーシップの拡大を発表しました。SalesforceのAIプラットフォーム『Agentforce』において、AnthropicのAIモデル『Claude』を優先的に提供します。これにより、金融や医療など規制が厳しい業界の顧客が、機密データを安全に保ちながら、信頼性の高いAIを活用できる環境を整備します。提携は業界特化ソリューションの開発やSlackとの統合深化も含まれます。

今回の提携の核心は、規制産業が抱える「AIを活用したいが、データセキュリティが懸念」というジレンマを解消する点にあります。Claudeの処理はすべてSalesforceの仮想プライベートクラウド内で完結。これにより、顧客はSalesforceが保証する高い信頼性とセキュリティの下で、生成AIの恩恵を最大限に享受できるようになります。

具体的な取り組みの第一弾として、ClaudeはSalesforceのAgentforceプラットフォームで優先基盤モデルとなります。Amazon Bedrock経由で提供され、金融、医療、サイバーセキュリティなどの業界で活用が見込まれます。米RBC Wealth Managementなどの企業は既に導入し、アドバイザーの会議準備時間を大幅に削減するなど、具体的な成果を上げています。

さらに両社は、金融サービスを皮切りに業界に特化したAIソリューションを共同開発します。また、ビジネスチャットツールSlackとClaudeの連携も深化。Slack上の会話やファイルから文脈を理解し、CRMデータと連携して意思決定を支援するなど、日常業務へのAI浸透を加速させる計画です。

パートナーシップは製品連携に留まりません。Salesforceは自社のエンジニア組織に『Claude Code』を導入し、開発者の生産性向上を図ります。一方、Anthropicも社内業務でSlackを全面的に活用。両社が互いの製品を深く利用することで、より実践的なソリューション開発を目指すとしています。

出典：Anthropic公式

AIエージェント更新、効果をA/Bテストで可視化

2025年10月10日創業者セキュリティスタートアップエージェントプロンプト基盤モデル

Raindropの新機能

企業向けAIエージェントのA/Bテスト

更新による性能変化を正確に比較

実ユーザー環境での振る舞いをデータで追跡

開発の課題を解決

「評価は合格、本番で失敗」問題に対処

データ駆動でのモデル改善を支援

障害の根本原因を迅速に特定

提供形態と安全性

月額350ドルのProプランで提供

SOC 2準拠で高い安全性を確保

詳細を見る

AIの可観測性プラットフォームを提供するスタートアップRaindropが、企業向けAIエージェントの性能を評価する新機能「Experiments」を発表しました。LLMの進化が加速する中、モデル更新が性能に与える影響をA/Bテストで正確に比較・検証できます。これにより、企業はデータに基づいた意思決定でAIエージェントを継続的に改善し、実際のユーザー環境での「評価は合格、本番で失敗する」という根深い問題を解決することを目指します。

「Experiments」は、AIエージェントへの変更がパフォーマンスにどう影響するかを可視化するツールです。例えば、基盤モデルの更新、プロンプトの修正、使用ツールの変更など、あらゆる変更の影響を追跡。数百万件もの実ユーザーとの対話データを基に、タスク失敗率や問題発生率などをベースラインと比較し、改善か改悪かを明確に示します。

多くの開発チームは「オフライン評価は合格するのに、本番環境ではエージェントが失敗する」というジレンマに直面しています。従来の評価手法では、予測不能なユーザーの行動や長時間にわたる複雑なツール連携を捉えきれません。Raindropの共同創業者は、この現実とのギャップを埋めることが新機能の重要な目的だと語ります。

このツールは、AI開発に現代的なソフトウェア開発の厳密さをもたらします。ダッシュボードで実験結果が視覚的に表示され、どの変更が肯定的な結果（応答の完全性向上など）や否定的な結果（タスク失敗の増加など）に繋がったかを一目で把握可能。これにより、チームは憶測ではなく客観的データに基づいてAIの改善サイクルを回せます。

Raindropは元々、AIの「ブラックボックス問題」に取り組む企業として設立されました。従来のソフトウェアと異なりAIは「静かに失敗する」特性があります。同社は、ユーザーフィードバックやタスク失敗などの兆候を分析し本番環境での障害を検知することから事業を開始。今回の新機能は、障害検知から一歩進んで改善効果の測定へと事業を拡張するものです。

「Experiments」は、Statsigのような既存のフィーチャーフラグ管理プラットフォームとシームレスに連携できます。セキュリティ面では、SOC 2に準拠し、AIを用いて個人を特定できる情報（PII）を自動で除去する機能も提供。企業が機密データを保護しながら、安心して利用できる環境を整えています。本機能は月額350ドルのProプランに含まれます。

出典：VentureBeat

Samsungの超小型AI「TRM」、再帰で巨大LLMを超える

2025年10月08日 Google OpenAI GitHub サムスン Gemini ネットワークエンジニア推論スケーリング則 GPU エネルギー AGI 韓国 MIT 投資ベンチマーク基盤モデル

TRMのパラメーターと仕組み

パラメーター数はわずか700万

既存LLMの1万分の1サイズ

再帰的推論による予測の洗練

低コストで高性能モデルを実現

性能と適用領域

数独や迷路など構造化パズルに特化

特定ベンチマークで巨大LLMを凌駕

設計の簡素化が汎化性能向上に寄与

コードはMITライセンスで公開中

詳細を見る

韓国 Samsung AI研究所の研究者が、新たな超小型AIモデル「TRM（Tiny Recursion Model）」を発表しました。わずか700万パラメーターのこのモデルは、特定の推論ベンチマークにおいて、OpenAIのo3-miniやGoogleのGemini 2.5 Proなど、1万倍以上巨大なLLMの性能を凌駕しています。AI開発における「スケールこそ全て」という従来のパラダイムに対し、低コストで高性能を実現する新たな道筋を示す画期的な成果です。

TRMの最大の特徴は、階層構造を持つ複雑なネットワークを排除し、単一の2層モデルを採用した点です。このモデルは、入力された質問と初期回答に対し、推論ステップを繰り返して自身の予測を再帰的に洗練させます。この反復的な自己修正プロセスにより、深いアーキテクチャをシミュレートし、巨大モデルに匹敵する推論能力を獲得しています。

TRMは、構造化され、視覚的なグリッドベースの問題に特化して設計されました。特にSudoku-Extremeで87.4%の精度を達成し、従来モデル（HRM）の55%から大幅に向上。また、人間の推論は容易だがAIには難解とされるARC-AGI ベンチマークでも、数百万倍のパラメーターを持つ最上位LLMに匹敵する結果を出しています。

開発者は、高額なGPU 投資と電力消費を伴う巨大な基盤モデルへの依存は「罠」だと指摘します。TRMの成功は、複雑性を減らすことで逆に汎化性能が向上するという「Less is More（少ない方が豊か）」の設計思想を裏付けました。この成果は、大規模な計算資源を持たない企業や研究者でも、高性能AIを開発できる可能性を示唆します。

TRMのコードは、商用利用も可能なMITライセンスのもとGitHubでオープンソース公開されています。これにより、企業は特定の推論タスク解決のために、巨大LLMのAPIを利用するのではなく、自社のサーバーで低コストの専用モデルを構築・運用できます。今後は、再帰的推論のスケーリング則や、生成タスクへの応用が焦点となる見込みです。

出典：VentureBeat

MITとMBZUAIが5年協定、AI基盤強化と地球課題解決へ

2025年10月08日学生ロボティクス MIT 提携基盤モデル教師

連携の核心

AIの基盤強化と応用促進

期間は5年間の国際共同研究

共同研究の重点領域

科学的発見の加速

人間の繁栄への貢献

地球の健康（持続可能性）

プログラム運営体制

研究資金はMBZUAIが支援

両大学から共同責任者を任命

研究成果はオープン公開を原則

詳細を見る

マサチューセッツ工科大学（MIT）のシュワルツマン・コンピューティング・カレッジは、ムハンマド・ビン・ザーイド人工知能大学（MBZUAI、アラブ首長国連邦）との5年間にわたる共同研究プログラムを正式に開始しました。この連携は、AIの技術的基盤を強化するとともに、喫緊の科学的・社会的課題への応用を加速させることを目的としています。国際的なトップレベルの頭脳が結集し、次世代AIの方向性を定める動きとして注目されます。

本プログラムでは、教員や研究者、学生が連携し、主に三つの核となる領域で基礎研究を推進します。それは「科学的発見の加速」「人間の繁栄への貢献」、そして「地球の健康（環境問題や持続可能性）」です。MIT側は「AIが責任ある、包括的かつ世界的に影響力のある形で進化する」という共通のコミットメントを強調しています。

MBZUAIのエリック・シン学長は、この提携が「トランスコンチネンタル（大陸横断的）な発見の橋」を築くと述べています。AI専用の大学であるMBZUAIが持つ基盤モデルや実世界への展開力と、MITが誇る計算科学と学際的なイノベーションの深さを融合させます。これにより、ブレークスルーが人間の健康改善やインテリジェント・ロボティクスなどに直結することが期待されます。

このプログラムは、AI科学を通じた進歩を専門とするアブダビ拠点のMBZUAIからの資金支援を受けて運営されます。毎年多数の共同プロジェクトが資金提供を受け、両大学から選出された運営委員会が研究テーマを決定します。さらに重要な点として、研究成果は原則としてオープンに公開可能であり、広範な知識共有を促進する方針です。

出典：MIT News

AIエージェントの信頼性を劇的向上 AUIが「確実な行動」実現の独自モデル発表

2025年10月07日 Google Amazon 推論ポリシースタートアップエージェントプロンプトベンチマーク基盤モデルトランスフォーマー Intel

現行AIエージェントの課題

タスク完了の信頼性が低い（企業レベル未達）

業界ベンチマークで成功率30〜56%に留まる

純粋な生成AIは「もっともらしいテキスト」を出力

特定の規則やポリシー遵守の「確実性」が欠如

信頼性を生む独自技術

基盤モデル「Apollo-1」を開発

ハイブリッドなニューロ・シンボリック推論を採用

言語能力と構造化された論理を融合

次トークン予測ではなく次アクション予測を実行

性能差が示す実力

TAU-Bench Airlineで92.5%の通過率を達成

既存トップモデルを大幅に上回る

AmazonやGoogle Flightsでのタスク実行も高精度

企業ポリシー遵守をシステムプロンプトで保証

詳細を見る

ステルススタートアップAugmented Intelligence（AUI）は、エンタープライズ向けAIエージェントの信頼性を劇的に高める基盤モデル「Apollo-1」を発表しました。従来のLLMが苦手としていた、タスクの確実な実行という課題を克服するため、独自開発のハイブリッドアーキテクチャを採用し、ベンチマークで圧倒的な性能差を示しています。

従来のLLMは、チャットや探索的な対話では優れた能力を発揮しますが、企業が求める複雑なタスクを確実に実行する能力が不足していました。AIエージェントの性能を測るベンチマーク「Terminal-Bench Hard」では、現在の最高モデルでも成功率は30%台に留まり、ビジネスルールが求められる場面で信頼性に欠ける点が大きな課題でした。

Apollo-1は「ステートフル・ニューロ・シンボリック推論」というハイブリッド構造に基づいています。これは言語の流暢さを担うニューラル層と、意図や制約といった構造化された論理を担うシンボリック層を統合し、タスク実行における「確実性（Certainty）」を保証するためのものです。

Transformerモデルが次のトークンを確率的に予測するのに対し、Apollo-1は会話の中で次に取るべき「アクション」を予測します。この構造により、エンコーダが自然言語をシンボリックな状態に変換し、決定エンジンが次の行動を決定するという、閉じた推論ループを実行。統計的な予測ではなく、決定論的な動作を実現しています。

この決定的な動作は、企業ポリシーの遵守において極めて重要です。例えば、銀行が「200ドル以上の返金には必ずID確認を義務付ける」といった制約を、Apollo-1では「System Prompt（振る舞い契約）」として定義し、確実に実行できます。これは、純粋な生成AIでは保証できない行動の信頼性を実現します。

ベンチマーク結果はその有効性を示しています。航空券予約タスクを評価する「TAU-Bench Airline」において、Apollo-1は92.5%という驚異的な通過率を達成。これは競合するトップモデルの56%を大きく引き離すものであり、金融、旅行、小売など、タスク実行の信頼性が求められる業界での応用が期待されます。

出典：VentureBeat

PowerSchool、SageMakerで実現した教育AI向けコンテンツフィルタリング

K-12教育特化AIの安全確保

K-12教育向けAIアシスタント「PowerBuddy」

歴史教育などでの誤検出（False Positive）を回避

いじめ・自傷行為の即時検知を両立させる必要性

SageMaker活用によるモデル育成

Llama 3.1 8BをLoRA技術で教育特化ファインチューニング

高い可用性とオートスケーリングを要件にSageMakerを採用

有害コンテンツ識別精度約93%、誤検出率3.75%未満

事業へのインパクトと将来性

学校現場での教師の負担を大幅に軽減

将来的にマルチアダプター推論で運用コストを最適化

詳細を見る

教育分野向けのクラウドソフトウェア大手PowerSchoolは、AIアシスタント「PowerBuddy」の生徒安全を確保するため、AWSのAmazon SageMaker AIを活用し、コンテンツフィルタリングシステムを構築しました。オープンな基盤モデルであるLlama 3.1を教育ドメインに特化してファインチューニングし、高い精度と極めて低い誤検出率を両立させ、安全な学習環境の提供を実現しています。

このソリューションが目指したのは「責任あるAI（Responsible AI）」の実現です。ジェネリックなAIフィルタリングでは、生徒が歴史的な戦争やホロコーストのような機微な学術的話題を議論する際に、誤って暴力的コンテンツとして遮断されるリスクがありました。同時に、いじめや自傷行為を示唆する真に有害な内容は瞬時に検知する必要があり、ドメイン特化の調整が不可欠でした。

PowerSchoolは、このカスタムモデルの開発・運用基盤としてAmazon SageMaker AIを選定しました。学生の利用パターンは学校時間帯に集中するため、急激なトラフィック変動に対応できるオートスケーリング機能と、ミッションクリティカルなサービスに求められる高い信頼性が決め手となりました。また、モデルの重みを完全に制御できる点も重要でした。

同社はLlama 3.1 8Bモデルに対し、LoRA（Low Rank Adaptation）技術を用いたファインチューニングをSageMaker上で行いました。その結果、教育コンテキストに特化した有害コンテンツ識別精度は約93%を達成。さらに、学術的な内容を誤って遮断する誤検出率（False Positive）を3.75%未満に抑えることに成功しました。

この特化型コンテンツフィルタリングの導入は、学生の安全を確保するだけでなく、教育現場に大きなメリットをもたらしています。教師はAIによる学習サポートにおいて生徒を常時監視する負担が減り、より個別指導に集中できるようになりました。現在、PowerBuddyの利用者は420万人以上の学生に拡大しています。

PowerSchoolは今後、SageMaker AIのマルチアダプター推論機能を活用し、コンテンツフィルターモデルの隣で、教育ドメインに特化した意思決定エージェントなど複数の小型言語モデル（SLM）を展開する計画です。これにより、個別のモデルデプロイが不要となり、専門性能を維持しつつ大幅なコスト最適化を目指します。

出典：AWS公式

AI動画は物理法則を理解したか？Google論文の検証

2025年10月01日 Google Veo Veo 3 動画生成シミュレーションエンジニア専門家経営者画像動画ロボット基盤モデル Google DeepMind

DeepMindの野心的な主張

Google Veo 3の能力を検証

ゼロショットでのタスク解決を主張

汎用的な視覚基盤モデルへの道筋

見えてきた性能の限界

一部タスクでは高い一貫性

ロボットの動作や画像処理で成功

全体としては一貫性に欠ける結果

「世界モデル」構築はまだ途上

詳細を見る

Google DeepMindが、最新のAI動画モデル「Veo 3」が物理世界をどの程度理解できるかを探る研究論文を発表しました。論文では、Veo 3が訓練データにないタスクもこなす「世界モデル」への道を歩んでいると主張しますが、その結果は一貫性に欠け、真の物理世界のシミュレーション能力には依然として大きな課題があることを示唆しています。

研究者らは、Veo 3が明示的に学習していない多様なタスクを解決できる「ゼロショット学習者」であると主張します。これは、AIが未知の状況に対しても柔軟に対応できる能力を持つことを意味し、将来的に汎用的な視覚基盤モデルへと進化する可能性を示唆するものです。

確かに、一部のタスクでは目覚ましい成果を上げています。例えば、ロボットの手が瓶を開けたり、ボールを投げたり捕ったりする動作は、試行を通じて安定して説得力のある動画を生成できました。画像のノイズ除去や物体検出といった領域でも、ほぼ完璧に近い結果を示しています。

しかし、その評価には注意が必要です。外部の専門家は、研究者たちが現在のモデルの能力をやや楽観的に評価していると指摘します。多くのタスクにおいて結果は一貫性を欠いており、現在のAI動画モデルが、現実世界の複雑な物理法則を完全に理解していると結論付けるのは時期尚早と言えるでしょう。

経営者やエンジニアにとって重要なのは、この技術の現状と限界を冷静に見極めることです。AI動画生成は強力なツールとなり得ますが、物理的な正確性が求められるシミュレーションやロボット工学への応用には、まだ慎重な検証が必要です。

出典：Ars Technica

NVIDIA、ロボット学習を加速する物理エンジン公開

2025年09月30日 Google NVIDIA エコシステムシミュレーションデジタルツイン GPU ロボット基盤モデル Google DeepMind

新物理エンジンNewton

Google、Disneyと共同開発

GPUで高速化されたシミュレーション

複雑な人型ロボットの学習を推進

Linux財団が管理するオープンソース

開発エコシステムの強化

基盤となるOpenUSDフレームワーク

新モデル「Isaac GR00T」も公開

主要ロボット企業が採用を開始

「シム・ファースト」開発の加速

詳細を見る

NVIDIAは今週開催のロボット学習カンファレンスで、Google DeepMindやDisney Researchと共同開発した新しい物理エンジン「Newton」をオープンソースとして公開しました。人型ロボットなど複雑な動作が求められる物理AIの開発を、現実世界での実証前にシミュレーションで高速化・安全化させるのが狙いです。

Newtonは、NVIDIAのGPU高速化技術「Warp」と3Dデータ標準「OpenUSD」を基盤に構築されています。従来の物理エンジンでは限界があった、人型ロボットの持つ多数の関節やバランス制御といった複雑な動きを、より正確かつ高速にシミュレーション上で学習させることが可能です。

ロボット開発では、実機での試行錯誤にかかる時間やコスト、危険性が課題でした。仮想空間で先に訓練を行う「シム・ファースト」のアプローチは、この課題を解決します。OpenUSDで構築された忠実なデジタルツイン環境が、ロボットのスキル獲得を飛躍的に効率化するのです。

この取り組みはNewton単体にとどまりません。ロボット向け基盤モデル「Isaac GR00T」や開発フレームワーク「Isaac Lab」もアップデートされ、包括的な開発エコシステムが強化されています。既にAgility Roboticsなど主要企業が採用しており、その実用性が示されています。

Linux財団が管理するオープンソースとして公開されたことで、Newtonは今後のロボット開発の新たな標準となる可能性があります。開発の参入障壁を下げ、工場や病院など多様な現場で人間と協働するロボットの実現を大きく前進させるでしょう。

出典：NVIDIA公式

PropHero、BedrockでAI投資顧問開発業務効率化とコスト60%削減

2025年09月25日 Amazon AWS 業務効率コンテンツオーストラリア不動産投資エージェント基盤モデル Cohere

詳細を見る

不動産投資管理サービスのPropHero社が、AWSと協業し、生成AIサービス「Amazon Bedrock」を用いてインテリジェントな不動産投資アドバイザーを開発しました。このシステムは、顧客に合わせた投資戦略を自然言語で提案し、業務効率化と大幅なコスト削減を両立した事例として注目されます。導入によるビジネスインパクトは顕著です。AIアドバイザーの投資目標達成率は90%に達し、有料ユーザーの70%以上が積極的に利用しています。また、一般的な問い合わせ対応を30%自動化し、スタッフはより複雑な業務に集中できるようになりました。戦略的なモデル選択により、AIコストも60%削減しています。高い性能とコスト効率はどのように両立したのでしょうか。その鍵は、複数のAIエージェントが協調動作する「マルチエージェント・アーキテクチャ」にあります。各エージェントは、質問の分類、専門的な助言、最終応答の生成など、特定のタスクに特化しており、LangGraphというツールでその連携を制御しています。同社は、タスクの複雑さに応じて最適な基盤モデル（FM）を選択する戦略を採用しました。例えば、簡単な応答には高速で安価な「Amazon Nova Lite」、専門的な投資助言には高性能な「Amazon Nova Pro」を割り当てることで、コストパフォーマンスを最大化しています。高品質な応答を維持するため、継続的な評価システムを組み込んでいます。会話データから「文脈との関連性」や「回答の正確性」といった指標をリアルタイムで測定します。これにより、AIアドバイザーの品質を常に監視し、迅速な改善サイクルを回すことが可能になっています。専門知識の提供には「Amazon Bedrock Knowledge Bases」を活用しています。FAQ形式のコンテンツに最適化されたセマンティックチャンキングや、Cohere社の多言語モデルを採用することで、スペイン語圏の利用者にも正確で文脈に沿った情報を提供できる体制を整えました。開発の背景には、不動産投資における情報格差やプロセスの煩雑さという課題がありました。PropHero社はこれらの障壁を取り除くため、誰でも専門的な知見にアクセスできるAIシステムの開発を目指しました。特にスペインとオーストラリアの市場に合わせた対応が求められていました。本事例は、生成AIが具体的なビジネス価値を生み出すことを明確に示しています。モジュール化されたアーキテクチャと堅牢な評価基盤を組み合わせることで、顧客エンゲージメントを継続的に向上させるソリューションを構築できるのです。

出典：AWS公式

Amazon、出品者向けAIエージェント拡充在庫管理から広告生成まで自動化

Agentic AI「Seller Assistant」進化

アカウント状態と在庫レベルを常時監視

売れ行き不振商品の価格変更や削除を推奨

需要パターンに基づき出荷を自動提案

新製品安全規制などコンプライアンスを自動チェック

AI広告チャットボットの導入

テキストプロンプトで静止画・動画広告を生成

ブランドガイドラインを反映したクリエイティブの自動作成

タグライン、スクリプト、ボイスオーバーの生成

Amazon外のメディア（Prime Video等）への広告展開

詳細を見る

Amazonは2025年9月、プラットフォーム上のサードパーティ出品者向けに、自律的に業務を代行するエージェントAI機能の導入・拡張を発表しました。既存の「Seller Assistant」を強化し、さらにAI広告作成チャットボットを提供します。これにより、在庫管理、コンプライアンス遵守、広告クリエイティブ制作などの広範な業務が自動化され、出品者の生産性と収益性の最大化を図ります。

拡張されたSeller Assistantは「常時稼働」のAIエージェントとして機能します。これは単なるツールではなく、セラーに代わってプロアクティブに働きかけることを目的としています。ルーティン業務から複雑なビジネス戦略までを自動で処理し、出品者は商品開発や事業成長といったコア業務に集中できる体制を構築します。

特に注目されるのが在庫管理の最適化機能です。エージェントは在庫レベルを継続的に監視し、売れ行きの遅い商品を自動的に特定します。これにより、長期保管料が発生する前に価格の引き下げや商品の削除を推奨。また、需要パターンを分析し、最適な出荷計画を立てるサポートも行います。

複雑化する規制への対応も自動化します。Seller Assistantは、出品リストが最新の製品安全性ポリシーに違反していないかをスキャンするほか、各国で販売する際のコンプライアンス要件への適合を自動で確保します。これはグローバル展開を志向するセラーにとって大きなリスク低減となります。

同時に導入されたAI広告チャットボットは、クリエイティブ制作の時間とコストを大幅に削減します。出品者が求める広告の概要をテキストで入力するだけで、AIがブランドガイドラインや商品詳細に基づき、静止画や動画のコンセプトを自動で生成します。

このチャットボットは、タグラインや画像だけでなく、スクリプト作成、音楽追加、ボイスオーバー、絵コンテのレイアウトまでを完結できます。生成された広告は、Amazonのマーケットプレイス内だけでなく、Prime VideoやKindle、TwitchといったAmazonの広範なプロパティに展開され、露出を最大化します。

これらの新機能は、Amazon独自の基盤モデルであるNova AI、およびAnthropicのClaudeを活用しています。今回の発表は、AIが商取引を主体的に推進する「エージェント主導型コマース」の流れを加速させています。Googleなども同様にエージェントによる決済プロトコルを公開しており、AIによる業務代行競争が本格化しています。

出典：The Verge | TechCrunch

QuoraのPoe、AWS BedrockでAIモデル統合を96倍高速化

2025年09月16日 Amazon AWS Poe 生産性エンジニア認証画像動画デプロイ投資基盤モデル

開発生産性の劇的向上

デプロイ時間を96倍高速化（数日→15分）。

必須コード変更を95%削減。

テスト時間を87%短縮。

開発リソースを機能開発へ集中。

統一アクセスレイヤーの構築

異なるAPI間のプロトコル変換を実現。

設定駆動型による迅速なモデル追加。

認証（JWTとSigV4）のブリッジング機能。

マルチモデル戦略の強化

30以上のテキスト/画像モデル統合。

設定変更でモデル能力を拡張可能に。

詳細を見る

QuoraのAIプラットフォーム「Poe」は、Amazon Web Services（AWS）と協業し、基盤モデル（FM）のデプロイ効率を劇的に改善しました。統一ラッパーAPIフレームワークを導入した結果、新規モデルのデプロイ時間が数日からわずか15分に短縮され、その速度は従来の96倍に達しています。この成功事例は、複数のAIモデルを大規模に運用する際のボトルネック解消法を示しています。

Poeは多様なAIモデルへのアクセスを提供していますが、以前はBedrock経由の各モデルを統合するたびに、独自のAPIやプロトコルに対応する必要がありました。Poeはイベント駆動型（SSE）、BedrockはRESTベースであり、この違いが膨大なエンジニアリングリソースを消費し、新しいモデルの迅速な提供が課題となっていました。

AWSのGenerative AI Innovation Centerとの連携により、PoeとBedrockの間に「統一ラッパーAPIフレームワーク」を構築しました。この抽象化レイヤーが、異なる通信プロトコルのギャップを埋め、認証や応答フォーマットの違いを吸収します。これにより、「一度構築すれば、複数のモデルを展開可能」な体制が確立されました。

この戦略の結果、新規モデルを統合する際の必須コード変更量は最大95%削減されました。エンジニアの作業内容は、以前の65%がAPI統合だったのに対し、導入後は60%が新機能開発に集中できるようになりました。この生産性向上により、Poeはテキスト、画像、動画を含む30以上のBedrockモデルを短期間で統合しています。

高速デプロイの鍵は、「設定駆動型アーキテクチャ」です。新しいモデルの追加には統合コードの記述は不要で、設定ファイルへの入力のみで完結します。さらに、Bedrockが導入した統一インターフェース「Converse API」を柔軟に活用することで、チャット履歴管理やパラメーター正規化が容易になり、統合作業がさらに簡素化されました。

本フレームワークは、マルチモーダル機能の拡張にも貢献しています。例えば、本来テキスト専用のモデルに対しても、Poe側が画像を分析しテキスト化することで、擬似的な画像理解能力を付与できます。これにより、基盤モデルのネイティブな能力によらず、一貫性のあるユーザーエクスペリエンスを提供可能になりました。

本事例は、AIモデル活用の競争優位性を得るには、個別のモデル連携に時間を使うのではなく、柔軟な統合フレームワークへの初期投資が極めて重要であることを示唆しています。抽象化、設定駆動、堅牢なエラー処理といったベストプラクティスは、AIを大規模展開し、市場価値を高めたい組織にとって必須の戦略となるでしょう。

出典：AWS公式

NVIDIAが英国の「AIメーカー」戦略を加速物理AI・創薬・ロボティクス分野で広範に連携

英国の国家AI戦略を支援

英国のAI機会行動計画を後押し

世界クラスの計算基盤への投資

AI採用を全経済分野で推進

AIユーザーでなくAIメーカーを目指す

重点分野での協業事例

スパコン「Isambard-AI」で基盤構築

ロボティクス：自律走行、製造、ヒューマノイド開発

ライフサイエンス：AI創薬、デジタルツインを活用

エージェントAI：金融、音声、カスタマーサポートを自動化

詳細を見る

NVIDIAは英国のAIエコシステムとの広範なパートナーシップを強調し、英国の国家戦略である「AIメーカー」としての地位確立を強力に支援しています。ジェンスン・ファンCEOの英国訪問に際し、物理AI、ロボティクス、ライフサイエンス、エージェントAIなど最先端領域における具体的な協業事例が公表されました。

英国のAI基盤強化の核となるのは、NVIDIA Grace Hopper Superchipsを搭載した国内最速のAIスーパーコンピューター「Isambard-AI」です。これにより、公的サービスの改善を目指す独自の多言語LLM（UK-LLM）や、早期診断・個別化医療に向けた医療用基盤モデル（Nightingale AI）など、重要な国家プロジェクトが推進されています。

特に物理AIとロボティクス分野での応用が加速しています。Extend Roboticsは製造業向けに安全なロボット遠隔操作システムを開発。Humanoid社は倉庫や小売店向けの汎用ヒューマノイドロボットを開発しており、いずれもNVIDIAのJetsonやIsaacプラットフォームが活用されています。

ライフサイエンス分野では、AIによる創薬の加速が目覚ましいです。Isomorphic LabsはAI創薬エンジンを構築し、英国CEiRSIはNVIDIA技術を用いて複雑な患者のデジタルツインを作成。これにより、大規模かつ多様な患者集団に対する新しい治療法のテストを可能にしています。

エージェントAIおよび生成AIのイノベーションも活発です。Aveniは金融サービスに特化したLLMを開発し、コンプライアンスを確保しながら顧客対応やリスク助言を行うエージェントフレームワークを構築しました。ElevenLabsやPolyAIは、超リアルな音声生成や、大規模な顧客サポート自動化を実現しています。

また、AIスキルギャップ解消への取り組みも重要です。技術ソリューションプロバイダーのSCANは、NVIDIA Deep Learning Instituteと連携し、コミュニティ主導型のトレーニングプログラムを展開しています。これにより、英国全土でAIや専門的なワークロードに対応できる人材育成が進められています。

出典：NVIDIA公式

Google、生成AI「LearnLM」で学習効果11%向上へ

2025年09月16日 Google Gemini 生産性検索 AI活用コンテンツ音声インド基盤モデル

学習効果を高めるAI基盤

独自AIモデル「LearnLM」を活用

教育学に基づきコンテンツを再構築

最新のGemini 2.5 Proに統合

静的な教科書を対話型ガイドに変換

個々人に合わせた学習体験

学習者のレベルや興味に応じて内容を適応

マインドマップや音声レッスンを生成

リアルタイムフィードバック付きの対話型クイズ

長期記憶テストで11%のスコア向上

詳細を見る

Googleは、教育分野における生成AI活用実験「Learn Your Way」を発表しました。独自AIモデル「LearnLM」を基盤とし、静的な教科書を学習者の興味やレベルに合わせた対話型コンテンツに変革します。学習科学に基づいて設計されたこのツールは、従来のデジタル教材利用者と比較して長期記憶テストで11%のスコア向上を実現しました。

Learn Your Wayの中核となるのは、教育学（ペダゴジー）が注入された特化型モデルLearnLMです。これは現在、Googleの高性能基盤モデルGemini 2.5 Proに直接統合されています。単なる情報検索ではなく、学習プロセス全体にAIを深く関与させ、指導のエッセンスを組み込むことが特徴です。

具体的な機能として、AIは元の教材に基づき、マインドマップ、オーディオレッスン、そしてリアルタイムフィードバック付きのインタラクティブなクイズなどを生成します。これにより、学習者が自身のペースやスタイルで能動的に学びを進められる、自己主導的な学習環境を提供します。

この実証実験で示された11パーセントポイントという記憶定着率の向上は、企業研修や高度な専門知識の習得において、極めて重要な意味を持ちます。生産性向上を目指す経営層やリーダーにとって、特化型AIが教育・トレーニングにもたらす革新性を示す明確な事例として注目されます。

出典：Google公式

DeepMind、年間1.4兆エンベディングで地球をデータ化するAI公開

2025年09月15日 Google ワークフローリスクリスクモデルインフラ画像ベンチマーク基盤モデル教師 Google DeepMind

地球動態把握AIの核心

Google DeepMindが開発した基盤モデル

衛星データなどから地球を統一デジタル表現化

10m四方のセルごとに64次元のエンベディング生成

年間1.4兆超の緻密なデータ要約

技術的優位性と応用範囲

従来のストレージ要件を16分の1に大幅削減

競合比でエラー率23.9%減を達成

ラベルデータが少ない状況でも高精度な分類を実現

都市計画や山火事リスク管理など広範に適用

詳細を見る

Google DeepMindは、地球の広範な変化を高精度に追跡するAIモデル「AlphaEarth Foundations」を発表しました。このモデルは地球を「生きたデータセット」として捉え、衛星画像やセンサーデータなど多様な情報を統合します。年間1.4兆を超えるエンベディングを生成し、従来困難だった地球規模のデジタル表現と分析を革新します。

AlphaEarthの核心技術は、地球上の10m四方のセルごとに64次元の「エンベディング（数値要約）」を作成する点です。これにより、膨大な地理空間データを統一的に扱えるようになりました。この緻密なアプローチにより、ストレージ要件を従来の16分の1にまで削減しつつ、高い空間的・時間的な詳細度を維持しています。

地球観測における長年の課題であった、衛星データの不規則性や雲による欠損を本モデルは克服しています。光学画像だけでなく、レーダー、気候モデル、さらには地理タグ付きのWikipedia情報まで組み込むことで、マルチソース・マルチレゾリューションな一貫性のあるデータセットを構築しています。

ベンチマークテストの結果、AlphaEarthは競合する既存のアプローチと比較して、平均で23.9%低いエラー率を記録しました。また、ラベルデータが非常に少ない状況下でも高精度な分類を可能にし、通常数千のラベルを必要とするタスクで、少数のサンプルで87種の農作物や土地被覆タイプを特定できています。

この技術は、都市計画やインフラ管理、生態系追跡といった幅広い分野で即戦力となります。特にビジネス領域では、保険会社や通信会社などが空間分析プラットフォームCARTOを経由して利用を開始しています。

これにより、APIや追加ストレージなしで山火事リスクの高い地域を特定するなど、迅速なリスクモデル構築が可能になります。自社の既存ワークフローにエンベディングをロードするだけで、高度な環境プロファイリングが可能になる点がメリットです。

AlphaEarthは、パターンを学習しコンパクトに要約する自己教師あり学習フレームワークであり、生成モデルではありません。非営利利用向けにGoogle Earth Engineデータカタログを通じて無償提供されており、国連食糧農業機関（FAO）を含む世界50以上の組織が既に活用を進めています。

出典：spectrum.ieee.org

AIブームが巨大企業を置き去りにする可能性

2025年09月14日 OpenAI Anthropic Gemini Claude GPT-5 創業者強化学習ファインチューニング事前学習事後学習リスクインフラスタートアップブランド基盤モデル

基盤モデルの価値変化

基盤モデルはコモディティ化へ

事前学習の効果が鈍化

事後学習と強化学習へ注目が移行

競争環境の変化

アプリケーション層での競争が激化

オープンソース代替案の台頭

低マージン事業への転落リスク

企業戦略の再構築

ファインチューニングとUI設計が重要

基盤モデル企業の優位性は縮小

新たな競争優位性の模索が必要

詳細を見る

AIブームが進む中、基盤モデルを開発する巨大企業が置き去りにされる可能性が浮上している。かつては「GPTラッパー」と軽視されたAIスタートアップが、特定タスク向けのモデルカスタマイズやインターフェース設計に注力し始めたからだ。

基盤モデルの価値が変化している背景には、事前学習のスケーリング効果が鈍化している事実がある。AIの進歩は止まっていないが、超大規模モデルの初期利益は減少し、事後学習や強化学習が新たな進化の源泉となっている。

競争環境も変化している。スタートアップはGPT-5、Claude、Geminiなど基盤モデルを互換性のある部品として扱い、ユーザーが気づかない間にモデルを切り替えることを前提に設計している。

この状況は、OpenAIやAnthropicのような基盤モデル企業を低マージンのコモディティ事業のバックエンドサプライヤーに変えるリスクをはらんでいる。ある創業者はこれを「スターバックスにコーヒー豆を売るようなもの」と表現した。

もちろん、基盤モデル企業が完全に脱落するわけではない。ブランド力、インフラ、巨額の資金など持続的な優位性も存在する。しかし、昨年までの「より大きな基盤モデルを構築する」という戦略は魅力を失いつつある。

AI開発の速いペースを考えると、現在の事後学習への注目も半年後には逆転する可能性がある。最も不確実なのは、汎用人工知能への競争が医薬品や材料科学で新たなブレークスルーを生み出す可能性だ。

結局のところ、AIの価値は基盤モデル自体ではなく、それを活用するアプリケーションやユーザー体験に移行しつつある。企業はこの変化に適応し、新たな競争優位性を築く必要に迫られている。

出典：TechCrunch

基盤モデル（LLM技術）に関するニュース一覧

基盤モデル（LLM技術）に関するニュース一覧

VC基金の投資方針

Builders支援プログラム

エコシステム戦略の狙い

物理AIの新基盤

デジタルツイン実用化

産業ロボット連携拡大

Apex 1.0の性能

ポストトレーニング戦略

事業への影響

連合の概要と初動

業界リーダーの展望

提携の概要

業界の提携加速

モデルの特徴

性能と実用性

AI市場の競争構造

寡占化の背景と展望

開発基盤の全体像

シミュレーションと学習

実機展開と安全性

Forgeの主要機能

競合との差別化戦略

Perch 2.0の成果

鳥とクジラの共通性

創薬へのAI活用

製造・診断への展開

データセットと規模

基盤AIモデル2種

買収と技術の概要

業界への波及と課題

モデルと創作ツール

グローバル戦略と社会実装

Glazeの基本機能

事業戦略と展望

手法の核心

応用と展望

主要メンバーの相次ぐ離脱

Alibabaの組織再編と戦略転換

オープンソースAIへの影響

消滅する二つのAIビジネスモデル

生き残るAIスタートアップの条件

無料LLMファインチューニングの実現

エコシステムへの影響

急速な資金調達

研究者起業の勝機

モデルの革新性

金融AIへの示唆

NEXUS技術と調達

データ分析市場への影響

研究の主要発見

実践的な示唆

両社にとっての意義

Cosmos Reason 2とAlpamayoの革新

NvidiaがロボティクスのAndroidを目指す

企業が注目すべき4大研究トレンド

OpenAIの音声AI戦略と脱スクリーン

2025年AI業界の総評

VCの2026年エンタープライズAI予測

相次ぐ大型資金調達

消費者AI vs. エンタープライズAI：VCの視点

車両制御と統合する独自AI

エッジとクラウドの最適化

AmazonのAI戦略と課題

AI脆弱性とDOGEの真実

ラスベガスで年次総会が開幕

注目の基調講演スケジュール

特化型AI構築サービス

新モデル「Nova」4種

AWSのAI戦略

AIとインフラの最新動向

基調講演と視聴方法

コンテキスト制限の壁

2段階の解決アプローチ

人間の作業フローを模倣

汎用から特化型へのシフト

先行企業の導入成果

圧倒的なデータと学習基盤

概念を理解する高度な推論