NVIDIA、次世代AI基盤Vera Rubinと1兆ドル売上見通しを発表

Vera Rubin全貌

7チップ統合の新プラットフォーム
専用CPU「Vera」とBlueField-4搭載
次世代Feynmanアーキテクチャも予告
宇宙データセンター構想を公開

エージェントAI戦略

OpenClaw対応を全社に要求
NemoClawでエージェント安全運用
Nemotron Coalitionで6モデル群展開

産業・医療への展開

BYD・日産ら自動運転提携
IGX Thorで手術ロボット本格化
AWSMicrosoft大規模GPU展開

NVIDIAは2026年3月16日、サンノゼで開催したGTC 2026の基調講演で、創業者兼CEOのジェンスン・ファン氏が次世代フルスタックAIプラットフォーム「Vera Rubin」を発表し、2025年から2027年にかけて少なくとも1兆ドルの売上を見込むと宣言しました。

Vera Rubinは7つのチップ、5つのラックスケールシステム、1台のスーパーコンピュータで構成されるエージェントAI向け統合プラットフォームです。専用CPU「Vera」と新ストレージ基盤「BlueField-4 STX」を搭載し、さらに次世代アーキテクチャ「Feynman」や宇宙AI「Space-1」構想も予告されました。

エージェントAI分野では、オープンソースのOpenClawを全企業が戦略として持つべきだと強調し、エンタープライズ向けにポリシー制御やガードレールを備えた「NemoClaw」スタックとOpenShellランタイムを発表しました。DGX SparkやDGX Stationと組み合わせ、デスクトップで自律エージェントを安全に構築・運用できる環境を提供します。

クラウド基盤ではAWS100万台超のNVIDIA GPUを展開する大型提携を発表し、MicrosoftもAzureデータセンターにVera Rubin NVL72を世界初導入しました。物理AI領域ではBYD、日産、現代、吉利が自動運転プラットフォームに参画し、Uberとのロボタクシー配車連携も明らかになりました。

医療分野では初のヘルスケア特化型物理AIプラットフォームを公開し、外科手術ロボット向けにCosmos-HやGR00T-Hなどのモデル群を整備しました。Johnson & JohnsonやCMR Surgicalが早期採用を表明しています。さらにAlphaFoldタンパク質構造データベースの大規模拡張や、Nemotronモデルによるデジタルヘルスエージェントの構築支援など、ライフサイエンス領域でも多数の発表がありました。

オープンモデル戦略では「Nemotron Coalition」を立ち上げ、言語・推論ワールドモデルロボティクス、自動運転、バイオ、気象の6つのフロンティアモデル群でパートナーを結集しました。基調講演ではディズニーのオラフが物理AIで自律歩行するデモで締めくくり、シミュレーションから現実世界への移行を印象づけました。

Mistral、推論・視覚・コード統合の小型モデルSmall 4公開

Small 4の特徴

Apache 2.0で公開
総パラメータ1190億、活性60億
128エキスパートのMoE構成

推論コスト削減

出力が他モデルより大幅に短い
推論努力を動的に調整可能
H100×4台で運用可能

ベンチマーク性能

MMLU ProでMistral Large 3に迫る性能
GPT-OSS 120BをLCRで上回る

Mistralは2026年3月、推論・マルチモーダル・エージェントコーディングの3機能を統合した小型オープンソースモデルSmall 4」を公開しました。Apache 2.0ライセンスで提供され、企業が複数モデルを使い分ける必要性を解消することを目指しています。

Small 4はMixture-of-Experts(MoE)アーキテクチャを採用し、総パラメータ数1190億のうち、トークンあたりの活性パラメータはわずか60億に抑えられています。128のエキスパートから各トークンで4つが選択される設計により、効率的なスケーリングと専門化を実現しています。

新たに導入された「reasoning_effort」パラメータにより、ユーザーは推論の深さを動的に調整できます。軽量な高速応答からMagistralのようなステップバイステップの詳細推論まで、用途に応じた切り替えが可能です。256Kのコンテキストウィンドウも長文分析に対応します。

ベンチマークでは、MMLU ProMistral Medium 3.1やMistral Large 3に迫る性能を示しました。一方、LiveCodeBenchではQwen 3.5 122BやClaude Haikuに及ばない結果も出ています。ただしSmall 4はインストラクトモードで最短の出力長(2.1K文字)を記録し、推論コスト面での優位性を主張しています。

小型言語モデル市場のNeurometric社CEOロブ・メイ氏は、Small 4のアーキテクチャの柔軟性を評価しつつも、小型モデル市場の断片化リスクを指摘しました。企業がAIモデルを選定する際には「信頼性と構造化出力」「レイテンシと知能の比率」「ファインチューニング可能性とプライバシー」の3つの柱を優先すべきだと述べています。

トランプ政権、州AI規制を無効化する連邦統一法案の枠組み公表

連邦一元化の骨子

州のAI開発規制を禁止
7つの重点目標でイノベーション優先
新たな連邦規制機関の設置見送り
開発者第三者行為への免責

子どもの安全と著作権

保護者に安全管理の責任を移転
年齢確認の義務化を提案
著作権問題は司法判断に委ねる方針

言論と政治的背景

政府によるAI検閲の禁止を明記
Anthropic排除と矛盾する構造

トランプ政権は2026年3月20日、AI規制に関する連邦統一の立法枠組みを公表しました。7つの重点目標を掲げ、州ごとに異なるAI規制法を連邦法で無効化し、全米統一のルールを確立する方針を示しています。

枠組みの最大の特徴は、AI開発の規制権限を州から連邦政府に集約する点です。AI開発は「本質的に州を超える問題」であり国家安全保障に関わるとして、州による独自規制を明確に排除しています。ニューヨーク州のRAISE法やカリフォルニア州のSB-53など、先行する州法への影響が懸念されます。

子どもの安全については、プラットフォーム企業への義務づけではなく、保護者によるアカウント管理やデバイス制御を重視する方針を打ち出しました。性的搾取防止機能の実装を企業に求めるものの、「商業的に合理的な範囲」という留保をつけ、明確な強制力は持たせていません。

著作権問題では、AIモデルの学習におけるフェアユースを支持しつつも、最終判断は裁判所に委ねるとしました。また、AI生成によるディープフェイクから個人の肖像・声を保護する連邦枠組みの検討や、AI悪用詐欺への法執行強化にも言及しています。

言論の自由に関しては、政府がAI企業に対し「党派的・イデオロギー的な理由でコンテンツの削除や変更を強制」することを禁じるよう議会に求めました。一方で、トランプ大統領自身がAnthropicを「急進左派」と呼び政府調達から排除した経緯があり、ホワイトハウスAI責任者のデビッド・サックス氏が大手テック企業寄りとの批判も出ています。

データセンター建設については、連邦許認可の迅速化を推進する一方、近隣住民の電気料金上昇を防ぐ措置を議会に求めました。枠組み全体として、規制よりも成長促進を優先する「軽量規制」路線が鮮明であり、業界からは歓迎の声が上がる一方、独立した監視機関や責任追及の仕組みが欠如しているとの指摘が相次いでいます。

Google検索がAIで見出しを無断書き換え、実験を開始

書き換えの実態

検索結果の見出しをAI生成に置換
元記事の意味が改変される事例
ニュース以外のサイトも対象
Discoverに続き通常検索にも拡大

報道への影響

編集権の侵害との批判
誤解を招く見出しで信頼性低下
正式機能化の前例あり
15年の編集経験でも前例なし

Google検索結果に表示されるニュース記事の見出しを、AIが生成したものに無断で置き換える実験を開始したことが明らかになりました。米メディアThe Vergeが自社記事の見出しが書き換えられている複数の事例を確認し、報じています。

The Vergeの記事「あらゆる不正に使えるAIツールを試した」という見出しは、わずか5語の「'Cheat on everything' AIツール」に短縮され、まるで製品を推奨しているかのような印象に変えられていました。Googleはこれを「小規模で限定的な実験」と説明しています。

Googleの広報担当者は、ユーザーの検索クエリに合致するタイトルを特定し、エンゲージメントを向上させることが目的だと説明しました。ニュースサイトに限らず、あらゆるウェブサイトを対象に水平的な改善を検討しているとしています。

しかしGoogleは以前、Google DiscoverでのAI見出し書き換えも当初「実験」と説明していましたが、1カ月後には「ユーザー満足度で好成績」として正式機能に格上げした前例があります。今回も同様に拡大される可能性が指摘されています。

見出しの改変は、ジャーナリズムの信頼性を損なう行為だとThe Vergeは批判しています。権力機関がメディアの信用を失墜させようとし、多くの報道機関が経営難に陥っている時期に、検索プラットフォームが記事の意味を変えることは深刻な問題です。従来のSEO対策では見出しの一部切り取りはあったものの、AI生成による完全な書き換えは前例がないとしています。

Anthropic、軍事AIへの妨害能力を法廷で全面否定

技術的に不可能と主張

キルスイッチ不在を宣誓供述
エアギャップ環境で遠隔操作不能
更新には国防総省の承認が必要
ユーザーの入力データも閲覧不可

交渉経緯の矛盾を指摘

指定翌日に「非常に近い」とメール
自律兵器・監視の2論点でほぼ合意
妨害懸念は交渉中に未提示
3月24日にサンフランシスコで審理

憲法訴訟の行方

サプライチェーンリスク指定の撤回求める
国防総省は安全保障上の判断と反論

Anthropicの公共部門責任者ティアグ・ラマサミー氏は2026年3月20日の裁判所提出文書で、同社が米軍に導入済みのAIモデルClaudeを妨害する技術的能力を持たないと宣誓供述しました。国防総省によるサプライチェーンリスク指定への反論です。

ラマサミー氏によると、Claudeは政府のエアギャップ環境に配備されており、Anthropic社員がシステムにログインしてモデルを変更・無効化することは不可能です。リモートキルスイッチやバックドアは存在せず、更新には国防総省とクラウド事業者双方の承認が必要だと説明しています。

政策責任者のサラ・ヘック氏は、Anthropicが軍事作戦への拒否権を求めたという政府の主張を否定しました。さらに、サプライチェーンリスク指定の翌日に国防次官が「非常に近い」と評価するメールをCEOに送っていた事実を公開し、指定の正当性に疑問を投げかけています。

Anthropicは3月4日の契約案で、合法的な軍事作戦の意思決定に対する管理権や拒否権を求めないことを明文化する用意があったと主張しています。自律兵器と米国民の大量監視に関する懸念に対応する文言も受け入れる姿勢でしたが、最終的に交渉は決裂しました。

国防総省は第三者クラウド事業者と連携し、Anthropic経営陣が既存のClaudeシステムに一方的な変更を加えられないよう追加措置を講じていると表明しています。一方、Anthropic米国企業初のサプライチェーンリスク指定が憲法修正第1条に違反するとして2件の訴訟を提起しており、3月24日のサンフランシスコ連邦地裁の審理が注目されています。

OpenAI、デスクトップ統合「スーパーアプリ」を開発中

統合アプリの全容

ChatGPTCodex・Atlasを一本化
製品の分散化が品質低下の要因
モバイル版ChatGPT変更なし

競争環境と戦略転換

Anthropicとの競争が激化
Claude Codeの人気急上昇が背景
Codexへの集中投資を明言
「副次的探索」の縮小を指示

OpenAIは、ChatGPTアプリ、AIコーディングツール「Codex」、AIブラウザ「Atlas」を統合したデスクトップ向け「スーパーアプリ」の開発を進めていることが、米ウォール・ストリート・ジャーナルの報道で明らかになりました。アプリケーション部門CEOのフィジ・シモ氏が社内メモで方針を示しています。

シモ氏はメモの中で、製品の分散化が「開発速度を低下させ、求める品質基準の達成を困難にしている」と指摘しました。同社は昨年、動画生成AI「Sora」の発表やジョニー・アイブ氏のAIハードウェア企業買収など派手な展開を見せていましたが、戦略の再集中が急務となっています。

背景にはAnthropicとの競争激化があります。特にClaude Codeの急速な普及がOpenAIにとって脅威となっており、経営陣は優先度の低い取り組みの見直しを進めています。シモ氏は従業員に対し「副次的な探索に気を取られないように」と呼びかけました。

シモ氏はX(旧Twitter)への投稿で「企業には探索のフェーズと再集中のフェーズがあり、どちらも重要だ」と述べた上で、「Codexのように新しい賭けが成果を出し始めた今こそ、集中投資すべき時だ」と強調しました。

なお、モバイル版ChatGPTについては今回の統合の対象外とされています。OpenAIの広報担当者はコメントを控えており、統合アプリの具体的なリリース時期は明らかになっていません。今後のデスクトップ体験の大幅な刷新が見込まれます。

Scale AI、音声AI初の実世界ベンチマーク公開

評価手法の革新

60言語超の実音声で評価
利用中会話から盲検比較実施
投票後に選択モデルへ自動切替
合成音声でなく実環境音声使用

主要モデルの実力

音声認識はGemini 3 Proが首位
音声対話はGPT-4o Audioが優勢
Grok Voiceが補正後に急浮上
Qwen 3 Omniが知名度以上の健闘

浮き彫りの課題

非英語で応答言語が切替わる欠陥
同一モデル内で音声選択により勝率30pt差
会話が長引くと内容品質が急劣化

Scale AIは2026年3月18日、音声AIモデルを実際の人間の会話データで評価する世界初のベンチマークVoice Showdown」を公開しました。60言語以上、数千件の自発的音声会話から収集した選好データに基づき、既存の合成音声ベンチマークでは見落とされてきた能力差を明らかにしています。

評価はScale AIChatLabプラットフォーム上で行われます。ユーザーはフロンティアモデルを無料で利用でき、音声プロンプトの5%未満の頻度で匿名の2モデル比較が提示されます。投票後は選んだモデルに切り替わるため、誠実な投票が動機づけられる設計です。

音声認識(Dictate)部門ではGemini 3 ProGemini 3 Flashが統計的に同率首位となり、GPT-4o Audioが3位に続きました。音声対話(S2S)部門ではスタイル補正後にGPT-4o Audioが首位、Grok Voiceが僅差の2位に浮上しています。オープンウェイトQwen 3 Omniは両部門で4位と健闘しました。

最も深刻な発見は多言語対応脆弱性です。OpenAIのGPT Realtime 1.5はヒンディー語やスペイン語など公式対応言語でも約20%の確率で英語で応答してしまいます。また同一モデル内でも音声の選択により勝率が30ポイントも変動することが判明しました。

さらに会話が長くなるにつれ内容品質の劣化が主要な失敗要因となることが示されました。1ターン目では品質起因の失敗が23%ですが、11ターン以降は43%に急増します。Scale AIは今後、リアルタイムの全二重通話評価モードの追加を予定しており、音声AI評価の新たな業界標準となることが期待されます。

NVIDIA、多言語・マルチモーダル対応のAI安全モデルを公開

モデルの特徴

140以上の言語に対応
画像とテキストの複合判定
Gemma-3 4B基盤で軽量高速
文化的文脈を考慮した安全判定

性能と実用性

有害コンテンツ検出精度84%
競合モデルの約半分の遅延
12言語で安定した精度を維持
8GB VRAMGPUで動作可能

NVIDIAは2026年3月20日、マルチモーダル・多言語対応のコンテンツ安全モデル「Nemotron 3 Content Safety 4B」をHugging Faceで公開しました。従来の英語中心・テキストのみの安全モデルが抱えていた文化的ニュアンスの見落としを解消することを目指しています。

同モデルはGemma-3 4B-ITビジョン言語基盤モデル上に構築され、LoRAアダプターで安全分類機能を追加しています。テキスト・画像またはその両方を入力として受け取り、安全・危険の判定を出力します。アシスタント応答が含まれる場合はやり取り全体の文脈を評価し、複合的に生じる違反も検出できます。

訓練データにはNemotron Safety Guard Dataset v3の文化的に適応された多言語データ、人手でアノテーションされたマルチモーダルデータ、合成データなどが含まれます。英語データは日本語・中国語・韓国語を含む12言語に翻訳され、実運用環境を反映した多言語カバレッジを実現しています。

ベンチマーク評価では、Polyguard・VLGuard・MM SafetyBenchなど主要テストで平均84%の精度を達成し、同規模のオープン安全モデルを上回りました。さらにポルトガル語やロシア語など訓練外言語でも強力なゼロショット汎化性能を示しています。推論遅延は大型モデルの約半分で、エージェントループやリアルタイム用途にも適しています。

4月にはNVIDIA NIMとしても提供予定で、GPU最適化された推論マイクロサービスとして本番環境への迅速な導入が可能になります。企業のAIエージェントやグローバルサービスにおけるコンテンツモデレーション基盤として、実用性の高い選択肢となりそうです。

a16z、AIがBPO業界3000億ドル市場を分解と分析

BPO業界へのAI影響

3000億ドル規模のBPO市場が対象
AIが従来型アウトソーシングを代替
業務プロセスのアンバンドルが加速

VC視点の市場展望

a16zがBPO再編の投資機会を指摘
AIエージェントが個別業務を自動化
スタートアップ参入の好機と分析

Andreessen Horowitza16zは、AIが3000億ドル規模のBPO(ビジネス・プロセス・アウトソーシング)業界を根本から変革しつつあると分析しています。従来一括で外注されていた業務が、AIによって個別に分解・自動化される動きが加速しています。

BPO業界では、コールセンター対応やデータ入力、経理処理など多様な業務が大手ベンダーにまとめて委託されてきました。しかしAIエージェントの進化により、これらの業務を個別に自動化できるようになり、従来の一括委託モデルが崩れ始めています。

a16zはこの構造変化を「アンバンドリング」と表現し、スタートアップにとって大きな参入機会が生まれていると指摘しています。特定の業務領域に特化したAIソリューションが、既存の大手BPO企業のシェアを奪う可能性があります。

企業にとっては、BPOコストの大幅削減と業務品質の向上が同時に期待できます。AIが定型業務を処理し、人間はより付加価値の高い判断業務に集中できる体制への移行が進んでいます。

この動きは、AI活用を検討する経営者やリーダーにとって、自社のアウトソーシング戦略を見直す契機となります。どの業務をAIに置き換え、どの業務を人間が担うべきか、改めて検討する必要があります。

AI最大の投資先はエネルギー技術との調査報告

電力不足の深刻化

DC計画の半数に遅延リスク
190GW計画中建設中は5GWのみ
2030年までに電力需要175%増の予測

大手の電力戦略

Googleが風力・太陽光・蓄電池を併用
Form Energyの100時間蓄電池に大型投資
オンサイト電源・ハイブリッド方式が拡大

注目の新技術

固体変圧器スタートアップ投資集中
米国の蓄電容量が65GWに到達見込み

Sightline Climateの調査によると、発表済みデータセンター計画の最大50%が遅延する可能性があり、最大の原因は電力供給の不足であることが明らかになりました。AI投資の最善策はエネルギー技術かもしれないと報告書は指摘しています。

同社が追跡する190ギガワット分のデータセンター計画のうち、実際に建設中なのはわずか5ギガワットです。2025年には約36%のプロジェクトでスケジュールの遅延が発生しており、この供給不足は企業のAI活用にも波及する恐れがあります。

Googleはミネソタ州の新データセンターで、風力・太陽光発電とForm Energyの30ギガワット時の大型蓄電池を組み合わせる方式を採用しています。AmazonOracleなども送電網への依存を減らすため、オンサイト電源やハイブリッド方式の導入を進めています。

送電網の老朽化とガスタービンの不足が代替エネルギー技術への道を開いています。米国の蓄電池容量は年末までに約65ギガワットに達する見通しで、Form EnergyはIPOに向けて5億ドルの資金調達を計画しています。

データセンター電力密度が1メガワットに達すると、電力機器がサーバーラック自体の2倍のスペースを占めるようになります。この課題に対し、固体変圧器スタートアップが注目を集めており、140年前の鉄銅技術に代わるシリコンベースの電力変換装置の開発が進んでいます。

蓄電池や変圧器企業への投資規模はAI業界の大型ラウンドと比べまだ小さく、投資家にとって参入しやすい領域です。輸送から重工業まであらゆる分野の電化が進む中、エネルギー技術はAIバブル崩壊へのヘッジにもなると専門家は分析しています。

WordPress.comがAIエージェントによる記事作成・公開機能を提供開始

新機能の概要

AIが記事の作成・編集・公開を代行
コメント管理やメタデータ修正も対応
自然言語の指示でサイト運営を自動化
テーマやデザインを理解したコンテンツ生成

仕組みと安全策

MCPプロトコルで外部AI連携
ClaudeChatGPT等の主要AIに対応
AI作成記事は下書き保存が既定
全変更をアクティビティログで追跡

業界への影響

全Webサイトの43%超WordPress基盤
月間200億PV規模のネットワーク

WordPress.comは2026年3月20日、AIエージェントがユーザーのWebサイト上で記事の作成・編集・公開を行える新機能を発表しました。コメント管理やメタデータの更新、タグ・カテゴリの整理も可能で、すべて自然言語による指示で操作できます。

この機能は2025年秋に導入されたMCPプロトコル対応を拡張したものです。MCPはアプリケーションが大規模言語モデルにコンテキストを提供する標準規格で、Claude Desktop、Cursor、VS Code、ChatGPTなど主要なAI対応ツールと接続して利用できます。

AIエージェントはランディングページやAboutページの作成に加え、コメントの承認・返信・整理、カテゴリやタグの再構成、SEO改善のためのalt属性やキャプションの修正など幅広い操作に対応します。サイトのテーマやデザインを事前に解析し、統一感のあるコンテンツを生成します。

安全対策として、すべての変更にはユーザーの承認が必要であり、AIが作成した投稿はデフォルトで下書きとして保存されます。変更履歴はアクティビティログで追跡でき、サイトオーナーはMCP設定画面から利用する機能を個別にトグルで制御できます。

WordPressは全Webサイトの43%以上を支えるプラットフォームであり、WordPress.comだけでも月間200億ページビュー・4億900万ユニークビジターを抱えます。AI主導のコンテンツ制作が広がることで、Web全体の質と性質に大きな変化をもたらす可能性が指摘されています。

Microsoft、Windows 11のCopilot統合を縮小へ

AI統合の見直し

Photos等4アプリCopilot削減
設定・エクスプローラー統合も撤回
「真に有用な」AI体験に集中方針
Windows Recall発売後も脆弱性発覚

背景と他の改善

米成人の半数がAIに懸念増大
ユーザーの声を数カ月間収集
タスクバー移動や更新制御も追加
Insider Program改善でフィードバック強化

Microsoftは2026年3月20日、Windows 11におけるAIアシスタントCopilotの統合箇所を削減すると発表しました。Windows・デバイス担当EVPのPavan Davuluri氏がブログで方針転換を説明しています。

具体的にはPhotos、Widgets、メモ帳、Snipping Toolの4アプリからCopilot連携を縮小します。「AIが最も意味のある場所に統合する」という方針のもと、真に有用な体験だけに絞る考えです。

この動きに先立ち、Windows Centralは設定アプリやファイルエクスプローラーへのCopilot統合計画が静かに棚上げされたと報じていました。AI機能の過剰搭載に対する消費者の反発が背景にあります。

Pew Researchの調査によると、2025年6月時点で米国成人の半数がAIに対し期待より懸念が上回ると回答しており、2021年の37%から大幅に増加しました。信頼と安全への不安が企業戦略に影響を与えています。

Copilot縮小に加え、タスクバーの上部・側面配置、システム更新の制御強化、ファイルエクスプローラーの高速化なども発表されました。Davuluri氏はコミュニティの声を数カ月間聞いてきた成果だと述べています。

NvidiaのDLSS 5、ゲーマーと開発者から猛反発

生成AIの暴走

顔の自動変更に批判殺到
開発者の意図を無視する仕様
Snapchatフィルター」と揶揄
アーティファクト問題も発覚

業界の反応

Capcom・Ubisoftも事前把握なし
CEO黄氏「ゲーマーは完全に間違い
弱いGPUでの動作こそ本来の価値
数年後には標準機能化の見方も

Nvidiaは2026年3月のGTC(GPU Technology Conference)で、ゲーム内キャラクターの顔を生成AIで写実的に変換する新技術「DLSS 5」を発表しました。従来のDLSSがフレームレート向上を目的としていたのに対し、今回は視覚的な変更を自動で加える点が大きな転換点となっています。

デモでは『バイオハザード』『アサシンクリード』『スターフィールド』などの人気タイトルが使用されましたが、SNS上では「ポルノ顔」「yassified(過度に美化)」などと酷評が相次ぎました。キャラクターの目が大きくなり、唇がふっくらし、鼻の形まで変わるなど、原作のデザイン意図を逸脱した変化が問題視されています。

ゲーム開発者からも懸念の声が上がっています。『Call of Duty』シリーズに携わったアーティストのジェームズ・ブレイディ氏は「アーティストの創造性と意図を根本から損なう」と批判しました。さらにCapcomやUbisoftの開発者は、デモの内容を事前に知らされておらず、一般公開と同時に初めて見たと報じられています。

批判に対しNvidiaのCEOジェンスン・ファン氏は「ゲーマーは完全に間違っている」と反論しました。しかしデモはNvidia最上位のGeForce RTX 5090を2枚使用しており、旧世代GPUの性能底上げという実用的な訴求がなかった点も失望を招いています。

オープンソースゲーム機Arduboyの開発者ケビン・ベイツ氏は、技術的偉業と認めつつも「現時点ではAI企業としての力を誇示するためにやらざるを得ないもの」と分析しています。一方で「数年後にはデフォルト機能になり、誰も気にしなくなる」とも予測しており、不気味の谷を越えた先の社会的受容が今後の焦点となりそうです。

NVIDIA、1日で専用埋め込みモデルを構築するレシピ公開

手法と成果

GPU1台・1日未満で完結
ラベル不要の合成データ生成
ハードネガティブマイニング採用
Recall・NDCG@10が10%以上改善

企業実績と展開

AtlassianがJiraで検証済み
Recall@60が0.751→0.951に向上
NIMOpenAI互換API展開
6コマンドで全工程実行可能

NVIDIAは2026年3月20日、汎用埋め込みモデルを特定ドメインに最適化するファインチューニングレシピを公開しました。GPU1台と1日未満の学習時間で、手動ラベリング不要で高品質なドメイン特化型埋め込みモデルを構築できます。

本レシピの核心は、LLMを使った合成データ生成パイプラインです。ドメイン文書をLLMに読み込ませ、複雑さの異なる質問・回答ペアを自動生成します。マルチホップクエリにも対応し、複数文書にまたがる推論を学習データに反映できます。

学習効果を高めるため、ハードネガティブマイニングを導入しています。正解に近いが誤りである文書を特定し、モデルが微妙な違いを学習できるようにします。正解スコアの95%以上の候補は偽陰性の可能性があるため自動除外されます。

Atlassianは本レシピをJiraデータセットに適用し、Recall@60が0.751から0.951へと26.7%向上する成果を確認しました。数百万のRovoユーザーの検索精度が直接的に改善されています。

完成したモデルはONNXやTensorRTに変換後、NVIDIA NIMコンテナでOpenAI互換APIとして本番展開できます。既存のRAGパイプラインにコード変更なしで組み込める点が実用上の大きな利点です。

MIT会議でAI開発の方向転換が議論、小規模モデル推進を提唱

消費者とAI企業の溝

消費者の過半数がAIリスク懸念
キラーアプリ不在で課金意欲低迷
企業と利用者の認識に大きな乖離

小規模AI路線の提唱

記者Karen HaoがAGI路線を批判
AlphaFold型の特化モデルを推奨
大規模計算の環境負荷を問題視

市民参加型AI開発

地域社会のニーズに応える設計
技術の軌道修正に市民の声が不可欠

MITで開催されたAIシンポジウムにおいて、ジャーナリストのKaren Hao氏と研究者のPaola Ricaurte氏が基調講演を行い、現在のAI開発の方向性に疑問を呈しました。300人以上が参加し、AIの恩恵を誰が受けるのかという根本的な問いが議論されました。

Hao氏は、大規模言語モデルの開発に使われる膨大なデータセットと計算資源の規模が不必要であると主張しました。ハイパースケールデータセンターエネルギー消費や水資源の大量使用、さらにギグエコノミー労働者への人的負担といったトレードオフを具体的に指摘しています。

代替モデルとして、ノーベル賞を受賞したAlphaFoldを例に挙げました。タンパク質構造の予測に特化した小規模モデルは、厳選されたデータセットのみを使用し、高速なスーパーコンピューティングも不要でありながら、巨大な恩恵を生み出していると説明しました。

一方、The Vergeの調査報道によれば、企業がAI導入を急ぐ一方で消費者の反応は冷ややかです。Pew Researchの調査では多くの人がAIの影響を懸念しており、NBCの世論調査でも過半数がリスクが利点を上回ると回答しました。消費者が対価を払いたいと思う画期的なユースケースがいまだ登場していないことが背景にあります。

Ricaurte氏は、コミュニティのニーズに応えない技術に意味はないと述べ、目的駆動型のAI開発を訴えました。Hao氏もAIという用語の曖昧さが建設的な議論を妨げていると指摘し、「自転車からロケットまで」という比喩で具体的な議論の必要性を強調しました。両氏は聴衆に対し、技術の軌道はまだ固定されておらず、市民一人ひとりが積極的に関与すべきだと呼びかけました。

AIエージェントがLinkedInで影響力を獲得後、アカウント停止に

AIのLinkedIn活動

AIエージェントがCEO役で投稿
5カ月で数百人のフォロワー獲得
企業インフルエンサー風の文体を習得
LinkedIn社から講演に招待

停止と真正性の問題

講演36時間後にプロフィール削除
「実在の人物用」とLinkedInが説明
投稿の半数以上がAI生成との推計
プラットフォーム自身がAI機能を推進

AIスタートアップHurumoAIの共同創業者である記者が、AIエージェント「Kyle Law」にCEO役を任せ、2025年8月からLinkedInで自律的に投稿させる実験を行いました。KyleはLindyAIプラットフォームを通じて2日おきに投稿し、5カ月で数百人のフォロワーを獲得しました。

Kyleの投稿スタイルは、LinkedInに典型的な企業インフルエンサーの語り口と完璧に一致していました。スタートアップの苦労話や学びを語り、最後に読者への質問で締めくくる構成が功を奏し、投稿のインプレッション数は人間の創業者本人を上回るほどでした。

LinkedIn社のマーケティング部門がKyleに注目し、社内向け講演に招待するという異例の展開となりました。数百人のLinkedIn社員が参加するビデオ会議にライブアバターで登壇し、AIエージェントとして初の企業招待講演を実現しました。

しかし講演からわずか36時間後、Kyleのプロフィールは削除されました。LinkedInの広報担当者は「プロフィールは実在の人物のためのもの」と説明しています。招待した担当者自身も規約違反を認識しつつ「レーダーをくぐり抜けてほしい」と述べていたことが明らかになっています。

この事件は、ソーシャルメディアにおける「真正な交流」の定義に根本的な疑問を投げかけます。LinkedInは自らAI作文機能を提供し、調査では投稿の半数以上がAI生成と推定されています。プラットフォームがAIツールを推進しながらAIエージェントを排除する矛盾は、SNSの信頼性が崩壊に向かう構造的問題を浮き彫りにしています。

Palantir、AI戦争技術で国防総省の正式プログラムに認定

軍事AI路線の加速

国防総省が正式認定
兵器照準技術の提供企業に
イラン戦での実戦支援を最優先
AI倫理論争とは一線を画す姿勢

商業部門の急成長

商業事業が前年比120%成長
生成AIが顧客支援を大幅強化
中小企業Instagram広告経由で導入
少数顧客と深い関係構築を志向

Palantirが2026年3月に開催した開発者会議で、CEOアレックス・カープ氏は同社の最優先事項がイラン戦での米軍支援であると宣言しました。会議直後、国防総省Palantirを兵器照準技術の正式プログラムとして認定しています。

同社の商業事業は前年比120%の成長率を記録しており、政府部門の60%成長を大幅に上回っています。CTOシャイアム・サンカール氏は「認知のためのアイアンマンスーツを構築している」と語り、生成AIの登場が成長の制約を取り払ったと説明しました。

従業員450人のファッション企業Instagram広告経由でPalantirを導入し、AI活用による仕入れ判断と価格交渉の自動化で1商品あたり9ドルの損失から9ドルの利益へと17ポイントの利益率改善を達成した事例が紹介されました。

カープ氏はAI企業の倫理的制約に対して明確に反対の立場を示しました。サンカール氏は、AI企業の指導者たちが「神があるべき心の穴をAGIで埋めようとしている」と批判し、Anthropicダリオ・アモデイ氏の楽観論とは対極の姿勢を鮮明にしています。

Palantirは国防契約での実績が商業分野でも競争優位になると確信しています。同社の強硬な愛国主義的姿勢は顧客の「フィルター」として機能し、価値観の合致する企業とのみ深い関係を築く戦略をとっています。一方で、ICEとの協力継続など人権面での懸念も指摘されています。

アシェット社、AI使用疑惑でホラー小説の出版を撤回

疑惑の経緯

NYTがAI使用を指摘
Reddit投稿で編集者が告発
YouTube検証動画が120万再生
著者本人はAI使用を否定

出版社の対応

英国市場から即時撤回
米国展開計画も中止決定
自費出版からの異例の契約破棄

アシェット社は2026年3月、ホラー小説『Shy Girl』を英国市場から撤回し、米国での出版計画も中止しました。ニューヨーク・タイムズの調査報道で、作品の相当部分にAIが使用された疑いが浮上したためです。

同作はミア・バラード氏が2025年に自費出版したホラー小説で、SNSで話題となり大手出版社との契約に至った異例の成功事例でした。強迫性障害を持つ女性が「シュガーダディ」のペットとして生きる物語が読者の関心を集めていました。

しかし一部の読者からは「過剰に装飾的で反復的な文章」との批判が上がり、やがて文体がチャットボットの出力に酷似しているとの指摘が相次ぎました。書籍レビューサイトGoodreadsでも評価が大きく割れる事態となりました。

2026年1月には、ベテラン編集者を名乗る人物がRedditで長文の告発投稿を行い「AIでなければひどい作家だ。文章はLLMと見分けがつかない」と断じました。世界第2位の出版社がAI生成作品を刊行した可能性に強い懸念を示しています。

その後、同様の主張を展開する2時間半の検証動画YouTubeに投稿され、120万回以上再生される反響を呼びました。AI時代の出版における品質管理と著作の真正性をめぐる議論が、業界全体に波及しています。

a16z、AI市場は独占でなく寡占に向かうと分析

AI市場の競争構造

a16zがAI市場構造を分析
独占か寡占かの論点を整理
複数プレイヤーの共存を予測

寡占化の背景と展望

基盤モデルの開発競争が継続
参入障壁は高いが独占困難
オープンソースが競争を促進
レイヤー別に競争環境が異なる

Andreessen Horowitza16zは、AI市場が独占(モノポリー)ではなく寡占(オリゴポリー)に向かうとの見解を発表しました。大手VCとしてAI業界を俯瞰した分析です。

AI業界ではOpenAIGoogleAnthropicなど複数の有力企業が基盤モデル開発で競争しています。一社が市場を完全に支配する独占状態にはなりにくいとa16zは指摘しています。

その背景にはオープンソースモデルの台頭があります。MetaLlamaシリーズなどが無償公開され、新規参入者にも高性能モデルの活用機会が広がっており、独占を阻む要因となっています。

一方で計算資源や大規模データセットの確保には莫大な投資が必要であり、参入障壁は依然として高い状態です。結果として少数の大手企業による寡占構造が形成されつつあります。

a16zはAIのバリューチェーンをレイヤー別に分析し、インフラ層・モデル層・アプリケーション層でそれぞれ異なる競争環境が生まれると見ています。投資家経営者にとって市場構造の理解が戦略策定の鍵となります。

VercelがベクトルDB不要のナレッジエージェント基盤を公開

ファイル検索の仕組み

ベクトルDB・埋め込み不要
grep/find/cat検索実行
Sandbox内でbash操作
デバッグ数分で完結
コスト75%削減の実績

マルチ展開と拡張性

Chat SDKで全平台対応
AI SDKとの深い統合
複雑度による自動ルーティング

管理機能

利用統計・エラーログ内蔵
AI管理エージェント自己診断

Vercelは、ベクトルデータベースや埋め込みモデルを使わずにナレッジエージェントを構築できるオープンソーステンプレート「Knowledge Agent Template」を公開しました。Vercel Sandbox、AI SDK、Chat SDKを組み合わせた構成で、ワンクリックでデプロイできます。

従来のRAGパイプラインでは、チャンキングや埋め込みモデルの選定、類似度スコアの調整に多大な工数がかかり、誤回答時のデバッグも困難でした。ベクトル検索では類似度0.82と0.79の差異の原因特定が難しく、障害対応が長期化する課題がありました。

新アーキテクチャでは、エージェントgrep・find・catといたファイルシステム操作で情報を検索します。LLMはコード学習を通じてディレクトリ操作に習熟しているため、この手法が有効です。社内の営業通話要約エージェントでは、コストが約1ドルから約0.25ドルに削減され、出力品質も向上しました。

Chat SDKにより、同一のナレッジベースをSlackDiscordGitHubMicrosoft Teamsなど複数プラットフォームに同時展開できます。各アダプターが認証やメッセージ形式の差異を吸収し、エージェント本体のコードは変更不要です。さらにAI SDKとの統合により、質問の複雑度に応じてモデルを自動選択するスマートルーティング機能も備えています。

テンプレートには管理画面が内蔵されており、利用統計、エラーログ、ユーザー管理、ソース設定を一元管理できます。さらにAI管理エージェントが搭載され、「過去24時間のエラー」や「よくある質問」を自然言語で問い合わせることが可能です。外部の監視ツールを別途導入する必要がありません。

Amazon、Alexa搭載スマートフォン再参入を計画

端末の概要

コードネーム「Transformer
Light Phoneから着想の簡素設計
従来型アプリストア不要の可能性
ミニアプリ方式を検討中

課題と懸念

AppleSamsung独占市場への挑戦
プライバシー問題の根深い歴史
関税・供給網混乱によるコスト増大

AmazonがFire Phone撤退から10年以上を経て、Alexa+AIアシスタントを中核に据えた新型スマートフォンの開発を進めていることが、Reutersの報道で明らかになりました。コードネーム「Transformer」と呼ばれる同端末は、社内のZeroOneグループが開発を主導しています。

開発チームを率いるのは、MicrosoftでZuneやXboxを手がけたJ・アラード氏です。チームはスマートフォンと「ダムフォン」の両方のデザインを検討しており、白黒ディスプレイとアプリストア非搭載が特徴のミニマリスト端末Light Phoneからインスピレーションを得ているとされます。

2014年に発売された初代Fire Phoneはアプリ不足と低調な売上により1年で撤退に追い込まれました。今回はChatGPTのようなミニアプリ方式を採用し、従来型アプリストアへの依存を回避する戦略が検討されています。AIが生成するUIにより、アプリそのものが不要になる可能性も示唆されています。

市場アナリストからは厳しい見方も出ています。IDCのジェロニモ副社長は「ハードウェアAppleSamsungに対抗するのは不可能」と指摘し、メモリ危機や関税による製造コスト上昇も懸念材料に挙げました。一方で、Alexa+を搭載した常時携帯型のコンパニオンデバイスとしての可能性には一定の評価を示しています。

プライバシー面では、Amazonデジタル権利ランキングで下位に位置し、Alexa音声データの広告利用が過去に指摘されている点が大きな課題です。専門家は、スマートフォン参入によりデータ収集の規模が飛躍的に拡大し、広告事業強化の手段となる可能性を警告しています。発売時期や価格は未定で、計画自体が中止される可能性も残されています。

Replit「Agent 4」発表、無限キャンバスで協働開発を刷新

Agent 4の新機能

Infinite Canvasで複数成果物を一元管理
並列タスクと統合ビルド対応
Web・モバイルを単一プロジェクトで構築
デザインバリエーション自動生成機能

社内活用と実証事例

BigQuery連携で3Dデータ可視化実現
設計者がAgent 4でAgent 4自体を設計
企業向けデモを一晩で構築・納品
クリエイター支援プログラムの国際展開加速

Replitは自社HQからのライブ配信で、AIコーディングツール最新版「Agent 4」を正式発表しました。新機能の中核となるInfinite Canvasや並列タスク処理により、複数人での協働アプリ開発が大幅に効率化されます。

コミュニティマネージャーのManny Bernabe氏は、Agent 4で構築した「テイスト開発アプリ」を実演しました。画像Google Geminiで分析し、タイポグラフィや配色、レイアウトの評価を返すこのアプリは、ランディングページ・Webアプリ・モバイル版を1つのキャンバス上で同時に管理できます。

Raymmar Tirado氏は「Replitopolis」と呼ばれる3D都市を披露しました。BigQueryのデータをリアルタイムで可視化し、各ビルがユーザーを、高さがプロンプト送信数を表現します。企業の読み取り専用データに接続するだけで内部ツールを構築できる可能性を示しました。

デザイナーのZade Keylani氏は、Agent 4のUIデザイン自体をAgent 4で構築した経験を共有しました。Figmaファイルではなく動作するプロトタイプをエンジニアに引き渡す手法により、開発中にリアルな問題を発見・報告できたと語ります。空間的思考を活かすCanvasが試行錯誤のハードルを下げたと強調しました。

マーケティング担当のRaina Saboo氏は、Agent 4のテーマを「意図ある創造性」と説明しました。Agent 3が自律性を追求したのに対し、Agent 4は人間の方向性とAIの能力を掛け合わせる設計思想です。DatabricksStripeなど大手企業顧客も早期アクセスで導入を進めており、ローンチ週には資金調達発表とブランド刷新も同時に実施されました。

世界モデル3方式が物理AI基盤として急浮上

3つのアーキテクチャ

JEPAがリアルタイム推論に特化
ガウシアンスプラットで3D空間生成
エンドツーエンド生成で合成データ量産
AMI Labsが10.3億ドルシード調達

LLMの物理的限界

物理的因果関係の理解が欠如
リチャード・サットンが模倣の限界指摘
ハサビスが不均一な知性と批判

産業応用と今後

WaymoがGenie 3で自動運転訓練
AutodeskがWorld Labs支援で設計応用

大規模言語モデル(LLM)がロボティクスや自動運転など物理世界の理解を要する領域で限界に直面しており、投資家の関心が「世界モデル」へ急速にシフトしています。AMI Labsが10.3億ドル、World Labsが10億ドルのシード資金を相次いで調達しました。

チューリング賞受賞者のリチャード・サットン氏はLLMが人間の発言を模倣するだけで世界をモデル化していないと警告しました。Google DeepMindデミス・ハサビスCEOも、現在のAIは数学五輪を解けるのに基本的な物理で失敗する「不均一な知性」を抱えていると指摘しています。

第1のアプローチ「JEPA」は、ピクセルレベルの予測ではなく潜在的な抽象表現を学習する手法です。人間が車の軌道と速度を追跡し背景の細部を無視するように、核心的な物理法則のみを捉えます。計算効率が高くリアルタイム推論に適しており、AMIは医療企業Nablaと提携してヘルスケア分野での活用を進めています。

第2のアプローチはWorld Labsが採用する「ガウシアンスプラット」で、画像やテキストから完全な3D空間環境を生成します。Unreal Engineなどに直接インポートでき、Autodeskが産業設計への統合を目的に同社を強力に支援しています。第3のアプローチはDeepMindGenie 3NvidiaCosmosに代表されるエンドツーエンド生成で、モデル自体が物理エンジンとして機能します。

今後は各アプローチの長所を組み合わせたハイブリッドアーキテクチャの台頭が見込まれます。サイバーセキュリティ企業DeepTempoはLLMとJEPAを統合した「LogLM」でログ異常検知を実現しており、LLMが推論・対話層を担い世界モデルが物理・空間データ基盤となる構図が形成されつつあります。

豪州AI新興2社、DevOpsなしで世界展開を実現

インフラ人材不足の現実

APACでIT人材確保が困難
豪州DevOps人件費は15万ドル超
シンガポールAI投資84億ドル

2社の運用モデル

Leonardo.AIが日産450万画像
ビルド時間を10分から2分に短縮
Relevance AIが5万エージェント運用
専任インフラチームゼロで稼働

Vercel基盤の効果

Sandbox SDKにファイル権限機能追加

Vercelの基盤を活用する豪州発のAIスタートアップ2社が、専任のDevOpsチームを持たずにグローバル規模のサービス運用を実現しています。画像生成Leonardo.AIとAIエージェントRelevance AIが、その代表例です。

APAC地域ではAIスタートアップへの投資が急増しており、豪州だけで10億ドル超がAI企業に投じられています。一方でDevOpsエンジニアの採用は困難を極め、豪州での年収は15万ドル以上、IDCによればAPAC企業の6〜8割がIT人材の確保に苦戦しています。

Leonardo.AIは当初ゲーム開発者向けのAI画像生成ツールとして出発し、現在は日産450万枚画像を処理しています。Vercel導入前はビルドに10分以上、ページ読み込みに60秒かかっていましたが、移行後はビルド時間が2分に短縮されました。

Relevance AIはシドニーを拠点に、SalesforceやHubSpot、Slackなど既存ツール上で動作するAIエージェントプラットフォームを提供しています。5万のエージェントインフラチームなしで自律稼働し、リード選定や顧客対応を自動化しています。

またVercel Sandbox SDKはバージョン1.9.0でファイル書き込み時の権限設定機能を追加しました。writeFiles APIにmodeプロパティを渡すことで、chmodの追加実行が不要になり、サンドボックス内でのスクリプト管理が効率化されます。

両社に共通するのは、インフラ管理をプラットフォームに委ね、エンジニアリングリソースをプロダクト開発に集中させる運用モデルです。AI時代のスタートアップにとって、最大のチームではなく最速で出荷できるチームが勝つという構図が鮮明になっています。

AI議事録デバイス主要8製品が出揃い市場が本格化

カード型デバイス

Plaud Note Proは179ドル
Comulyticは追加課金なしで無制限文字起こし
TicNoteは120言語対応
Pocketは15m集音・64GB内蔵

ウェアラブル

Plaud NotePinはペンダント・リスト兼用
Omiは89ドルでオープンソース
Viaim RecDotはイヤホン型で78言語対応
Ankerはコイン型で32時間録音

TechCrunchは2026年に入り急速に拡大する物理型AI議事録デバイス市場について、主要8製品を比較レビューしました。対面会議やオンライン通話の録音・文字起こし・要約・アクション抽出を行うこれらのデバイスは、159〜200ドルの価格帯で競争が激化しています。

Plaudはカード型のNote/Note Proに加え、ペンダントやリストバンドとしても使えるNotePin/NotePin Sを展開し、最も幅広い製品ラインナップを持ちます。月300分の無料文字起こしが付属し、Pro版は4マイク搭載で3〜5メートルの集音範囲を実現しています。

Comulytic Note Proは159ドルの買い切りで基本的な文字起こしが無制限という独自の価格戦略を採用しています。45時間の連続録音と100日以上の待機時間を実現し、月15ドルの上位プランではAI要約やアクション抽出などの高度な機能が利用できます。

ウェアラブル型ではOmiペンダントが89ドルと最安値で、ハードウェア・ソフトウェアともにオープンソースとして公開されている点が特徴です。ユーザーが独自のコネクタやアプリを開発できるため、エンジニア層を中心にコミュニティが形成されています。

Anker Soundcore Workはコイン型のピンとパック型バッテリーの組み合わせで、ケース装着時に最大32時間の録音が可能です。Viaim RecDotはイヤホン型という独自形状で、通話中のリアルタイム文字起こしに特化しており、78言語に対応しています。

独DFKIがAI搭載スマート車椅子の実証実験を公開

研究の概要と技術

DFKIがセンサー搭載電動車椅子を開発
半自律・完全自律の2モード搭載
自然言語で目的地指示が可能
ROS2 Nav2とSLAM地図を活用

実用化への課題

コストが最大の普及障壁
多様なユーザーニーズへの対応が困難
実環境での信頼性確保が課題
市場投入まで10年の見通し

ドイツ人工知能研究センター(DFKI)の研究チームが、AI搭載スマート車椅子のプロトタイプを開発し、米カリフォルニア州アナハイムで開催されたCSUN支援技術カンファレンスで研究成果を発表しました。

開発された車椅子は半自律モード完全自律モードの2種類を備えています。半自律モードではジョイスティックによる操作を支援し、完全自律モードでは「コーヒーマシンまで連れて行って」といった自然言語入力で目的地へ誘導します。

各車椅子には2基のLiDAR、3Dカメラ、オドメーター、ユーザーインターフェース、組み込みコンピューターが搭載されています。オープンソースのROS2 Nav2ナビゲーションシステムとSLAM技術を組み合わせ、障害物回避を実現しています。

トロント拠点のBraze Mobility社CEOビスワナサン氏は、コストが最大の障壁だと指摘します。フランスIRISAの研究者デヴィンジュ氏も、センシングや自律性を高めるほど実環境での堅牢な性能確保が難しくなると述べています。

研究を率いたマンデル氏は、スマート車椅子の市場投入を10年以内と見込む一方、重度障害を持つ車椅子利用者が狭い通路を巧みに通過する能力を目の当たりにした経験から、技術はユーザーを置き換えるのではなく協調関係を築くべきだと強調しています。

MITとHPI、AI×創造性の研究拠点を設立

10年規模の連携構想

Hasso Plattner財団が資金提供
AI×デザイン学際研究推進
冠名教授職・大学院フェロー設置
ハッカソンや夏季交換プログラム展開

人間中心の創造性追求

情報時代から想像力の時代へ
2022年の持続可能性研究を発展
大西洋横断の共同研究体制構築

MITと独ハッソ・プラットナー研究所(HPI)は2026年3月19日、AI と創造性に関する共同研究拠点「MHACH」の設立に合意しました。Hasso Plattner財団が資金を提供し、10年間にわたる長期的な学際研究と教育プログラムを展開します。

MHACHでは冠名教授職や大学院フェローシップを設置し、AIと創造性の交差領域で継続的な研究基盤を整備します。ワークショップやハッカソン、夏季交換プログラムなど体験型の教育機会も拡充し、両機関の学生・研究者が分野を超えて協働できる環境を構築します。

MITサリー・コーンブルース学長は「情報時代が想像力の時代に移行するなか、人間の創造性に新たな重点が置かれる」と述べました。AIが創造性を損なうかではなく、新たな知性が創造プロセスをいかに深化・豊穣化できるかを探究する姿勢を示しています。

本連携は2022年に設立されたMIT MADとHPIの持続可能性デザイン研究プログラムを発展させたものです。HPIはデジタルエンジニアリングやサイバーセキュリティデザイン思考の分野で世界的な実績を持ち、人間中心イノベーションの知見を提供します。

運営委員会はMIT建築・計画学部、MITシュワルツマン・コンピューティング学部、HPIの代表者で構成されます。Hasso Plattner財団の長期的な慈善的コミットメントにより、技術革新とデザイン思考を結びつける国際的な研究教育の新たなモデルが目指されています。

IBM Research、構造化AIワークフロー基盤Mellea 0.4.0を公開

Mellea 0.4.0の新機能

Granite Librariesとネイティブ統合
制約付きデコードでスキーマ正確性を保証
指示・検証・修復パターンの導入
観測フックワークフロー監視が可能に

Granite Librariesの構成

granitelib-core:要件検証用アダプタ
granitelib-ragRAGパイプライン全工程対応
granitelib-guardian:安全性・事実性・コンプライアンス特化
granite-4.0-micro向けLoRAアダプタ

IBM Researchは2026年3月20日、オープンソースのPythonライブラリMellea 0.4.0と3つのGranite Librariesを同時公開しました。これにより、IBM Graniteモデル上で構造化・検証可能・安全性を備えたAIワークフローの構築が容易になります。

Melleeは確率的なプロンプト動作を、構造化された保守可能なAIワークフローに置き換えるライブラリです。制約付きデコードや構造化修復ループ、パイプラインの組み合わせにより、LLMベースのプログラムの予測可能性と保守性を高める設計思想を持っています。

バージョン0.4.0では、Granite Librariesとのネイティブ統合が実現しました。制約付きデコードに基づく標準化APIを通じ、出力のスキーマ正確性を保証します。さらにリジェクションサンプリング戦略による指示・検証・修復パターンや、イベント駆動型コールバックによる観測フックも導入されました。

同時公開されたGranite Librariesは、granite-4.0-microモデル向けの特化型LoRAアダプタ群です。granitelib-coreは要件検証、granitelib-rag検索前・検索後・生成後のRAGタスク、granitelib-guardianは安全性・事実性・ポリシー準拠の各領域をカバーします。

汎用プロンプティングに頼らず、タスク特化型アダプタを用いることで、少ないパラメータコストで各タスクの精度を向上させつつ、ベースモデルの能力を損なわない点が特長です。コードと論文はHugging FaceおよびGitHubで公開されており、すぐに導入を開始できます。

AI食事記録アプリの実力と限界、専門家が指摘

アプリの機能と課題

AI画像認識でカロリー自動推定
アプリ間で推定値に大きな差
個人差の反映に方程式の限界
年間35〜80ドルのサブスク費用

健康管理への効果

食事摂取量の過小評価を防止
栄養バランスの気づきを促進
水分・食物繊維の摂取改善
完璧主義による弊害リスク

AIコンピュータビジョンを活用した食事記録アプリが続々と登場しています。BitePal、Hoot、Lose It!、MyFitnessPalなど複数のアプリを実際に試し、栄養専門家への取材を通じてその実力と限界が明らかになりました。

食事記録アプリの最大の利点は、日々の食事に対する意識と責任感を高める点です。登録栄養士のメリダン・ザーナー氏によると、人は食事摂取量を20〜50%過小評価する傾向があり、アプリによる記録がその補正に役立つといいます。

一方で、各アプリが提示する推奨カロリーには大きなばらつきがありました。同じ身長・体重を入力しても異なる数値が表示され、ホルモンや骨格、遺伝的要因など個人差を方程式に反映しきれないことが原因です。正確な代謝率は専門家による検査が必要とされます。

AIカメラ分析機能では、同じ地中海風ボウルでもアプリによって約1,000カロリーから大幅に高い数値まで差が出るなど、精度に課題が残りました。バーコードスキャンの方がより正確なカロリー計測が可能で、総合的にはLose It!が最も使いやすいと評価されています。

ただし、完璧主義的な性格の人は数値目標に執着しすぎる危険があると専門家は警告しています。食べ物を「良い」「悪い」と二分する思考は不健康であり、栄養管理はグレーゾーンで機能するものだとザーナー氏は強調。アプリはあくまで健康管理の「ツールボックスの一つ」として活用すべきだと結論づけています。

YouTube、スポーツポッドキャスト広告枠を米国で提供開始

広告ラインナップ

Top Sports Podcast Lineup提供開始
米国広告主が即日利用可能
YouTube Select経由で配信
New Heights等の人気番組に掲載

若年ファン層の視聴動向

2025年スポーツ系再生85億回超
14〜24歳の56%が毎週視聴
試合後の解説・分析が視聴を牽引

YouTubeは2026年3月、米国の全広告主を対象に「Top Sports Podcast Lineup」の一般提供を開始しました。スポーツファンが集まるポッドキャスト番組群に広告を配信できる新たな仕組みです。

同ラインナップはYouTube Selectの枠組みを活用し、New HeightsThe Rich Eisen Showなど人気スポーツポッドキャストへの広告掲載を簡便に実現します。ブランドはファンとの接点を効率的に確保できます。

背景には若年層のスポーツ視聴行動の変化があります。14〜24歳の56%がアスリートのポッドキャストや動画を毎週視聴しており、従来のテレビ中継とは異なる接触経路が主流になりつつあります。

2025年にはYouTube上のスポーツ関連ポッドキャストの再生回数が85億回を超えました。試合そのものだけでなく、試合後の解説やコメンタリーがファンの視聴時間を大きく押し上げています。

YouTubeは「大きな大会やチャンピオンシップが終わった後も、YouTube上の会話は続く」と強調しています。広告主にとっては試合終了後もファンとつながり続けられる継続的なブランド露出の機会となります。