オンデバイス(ハードウェア)に関するニュース一覧

Google医療AIコンペMedGemma受賞者を発表

主要受賞プロジェクト

EpiCast:西アフリカの疾病監視支援
FieldScreen AI:結核スクリーニング
Tracer医療ミス防止ワークフロー

技術特別賞と展望

BridgeDX:災害時オフライン診断支援
CaseTwin:胸部X線の類似症例照合
BigTB6音声駆動の結核・貧血検査
850超チームがHAI-DEF活用で参加
途上国の医療格差解消に焦点

Googleは、医療AI開発者向けオープンモデル基盤「Health AI Developer Foundations(HAI-DEF)」プログラムの一環として開催した「MedGemma Impact Challenge」の受賞者を発表しました。Kaggleと共催した本コンペには850以上のチームが参加し、医療課題の解決に挑みました。

グランプリのEpiCastは、西アフリカ経済共同体の疾病監視の空白を埋めるモバイルファーストのソリューションです。ファインチューニングしたMedGemmaモデルにMedSigLIPやHeARを組み合わせ、地域言語による臨床観察をWHOの統合疾病監視・対応シグナルに変換し、感染症アウトブレイクの早期発見を支援します。

FieldScreen AIは、リソースが限られた環境向けの結核スクリーニングワークフローです。MedGemmaによる胸部X線解析とHeARベースの咳音声分類を組み合わせ、完全にオンデバイスで動作します。Tracerは医師のメモから仮説を抽出し、検査結果と照合することで医療ミスの防止を目指します。

技術特別賞では3テーマが表彰されました。BridgeDXは2015年ネパール地震の経験から着想を得たオフライン診断支援デモで、WHOやMSFのガイドラインに基づきます。CaseTwinエージェントワークフローで胸部X線の類似症例を照合し、農村部の病院での紹介プロセスを数時間から数分に短縮します。

本コンペは、HAI-DEFオープンウェイトモデルが世界中の医療格差解消に大きな可能性を持つことを示しました。Googleは2024年末にHAI-DEFを立ち上げ、2025年1月にはMedGemma 1.5を公開しており、今後も開発者コミュニティとの連携を通じて医療AIの民主化を推進する方針です。

Amazon、Alexa搭載スマートフォン再参入を計画

端末の概要

コードネーム「Transformer
Light Phoneから着想の簡素設計
従来型アプリストア不要の可能性
ミニアプリ方式を検討中

課題と懸念

AppleSamsung独占市場への挑戦
プライバシー問題の根深い歴史
関税・供給網混乱によるコスト増大

AmazonがFire Phone撤退から10年以上を経て、Alexa+AIアシスタントを中核に据えた新型スマートフォンの開発を進めていることが、Reutersの報道で明らかになりました。コードネーム「Transformer」と呼ばれる同端末は、社内のZeroOneグループが開発を主導しています。

開発チームを率いるのは、MicrosoftでZuneやXboxを手がけたJ・アラード氏です。チームはスマートフォンと「ダムフォン」の両方のデザインを検討しており、白黒ディスプレイとアプリストア非搭載が特徴のミニマリスト端末Light Phoneからインスピレーションを得ているとされます。

2014年に発売された初代Fire Phoneはアプリ不足と低調な売上により1年で撤退に追い込まれました。今回はChatGPTのようなミニアプリ方式を採用し、従来型アプリストアへの依存を回避する戦略が検討されています。AIが生成するUIにより、アプリそのものが不要になる可能性も示唆されています。

市場アナリストからは厳しい見方も出ています。IDCのジェロニモ副社長は「ハードウェアAppleSamsungに対抗するのは不可能」と指摘し、メモリ危機や関税による製造コスト上昇も懸念材料に挙げました。一方で、Alexa+を搭載した常時携帯型のコンパニオンデバイスとしての可能性には一定の評価を示しています。

プライバシー面では、Amazonデジタル権利ランキングで下位に位置し、Alexa音声データの広告利用が過去に指摘されている点が大きな課題です。専門家は、スマートフォン参入によりデータ収集の規模が飛躍的に拡大し、広告事業強化の手段となる可能性を警告しています。発売時期や価格は未定で、計画自体が中止される可能性も残されています。

Perplexity、Mac常駐型AIエージェント「Personal Computer」発表

製品の主な特徴

Mac Mini上で24時間常駐稼働
ローカルファイルとアプリに直接アクセス
任意デバイスから遠隔操作が可能
操作の監査証跡と承認機能を搭載

競合との差別化

OpenClawより安全性を訴求
誤操作時の取り消し機能搭載
キルスイッチで暴走を防止

提供状況と展望

現在招待制の早期アクセス段階
CEO「一人で10億ドル企業構築可能」と主張

Perplexityは2026年3月、Mac上でローカル稼働するAIエージェントツール「Personal Computer」を発表しました。同ツールは専用デバイス上で24時間稼働し、ユーザーのファイルやアプリに直接アクセスして業務を自律的に遂行します。

Personal Computerは、先月発表されたクラウド型の「Perplexity Computer」をローカル環境に拡張した製品です。ユーザーは具体的な操作指示ではなく、「投資家へのメール作成」「レポートのスライド化」といった目的レベルの指示を与えるだけで、AIが自律的にタスクを完了します。

セキュリティ面では、競合のオープンソースツールOpenClawとの差別化を強調しています。全操作の監査証跡を提供し、機密性の高い操作は事前承認を求める仕組みを備えます。さらにキルスイッチを搭載し、エージェントの暴走リスクに対応しています。

現時点ではウェイトリストによる招待制の早期アクセス段階にあり、正式な提供開始時期は未定です。対応ハードウェアはMac Miniが示されていますが、その他のプラットフォームへの対応は明らかにされていません。

CEOのAravind Srinivas氏はX上で、「人間最大の弱点である睡眠を克服し、一人で10億ドル企業を構築できる」と野心的なビジョンを語りました。プロフェッショナル用途を主軸としつつ、コンシューマー市場への展開も視野に入れた戦略が見て取れます。

NXPがロボットAIのエッジ実装手法を公開

データ収集の要点

カメラ固定とコントラスト確保
グリッパーカメラの併用推奨
作業空間を分割し多様なエピソード収録
失敗リカバリ動作を20%含める

エッジ最適化と成果

VLAモデルをブロック分割し個別最適化
量子化でレイテンシ2.86秒→0.32秒
非同期推論で連続動作を実現
i.MX 95で精度96%を達成

NXPは2026年3月5日、組み込みプラットフォーム上でロボットAIを動作させるための実践ガイドをHugging Faceと共同で公開しました。データ収録からVLAモデルの微調整、オンデバイス最適化までの一連の手法を体系的に示しています。

Vision-Language-Action(VLA)モデルは、視覚と言語の理解に基づきロボットの動作を生成する次世代技術です。しかし組み込み環境では計算資源やメモリ、消費電力の制約があり、リアルタイム制御との両立が大きな課題となっています。

データ収集ではカメラの固定設置、照明の統一、対象物とのコントラスト確保が重要とされています。特にグリッパーに装着したカメラが精密操作の成功率を大幅に向上させることが確認されました。作業空間を11クラスタに分割し、各クラスタで多様な開始位置を記録する手法が推奨されています。

最適化ではVLAモデルをビジョンエンコーダ、LLMバックボーン、アクションエキスパートの3ブロックに分解し、それぞれ独立に量子化を適用しました。ビジョンとLLM部分は4〜8ビット量子化が可能な一方、ノイズ除去を繰り返すアクション部分は高精度を維持する必要があります。

NXP i.MX 95プロセッサ上でACTポリシーを実行した結果、最適化モデルで推論レイテンシ0.32秒、テストセット精度100%、全体精度89〜96%を達成しました。非同期推論により動作中に次の指令を並行生成でき、滑らかなロボット制御を実現しています。今後はシミュレーション環境や強化学習を活用し、より複雑なタスクへの展開を目指します。

llama.cppがHFに合流して機能強化

ローカルAI基盤の統合

Georgi Gerganov率いるGGMLチームがHFに合流
llama.cppは最も広く使われるローカル推論エンジン
HuggingFace傘下でコミュニティ規模の拡大を目指す
GGML形式がGGUFフォーマットとして業界標準に確立
商業利用・研究利用双方でのオープン推進が継続

ローカルAIエコシステムへの影響

エッジ・オンデバイス推論の民主化が加速
クラウドへの依存を減らすプライバシー重視AIが普及
企業向けオンプレAI展開の標準スタックとして定着
HFのモデルハブとの深い統合でアクセスが容易に
コミュニティ持続性の確保が長期課題

Hugging Faceは、最も影響力のあるローカルAI推論フレームワークであるGGMLとllama.cppの開発者Georgi Gerganovとそのチームを迎え入れたと発表しました。この統合は、ローカルAI推論エコシステムの長期的な発展を担保する重要な動きです。

llama.cppは、MacのM系チップからRaspberry Piまで幅広いデバイスでLLMを実行できるフレームワークとして、ローカルAI革命の立役者となってきました。GGUF形式はモデルの量子化・配布の事実上の標準フォーマットとして採用されています。

HuggingFaceとの統合により、GGMLチームはHFの広大なモデルハブ、コミュニティ、インフラを活用できるようになります。一方、HFにとってはオンデバイスAI分野での存在感を大幅に強化できるメリットがあります。

ローカルAIの重要性はプライバシー保護、オフライン利用、低コスト展開の観点から高まり続けています。企業がクラウドAIコストに悩む中、オンプレミスLLMの需要は急速に拡大しており、llama.cppはそのユースケースで中心的役割を担っています。

この統合はオープンソースAIエコシステムの成熟を示す重要なマイルストーンです。商業的に成功したHFがコミュニティ主導の重要プロジェクトを取り込むことで、オープンソースの持続可能性モデルの新たな形を示しています。

Reface創設者がオンデバイスAI最適化を創業

オンデバイスAIの強化

Reface・Prisma創設者が新会社設立
オンデバイスモデルの高速化
エッジAIの新手法開発

動画顔交換アプリRefaceと写真フィルターアプリPrismaの共同創設者たちが、オンデバイスAIモデルの性能向上に特化した新スタートアップを設立しました。

スマートフォンやエッジデバイスで動作するAIモデルの高速化・軽量化技術を開発しており、クラウドへの依存を減らしながら高度なAI機能を実現することを目指しています。

NvidiaとGroqがリアルタイムAI推論競争、企業の勝敗を決める速度戦

リアルタイム推論の重要性

応答遅延が企業AIの競争力を左右
GroqLPUアーキテクチャが高速推論をリード
NvidiaのH200・Blackwellが追撃
ミリ秒単位の差がユーザー体験を決定

企業への実装示唆

遅延予算を明確に定義することが重要
ストリーミング応答で知覚遅延を低減可能
推論インフラの選択がコア競争力に
エッジ展開と中央集権型の使い分けが鍵

記事は古代ピラミッドの比喩を用いながら、AIリアルタイム推論の重要性と、NvidiaGroqがこの分野でどのように企業向け市場を争っているかを分析しています。

GroqLPU(Language Processing Unit)という専用アーキテクチャにより、汎用GPUよりも大幅に高速なテキスト生成を実現しています。1秒あたりのトークン生成数Nvidia GPUを凌駕するデモが注目を集めています。

NvidiaはH200やBlackwellシリーズで推論性能を向上させながら、CUDAエコシステムという強固な参入障壁を維持しています。エンタープライズ市場での信頼性・サポート体制Groqを圧倒しています。

企業が推論インフラを選ぶ際には、ピーク遅延、スループット、コスト、信頼性を明確に定義した上で選択することが重要です。遅延バジェットを設定し、それに基づいてアーキテクチャを選ぶアプローチを推奨しています。

長期的には、エッジデバイス上での軽量モデル実行と、クラウド上の高性能モデルを使い分けるハイブリッド推論が主流になると見られており、企業はその両方に対応できる柔軟な設計が求められます。

Appleの改良型Siriが再び延期、AI競争で遅れ鮮明に

延期の実態

iOS 26.4向け機能が26.5以降に先送り
AI強化Siriをめぐる2年越しの遅延が継続
ライバル各社AIとの格差拡大を招く懸念

戦略的影響

Apple Intelligenceの旗艦機能が未実装のまま
WWDC発表と実際の提供時期の乖離が深刻
ユーザーの信頼低下リスクが高まる

Appleは改良型Siriの主要機能をiOS 26.4に導入する計画でしたが、再び延期が報じられています。新機能はiOS 26.5やiOS 27での提供に後ずれする見通しで、Apple Intelligenceの目玉とされていた機能の実現がいつになるか不透明な状況です。

Appleは2024年のWWDCでAI強化版Siriを大々的に発表して以来、約2年間にわたり継続的な遅延に苦しんでいます。OpenAIGoogleなどの競合がリアルタイム音声AIを次々と商用化する中、Siriの遅れは戦略的なリスクへと発展しています。

エンジニアリングの複雑性とプライバシー要件の両立が、開発を難しくしていると言われています。特にオンデバイス処理とクラウドAIの統合において、品質基準を満たすことができていないとの指摘があります。

今回の延期はAppleにとって単なる製品スケジュール問題にとどまらず、AI時代におけるブランド価値にも影響を及ぼしかねません。iPhoneの購買動機としてAI機能を重視する消費者層の期待を裏切ることで、販売に影響する可能性があります。

業界アナリストは、AppleがAI競争において後手に回っていると分析しています。完璧主義的なアプローチと市場投入速度のバランスをいかに取るかが、今後のAppleの課題となります。

MistralがオープンソースVoxtral音声モデルと超高速翻訳モデルを公開

新モデルの特徴

Voxtral Transcribe 2をオープンソース公開
オンデバイス動作で低コスト実現
高速翻訳モデルが大手AIに匹敵
数セント音声処理を実現
プライバシー保護のエッジ処理対応
多言語対応の幅が大幅拡大

開発者・企業への影響

オープンウェイト自社サービス統合可能
コスト効率クラウドAPIへの代替
リアルタイム翻訳アプリ開発が加速

Mistralは2026年2月4日、オープンソースの音声文字起こしモデル「Voxtral Transcribe 2」と超高速翻訳モデルを相次いで公開した。

Voxtral Transcribe 2はオンデバイスで動作し、処理コストが数セント程度と非常に低く、プライバシーを重視するアプリケーション開発者にとって魅力的な選択肢となる。

翻訳モデルはWiredの報道によると、OpenAIGoogleなど大手企業のモデルに匹敵する速度と精度を実現しており、オープンソースの競争力を示した。

両モデルともにHuggingFace経由でダウンロード・利用可能であり、開発者は自社サービスに統合することでクラウドAPIコストを削減できる。

Mistralのオープンソース戦略は欧州発AIの競争力を示すものとして注目されており、日本企業にとっても活用しやすいモデルの登場となった。

QualcommがSpotDraftのオンデバイスAI法律契約支援に出資

投資の概要

QualcommSpotDraftに出資
評価額2倍に上昇
オンデバイスAIの法律業務応用

オンデバイスAIの可能性

エンタープライズ法律AIの市場拡大
Snapdragonチップとの連携

Qualcommは契約管理AI企業SpotDraftに出資し、Snapdragonチップ上でオンデバイスで動作する法律AIの開発を支援します。評価額は2倍に上昇しました。

オンデバイス処理により機密法律文書クラウドに送信されないため、企業のプライバシーセキュリティ要件を満たしつつAIの恩恵を受けられます。

AppleがAI競争で周回遅れになった後、本当の挑戦が始まる

Appleの現状評価

Apple Intelligence の機能が競合に遠く及ばず
SiriGemini採用が独自AI限界を露呈
ハードウェア優位性だけでは不十分
AI時代の主導権をGoogleOpenAIに奪われる
独自LLM開発の遅延が競争力に直結

今後の課題と対策

エコシステム閉鎖性とAI開放性のジレンマ
プライバシー重視という戦略的定位を維持
オンデバイスAIでの差別化が重要
大型AI買収提携を検討か
デバイス販売への影響が深刻化リスク

複数のアナリストやメディアが、AppleがAI競争において本質的に出遅れていることを分析しています。SiriChatGPTGeminiと比べて大幅に見劣りし、最終的にGeminiSiriの基盤として採用するという判断自体が、Apple Intelligenceの限界を公式に認めるものです。

Appleプライバシー重視というポジショニングでオンデバイスAI処理を差別化戦略として活用しようとしていますが、クラウドAIとの性能差は顧客体験の差として直接現れています。ハードウェアの優位性だけでAI時代を乗り切れるかは疑問視されています。

今後のAppleの真の課題は単なる性能向上ではなく、AI時代のユーザー体験における独自の価値をどう定義するかです。プライバシーセキュリティエコシステム統合の観点から独自の立場を確立できるかが今後数年の競争力を左右します。

フィジカルAIが自動車産業を変革する——CES後の最新分析

自動車×AIの変革ロードマップ

Wiredが「フィジカルAIが自動車を変える」特集記事を掲載
センサーフュージョン・オンデバイス推論が成熟化
レベル2+から3への移行タイムラインが具体化
AI搭載ECUが車の知能化を本格的に担う時代へ
OEMとAI半導体企業の提携が相次ぐ
2026年から2028年が本格的な車載AI革命の期間

Wiredの特集記事は、「フィジカルAI」という概念が自動車産業でどのように具現化しているかを詳しく分析しています。NvidiaのDrive ThorQualcomm Snapdragon Ridgeなどの次世代車載AI半導体が、センサーフュージョン・自律走行判断・乗客インタラクションを統合的に処理できるようになりました。

CES 2026での各社発表を踏まえ、L2+(運転支援)からL3(特定条件下の完全自律)への移行が2026〜2028年に具体化すると見込まれています。トヨタ・BMW・Mercedes-Benzなど主要OEMがNvidiaQualcommとのパートナーシップを強化し、AI搭載ECUの車両統合を進めています。

日本の自動車産業にとっても、AI半導体の選択と車載ソフトウェア開発能力の構築が競争力を決める重要な局面です。ソフトウェア定義車両(SDV)への移行にAIが不可欠な要素として組み込まれています。

DellがAI PC消費者の無関心を公式認定——製品戦略の転換を迫られる

消費者離れの背景と実態

DellのCEOが「消費者はAI PCに無関心」と公式認定
AI PCのマーケティングが消費者に届いていない現実
高価格帯にもかかわらずAI機能の使用率が低い
エンタープライズ市場に軸足を移す戦略的シフト
Intel・AMDとの協調マーケティングの見直しを検討
Windows AI機能の普及が期待以下に止まる

AI PCエコシステムへの示唆

キラーアプリ不在が需要停滞の根本原因
ハードウェア先行でソフトウェアが追いつかない課題
Microsoftのローカルオンデバイス戦略の再考が必要
NPUの差別化が消費者に伝わっていない
PCメーカー各社の販売戦略の見直しを促す
B2B向けAI PC需要は堅調で二極化が進む

DellのMichael Dell CEOは公式に「消費者はAI PCの機能に関心を持っていない」と認め、業界に衝撃を与えました。AI PC市場を牽引するはずだったNPU(Neural Processing Unit)搭載モデルが、プレミアム価格にもかかわらず消費者の心を掴めていない実態が明らかになりました。

この発言は、IntelのCore Ultra、AMD Ryzen AI、QualcommのSnapdragon Xなど各社がAI PCを推進してきた2024〜2025年のマーケティング戦略の限界を示しています。キラーアプリケーションの欠如が最大の障壁で、ハードウェアの準備はできても使いたい体験が提供されていないことが原因です。

Dellはエンタープライズ向けのAI PC需要が堅調であることを踏まえ、B2Bセグメントへの注力を強化する方針です。AI PCの一般消費者への普及には、Copilot+のような具体的な価値提案が不可欠であり、ソフトウェアとユースケースの充実が最優先課題となっています。

CaterpillarがNvidiaとエッジAIで建設機械をスマート化

Caterpillar × Nvidiaの提携内容

建設機械へのエッジAI搭載を共同で推進
Nvidia Jetsonプラットフォームを重機に組み込む
リアルタイム作業最適化と予知保全を実現
機械の自律化・半自律化を段階的に実現
鉱山・建設・インフラ整備現場での活用を想定
人手不足が深刻な建設業界の課題解決に貢献

産業AIの普及に向けた意義

フィジカルAIの代表的な実用事例
過酷環境での信頼性を確保した堅牢な設計
低遅延処理でリアルタイム安全管理が可能
Caterpillarの広大なグローバル機材台数を活用
建設DXを加速するエコシステムの構築
製造業でのAI活用が他産業にも波及

世界最大の建設機械メーカーCaterpillarが、Nvidia提携して重機へのエッジAI統合を進めると発表しました。Nvidia Jetsonプラットフォームをブルドーザーや油圧ショベルなどの大型重機に搭載し、リアルタイムの作業最適化・予知保全・安全管理を実現します。

建設現場は変化の激しい非構造化環境であり、オンデバイスでのリアルタイムAI推論が不可欠です。クラウドへの接続が困難な鉱山・遠隔地建設現場でも動作する堅牢なエッジAIシステムとして、過酷な環境条件にも対応しています。

建設業界では深刻な人手不足と安全事故削減が急務であり、AI搭載重機は作業員の補助・代替だけでなく、危険作業の自動化による安全性向上も期待されます。Caterpillarのグローバルな機材台数を活かした大規模展開が見込まれ、産業AIの重要な先進事例となっています。

ReolinkがローカルAIハブで監視カメラの月額不要化を実現

プライバシー重視の設計思想

Reolink AI BoxがCESでローカル処理AIハブを発表
クラウドサブスクリプション不要でAI機能を利用可能
動体検知・人物認識・車両識別をローカルで処理
映像データがクラウドに送信されないため高いプライバシー
家庭・中小企業向けの費用対効果の高い選択肢に

セキュリティカメラ市場への影響

クラウド依存型のビジネスモデルへの挑戦
継続課金なしで高度なAI機能を提供
映像処理のリアルタイム性が向上
ネット環境に依存しないオフライン動作も可能
Arlo・Ringなどのクラウド型競合との差別化
IoTセキュリティ設備のAI化に新しい方向性

Reolinkが発表したAI Boxは、監視カメラのAI機能をクラウドではなくローカルで処理するハブデバイスです。QualcommEdge AIチップを搭載し、動体検知・人物認識・車両識別などの機能をサブスクリプション料金なしで利用できます。

月額料金が必要なArloやRingなどのクラウド型競合との差別化として、プライバシー重視とコスト効率を前面に打ち出しています。映像データが自宅のネットワーク内で完結するため、データ流出リスクが根本的に低減されます。

IoTセキュリティ機器のAI化において、クラウド課金モデルに代わるローカル処理モデルが選択肢として確立されつつあります。特に映像プライバシーを重視するユーザー層や、サブスクリプションコストを削減したい中小企業にとって魅力的な選択肢となっています。

AMD、CES 2026でAI PC向け新プロセッサを発表

Ryzen AI PC向け新アーキテクチャ

Lisa SuがCESキーノートでRyzen AI新世代を発表
NPU性能を大幅に向上させた最新アーキテクチャ
一般用途とゲーミング向けの2ラインを展開
Windows Copilot+との統合を最適化
ローカルAI処理でプライバシーとパフォーマンスを両立
QualcommIntelとのAI PC競争が本格化

AI PCエコシステムの成熟

PC搭載NPUがAI処理の主役に
クラウド依存なしのオンデバイスAIが普及段階へ
ゲーミング向けでAIフレーム補間精度が向上
電力効率向上でノートPCのバッテリー寿命延長
AIモデルのローカル実行が一般ユーザーに開放
対応アプリの増加がエコシステムを拡大

AMDのLisa Su CEOがCES 2026のキーノートでRyzen AIの新世代プロセッサを発表した。NPU(ニューラルプロセシングユニット)の性能を大幅に向上させ、一般用途とゲーミングの両カテゴリー向けに展開する。

新プロセッサはMicrosoftWindows Copilot+認定要件を大幅に上回る性能を持ち、ローカルでのStable Diffusion・Phi-3・Llamaなどの推論を快適に実行できる。クラウドに頼らないプライベートなAI処理が一般ユーザーに開放される。

ゲーミング向けプロセッサでは、AIフレーム生成技術の精度とレスポンスが向上し、低スペックのGPUでも高品質なゲーム体験が可能になる。AMDのFSR(FidelityFX Super Resolution)とAIの組み合わせがさらに進化した。

AI PCの競争ではQualcomm(Snapdragon X)・Intel(Meteor Lake後継)との激しい競合が続いている。AMDは特にx86アーキテクチャの互換性と高い実行性能を武器に、既存のWindowsソフトウェア資産を活かした差別化を図る。

電力効率の向上も注目点で、同等のAI処理性能を前世代より低い消費電力で実現するとされる。ノートPCでの長時間AI処理が可能になることで、モバイルワーカーにとっての実用性が大幅に向上する見込みだ。

GemmaとHF v5が新展開を加速

Gemmaの新バリアント

FunctionGemmaエッジ公開
T5Gemma 2が長文脈対応
累計DL3億件超を達成

研究・ツールの進展

MITが学習不適を覆す実験
HF v5で設計刷新
Kaggleで5日集中講座
C2Scaleで癌研究応用

GoogleGemmaモデルの新バリアント「FunctionGemma」を公開しました。エッジデバイス上でのカスタム関数呼び出しに特化した軽量設計で、オフライン環境での活用が広がります。

「T5Gemma 2」はGemma 3基盤のエンコーダー・デコーダーモデルで、マルチモーダル処理と長文脈への対応を初めて実現しており、文書分類や翻訳タスクでの活用が期待されています。

MITのCSAIL研究チームは、これまで学習不適とされてきたニューラルネットワークも短期間のガイダンスで効果的に学習できることを実験的に実証し、従来の通説を覆しました。

Hugging FaceTransformers v5でトークナイザーの設計を大幅に刷新し、学習済み語彙との分離によってコードのモジュール性を高め、カスタマイズと保守の容易さを向上させました。

KaggleとGoogleが共催した5日間のAIエージェント集中講座には世界中から多数の参加者が集まり、実践的なAI教育への高い需要と世界的なAI学習熱の高まりを改めて示しました。

Gemmaファミリーの累計ダウンロード数は3億件を突破しており、一般的なNLPタスクを超えて癌研究(C2Scale)など高度に専門化された科学的応用も着実に増加しています。

AdobeにAI学習の著作権集団訴訟

Adobeへの著作権集団訴訟

Adobe海賊版書籍でAIモデルを学習したと訴訟
問題のSlimPajamaデータセットにBooks3が含まれると主張
同様の訴訟がAppleSalesforceにも拡大
Anthropicは類似訴訟で15億ドルの和解に合意

AI時代の創造性論争

Wicked監督Chuが人間の即興こそ映画の美しさと主張
AIツールの利便性と創造的原罪を対比
雨中の撮影など予期せぬ瞬間がアートを生む

Adobe著作権侵害を主張する集団訴訟に直面しています。オレゴン州の作家Elizabeth Lyonが原告となり、AdobeオンデバイスAIモデル「SlimLM」の学習データに彼女の著作物が無断使用されたと訴えています。

訴状によれば、AdobeはSlimPajama-627Bデータセットを学習に使用しており、このデータセットは著作権問題で知られるBooks3を含むRedPajamaデータセットの改変版であるとされています。Books3は19万1000冊の書籍データを含むデータセットで、GenAI学習に広く使用されてきました。

同様の訴訟はAppleApple Intelligenceの学習データ問題)やSalesforceにも提起されており、AI学習データにおける著作権問題は業界全体の課題となっています。AnthropicClaudeの学習データに関する類似訴訟で2025年9月に15億ドルの和解に合意しており、業界の転換点とみられています。

一方でWicked映画の監督Jon M. Chuは、AI時代における芸術の本質について深い見解を示しました。生成AIは有用なツールであると認めつつも、スクリプトには書けないような予期せぬ瞬間、例えば雨中の撮影でカメラを役者に近づけた瞬間こそがアートを本物にすると語っています。

Chuは生成AIが学習データの「原罪」(同意なしの大規模データマイニング)を抱えており、アーティストにとってそれを乗り越えることは難しいと述べています。同時に技術が進歩し続ける現実も認識しており、「私はテクノロジーが嫌いではない。私たちが何を大切にするかを人間が選ぶ」と語っています。

AI著作権問題は、技術の急速な発展と既存の知的財産保護の枠組みとの根本的な衝突を示しています。訴訟の行方は業界全体のAI学習データの在り方に大きな影響を与える可能性があります。

Google、オンデバイスAI開発コンペの受賞者を発表

障害者支援とオフライン活用

視覚障害者向けウェアラブルAIが優勝
胸部カメラ映像をリアルタイム解析
認知障害者支援の完全オフライン動作
個人の発話特徴をローカル学習

警備・教育へのエッジ実装

警備カメラ映像の文脈的脅威判定
通信遮断地域での教育ハブ構築
ロボットJetson上での実装

Googleは12月10日、オンデバイスAIモデル「Gemma 3n」を活用した開発コンペ「Impact Challenge」の受賞者を発表しました。600以上の応募から選出されたプロジェクトは、クラウドに依存しないエッジAIが、低遅延かつ高プライバシーで社会課題を解決する可能性を実証しています。

最優秀賞の「Gemma Vision」は、視覚障害者が胸部に装着したカメラ映像をAIが解析し、周囲の状況を伝えるウェアラブルアシスタントです。白杖を持つ手が塞がらないよう音声や小型コントローラーで操作でき、すべての処理をデバイス上で完結させることで、実用的な応答速度を実現しています。

2位の「Vite Vere Offline」は、認知障害者のために画像音声指示に変換する完全オフラインアプリです。3位の「3VA」は、脳性麻痺を持つデザイナー向けにピクトグラムを豊かな文章へ変換するシステムで、ローカル環境での追加学習により、個人の意図を正確に反映させることに成功しました。

そのほか、警備カメラの映像から脅威のみを文脈的に識別するシステムや、インターネット接続がない地域向けの教育用マイクロサーバーなど、多彩なプロジェクトが入賞しました。これらの事例は、AIが画面の中だけでなく、物理的な制約のある現場でいかに具体的価値を生み出せるかを示唆しています。

Google、Android XR拡大 Galaxy新機能とXreal製グラス公開

Galaxy XRの機能拡張

Galaxy XRがWindows PCと連携、作業空間を拡張
移動中も画面が安定するトラベルモードを搭載
表情をリアルに再現するLikenessで自然な対話

軽量グラス「Project Aura」

Xrealと協業、軽量な有線XRグラスProject Aura
70度の視野角を持ち、現実とデジタル情報を融合
サングラスのような形状でAndroidアプリが動作

エコシステムの開放戦略

既存アプリが修正なしで動作、開発コストを抑制
AIグラスはiPhoneにも対応、囲い込みを打破

Googleは8日、Android XRの大型アップデートと新デバイス計画を発表しました。Samsung製ヘッドセット「Galaxy XR」の機能強化に加え、Xrealと共同開発した軽量グラス「Project Aura」を初公開。AppleMetaが先行するXR市場に対し、オープンなエコシステムで攻勢を強めます。

Galaxy XR向けには、生産性を高める新機能が追加されました。Windows PCと接続して仮想空間に画面を表示する「PC Connect」や、飛行機内でも安定した映像を楽しめる「トラベルモード」が登場。自身のリアルな表情をアバター化する「Likeness」により、ビデオ会議の質も向上します。

注目は、Xrealと提携した有線XRグラス「Project Aura」です。従来のヘッドセットとは異なり、サングラスのような軽量な形状を実現。スマホ等と有線接続し、70度の視野角で現実世界にデジタル情報を重ねて表示できます。2026年の発売を目指し、日常使いできるXRデバイスとして期待されます。

Android XRの最大の強みは、既存のAndroidアプリ資産を活用できる点です。UberやYouTube Musicなどのアプリが、開発者の追加作業なしでXRデバイス上で動作します。これにより、競合他社が苦戦するアプリ不足の問題を解消し、ユーザーにとっての実用性を即座に提供します。

さらにGoogleは、AIグラスにおけるiOS対応も明言しました。iPhoneユーザーでもGemini機能をフルに利用可能にする方針で、OSの壁を超えた普及を狙います。特定のハードウェアに縛られない柔軟な戦略は、ウェアラブル市場におけるGoogleの優位性を高める一手となるでしょう。

スマホNPU進化も恩恵不明確、主要AIはクラウド依存

性能向上と用途の乖離

NPU性能は数ヶ月で4割向上
具体的な実用メリットの説明不足
メーカーによるスペック競争が先行

オンデバイスAIの現在地

理想はセキュリティな個人AI
現実はクラウド処理が主流
ハード進化に見合うアプリ不在

スマートフォンに搭載されるNPUの性能が飛躍的に向上しているにもかかわらず、ユーザーが享受するAI体験の質は変わっていないと米Ars Technicaが報じました。チップメーカーが誇るハードウェアの進化と、実際のアプリ利用におけるクラウド依存の現状に大きな乖離が生じています。

NPUは数ヶ月ごとに30〜40%の高速化を実現していますが、その処理能力を活かす具体的な用途は提示されていません。消費者は「なぜAI用のハードウェアが必要なのか」という疑問に対する明確な答えを得られず、メーカーによるスペック競争の恩恵を実感できていないのが実情です。

専門家は、プライバシー保護に優れたオンデバイスAIの普及を期待していますが、主要な生成AIツールは依然としてデータセンター上の巨大サーバーで稼働しています。スマホ単体で完結する高度なAI処理が実現しない限り、手元の高性能チップは有効活用されません。

Liquid AI、エッジAI開発の「設計図」を全公開

企業向け小規模モデルの革新

51ページの技術レポートを公開
独自のLFM2アーキテクチャ詳解
CPU環境での推論効率を最大化
競合を凌ぐ処理速度と品質

実践的なハイブリッド戦略

自社データでのオンプレミス運用
画像音声対応のマルチモーダル
クラウド不要のローカル処理実現
エッジとクラウド協調動作

MIT発のスタートアップLiquid AIは2025年12月1日、最新AIモデル「LFM2」の技術レポートを公開しました。これは単なるモデル提供にとどまらず、企業が独自のハードウェア制約に合わせて高性能な小規模モデルを構築するための「設計図」を提供するものです。巨大なGPUクラスターを前提としないこのアプローチは、コストやプライバシーを重視する企業のAI戦略に、オンデバイスでの実用化という新たな選択肢をもたらします。

LFM2の最大の特徴は、一般的なCPUやモバイルSoC上での動作に最適化されている点です。独自開発されたハイブリッドアーキテクチャにより、同規模の競合モデルであるLlama 3.2やGemma 3と比較して、推論速度と品質の両面で高いパフォーマンスを発揮します。これにより、スマートフォンやノートPC、産業機器など、通信環境や電力に制約のあるエッジ環境でも、遅延の少ない高度なAI処理が可能になります。

今回公開された51ページのレポートでは、アーキテクチャ探索プロセスやトレーニングデータの混合比率、知識蒸留の手法など、モデル開発の詳細なレシピが明かされました。企業はこの情報を参照することで、ブラックボックス化した外部APIに依存することなく、自社のデータセンターデバイス上で完結するAIシステムを構築・運用できるようになります。これは、セキュリティ要件の厳しい産業分野において大きなアドバンテージです。

さらにLFM2は、テキストだけでなく画像音声にも対応するマルチモーダル機能を、トークン効率を極限まで高めた形で実装しています。現場でのドキュメント理解や音声操作といったタスクを、データを外部に送信することなくローカルで完結させることが現実的になります。Liquid AIの提示するこのモデルは、エッジとクラウドが適材適所で連携する「ハイブリッドAI」時代の標準的な構成要素となるでしょう。

Hugging Faceがv5発表、PyTorch特化と相互運用性強化

開発効率を高める構造改革

モデル定義をモジュール化し保守性向上
開発基盤をPyTorchへ完全一本化

実用性を極めた学習・推論

大規模な事前学習への対応を強化
OpenAI互換の推論サーバー機能導入
低精度の量子化を標準機能として統合

エコシステムをつなぐハブへ

外部推論エンジンとの連携を円滑化
ローカル実行オンデバイス対応

Hugging Faceは、AI開発のデファクトスタンダードであるライブラリの最新版「Transformers v5」を発表しました。本バージョンでは「相互運用性」と「シンプルさ」を最優先し、コード構造のモジュール化やPyTorchへのバックエンド一本化を断行。急速に拡大するAIエコシステムにおいて、エンジニアがより効率的に学習・推論を行えるよう、量子化の標準サポートや外部ツールとの連携を強化した大型アップデートです。

前バージョンのリリースから5年、Transformersは爆発的な成長を遂げました。1日あたりのインストール数は2万回から300万回へと急増し、累計ダウンロード数は12億回を突破。サポートするモデルアーキテクチャも40種類から400種類以上へと拡大しており、AI技術の民主化と普及を支える重要なインフラとしての地位を確立しています。

v5の最大の焦点は「シンプルさ」の追求です。開発チームは「コードこそが製品である」という哲学のもと、モデル定義のモジュール化を推進。複雑化していたコードベースを整理し、新しいモデルの追加や保守を容易にしました。これにより、コミュニティによる貢献プロセスが簡素化され、最新モデルへの対応速度がさらに向上します。

技術的な大きな転換点として、バックエンドをPyTorchに一本化します。TensorFlowやFlaxのサポートを縮小し、PyTorch財団との連携を深めることで、パフォーマンスと安定性を最大化します。同時に、JAXエコシステムとの互換性は維持し、多様な開発環境やニーズに応える柔軟性も確保しています。

実用面では、推論機能と量子化が大幅に強化されました。新たにOpenAI互換のAPIを持つ「transformers serve」を導入し、手軽な推論サーバー構築が可能に。また、8-bitや4-bitといった低精度モデルの量子化を「第一級市民」として扱い、リソース制約のある環境でも高性能なモデルを効率的に扱えるようになります。

最終的な目標は、あらゆるAIツールとのシームレスな連携です。UnslothやAxolotlでの学習から、vLLMやllama.cppを用いた推論・ローカル実行まで、Transformers v5はエコシステムのハブとして機能します。この高い相互運用性により、開発者は最適なツールを自由に組み合わせ、生産性を最大化できるでしょう。

MSのPC操作AI「Fara-7B」 端末完結でGPT-4o凌駕

端末完結でGPT-4o超え

70億パラメータの軽量モデルでPC動作
WebVoyagerで勝率73.5%を達成
視覚情報のみでマウス・キー操作

高度なプライバシーと安全設計

データが外部に出ないピクセル主権
重要操作前に停止する安全機構

革新的な学習手法と入手性

合成データによる効率的な学習
MITライセンスで商用利用も可能

マイクロソフトは2025年11月24日、PC操作に特化した新しい小規模言語モデル(SLM)「Fara-7B」を発表しました。わずか70億パラメーターながら、GPT-4oベースのエージェントを凌駕する性能を記録。データが外部に出ないオンデバイス実行を実現し、プライバシー保護と低遅延を両立させています。

最大の特徴は、人間と同じように画面の視覚情報だけを頼りに操作を行う点です。HTMLコード等の裏側情報を必要とせず、スクリーンショットからボタン位置などを認識してマウスやキーボードを操作します。Web操作のベンチマーク「WebVoyager」では、GPT-4o(65.1%)を上回る73.5%のタスク成功率を達成しました。

ビジネス利用で重要なのがセキュリティです。Fara-7Bはローカル環境で動作するため、機密情報がクラウドに送信されるリスクを排除する「ピクセル主権」を確立しています。また、送金やメール送信などの不可逆的な操作の直前には、必ずユーザーの同意を求める「クリティカルポイント」機能が組み込まれています。

開発には「知識の蒸留」という高度な手法が用いられました。マルチエージェントシステム「Magentic-One」が生成した14万件以上の高品質な合成データを学習させることで、小型モデルながら複雑な推論能力を獲得しています。ベースモデルには視覚処理に優れたQwen2.5-VL-7Bが採用されました。

本モデルは現在、Hugging Face等を通じてMITライセンスで公開されており、商用利用を含む試験運用が可能です。Windows 11搭載のCopilot+ PCでも動作確認済みで、企業は自社のセキュリティ要件に合わせたPC操作自動化エージェントの開発を、低コストかつ安全に開始できます。

PowerToysのAI貼り付け、ローカル処理で無料・安全化

ローカルAI活用でコスト削減

NPU活用でAPI課金不要
データを守るオンデバイス処理
オフラインでも翻訳・要約が可能

多様なモデルへの対応拡大

GeminiMistralも選択可能
オープンソースのOllamaと連携
UI改善で操作性向上

MicrosoftWindows 11向けユーティリティ「PowerToys」を更新し、Advanced Paste機能を強化しました。ユーザーはクラウドを経由せず、デバイス上のAIモデルを利用して高度な貼り付けが可能になります。

特筆すべきは、NPU(ニューラル処理装置)を活用した完全ローカル処理です。これによりAPI利用料が不要になるほか、データが外部に送信されないため、機密情報を含むテキストも安心して扱えます。

具体的には、Microsoft Foundry LocalやOllamaを介してローカルモデルを実行します。クリップボードの内容を瞬時に翻訳・要約するなど、業務効率を飛躍的に高める機能が手軽に利用可能です。

さらに、連携可能な外部モデルも拡充されました。従来のOpenAIに加え、Azure OpenAIGeminiMistralに対応。用途や契約状況に応じて最適なAIモデルを柔軟に選択できる設計へと進化しています。

Google、インドでAI詐欺対策強化も機種と言語に課題

AIによる通話詐欺検知

Gemini Nanoで解析
Pixel 9以降かつ英語のみ

画面共有の悪用防止

金融アプリ利用時に警告
ワンタップで共有停止

普及への高いハードル

Pixelシェア1%未満
偽アプリ根絶に至らず

Googleは20日、インドにおけるデジタル詐欺対策として、AIを活用した新たな保護機能を発表しました。Pixel 9シリーズ向けのリアルタイム詐欺検出や、主要な金融アプリでの画面共有警告などが導入されます。インドではデジタル決済の普及に伴い詐欺被害が急増しており、2025年だけで数億ドル規模の損失が発生している深刻な状況に対応する狙いです。

目玉となるのは、同社の軽量AIモデルGemini Nanoを活用した通話分析機能です。デバイス上で処理が完結するため、通話内容がGoogleのサーバーに送信されることはありません。未知の番号からの通話中に詐欺の兆候を検知すると、ユーザーに警告音と通知で知らせる仕組みですが、現状は英語のみの対応となっています。

この機能の普及には大きな壁が存在します。インドのスマートフォン市場でAndroidは96%を占めますが、対応するPixel端末のシェアは1%未満に過ぎません。また、多言語国家であるインドにおいて、英語話者のみを対象とした機能展開では、最も脆弱な層を保護しきれないという指摘もあります。

一方で、より広範なユーザーに向けた対策も講じられています。PaytmやGoogle Payなどの金融アプリと連携し、通話中に画面共有を求められた際に警告を表示する機能を試験導入しました。詐欺師がワンタイムパスワード等を盗み見る手口を防ぐもので、こちらは将来的にインドの現地言語にも対応する予定です。

Googleは他にも、サイドローディングによる危険なアプリのインストールを1億回以上ブロックするなど対策を強化しています。しかし、公式ストアであるGoogle Play上でも依然として偽アプリが散見されるなど、巨大なエコシステムの健全化には依然として課題が残されています。

Pixel大型更新、AIが通知要約し生産性を劇的改善

AIで業務効率を最大化

長文会話をAIが自動で要約
通話内容を自動で文字起こし・要約
AIが詐欺の可能性をチャットで警告
重要連絡先(VIP)の通知を自動で優先

Geminiで創造性を解放

メッセージ内で写真をAIが再構成
集合写真の表情や装飾をAIが修正

利便性と安全性の向上

詐欺電話検知を多国で展開
マップに電力モードを追加

Googleは2025年11月、同社のスマートフォン「Pixel」シリーズ向けに、AI機能を大幅に強化するソフトウェアアップデート「Pixel Drop」を発表しました。AIモデルGeminiを活用し、通知の自動要約や高度な詐欺検知、写真編集など多岐にわたる新機能を提供。ビジネスユーザーの生産性向上とセキュリティ強化を両立させるアップデートとなっています。

今回のアップデートの目玉は、AIによる通知の自動要約機能です。長文のメッセージや活発なグループチャットの内容を通知画面で簡潔にまとめてくれるため、重要な情報を素早く把握できます。情報過多になりがちな現代において、ビジネスパーソンが集中力を維持し、効率的にコミュニケーションを取る上で強力なツールとなるでしょう。

セキュリティ面も大幅に強化されました。チャットメッセージの通知段階で、AIが詐欺の可能性を検知し「Likely scam」と警告を表示する新機能を追加。従来の通話中の詐欺検知機能も、イギリスやカナダなど提供地域を拡大し、巧妙化するオンライン詐欺からユーザーを保護する体制をグローバルに広げています。

Googleの最新AIモデルGemini Nanoオンデバイスで活用される点も注目です。メッセージアプリ内で写真を再構成する「Remix」機能や、通話内容を文字起こし・要約する「Call Notes」機能(日本でも利用可能に)が実装され、創造性と業務効率の両面でAIの力をより身近に体感できるようになりました。

Googleフォトでは、AIによる写真編集機能がさらに進化。「Help me edit」機能を使えば、「サングラスを外して」「笑顔にして」といった自然言語の指示で、集合写真の細部を簡単に修正できます。個人の写真ライブラリから最適な画像を基に編集するため、極めて自然な仕上がりが特徴です。

このほか、重要な連絡先からの通知を優先するVIP機能の強化や、Googleマップ運転中のバッテリー消費を抑える省電力モードも追加されました。今回のアップデートは、AIをあらゆる場面で活用し、ユーザー体験を向上させるGoogleの強い意志を示すものと言えます。

Google、新AI基盤でプライバシーと高性能を両立

プライバシーとAI性能の両立

高度なAI処理をクラウドで実現
AppleのPCCに類似した仕組み

堅牢なセキュリティ技術

専用チップTPUで処理を高速化
技術TEEでデータを隔離・暗号化
Googleさえアクセス不可能な設計

身近な機能の高度化

Pixel 10の新機能「Magic Cue」強化
Recorderアプリの多言語要約

Googleは11日、ユーザーデータのプライバシーを保護しながら、クラウド上で高度なAIモデル「Gemini」を実行できる新基盤「Private AI Compute」を発表しました。オンデバイス処理と同等のセキュリティを保ちつつ、より複雑なAIタスクを可能にします。これはAppleの「Private Cloud Compute」に追随する動きです。

AI機能が高度化するにつれ、スマートフォンなどのデバイス上での処理には計算能力の限界が見えてきました。そこでGoogleは、プライバシーを保護したままクラウドの膨大な計算資源を活用するハイブリッドなアプローチとして、この新基盤を開発しました。利便性と安全性の両立を目指します。

新基盤の中核は、Google独自のAIチップTPU(Tensor Processing Units)と、データを隔離・暗号化するTEE(信頼できる実行環境)です。これにより、ユーザーデータはクラウド上で処理される際にも保護され、Google自身でさえ内容を閲覧することは不可能だと説明しています。

この動きは、Appleが先に発表した「Private Cloud Compute」と酷似しており、大手IT企業間でAIのプライバシー保護が重要な競争軸となっていることを示しています。ユーザーは、利便性とプライバシーの両方を高いレベルで享受できる時代を迎えつつあるのではないでしょうか。

具体的な応用例として、次期スマートフォン「Pixel 10」に搭載されるAI機能「Magic Cue」の提案精度が向上するほか、録音アプリ「Recorder」での文字起こし要約がより多くの言語で利用可能になります。身近な機能がより賢く、便利になることが期待されます。

Googleは、このシステムの安全性を客観的に示すため、セキュリティ企業NCC Groupによる独立した分析を受けたことも公表しています。厳格なプライバシーガイドラインを満たしていることが確認されており、技術的な透明性の確保に努める姿勢を見せています。

今回の発表は始まりに過ぎないとGoogleは述べています。今後、オンデバイスクラウドの長所を融合させたプライベートAI技術が、検索Gmailなど、より広範なサービスに展開される可能性があります。企業のAI活用においても重要な選択肢となるでしょう。

家庭用AI『Gemini』、米国で先行提供開始

Gemini搭載の新アシスタント

既存アシスタント刷新
Nestデバイス上動作
より複雑なタスクと自然な会話
基盤はGemini LLM

早期アクセスの注意点

アシスタントには戻れない
一部機能は有料プラン限定
参加にはアプリからの申請が必要
対象は米国ユーザーから

Googleは2025年10月29日、米国のスマートホームユーザー向けに、新しいAIアシスタントGemini for Home」の早期アクセス提供を開始しました。これは、同社のNestデバイスに搭載されている既存のGoogleアシスタントを置き換えるもので、スマートホーム体験を根本から刷新する重要なアップデートとなります。

Gemini for Home」の最大の特徴は、基盤となる大規模言語モデル(LLM)Geminiです。これにより、従来のGoogleアシスタントと比較して、より複雑な指示を理解し、実行できるようになります。また、人間と話しているかのような、より自然で文脈に沿った会話が可能になる点も大きな進化と言えるでしょう。

早期アクセスに参加するには、Google Homeアプリの設定メニューから申請が必要です。承認されると、利用者が持つ全ての対応デバイスでGemini for Homeが有効になります。ただし、一度切り替えると元のGoogleアシスタントに戻すことはできないため、注意が必要です。

また、一部の高度な機能は有料サブスクリプション「Google Home Premium」の加入者限定となります。リアルタイムで対話できる「Gemini Live」や、カメラの録画履歴をAIで検索する機能などがこれに該当します。今回の動きは、家庭におけるAI活用を本格化させるGoogleの強い意志の表れと言えます。

AI開発の生産性向上、ソフトウェアの断片化解消が鍵

AI開発を阻む「複雑性の壁」

断片化したソフトウェアスタック
ハードウェア毎のモデル再構築
6割超のプロジェクトが本番前に頓挫
エッジ特有の性能・電力制約

生産性向上への道筋

クロスプラットフォームの抽象化レイヤー
最適化済みライブラリの統合
オープン標準による互換性向上
ハードとソフトの協調設計

ArmをはじめとするAI業界が、クラウドからエッジまで一貫した開発を可能にするため、ソフトウェアスタックの簡素化を急いでいます。現在、断片化したツールやハードウェア毎の再開発がAIプロジェクトの大きな障壁となっており、この課題解決が開発の生産性と市場投入の速度を左右する鍵を握っています。

AI開発の現場では、GPUやNPUなど多様なハードウェアと、TensorFlowやPyTorchといった異なるフレームワークが乱立。この断片化が非効率な再開発を招き、製品化までの時間を浪費させています。調査会社ガートナーによれば、統合の複雑さを理由にAIプロジェクトの6割以上が本番前に頓挫しているのが実情です。

このボトルネックを解消するため、業界は協調した動きを見せています。ハードウェアの違いを吸収する抽象化レイヤーの導入、主要フレームワークへの最適化済みライブラリの統合、ONNXのようなオープン標準の採用などが進んでいます。これにより、開発者はプラットフォーム間の移植コストを大幅に削減できるのです。

簡素化を後押しするのが、クラウドを介さずデバイス上でAIを処理する「エッジ推論」の急速な普及です。スマートフォンや自動車など、電力や処理能力に制約のある環境で高性能なAIを動かすには、無駄のないソフトウェアが不可欠です。この需要が、業界全体のハードウェアとソフトウェアの協調設計を加速させています。

この潮流を主導するのが半導体設計大手のArmです。同社はCPUにAI専用の命令を追加し、PyTorchなどの主要ツールとの連携を強化。これにより開発者は使い慣れた環境でハードウェア性能を最大限に引き出せます。実際に、大手クラウド事業者へのArmアーキテクチャ採用が急増しており、その電力効率の高さが評価されています。

AIの次なる競争軸は、個別のハードウェア性能だけでなく、多様な環境でスムーズに動作する「ソフトウェアの移植性」に移っています。エコシステム全体で標準化を進め、オープンなベンチマークで性能を競う。こうした協調的な簡素化こそが、AIの真の価値を引き出し、市場の勝者を決めることになるでしょう。

MITとIBM、小型・効率AIで産業応用を加速

産学連携が生む圧倒的成果

特許54件、引用12万件超
産業ユースケース50件以上を創出
医療や化学など多分野へ応用

「巨大」から「小型・効率」へ

巨大モデルからタスク特化型へ転換
性能を維持しモデルを小型化
エッジデバイスでの高速処理実現

少ないデータで賢く学習

自己修正で推論精度を高める新手法
PoCで終わらせない実用化を推進

マサチューセッツ工科大学(MIT)とIBMが共同で運営する「MIT-IBM Watson AI Lab」は、AI開発の新たな方向性を示しています。設立8周年を迎えた同ラボは、巨大な基盤モデルから、より小さく効率的でタスクに特化したモデルの開発に注力。研究と実用化のギャップを埋め、産業界でのAI活用を加速させることを目指します。これは、AIプロジェクトの多くが概念実証(PoC)で頓挫する現状への明確な回答と言えるでしょう。

この産学連携は目覚ましい成果を上げています。これまでに特許54件を出願し、論文の引用数は12万8000件を超えました。さらに、ヘルスケアや金融、化学など多岐にわたる分野で50件以上の産業ユースケースを創出。AI画像技術によるステント留置の改善や、計算コストの大幅な削減など、具体的なイノベーションを生み出し続けています。

なぜ今、「小型・効率化」が重要なのでしょうか。調査会社ガートナーによると、生成AIプロジェクトの少なくとも30%が2025年末までに概念実証(PoC)の段階で中止されると予測されています。多くの企業がAIへの期待を抱きつつも、価値ある成果に繋げられていないのです。同ラボは、この研究と実用の間の「死の谷」を埋める役割を担っています。

小型化の鍵を握るのが、`once-for-all`や`AWQ`といった革新的な技術です。これらの手法は、モデルのアーキテクチャを最適化し、性能を維持したままサイズを圧縮します。これにより、スマートフォンなどのエッジデバイス上でもAIを高速に実行できるようになります。遅延を減らし、リアルタイムでの応用範囲を大きく広げる可能性を秘めています。

さらに、少ないデータで賢く学習する技術も進化しています。例えば`COAT`(Chain-of-Action-Thought)と呼ばれる手法は、AIが自らの推論プロセスを反復的に自己修正することで、より正確な答えを導き出します。これは、限られた計算資源とデータで、現実世界の複雑な課題を解決するための重要なアプローチです。

これらの研究成果は、IBMのプラットフォーム`watsonx`などを通じて実用化されています。一例が、コンパクトながら高精度な文書理解能力を持つ`Granite Vision`モデルです。企業が保有する膨大な文書から、信頼性の高い情報を抽出し、要約するニーズに応えます。

MIT-IBM Watson AI Labが目指すのは「有用で効率的な知能」の創出です。巨大モデルの開発競争から一歩進み、目的に合わせて最適化されたAIこそが、真の経済的・社会的価値を生み出すと彼らは考えています。この産学連携の取り組みは、AIの実用化を目指す全ての企業にとって、重要な指針となるでしょう。

AI PCが再定義する生産性、鍵は「創造性」

AI PCがもたらす価値

ローカルAI処理による高速化
機密データを保護するセキュリティ
オフラインでも作業可能
低遅延と省エネルギーの実現

創造性が生む事業成果

市場投入までの時間短縮
外部委託費の削減
顧客エンゲージメントの向上
従業員の満足度と定着率向上

AI PCの登場が、ビジネスにおける「生産性」の定義を根底から変えようとしています。マサチューセッツ工科大学(MIT)の研究で生成AIが人間の創造性を高めることが示される中、NPU(Neural Processing Unit)を搭載した次世代PCがその能力を最大限に引き出します。デバイス上でAI処理を完結させることで、低遅延、高セキュリティ、省エネを実現し、単なる効率化ツールを超えた価値を提供し始めています。

企業のIT意思決定者の45%が、すでにAI PCを創造的な業務支援に活用しています。しかし、一般の知識労働者における同目的での利用率は29%にとどまり、組織内で「クリエイティブ格差」が生じているのが現状です。この格差を埋めることが、AI PCのポテンシャルを全社的に引き出す鍵となります。

AI PCは、従業員が創造的な作業に集中できる環境を整えます。専用のNPUがAI関連の負荷を担うため、ユーザーは思考を中断されることなく、アイデア創出に没頭できます。これにより、バッテリー寿命が延び、待ち時間が減少。デザイン動画制作、資料作成など、あらゆる業務でリアルタイムの試行錯誤が可能になります。

この創造性の向上は、具体的な事業成果に直結します。マーケティング部門では、数週間かかっていたキャンペーン素材を数時間で生成。技術部門では、設計や試作品開発のサイクルを大幅に短縮しています。営業担当者は、オフラインの顧客先でもパーソナライズされた提案書を即座に作成でき、案件化のスピードを高めています。

最終的に、AI PCは従業員の働きがいをも向上させます。HPの調査では、従業員が仕事に健全な関係を築く上で最も重要な要素は「充実感」であることが示されています。単なるタスク処理ではなく、創造性を発揮できるツールを与えることは、生産性、満足度、定着率の向上につながるのです。

CIO(最高情報責任者)にとって、AI PCの導入は単なる機器の高速化ではありません。その真価は、従業員の創造性を解放し、新たなアイデアや協業、競争力を生み出す企業文化を醸成することにあります。AI PCをいかに活用し、組織全体の創造性を高めるかが、今後の成長を左右するでしょう。

Acer、50TOPSのAI搭載Chromebookを投入

強力なオンデバイスAI

MediaTek製CPUを搭載
50TOPSのAI処理能力
高速・安全なオフラインAI
AIによる自動整理や画像編集

ビジネス仕様の高性能

360度回転する2-in-1設計
最大17時間の長時間バッテリー
最新規格Wi-Fi 7に対応
Gemini 2.5 Proが1年間無料

Googleは、Acer製の新型ノートPC「Acer Chromebook Plus Spin 514」を発表しました。最大の特徴は、MediaTek Kompanio Ultraプロセッサが実現する強力なオンデバイスAI機能です。オフラインでも高速に動作するAIが、ビジネスパーソンの生産性を飛躍的に高める可能性を秘めています。

新モデルは、50TOPSという驚異的なAI処理能力を備えています。これにより、タブやアプリを自動で整理する「スマートグルーピング」や、AIによる高度な画像編集デバイス上で直接、高速かつ安全に実行できます。機密情報をクラウドに送る必要がないため、セキュリティ面でも安心です。

ハードウェアもビジネス利用を強く意識しています。360度回転するヒンジでノートPCとタブレットの1台2役をこなし、14インチの2.8K高解像度タッチスクリーン、最大17時間持続するバッテリー、最新のWi-Fi 7規格への対応など、外出先でも快適に作業できる仕様です。

購入者特典として、Googleの最先端AIモデル「Gemini 2.5 Pro」や2TBのクラウドストレージを含む「Google AI Proプラン」が12ヶ月間無料で提供されます。これにより、文書作成やデータ分析といった日常業務がさらに効率化されるでしょう。

今回、デスクトップ型の「Acer Chromebox CXI6」と超小型の「Acer Chromebox Mini CXM2」も同時に発表されました。オフィスでの固定利用から省スペース環境まで、多様なビジネスシーンに対応する製品群で、AI活用を推進する姿勢がうかがえます。

AI21が25万トークン対応の小型LLMを発表、エッジAIの経済性を一変

小型モデルの定義変更

30億パラメータのオープンソースLLM
エッジデバイスで25万トークン超を処理
推論速度は従来比2〜4倍高速化

分散型AIの経済性

MambaとTransformerハイブリッド構造採用
データセンター負荷を減らしコスト構造を改善
高度な推論タスクをデバイスで実行

企業利用の具体例

関数呼び出しやツールルーティングに最適
ローカル処理による高いプライバシー確保

イスラエルのAIスタートアップAI21 Labsは、30億パラメータの小型オープンソースLLM「Jamba Reasoning 3B」を発表しました。このモデルは、ノートPCやスマートフォンなどのエッジデバイス上で、25万トークン以上という異例の長大なコンテキストウィンドウを処理可能であり、AIインフラストラクチャのコスト構造を根本的に変える可能性を秘めています。

Jamba Reasoning 3Bは、従来のTransformerに加え、メモリ効率に優れたMambaアーキテクチャを組み合わせたハイブリッド構造を採用しています。これにより、小型モデルながら高度な推論能力と長文処理を両立。推論速度は従来のモデルに比べて2〜4倍高速であり、MacBook Pro上でのテストでは毎秒35トークンを処理できることが確認されています。

AI21の共同CEOであるオリ・ゴーシェン氏は、データセンターへの過度な依存が経済的な課題となっていると指摘します。Jamba Reasoning 3Bのような小型モデルをデバイス上で動作させることで、高価なGPUクラスターへの負荷を大幅に軽減し、AIインフラストラクチャのコスト削減に貢献し、分散型AIの未来を推進します。

このモデルは、特に企業が関心を持つユースケースに最適化されています。具体的には、関数呼び出し、ポリシーに基づいた生成、そしてツールルーティングなどのタスクで真価を発揮します。シンプルな業務指示や議事録作成などはデバイス上で完結し、プライバシーの確保にも役立ちます。

Jamba Reasoning 3Bは、同規模の他の小型モデルと比較したベンチマークテストでも優位性を示しました。特に長文理解を伴うIFBenchやHumanity’s Last Examといったテストで最高スコアを獲得。これは、同モデルがサイズを犠牲にすることなく、高度な推論能力を維持していることを示しています。

企業は今後、複雑で重い処理はクラウド上のGPUクラスターに任せ、日常的かつシンプルな処理はエッジデバイスでローカルに実行する「ハイブリッド運用」に移行すると見られています。Jamba Reasoning 3Bは、このハイブリッド戦略の中核となる効率的なローカル処理能力を提供します。

iOS 26、オンデバイスAIでアプリ体験を刷新

オンデバイスAIの利点

推論コスト不要でAI機能実装
プライバシーに配慮した設計
ネット接続不要のオフライン動作

主な活用パターン

テキストの要約・生成・分類
ユーザー入力に基づく自動提案機能
音声からのタスク分解・文字起こし
パーソナライズされた助言・フィードバック

Appleが2025年の世界開発者会議(WWDC)で発表した「Foundation Models framework」が、最新OS「iOS 26」の公開に伴い、サードパーティ製アプリへの実装が本格化しています。開発者は、デバイス上で動作するこのローカルAIモデルを利用し、推論コストをかけずにアプリの機能を向上させることが可能です。これにより、ユーザーのプライバシーを保護しながら、より便利な体験を提供できるようになりました。

AppleのローカルAIモデルは、OpenAIなどの大規模言語モデルと比較すると小規模です。そのため、アプリの根幹を覆すような劇的な変化ではなく、日常的な使い勝手を向上させる「生活の質(QoL)」の改善が主な役割となります。推論コストが不要でオフラインでも動作する点が、開発者にとって大きな利点と言えるでしょう。

具体的な活用例として、生産性向上機能が挙げられます。タスク管理アプリ「Tasks」では音声からタスクを自動分割し、日記アプリ「Day One」はエントリーの要約やタイトルを提案します。また、レシピアプリ「Crouton」では、長文から調理手順を自動で抽出するなど、手作業を削減する機能が実装されています。

学習や創造性の分野でも活用が進んでいます。単語学習アプリ「LookUp」は、AIが単語の例文を生成し、学習をサポートします。子供向けアプリ「Lil Artist」では、キャラクターとテーマを選ぶだけでAIが物語を生成。ユーザーの創造性を刺激する新たな体験を提供しています。

個人の趣味や健康管理といった専門分野でも応用は多彩です。フィットネスアプリ「SmartGym」はワークアウトの要約を生成し、テニス練習アプリ「SwingVision」は動画から具体的なフォーム改善案を提示します。このように、AIがパーソナライズされた助言を行う事例が増えています。

今回の動きは、AI機能の導入がより身近になることを示唆しています。開発者は、サーバーコストやプライバシー問題を気にすることなく、高度な機能をアプリに組み込めるようになりました。iOS 26を皮切りに、オンデバイスAIを活用したアプリのイノベーションは、今後さらに加速していくとみられます。

Pixel 10、AIが不在着信を文字起こし・要約

新AI機能「Take a Message」

不在着信・拒否通話のスマートな処理
会話型AIによるリアルタイム文字起こし
通話後のAIによるアクション提案

2つの人気機能を統合

通話スクリーニングのスパム検出活用
通話メモの要約・ネクストステップ生成

高度なオンデバイスAI

プライバシーに配慮した端末内処理
最新のPixel 10シリーズに搭載

Googleは2025年10月2日、最新スマートフォン「Pixel 10」シリーズ向けに、新たなAI通話支援機能「Take a Message」を発表しました。この機能は、不在着信や応答を拒否した通話の内容をAIがリアルタイムで文字起こしし、通話後には次のアクションを提案するものです。多忙なビジネスパーソンが重要な連絡を逃さず、効率的に対応できるよう支援することを目的としています。

「Take a Message」の最大の特徴は、Google高度な会話型AIを駆使している点です。相手が残したボイスメッセージをリアルタイムで画面にテキスト表示するため、音声を聞けない状況でも内容を即座に確認できます。これにより、会議中や移動中でも重要な用件を逃す心配がありません。

さらに、通話が終了するとAIがメッセージ内容を分析し、要約と推奨される次のアクションを自動生成します。「明日15時に折り返し電話」といった具体的なタスクを提示し、迅速な対応を支援。これは既存の人気機能「Call Notes」の進化形と言えます。

この新機能は、既存の「Call Screen」と「Call Notes」の長所を統合したものです。迷惑電話をブロックする強力なスパム検出機能も継承し、安全性と利便性を両立。処理はすべて端末内で完結するオンデバイスAIのため、プライバシーの観点でも安心できます。

「Take a Message」は、まず最新の「Pixel 10」シリーズで利用可能となります。Googleは、AIを用いてスマートフォンの原点である「通話」体験の再発明を目指しています。今回の新機能は、AIが日常業務を効率化する可能性を示す好例と言えるでしょう。

Pixel 10 Pro、AIで100倍ズームを実現

Pro Res Zoomとは

Pixel 10 Pro搭載の新ズーム技術
AIで100倍ズームを実現
Tensor G5チップ高速処理

AIによる画質向上

単なるデジタルズームではない
生成AIが欠落情報を補完
ノイズ除去とシャープ化を両立
デバイス上数秒で完結

Googleが、次期スマートフォン「Pixel 10 Pro」に搭載される新たなAIカメラ技術「Pro Res Zoom」を発表しました。この技術は、生成AIを活用して最大100倍のズーム撮影でも鮮明な画質を実現するものです。遠くの被写体を、これまでにないほど詳細に捉えることが可能になります。

Pro Res Zoomの核心は、単なる画像の切り出しと拡大(デジタルズーム)ではない点にあります。撮影データから色や形といった僅かな手がかりを基に、AIが欠落したディテールを生成・補完します。これにより、従来のズーム機能ではぼやけてしまっていた被写体も、驚くほど鮮明な一枚の写真として仕上がります。

この高度な処理は、最新の「Tensor G5」チップによってデバイス上で直接実行されます。最先端の拡散モデル(diffusion model)を数秒で動作させ、ノイズ除去とシャープ化を同時に行います。クラウドにデータを送ることなく、手元で高速に処理が完結するのが大きな特徴です。

この新技術は、ユーザーにどのような価値をもたらすのでしょうか。例えば、遠くにいる野生動物や、スポーツ観戦中の選手の表情など、これまで諦めていたシーンの撮影が可能になります。Pixel 9 Proの「Super Res Zoom」が最大30倍だったのに対し、100倍という圧倒的なズーム性能は、スマートフォンの写真撮影の常識を覆す可能性を秘めています。

Googleの取り組みは、生成AIがクラウド上のサービスから、スマートフォンという日常的なデバイスへと活躍の場を広げていることを示しています。カメラ機能の進化は、AIがもたらすユーザー体験向上の好例と言えるでしょう。

Hance、KB級AI音声処理でエッジ市場に革新

驚異の超小型・高速AI

モデルサイズは僅か242KB
遅延10ミリ秒のリアルタイム性
電力で多様なデバイスに対応

F1からインテルまで

F1公式無線サプライヤーが採用
Intelの最新チップNPUへ最適化
防衛・法執行分野への応用
大手スマホメーカーとも協議中

ノルウェーのスタートアップHanceが、キロバイト級の超小型AI音声処理ソフトウェアを開発しました。クラウドを介さずデバイス上で動作し、わずか10ミリ秒の低遅延でノイズ除去や音声の明瞭化を実現。すでにF1の公式無線サプライヤーやIntelといった大企業を顧客に持ち、10月27日から開催されるTechCrunch Disrupt 2025でデモを披露します。

この技術の核心は、わずか242KBという驚異的なモデルサイズにあります。これにより、スマートフォンや無線機など、リソースが限られたエッジデバイス上でのリアルタイム処理が可能になりました。従来のクラウドベースのAIと異なり、通信遅延や消費電力を大幅に削減できる点が大きな強みです。

HanceのAIモデルは、共同創業者が運営する高品質なサウンドライブラリ「Soundly」の音源を用いてトレーニングされました。F1マシンの轟音から火山の噴火音まで、多種多様なデータを学習させることで、過酷な環境下でも特定の音声を分離し、ノイズやエコー、反響を除去する高い性能を達成しています。

その実用性はすでに証明されています。F1チームが使用する無線システムを手がけるRiedel Communicationsは、高速走行中のドライバーとエンジニア間の極めて重要な通信をクリアにするため、Hanceの技術を採用。他にも、防衛や法執行機関といった、リアルタイム性と信頼性が求められる分野からの関心も高まっています。

Hanceは事業拡大を加速させています。半導体大手Intelとは、同社の最新チップ「NPU(ニューラル・プロセッシング・ユニット)」向けにモデルを最適化するパートナーシップを締結。他のチップメーカーや、非公開のスマートフォンメーカーとも協議を進めており、競争優位を保つため、研究開発に注力し続ける方針です。

Pixel 10、AI通話機能でビジネスを加速

AIが変えるビジネス通話

関連情報をAIが自動提示
通話内容からタスクを自動生成
不在着信をAIが要約・分類
迷惑電話をAIが自動で判別

グローバル化と利便性向上

オンデバイスAIでリアルタイム翻訳
AIによる自動応答・フィルタリング
カスタマイズ可能な通話画面
車内でのAIアシスタント連携

Googleが2025年9月29日、最新スマートフォン「Pixel 10」向けに、AIを活用した9つの新しい通話機能を発表しました。これらの機能は、最新AIモデル「Gemini Nano」と独自プロセッサ「Tensor G5」を搭載し、通話中の情報検索やリアルタイム翻訳、議事録作成などを自動化。ビジネスパーソンの生産性向上と、より円滑なコミュニケーションの実現を目指します。

中でも注目すべきは「Magic Cue」機能です。これは、ユーザーの許可のもとGmailやメッセージの内容をAIが解析し、通話中に必要な情報を先回りして提示するものです。例えば、顧客との通話中に注文番号を自動で表示するなど、情報検索の手間を大幅に削減し、ビジネスの機会損失を防ぎます。

グローバルなビジネス展開を加速させるのが「Voice Translate」です。デバイス上で完結するAIが、通話内容をリアルタイムで翻訳します。話者の声質を保ったまま自然な翻訳が可能なため、言語の壁を越えた円滑なコミュニケーションを実現。海外の取引先やチームとの連携を強力にサポートするでしょう。

「Call Notes」機能も大幅に進化しました。通話内容を記録するだけでなく、そこからカレンダーの予定やタスクをAIが提案し、ワンタップで作成可能になります。これにより、通話後のフォローアップ作業が劇的に効率化され、重要なアクションの抜け漏れを防ぐことが期待できます。

このほかにも、迷惑電話をAIが自動で判別・対応する「Call Screen」や「Scam Detection」の対象国拡大、不在着信をテキスト化して要約する「Take a Message」、車内で安全に通話機能を活用できるAndroid Auto連携など、日々の業務を効率化する機能が多数盛り込まれています。

これらの革新的な機能は、Pixel 10に搭載される強力なオンデバイスAI基盤によって実現されています。AIアシスタントが単なるツールから真の「ビジネスパートナー」へと進化する可能性を示しており、今後のスマートフォンがもたらす生産性革命に大きな期待が寄せられます。

Hugging Face、Apple向けAIライブラリv1.0を公開

Apple開発者向けAIツール

ローカルLLMのアプリ統合を簡素化
Tokenizer, Hubなど必須機能を提供
Core MLやMLXを補完する設計

v1.0の進化点

パッケージの安定性向上とAPI整理
モジュール分割による依存性削減
最新Core ML APIとSwift 6に対応

今後のロードマップ

MLXフレームワークとの連携深化
エージェント型ユースケースの探求

AIプラットフォームのHugging Faceが、Apple製品開発者向けライブラリ「swift-transformers」のバージョン1.0を公開しました。本ライブラリは、iPhoneなどのデバイス上でローカルにAIモデルを動作させる際の技術的ハードルを下げ、アプリへの組み込みを容易にすることを目的としています。

swift-transformersは、AppleのCore MLやMLXといった機械学習フレームワークを補完する重要な機能群を提供します。具体的には、複雑なテキスト入力を処理する「Tokenizers」、Hugging Face Hubからモデルを管理する「Hub」、Core ML形式モデルの推論を簡素化する「Models」と「Generation」が中核をなします。

すでに、Apple自身のサンプル集「mlx-swift-examples」や、高性能な音声認識フレームワーク「WhisperKit」など、多くのプロジェクトで採用されています。これにより、AppleエコシステムにおけるオンデバイスAI開発の基盤技術としての地位を確立しつつあると言えるでしょう。

今回のv1.0リリースは、ライブラリの安定性を公式に保証する初のメジャーアップデートです。主要な変更点には、必要な機能だけを導入できるモジュール分割や、最新のCore ML APIへの対応、そしてSwift 6への完全準拠が含まれます。開発者はより安心して長期的なプロジェクトに採用できます。

Hugging Faceは今後の展望として、Apple機械学習フレームワーク「MLX」との連携強化を掲げています。さらに、自律的にタスクを処理する「エージェント」のような、より高度なユースケースの実現も視野に入れており、オンデバイスAIの新たな可能性を切り拓くことが期待されます。

Google、次期チップ「Tensor G5」でPixel 10のAI機能を大幅強化

Googleは9月24日、公式ポッドキャストで、次期スマートフォン「Pixel 10」シリーズに搭載する最新チップ「Tensor G5」の詳細を明らかにしました。同社のシリコンチーム担当者が解説し、Tensor G5がGoogle史上最大のアップグレードであり、デバイス上のAI機能を飛躍的に進化させることを強調しました。これにより、スマートフォンの利便性が新たな段階に入ることが期待されます。 Tensor G5は、AI処理能力の向上に特化した設計が特徴です。Googleのシリコンチーム担当者によれば、このチップは技術的なブレークスルーであり、これまでのチップから大幅な性能向上を実現したとのことです。スマートフォンの「頭脳」が進化することで、複雑なAIタスクをデバイス上で高速に処理できるようになります。 新機能で特に注目されるのが、自分の声でリアルタイム翻訳を行う「Live Translate」です。従来の翻訳機能と異なり、まるで自分がその言語を話しているかのような自然なコミュニケーションを可能にします。Tensor G5の高度な音声処理能力が可能にするこの機能は、海外とのビジネスなどで大きな変革をもたらす可能性があります。 さらに、ユーザーの意図を先読みしてアシストするエージェント機能「Magic Cue」や、Pixel 10 Proに搭載される「100x ProRes Zoom」もTensor G5の性能によって実現されます。これらの機能は、単なる操作の補助にとどまらず、ユーザーの生産性を高めるパートナーとしてのスマートフォンの役割を強化することを示唆しています。 今回の発表は、AI処理がクラウドから個人のデバイス(エッジ)へ移行する流れを象徴します。デバイス上でAIが完結すれば、プライバシーと応答速度の向上が両立します。経営者エンジニアにとって、この「エッジAI」の進化がもたらす新たなビジネスチャンスや生産性向上の可能性は、注視すべき重要なトレンドと言えるでしょう。

AppleのオンデバイスAI、iOS 26アプリで実用化進む

サードパーティの開発者らが、Appleの最新OS「iOS 26」の公開に伴い、同社のオンデバイスAIモデルを自社アプリに組み込み始めています。この動きは、Apple開発者向け会議(WWDC)で発表したAIフレームワーク「Foundation Models」を活用したものです。開発者推論コストを気にすることなく、支出分析やタスク管理の自動化といった機能を実装できます。これにより、ユーザー体験の向上が期待されます。 Appleの「Foundation Models」は、デバイス上でAI処理を完結させるのが特徴です。これにより開発者推論コストを負担せず、ユーザーのプライバシーも保護できます。OpenAIなどの大規模モデルとは異なり、既存アプリの利便性を高める「生活の質(QoL)」向上に主眼が置かれています。 生産性向上アプリでの活用が目立ちます。タスク管理アプリ「Tasks」は、入力内容からタグを自動提案したり、音声内容を個別のタスクに分解したりします。日記アプリ「Day One」では、エントリーの要約やタイトルをAIが提案し、より深い記述を促すプロンプトを生成します。 専門分野や学習アプリでも導入が進んでいます。家計簿アプリ「MoneyCoach」は、支出が平均より多いかを分析して提示します。単語学習アプリ「LookUp」では、単語を使った例文をAIが自動生成したり、その語源を地図上に表示したりするユニークな機能が追加されました。 活用範囲は多岐にわたります。子供向けアプリ「Lil Artist」では、キャラクターとテーマを選ぶとAIが物語を創作。レシピアプリ「Crouton」はテキストから調理手順を自動分割します。電子署名アプリ「SignEasy」は契約書の要点を抽出し、利用者に要約を提示します。 これらの事例は、AppleオンデバイスAIが大規模生成AIとは異なる形でユーザー体験を向上させる可能性を示します。プライバシーとコストの課題をクリアしたことで、今後多くの開発者が追随するでしょう。身近なアプリがより賢くなることで、iPhoneエコシステム全体の魅力が一層高まりそうです。

Google Chrome、AI統合で大刷新 Geminiで生産性向上へ

Googleは9月18日、Webブラウザ「Chrome」に自社のAIモデル「Gemini」を統合する、史上最大級のアップデートを発表しました。これにより、複数タブ情報の要約やアドレスバーからのAI検索が可能になります。将来的には面倒な作業を自動化するエージェント機能も導入し、ユーザーの生産性を飛躍的に高めることを目指します。 新たに搭載される「Gemini in Chrome」は、ブラウザの強力なAIアシスタントとして機能します。例えば、調査のために開いた多数のタブの内容を横断的に比較・要約させ、旅行の旅程作成や商品の比較検討といった作業を効率化します。これにより、情報収集にかかる時間を大幅に短縮できるでしょう。 アドレスバー(オムニボックス)もAIで強化されます。Google検索の「AIモード」が統合され、より長く複雑な質問を直接入力できるようになります。また、閲覧中のページ内容に基づいた関連質問が提案され、ページを離れることなく、サイドパネルでAIによる回答を確認できます。 最も注目されるのが、数ヶ月以内に導入予定の「エージェント機能」です。これは、ユーザーの指示に基づき、食料品の注文や散髪の予約といった複数ステップのタスクをChromeが自律的に実行する機能です。面倒な日常業務をAIに任せる未来が近づいています。 Geminiは、カレンダーやYouTube、マップといった他のGoogleアプリとも深く連携します。これにより、閲覧中のページから離れることなく会議の予定調整や動画内の特定場面の検索が可能になります。また、過去に閲覧したページを曖昧な記憶から探し出す機能も追加される予定です。 AIはセキュリティ強化にも活用されます。オンデバイスAIモデル「Gemini Nano」を用いて、巧妙化するフィッシング詐欺や偽のウイルス警告を検知・ブロックします。さらに、パスワードが漏洩した際には、対応サイトでワンクリックでパスワードを自動変更する機能も近日中に追加されます。 これらの新機能は、まず米国のMacおよびWindowsユーザー(言語設定が英語)向けに提供が開始されます。その後、モバイル版(Android/iOS)や他の国・言語へも順次展開される計画です。企業向けにはGoogle Workspaceを通じて提供されます。

Google、Pixel 10とWatch 4を発表、Gemini AI機能を大幅強化

最新Pixel製品群

Pixel 10シリーズをフル展開
Pixel Watch 4を同時発表
Pixel Buds A Series 2も投入
アクセサリー「Pixelsnap」も展開

最先端AIと機能強化

Pixel向けGemini新機能5種
最新Google AIによる利便性向上
Watch 4に緊急衛星通信搭載
Pixel開発10周年記念のモデル

Googleは2025年9月16日の「Made by Google 2025」において、スマートフォン「Pixel 10」シリーズや「Pixel Watch 4」を含む新製品ラインナップを発表しました。この最新ポートフォリオは、Pixel開発10周年という節目を記念し、最先端のGoogle AIを深く統合しています。特に、デバイス上で動作する生成AI「Gemini」の機能が大幅に強化され、ユーザー体験の劇的な向上を目指します。

今回発表されたPixel 10シリーズには、通常モデルに加え、Pro、Pro XL、そして折りたたみ式のPro Foldが揃い、フルラインナップとなりました。デザインも一新され、発売10周年を飾るにふさわしいアップグレードが施されています。企業や開発者は、これらの多様なフォームファクターで、AIを活用した新しいモバイルソリューションの可能性を探ることが可能です。

新しいPixel製品群の核となるのは、高度に統合されたAI機能です。Googleは、Pixel上でGemini5つの新たな機能を提供することを明らかにしました。この最新のGoogle AIは、これまで以上にユーザーのパーソナライゼーションを可能にし、日常的なタスクをよりスムーズに実行できるよう設計されています。AIによる生産性向上は、ビジネス利用における最大の関心事となるでしょう。

また、同時に発表された「Pixel Watch 4」にも注目が集まります。Watch 4は、緊急時に備えた衛星通信機能(Emergency Satellite Communications)を搭載しており、ユーザーの安全確保を最優先しています。さらに「Pixel Buds A Series 2」やアクセサリー群「Pixelsnap」も投入され、Googleエコシステム全体が強化されています。

AT&T、AI秘書で迷惑電話を遮断 ネットワーク履歴活用し精度向上

機能と動作原理

未登録番号からの着信を自動で一次応答
通話履歴に基づき人間関係を分析
声や緊急性から発信者が人間か判定

優位性とユーザー体験

特定のデバイス依存なしで利用可能
GoogleAppleとの差別化要素
リアルタイムで文字起こしを確認可能
AIによる要約やメッセージ取得

AT&T;は、迷惑電話やロボコールを自動で選別するAIアシスタント機能「デジタルレセプショニスト」のテストを一部顧客向けに開始しました。これは個人の通話履歴データを活用し、キャリアのネットワーク側で自動的に通話をスクリーニングするものです。未知の番号からの着信に対し、AIが発信者と用件を確認することで、多忙なビジネスパーソンの生産性向上に貢献します。

この機能の最大の特徴は、AIが個々の端末ではなく、AT&T;のネットワーク全体に組み込まれている点です。GoogleAppleの既存機能がデバイス上の連絡先リストに依存するのに対し、AT&T;のAIはネットワークから得るユーザーのコールパターンを分析します。これにより、頻繁なやり取りを把握し、信頼できる発信者を正確に判断することで、より高い精度での通話フィルタリングを実現しています。

未知の番号から着信があった場合、AIアシスタントが自動で応答し、発信者が人間であるか、または緊急性があるかを声のトーンなどから判定します。基準を満たした通話のみを本人に転送するか、メッセージを残すかを選択できます。

また、ユーザーは専用アプリを通じてAIによる通話のリアルタイム文字起こしを確認し、いつでも会話に加わることも可能です。AT&T;の最高データ責任者によると、このAIアシスタントは単なるスクリーニングに留まらず、将来的に予約やスケジュール調整といった複雑なタスクの代行へと進化する可能性を秘めています。