Perplexity AIがローカルとクラウドを自動振り分ける推論基盤を発表

ハイブリッド推論の仕組み

タスク単位で実行場所を自動判定
機密データは端末内で処理
フロンティアモデルは複雑な推論に活用
Intel Core Ultra Series 3で実演

エンタープライズ戦略の深化

規制業界のデータガバナンスに対応
SOC 2 Type II取得済み環境と連携
時価総額200億ドル、売上目標6.56億ドル

競合環境と課題

AppleGoogle・MSも類似技術を開発中
9件の著作権訴訟が事業リスク
詳細を読む

Perplexity AIは2026年6月2日、台湾で開催中のComputex 2026において、AIワークロードをローカル端末とクラウドの間で自動的に振り分ける「ハイブリッドローカル・サーバー推論オーケストレーター」を発表しました。CEOのAravind Srinivas氏がIntel CEOのLip-Bu Tan氏と共にステージ上でデモを実施し、機密性の高い資料の処理においてローカルモデルとクラウドモデルを動的に使い分ける仕組みを披露しました。同社の時価総額は200億ドルに達しています。

この技術の核心は、ユーザーが事前に実行場所を選ぶ必要がない点にあります。システムがタスクごとにデータの機密性と処理の複雑さを評価し、財務記録や健康情報などの機密データはローカル端末に留め、高度な推論が必要な処理はクラウド上のフロンティアモデルに送信します。クラウドへの送信前にはユーザーの許可を求める設計で、エンタープライズが懸念するデータガバナンスの問題に直接対応しています。

発表のタイミングは戦略的です。NvidiaArmベースのRTX Sparkスーパーチップを発表し、Intelも18A技術のXeon 6+やCore Ultra Series 3を披露した直後でした。ローカル端末の処理能力が向上するほどクラウド依存が減り、レイテンシとコストが改善されるため、Perplexityのオーケストレーターは半導体メーカーの戦略とも合致します。同社はチップ非依存の設計を掲げており、今後複数ベンダーへの最適化を進める方針です。

エンタープライズ向けには、金融・医療・法務など規制の厳しい業界での活用が想定されています。たとえば投資銀行が機密の案件資料を処理する際、機密部分はローカルで解析し、分析タスクのみクラウドに委ねるといった運用が可能になります。3月のAsk 2026カンファレンスで発表されたComputer for Enterpriseと組み合わせ、SnowflakeSalesforce・SharePointなど100以上のSaaS連携も提供しています。

一方で課題も山積しています。CNN・ニューヨーク・タイムズ・読売新聞など9組織からの著作権訴訟を抱えており、企業導入の判断に影響を与える可能性があります。また、Apple Intelligence・Google Gemini Nano・Microsoft Copilot+ PCsなど大手も同様のローカル・クラウド連携を進めており、Perplexityが主張する「タスク単位の動的ルーティング」の優位性が実環境で証明されるかが今後の焦点となります。製品の一般提供は数週間以内を予定しています。