Google、Gemini 3.5 Flashを公開 競合の4倍速で性能も上回る

性能と速度の両立

3.1 Proをほぼ全指標で超越
出力速度は競合フロンティアの4倍
Antigravity内では12倍速の最適化版も提供
コーディングエージェント性能で業界最高水準

企業向けコスト革命

大規模利用企業に年間10億ドル超の削減効果
競合比1/2〜1/3推論コスト
数時間の自律エージェントセッションに対応

消費者向け大規模展開

GeminiアプリとAI Mode in Searchの標準モデルに
24時間稼働の個人エージェントGemini Spark発表
詳細を読む

Googleは2026年5月19日のGoogle I/O開発者会議で、最新AIモデルGemini 3.5 Flashを発表し即日提供を開始しました。同モデルはわずか4〜5カ月前にフラグシップとして位置づけられていたGemini 3.1 Proをほぼすべてのベンチマークで上回りながら、出力速度は競合フロンティアモデルの4倍となる毎秒約300トークンを達成しています。Google DeepMindのコライ・カブクチュオール最高技術責任者は「品質とレイテンシの驚異的な組み合わせ」と表現しました。

主要ベンチマークではTerminal-Bench 2.1で76.2%、GDPval-AAで1656 Elo、MCP Atlasで83.6%、CharXiv Reasoningで84.2%を記録しました。Artificial Analysisの知能・速度インデックスで「右上象限」に位置する唯一のモデルとなり、品質とコストのトレードオフを根本から覆す成果だとGoogleは主張しています。

企業向けのコストインパクトも大きく、サンダー・ピチャイCEOは1日1兆トークンを処理する大口顧客がワークロードの80%をFlashに移行すれば年間10億ドル以上を節減できると述べました。推論コストは競合の2分の1から3分の1の水準です。エージェントワークフローではトークン消費が急増するため、このコスト優位性は自律型AI導入の採算性を大きく改善します。

エージェント機能への最適化も際立っています。3.5 Flashは数時間にわたる自律セッションを実行でき、社内テストではエージェントOSをゼロから構築することにも成功しました。同時発表されたAntigravity 2.0はスタンドアロンのデスクトップアプリとして提供され、複数エージェントの並列管理が可能です。ShopifyやMacquarie Bank、Salesforceなどのパートナー企業も既に業務への組み込みを進めています。

消費者向けには、月間アクティブユーザー9億人超のGeminiアプリと10億人超のAI Mode in Searchの標準モデルとなりました。新たに発表された24時間稼働パーソナルエージェントGemini Spark」もFlashで駆動し、Gmail・Docs・Sheetsなどと連携してバックグラウンドでタスクを処理します。Googleは2026年の設備投資を1800億〜1900億ドルと見込んでおり、自社開発TPU第8世代を含むインフラ増強でさらなるコスト削減を目指します。来月にはより高性能な3.5 Proの一般提供も予定されています。