Google、Gemini 3.5 Flashを公開 競合の4倍速で性能も上回る
詳細を読む
Googleは2026年5月19日のGoogle I/O開発者会議で、最新AIモデルGemini 3.5 Flashを発表し即日提供を開始しました。同モデルはわずか4〜5カ月前にフラグシップとして位置づけられていたGemini 3.1 Proをほぼすべてのベンチマークで上回りながら、出力速度は競合フロンティアモデルの4倍となる毎秒約300トークンを達成しています。Google DeepMindのコライ・カブクチュオール最高技術責任者は「品質とレイテンシの驚異的な組み合わせ」と表現しました。
主要ベンチマークではTerminal-Bench 2.1で76.2%、GDPval-AAで1656 Elo、MCP Atlasで83.6%、CharXiv Reasoningで84.2%を記録しました。Artificial Analysisの知能・速度インデックスで「右上象限」に位置する唯一のモデルとなり、品質とコストのトレードオフを根本から覆す成果だとGoogleは主張しています。
企業向けのコストインパクトも大きく、サンダー・ピチャイCEOは1日1兆トークンを処理する大口顧客がワークロードの80%をFlashに移行すれば年間10億ドル以上を節減できると述べました。推論コストは競合の2分の1から3分の1の水準です。エージェント型ワークフローではトークン消費が急増するため、このコスト優位性は自律型AI導入の採算性を大きく改善します。
エージェント機能への最適化も際立っています。3.5 Flashは数時間にわたる自律セッションを実行でき、社内テストではエージェントがOSをゼロから構築することにも成功しました。同時発表されたAntigravity 2.0はスタンドアロンのデスクトップアプリとして提供され、複数エージェントの並列管理が可能です。ShopifyやMacquarie Bank、Salesforceなどのパートナー企業も既に業務への組み込みを進めています。
消費者向けには、月間アクティブユーザー9億人超のGeminiアプリと10億人超のAI Mode in Searchの標準モデルとなりました。新たに発表された24時間稼働パーソナルエージェント「Gemini Spark」もFlashで駆動し、Gmail・Docs・Sheetsなどと連携してバックグラウンドでタスクを処理します。Googleは2026年の設備投資を1800億〜1900億ドルと見込んでおり、自社開発TPU第8世代を含むインフラ増強でさらなるコスト削減を目指します。来月にはより高性能な3.5 Proの一般提供も予定されています。