Google I/Oで動画生成AI Gemini Omni発表
詳細を読む
Googleは2026年5月の開発者会議Google I/O 2026で、3つの主要AI製品を発表しました。マルチモーダル動画生成モデル「Gemini Omni」、エージェント向け最新モデル「Gemini 3.5 Flash」、そして常時稼働型パーソナルAIエージェント「Gemini Spark」です。いずれもGoogleのエージェント実行基盤Antigravityと統合されています。
Gemini Omniは画像・音声・動画・テキストを入力として高品質な動画を生成・編集できるモデルです。自然言語で動画を会話的に編集でき、前のターンの指示を引き継ぎながらキャラクターの一貫性や物理法則を保つ点が特徴です。Gemini app、Google Flow、YouTube Shorts等で順次提供されます。
Gemini 3.5 Flashはエージェントタスクとコーディングに特化した最新モデルで、大規模フラッグシップモデルに匹敵する性能をFlashシリーズの速度で実現します。Gemini appの標準モデルおよびGoogle検索のAI Modeに採用され、検索結果をリアルタイムにカスタムUIとして生成する機能や、情報エージェントによるバックグラウンド監視機能が導入されます。
Gemini SparkはGemini 3.5とAntigravityを基盤とするパーソナルAIエージェントで、GmailやGoogleカレンダー等のWorkspaceツールと連携して日常タスクを自動化します。WIREDの実機レビューでは、メールやカレンダーから誕生日パーティーの計画を自動生成するなど高い情報統合力を示しました。一方で、同居のパートナーを「親しい友人」と分類するなど文脈理解の限界も露呈しています。
セキュリティ面では、個人データへの広範なアクセスに伴うプロンプトインジェクション攻撃のリスクをGoogle自身が警告しています。Sparkは月額100ドルのAI Ultraプランの加入者向けに米国で提供が始まりました。Gemini 3.5 FlashのAPIはGoogle AI StudioやAndroid Studio等で一般提供されています。