Google AI Overviewsの回答、10回に1回は誤り
出典:Ars Technica
詳細を読む
2026年4月7日、ニューヨーク・タイムズはAIスタートアップのOumiと協力し、Google検索のAI Overviews機能の精度を大規模に調査した結果を公開しました。OpenAIが2024年に公開したSimpleQAと呼ばれる4000問超の事実確認ベンチマークを用いて検証したところ、正答率は約91%であることが判明しました。
AI Overviewsは2024年の提供開始以降、不正確な回答が問題視されてきました。前世代のGemini 2.5搭載時には正答率が85%にとどまっていましたが、2026年1月のGemini 3へのアップデートにより91%まで改善しています。それでも約10%の誤答率は、Googleの検索規模を考えると毎時数百万件の誤った情報が配信されていることを意味します。
調査では具体的な誤回答の事例も報告されています。ボブ・マーリーの旧宅が博物館になった年を尋ねた質問では、引用したウィキペディアに矛盾する2つの年が記載されており、AI Overviewsは誤った方を選択しました。また、ヨーヨー・マのクラシック音楽殿堂入りについては、引用元に記載があるにもかかわらず「そのような殿堂は存在しない」と回答しました。
この調査結果は、AI搭載の検索機能が急速に普及する中で、生成AIの事実精度が依然として大きな課題であることを浮き彫りにしています。正答率91%は改善傾向にあるものの、数十億件規模の検索に適用される以上、誤情報の絶対量は無視できない水準にあります。