Google AI Overviewsの回答、10回に1回は誤り

精度調査の結果

正答率約91%、誤答率約10%
SimpleQA評価で4000問超を検証
Gemini 3更新後に精度6ポイント改善
毎日数千万件の誤回答が発生と推計

誤回答の具体例

引用元に記載のない情報を回答
矛盾する情報から誤った方を選択
存在する事実を「存在しない」と断言
詳細を読む

2026年4月7日、ニューヨーク・タイムズはAIスタートアップOumiと協力し、Google検索AI Overviews機能の精度を大規模に調査した結果を公開しました。OpenAIが2024年に公開したSimpleQAと呼ばれる4000問超の事実確認ベンチマークを用いて検証したところ、正答率は約91%であることが判明しました。

AI Overviewsは2024年の提供開始以降、不正確な回答が問題視されてきました。前世代のGemini 2.5搭載時には正答率が85%にとどまっていましたが、2026年1月のGemini 3へのアップデートにより91%まで改善しています。それでも約10%の誤答率は、Google検索規模を考えると毎時数百万件の誤った情報が配信されていることを意味します。

調査では具体的な誤回答の事例も報告されています。ボブ・マーリーの旧宅が博物館になった年を尋ねた質問では、引用したウィキペディアに矛盾する2つの年が記載されており、AI Overviewsは誤った方を選択しました。また、ヨーヨー・マのクラシック音楽殿堂入りについては、引用元に記載があるにもかかわらず「そのような殿堂は存在しない」と回答しました。

この調査結果は、AI搭載の検索機能が急速に普及する中で、生成AIの事実精度が依然として大きな課題であることを浮き彫りにしています。正答率91%は改善傾向にあるものの、数十億件規模の検索に適用される以上、誤情報の絶対量は無視できない水準にあります。