Google、ニュース記事500万件からAI洪水予測モデルを構築

Groundsourceの仕組み

Geminiで500万記事を解析
260万件の洪水事例を抽出
地理タグ付き時系列データを構築
LSTMモデルで発生確率を予測

展開と課題

150カ国の都市部に提供
24時間前の予測が可能に
解像度は20平方kmと粗い
気象インフラ未整備地域が対象
詳細を読む

Googleは、自社の大規模言語モデルGeminiを活用し、世界中の500万件のニュース記事から260万件の洪水事例を抽出して地理タグ付きデータセット「Groundsource」を構築したと発表しました。

鉄砲水は局所的かつ短時間で発生するため、従来の気象観測では十分なデータを収集できず、深層学習モデルによる予測が困難でした。Groundsourceはこのデータギャップを報道記事の解析という独創的な手法で解消しています。

研究チームはGroundsourceを基盤としてLSTMニューラルネットワークを訓練し、気象予報データから都市部の鉄砲水発生確率を最大24時間前に予測するモデルを開発しました。このモデルはすでにGoogleFlood Hubで稼働しています。

現在150カ国以上の都市部でリスク情報を提供しており、南部アフリカ開発共同体など各国の緊急対応機関と連携しています。一方、解像度が20平方kmにとどまる点や、局地レーダーデータを取り込んでいない点が課題として残っています。

Googleはこの手法を地滑り熱波など他の自然災害にも応用する方針です。高価な気象インフラを持たない途上国でも予測を可能にする点が最大の意義であり、データセットはオープンソースとして公開されています。