AIの不具合を通報できる共有サイトFLARE-AIが始動

通報サイトの仕組み

有害事例の集約報告サイト
オープンソースで検証可能
MITRE等へ報告を転送

背景と課題

中央集約の報告窓口が不在
32組織49名の専門家が開発
連邦法案とも連携
報告の殺到など運用課題
詳細を読む

AI研究者のグループが2026年7月1日、AIの有害な挙動を報告・追跡するクラウドソーシング型サイト「FLARE-AI」を公開しました。チャットボットがマルウェアや爆弾製造の手順を生成したり、個人情報を漏らしたり、利用者の妄想を助長したりした場合に、誰もが警鐘を鳴らせる仕組みです。サービス障害を集計するDowndetectorのAI版とも言える存在です。

最大の狙いは、AIの不具合を通報する統一的な窓口の欠如を埋めることです。開発を主導したHuggingFaceのアビジット・ゴーシュ氏は「現在、AIシステムの欠陥を報告する中央集約された説明責任のある方法が存在しない」と指摘します。同システムのオープンソースコードにより、第三者が問題を検証し、モデル開発元や非営利団体MITREへ報告を振り分けられます。

この取り組みは32の組織から集まった49名のAI専門家との協働で開発されました。研究者らは論文の中で、AIの普及とエージェント型システムの高度化が進むほど、この仕組みが重要になると論じています。6月に発表された連邦議会の法案とも連動し、米国立標準技術研究所(NIST)が欠陥報告データベースを整備する構想も含まれます。

背景には、AIツールを巡る不具合の続発があります。今週はLayerX社が、OpenAIのAtlasやPerplexityCometといったAI搭載ブラウザのガードレールを回避する手口を公表しました。バグやサイバー攻撃だけでなく、心理的被害や差別、誤情報など問題は多岐にわたり、企業ごとに基準が異なる点も課題です。

一方で運用面の懸念も残ります。Humane Intelligenceのラムマン・チョウドリー氏は、深刻でない報告を含む大量の通報をどうさばくか、また信頼できる権威ある組織の裏付けをどう確保するかが課題だと指摘します。エージェント型システムの能力向上に伴い、AIの被害を報告する新たな手段の必要性は今後さらに高まりそうです。