クエリログ活用でAIのSQL誤り6割超を解消

文脈不足が根本原因

テーブル1万超で精度35%未満
スキーマだけでは業務意図を把握不能
DataHubが意味索引を新たに提供

実績と業界動向

MiroSnowflake連携で実証
MCPLangChain等4基盤に対応
分析会社は文脈制御を次の覇権争いと指摘
ベンダー中立のプラットフォーム戦略
詳細を読む

データ統合プラットフォームのDataHubは、AIエージェントのSQL精度を改善する新機能「Context Intelligence」を発表しました。過去のSQLクエリ履歴を解析し、業務上の意味を構造化した「セマンティックアンカー」を生成することで、エージェントがテーブル結合やルーティングで誤る問題に対処します。MCPLangChainGoogleのAgent Development Kit、CrewAIの4つのフレームワークに対応しています。

導入事例として注目されるのが、デジタルコラボレーションツールのMiroです。同社がSnowflake環境にAIエージェントを直接接続したところ、1万超のテーブルに対して正答率は35%未満でした。スキーマ情報だけではどのテーブルがどの業務上の質問に対応するか判別できず、エージェントが誤ったJOINを生成していたのです。

Miroはデータを明確に定義された「データプロダクト」に整理し、DataHubの文脈レイヤーを介してエージェントがアクセスする構成に変更しました。ユーザーのリクエストはまずDataHubのMCPで適切なデータ資産にマッピングされ、その後SnowflakeMCPでSQL生成が行われます。メタデータ、エンティティ関係、クエリ履歴、業務意図といった意味的シグナルにより、スキーマだけに頼らない正確なルーティングが可能になりました。

DataHubはLinkedInで約6年間の社内開発を経て2020年にオープンソース化されたプロジェクトで、現在は1万5000人以上のコントリビューターと3000以上の本番環境での導入実績があります。今回の機能は新規開発ではなく、長年のリネージ追跡で培われたクエリログ解析基盤の上に構築されています。

業界アナリストのConstellation Research・Michael Ni氏は、文脈の制御権を握る者がデータ・エージェント・意思決定の全レイヤーを支配すると指摘し、文脈管理を次の主要プラットフォーム戦争と位置づけています。DataHubはベンダー中立を掲げ、SnowflakeのセマンティックビューやMicrosoft Fabric IQなど既存のエンドポイントに文脈を供給する戦略を採っています。