NvidiaのNemotronモデルがマルチモーダル検索と文書AIを強化

モデルの性能と用途

ColEmbed V2がマルチモーダル検索首位
ViDoRe V3ベンチマークでトップ達成
Nemotron AgentsがAIリアルタイムBI実現
文書構造を理解した情報抽出
RAGパイプラインとの高い親和性
エンタープライズ文書処理の革新

ビジネス活用

非構造化文書からKPI抽出
業務意思決定支援の即時化
Nvidiaエコシステムとの統合促進
詳細を読む

Nvidiaは2026年2月4日、マルチモーダル検索モデル「Nemotron ColEmbed V2」がHuggingFaceのViDoRe V3ベンチマークでトップスコアを達成したと発表した。

ColEmbed V2は画像・テキスト・表・チャートを統合したマルチモーダル文書検索において卓越した性能を持ち、企業の複雑な文書からの情報抽出を実現する。

Nemotron Agentsはリアルタイムで文書をビジネスインテリジェンスに変換するシステムで、ERPデータやレポートから即座にKPIを算出できる。

これらのモデルはNvidiaのAI基盤(NIM)上で動作し、既存のRAGアーキテクチャ検索システムへの統合が容易だ。

日本企業においても大量の非構造化文書(契約書、報告書等)を持つ組織にとって、文書AI自動化の実用性が高まった重要な進展だ。