NvidiaのNemotronモデルがマルチモーダル検索と文書AIを強化

2026年02月04日 NVIDIA 検索エコシステム ERP 画像日本

モデルの性能と用途

ColEmbed V2がマルチモーダル検索首位

ViDoRe V3ベンチマークでトップ達成

Nemotron AgentsがAIリアルタイムBI実現

文書構造を理解した情報抽出

RAGパイプラインとの高い親和性

エンタープライズ文書処理の革新

非構造化文書からKPI抽出

業務意思決定支援の即時化

詳細を読む

Nvidiaは2026年2月4日、マルチモーダル検索モデル「Nemotron ColEmbed V2」がHuggingFaceのViDoRe V3ベンチマークでトップスコアを達成したと発表した。

ColEmbed V2は画像・テキスト・表・チャートを統合したマルチモーダル文書検索において卓越した性能を持ち、企業の複雑な文書からの情報抽出を実現する。

Nemotron Agentsはリアルタイムで文書をビジネスインテリジェンスに変換するシステムで、ERPデータやレポートから即座にKPIを算出できる。

これらのモデルはNvidiaのAI基盤（NIM）上で動作し、既存のRAGアーキテクチャや検索システムへの統合が容易だ。

日本企業においても大量の非構造化文書（契約書、報告書等）を持つ組織にとって、文書AI自動化の実用性が高まった重要な進展だ。