NvidiaのNemotronモデルがマルチモーダル検索と文書AIを強化
詳細を読む
Nvidiaは2026年2月4日、マルチモーダル検索モデル「Nemotron ColEmbed V2」がHuggingFaceのViDoRe V3ベンチマークでトップスコアを達成したと発表した。
ColEmbed V2は画像・テキスト・表・チャートを統合したマルチモーダル文書検索において卓越した性能を持ち、企業の複雑な文書からの情報抽出を実現する。
Nemotron Agentsはリアルタイムで文書をビジネスインテリジェンスに変換するシステムで、ERPデータやレポートから即座にKPIを算出できる。
これらのモデルはNvidiaのAI基盤(NIM)上で動作し、既存のRAGアーキテクチャや検索システムへの統合が容易だ。
日本企業においても大量の非構造化文書(契約書、報告書等)を持つ組織にとって、文書AI自動化の実用性が高まった重要な進展だ。