NVIDIA、1200億パラメータの新モデルNemotron 3 Superを公開
詳細を読む
NVIDIAは2026年3月11日、エージェントAI向け新モデル「Nemotron 3 Super」を公開しました。1200億パラメータのうち推論時に稼働するのは120億のみで、前世代比最大5倍のスループットと2倍の精度向上を実現しています。
本モデルはMamba-2層とTransformer層を組み合わせたハイブリッド構造を採用しています。Mamba層が線形計算量で高速処理を担い、Transformer層が高精度な情報検索を補完することで、100万トークンのコンテキストウィンドウを効率的に実現しました。
新技術「Latent MoE」は、トークンを圧縮空間に射影してからエキスパートに振り分けることで、同じ計算コストで4倍の専門家を活用できます。さらにマルチトークン予測により推論速度を最大3倍に高速化しています。
Blackwell GPUプラットフォームではNVFP4精度で動作し、Hopper世代のFP8比で最大4倍高速な推論を精度損失なく達成しました。DeepResearch Benchのリーダーボードでは1位を獲得しています。
Perplexity、CodeRabbit、Greptileなどの企業が即日統合を開始し、Siemens、Palantir、Cadenceなどの大手企業も製造・サイバーセキュリティ分野での活用を進めています。モデルはオープンウェイトで公開され、10兆トークン超の学習データとレシピも併せて提供されました。
Google Cloud、Oracle Cloud、AWS、Azureなど主要クラウドに加え、Dell AI FactoryやHPEによるオンプレミス展開にも対応します。NVIDIA NIMマイクロサービスとしてパッケージ化されており、企業は柔軟な環境で商用利用が可能です。