NvidiaがNemotron 3公開とSchedMD買収で事業拡大
詳細を読む
NvidiaはNemotron 3モデルファミリーを公開しました。Nano(300億パラメータ)、Super(1000億)、Ultra(5000億)の3サイズで構成され、ハイブリッドMamba-TransformerのMoEアーキテクチャを採用しています。
Nemotron 3 Nanoは同規模モデルと比較して最大3.3倍のスループットを実現し、100万トークンのコンテキストウィンドウに対応します。推論コストの削減と精度向上を両立した設計です。
Nvidiaはモデルの重み、学習レシピ、事前学習・事後学習データセットをすべて公開しています。公開された事後学習データセットは既存の最大規模のものより2.5倍大きく、業界最大規模となります。
モデル訓練に使用した強化学習基盤NeMo Gymもオープンソースとして公開されました。数学、コーディング、ツール利用など10以上のRL環境が含まれており、開発者が独自環境を構築することも可能です。
Nvidiaはと同日、HPC向けオープンソースのワークロード管理システムSlurmを開発するSchedMDの買収を発表しました。Slurmは世界のスーパーコンピュータTop500のうち半数以上で採用されている実績ある基盤ソフトウェアです。
SchedMD買収によりNvidiaは半導体からモデル、そしてHPCソフトウェアスタックまでをカバーする垂直統合を強化します。SlurmはNvidiaのハードウェア上での最適化が進む一方、ベンダー中立性も維持されます。
米政府はNvidiaのH200チップを中国へ輸出することを承認しました。H200は前世代Hopperシリーズの最高性能GPUで、中国ではこれまで販売が制限されていました。
承認を受けてAlibabaやByteDanceなど中国大手企業がH200の大口注文を検討しており、Nvidiaは需要に応えるため生産拡大を検討しています。ただし中国政府側の輸入許可判断が依然として焦点です。
一方でNvidiaにとってのリスクも存在します。中国政府は国産チップの活用を推進しており、長期的には中国AIモデルが自国製シリコンに依存する方向へシフトする可能性があります。