NVIDIA、コンテンツ安全モデルNemotron 3.5を公開

2026年06月04日 NVIDIA 推論リスク GPU コンテンツポリシー

主な新機能

カスタムポリシー対応で業種別運用が可能に

推論トレースによる判定根拠の監査

テキストと画像を統合した安全性判定

12言語を明示学習、約140言語にゼロショット対応

性能と実用性

マルチモーダル安全ベンチで平均約85%の精度

多言語Aegisで平均96.5%の分類精度

4Bパラメータで8GB以上のGPUに展開可能

競合比で3倍低いレイテンシを実現

出典：Hugging Face

詳細を読む

NVIDIAは2026年6月4日、企業向けAIコンテンツ安全モデル「Nemotron 3.5 Content Safety」をHugging Face上で公開しました。Gemma 3 4Bをベースとする40億パラメータのモデルで、テキストと画像を同時に評価し、両者の組み合わせから生じるポリシー違反も一括で検出します。NVIDIAオープンモデルライセンスのもと、研究・商用いずれの用途にも利用できます。

最大の進化点は、カスタムポリシー機能の追加です。従来は固定の安全分類体系に依存していましたが、3.5では推論時に自然言語で記述した独自ポリシーを入力できるようになりました。これにより、医療・金融・教育など業種固有のリスク基準に合わせた安全判定が可能になります。不要なカテゴリの抑制や、組織独自のリスクカテゴリの追加にも対応しています。

もう一つの注目機能が、推論トレース（THINKモード）です。モデルが安全・不安全の判定に至るまでのステップを段階的に出力することで、判定根拠を監査可能にします。規制産業で求められるコンプライアンスログや、人間によるレビュー、ポリシーの反復改善に活用できます。推論トレースは大規模モデルで生成後、3文以内に要約する2段階プロセスで簡潔化されており、レイテンシへの影響を抑えています。

多言語対応も強化されています。英語・日本語・中国語など12言語を明示的に学習し、ベースモデルのGemma 3から継承した能力により約140言語へのゼロショット汎化も可能です。多言語Aegisベンチマークでは12言語平均96.5%の分類精度を達成しました。マルチモーダル安全ベンチマーク全体では平均約85%の精度を記録しています。

実運用面では、4Bパラメータの軽量設計により8GB以上のVRAMを搭載したGPUで動作します。競合するマルチモーダル安全モデルと比較してエンドツーエンドのレイテンシは3分の1で、推論モード有効時でもトークン生成量は最大50%少なく済みます。訓練データセットも同時公開され、実写真が99%を占める点がマルチモーダル安全研究の既知の課題に対処しています。