企業独自ルールで判定するAI安全モデル｜NVIDIA Nemotron 3.5

AI TREND

NVIDIA：安全判定モデル公開

NVIDIAが、テキスト・画像・応答を1つの文脈としてまとめて1回で安全性判定するモデル「Nemotron 3.5 Content Safety」を公開した。企業ごとの独自ポリシーを推論時に適用でき、判定理由を残す説明モードと学習用データセットも同時公開した。

3 の要点を3分で

NVIDIAが、テキスト・画像・応答を1つの文脈としてまとめて1回で安全性判定するコンテンツ安全モデルNemotron 3.5 Content Safetyを公開した。最大の新機能は、推論時に企業独自の安全ポリシーを自然言語で渡すと、内蔵分類体系に頼らずそのポリシーに基づいて判定する点である。医療・金融・子ども向け教育などは許容される表現の基準が異なり、単一の万能ルールでは運用できないという課題に応える。

基盤はGoogle Gemma 3 4B ITで、LoRAアダプターで安全性分類を付加した。8GB以上のVRAMで実時間動作し、12言語を明示的に学習、Gemma 3由来で約140言語に追加学習なしで汎用対応する。判定理由を段階的に出力する説明モード(THINK)を備え、遅延優先時は無効化して高速な二択判定に戻せる。

判定理由を残せるため、規制業界での監査記録や人手による見直しにも使え、企業導入のハードルを下げる。学習・評価に使った多言語・マルチモーダルの安全性データセットも同時に公開された。

企業独自ルールで判定するAI安全モデル｜NVIDIA Nemotron 3.5の本文内説明図 — 図解: 安全判定モデル公開 - NVIDIAがテキスト・画像・応答を1つの文脈としてまとめて1回

押さえるポイント

この変化で何が要点か。図解と出典つきで一目で。

企業独自の安全ルールを自然言語で渡し、それに沿って判定できる
テキスト・画像・応答を1つの文脈でまとめて1回で判定する
判定理由を段階的に出力する説明モード(THINK)を搭載

5W1Hでサクッと理解

構造化された事実を最初に。誰が何をいつどこでなぜどのように。

誰が: NVIDIA
何を: 安全判定モデル公開
いつ: 2026年6月5日
どこで: Hugging Face
なぜ: 業界別の基準対応
どのように: 独自ポリシー適用

背景

NVIDIAの安全性判定モデルは、当初は英語テキスト専用の分類器だったが、対応する形式や言語、処理方法を広げてきた。2026年3月公開のNemotron 3は、画像理解と多言語対応を初めて1つの40億パラメータ規模のモデルに統合した。Nemotron 3はマルチモーダルな有害コンテンツ検査で平均84%の精度を達成し、LlamaGuard-4-12Bの約半分の遅延（レイテンシ）で動作したとされる。今回の3.5はこの小型・効率を保ちつつ機能を拡張したものである。

なぜ今注目なのか

医療・金融・子ども向け教育などは許容される表現の基準が異なり、単一の万能ルールでは運用できない。3.5は判定時に企業独自のルールを自然言語で受け取り、それに沿って判定する点が最大の新機能である。判定理由を残せるため、規制業界での監査記録や人手による見直しにも使え、企業導入のハードルを下げる。

企業独自ルールで判定するという新機軸

NVIDIAが公開した「Nemotron 3.5 Content Safety」の最大の変化は、推論時に企業独自の安全ポリシーを自然言語で渡せる点にある。従来の安全性判定モデルは内蔵された分類体系に従って違反を判定していたが、3.5はその固定ルールに頼らず、渡されたポリシーに沿って判定する。

Nemotron 3.5 Content Safety: Customizable Multimodal Safety for Global Enterprise AI
出典: Hugging Face Blog

ここで言う「カスタマイズ可能(Customizable)」とは、医療・金融・子ども向け教育のように許容される表現の基準が業界ごとに異なる現実を、単一の万能ルールではなく自社固有のルールで運用できることを指す。安全基準そのものを自社で定義し、モデルにそのまま渡せる設計だ。

画像も応答も1回でまとめて判定する

Nemotron 3.5は、入力テキスト・画像・AIの応答を別々ではなく1つの文脈としてまとめて評価する。これにより、テキスト単体・画像単体では問題なくても、要素間の相互作用で生じる違反を1回の処理で検出できる。

基盤はGoogleのGemma 3 4B IT。そこにLoRAアダプター(基盤モデルを丸ごと作り直さず、小さな追加層で特定タスクを学習させる手法)を付けて安全性分類を加えた構成で、8GB以上のVRAM(GPUのメモリ)があれば実時間で動作する。40億パラメータ級の小型設計のため、外部APIに頼らず自社環境で回しやすい。

言語面では12言語を明示的に学習し、Gemma 3由来で約140言語に対しては追加学習なしの汎用対応を持つ。多言語のサービスを運用する事業者にとって、言語ごとに別モデルを用意する負担が減る。