NVIDIAが、テキスト・画像・応答を1つの文脈としてまとめて1回で安全性判定するコンテンツ安全モデルNemotron 3.5 Content Safetyを公開した。最大の新機能は、推論時に企業独自の安全ポリシーを自然言語で渡すと、内蔵分類体系に頼らずそのポリシーに基づいて判定する点である。医療・金融・子ども向け教育などは許容される表現の基準が異なり、単一の万能ルールでは運用できないという課題に応える。
基盤はGoogle Gemma 3 4B ITで、LoRAアダプターで安全性分類を付加した。8GB以上のVRAMで実時間動作し、12言語を明示的に学習、Gemma 3由来で約140言語に追加学習なしで汎用対応する。判定理由を段階的に出力する説明モード(THINK)を備え、遅延優先時は無効化して高速な二択判定に戻せる。
判定理由を残せるため、規制業界での監査記録や人手による見直しにも使え、企業導入のハードルを下げる。学習・評価に使った多言語・マルチモーダルの安全性データセットも同時に公開された。