2026年4月29日、AWSはNVIDIA Nemotron 3 Nano OmniをAmazon SageMaker JumpStartでday zero提供開始したと公式ブログで発表した。このモデルは総パラメータ30B・アクティブパラメータ3BのMoE構成で、Mamba2 Transformer Hybridアーキテクチャを採用する。
最大の特徴は、動画(最大2分・256フレーム)、音声(最大1時間・wav/mp3)、画像(JPEG/PNG)、テキスト(131Kトークン)を単一推論パスで処理できる点にある。従来エンタープライズが画像解析・音声認識・言語モデルを個別に組み合わせていた構成を1モデルに統合できるため、オーケストレーション層を削れる。
提供形態はFP8精度で、デプロイにはml.p4d.24xlargeまたはml.p5.48xlargeインスタンスが必要。推論モードはThinking(temperature 0.6、max_tokens 20480)とInstruct(temperature 0.2、max_tokens 1024)の2系統が公式に推奨されている。
ライセンスはNVIDIA Open Model Agreementに基づくオープンモデルとして商用利用可能。SageMaker JumpStartからのday zero提供により、Hugging Faceからの自前デプロイや個別ライセンス交渉を経ずにマネージド環境で即時運用へ移せる。
読者への示唆は明確である。マルチモーダルAIの評価を進めているチームは、既存の複数モデル構成と本モデル単一構成をPoCで直接比較できる段階に入った。インスタンス要件が具体化したことで、月次コスト試算も着手できる。