NVIDIA Nemotron 3 Nano OmniがSageMaker JumpStartで即日提供

モデル米国メガテック SageMaker JumpStart 04/30 03:02

AWSとNVIDIA：Nemotron 3 Nano Omni提供 — 画像: AI生成

2026年4月29日、AWSはNVIDIA Nemotron 3 Nano OmniをAmazon SageMaker JumpStartでday zero提供開始したと公式ブログで発表した。このモデルは総パラメータ30B・アクティブパラメータ3BのMoE構成で、Mamba2 Transformer Hybridアーキテクチャを採用する。

最大の特徴は、動画（最大2分・256フレーム）、音声（最大1時間・wav/mp3）、画像（JPEG/PNG）、テキスト（131Kトークン）を単一推論パスで処理できる点にある。従来エンタープライズが画像解析・音声認識・言語モデルを個別に組み合わせていた構成を1モデルに統合できるため、オーケストレーション層を削れる。

提供形態はFP8精度で、デプロイにはml.p4d.24xlargeまたはml.p5.48xlargeインスタンスが必要。推論モードはThinking（temperature 0.6、max_tokens 20480）とInstruct（temperature 0.2、max_tokens 1024）の2系統が公式に推奨されている。

ライセンスはNVIDIA Open Model Agreementに基づくオープンモデルとして商用利用可能。SageMaker JumpStartからのday zero提供により、Hugging Faceからの自前デプロイや個別ライセンス交渉を経ずにマネージド環境で即時運用へ移せる。

読者への示唆は明確である。マルチモーダルAIの評価を進めているチームは、既存の複数モデル構成と本モデル単一構成をPoCで直接比較できる段階に入った。インスタンス要件が具体化したことで、月次コスト試算も着手できる。

NVIDIA Nemotron 3 Nano OmniがSageMaker JumpStartで即日提供の本文内説明図 — 図解: 単一モデル統合 - 動画・音声・画像・テキストを1つの推論パスで処理するMoE構成の仕組み

押さえるポイント

総30B・アクティブ3BのMoE構成で、動画2分・音声1時間・131Kトークンを単一パス処理
Mamba2 Transformer Hybridアーキテクチャを採用しFP8精度で配布される
ml.p4d.24xlargeまたはml.p5.48xlargeでday zeroデプロイが可能

5W1Hでサクッと理解 誰が AWSとNVIDIA 
 何を Nemotron 3 Nano Omni提供 
 いつ 2026年4月29日 
 どこで SageMaker JumpStart 
 なぜ マルチモーダル統合開発 
 どのように FP8モデルday zero配布 

何が起きたか

要点AWSがNVIDIA Nemotron 3 Nano Omniを、SageMaker JumpStartでday zero提供開始した。動画・音声・画像・テキストを1つのモデルで扱えるマルチモーダルモデルが、マネージド環境から即時デプロイ可能になった。

3つの視点で読む

開発現場

Mamba2 Transformer Hybridと3Bアクティブパラメータの組み合わせにより、動画256フレーム・音声1時間・131Kテキストを単一推論パスで扱える。従来は画像・音声・テキストで別モデルをオーケストレーションしていた構成を1モデルに統合でき、前処理パイプラインとレイテンシ境界が動く。

事業判断

SageMaker JumpStartでのday zero提供により、AWSユーザーはHugging Faceからの自前デプロイを経ずに商用利用可能なマルチモーダルモデルへアクセスできる。ml.p4d.24xlarge/ml.p5.48xlargeという調達可能なインスタンスが明示されたことで、PoCの見積もり前提が確定した。

リスク・ルール

NVIDIA Open Model Agreementのもとで商用利用が許諾される点が明示されており、自社データで動かす際のライセンス判断が個別交渉不要になる。エンタープライズの法務レビュー工数が軽くなる一方、出力コンテンツの責任範囲は利用企業側に残る。

追い風と向かい風

追い風を受ける側

AWS上でマルチモーダルAIを開発する企業JumpStartから即デプロイでき、動画・音声・画像・テキストを1モデルで処理できるためパイプラインが簡素化する
NVIDIANemotronブランドのオープンモデルをハイパースケーラーのマネージドカタログに組み込み、推論向けGPU需要（p4d/p5）の出口を確保した
AWS SageMakerチームday zero対応により他社クラウドより先行してモデル提供できるカタログ競争力を示した

向かい風を受ける側

単機能のマルチモーダルAPIベンダー動画理解・音声文字起こし・画像解析を個別に売るモデルが、1モデル統合構成と直接比較される
マルチモデル・オーケストレーション基盤画像・音声・テキストを別モデルで繋ぐアーキテクチャの優位性が縮む

今やるべきこと

技術判断 確認する ml.p4d.24xlargeとml.p5.48xlargeのリージョン在庫と時間単価、FP8推論時のメモリ要件を自社アカウントで確認する

事業判断 比較する既存のマルチモデル構成（画像+音声+LLM）の月次コストと、Nemotron 3 Nano Omni単一モデル構成の月次コストをPoC用ワークロードで比較する

実装・検証 測る 2分動画＋1時間音声の実サンプルでThinkingモードとInstructモードの応答時間・精度・トークン消費を測り、推奨パラメータ（temperature 0.6/0.2）で切り分ける

時系列タイムライン

2026年4月29日 AWSがNVIDIA Nemotron 3 Nano OmniのSageMaker JumpStartでのday zero提供を発表
2026年4月29日 ml.p4d.24xlargeおよびml.p5.48xlargeでFP8モデルのデプロイが可能に
2026年4月30日時点エンタープライズ向けユースケースとしてマルチモーダル統合が各所で検討対象に

情報ソース

NVIDIA Nemotron 3 Nano Omni model now available on Amazon SageMaker JumpStart 一次情報公式技術
モデル配布（Hugging Face / Nemotronドキュメント）モデル配布（Hugging Face / Nemotronドキュメント）
製品ドキュメント: Artificial Intelligence 製品ドキュメント
製品ドキュメント: Amazon Bedrock 製品ドキュメント
製品ドキュメント: Amazon Comprehend 製品ドキュメント
製品ドキュメント: Amazon Kendra 製品ドキュメント
製品ドキュメント: Amazon Lex 製品ドキュメント
製品ドキュメント: Amazon Polly 製品ドキュメント

モデルの記事

読み込み中...

押さえるポイント

5W1Hでサクッと理解

何が起きたか

3つの視点で読む

追い風と向かい風

今やるべきこと

時系列タイムライン

SNSの反応

主な声

関連コンテンツ

関連キーワード

関連するAIトレンド記事

情報ソース

人気記事ランキング

モデルの記事