GPT OSSとNemotronがAWS GovCloudのBedrockで利用可能に

AWSは2026年4月30日、Amazon BedrockのAWS GovCloud（US）リージョンで、OpenAIのGPT OSS（120B・20B）とNVIDIA Nemotron（Nano 9B v2・Nano 12B v2・Nano 30B・Super 120B）の計6モデルを利用可能にした。いずれもオープンウェイトモデルで、重み・データセット・レシピが公開されている。

今回の発表で特に実装に直結する要素が、新しい分散推論エンジン「Mantle」である。Mantleは大規模機械学習モデルをBedrock上でサーバーレス提供する基盤で、新モデルのオンボーディングを高速化し、QoS制御付きの推論・自動キャパシティ管理・統一プールによるデフォルトクォータ引き上げを提供する。さらにOpenAI API仕様との互換性を標準装備しており、既存のOpenAIクライアント実装からエンドポイントを差し替えるだけで移行できる設計だ。

読者への意味は2層ある。第1に、GovCloud（US）は米国政府機関・規制産業向けに設計されたリージョンであり、ここにオープンウェイトモデル群が入ったことは、従来クローズドモデル中心だった政府領域の調達選択肢が広がったことを意味する。第2に、SLM（Nemotron Nano 9B）からLLM（Super 120B、GPT OSS 120B）まで6モデルが統一APIで並ぶため、ユースケース単位で推論コストと精度のトレードオフを調整できる。

日本の組織にとってGovCloud（US）は直接利用対象ではないが、AWSが規制領域にオープンウェイトを主力投入した点は、今後の商用リージョンや他リージョンでの展開を見極める前例として記録する価値がある。

GPT OSSとNemotronがAWS GovCloudのBedrockで利用可能にの本文内説明図 — 図解: Mantle経由の統一A - GovCloud上で6つのオープンウェイトLLMをコード変更なしに切り替えられる仕組

押さえるポイント

GovCloud（US）でオープンウェイトLLMが統一APIで利用可能に
新推論エンジン「Mantle」がOpenAI API仕様と標準互換
SLMからLLMまで6モデルをコード変更なしで切替可能

5W1Hでサクッと理解 誰が AWS 
 何を Bedrockにモデル追加 
 いつ 2026年4月30日 
 どこで GovCloud米国 
 なぜ 規制産業のAI活用 
 どのように 新エンジンMantle 

何が起きたか

要点AWSは2026年4月30日、Amazon BedrockのAWS GovCloud（US）リージョンで、OpenAIのGPT OSS（120B・20B）とNVIDIA Nemotron（Nano 9B v2・Nano 12B v2・Nano 30B・Super 120B）のオープンウェイトモデル群を利用可能にした。新推論エンジン「Mantle」が基盤となる。

3つの視点で読む

開発現場

Mantleが分散推論エンジンとしてサーバーレス提供され、OpenAI API仕様と互換性を持つ。既存のOpenAIクライアントSDKで書かれたコードをエンドポイント差し替えのみで動作させる設計で、モデル切替時にアプリ側の改修が不要になる。SLM（Nemotron Nano 9B）からLLM（Super 120B、GPT OSS 120B）まで選べるため、推論コストと精度のトレードオフをユースケース単位で調整できる。

事業判断

GovCloud（US）は米国政府機関・規制産業向けリージョンであり、ここにオープンウェイトモデルが入ったことで、従来クローズドモデルに限られていた調達選択肢が広がった。日本の読者にとっては直接利用できるリージョンではないが、AWSが「コンプライアンス要件が厳しい領域でもオープンウェイトを主力として提供する」方針を示した点が、今後の東京・大阪リージョンでの展開判断の前例になる。

リスク・ルール

重み・データセット・レシピが公開されているモデルを、GovCloudというFedRAMP等の米国政府向けコンプライアンス基盤上で提供する構成は、「オープンウェイト＝監査可能性」を規制側が受容する方向の具体例となる。モデル挙動の内部検証が可能な点が、説明責任を要求される組織の導入要件と整合する。

追い風と向かい風

追い風を受ける側

米国政府機関・規制産業のAI導入担当コンプライアンス境界の内側で最新のオープンウェイトLLMを統一APIから選択できるようになった
OpenAI・NVIDIAGovCloudというクローズドモデル優位だった領域にオープンウェイト製品で足場を築いた
既存のOpenAI APIクライアント開発者Mantleのapi互換によりコード変更なしでBedrock側に移行できる

向かい風を受ける側

GovCloud向けクローズドモデル単独提供ベンダー同一API経由でオープンウェイト代替が選べる比較環境に置かれる
自前でオープンウェイトを政府向け基盤に載せる事業者サーバーレスかつ自動キャパシティ管理のマネージド選択肢が登場し、差別化が狭まる

今やるべきこと

技術判断 確認する自社の対象リージョンがGovCloud（US）か商用リージョンかを確認し、Bedrock上でGPT OSSとNemotronが提供されるモデルIDとクォータを確認する

事業判断 定義する GPT OSS 120B／20B、Nemotron Nano 9B／12B／30B、Super 120Bの使い分け基準を、推論コスト・応答精度・レイテンシの3軸で定義する

実装・検証 試す既存のOpenAI SDKコードをMantleのAPI互換エンドポイントに向け替え、同一プロンプトで出力差分とトークン課金差分を測る

時系列タイムライン

2025年8月 OpenAIがgpt-ossシリーズ（120B・20B）をオープンウェイトとして公開
2026年4月30日 AWSがAmazon Bedrock（AWS GovCloud US）でGPT OSSとNVIDIA Nemotronの提供開始、新推論エンジンMantleが稼働

情報ソース

OpenAI GPT OSS and NVIDIA Nemotron Models Available on Amazon Bedrock in AWS GovCloud (US) 一次情報公式速報性
Introducing gpt-oss | OpenAI 公式技術
openai/gpt-oss-120b · Hugging Face モデル配布技術
nvidia/NVIDIA-Nemotron-Nano-9B-v2 · Hugging Face モデル配布技術
Nemotron AI Models | NVIDIA Developer 公式ベンダー資料
モデル配布: GPT OSS 20B（Hugging Face）モデル配布
実装コード（GitHub）実装コード（GitHub）
OpenAI オープンウェイトモデルヘルプ記事 OpenAI オープンウェイトモデルヘルプ記事
モデル配布: unsloth/gpt-oss-120b-GGUF · Hugging Face モデル配布
モデル配布モデル配布

モデルの記事

読み込み中...

押さえるポイント

5W1Hでサクッと理解

何が起きたか

3つの視点で読む

追い風と向かい風

今やるべきこと

時系列タイムライン

SNSの反応

関連コンテンツ

関連キーワード

関連するAIトレンド記事

情報ソース

人気記事ランキング

モデルの記事