AWSは2026年4月30日、Amazon BedrockのAWS GovCloud(US)リージョンで、OpenAIのGPT OSS(120B・20B)とNVIDIA Nemotron(Nano 9B v2・Nano 12B v2・Nano 30B・Super 120B)の計6モデルを利用可能にした。いずれもオープンウェイトモデルで、重み・データセット・レシピが公開されている。
今回の発表で特に実装に直結する要素が、新しい分散推論エンジン「Mantle」である。Mantleは大規模機械学習モデルをBedrock上でサーバーレス提供する基盤で、新モデルのオンボーディングを高速化し、QoS制御付きの推論・自動キャパシティ管理・統一プールによるデフォルトクォータ引き上げを提供する。さらにOpenAI API仕様との互換性を標準装備しており、既存のOpenAIクライアント実装からエンドポイントを差し替えるだけで移行できる設計だ。
読者への意味は2層ある。第1に、GovCloud(US)は米国政府機関・規制産業向けに設計されたリージョンであり、ここにオープンウェイトモデル群が入ったことは、従来クローズドモデル中心だった政府領域の調達選択肢が広がったことを意味する。第2に、SLM(Nemotron Nano 9B)からLLM(Super 120B、GPT OSS 120B)まで6モデルが統一APIで並ぶため、ユースケース単位で推論コストと精度のトレードオフを調整できる。
日本の組織にとってGovCloud(US)は直接利用対象ではないが、AWSが規制領域にオープンウェイトを主力投入した点は、今後の商用リージョンや他リージョンでの展開を見極める前例として記録する価値がある。