AWSは2026年6月11日、Google DeepMindの公開重み(オープンウェイト)モデル群Gemma 4を、マネージド基盤Amazon Bedrock上で利用可能にしたと発表した。提供されるのはGemma 4 31BGemma 4 26B-A4BGemma 4 E2Bの3種類で、すべての層が密に動く構造(dense)と一部の専門家だけが動く構造(MoE)にまたがる。

31Bは推論・コーディング中心の重い処理向けで、約25万6千トークンの長文脈を扱える。26B-A4Bはコストと応答速度を重視する処理向け、E2Bは最も小型で低遅延の対話向けだ。いずれもテキスト・画像・動画・音声の複数形式入力と35以上の言語に対応し、外部ツール呼び出し(function calling)・構造化出力・応答の逐次配信に標準対応する。

利用可能リージョンは米国東部(バージニア北部・オハイオ)・米国西部(オレゴン)・欧州(フランクフルト)の4つで、東京・大阪などの日本リージョンは現時点で含まれない。データを国内サーバから外に出さず処理したい業務では、現時点で対象外となる点が判断材料になる。