AWS:Gemma 4提供開始
画像: AI生成

AWSは2026年4月30日、Google DeepMindのGemma 4シリーズからE4B、26B-A4B、31Bの3モデル(すべて指示チューニング済み)をAmazon SageMaker JumpStartで提供開始した。

3モデルに共通する機能は広範で、ステップバイステップの推論モード、画像理解(物体検出、文書・PDF解析、画面・UI理解、チャート理解、多言語OCR、手書き認識)、動画理解(フレーム列の処理)、テキストと画像を1つのプロンプト内で自由に混在させるインターリーブ入力、構造化ツール利用のためのネイティブ関数呼び出し、コード生成・補完・修正、35以上の言語への即時対応(事前学習は140以上の言語)を備える。

差別化要素はE4Bに集約されている。E4Bのみが音声入力を受け付け、自動音声認識(ASR)と、音声から翻訳済みテキストへの変換に複数言語で対応する。音声を扱うエージェントやコンタクトセンター系ワークロードでは、軽量モデル1つで入力モダリティを統合できるため、パイプライン構成が単純化する。

デプロイはSageMaker StudioのModelsセクションからのGUI操作、またはSageMaker Python SDK経由で行える。既にSageMakerを運用している組織では、権限・VPC・ロギングなどの既存ガードレールの中にGemma 4を組み込めるため、PoCから本番移行までの摩擦が小さい。エンタープライズがマルチモーダル基盤モデルを比較検討する際、JumpStartの標準カタログに並んだことで、評価対象に加えやすい状態となっている。