SageMaker HyperPodがG7e/r5d.16xlarge対応、推論2.3倍と768GB

AWSはSageMaker HyperPodの対応インスタンスを拡張し、NVIDIA RTX PRO 6000 Blackwell Server Edition GPUを搭載するG7eと、CPU/メモリ重視のr5d.16xlargeを追加した。HyperPodは基盤モデルの学習・デプロイ向けに、フォールトトレランス、自動クラスタ復旧、分散学習ライブラリを組み込んだマネージド基盤で、今回の追加により選択できる計算プロファイルが広がる。
G7eの数値面の変化は明確だ。G6e比で推論性能は最大2.3倍、TFLOPsは最大1.27倍、GPU間帯域幅は最大4倍、総GPUメモリは最大768GB。AWSはユースケースとしてLLM、エージェンティックAI、マルチモーダル生成AI、physical AIを挙げており、単一エンドポイントでより大きなモデルを収容する、または複数モデルを同居させる運用が対象となる。加えて、NLP・コンピュータビジョン・小規模生成AIのシングルノード・ファインチューニングにも位置づけられている。
r5d.16xlargeは64 vCPU、512GBメモリ、5×600GB NVMe SSD、Intel Xeon Platinum 8000シリーズ（全コア持続ターボ最大3.1GHz）という構成で、Rayによる分散学習データ前処理、大規模特徴量エンジニアリング、メモリ重めのオーケストレーションをGPUノードと同じHyperPodクラスタ内で回す用途に向く。GPU前段のETLを外部基盤に出さず同居させられる点が、運用簡素化に直結する。
リージョンはG7eが米国東部（バージニア北部・オハイオ）、アジアパシフィック（東京）、米国西部（オレゴン）、r5d.16xlargeはHyperPod提供全リージョン。東京での提供は、国内データ要件を維持したまま大規模推論基盤を組む実装選択肢を直接広げる。

SageMaker HyperPodがG7e/r5d.16xlarge対応、推論2.3倍と768GBの本文内説明図 — 図解: 推論2.3倍の仕組み - G7eがHyperPodに加わり単一ノードで大規模LLMを収容す

押さえるポイント

G7eはG6e比で推論性能最大2.3倍、GPU間帯域幅最大4倍を実現
総GPUメモリ最大768GBで大規模LLMを単一エンドポイントに収容可能
東京リージョン対応で日本企業が低遅延で検証・本番運用できる

5W1Hでサクッと理解 誰が AWS 
 何を G7e/r5d対応追加 
 いつ 2026年4月28日 
 どこで 東京など4地域 
 なぜ 推論性能向上 
 どのように HyperPod拡張 

何が起きたか

要点AWSは2026年4月28日、SageMaker HyperPodの対応インスタンスにNVIDIA RTX PRO 6000 Blackwell搭載のG7eと、CPU/メモリ重視のr5d.16xlargeを追加した。G7eは東京を含む4リージョンで利用可能。

3つの視点で読む

開発現場

NVIDIA RTX PRO 6000 Blackwell Server Editionの採用により、G7eはG6e比で推論最大2.3倍、GPU間帯域幅最大4倍、TFLOPs最大1.27倍となる。総GPUメモリ768GBは70B級以上のLLMや物理AI・マルチモーダル生成AIを単一エンドポイントに載せる設計を可能にし、従来複数ノード分散が必要だった構成を1ノードに圧縮できる。

事業判断

HyperPodはフォールトトレランスと自動クラスタ復旧を持つマネージド基盤で、そこにG7eとr5d.16xlargeが同時追加された。GPUノードとメモリ重視CPUノード（64 vCPU・512GB・3TB NVMe）をHyperPod内で混在運用できるため、外部ETL基盤を別途用意する必要が減り、基盤モデル開発のTCO比較軸がH100系だけでなくBlackwell RTX PRO系にも広がる。

リスク・ルール

東京リージョン提供により、日本国内でデータレジデンシーを維持したまま大規模推論基盤を運用できる。海外リージョン経由を前提にしていた国内の行政・金融ワークロードで、越境データ移転の論点を減らす選択肢が増える。

追い風と向かい風

追い風を受ける側

日本国内でLLMを運用する企業・SIer東京リージョンでG7eが使え、国内データ要件を満たしつつ推論コストと遅延を改善できる
NVIDIARTX PRO 6000 Blackwell Server EditionがHyperPodの正式対応インスタンスに採用され、Hopper以外の販路が拡大する
Rayなど分散前処理フレームワーク利用者r5d.16xlargeの512GBメモリとNVMeにより、GPU前段の前処理・特徴量エンジニアリングを同一クラスタで完結できる

向かい風を受ける側