AWSは、Amazon SageMaker StudioノートブックにおけるG6eインスタンスの利用可能リージョンを拡大したと公式の「What's New」で発表した。G6eはNVIDIA L40S Tensor Core GPUを搭載するEC2インスタンスファミリーで、生成AIモデルの学習・ファインチューニング・推論を主用途としている。
今回の発表のポイントは新機能の追加ではなく「提供面の拡大」である。SageMaker Studioノートブックは、ブラウザ上のIDEからGPUインスタンスを直接起動して検証を進められるマネージドサービスであり、対応インスタンスタイプとリージョンの組み合わせが利用者の実装可否を直接左右する。これまで一部リージョンに限られていたG6eが追加地域で選択できるようになることで、データレジデンシーや低レイテンシを要件とするユーザーが、別リージョンへ迂回せずノートブック上で生成AIワークロードを試せる。
周辺動向としては、AWSはSageMaker InferenceでのG6eサポート、さらに後継となるG7eによる生成AI推論加速についても公式ブログで解説しており、L40S世代以降のGPU選択肢を体系的に整えつつある。利用者から見ると、G5等の旧世代から、G6e、G7eへと比較対象が増えた格好だ。
読者が次にやるべきは、対象リージョンに自社の利用拠点が含まれるかをAWSの公式リージョン一覧で確認し、代表的な推論ワークロードでG6eのトークン/秒と時間単価を実測することだ。リージョン拡大は単独では地味な発表だが、東京リージョンを含む日本ユーザーにとっては調達条件と検証速度の前提が変わる契機となる。