AWS:G6eをStudioに拡大
画像: AI生成

AWSは、SageMaker StudioノートブックにおけるAmazon EC2 G6eインスタンスの一般提供リージョンを拡大した。新たに対応したのは中東(ドバイ)、アジアパシフィック(東京・ソウル)、欧州(フランクフルト・ストックホルム・スペイン)の6リージョンで、日本のユーザーにとっては東京リージョン対応が大きな意味を持つ。

G6eはNVIDIA L40S Tensor Core GPUを最大8基搭載し、GPU1基あたり48GBメモリ、第3世代AMD EPYCプロセッサと組み合わさる構成で、AWSはG5比で最大2.5倍の性能を公式に提示している。SageMaker Studio上のJupyterLabおよびCodeEditorアプリから起動でき、最大130億パラメータのLLMデプロイ、画像・動画・音声生成の拡散モデルのインタラクティブ検証、生成AIのファインチューニングといった実務ユースケースが想定されている。

技術判断の観点では、これまで国内リージョンではGPUメモリ制約から選択肢が限られていたファインチューニング系ワークロードが、東京リージョン内で完結する点が重要である。データを国外に出さずにL40Sクラスを使えることで、金融・医療・公共など国内データ主権要件を持つ領域でも採用検討の前提条件が整う。

一方、本リリースはリージョン拡大であって新インスタンスの発表ではない。G6e自体は既存サービスであり、料金は通常の料金ページで確認する必要がある。実装着手時の落とし穴として、SageMaker Studioのドメイン設定やインスタンスクォータが新リージョンでデフォルトでは小さい場合があるため、L40S 8基構成を狙う場合は事前にサービスクォータの引き上げ申請を切り分けて行うのが現実的である。