NVIDIAとAWSが協業を深め、AIを本番規模で動かすための基盤を3領域で強化したと発表した。柱は新仮想サーバー「EC2 G7」、検索基盤Amazon OpenSearchへのGPU高速化標準搭載、大規模学習向けのNVIDIA GB300認定(Exemplar Cloud)取得である。
最も実務に効くのが検索だ。OpenSearch Serverlessでベクトル検索のGPU高速化(NVIDIA cuVS)が標準となり、CPUのみと比べて索引作成が最大10倍速く、コストは4分の1になった。十億規模のベクトルデータベースを1時間未満で構築できる。これまで専門チームが必要だった処理が、追加実装なしのクラウド標準機能として使える。
推論面では、EC2 G7がNVIDIA RTX PRO 4500 Blackwell搭載で前世代G6比でAI推論が最大4.6倍に向上。最大8基のGPU、合計256GBのGPUメモリ、最大7.6TBのローカルSSDを備え、1~8GPU構成から選べる。試作から本番への移行で課題となる速度・コスト・運用負担を、各層で同時に底上げした形だ。