Amazon Redshiftの新インスタンス「RG」は、AWS Gravitonベースのプロセッサと統合データレイククエリエンジンを組み合わせた点が核心となる。RA3比で最大2.2倍の高速化、vCPUあたり30%の価格引き下げという数値もさることながら、実務上のインパクトが大きいのはRedshift Spectrumの位置付けの変化である。
これまでRedshiftでS3上のデータレイクを参照する場合、Spectrum経由でスキャンしたデータ量に応じて$5/TBの課金が発生していた。データレイク中心のワークロードではこの従量課金が読みづらく、コスト管理上の悩みどころだった。RGでは統合クエリエンジンがデータレイクを直接処理するためSpectrumが不要となり、このスキャン課金そのものが撤廃される。Apache Icebergで最大2.4倍、Apache Parquetで最大1.5倍という性能向上は、レイクハウス構成を現実的な選択肢に押し上げる数値である。
移行経路も整備されている。Elastic Resizeを使えば10〜15分のダウンタイムで既存RA3クラスターから切り替えられ、Snapshot and Restoreという代替手段も用意されている。外部テーブル・スキーマ・既存のSpectrumクエリ構文は変更不要で、アプリケーションコードに手を入れずに性能改善とコスト削減を取り込める。データレイククエリはVPC境界内で実行され、既存のIAMロールがそのまま使えるため、社内のガバナンス設計も維持される。
読者が今すべきことは、現行のSpectrumスキャン量とvCPU構成を棚卸しし、RG移行後のTCOを試算することである。Snowflake・BigQuery・Databricksとの比較検討中であれば、コスト前提が変わったタイミングとして再評価に値する。