AWS Glue zero-ETL統合は、AWSが推進する「ETLパイプラインを書かないデータ統合」の中核機能で、今回ムンバイ(アジアパシフィック)リージョンに展開された。対応ソースはAmazon DynamoDB、Oracle Database@AWS、セルフマネージドDB(Oracle、SQL Server、MySQL、PostgreSQL)、そしてSaaSアプリケーションのSalesforce、SAP、Zendesk、Zoho CRMと幅広い。これらのデータを分析データストアへ直接レプリケートできる。

技術的な要点は、スキーママッピング、変更データキャプチャ(CDC)、増分レプリケーションをAWSが内部で処理する点だ。これまではAWS DMSやGlueジョブ、サードパーティのCDCツールを組み合わせて構築していた領域が、統合設定とモニタリング作業に置き換わる。データ移動のレイテンシ削減とニアリアルタイムでのターゲット反映により、分析・機械学習ワークロードの鮮度が上がる。

日本企業視点では、インド現地法人やインド市場向けサービスを運営するチームに直接の意味がある。RBI(インド準備銀行)規制下の金融データなど、国外移送が制約される領域で、データを同一リージョン内に留めたまま分析基盤を構築できる選択肢が広がった。

一方、検討時の落とし穴として、zero-ETLは「対応ソース×対応ターゲット」の組み合わせに依存する点に注意が必要だ。AWS Glueの公式ドキュメントには制約事項(Limitations)が記載されており、テーブルサイズ、スキーマ変更時の挙動、初期ロード時間などは事前検証が前提になる。既存のサードパーティETLツールを置き換える判断は、対応範囲・料金・運用工数を1ワークロード単位で比較したうえで行うのが現実的だ。