AWSは2026年6月10日、データ分析・AI開発の統合環境Amazon SageMaker Unified Studioのノートブックで、サーバーレス型ビッグデータ処理基盤Amazon EMR Serverlessを分散処理エンジンApache Sparkの実行基盤として使えるようにした。従来はAmazon Athena Spark経由が前提だったが、EMR Serverlessが選択肢に加わり、用途に応じて実行エンジンを切り替えられる。

ノートブックの各セルでPySparkSpark SQLをEMR Serverless上で実行でき、実行エンジンは横のパネルから選択するとPythonとSQL両方のセルに適用される。全エンジン共通のSpark UI監視画面でジョブの実行状況を確認でき、組み込みAI支援機能SageMaker Data Agentと併用すれば自然言語からコードや実行計画を生成できる。

事前確保した処理能力(pre-initialized capacity)でセッション起動を速められ、仮想ネットワーク接続(VPC接続)にも対応する。SageMaker Unified Studioが使える全AWSリージョンで、ノートブックとJupyterLab環境の両方に対応する。