AWSはAmazon EMR Serverlessで、対話型セッション機能(Spark Connect方式)を提供開始した。JupyterやVisual Studio Code、SageMaker Unified Studioの管理ノートブックから、クラウド上のApache Spark処理を呼び出し、その場でコードを試しながら開発できる。
Spark Connectは開発者のクライアントとSpark本体(ドライバー)を切り離す仕組みで、手元の開発ツールを維持したまま計算処理だけをクラウドに任せられる。セッションをまたいでSparkの状態が保持され、手元のPythonコードとクラウド側のSpark処理を混在実行できる。これにより、データ探索・段階的デバッグ・PySparkジョブの少しずつの開発が本番投入前にクラウドで完結する。
監視面ではSpark UIでのリアルタイム監視、Spark History Serverでの履歴追跡、コンソール/API/CLI/SDKでのセッション管理に対応する。セッション単位で費用と利用状況を細かく把握できる点はコスト管理の精度を上げる。EMRリリース7.13で提供され、EMR Serverlessが使える全AWSリージョンで利用できる。