AWSは2026年5月20日、Amazon SageMaker HyperPodに推論ワークロード向けのデータキャプチャ機能を追加した。HyperPod上で生成AIや機械学習モデルを本番運用する組織にとって、入力と出力の系統的な可視化はモデルドリフト検知、規制監査対応、本番障害のデバッグ、ファインチューニング用ground-truthデータセット構築の前提となる。
従来、HyperPodユーザーは限定的な可観測性を受け入れるか、HyperPod Inference Operatorの外側にコストのかかるカスタムロギングパイプラインを構築するかの二択を迫られていた。新機能では、SageMakerエンドポイント、ロードバランサー、モデルポッドの3層からキャプチャポイントを選択し組み合わせられるため、必要な可視性レベルに応じた階層的な観測設計が可能になる。
運用面では、キャプチャデータはユーザー所有のS3バケットへ非同期配信される。サンプリング率を設定することでカバレッジとコストのバランスを取り、AWS KMSのカスタマーマネージドキーで暗号化することで機密データの保護要件にも対応する。設計上、データキャプチャは推論処理をブロックしないため、本番可用性は維持される。
有効化はHyperPod Inference OperatorまたはSageMaker JumpStart経由でモデルをデプロイする際にエンドポイント設定から行う。対象はEKSオーケストレーターを使用するHyperPodクラスターで、HyperPodがサポートされる全AWSリージョンで利用可能だ。Slurmベースの構成は現時点で対象外となるため、自社のオーケストレーター選択がそのまま機能利用可否に直結する点は実装前に確認すべきポイントとなる。