AWSは2026年6月18日、Amazon SageMaker AIの非同期推論で、入力データをAPIリクエストの本文に直接埋め込んで送れる機能を発表した。エンドポイント呼び出しAPI(InvokeEndpointAsync)に新パラメータ「Body」が追加され、これまで必須だったストレージ(Amazon S3)への事前アップロードが不要になった。

直接送信できるデータは最大128,000バイトまで。BodyとInputLocation(S3指定)は同時に指定できず、両方指定するとエラーになる。既存の非同期エンドポイントでそのまま使え、モデルやコンテナの変更は不要で、31の商用AWSリージョンで利用できる。出力は従来どおりS3の出力先に書き込まれる。

小さな入力を高頻度で扱うワークロードでは、S3アップロード分の通信往復とアップロード料金が毎回発生していた。今回の更新でこの往復と課金が消え、入力用バケットの準備・書き込み権限(IAMのs3:PutObject許可)・古いデータの掃除といった運用負荷も減る。一方、画像・音声・数MBの文書など128,000バイトを超えるデータは引き続きS3指定を使う必要がある。