AWSが2026年6月18日、プログラマティック広告のリアルタイム入札にAIエージェントを組み込む本番想定の実装ガイダンスを公開した。今日の入札処理は1日数十億件の判断をミリ秒単位で下し、その締め切りとCPUのみの基盤から、ルールベースの簡易ロジックや軽量モデルに依存してきた。深層学習モデルを挟むと応答が締め切りを超えるが、GPU推論を入札経路上に置くことで速度を犠牲にせずモデル主導の判断を実現する。

ガイダンスは業界標準ARTF(IAB Tech Labが2025年11月13日にコメント募集版を公開、応答時間を約80%=600〜800msから100msへ削減)に準拠する。NVIDIA Triton推論サーバーAmazon EKS上で動かし、入札価格最適化・オーディエンス活性化・PMP取引管理・品質指標付与の4種のARTF準拠コンテナを例示する。深層学習の推奨モデル(DLRM、Wide&Deep、NCF)をGPUで動かし、ルールベースのコンテナと同一パイプライン上で混在させられる。

各コンテナは外部ツール接続規格(MCP)を公開しAmazon Bedrock AgentCoreから検証でき、Blackwell世代のEC2 G7eに対応する。入札ロジックを一枚岩から個別コンテナへ分割でき、停止せず改善できる構成と、GPU調達を所有から従量課金へ転換できる点が導入判断に効く。