AWSは2026年5月5日、AIエージェントの本番運用品質を継続的に改善するためのマネージド機能『AgentCore Optimization』をプレビュー公開した。launch時点で高品質なエージェントも、モデルの更新、ユーザー行動の変化、プロンプトの流用によって品質が静かに劣化していくという課題に対応する。
中核となるのは3つの機能だ。第一にRecommendations APIが本番トレースを分析し、システムプロンプトまたはツール説明の改善案を自動生成する。第二にバッチ評価が事前定義されたテストデータセットに対してエージェントを実行し、集計スコアでリグレッションを検出する。第三にA/BテストがAgentCore Gatewayを通じて本番トラフィックを設定割合で分割し、信頼区間とp値付きで結果を報告する。
運用面で重要なのが『設定バンドル』の導入だ。モデルID、システムプロンプト、ツール説明を不変のバージョン管理スナップショットとしてまとめ、コード変更なしでプロンプトやモデルを切り替えられる。トレースはOpenTelemetry互換形式でAgentCore Observabilityが管理し、目標達成率・ツール選択精度・有用性・安全性などの軸で自動スコアリングされる。
日本市場との関係では、NTTデータと野村総合研究所が活用事例としてコメントを提供している点が注目される。国内大手SIerがAWSのエージェント基盤を実運用フェーズで採用している事実が公式に示された形だ。エージェント運用の標準プラクティスが『推奨生成→バッチ評価→A/Bテスト→バンドル切替』というループに固定化されていく流れの中で、自前構築を進めるチームは機能差と運用コストの比較を改めて行う必要がある。