Microsoftがクラウド型エージェント基盤Foundry Agent Serviceに、エージェントの動作を自動で評価・改善するAgent Optimizerを発表した。現在は招待制の限定先行公開で、30日以内に一般向け試用として提供予定。

エージェントを評価基準で採点し、より良い設定を自動生成して順位付けする閉ループ方式で動く。改善対象は指示文(プロンプト)・再利用可能な手順(スキル)・最適なモデル選定・ツール説明文の4種類から選べる。起動は「azd ai agent optimize」コマンド1つで、典型処理は数分で完了し追加インフラは不要。起動時に設定読込を一行追加するだけで導入でき、本番では最適化なしの既定値が自動適用される。

効くのは「作る」段階ではなく「正しく振る舞わせる」運用段階だ。これまで指示文を手で書き換え手作業テストするしかなかった改善ループが自動化される。記事の例では総合評価が0.60から0.92へ、再学習もコード変更もなしに改善した。Foundryの追跡記録(trace)と評価機能を組み合わせ、運用→評価→改善の循環を回す。