AIエージェントの「直し作業」を自動化｜Microsoft新機能

𝕏 詳細分析エージェント米国メガテック Foundry Agent Service 06/04 13:05

AI TREND

Microsoft：Agent Optimizer発表

Microsoftがクラウド型エージェント基盤「Foundry Agent Service」に、エージェントの動作を評価基準で採点し、より良い設定を自動生成して順位付けする「Agent Optimizer」を発表した。現在は招待制の限定先行公開で、30日以内に一般向け試用として提供予定。

3 の要点を3分で

Microsoftがクラウド型エージェント基盤Foundry Agent Serviceに、エージェントの動作を自動で評価・改善するAgent Optimizerを発表した。現在は招待制の限定先行公開で、30日以内に一般向け試用として提供予定。

エージェントを評価基準で採点し、より良い設定を自動生成して順位付けする閉ループ方式で動く。改善対象は指示文（プロンプト）・再利用可能な手順（スキル）・最適なモデル選定・ツール説明文の4種類から選べる。起動は「azd ai agent optimize」コマンド1つで、典型処理は数分で完了し追加インフラは不要。起動時に設定読込を一行追加するだけで導入でき、本番では最適化なしの既定値が自動適用される。

効くのは「作る」段階ではなく「正しく振る舞わせる」運用段階だ。これまで指示文を手で書き換え手作業テストするしかなかった改善ループが自動化される。記事の例では総合評価が0.60から0.92へ、再学習もコード変更もなしに改善した。Foundryの追跡記録（trace）と評価機能を組み合わせ、運用→評価→改善の循環を回す。

AIエージェントの「直し作業」を自動化｜Microsoft新機能の本文内説明図 — 図解: AIエージェント - Microsoftがクラウド型エージェント基盤Foundry

押さえるポイント

この変化で何が要点か。図解と出典つきで一目で。

手作業だったエージェント改善ループをコマンド1つで自動化
記事の例で総合評価が0.60から0.92へ改善（再学習なし）
改善対象は指示文・スキル・モデル選定・ツール説明の4種

5W1Hでサクッと理解

構造化された事実を最初に。誰が何をいつどこでなぜどのように。

誰が: Microsoft
何を: Agent Optimizer発表
いつ: 2026年6月4日
どこで: Foundry Agent Service
なぜ: 改善ループ自動化
どのように: 閉ループ採点・順位付け

背景

Foundry では「ホスト型エージェント（hosted agents）」により、ロジックを書いてコマンド一つで配置・公開できる仕組みが整っていた。だが「公開できた」ことと「本番運用に耐える」ことは別問題であり、現場では多くの課題が出ていた。たとえばカスタマーサポート用エージェントが注文番号を確認せずに状態照会したり、本来断るべき電気配線の助言をしてしまうといった不具合が起きる。これらを直すには指示文（システムプロンプト）を書き換え、手作業でテストし、他を壊していないか祈るしかなかった。10個のエージェントを別領域で運用するチームにとって、この手作業は規模拡大の妨げになっていた。

なぜ今注目なのか

エージェント開発の難所は「作ること」ではなく「あらゆる場面で正しく振る舞わせること」にあると開発者から繰り返し指摘されていた。Agent Optimizer はこの手作業の改善ループを自動化し、追加のインフラ構築なしに数分で完了する点が実務に効く。記事の例では総合評価が0.60から0.92へ、モデル再学習もコード変更もなしに改善している。

総合評価0.60が0.92に、コードもモデルも触らず

MicrosoftがFoundry Agent Serviceに追加したAgent Optimizerは、エージェントの動作を評価基準で採点し、より良い設定を自動生成して順位付けする閉ループ方式で動く。公式ブログの例では、総合評価が0.60から0.92へ、モデルの再学習もコード変更もなしに改善している。

効くのは「作る」段階ではなく「あらゆる場面で正しく振る舞わせる」運用段階だ。たとえばカスタマーサポート用エージェントが注文番号を確認せずに状態を照会したり、本来断るべき助言をしてしまう。こうした不具合を直すには、これまで指示文（システムプロンプト）を書き換え、手作業でテストし、他を壊していないか祈るしかなかった。