Microsoftが Build 2026 で、Foundry の観測機能(observability)を任意のエージェント開発枠組みと展開先へ拡張すると発表した。LangChain・LangGraph・OpenAI SDK・Microsoft Agent Framework、および OpenTelemetry 経由の独自枠組みに対応し(公開プレビュー)、他社製を含むエージェントを一つの追跡画面で監視・評価できる。
用途ごとに評価基準を自動生成する「ルーブリック評価器」を新設し、課題達成度・口調・安全性・費用・遅延の5軸を重み付けして採点する。本番のやり取りを賢く抽出する「インテリジェント・トレースサンプリング」により、全件評価せず費用を抑えながら品質を継続監視する。
エージェント最適化機能は改善案を根拠付きで順位化し、差分・履歴・巻き戻し(ロールバック)に対応する。これは現在非公開プレビューで、今月中に公開プレビューへ移行する予定。AIエージェントは非決定的で挙動が静かに劣化するため、ログやエラー率だけでは品質低下を捉えきれない。経営層の「費用に見合うのか」という問いに観測データで答える道筋を示す内容である。
OpenAI frontier models and Codex are now generally available on AWS, giving enterprises a new way to build on Amazon Bedrock with OpenAI through the security, compliance, and governance workflows they already use. This is also the beginning of a broader expansion of OpenAI…