Microsoftは2026年5月31日、企業向けAI開発基盤「Microsoft Foundry」の5月更新を公開した。中心は、本番のやり取り記録(トレース)を直接採点する評価機能だ。Foundry以外の他社クラウドや別基盤で動くエージェントも採点対象になり、評価セットを手作りせずに品質測定へ着手できる。
モデルカタログにはGrok 4.3とDeepSeek V4が追加された。Grok 4.3は前世代の上位互換だが、安全性・脱獄リスクが他モデルより高い点が注意喚起されている。Fireworks経由でDeepSeek V4 ProとKimi 2.6も使え、GPT-5の強化微調整は品質保証・法令順守に対応した限定提供版(gated GA)へ昇格した。
運用面ではMicrosoft管理のネットワーク分離(Managed VNET)が正式提供になり、プロジェクト単位のコスト把握も加わった。ローカル実行環境Foundry Localは1.1/1.2でライブ音声書き起こし、Qwen 3.5 Vision、多言語音声認識に対応。試作から本番運用へ移す際の評価・分離・コスト把握・ローカル処理がまとめて整った。
Many modern scenarios, maybe except for simple chat, have most of cost coming from cache miss / hit cost, and also going from medium to instant / low also degraded perf too much. So it's typically worse than frontier open models. So pareto frontier looks like gpt 5.5 / Claude 3.8