2026年6月3日、Microsoftが本番AIアプリのモデル運用指針「A Developer's Guide to Managing Models, Cost and Quality in Microsoft Foundry」を公開した。優れたモデルへのアクセスが前提となった今、課題は「どのモデルをどう選び、検証し、コストを抑えつつ本番で安定運用するか」という運用面に移ったという考えを示す。

モデル選定は性能ランキングではなく、能力・安全性・応答速度・コストの4軸で作業内容との適合を判断する。リクエストごとに最適モデルへ自動振り分けする「Model Router」、自前のCSV/JSONLデータで複数モデル・プロンプトを横並び評価する仕組み、バッチ・キャッシュ・プロビジョンドスループット・割り当て管理・圧縮蒸留などのコスト最適化手段を、1つのワークフローに統合する。提供元に縛られない方針でMicrosoft製・OSS・外部ベンダー(ISV)を同一画面で扱え、囲い込み(ベンダーロックイン)を避けられる。

同時に「Fireworks AI on Microsoft Foundry」が一般提供(GA)に到達。単一のAzureエンドポイントから企業向けSLA付きで、別契約・別インフラなしに高速なオープンモデル推論を本番品質で使える選択肢が増えた。