何が追加されたのか
MicrosoftはDeveloper BlogでFoundry Local 1.1を公開した。Foundry Localはオンデバイスで生成AIモデルを実行するためのランタイムで、今回の更新ではこれまでクラウド側に依存していた3つの機能がローカル実行可能になった。
Foundry Local 1.1: Live Transcription, Embeddings, and Responses API
追加された機能は、ライブ音声文字起こし (Live Transcription)、埋め込み生成 (Embeddings)、そしてOpenAI互換のResponses APIの3点。とくにResponses APIはOpenAIがアシスタント構築向けに提供しているエンドポイント仕様であり、これがローカルで動くということは、既存のOpenAI SDKを使ったコードがエンドポイントURLの差し替えだけでオフライン環境でも動作することを意味する。
実装現場で何が動くか
これまでローカルLLM環境では、テキスト生成はOllamaやLM Studioで動かせても、音声文字起こしはWhisper単体、埋め込みは別途sentence-transformersといった具合に、機能ごとに別ツールを組み合わせる必要があった。Foundry Local 1.1はこの3点を単一ランタイム配下で提供する。
Windows端末を業務標準とする日本企業では、社内文書を外部に出さずに検索・要約するローカルRAGの需要が継続している。文字起こしと埋め込みがランタイム同梱になったことで、議事録の文字起こし→ベクトル化→検索という典型的ワークフローを、クラウドAPI課金もデータ越境もなしに構築する道筋が明確になった。
落とし穴と確認すべき点
読者が注意すべきは、ローカル実行ゆえのハードウェア要件と、対応モデルの範囲である。Responses APIの「互換」がどこまでOpenAI本家の機能セット (tool calling、structured output等) をカバーするかは、PoC前に公式ドキュメントで確認すべき項目になる。クラウドAPIと同じコードが動くことと、同じ精度・同じ機能で動くことは別問題であり、移行判断は実機での実測が前提となる。