Mistral Medium 3.5公開：128BモデルがSWE-Bench 77.6%

Mistral AIが公開した「Mistral Medium 3.5」は、密結合128Bパラメータ・256kコンテキストウィンドウを持つモデルで、SWE-Bench Verifiedで77.6%を記録した。このスコアは同社の先行モデルDevstral 2を上回り、コーディングエージェント用途での実力を具体的な数字で示している。

同時発表の「Vibe」リモートエージェントは、CLIまたはLe Chatから起動でき、クラウド上で非同期にコーディングタスクを並列実行する。ローカルで進めていたセッションをクラウド側へ「テレポート」する機能も用意され、対話的開発と長時間バッチ的なエージェント実行の切替が滑らかになる。Le Chatに追加されたWork modeは、メール、カレンダー、Jira、Slackといった業務ツールを横断する複雑なマルチステップタスクを自律処理する。

配布面では、オープンウェイトを修正MITライセンスでHugging Faceに公開、APIは入力$1.5・出力$7.5（百万トークンあたり）と価格を明示した。4GPUでセルフホスト可能な規模に抑えられており、NVIDIA NIMコンテナおよびbuild.nvidia.comからも利用できる。

日本の開発現場にとっての含意は明確だ。API単価とセルフホストコストを同一モデルで直接比較できるため、PoCから本番展開までのコスト試算がしやすい。修正MITでの重み配布はデータ境界を自社内に保ちたい金融・医療・政府系の要件と整合する。一方で、国内で広く使われる日本語ワークフローや既存SaaSとの統合検証は各社側で必要となる。まずVibeのCLIで定型的なコーディングタスクを走らせ、成功率・介入回数・復旧時間を記録することが次の一歩となる。

Mistral Medium 3.5公開：128BモデルがSWE-Bench 77.6%の本文内説明図 — 図解: リモートエージェント構成 - 128Bモデルがクラウドで非同期並列実行し、ローカル開発と自律エージェントを一つのワ

押さえるポイント

SWE-Bench Verifiedで77.6%、同社Devstral 2を上回るコーディング性能を記録
CLI／Le Chatからクラウド上で非同期にエージェントを起動、並列実行が可能
128Bモデルを修正MITライセンスでHugging Face公開、4GPUでセルフホスト可能

5W1Hでサクッと理解 誰が Mistral AI 
 何を Medium 3.5とVibe公開 
 いつ 公開日時不明 
 どこで Hugging Face等 
 なぜ エージェント実行基盤 
 どのように オープンウェイト＋API 

何が起きたか

要点Mistral AIが密結合128BモデルMistral Medium 3.5と、同モデルを用いたVibeのリモートコーディングエージェント、Le ChatのWorkモードを同時公開した。

3つの視点で読む

開発現場

密結合128Bで256kコンテキスト、SWE-Bench Verified 77.6%という構成は、4GPUセルフホストが可能な規模でエージェント実行に必要な長文脈と推論品質を両立している。ローカルセッションをクラウドへ「テレポート」する設計により、対話的開発と非同期並列エージェントの切替が同一ワークフローで成立する。

事業判断

入力$1.5・出力$7.5（百万トークン）の価格提示とオープンウェイト配布の併存で、API利用と自社GPU展開のコスト比較が実数値でできる。NVIDIA NIMコンテナとbuild.nvidia.comでの提供により、既存のNVIDIAスタックを持つ企業はプロキュアメント経路を追加せず導入可能になった。

リスク・ルール

修正MITでのオープンウェイト公開は、モデル重みを自社インフラ内に閉じ込めたい規制業界（金融・医療・政府系）の調達要件と整合する。クラウドに送出するデータ境界を自社で定義できるため、データ所在地要件のある日本の企業にとっても選択肢が増えた。

追い風と向かい風

追い風を受ける側

セルフホスト志向の企業開発チーム4GPUで動く128Bオープンウェイトをコーディングエージェント用途で社内展開できる
NVIDIAエコシステム利用者NIMコンテナとbuild.nvidia.comで即時利用でき、既存スタックに組み込める
コスト比較を行うCTO／購買担当API単価とセルフホストGPUコストを同一モデルで直接比較できる

向かい風を受ける側

クローズドな中価格帯コーディングモデル提供ベンダーオープンウェイト＋$1.5/$7.5の価格提示により、同等スコア帯での差別化が難しくなる
単機能のコーディング支援ツールLe Chat Work modeがメール・Jira・Slack横断を自律実行するため、単機能ツールの統合価値が相対的に低下する

今やるべきこと

技術判断 確認する修正MITライセンスの利用条件と、256kコンテキスト時の実効スループットを自社GPU構成で確認する

事業判断 比較する API利用（入力$1.5／出力$7.5）と4GPUセルフホストの月次コストを、想定トークン量で比較する

実装・検証 試す VibeのCLIからリモートエージェントを起動し、既存リポジトリでSWE-Bench類似タスクの成功率と介入回数を測る

時系列タイムライン

公開時期 Mistral AIがMistral Medium 3.5、Vibeリモートエージェント、Le Chat Work modeを発表
同時公開 Hugging Faceにて修正MITライセンスでオープンウェイト公開、API提供開始（入力$1.5／出力$7.5）
同時公開 NVIDIA NIMコンテナおよびbuild.nvidia.comで利用可能化

情報ソース

Remote agents in Vibe. Powered by Mistral Medium 3.5. 一次情報公式製品発表
Devstral 2 & Vibe CLI ベンダー資料比較参考
Workflows ベンダー資料関連機能
build.nvidia.com: mistral-medium-3.5-128b 製品ドキュメント配布経路
NVIDIA NIM: mistral-medium-3.5-128b 製品ドキュメント配布経路

モデルの記事

読み込み中...

Mistral Medium 3.5公開：128BモデルがSWE-Bench 77.6%

押さえるポイント

5W1Hでサクッと理解

何が起きたか

3つの視点で読む

追い風と向かい風

今やるべきこと

時系列タイムライン

関連動画

情報ソース

人気記事ランキング

モデルの記事

押さえるポイント

5W1Hでサクッと理解

何が起きたか

3つの視点で読む

追い風と向かい風

今やるべきこと

時系列タイムライン

SNSの反応

主な声

関連動画

関連コンテンツ

関連キーワード

関連するAIトレンド記事

情報ソース

人気記事ランキング

モデルの記事