Mistral AIが公開した「Mistral Medium 3.5」は、密結合128Bパラメータ・256kコンテキストウィンドウを持つモデルで、SWE-Bench Verifiedで77.6%を記録した。このスコアは同社の先行モデルDevstral 2を上回り、コーディングエージェント用途での実力を具体的な数字で示している。
同時発表の「Vibe」リモートエージェントは、CLIまたはLe Chatから起動でき、クラウド上で非同期にコーディングタスクを並列実行する。ローカルで進めていたセッションをクラウド側へ「テレポート」する機能も用意され、対話的開発と長時間バッチ的なエージェント実行の切替が滑らかになる。Le Chatに追加されたWork modeは、メール、カレンダー、Jira、Slackといった業務ツールを横断する複雑なマルチステップタスクを自律処理する。
配布面では、オープンウェイトを修正MITライセンスでHugging Faceに公開、APIは入力$1.5・出力$7.5(百万トークンあたり)と価格を明示した。4GPUでセルフホスト可能な規模に抑えられており、NVIDIA NIMコンテナおよびbuild.nvidia.comからも利用できる。
日本の開発現場にとっての含意は明確だ。API単価とセルフホストコストを同一モデルで直接比較できるため、PoCから本番展開までのコスト試算がしやすい。修正MITでの重み配布はデータ境界を自社内に保ちたい金融・医療・政府系の要件と整合する。一方で、国内で広く使われる日本語ワークフローや既存SaaSとの統合検証は各社側で必要となる。まずVibeのCLIで定型的なコーディングタスクを走らせ、成功率・介入回数・復旧時間を記録することが次の一歩となる。