社内コードを外に出さず使う高速AI｜JetBrains Mellum2

AI TREND

JetBrains：MoEモデル公開

JetBrainsが、自然言語とコードを一から学習した混合エキスパート方式（MoE）の新モデル「Mellum2」を公開した。総パラメータ120億ながら1トークンあたり実働25億にとどめ、同規模の公開モデルと競える性能で推論速度2倍以上をうたう。

3 の要点を3分で

JetBrainsが、自然言語とコードを一から学習した混合エキスパート方式（MoE）の新モデルMellum2を公開した。総パラメータは120億だが、1トークンあたり実際に動くのは25億にとどめることで高速処理を実現し、同規模の公開モデルと競える性能で推論速度は2倍以上速いとされる。商用利用可能なApache 2.0ライセンスで配布される。

前身は、JetBrainsのIDE向けコード補完を担う40億パラメータのモデルMellumで、過去にHugging Faceでのオープン公開やAmazon Bedrockマーケットプレイスでの無料提供が行われた。Mellum2はこの基盤を拡張し、補完だけでなく振り分け・検索補助（RAG）・要約・補助エージェント・自前環境運用まで対応する。

狙いは「軽くて速い役割」だ。巨大な単一モデルに一括依存せず、役割を絞った小型モデルを組み合わせて全体を速く・安く・制御しやすくする。社内コードや機密データを外部に出さずに扱いたい企業にとって、自社サーバー内で動かせる現実的な選択肢になる。

社内コードを外に出さず使う高速AI｜JetBrains Mellum2の本文内説明図 — 図解: AIエージェント - JetBrainsが自然言語とコードを一から学習した混合エキスパート方式

押さえるポイント

この変化で何が要点か。図解と出典つきで一目で。

総120億・実働25億のMoEで同規模モデルの2倍超の速度
商用利用可能なApache 2.0で配布、社内運用に向く
前身は40億のコード補完特化モデルMellumの拡張版

5W1Hでサクッと理解

構造化された事実を最初に。誰が何をいつどこでなぜどのように。

誰が: JetBrains
何を: MoEモデル公開
いつ: 2026年6月2日
どこで: Hugging Face
なぜ: 軽量高速役割狙い
どのように: 総120億実働25億MoE

背景

Mellumはもともと、JetBrainsの統合開発環境（コードを書く作業場、IDE）向けにコード補完を担う40億パラメータのモデルとして始まった。今回のMellum2はその基盤を拡張し、補完だけでなく自然言語処理やソフトウェア開発の幅広い作業に対応する。近年のAIシステムは、振り分け・検索・要約・計画・検証・ツール利用など、複数のモデル呼び出しを組み合わせて動く構成が増えている。こうした処理の多くは応答速度が重視され、必ずしも最大規模のモデルを必要としない。Mellum2はこの「軽くて速い役割」を狙って設計されている。

なぜ今注目なのか

Mellum2は、巨大な単一モデルにすべてを任せるのではなく、役割を絞った小型モデルを組み合わせて全体を速く・安く・制御しやすくするという設計思想を体現している。同規模の他モデルと競える性能を保ちつつ2倍以上速いとされ、自社サーバー内（自前環境）での運用にも向く。社内コードや機密データを外部に出さずに扱いたい企業にとって、現実的な選択肢になる。

120億のうち25億だけ動かす——速度2倍超の狙い

JetBrainsが公開した新モデルMellum2は、総パラメータ120億の混合エキスパート方式（複数の専門モジュールを切り替えて使う方式、MoE）を採る。特徴は、1トークンを処理するたびに動くパラメータを25億にとどめる点だ。すべてのパラメータを毎回動かさないため、同規模の公開モデルと競える性能を保ちながら推論速度を2倍以上に引き上げる。

Introducing Mellum2: A 12B Mixture-of-Experts Model by JetBrains
出典: Hugging Face Blog

上の見出しにある「12B」は総パラメータ120億、「Mixture-of-Experts（MoE）」は処理ごとに必要な専門モジュールだけを起動する仕組みを指す。巨大な単一モデルにすべてを任せるのではなく、役割を絞って全体を速く・安く・制御しやすくする設計思想がここに表れている。

コード補完専用から、振り分け・検索・要約まで

Mellum2の前身は、JetBrainsの統合開発環境（コードを書く作業場、IDE）向けにコード補完を担う40億パラメータのモデルMellumだった。Mellumは過去にHugging Faceでオープン公開され、Amazon Bedrockのマーケットプレイスでも無料提供されている。

Mellum Goes Open Source: A Purpose-Built LLM for Developers, Now on Hugging Face
出典: The JetBrains AI Blog

上の見出しにある「Open Source」はソースを公開して誰でも使える形にすること、「Purpose-Built LLM」は用途を絞って設計した大規模言語モデルを指す。Mellum2はこの基盤を拡張し、コード補完だけでなく自然言語処理やソフトウェア開発の幅広い作業に対応する。具体的には、どのモデルに処理を回すかの振り分け、検索補助（外部知識を引いて答えを補強する仕組み、RAG）、要約、補助エージェント、自社サーバー内での運用などを想定する。これらの処理は応答速度が重視され、必ずしも最大規模のモデルを必要としない領域だ。Mellum2はこの「軽くて速い役割」を狙って設計されている。