JetBrainsが、自然言語とコードを一から学習した混合エキスパート方式(MoE)の新モデルMellum2を公開した。総パラメータは120億だが、1トークンあたり実際に動くのは25億にとどめることで高速処理を実現し、同規模の公開モデルと競える性能で推論速度は2倍以上速いとされる。商用利用可能なApache 2.0ライセンスで配布される。

前身は、JetBrainsのIDE向けコード補完を担う40億パラメータのモデルMellumで、過去にHugging Faceでのオープン公開やAmazon Bedrockマーケットプレイスでの無料提供が行われた。Mellum2はこの基盤を拡張し、補完だけでなく振り分け・検索補助(RAG)・要約・補助エージェント・自前環境運用まで対応する。

狙いは「軽くて速い役割」だ。巨大な単一モデルに一括依存せず、役割を絞った小型モデルを組み合わせて全体を速く・安く・制御しやすくする。社内コードや機密データを外部に出さずに扱いたい企業にとって、自社サーバー内で動かせる現実的な選択肢になる。