JetBrainsがMoE型コードモデルMellum2公開
詳細を読む
開発ツール大手のJetBrainsは6月1日、120億パラメータのMixture-of-Experts(MoE)モデル「Mellum2」を公開しました。テキストとコードを対象に一から学習したモデルで、ライセンスは商用利用も可能なApache 2.0です。コード補完から出発したMellumの後継として、より広範なソフトウェア開発タスクへ用途を広げています。
最大の特徴は効率性にあります。総パラメータは120億ですが、MoE構成により1トークンあたり25億パラメータのみを活性化させ、モデル全体の容量を保ちつつ推論コストを抑えます。同社によれば、同規模のオープンモデルと競合する性能を保ちながら、推論速度は2倍以上に達するといいます。
JetBrainsはMellum2を、最大のモデルを必要としない低レイテンシ処理向けと位置づけます。具体的には、プロンプト分類やツール選択といったルーティング、文脈圧縮や要約を含む検索後処理、エージェントの計画・検証・変換などの補助タスクが対象です。これらは頻度が高く速度が重要なため、軽量モデルが適しているという考え方です。
同社はこうした役割を「focal(焦点)」モデルと表現します。大規模システム内の高頻度タスクに最適化した、速く役割の明確なモデルという位置づけです。スタック内の全モデルを置き換えるのではなく、システム全体を「より速く、安く、制御しやすく」することを目的に掲げています。
オープンかつ効率的に運用できる点から、独自コードや社内データを扱う自社ホスト環境への展開も想定されています。モデルはHugging Faceで公開され、アーキテクチャや評価手法は技術レポートで確認できます。IDE内やRAGパイプライン、エージェントワークフローなど、実運用での試用が可能な状態です。