Mellum2 — Le nouveau modèle MoE de JetBrains

Rapport mis à jour le 18-06-2026 · Benchmarks : Hugging Face (JetBrains/Mellum2-12B-A2.5B-Instruct & Mellum2-12B-A2.5B-Thinking)

📋 Vue d'ensemble

JetBrains a publié Mellum2, un modèle de langage de 12B paramètres basé sur une architecture Mixture-of-Experts (MoE), entraîné ex nihilo sur des données de texte naturel et de code. Seuls 2.5B paramètres sont activés par token, ce qui permet une inférence rapide et économe en ressources.

Deux variants principaux :

🔧 Architecture & Performance

ParamètreValeur
Paramètres totaux12B
Paramètres actifs/token2.5B
ArchitectureMixture-of-Experts (MoE) — 64 experts, 8 activés
Couches28
Taille cachée2304
Contexte131,072 tokens
Sliding Window1,024
PrécisionBF16
LicenseApache 2.0 (Open Source)

📊 Benchmarks (auto-rapportés par JetBrains)

📝 Mellum2 Instruct

BenchmarkMellum2Qwen3.5 4BQwen3.5 9BOLMo-3 7BMinistral 3 14BSeed-Coder 8B
LiveCodeBench v630.937.251.063.728.242.4
EvalPlus76.278.469.471.867.374.1
MultiPL-E64.667.151.067.136.177.0
BFCL v431.844.252.060.619.838.8
BFCL v343.166.364.170.541.952.7
AIME (2025+2026)29.941.738.358.340.033.3
GSM-Plus73.080.585.287.985.886.6
MMLU-Redux77.478.187.591.171.885.9
GPQA Diamond38.940.976.879.840.958.6
IFEval69.375.882.183.983.267.3
JetBrains pairwise66.768.160.677.844.472.4
MixEval62.962.265.971.159.471.2
BS-Bench24.018.056.961.022.09.0
HarmBench (↓)8.423.120.320.914.756.5
XSTest78.381.293.291.291.296.8

🧠 Mellum2 Thinking

BenchmarkMellum2Qwen3.5 4BQwen3.5 9BOLMo-3 7BMinistral 3 14B
LiveCodeBench v675.169.959.468.359.8
BFCL v438.845.642.942.735.9
BFCL v360.569.473.968.552.2
AIME (2025+2026)20.058.468.373.461.7
GSM-Plus62.687.089.390.788.1
MMLU-Redux84.886.288.391.771.3
GPQA Diamond39.957.676.881.329.3
IFEval69.176.587.189.884.7
JetBrains pairwise64.469.540.556.763.8
MixEval63.466.971.976.070.8
BS-Bench14.015.063.070.023.0
HarmBench (↓)12.220.615.96.648.7
XSTest90.889.696.897.696.8

AIME = moyenne AIME 2025+2026 (30 questions/chacune). BFCL v4 = moyenne macro 5 sous-tâches. JetBrains pairwise = win rate vs Qwen2.5-7B-Instruct. HarmBench ↓ : plus bas = mieux. Source : pages HF des modèles.

🎯 Points clés

💡 Philosophie : le \"Focal Model\"

JetBrains défend une vision de systèmes IA coordonnés plutôt que monolithiques. Mellum2 est conçu comme un \"focal model\" — un composant rapide et spécialisé pour les tâches à haute fréquence dans une stack IA plus large. Il ne vise pas à remplacer les grands modèles frontier, mais à rendre la stack plus rapide, moins chère et plus contrôlable.

📦 Disponibilité

🤔 Analyse d'Alfred

Mellum2 est intéressant pour plusieurs raisons :

📚 Sources