Rapport — LFM2.5-8B-A1B

Aperçu

LFM2.5-8B-A1B est le dernier modèle de Liquid AI, une architecture MoE Edge Reasoning conçue pour fonctionner sur des appareils grand public (téléphones, laptops, PCs, robots). Il combine 8B paramètres totaux avec seulement 1.5B actifs par forward pass, offrant un ratio performance/coût exceptionnel.

Spécifications clés

8B / 1.5B

Paramètres (total / actif)

128K

Contexte (tokens)

38T

Tokens d'entraînement

128K

Vocabulaire (tokens)

Améliorations par rapport à LFM2-8B-A1B

📈 Contexte

32K → 128K tokens
+400B tokens de midtraining sur données long-document

🌍 Vocabulaire

65K → 128K tokens
+120% Hindi, +238% Thai, +118% Vietnamese

🧠 Raisonnement

Chain of thought explicite
RL pour réduire les "doom loops"

🎯 Hallucinations

RL avg@k-based reward
Boundary de connaissance plus nette

📊 Benchmarks — LFM2.5 vs LFM2

Benchmark	LFM2	LFM2.5	Δ
AA-Omniscience Index	-78.42	-24.70	+53.62
IFEval	79.44	91.84	+12.44
IFBench	26.00	56.47	+30.47
MATH500	74.80	88.76	+13.96
AIME25	20.00	42.53	+22.53
BFCLv3	45.07	64.36	+19.29
BFCLv4	25.52	48.50	+22.98
Tau² Telecom	13.60	88.07	+74.47
Tau² Retail	7.02	39.82	+32.80

🔥 Comparaison avec d'autres modèles

Modèle	Params	IFEval	IFBench	BFCLv3	Tau² Telecom
LFM2.5-8B-A1B	8B/A1B	91.84	56.47	64.36	88.07
Qwen3-30B-A3B-Thinking	30.5B/3.3B	90.82	51.11	73.39	21.93
Gemma-4-26B-A4B-IT	26B/4B	91.40	47.25	68.87	42.11
gpt-oss-20b	21B/3.6B	86.73	58.64	62.52	57.24
Qwen3.5-4B	4B	87.80	50.38	71.06	87.72

💡 LFM2.5 bat des modèles 3-6x plus grands en instruction following et agentic, tout en n'utilisant que 1.5B paramètres actifs.

🛠️ Plateformes supportées

llama.cpp (GGUF) MLX (Apple Silicon) vLLM SGLang LEAP (iOS/Android) Transformers

🎯 Verdict

LFM2.5-8B-A1B est un banger confirmé. Le saut de performance est massif (+53 sur l'AA-Omniscience Index), le contexte 128K est huge, et le vocabulaire étendu le rend bien plus multilingue. C'est le modèle de référence pour les agents on-device privés, et il bat des modèles 3-6x plus grands en instruction following et tool calling.

Prochaine étape : le tester en local et voir si on peut l'intégrer dans certains workflows. GGUF disponible sur Hugging Face.