LFM2.5-8B-A1B

Liquid AI — Mixture-of-Experts optimisé pour le edge computing

📅 28 mai 2026 • Rapport généré le 29 mai 2026

Aperçu

LFM2.5-8B-A1B est le dernier modèle de Liquid AI, une architecture MoE Edge Reasoning conçue pour fonctionner sur des appareils grand public (téléphones, laptops, PCs, robots). Il combine 8B paramètres totaux avec seulement 1.5B actifs par forward pass, offrant un ratio performance/coût exceptionnel.

Spécifications clés

8B / 1.5B
Paramètres (total / actif)
128K
Contexte (tokens)
38T
Tokens d'entraînement
128K
Vocabulaire (tokens)

Améliorations par rapport à LFM2-8B-A1B

📈 Contexte

  • 32K → 128K tokens
  • +400B tokens de midtraining sur données long-document

🌍 Vocabulaire

  • 65K → 128K tokens
  • +120% Hindi, +238% Thai, +118% Vietnamese

🧠 Raisonnement

  • Chain of thought explicite
  • RL pour réduire les "doom loops"

🎯 Hallucinations

  • RL avg@k-based reward
  • Boundary de connaissance plus nette

📊 Benchmarks — LFM2.5 vs LFM2

Benchmark LFM2 LFM2.5 Δ
AA-Omniscience Index -78.42 -24.70 +53.62
IFEval 79.44 91.84 +12.44
IFBench 26.00 56.47 +30.47
MATH500 74.80 88.76 +13.96
AIME25 20.00 42.53 +22.53
BFCLv3 45.07 64.36 +19.29
BFCLv4 25.52 48.50 +22.98
Tau² Telecom 13.60 88.07 +74.47
Tau² Retail 7.02 39.82 +32.80

🔥 Comparaison avec d'autres modèles

Modèle Params IFEval IFBench BFCLv3 Tau² Telecom
LFM2.5-8B-A1B 8B/A1B 91.84 56.47 64.36 88.07
Qwen3-30B-A3B-Thinking 30.5B/3.3B 90.82 51.11 73.39 21.93
Gemma-4-26B-A4B-IT 26B/4B 91.40 47.25 68.87 42.11
gpt-oss-20b 21B/3.6B 86.73 58.64 62.52 57.24
Qwen3.5-4B 4B 87.80 50.38 71.06 87.72

💡 LFM2.5 bat des modèles 3-6x plus grands en instruction following et agentic, tout en n'utilisant que 1.5B paramètres actifs.

🛠️ Plateformes supportées

llama.cpp (GGUF) MLX (Apple Silicon) vLLM SGLang LEAP (iOS/Android) Transformers

🎯 Verdict

LFM2.5-8B-A1B est un banger confirmé. Le saut de performance est massif (+53 sur l'AA-Omniscience Index), le contexte 128K est huge, et le vocabulaire étendu le rend bien plus multilingue. C'est le modèle de référence pour les agents on-device privés, et il bat des modèles 3-6x plus grands en instruction following et tool calling.

Prochaine étape : le tester en local et voir si on peut l'intégrer dans certains workflows. GGUF disponible sur Hugging Face.