Liquid AI lance un LLM 8B sur device, révolution edge en 2026

Q: Qu'est-ce qu'un modèle MoE ?

MoE signifie Mixture of Experts. Seuls certains paramètres (experts) sont activés selon la tâche, réduisant la charge computationnelle. Idéal pour l'IA embarquée.

Q: Pourquoi 128K tokens de contexte sont-ils importants ?

Cette fenêtre permet de traiter des documents longs ou des conversations complexes sans perte d'information. Essentiel pour les applications médicales ou juridiques.

Q: Quels appareils supporteront ce modèle ?

Les smartphones haut de gamme (2025+), tablettes et appareils médicaux équipés de GPU/NPU récents. Exemples : iPhone 17, Samsung Galaxy S26, dispositifs IoT avancés.

2026 marque un tournant pour l’IA embarquée. Liquid AI dévoile son modèle LFM2.5-8B-A1B, conçu pour fonctionner sur des appareils grand public. Avec 8,3 milliards de paramètres mais seulement 1,5 milliard activés simultanément, cette solution réduit la dépendance au cloud. Latence minimale, confidentialité renforcée et coûts énergétiques divisés par 10. Une avancée stratégique pour les secteurs critiques comme la santé ou la défense.

Liquid AI : une startup née au MIT

Fondée en 2023 par d’anciens chercheurs du MIT, Liquid AI se spécialise dans les modèles d’IA optimisés pour le edge computing. Leur approche repose sur des architectures MoE (Mixture of Experts) alliant performance et efficacité énergétique. La startup a levé 120 millions de dollars en 2025 pour accélérer ses développements.

Leur dernier modèle, LFM2.5-8B-A1B, cible les GPU et NPU grand public. Une première pour un LLM de cette envergure. Les partenariats annoncés avec des fabricants de smartphones et d’appareils médicaux confirment leur ambition : démocratiser l’IA sur device.

LFM2.5-8B-A1B : chiffres clés et spécifications

Ce modèle MoE combine puissance et frugalité. Voici ses caractéristiques techniques principales :

8,3 milliards de paramètres totaux, mais seulement 1,5 milliard activés simultanément
Fenêtre contextuelle de 128 000 tokens, idéale pour les tâches complexes
Capacités avancées de raisonnement et d’appel d’outils (tool calling)
Optimisé pour les GPU/NPU grand public (ex : Qualcomm Snapdragon, Apple M-series)
Consommation énergétique réduite à 5-10 watts en fonctionnement
Latence inférieure à 100 ms pour les requêtes locales

Ces performances ouvrent la voie à des applications jusqu’alors réservées aux data centers. Une rupture technologique pour l’IA embarquée.

IA sur device vs cloud : comparaison des approches

L’essor des modèles sur device redéfinit les équilibres. Voici une comparaison des deux approches :

Critère	IA sur device (LFM2.5-8B-A1B)	IA cloud (ex : GPT-4)
Latence	<100 ms	200-500 ms (selon réseau)
Confidentialité	Données locales, pas de transfert	Données envoyées aux serveurs
Coût énergétique	5-10W	100-500W par requête
Dépendance réseau	Aucune	Obligatoire (4G/5G/WiFi)
Mises à jour	Via OTA (Over-The-Air)	Centralisées (serveur)
Secteurs cibles	Santé, robotique, mobile	Marketing, analyse de données

Perspectives : enjeux pour l’Europe et les entreprises françaises

Souveraineté des données et indépendance technologique

Ce modèle change la donne pour l’Europe. Les entreprises peuvent déployer des solutions IA critiques sans dépendre des clouds américains ou chinois. Un atout pour les secteurs réglementés comme la santé ou la défense. La France pourrait accélérer ses projets d’IA souveraine avec cette technologie.

Réduction des coûts et accessibilité

L’IA sur device divise les coûts par 10. Les PME françaises peuvent désormais intégrer des solutions avancées sans infrastructure cloud coûteuse. Exemple : un hôpital peut analyser des données patients localement, sans risque de fuite. Une opportunité pour les startups spécialisées en edge computing.

Ce qu’il faut retenir

Liquid AI lance un LLM 8B sur device, une première pour un modèle de cette taille
128K tokens de contexte et tool calling intégrés, optimisé pour les GPU/NPU grand public
Réduction drastique de la latence et des coûts énergétiques (5-10W)
Opportunité majeure pour l’Europe : souveraineté des données et indépendance technologique
Applications cibles : santé, robotique, mobile et secteurs critiques

❓ Questions fréquentes

Qu’est-ce qu’un modèle MoE ?

MoE signifie Mixture of Experts. Seuls certains paramètres (experts) sont activés selon la tâche, réduisant la charge computationnelle. Idéal pour l’IA embarquée.

Pourquoi 128K tokens de contexte sont-ils importants ?

Cette fenêtre permet de traiter des documents longs ou des conversations complexes sans perte d’information. Essentiel pour les applications médicales ou juridiques.

Quels appareils supporteront ce modèle ?

Les smartphones haut de gamme (2025+), tablettes et appareils médicaux équipés de GPU/NPU récents. Exemples : iPhone 17, Samsung Galaxy S26, dispositifs IoT avancés.

En résumé

LFM2.5-8B-A1B de Liquid AI marque un tournant pour l’IA embarquée. Performances cloud sur device, latence réduite et confidentialité renforcée : les entreprises françaises disposent désormais d’une alternative souveraine aux solutions américaines. Une opportunité à saisir pour les secteurs critiques, avec des coûts divisés par 10. L’Europe pourrait accélérer son indépendance technologique grâce à cette innovation.

À propos de l'auteur

Anis

Anis Flazi est le fondateur et rédacteur en chef d'IA Codex. Diplômé de la Sorbonne en systèmes d'information et de connaissances, il évolue depuis plus de 10 ans dans le marketing digital (publicité Meta, Google et TikTok, en agence, chez l'annonceur et en freelance). Cette double culture, technique et terrain, l'a conduit à adopter l'intelligence artificielle dès ses débuts : d'abord appliquée à ses campagnes, puis étendue à l'ensemble de ses projets. Il teste aujourd'hui les outils et modèles d'IA au quotidien pour décrypter, sans hype ni jargon, ce qui change vraiment pour les professionnels francophones.

Tous les articles de Anis →