1 trillion de paramètres : un LLM géant tourne sur un seul GPU en 2026
Un passionné exécute un LLM de 1 trillion de paramètres sur un seul GPU avec 768 Go de mémoire Optane DIMM. Performance modeste mais inédite, cette approche low-cost ouvre des perspectives pour l’IA locale.