DFlash : 15x plus rapide sur Blackwell, l’IA qui décode en blocs 2026
DFlash, une méthode de *speculative decoding* développée par l’UC San Diego, accélère jusqu’à 15x les modèles d’IA sur GPU Blackwell. Réduction des coûts et latence pour les entreprises françaises.