Netflix vient de franchir un cap historique dans l’IA open source. Le géant du streaming a publié VOID (Video Object and Interaction Deletion), son tout premier modèle d’intelligence artificielle en open source sur Hugging Face. Ce modèle permet de supprimer des objets dans une vidéo — mais pas seulement : il élimine aussi toutes les interactions physiques que ces objets provoquent dans la scène. Une avancée qui va bien au-delà du simple « effaceur » vidéo.
VOID : bien plus qu’un simple outil de suppression
Les outils classiques de suppression d’objets vidéo se contentent d’effacer un élément et de remplir le trou avec le fond. Le résultat est souvent approximatif : ombres orphelines, reflets fantômes, objets qui semblent flotter dans le vide. VOID change complètement la donne.
Le modèle de Netflix ne se contente pas de retirer un objet : il comprend les relations causales entre les éléments d’une scène. Si vous supprimez une personne qui tenait un verre, VOID supprime aussi le verre. Si une personne soutenait un objet qui allait tomber, VOID recalcule la physique de la scène. C’est ce que les chercheurs appellent la suppression des « interactions induites ».
Concrètement, VOID utilise un pipeline de raisonnement basé sur un VLM (Vision-Language Model) : l’utilisateur clique sur l’objet à supprimer, et le modèle identifie automatiquement quelles autres régions de la scène seront affectées. Le tout fonctionne grâce à un entraînement sur des vidéos contrefactuelles générées via deux sources :
- HUMOTO — des interactions humain-objet simulées dans Blender avec moteur physique
- Kubric — des interactions objet-objet utilisant les Google Scanned Objects

Pourquoi Netflix fait de l’open source ?
C’est la grande surprise. Netflix, habituellement très discret sur ses outils internes, a choisi de publier VOID en open source avec des poids disponibles sur Hugging Face et le code complet sur GitHub. Le modèle a été entraîné sur 8 GPU A100 80 Go avec DeepSpeed ZeRO Stage 2.
Le papier de recherche associé (arXiv:2604.02296) a été publié par Saman Motamed, William Harvey, Benjamin Klein et d’autres chercheurs de l’équipe Netflix Research. Sur Reddit, le post annonçant VOID a récolté plus de 800 upvotes sur r/LocalLLaMA en quelques heures, signe de l’engouement de la communauté.
Pour Netflix, cette publication sert plusieurs objectifs : attirer les meilleurs talents en recherche IA, positionner l’entreprise comme acteur sérieux de l’IA (et pas juste un consommateur de modèles), et contribuer à un écosystème qui lui profite en retour via les contributions de la communauté open source.
Ce que ça change pour vous
Si vous travaillez dans la production vidéo, le montage ou les effets spéciaux, VOID est potentiellement révolutionnaire. Voici ce que ça ouvre comme possibilités :
- Post-production simplifiée : supprimer un figurant indésirable, un micro visible ou un objet anachronique sans retouche frame par frame
- Création de contenu : les créateurs YouTube et TikTok pourront nettoyer leurs vidéos avec une qualité proche du cinéma
- VFX démocratisés : des effets qui coûtaient des milliers d’euros en studio deviennent accessibles à tous
- Formation et éducation : les écoles de cinéma et de création numérique ont désormais un outil gratuit de niveau professionnel
Attention cependant : le modèle nécessite du matériel conséquent (8 GPU A100 pour l’entraînement). Pour l’inférence, les besoins sont plus raisonnables, mais restent au-dessus d’un PC grand public. Les plateformes comme Hugging Face Spaces ou des services cloud devraient rapidement proposer des démos accessibles.
Netflix dans la course à l’IA : la stratégie silencieuse
Contrairement à Disney qui a récemment fait les gros titres avec ses investissements massifs en IA générative, Netflix joue une carte plus subtile. L’entreprise développe ses propres modèles en interne, les publie en open source, et construit sa réputation dans la communauté recherche. VOID rejoint d’autres initiatives Netflix comme ses travaux sur la compression vidéo adaptative et ses algorithmes de recommandation.
Cette approche rappelle celle de Meta avec LLaMA : publier en open source pour gagner en influence et en talent, tout en gardant l’avantage compétitif sur l’intégration dans ses propres produits.
Notre avis
VOID est impressionnant — pas tant par la suppression d’objets (ça existait déjà) que par la compréhension causale des interactions physiques. C’est un vrai saut qualitatif. Le fait que Netflix le publie en open source est un signal fort : les géants du streaming prennent l’IA au sérieux et veulent être des contributeurs, pas juste des consommateurs. Pour les créateurs vidéo francophones, c’est une excellente nouvelle. On attend maintenant une version plus légère et des interfaces utilisateur plus accessibles pour que tout le monde puisse en profiter.
À lire aussi
- Google Vids gratuit : créez des vidéos IA avec Veo 3.1
- Google Gemma 4 : le modèle IA open source qui change la donne
- DeepSeek V4 tourne sur puces Huawei : adieu Nvidia