Netflix publie VOID, son premier modèle IA open source

✅ Mise à jour post-publication — Réception et détails techniques de VOID
VOID a été très bien reçu depuis sa sortie le 3 avril 2026 :
• Développé en partenariat avec INSAIT (Sofia University)
• Architecture : basé sur CogVideoX, fine-tuné pour l’inpainting vidéo avec quadmask encoding (4 valeurs : removals, supports, occlusions, consequences)
• Étude utilisateurs : VOID préféré 64,8% du temps vs Runway (18,4%) et autres concurrents
• Licence Apache 2.0 — disponible sur GitHub et Hugging Face pour tout développeur avec un GPU
• Risque noté par The Register : comme Stable Diffusion pour les images, VOID pourrait amplifier les problèmes de désinformation vidéo
GitHub Netflix/void-model | Hugging Face

Netflix vient de franchir un cap historique dans l’IA open source. Le géant du streaming a publié VOID (Video Object and Interaction Deletion), son tout premier modèle d’intelligence artificielle en open source sur Hugging Face. Ce modèle permet de supprimer des objets dans une vidéo — mais pas seulement : il élimine aussi toutes les interactions physiques que ces objets provoquent dans la scène. Une avancée qui va bien au-delà du simple « effaceur » vidéo.

VOID : bien plus qu’un simple outil de suppression

Les outils classiques de suppression d’objets vidéo se contentent d’effacer un élément et de remplir le trou avec le fond. Le résultat est souvent approximatif : ombres orphelines, reflets fantômes, objets qui semblent flotter dans le vide. VOID change complètement la donne.

Le modèle de Netflix ne se contente pas de retirer un objet : il comprend les relations causales entre les éléments d’une scène. Si vous supprimez une personne qui tenait un verre, VOID supprime aussi le verre. Si une personne soutenait un objet qui allait tomber, VOID recalcule la physique de la scène. C’est ce que les chercheurs appellent la suppression des « interactions induites ».

Concrètement, VOID utilise un pipeline de raisonnement basé sur un VLM (Vision-Language Model) : l’utilisateur clique sur l’objet à supprimer, et le modèle identifie automatiquement quelles autres régions de la scène seront affectées. Le tout fonctionne grâce à un entraînement sur des vidéos contrefactuelles générées via deux sources :

HUMOTO — des interactions humain-objet simulées dans Blender avec moteur physique
Kubric — des interactions objet-objet utilisant les Google Scanned Objects

Netflix VOID - Suppression d'objets vidéo avec compréhension des interactions physiques — VOID comprend les interactions physiques : quand un objet est supprimé, toutes ses conséquences sur la scène le sont aussi.

Pourquoi Netflix fait de l’open source ?

C’est la grande surprise. Netflix, habituellement très discret sur ses outils internes, a choisi de publier VOID en open source avec des poids disponibles sur Hugging Face et le code complet sur GitHub. Le modèle a été entraîné sur 8 GPU A100 80 Go avec DeepSpeed ZeRO Stage 2.

Le papier de recherche associé (arXiv:2604.02296) a été publié par Saman Motamed, William Harvey, Benjamin Klein et d’autres chercheurs de l’équipe Netflix Research. Sur Reddit, le post annonçant VOID a récolté plus de 800 upvotes sur r/LocalLLaMA en quelques heures, signe de l’engouement de la communauté.

Pour Netflix, cette publication sert plusieurs objectifs : attirer les meilleurs talents en recherche IA, positionner l’entreprise comme acteur sérieux de l’IA (et pas juste un consommateur de modèles), et contribuer à un écosystème qui lui profite en retour via les contributions de la communauté open source.

Ce que ça change pour vous

Si vous travaillez dans la production vidéo, le montage ou les effets spéciaux, VOID est potentiellement révolutionnaire. Voici ce que ça ouvre comme possibilités :

Post-production simplifiée : supprimer un figurant indésirable, un micro visible ou un objet anachronique sans retouche frame par frame
Création de contenu : les créateurs YouTube et TikTok pourront nettoyer leurs vidéos avec une qualité proche du cinéma
VFX démocratisés : des effets qui coûtaient des milliers d’euros en studio deviennent accessibles à tous
Formation et éducation : les écoles de cinéma et de création numérique ont désormais un outil gratuit de niveau professionnel

Attention cependant : le modèle nécessite du matériel conséquent (8 GPU A100 pour l’entraînement). Pour l’inférence, les besoins sont plus raisonnables, mais restent au-dessus d’un PC grand public. Les plateformes comme Hugging Face Spaces ou des services cloud devraient rapidement proposer des démos accessibles.

Netflix dans la course à l’IA : la stratégie silencieuse

Contrairement à Disney qui a récemment fait les gros titres avec ses investissements massifs en IA générative, Netflix joue une carte plus subtile. L’entreprise développe ses propres modèles en interne, les publie en open source, et construit sa réputation dans la communauté recherche. VOID rejoint d’autres initiatives Netflix comme ses travaux sur la compression vidéo adaptative et ses algorithmes de recommandation.

Cette approche rappelle celle de Meta avec LLaMA : publier en open source pour gagner en influence et en talent, tout en gardant l’avantage compétitif sur l’intégration dans ses propres produits.

Notre avis

VOID est impressionnant — pas tant par la suppression d’objets (ça existait déjà) que par la compréhension causale des interactions physiques. C’est un vrai saut qualitatif. Le fait que Netflix le publie en open source est un signal fort : les géants du streaming prennent l’IA au sérieux et veulent être des contributeurs, pas juste des consommateurs. Pour les créateurs vidéo francophones, c’est une excellente nouvelle. On attend maintenant une version plus légère et des interfaces utilisateur plus accessibles pour que tout le monde puisse en profiter.

Sources

À propos de l'auteur

Anis

Anis Flazi est le fondateur et rédacteur en chef d'IA Codex. Diplômé de la Sorbonne en systèmes d'information et de connaissances, il évolue depuis plus de 10 ans dans le marketing digital (publicité Meta, Google et TikTok, en agence, chez l'annonceur et en freelance). Cette double culture, technique et terrain, l'a conduit à adopter l'intelligence artificielle dès ses débuts : d'abord appliquée à ses campagnes, puis étendue à l'ensemble de ses projets. Il teste aujourd'hui les outils et modèles d'IA au quotidien pour décrypter, sans hype ni jargon, ce qui change vraiment pour les professionnels francophones.

Tous les articles de Anis →

VOID : bien plus qu’un simple outil de suppression

Pourquoi Netflix fait de l’open source ?

Ce que ça change pour vous

Netflix dans la course à l’IA : la stratégie silencieuse

Notre avis

À lire aussi

Sources

Articles liés

Laisser un commentaire Annuler la réponse