Médias / Tech & internet

Les séries pourront-elles bientôt être doublées par des intelligences artificielles?

C'est en tout cas le pari de plusieurs startups, qui assurent que la voix et la synchronisation seront parfaites.

Crédit: Jacek Dylag <a href="https://unsplash.com/photos/xPugU5J5ePc">via Unsplash</a>
Crédit: Jacek Dylag via Unsplash

Temps de lecture: 2 minutes - Repéré sur Washington Post

Si voir des films en version originale sous-titrée n'est pas pour vous (quelle que soit la raison), mais que les voix choisies font souvent saigner vos tympans, la technologie va peut-être bientôt venir vous sauver.

Selon le Washington Post, l'intelligence artificielle et le machine learning vont bientôt permettre le tour de magie suivant: n'importe quelle œuvre pourra être doublée dans toutes les langues en un clin d'œil ou presque, et de façon aussi satisfaisante que possible.

Le résultat est décrit comme optimal, avec une voix collant parfaitement à celle de l'interprète original·e et un travail de synchronisation avec le mouvement des lèvres. Cette technologie nommée «auto-dubbing» («auto-doublage») est actuellement développée par plusieurs startups américaines.

Le processus est simple: il suffit de demander à l'interprète original·e d'enregistrer 5 minutes de n'importe quel texte dans sa langue d'origine. La machine fait alors le reste. L'intelligence artificielle développée parvient en effet à apprendre à parler comme l'acteur ou l'actrice, et le langage ainsi obtenu est converti numériquement dans la langue désirée. Un processus qui, selon le Washington Post, prend actuellement plusieurs semaines.

Bientôt sur Netflix

On pourra bientôt observer le résultat sur Netflix, où le thriller américain Every Time I Die sera proposé dans des versions espagnole et portugaise générées par une IA qu'a développé la startup Deepdub, basée à Dallas et à Tel Aviv.

Chez Flawless, une autre entreprise, on tente même d'aller plus loin: pour synchroniser au mieux les dialogues avec les mouvements des lèvres des interprètes, on a mis au point un dispositif qui modifie l'image afin que les bouches s'adaptent aux répliques. Le résultat sera-t-il assez discret pour ne pas perturber le public? Il est permis d'en douter. Le niveau de malaise se trouvera probablement entre celui du deepfake et celui de la «vallée de l'étrange»...

Quant à l'avenir des doubleurs et des doubleuses, dont les meilleur·es parviennent à mettre de l'âme et de l'épaisseur dans leurs (ré)interprétations, il est potentiellement compromis par ces avancées technologiques qui, une fois l'investissement de départ amorti, risquent de faire économiser pas mal d'argent aux studios de production. Au mépris de l'artistique et du maintien des emplois.

cover
-
/
cover

Liste de lecture