Tech & internet / Sciences

Votre voix peut désormais être clonée en un temps record

Temps de lecture : 2 min

À partir d'un échantillon de voix très court, un algorithme développé par Baidu est capable de produire de nouveaux énoncés qui reprennent toutes les caractéristiques d'une voix donnée.

Le discours d'un roi, Tom Hooper, 2011 | Allociné License by

Il suffit d'enregistrer 3,7 secondes de temps de parole et vous pourrez reproduire (ou déformer) tous les discours du monde: c'est la promesse assez inquiétante qu'est en train de réaliser Baidu, le numéro un​ chinois de l'internet, grâce à un nouvel algorithme d'intelligence artificielle.

Ce dernier est capable de cloner une voix, avec ses intonations, ses accents, ses particularités, et de produire à partir de là de nouvelles paroles, comme si elles étaient prononcées par la personne enregistrée à l'origine.

Des clones confondants

Cela s'appelle Deep Voice, et​ ne fait que trop penser aux «deep fakes», ces vidéos pornographiques truquées elles aussi à l'aide d'un algorithme d'intelligence artificielle, permettant d'incruster de façon réaliste le visage d'une personne –si possible célèbre– sur un corps étranger.

Il y a un an de cela, le système de «texte à parole» de Deep Voice avait encore besoin de 30 minutes de bande-son préalable avant de pouvoir obtenir un résultat satisfaisant.

Il est désormais possible d'obtenir un clone crédible en un temps record, bien que de plus larges échantillons permettent de créer des faux de meilleure qualité.

Avec seulement quelques secondes, l'enregistrement produit est reconnaissable (c'est-à-dire suffisamment trompeur pour être crédible)​, mais sonne comme une captation d'assez mauvaise qualité, un peu hachée ou grésillante. Entraîné sur cent échantillons, l'algorithme peut en revanche produire des discours confondants. Il est possible pour le système de transformer une voix de femme en voix d'homme, ou un accent britannique en accent américain (divers échantillons sont disponibles ici).

À LIRE AUSSI Comment la DGSE recrute

Dans un communiqué, Baidu écrivait espérer que le clonage de voix ​puisse «avoir des applications significatives dans la personnalisation d'interfaces humain-machine».

​Un autre type «d'applications significatives» permis par ce type d'avancée technologique pourrait également​ concerner la falsification de documents audio ou la création de toute pièce de fausses déclarations. Dans un contexte de prolifération de fake news, des clones vocaux pourront s'ajouter à cœur joie à la cacophonie ambiante: une nouvelle mine d'or pour les faussaires.

Newsletters

Une université travaillant sur le Covid-19 se fait hacker et paie 1.140.000$

Une université travaillant sur le Covid-19 se fait hacker et paie 1.140.000$

L'Université de Californie à San Francisco, une institution de recherche médicale, a payé la rançon pour éviter une cyberattaque du groupe de hackers Netwalker.

Twitter a voulu lutter contre les fake news liées à la 5G et au Covid-19 avec un algorithme. Ça a complètement échoué

Twitter a voulu lutter contre les fake news liées à la 5G et au Covid-19 avec un algorithme. Ça a complètement échoué

La plateforme a alpagué des tweets complètement inoffensifs et en a laissé d’autres plus conspirationnistes.

Les jeux vidéo sont de bonnes formations à la gestion de crise

Les jeux vidéo sont de bonnes formations à la gestion de crise

Jouer est un moyen efficace de se confronter à des situations extraordinaires dans des environnements virtuels réalistes qui stimulent l'intelligence, la mémoire et la créativité.

Newsletters