Nous avons parcouru un long chemin depuis les voix générées par ordinateur d'il y a quelques décennies qui semblaient complètement robotisées. Siri et Alexa ont changé cela, en paraissant plus humaines, mais des fautes de prononciation et un ton mesuré vous font constater encore que ce n'est pas réel et généré par ordinateur.
La nouvelle technologie de l'intelligence artificielle, cependant, est devenue plus avancée. Non seulement elles peuvent maintenant cloner nos voix, mais elles peuvent le faire très rapidement, en quelques secondes seulement.
Le clonage de voix
Il a été annoncé qu'il suffit de 3,7 secondes d'audio pour cloner votre voix, selon la société de technologie chinoise Baidu. C'est à la fois excitant et effrayant.
Il s'agit d'une nette amélioration en un an seulement. À l'époque, Baidu a créé Deep Voice, un outil de clonage de voix, qui pouvait reproduire votre voix en utilisant 30 minutes d'audio. Mais maintenant ils peuvent le faire en 1/600 du temps précédent, si mes calculs rapides sont corrects.
Google travaille également sur la technologie vocale. Ils ont lancé Tacotron2, un outil de synthèse vocale qui utilise un réseau neuronal profond et WaveNet, une méthode de génération vocale utilisée pour générer la voix qu'ils utilisent pour Google Assistant. On dit qu'il est tellement authentique qu'il est difficile de faire la différence entre une voix humaine et une voix générée par l'IA. Alexa et Siri pourraient supporter quelques améliorations dans ce domaine également.
Ils ont même trouvé un moyen pour que l'intelligence artificielle prononce correctement les mots, ce qui est souvent utilisé pour rigoler. Le système téléphonique de mon père lui annonce l'identité de l'appelant à haute voix, et il s'amuse à lui dire qu'il a un appel de "A-nah-nee-muss" au lieu de prononcer Anonymous correctement.
Cette technologie a permis à Google Assistant de proposer des voix de célébrités, comme la voix de John Legend. Il y a aussi un extrait du discours de l'auteur Jordan Peterson qui a été utilisé pour faire de l'audio réaliste de lui rappant une chanson d'Eminem.
Cela pourrait mener à toutes sortes de produits technologiques améliorés, pas seulement des assistants vocaux. Mais ce qui est triste, c'est que même si cette technologie pourrait être utilisée à bon escient, nous devons nous rendre compte qu'elle pourrait être mal employée par des personnes malfaisantes quand celles-ci la possèderont.
Quelqu'un pourrait vous appeler au téléphone et vous faire parler pendant quelques instants, puis prendre cet enregistrement audio et reproduire votre voix, l'utilisant pour vider des comptes bancaires et faire d'autres crimes frauduleux. Nous devons aussi nous rendre compte qu'il y aura des enfants qui sécheront les cours à l'école et qui s'en serviront pour reproduire la voix de leur mère.
Le bien contre le mal
Cependant, nous ne pouvons pas ignorer les progrès de la technologie de peur qu'elle n'introduise aussi le mal. Nous devons juste réaliser que le mal est une possibilité et nous en protéger dès le départ. Indépendamment des mauvaises intentions possibles, les progrès de cette technologie en seulement un an sont encore étonnants.
Par : Laura Tucker
Sauce :
https://www.iottechtrends.com/artificial-intelligence-technology-clone-voice/