Voice Engine : un nouvel outil IA pour cloner des voix, aussi puissant qu'inquiétant
Après le texte, des images les vidéos, OpenAI s'attaque au son, avec Voice Engine, un nouvel outil IA capable de cloner des voix humaines avec un réalisme saisissant. Encore une technologie bouffante, mais qui pourrait être mal employée.
Une fois de plus, l'intelligence artificielle a permis de mettre au point un outil aussi spectaculaire qu'effrayant. Le vendredi 26 avril dernier, la start-up californienne OpenAI, connue pour avoir développé ChatGPT, un agent conversationnel, et Sora, une IA capable de générer des vidéos d'un réalisme époustouflant, a dévoilé un tout nouvel outil capable de cloner des voix. Baptisée Voice Engine, cette technologie boostée par l'intelligence artificielle peut en effet reproduire la voix d'une personne après l'avoir écoutée pendant seulement quinze secondes. Ce système n'est donc pas entièrement nouveau, puisque OpenAI avait déjà développé une première version à la fin de l'année 2022, qu'elle avait intégrée aux fonctions de synthèse vocale dans ChatGPT. Cependant, il s'agit bien de la toute première fois que la start-up communique publiquement sur cette nouvelle offre de service.
Voice Engine : des imitations parfaites… et dangereuses !
En tout cas, les résultats publiés par la société sont bluffants. En effet, Voice Engine est capable de reproduire des accents, des intonations, des nuances et, plus généralement, toutes les caractéristiques spécifiques de la voix d'une personne. Ainsi, il est de plus en plus difficile de faire la différence entre une voix clonée et une voix réelle. Grâce à cette technologie, OpenAI compte bien offrir de nouvelles possibilités à ses utilisateurs. Par exemple, l'outil peut être utilisé comme une aide à la lecture pour les personnes qui ont perdu la voix, un traducteur de contenu (puisqu'il fonctionne en français et dans d'autres langues), ou encore un assistant à la lecture pour les enfants ou les personnes qui ne savent pas lire. Mais ce n'est pas tout ! L'intelligence artificielle peut aussi être amenée à s'implanter dans le quotidien des fans de littérature. En effet, Voice Engine pourrait être utilisé dans la conception de podcasts audio, de livres audio, et même à la radio.
Malheureusement, la technologie a déjà été utilisée à des fins criminelles. Alors que les États-Unis sont en pleine période de campagne électorale, des cybercriminels ont usurpé la voix de Joe Biden pour appeler des électeurs. Face à un tel danger, l'entreprise a adopté une position délibérément prudente et pris plusieurs mesures de sécurité. Tout d'abord, Voice Engine n'est pas accessible au grand public, mais uniquement à des partenaires qui ont accepté les conditions d'utilisation d'OpenAI, leur interdisant de pratiquer l'usurpation d'identité ou d'exploiter une voix sans le consentement de la personne.
Les partenaires sont également obligés d'indiquer que la voix utilisée a été générée par l'intelligence artificielle. "Nous travaillons avec des partenaires américains et internationaux issus du gouvernement, des médias, du divertissement, de l'éducation, de la société civile et d'autres secteurs, et nous prenons en compte leurs commentaires au fur et à mesure que nous développons l'outil", a indiqué la société, avant de conclure : "Nous avons mis en place un ensemble de mesures de sécurité, y compris une marque en filigrane pour pouvoir retracer l'origine de tout son généré par Voice Engine, ainsi qu'un contrôle proactif de son utilisation."