IA YouTube : vous allez pouvoir choisir la langue de doublage des vidéos

IA YouTube : vous allez pouvoir choisir la langue de doublage des vidéos

YouTube aussi se met à l'intelligence artificielle ! La plateforme propose un nouvel outil permettant de traduire et de doubler les vidéos dans plusieurs langues grâce à une IA. De quoi mieux profiter des contenus internationaux !

L'un des principaux attraits de YouTube, c'est que l'on a accès à du contenu provenant du monde entier. C'est très enrichissant, mais il est parfois difficile de comprendre ce qui est dit dans une langue étrangère. Bien évidemment, il est possible d'activer des sous-titres qui sont générés automatiquement, mais le rendu est, disons-le, assez aléatoire. Le problème, c'est que cela casse l'immersion. On vient sur la plateforme pour regarder et, surtout, écouter une vidéo, pas pour la lire, et du contenu en langue étrangère peut en rebuter plus d'un. Conscient de ce petit problème et afin de diffuser plus facilement ses vidéos à l'international, le géant d'Internet travaille sur un nouveau service de doublage. Et, bien évidemment, il ne peut faire l'impasse sur l'intelligence artificielle en 2023 !

YouTube : des vidéos doublées en français par l'IA

En début d'année, YouTube mettait à disposition des créateurs un nouvel outil de doublage de vidéos. Certains, comme MrBeast, peuvent ainsi proposer des doublages de qualité dans pas moins de treize langues, allant du  japonais au français en passant par l'arabe ou le turc. De quoi toucher un public beaucoup plus important ! Mais la plateforme propose désormais un nouvel outil, bien plus accessible et moins coûteux. Pour que les utilisateurs puissent accéder à davantage de vidéos doublées dans leur langue, elle s'est tournée vers Aloud, issu de l'incubateur interne Area 120 de Google. Le principe est simple : l'IA analyse la vidéo et transcrit son contenu, avant de l'envoyer au youtubeur. Celui-ci vérifie et corrige le script. Une fois validé, l'intelligence artificielle n'a plus qu'à réaliser la traduction, puis à procéder au doublage avec la synthèse vocale. D'après un responsable interrogé par The Verge, cette nouvelle fonction est en cours d'essai chez plusieurs centaines de créateurs de la plateforme.

Pour profiter de cette nouveauté sur les vidéos qui proposeront cette fonction, il suffira, comme pour les sous-titres, d'aller dans les paramètres de la vidéo et de sélectionner la piste audio que l'on souhaite entendre. Il est possible de tester cela sur la vidéo de présentation d'Aloud, qui est disponibles en cinq langues différentes. Le doublage est plutôt propre et ne modifie pas les autres éléments sonores tels que la musique. Le temps reste toutefois monocorde. Pour le moment, la fonction prend uniquement en charge trois langues, à savoir l'anglais, l'espagnol et le portugais, mais d'autres devraient bientôt suivre. De plus, les capacités de l'IA devraient être améliorées pour "faire en sorte que les pistes audio traduites ressemblent à la voix du créateur, avec plus d'expression et de synchronisation labiale" d'ici 2024.

YouTube : des outils dopés à l'IA pour les créateurs

Cette fonction s'inscrit dans le cadre d'une panoplie d'outils dopés à l'IA que YouTube concocte pour les créateurs. En effet, en mars dernier, le nouveau patron de la plateforme Neal Mohan – l'ancienne PDG Susan Wojcicki, aux commandes depuis presque une décennie, a quitté la compagnie mi-février – avait annoncé dans sa première lettre à la communauté le développement de nouveaux outils basés sur l'IA générative pour les créateurs. "La puissance de l'IA commence à peine à émerger, d'une manière à réinventer la vidéo et à rendre possible ce qui semble impossible", expliquait-il. Le but est de leur permettre de créer des vidéos encore plus impressionnantes, tout en disposant de peu de moyens. Le PDG prévoit donc, dans les prochains mois, de mettre à disposition des créateurs "davantage d'outils pour gagner leur vie en faisant ce qu'ils aiment", en dehors de la monétisation des vidéos par la publicité, "en développant notre activité d'abonnements, en investissant dans le shopping et en améliorant continuellement nos offres de biens numériques payants."

Il compte également faciliter la production et la publication de podcasts sur la plateforme, et les proposer aux utilisateurs de YouTube Music aux États-Unis puis, par la suite, dans d'autres régions. Il souhaite aussi permettre l'intégration RSS afin de proposer un autre moyen de télécharger les émissions sur YouTube et plus d'options d'écoute, ainsi que développer les vidéos de réactions via les Short. Enfin, il espère élargir l'accès à la fonction permettant d'ajouter des pistes linguistiques à leurs vidéos et de rendre les contenus plus accessibles aux personnes sourdes et malentendantes. Google a d'ailleurs présenté, lors de l'I/O 2023, son nouvel outil révolutionnaire, Universal Translator. Celui-ci double les vidéos à l'aide de l'IA et fait en sorte que les lèvres d'une personne soient synchronisées de façon convaincante – et qui ouvre en grand la porte aux deepfakes.

De plus, le service de streaming prévoit de mettre à disposition des créateurs des outils dopés à l'IA pour "développer leur narration et augmenter la valeur de leur production, qu'il s'agisse d'échanger virtuellement des tenues ou de créer un décor de film fantastique grâce aux capacités génératives de l'IA". Car, si jusqu'à présent, ce sont surtout les IA génératrices de texte – comme ChatGPT et Bing AI – et d'images – comme DALL-E et Midjourney – qui occupent le devant de la Toile, l'intelligence artificielle ne devrait pas tarder à s'attaquer à la vidéo – OpenAI travaille d'ailleurs sur un outil pour générer des vidéos à partir de commandes textuelles.

Les équipes de YouTube se montrent toutefois prudentes dans leur approche – sans doute ont-elles appris de la précipitation de Google avec son IA Bard, qui a fait une erreur lors de sa première présentation publique et a fait perdre des milliards de dollars à la firme en Bourse (voir notre article). "L'IA présente des opportunités créatives incroyables, mais doit être contrebalancée par une gestion responsable", avait expliqué le PDG de la plateforme. "Nous prenons le temps de développer ces fonctions avec des garde-fous bien pensés (…) ainsi que des protections pour adopter cette technologie de manière responsable".