Une IA de Meta traduit 200 langues en temps réel
Meta vient de développer une intelligence artificielle capable de traduire instantanément 200 langues. Un pas important dans la création d'un traducteur universel en temps réel qui pourrait avoir de multiples usages.
"Imaginez visiter un groupe Facebook préféré, tomber sur un message en igbo ou en luganda, et être capable de le comprendre dans votre propre langue d'un simple clic sur un bouton." Pour Meta, le groupe qui possède les applications Facebook, Messenger, Instagram et WhatsApp, cette réflexion a été le point de départ du projet No language left behind (NLLB), qui a pour but de créer un supertraducteur capable de traduire instantanément toutes les langues du monde. Il a mis au point une intelligence artificielle (IA) qui est déjà capable de traduire 200 langues. C'est un pas de géant, mais NLLB-200 est encore loin de pouvoir traduire les 7 000 langues parlées dans le monde.
IA de Meta : les minorités ne sont pas laissées de côté
La nouvelle IA du groupe Meta est basée sur le machine learning (apprentissage automatique en français), une technique qui fait découvrir aux algorithmes des motifs récurrents dans les ensembles de données disponibles sur le Web. Elle innove car elle ne passe pas par l'anglais pour effectuer la traduction. En effet, la plupart des systèmes de traduction automatique convertissent d'abord une langue en texte, puis la traduisent dans la deuxième langue avant de reconvertir le texte en paroles. Ce procédé retarde le processus de traduction et crée une grande dépendance vis-à-vis de l'écrit, ce qui limite l'efficacité de ces systèmes pour les langues principalement orales – comme des dialectes par exemple. Meta travaille sur un système direct de parole à parole afin que le processus de traduction soit plus rapide et plus efficace. La tâche est ardue, car certaines langues n'ont que peu de données sur Internet, ce qui complique l'apprentissage de l'IA.
NLLB-200 a déjà réussi à intégrer 200 langues, dont certaines sont minoritaires. Et 55 d'entre elles proviennent d'Afrique, ce qui permet la traduction de langues comme le kikuyu – parlé par 6 millions de personnes au Kenya – ou le kamba – parlé par moins de 4 millions de personnes – avec de très bons résultats. Comparée à d'autres intelligences artificielles traductrices sur des dialectes d'Afrique et du sous-continent indien, l'IA de Meta est 70 % plus efficace. Elle va donc pouvoir réduire la fracture numérique mondiale entre l'Europe et l'Amérique du Nord d'une part, et le reste du monde d'autre part, particulièrement visible sur les différents Wikipédia. Par exemple, il n'existe qu'environ 3 260 articles de Wikipédia en lingala, une langue qui compte pourtant 45 millions de locuteurs en République démocratique du Congo, en République centrafricaine et au Soudan du Sud. En comparaison, il existe plus de 2,5 millions d'articles en suédois, alors que cette langue n'est parlée que par 10 millions de locuteurs en Suède et en Finlande.
Connecter les utilisateurs du monde entier aux réseaux sociaux
La nouvelle IA de Meta est disponible en open source pour les contributeurs de Wikipédia et les chercheurs et développeurs en linguistique. Quant au groupe américain, son but est de rendre Facebook et le reste de ses réseaux sociaux accessibles à plus de monde. Il pourrait s'agir d'une bonne solution pour remédier à la perte de vitesse du groupe, qui doit faire face à une forte concurrence, principalement du côté de TikTok, alors que la firme est en train de développer son Metaverse, qui va demander des traductions en temps réel.
"Cela va être particulièrement important lorsque les gens commenceront à se téléporter à travers des mondes virtuels et à vivre des expériences avec des personnes d'horizons différents", a expliqué Mark Zuckerberg. "Maintenant, nous avons la possibilité d'améliorer Internet et d'établir une nouvelle norme où nous pouvons tous communiquer les uns avec les autres, quelle que soit la langue que nous parlons ou d'où nous venons. Et si nous réussissons, ce n'est qu'un exemple de la façon dont l'IA peut aider à rassembler les gens à l'échelle mondiale."
Le groupe américain a révélé une démo baptisée Stories Told Through Translation, qui utilise les dernières avancées de l'IA du projet No Language Left Behind. Cette démo traduit des livres de leurs langues d'origine, telles que l'indonésien, le somalien et le birman, dans d'autres langues pour les lecteurs. Un excellent moyen de découvrir des contes et des légendes d'autres cultures, et de rapprocher des populations injustement séparées du reste du monde à cause de leur linguistique.