Google Traduction reconnaît une centaine de nouvelles langues, dont de nombreux dialectes
Le géant de l'Internet ajoute 110 nouveaux langages et dialectes à son service Google Traduction, portant le total à 243 langues prises en charge. On peut désormais traduire le breton, l'occita et même deux créoles !
En ligne depuis pas moins de dix-huit ans déjà, Google Traduction n'a eu de cesse de s'améliorer et s'appuie maintenant sur la technique de deep learning ("apprentissage profond" en français), qui lui permet d'imiter fonctionnement du cerveau humain grâce à un réseau de neurones artificiels. De cette façon, l'IA apprend de ses erreurs, corrigées par les internautes, pour se perfectionner. Et autant dire que le service a progressé de manière extraordinaire au fil des années ! Loin de se contenter, comme un simple dictionnaire, de traduire en français un mot saisi depuis le clavier d'un smartphone, il reconnaît aujourd'hui l'écriture manuscrite, peut lire en quelques secondes de longs textes d'actualités publiés sur le Web dans la langue de notre choix et joue même les interprètes pour faciliter les échanges verbaux, le tout gratuitement ! Ce n'est guère étonnant que Google Traduction soit devenu un véritable réflexe pour certains !
Mais Google ne se repose pas sur ses lauriers pour autant ! Dans un billet de blog, l'entreprise annonce ce jeudi 27 juin l'intégration de 110 langues aux 133 déjà disponibles dans Google Translate, dont le breton, l'occitan, deux créoles français – le seychellois et le mauricien –, le cantonais, le wolof, mais aussi le panjabi – la langue la plus parlée au Pakistan –, le manx – une langue celtique de l'île de Man quasiment éteinte –, l'afar – une langue parlée à Djibouti, en Érythrée et en Éthiopie – et le n'ko – une écriture créée en 1949 pour transcrire les langues mandingues d'Afrique occidentale. Pour cela, rien ne vaut une bonne dose d'intelligence artificielle !
Google Traduction : 660 millions de nouveaux locuteurs dans le monde
Il s'agit de la "mise à jour la plus importante depuis le lancement de Google Traduction" pour le géant de l'Internet, qui a passé quatre ans à mettre en place ce projet. "Certaines sont des langues majeures dans le monde, avec plus de 100 millions de locuteurs", se réjouit Google. "D'autres sont parlées par de petites communautés autochtones, et quelques-unes n'ont presque aucun locuteur natif mais font des efforts de revitalisation actifs". Au total, ces nouvelles langues représentent plus de 612 millions de locuteurs dans le monde, ouvrant la voie à des traductions pour environ 8 % de la population mondiale ! Notons qu'un quart de ces nouvelles langues provient d'Afrique, ce qui représente la plus grande expansion de langues africaines – avec le fon, le kikongo, le luo, le ga, le swati, le venda, le wolof, etc. – de Google à ce jour.
Ce progrès a été permis grâce à l'utilisation de l'intelligence artificielle, et plus précisément du grand modèle de langage PaLM 2, qui repose sur du machine learning. Une de ses particularités est qu'il permet à Google Traduction d'"apprendre plus efficacement des langues étroitement liées entre elles", comme pour les créoles par exemple. Des linguistes spécialisés, des experts, des traducteurs et des locuteurs natifs ont également contribué à cette mise à jour majeure.
La mise à jour est en cours de déploiement. Par la suite, Google entend bien honorer la "1 000 Languages Initiative", un engagement pris en novembre 2022 visant à construire des modèles d'intelligence artificielle permettant à terme de proposer ses services sur Internet dans les 1 000 langues les plus parlées au monde, sur les 7 000 idiomes totaux existants.