Menu
Donnez votre avis

Translatotron, le premier outil de traduction directe de la parole

Félix Marciano - vendredi 17 mai 2019 - 10:56
Translatotron, le premier outil de traduction directe de la parole
Google vient de présenter un outil de traduction orale fonctionnant en temps réel, sans passer par une transcription écrite.


Google vient de franchir une nouvelle étape dans la traduction en présentant Translatotron. Contrairement aux solutions existantes, qui passent toutes par une transcription écrite intermédiaire, ce nouvel outil s'affranchit complètement du texte, en traduisant directement les paroles d'un locuteur, comme le ferait un traducteur humain, en temps réel. Une petite révolution, digne d'une oeuvre d'anticipation, et qui ouvre la voie à d'innombrables applications utiles au quotidien.

Comme Google l'explique dans son billet de blog, les solutions actuelles fonctionnent en cascade, en trois étapes avec une conversion de l'oral en texte, une traduction textuelle d'une langue à une autre, puis une conversion de texte à l'oral utilisant de la synthèse vocale. Translatotron exploite un tout autre modèle, en une seule passe, en traduisant les paroles au fur et à mesure. Un principe qui permet, selon Google, non seulement d'être plus réactif, mais aussi de mieux respecter les noms propres, parfois mal interprétés par autres systèmes.

Tournant bien évidemment à l'intelligence artificielle, le modèle de "traduction de séquence à séquence" mis au point par Google utilise des spectrogrammes pour analyser les composantes fréquentielles de la voix source et un vocoder pour synthétiser la voix traduite dans la langue cible, en passant par un réseau neuronal pour la traduction. La méthode utilisée est expliquée dans une publication scientifique que Google esquisse dans ses grandes lignes sur son blog, en donnant même quelques exemples sonores, en comparant Translatotron à d'autres systèmes de traduction.



Certes, le résultat n'est pas encore parfait, mais il ne s'agit pour le moment que d'un modèle expérimental appelé à évoluer. Google, qui semble convaincu que cette solution s'améliorera avec le temps, insiste sur le fait que cette méthode permet en outre de conserver le rythme et les intonations du locuteur, ce qui devrait déboucher à terme sur une traduction plus naturelle et plus "humaine". Encore une technologie prometteuse à suivre.

Illustrations : © Google - Pixabay
Ajouter un commentaire

Commentaires

Commenter la réponse de Utilisateur anonyme