Google vient d'ajouter une fonction particulièrement attendue à Gemini : on peut désormais envoyer des fichiers audio au chatbot pour qu'il les transcrive, les résume ou les analyse. Mais il y a quelques limites…

À force d'efforts de la part de Google, Gemini est parvenu à bien s'implanter dans l'écosystème du géant du numérique et, plus largement, dans la vie quotidienne des internautes. Le chatbot est notamment apprécié pour son approche multimodale, qui lui permet d'analyser aussi bien du texte et des images que des vidéos. Il manquait toutefois un support important, qui n'était pas pris en charge. Mais l'oubli est désormais corrigé ! Dans un post publié sur les réseaux sociaux, Josh Woodward, vice-président de Google Labs et Gemini, a annoncé que l'IA prend désormais en charge les fichiers audio sur Android, iOS et le Web. De cette manière, la firme répond à la demande pressante de nombreux utilisateurs.

Fichiers audio dans Gemini : une fonction très attendue

La prise en charge de fichiers audio se fait très facilement. Il suffit d'aller sur l'interface de Gemini, de cliquer sur l'icône "+", puis d'appuyer sur "Fichiers" si vous êtes sur l'application mobile ou de cliquer sur "Importer des fichiers" si vous êtes sur la version Web. Il ne vous reste alors plus qu'à importer les fichiers audio en question, de format MP3, WAV, M4A ou équivalents. L'IA s'occupe ensuite du reste.

Cette nouvelle fonction permet de transformer un simple enregistrement sonore — réunion, interview, cours ou mémo vocal — en document structuré et exploitable. L'intelligence artificielle s'occupe de transcrire, de résumer et d'extraire les points clés d'un enregistrement, comme les tâches ou les citations importantes.

Dans sa page de support, Google précise que l'on peut transmettre jusqu'à dix fichiers par requête, qu'il s'agisse de simples enregistrements ou d'archives ZIP — qui sont elles aussi limitées à dix éléments. Bien sûr, il y a des limites imposées selon les abonnements. Ainsi, la durée totale de l'audio transmis par les utilisateurs gratuits ne doit pas dépasser les dix minutes. De leur côté, les abonnés à Google AI Pro et AI Ultra voient cette limite monter à trois heures par fichier. Parfait pour traiter des conférences, des interviews ou des podcasts sans avoir à segmenter les enregistrements.