Gemini Live : discutez naturellement avec l'IA vocale de Google
Après sa conférence, Google déploie Gemini Live, le mode vocal de son chatbot grâce auquel vous pourrez parler à l'intelligence artificielle comme s'il s'agissait d'un être humain. Une sorte de Siri dopée à l'IA quoi !
Lors de la conférence Made By Google qui s'est tenue le 13 août, Google a dévoilé sa nouvelle gamme d'appareils Pixel ainsi que ses dernières avancées en matière d'intelligence artificielle. Après avoir présenté, avec plus ou moins de succès, les nouvelles fonctions de son IA sur mobile Gemini, le géant d'Internet a mis sur le devant de la scène Gemini Live, une sorte de Siri boosté à l'IA, qui promet de vous faire parler avec l'assistant personnel comme s'il s'agissait d'un être humain. Initialement présenté en mai dernier, lors de la Google I/O, il s'agit d'une "expérience de conversation mobile qui vous permet d'avoir des conversations naturelles avec Gemini", indique l'entreprise dans un article de blog. Concrètement, vous pourrez lui poser des questions sur divers sujets, discuter à voix haute avec lui et même l'interrompre en plein milieu de sa réponse pour approfondir un point en particulier, le tout en profitant de sa synthèse vocale poussée et de sa grande réactivité.
Gemini Live : un assistant personnel vocal dopé à l'IA
La présentation des nouveautés de Gemini ne s'est pas déroulée sans heurt. Il y a en effet eu un petit cafouillage durant la démonstration de l'intégration du chatbot dans les applications Tasks, Calendar et Keep. Est ensuite venu le tour de Gemini Live. Pour montrer son fonctionnement, Jenny Blackburn, la vice-présidente de Google en charge de l'IA, lui a demandé : "Ma nièce et mon neveu viennent ce week-end, et j'ai besoin de quelques idées pour quelque chose d'amusant et d'éducatif que nous pourrions faire ensemble. Je pensais peut-être à une expérience de chimie, quelque chose d'un peu magique." L'assistant lui propose de réaliser un volcan maison, une expérience de chimie plutôt classique, avant de lui demander si elle souhaitait entendre d'autres propositions, ce à quoi la cadre de Google répond par l'affirmative. L'IA lui propose donc de fabriquer une lampe à lave avec de l'encre réactive à la chaleur. Alors que Jenny Blackburn s'interroge si l'atelier ne sera pas trop salissant, Gemini lui explique qu'il faudra simplement veiller à couvrir le plan de travail. Enfin, la cadre de Google lui demande des suggestions de noms pour cette expérience, et l'IA s'empresse alors de lui proposer "L'Académie d'entraînement d'espions" ou "Le laboratoire des messages secrets". Bref, un véritable assistant conversationnel !
Google insiste sur le fait qu'on peut interrompre Gemini Live en plein milieu de sa réponse pour le rediriger ou changer de sujet, ou même mettre en pause la conversation. Il est également possible d'utiliser l'assistant en arrière-plan ou avec son smartphone verrouillé, comme ce serait le cas pour un appel. Au niveau de l'interface, aucune photo ou texte ne s'invite à l'écran, pour ne pas perturber la conversation.
Pour offrir plus de personnalisation à l'utilisateur, Google propose pas moins de dix voix disponibles, avec des caractéristiques différentes et un grain assez naturel. Trois d'entre elles ont été présentées lors de la conférence, à savoir Vega, Dipper et Ursa. Pour le moment, Gemini Live est uniquement disponible en anglais, et seulement pour les abonnés à Gemini Advanced – à 21,99 euros par mois – sur les smartphones Android. L'IA sera disponible dans d'autres langues et sur iOS dans les prochaines semaines.
Ce lancement intervient quelques jours après le déploiement de la fonction vocale avancée de ChatGPT en bêta. Réservée à certains abonnés à ChatGPT Plus, elle offre, selon OpenAI, des "conversations plus naturelles et en temps réel, pouvant être interrompues à tout moment". La guerre continue donc de plus belle entre les deux entreprises, bien décidées à gagner cette course à l'intelligence artificielle.