Google Gemini : l'IA qui veut écraser ChatGPT

Après plusieurs mois de travaux et de recherches, Google a officiellement annoncé le déploiement de Gemini, sa nouvelle IA. Avec cet outil, le géant américain espère bien détrôner OpenAI, le créateur de ChatGPT. Pari gagné ?

Au cours des derniers mois, Microsoft a multiplié les intégrations de son intelligence artificielle (IA) dans la grande majorité de ses produits et de ses services. Grâce à son partenariat avec Open AI, la société a notamment pu prendre de l'avance sur la concurrence. Cependant, Google pourrait bien avoir relancé la course à l'intelligence artificielle. Ce mercredi 6 décembre 2023, la firme de Mountain View a en effet annoncé qu'elle commençait à déployer Gemini, son tout nouvel outil d'IA. "Gemini est le modèle d'intelligence artificielle [IA] le plus puissant et le plus généraliste que nous ayons publié", explique Sundar Pichai, le PDG de Google dans son communiqué officiel publié sur le blog de la société. Avant d'ajouter : "Cette nouvelle ère de modèles représente l'un des plus grands efforts scientifiques et techniques que nous ayons entrepris depuis la création de Google."

Google Gemini : une IA qui entend dépasser ChatGPT

Comme l'a confirmé une vidéo test diffusée par Google lors d'une présentation à la presse, Gemini est un modèle dit "multimodal". En d'autres termes, il s'agit d'une intelligence artificielle capable d'analyser des sources d'information très différentes les unes des autres. En effet, Gemini est en mesure aussi bien de "comprendre" un exercice scolaire écrit à la main que de décrypter des vidéos ou même des lignes de code informatique. Et ce n'est pas tout : l'outil est aussi capable de reconnaître la matière d'un objet analysé, de trouver des points communs entre plusieurs objets ou même de comprendre des ombres chinoises.

Selon les évaluations de Google, Gemini est plus performant que son concurrent direct, GPT-4, dans huit des neuf principaux tests reconnus par la communauté IA. Parmi eux, on retrouve notamment des mathématiques, de la traduction ou encore de la programmation Python. Parallèlement, l'outil aurait également résolu 90 % des 57 tâches proposées lors d'un test imaginé par l'université de Berkeley dans lequel la machine était interrogée sur sa capacité de compréhension des modèles de langue, du droit, de l'histoire ou encore des mathématiques. À titre de comparaison, GPT-4 a affiché un score de 87 %, tandis que son prédécesseur, GPT-3, était à 45 %. "Gemini est le modèle le plus polyvalent que nous ayons développé à ce jour. Ses capacités avancées apporteront énormément aux développeurs et aux entreprises pour la conception d'applications fondées sur l'IA", indique Demis Hassabis, directeur de Google DeepMind.

Google Gemini : un modèle d'IA décliné en trois versions

Pour intégrer Gemini à toutes ses machines, Google a prévu de décliner son modèle en trois versions distinctes, curieusement qualifiées de "tailles" : Nano, Pro et Ultra.

Le modèle Nano est une version allégée de Gemini, spécialement conçue pour les smartphones. Ici, l'objectif est clair : que l'intelligence artificielle puisse être utilisée sans connexion internet. Une grande nouvelle pour les développeurs d'applications, qui peuvent déjà demander à accéder à Nano depuis ce mercredi 6 décembre.
Le modèle Gemini Pro est une version plus polyvalente, mais aussi plus poussée. Celle-ci a notamment été conçue pour être intégrée à tous les services et appareils de Google, dont Bard, son chatbot, qui est l'un des concurrents principaux de ChatGPT.
Enfin, le modèle Gemini Ultra, qui a été présenté en vidéo de démonstration, est la version la plus performante du LLM (grands modèles de langage). Elle a notamment été optimisée pour répondre à des tâches particulièrement complexes. Malheureusement, cette version n'est pas encore prête à être mise sur le marché. "Nous procédons actuellement à des vérifications approfondies de la sûreté du modèle, en faisant notamment appel à des tiers de confiance", explique Google.

Pour l'instant, Gemini s'adresse principalement à des utilisateurs anglophones. En effet, l'intelligence artificielle répond de manière beaucoup plus précise si les contenus en anglais. Pour l'instant, Google préfère affiner son modèle avant de le décliner dans d'autres langues. On dirait que le géant de Mountain View sait qu'il est attendu au tournant sur la qualité des produits proposés.