Google I/O 2024 : tout ce que l'IA va changer dans notre quotidien
Ce 14 mai, Google a ouvert le bal des conférences de développeurs, juste avant celles de Microsoft et d'Apple. Au programme : de l'IA, de l'IA et encore de l'IA, partout, tout le temps, pour tout. La grande révolution est bien en route.
La grand-messe annuelle de Google, la Google I/O, s'est tenue en ligne ce mardi 14 mai 2024, depuis le siège du géant américain à Mountain View. Et, le moins que l'on puisse dire, c'était que son programme était plutôt chargé avec, comme sujet principal, l'intelligence artificielle… et rien que l'IA ! Ceux qui s'attendaient à découvrir les prochains Pixel 9, Pixel Tablet et autre Chromecast en ont été pour leurs frais.
L'IA a occupé tellement l'espace durant cette conférence que Sundar Pichai, le patron de Google et maître de cérémonie pour l'occasion, a conclu l'événement en calculant le nombre de fois où ces deux initiales avaient été prononcées : 120. En deux heures, c'est une belle moyenne qui donne aussi le ton des principales préoccupations de la firme américaine.
À défaut de matériel c'est donc bien du côté logiciel que tous les efforts de Google semblent se focaliser. Au cœur de cette galaxie de nouveaux services se trouve Gemini, le modèle d'intelligence artificielle multimodal (comprenez qu'il peut s'attaquer non seulement à du texte mais aussi à des photos, des vidéos et du son). Après des débuts timides et un peu chaotiques (les déboires de Bard ne sont pas tout à fait oubliés) Google montre ses muscles pour revenir dans la compétition et tenir la dragée haute à ChatGPT 4o présenté la veille par son grand rival dans le domaine, OpenAI. Voici un résumé des principales annonces de cette conférence d'ouverture Google I/O 2024.
AI Overviews : la fin des résultats classiques
Avec l'intelligence artificielle, Google souhaite remodeler en profondeur ce qui fait son cœur de métier depuis plus de 25 ans : son moteur de recherche. Et il est certain que l'outil fait un véritable bond en avant avec comme objectif principal : faire les recherches à votre place. Jusqu'à présent, en effectuant une requête dans le champ de recherche, on obtenait une liste de liens vers des sites Web en accord avec le sujet. Avec AI Overviews, Gemini prend la main. Le haut de la page de résultats s'orne d'un résumé généré par Gemini qui répond au sujet demandé. Il peut être complété grâce à des suggestions de l'IA pour affiner la recherche ainsi que des cartes Maps ou des vidéos YouTube. Vous l'aurez compris, les liens vers les sites Web sont relégués bien plus bas dans la page. Le principe permet, selon Google de gagner du temps en évitant d'ouvrir des liens à tout va vers des sites Web pourtant bien référencés mais qui ne répondent pas forcément à la question posée. En test depuis un an aux États-Unis, AI Overviews va d'abord être déployé sur le sol américain puis ouvert aux autres pays du monde. Google espère toucher un milliard d'utilisateurs avant la fin de l'année. On ne sait pas pour le moment si AI Overviews se conforme aux exigences du DMA en Europe ou si Google va devoir procéder à quelques ajustements sur le vieux continent. Une chose est sure, AI Overviews va radicalement changer la façon dont on obtient des résultats avec Google Search. Et la firme tient toutefois à rassurer les éditeurs de sites Web qui s'imaginent déjà revoir leur référencement de fond en comble : " À mesure que nous élargissons cette expérience, nous continuerons à nous concentrer sur l'envoi d'un trafic précieux aux éditeurs et aux créateurs. Comme toujours, les publicités continueront d'apparaître dans des emplacements dédiés tout au long de la page, avec un étiquetage clair pour distinguer les résultats organiques des résultats sponsorisés ".
Google Search : la recherche à partir de vidéo
Nouvelle fonction à venir également, la possibilité d'utiliser une vidéo au lieu d'un texte pour mener une recherche. L'exemple utilisé pour la démonstration s'appuyait sur le dysfonctionnement d'une platine vinyle. L'IA analyse image par image la séquence, en tire toutes les informations possibles (comme la marque et le modèle de l'appareil) et " comprend " le problème. Elle livre alors des résultats sous forme de résumé (les sites Web utilisés comme référence ne sont toujours pas indiqués en premier) pour résoudre le problème. Cette fonction est encore en phase de tests aux États-Unis pour le moment et sera étendue à d'autres régions au fil du temps selon Google.
Google Workspace : Gemini pour simplifier les réunions
Workspace regroupe la suite d'outils de travail collaboratif de Google. Et bientôt, les entreprises pourront compter sur un nouveau collaborateur virtuel incarné par Gemini. Il aura son propre compte et se chargera par exemple de retrouver des documents liés à un même projet, d'en réaliser un résumé, de vérifier des plannings, d'élaborer des tableau de bord… Bref, Gemini sera un employé modèle, disponible jour et nuit 7j/7.
Google Photos : le plein de fonctions dopées à l'IA
Voilà neuf ans déjà que Google Photos, le gestionnaire d'images maison, existe. Google indique que 6 milliards de clichés sont envoyés sur ses serveurs quotidiennement. Le service utilise déjà l'IA pour la retouche d'images. Mais Gemini s'invite ici dorénavant pour l'organisation de la photothèque. On pourra ainsi lui demander de retrouver tout et n'importe quoi. La démonstration la plus bluffante durant la conférence montrait comment avec la requête : " quelle est l'immatriculation de ma voiture ? " Google Photos parvenait après analyse à identifier un cliché, parmi des milliers stockés dans la photothèque, présentant le numéro de plaque de la bonne voiture par recoupement. Autre possibilité, demander de créer un album représentant l'évolution d'une activité au fil du temps. L'exemple retenu pour illustrer le concept était les progrès en natation d'une petite fille, des premières séances d'apprentissage aux compétitions. Là encore le but est de faire gagner du temps pour éviter d'avoir à farfouiller dans des milliers de clichés pris durant plusieurs années.
Android 15 : Gemini au service du système
La prochaine version du système d'exploitation mobile de Google, qui accapare généralement une grande partie de cette grand-messe, a à peine été évoquée. Et évidemment, c'est sous le prisme de l'IA et en particulier de Gemini, qu'Android 15 a été abordé. Il faut se préparer à faire ses adieux à Google Assistant qui sera remplacé par Gemini. L'IA prendra ici la forme d'une fenêtre flottante qui se superpose à l'appli ouverte auparavant. Il sera possible d'utiliser des contenus générés par Gemini en les glissant dans l'appli de son choix. Par ailleurs, l'IA surveillera aussi vos arrières notamment avec les appels frauduleux. Elle signalera le risque d'arnaque durant l'appel.
Projet Astra : la riposte de Google à ChatGPT-4o
OpenAI à l'origine de ChatGPT a présenté la veille ChatGPT 4o, évolution majeure de son modèle de langage doté d'impressionnantes capacités d'interaction mêlant texte, voix et images. La riposte de Google ne s'est pas fait attendre longtemps et se dévoile sous les traits du projet Astra. Comme son nom l'indique, le procédé est encore à l'étape d'élaboration mais la vidéo présentée lors de la conférence laisse entrevoir d'immenses possibilités (s'il ne s'agit pas là encore d'une démonstration un peu trompeuse). À l'aide d'un smartphone pointant sa caméra sur divers objets en vidéo, l'IA est en mesure d'analyser l'environnement, de résoudre des problème, d'interagir en temps réel avec l'utilisateur, etc. On détecte même dans la vidéo une paire de lunettes façon Google Glass qui avaient fait un flop lors de leur sortie en 2011 mais qui pourraient bien renaître de leurs cendres avec une IA embarquée telle que Gemini.
IA générative : tout pour la création d'images et de sons
L'IA générative qui permet de créer du contenu en un clin d'œil représente aussi pilier majeur chez Google. La firme a ainsi profité de la conférence des développeurs pour présenter Imagen 3, capable de générer des images encore plus photoréalistes en sachant interpréter des prompts (descriptions textuelles) plus long. Au rendez-vous également, Veo qui se veut un concurrent direct de Sora d'OpenAI. L'objectif est ici de générer des vidéos complètes en 1080p à partir de prompts écrits ou même vocaux. Il est possible d'indiquer la nature des plans à générer (traveling, aérien, panoramique, etc.) l'ambiance lumineuse et bien d'autres aspects encore. Enfin, les musiciens y trouvent également leur compte avec Music AI Sandbox qui permet de générer des boucles ou d'enrichir des morceaux déjà réalisés grâce à l'IA générative.
Google Maps : l'IA pour améliorer la réalité augmentée
L'outil de cartographie de Google exploite déjà de manière intensive la réalité augmentée grâce à l'IA. Bientôt (aucune date n'a encore été annoncée) elle sera encore plus présente. Lors de la démonstration qui nous a été faite, une balade sur les quais de Seine à Paris permettait en pointant le smartphone du bon côté, d'afficher dans Maps les quais tels qu'ils se présentaient pendant l'exposition universelle de 1889 date de l'inauguration de la tour Eiffel. On pouvait y voir également les autres pavillons (démolis depuis) prendre place le long de la Seine à la manière des effets spéciaux que l'on peut apprécier dans l'émission Secrets d'histoire de France 2. Plus encore, l'IA permet également d'observer les différents projets de modifications qui ont put naître au fil des années. Un travail impressionnant et très bien réalisé mené par les équipes de Google Arts & Culture dont une bonne partie est installée en France.