Google Gemma 3 270M : une IA gratuite fonctionnant sans connexion Internet sur un smartphone

Google lance un modèle d'IA, baptisé Gemma 3 270M, capable de tourner en local, sans connexion Internet. Annoncée comme compacte, économe en énergie et performant, il peut fonctionner sur un simple smartphone.

Les intelligences artificielles sont, pour les modèles de langage (LLM) les plus populaires, des outils gourmands en ressources, dépendant de puissants serveurs dans le cloud. Elles comprennent toujours plus de paramètres, afin de devenir les plus rapides, les plus fiables et les plus intelligentes par rapport aux différents concurrents. Mais il existe aussi des IA plus petites, et donc plus accessibles.

Récemment, OpenAI a donné accès à ses modèles GPT-OSS pour Mac, capables de tourner hors ligne avec des performances proches de GPT-4o. Forcément, Google se devait de répliquer. C'est pourquoi l'entreprise dévoile dans un billet de blog Gemma 3 270M, un nouveau modèle open source capable de fonctionner directement en local sur un appareil grand public, comme un smartphone, sans connexion Internet.

Gemma 3 270M : une IA locale et économe en énergie

Gemma 3 270M est une version "miniature" et optimisée de la famille de modèles Gemma, issus de la même technologie que les grands modèles Gemini. Le chiffre "270M" fait référence à ses 270 millions de paramètres. Si cela peut sembler considérable, c'est en réalité minuscule comparé aux centaines de milliards de paramètres des modèles phares comme GPT-4 ou les plus grandes versions de Gemini. Cette compacité permet au modèle de tourner sur des appareils modestes, comme un Pixel 9, sans nécessiter de connexion Internet ni d'exiger un volume de stockage excessif.

L'une des caractéristiques de Gemma 3 270M est son efficacité énergétique. Selon Google, des tests réalisés sur un appareil Pixel 9 Pro ont montré que le modèle, dans sa version optimisée, ne consommait que 0,75 % de la batterie du téléphone pour accomplir 25 conversations avec l'IA. Il peut également fonctionner via un simple navigateur Web ou un Raspberry Pi. "Ce modèle peut même fonctionner dans un grille-pain ", plaisante Omar Sanseviero, ingénieur chez Google DeepMind, sur X.

Malgré ce format léger, les résultats semblent être là. Gemma 3 270M a obtenu un score de 51,2 % de précision, un score jugé remarquable dans la catégorie des modèles ultra-légers et comparable à certains modèles dépassant le milliard de paramètres.

Avec Gemma 3 270M, le traitement des données se fait en local, c'est-à-dire directement sur l'appareil de l'utilisateur, ce qui élimine la nécessité d'envoyer des informations vers des serveurs distants. Ce mode de fonctionnement permet de garantir la confidentialité des données, car les informations traitées ne quittent pas l'appareil. De plus, il permet une utilisation instantanée et une absence de latence, car il ne dépend pas de la vitesse de la connexion Internet.

Gemma 3 270M : miser sur la spécialisation plutôt que la puissance brute

Pour réussir son pari, Google a adopté une approche tournée vers la spécialisation plutôt que la puissance brute. Par exemple, l'entreprise SK Telecom a choisi d'adapter le modèle de langage à la gestion de contenus multilingues, atteignant des performances supérieures à des modèles propriétaires plus massifs. "Tout comme on n'utilise pas un marteau de maçon pour accrocher un cadre, l'ingénierie se définit par l'efficacité, pas la force", résume Olivier Lacombe, chef de produit chez Google.

Gemma 3 270M est proposé en accès libre pour les développeurs sur des plateformes comme Hugging Face, Ollama, Kaggle, LM Studio et Docker. Google met à disposition deux versions : un modèle pré-entraîné, qui peut être adapté à des besoins spécifiques par les développeurs, et une version "instruction-tuned", capable de répondre à des commandes directes dès son utilisation.

L'utilisation du modèle de langage est gratuite, à condition de ne pas l'utiliser pour créer du contenu trompeur, nuisible ou illégal. Google ne réclame aucun droit sur les textes produits, mais impose néanmoins de mentionner la source et d'informer les utilisateurs finaux de l'utilisation de l'IA. Les développeurs peuvent modifier le modèle, l'adapter à leurs besoins et l'intégrer à des produits commerciaux.