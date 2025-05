Certaines IA collectent beaucoup plus de données personnelles que d'autres. Voici qui, de ChatGPT, Gemini, Meta AI, Copilot, Grok, Perplexity ou encore Claude, vous espionne le plus. Et ça donne froid dans le dos…

L'intelligence artificielle a progressivement fait son nid dans notre quotidien, au point où nous l'utilisons sans nous en rendre compte. C'est particulièrement le cas avec les chatbots comme ChatGPT, Gemini ou encore Copilot, qui sont devenus de véritables assistants virtuels. Que ce soit pour aider aux devoirs, effectuer une recherche sur un sujet, obtenir des conseils médicaux, planifier une sortie, et même épancher ses sentiments ou apprendre à draguer. Autant de données qui sont servies aux entreprises sur un plateau.

Car oui, l'IA et la confidentialité, c'est une histoire d'amour qui ne fonctionne pas. Et nous avons beau le savoir, nous avons rarement conscience d'à quel point ce sont des aspirateurs à données. Et certaines plus que d'autres ! Surfshark, l'entreprise spécialisée dans les VPN, a analysé les pratiques des dix principaux assistants IA du marché. Et les résultats sont assez effarants, en particulier pour Meta AI, l'IA de WhatsApp et de Facebook, grande championne du siphonnage, qui s'empare goulûment des informations personnelles de ses quelque 500 millions d'utilisateurs.

Meta AI : le chatbot qui pille les données de ses utilisateurs

Là où le nombre moyen de données collectées par les assistants virtuels est de 13 sur 35, Meta AI en récupère 32. Autant dire que le chatbot est très loin devant ses concurrents ! En plus des données classiques (nom, adresse, historique de navigation, contenus générés, interactions, position géographique), c'est le seul à collecter des données à propos des informations financières, de la santé et de la forme physique, mais aussi les informations sensibles, notamment les données raciales ou ethniques, l'orientation sexuelle, les informations relatives à la grossesse ou à l'accouchement, le handicap, les convictions religieuses ou philosophiques, l'appartenance syndicale, les opinions politiques, les informations génétiques ou les données biométriques. Et quand on voit les politiques anti-avortement et de répression à l'encontre des minorités actuellement appliquées aux Etats-Unis, cela fait froid dans le dos.

© Surfshark

De plus, alors que la plupart des entreprises se "contentent" d'utiliser les données récoltées pour entraîner leurs modèles de langage, Meta AI est le seul, avec Copilot de Microsoft, à les partager avec des tiers, notamment pour envoyer des publicités ciblées. Seulement, la firme de Redmond se limite à deux types de données, celle de Mark Zuckerberg peut aller jusqu'à 24. Autant dire que mieux vaut y réfléchir à deux fois avant d'échanger avec son chatbot ! En France, Meta a spécifiquement indiqué que l'entreprise allait se servir des échanges des utilisateurs avec l'IA pour entraîner son modèle de langage. Il faut obligatoirement faire opposition via un formulaire avant le 27 mai prochain pour protéger ses données.

Intelligence artificielle : quelle est la meilleure alternative ?

Mais qu'en est-il des autres intelligences artificielles ? Celle de Google, Gemini, est la deuxième la plus vorace après Meta AI, avec 22 types de données collectées, dont les coordonnées (nom, adresse e-mail, numéro de téléphone, etc.), le contenu utilisateur, les contacts (comme la liste des contacts présents sur le téléphone de l'utilisateur), l'historique de recherche et l'historique de navigation. Notons que les données de localisation précises sont collectées uniquement par Gemini, Meta AI, Copilot et Perplexity.

ChatGPT fait un peu mieux, ou plutôt moins pire, avec "seulement" dix types de données collectées sur trente-cinq, avec en prime un mode de conversation temporaire, qui supprime automatiquement toutes les données après 30 jours. Quant à l'IA chinoise, DeepSeek, elle se situe dans la moyenne, avec 11 types de données. Notons cependant qu'en vertu de la politique de Pékin, les serveurs étant situés là-bas, les autorités sont autorisées à y accéder sans décision judiciaire. Et c'est sans compter les risques de piratage, l'entreprise ayant déjà subi un accident de sécurité par le passé.

Cette étude nous prouve qu'il n'y a pas vraiment d'IA "éthique", seulement certaines qui sont moins pires que d'autres. Entre la collecte des données excessive et leur revente, les politiques de stockage floues, l'utilisation des zones grises réglementaires et l'ingérence des autorités des nations étrangères, nos informations ne sont jamais en sécurité. Il faut toujours garder ce fait en tête et se questionner, à chaque fois que nous utilisons une de ces IA conversationnelles, sur ce que nous échangeons contre les réponses obtenues et si les risques en valent la chandelle.