Panne mondiale chez Meta : pourquoi Facebook, Instagram et Messenger ne répondaient plus
Il y a quelques jours, une panne mondiale historique a touché Facebook, Instagram, Messenger et d'autres services de Meta, les rendant totalement inaccessibles. L'entreprise a enfin expliqué l'origine du problème.
Gros coup de chaud sur les réseaux sociaux le mardi 5 mars dernier ! Vers 16 h, il était devenu impossible d'accéder aux réseaux sociaux et aux messageries instantanées de Meta ! De nombreux utilisateurs de Facebook, d'Instagram, de Messenger, de WhatsApp et de Threads privés d'accès à leurs outils de communication préférés s'étaient immédiatement rués sur Internet à la recherche d'informations, en signalant des problèmes de connexion sur des sites comme DownDetector, qui répertorie les pannes chez les grands opérateurs et les principaux services en ligne, mais aussi sur X – après tout, c'est le réseau social pour se plaindre. Même sur le forum de Comment Ça Marche, des posts d'internautes anxieux arrivaient de toutes parts ! Tout est finalement rentré dans l'ordre après 17 h. Mais alors, que s'est-il passé ?
Panne mondiale chez Meta : panique à bord !
Des dizaines de millions d'utilisateurs dans le monde ont été déconnectés de leurs comptes Facebook et Messenger, avec l'impossibilité de se reconnecter. Pire encore : un message indiquait que "le mot de passe que vous avez entré est incorrect". Et impossible de le réinitialiser, car le code pour la double authentification n'arrivait pas à bon port, et la plateforme ne reconnaissait pas non plus les nouveaux identifiants. Du côté d'Instagram, les utilisateurs ont fait face à un message "Une erreur s'est produite". Toutefois, le problème ne concernait que les personnes connectées à leur compte et que celles évoluant hors ligne n'aient aucun problème. De leur côté, Threads et WhatsApp avaient l'air d'être moins touchés, même si plusieurs signalements avaient été effectués.
La situation avait finalement commencé à revenir à la normale à partir de 17 h, Meta ayant visiblement réussi à réparer la panne, comme la société l'avait indiqué sur sa page d'état de service, en présentant évidemment ses excuses. Et, comme nous l'avions constaté, l'accès aux différents services était bien rétabli en début de soirée, à 19 h. Au final, la panne aura duré deux heures et demi, en faisant la panne la plus importante pour le groupe depuis quatre ans.
Panne mondiale chez Meta : une erreur technique lourde de conséquences
Pas de panique toutefois ! Contrairement à ce que beaucoup ont cru, il ne s'agissait pas d'un problème de piratage de compte, mais bel et bien d'une panne qui a touché les utilisateurs du monde entier. Sur X, Andy Stone, responsable de la communication chez Meta, avait confirmé la nouvelle : "Nous sommes au courant que nos utilisateurs ont du mal à accéder à nos services. Nous travaillons sur le sujet actuellement", expliquait-il.
L'entreprise de Mark Zuckerberg a donné plus de détails sur ce qui s'est passé dans un billet de blog. Apparemment, il s'agissait d'un problème de gestion d'une erreur par un système automatisé de vérification des valeurs de configuration au sein de l'infrastructure du groupe. Pour faire simple, ce système est chargé d'identifier et de corriger les valeurs de configuration qui ne sont pas valides dans le cache et de les remplacer par des valeurs mises à jour à partir de la mémoire permanente. Or, une modification qui a été apportée à une valeur de configuration persistante a été interprétée, à tort, comme invalide. De ce fait, chaque client a tenté de corriger cette erreur en même temps. Résultat : le groupement de bases de données a rapidement été submergé par des centaines de milliers de requêtes par seconde.
Pour aggraver les choses, chaque fois qu'un client obtenait une erreur en tentant d'interroger l'une des bases de données, il l'interprétait comme une valeur non valide et supprimait la clé de cache correspondante. Cela signifie que même après la résolution du problème initial, le flux de requêtes se poursuivait et les bases de données ne parvenaient pas à se rétablir. Bref, le système automatisé a fait plus de dégâts qu'il n'en a réparés. Pour résoudre ce problème, Meta n'a eu d'autres choix que de couper tout le trafic vers ce groupe de bases de données, c'est-à-dire de désactiver temporairement les différentes plateformes. Leur accès a ensuite été rétabli progressivement.
Panne mondiale chez Meta : déconnexion forcée et erreur de chargement
La dernière grosse panne des services de Meta remonte à mai 2023 et concernait Messenger, qui n'a plus été disponible pendant plus d'une heure. Meta avait ensuite fait face à une panne géante, touchant la totalité de ses services, en octobre 2021, qui avait duré près de six heures (voir notre article).
we know why youre all here rn
— X (@X) March 5, 2024
Comme d'habitude lorsque les réseaux sociaux de Meta tombent en panne, tous les utilisateurs se sont réfugié sur X (anciennement Twitter) pour partager leur détresse. "On sait pourquoi vous êtes là", avait d'ailleurs publié ironiquement le compte officiel de X. "Si vous arrivez à lire ce tweet, c'est parce que nos serveurs fonctionnent", avait quant à lui commenté Elon Musk, oubliant vite les nombreux déboires rencontrés par la plateforme depuis son rachat. Quand le chat n'est pas là, les souris dansent...