Panne Facebook, Instagram, WhatsApp, Messenger : retour sur le bug mondial
PANNE FACEBOOK. Une panne mondiale a frappé Facebook Instagram, Messenger et WhatsApp pendant la soirée du 4 octobre. Il a fallu plus de six heures pour rétablir les services. Retour sur un incident historique.
[Mis à jour le mardi 5 octobre à 19 h 45] Lundi noir pour Facebook. Le 4 octobre 2021 restera comme un jour très sombre dans les annales du géant américain, frappé par la panne gigantesque qui a bloqué les principaux services du groupe. Une panne historique, la plus longue endurée par l'entreprise de Mark Zuckerberg, qui aura d'ailleurs perdu personnellement près de six milliards de dollars en quelques heures après une chute du titre en Bourse. Mais les principales victimes auront été les utilisateurs de Facebook, d'Instagram, de Messenger et de WhatsApp, incapables d'accéder aux réseaux sociaux et de communiquer sur les messageries instantanées et, pour beaucoup, paniqués par cette privation subite d'outils numériques. La situation est heureusement revenue à la normale dans la nuit du 4 au 5 octobre, mais cet incident majeur mérite quelques explications.
Plus de six heures sans service
Tout a commencé en fin d'après-midi, vers 17 h 30 heure française, ce fameux lundi 4 octobre. De nombreux utilisateurs de Facebook, d'Instagram, de Messenger et de WhatsApp privés d'accès à leurs outils de communication préférés se sont rués sur Internet à la recherche d'information, en signalant des problèmes de connexion sur des sites comme DownDetector, qui répertorie les pannes chez les grands opérateurs et les principaux services en ligne. Le pic de signalements a été atteint vers 19 h, et les problèmes ont perduré toute la soirée. Durant toute cette période, il était impossible d'accéder aux réseaux sociaux ou d'utiliser les messageries de Facebook. Et contrairement à ce que beaucoup ont cru, il ne s'agissait pas d'un problème de piratage de compte ou d'un bug dans les applications, mais bien d'un accès aux services de Facebook. Tout se passait comme si les serveurs de l'entreprise étaient coupés du monde extérieur. Et la panne n'a pas touché que la France. Elle était générale, frappant aussi bien les États-Unis que l'Europe et d'autres régions de la planète.
Dans un message rapidement publié sur Twitter – qui fonctionnait parfaitement… –, Andy Stone, chef de la communication de Facebook, indiquait être au courant que certaines personnes avaient du mal à accéder à certains des produits et applications du groupe. "Nous sommes en train de travailler pour revenir à la normale le plus rapidement possible, et nous vous présentons nos excuses pour le désagrément."
Were aware that some people are having trouble accessing our apps and products. Were working to get things back to normal as quickly as possible, and we apologize for any inconvenience.
— Andy Stone (@andymstone) October 4, 2021
Une information un peu laconique, qui ne donnait aucune explication. Peu avant 22 h, un message d'excuses sur le fil Twitter officiel de Facebook donnait un peu plus de détails sur la situation, en indiquant que l'entreprise rencontrait de graves problèmes de réseau et que les équipes technique étaient mobilisées pour les résoudre au plus vite. Mais le problème était plus sérieux que prévu et il aura fallu finalement plus de six heures aux experts de Facebook pour en venir à bout. Aux alentours de minuit, heure française, les services sont progressivement redevenus accessibles. Mais pas complètement. Il était possible de se connecter à Facebook, mais pas d'envoyer de message ou de mettre à jour le fil d'actualité. "À l'immense communauté de personnes et d'entreprises dans le monde qui dépendent de nous : nous sommes désolés. Nous travaillons dur à vous redonner accès à nos applis et services et sommes heureux de vous dire qu'ils reviennent en ligne en ce moment ", a tweeté Facebook à 0 h 30, après six heures de panne totale. Tout est rentré dans l'ordre au cours de la nuit, et, à quelques détails près, Facebook, Instagram, Messenger et WhatsApp étaient complètement fonctionnels le matin du 5 octobre.
Un problème de routage
À en juger par le délai nécessaire au rétablissement des services, le problème qui a frappé Facebook était sévère et compliqué à résoudre. En effet, les propres employés de Facebook devaient se connecter à leur compte professionnel pour pouvoir accéder à leurs outils et documents. Mais, comme l'a rapporté The Verge, ils ne pouvaient même pas accéder à leurs bureaux, à cause de badges qui ne fonctionnaient pas ! Résultat : l'entreprise a envoyé certains de ses ingénieurs directement dans ses centres de données afin d'intervenir directement sur les serveurs.
" Nous avons travaillé aussi dur que possible pour restaurer l'accès et nos systèmes fonctionnent désormais normalement. La cause sous-jacente de cette panne a également touché de nombreux systèmes et outils internes que nous utilisons dans nos opérations quotidiennes, compliquant nos tentatives de diagnostiquer rapidement et de résoudre le problème", a avoué Facebook dans un bref communiqué.
Il a fallu attendre encore avant d'avoir des explications précises. Facebook a simplement indiqué que la panne était due à des changements de configuration dans les routeurs qui coordonnent le trafic entre les centres de données (les data centers). Modifications qui auraient eu plusieurs conséquences sur les communications entre les différents serveurs du groupe américain."Nous pensons que les causes de cette panne sont un mauvais changement de configuration. Nous n'avons aucune indication que des données des utilisateurs ont été compromises pendant la panne ", a précisé le groupe dans un communiqué, pour rassurer ses ytilisateurs.
Des experts, et notamment CloudFlare, société spécialisée dans le trafic Internet, ont avancé des hypothèses plus techniques. Le problème serait ainsi lié à deux éléments techniques qui régissent l'aiguillage sur la Toile : le DNS et le BGP. Le DNS, pour Domain Name System, est le service qui sert d'annuaire, en associant les URL (les adresses "classiques" des sites et des services) aux adresses IP (les numéros "physiques" des serveurs). Le BGP, pour Border Gateway Protocol, sert de guide, en indiquant le chemin à suivre pour parvenir à destination. Et c'est précisément un changement de configuration BGP suite à une mise à jour qui aurait fait dérailler la machine, en empêchant l'accès aux services de Facebook. Même l'adresse facebook.com était inaccessible pendant toute la durée de la panne, comme si le site avait disparu du Web. Il faudra sans doute attendre encore un peu avant d'avoir des informations officielles.
Quoi qu'il en soit, dans ce genre de situation, qui peut survenir n'importe quand, la seule attitude à adopter, c'est d'attendre patiemment. Aucune raison de s'inquiéter si ce genre de panne se reproduit : il ne s'agit pas d'un piratage ou d'un blocage de compte, juste d'un problème technique. Surtout quand le reste d'Internet fonctionne normalement. Il suffit d'aller sur des sites comme DownDetector, pour vérifier que le problème est global mais limité. Et de tester d'autres services pour communiquer. L'incident de la nuit du 4 octobre a d'ailleurs été très profitables aux autres messageries, telles Signal et Telegram, qui ont battu des records de téléchargement et d'utilisation. Le malheur des uns…