Ce n’était donc ni une cyberattaque, ni un acte malveillant, mais une « banale » erreur technique qui a ensuite entrainé des problèmes en cascade, jusqu’à faire planter une bonne partie du web, dans la journée du 18 novembre 2025. Voilà donc la conclusion à laquelle est parvenue Cloudflare dans les heures qui ont suivi la panne d’ampleur du net.
L’entreprise américaine, qui fournit des prestations à près de 20 % de tous les sites web, a finalement partagé des explications sur les causes de cette grosse sortie de piste. Et c’est Matthew Prince, le fondateur et patron de la société, qui a pris la plume pour rédiger un relativement long billet de blog post-mortem pour entrer dans les détails.

Pour comprendre les raisons de cette panne massive qui a fait planter une partie importante du trafic mondial, il faut au préalable avoir conscience de la place qu’occupe Cloudflare sur le net aujourd’hui. C’est un pilier majeur de l’infrastructure du web moderne, en proposant de très nombreux services aux sites, par exemple pour améliorer leur temps de chargement.
De fait, Cloudflare mobilise une infrastructure s’appuyant sur de nombreux serveurs dispersés un peu partout dans le monde, pour délivrer le contenu de ses clients à travers le web aussi efficacement et vite que possible. Ce réseau CDN (Content Delivery Network) met en cache du contenu des sites pour les dupliquer, ce qui permet de les épauler.
Un fichier clé qui déraille, et qui se propage partout toutes les 5 minutes
Le fait est que ce vaste réseau est aussi régi par des règles et des systèmes spécifiques, ne serait-ce que pour des raisons de sécurité. En particulier, il y a un fichier de règles servant à passer en revue les requêtes destinées aux sites des clients de Cloudflare — et ces règles doivent aider à faire le tri entre le bon grain et l’ivraie, en quelque sorte.


Ce fichier est appelé Bot Management system (système de gestion des bots), car il lui revient de gérer les requêtes qui sont automatiques, c’est-à-dire venant des moteurs de recherche, des chatbots ou bien de n’importe quel autre processus artificiel. Il est actualisé toutes les 5 minutes, et est distribué dans le monde entier.

C’est ce fichier qui a posé un problème dans la journée du 18 novembre. Un changement de permissions dans l’un des systèmes de base de données de Cloudflare a eu pour effet d’entraîner la création de plusieurs entrées dans ce fichier de règles qu’utilise le système de gestion des bots. Résultat : le fichier a plus que doublé en taille.
Évidemment, ce fichier plus volumineux a ensuite été propagé à toutes les machines composant le réseau de Cloudflare. En arrivant sur les serveurs, le fichier s’est retrouvé trop gros par rapport à la mémoire pré-allouée par le système — en effet, Cloudflare, dans un souci d’optimisation permanente et de performance, cherche des réglages aussi fins que possible.
Une autre panne en parallèle, non liée, qui a fait croire à une attaque cyber
On pourrait se dire que, puisque le fichier de règles est re-généré toutes les cinq minutes, une nouvelle version valide aurait dû arriver rapidement, et ne causer une interruption que très brève, au lieu des trois heures de panne. Mais ce n’est pas ce qui s’est produit et les ingénieurs mobilisés ont mis une partie de l’après-midi à identifier ce qui n’allait pas.
« Nous avons résolu le problème en arrêtant la génération et la propagation du fichier défectueux et en insérant manuellement un fichier connu pour être valide dans la file d’attente de distribution des fichiers », a résumé Matthew Prince. « Nous avons ensuite forcé le redémarrage de notre proxy central. » Le classique débrancher-rebrancher, en plus technique.
Un incident simultané a nourri l’hypothèse d’une cyberattaque
Pour ne rien arranger, et qui a rajouté de la difficulté aux équipes techniques, Cloudflare a connu un incident en parallèle, qui n’était pas relié au problème du fichier. Il s’agissait d’une « bête » panne d’un outil de monitoring servant à afficher le statut des services Cloudflare, à travers un tableau de bord. C’est ce qu’explique encore le PDG de la société :
« La page d’état est hébergée entièrement en dehors de l’infrastructure de Cloudflare et ne dépend en rien de Cloudflare. Bien qu’il s’agisse en fin de compte d’une coïncidence, cela a conduit certains membres de l’équipe chargée de diagnostiquer le problème à penser qu’un pirate informatique ciblait à la fois nos systèmes et notre page d’état. »
La pire panne de Cloudflare depuis 2019
Une coïncidence malheureuse, en somme, qui n’a pas aidé à y voir clair dans cette situation de crise. Celle-ci aura duré de 12h28 (heure de Paris) à 15h30 pour la résolution centrale du souci, selon la chronologie donnée par la société. Mais tout ne sera vraiment remis sur pied qu’à 18h06. Soit entre 3 et 6 heures, selon le délai de rétablissement que l’on retient.
Cet incident restera dans l’histoire comme la « pire panne » de la société depuis 2019, a fait savoir Matthew Prince. Certes, il y a déjà eu des soucis sur le tableau de bord, ou des problèmes de réseau. « Mais au cours des 6 dernières années, nous n’avons pas connu d’autre panne qui ait empêché la majeure partie du trafic central de circuler sur notre réseau. »
Mais comme dit le proverbe, sept fois à terre, huit fois debout. Bien qu’elle ait été qualifiée « d’inacceptable » par le PDG de Cloudflare, cette panne hors norme est aussi un bon moyen d’engranger de l’expérience, et de faire mieux. D’ores et déjà, cette sortie de route a produit des effets positifs, car la société a pris des mesures pour augmenter sa résilience.
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.
Toute l'actu tech en un clin d'œil
Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !
Tous nos articles sont aussi sur notre profil Google : suivez-nous pour ne rien manquer !











