Il y a quelques jours, une panne géante frappait internet. Victime d’un bug, l’entreprise Fastly a embarqué dans sa chute de très nombreux site internet d’ampleur. Mais qui est Fastly exactement ? Et comment l’entreprise a pu mettre à genoux une partie du web ?

Mardi 8 juin vers midi, une importante partie du web était inaccessible. Twitch, Reddit, le site du Monde.fr, tous semblaient touchés par une étrange panne et les internautes voulant y accéder étaient confrontés à une erreur 503.

Très rapidement, le coupable de cette panne a été identifié : une discrète entreprise nommée Fastly. Quasi-inconnue du grand public, Fastly est pourtant l’un des maillons essentiels du web, c’est un CDN (pour Content Delivery Network ou réseaux de diffusion de contenu en français). D’accord, mais c’est quoi un CDN, exactement ?

Des serveurs chauds près de chez vous

Dans son sens le plus strict, un CDN est un ensemble de serveurs localisé un peu partout dans le monde, qui a pour objectif de vous servir le contenu que vous souhaitez consulter le plus rapidement possible.

Les CDN n’hébergent pas à proprement parler des pages web, mais ils gardent une partie de leurs contenus en cache afin d’améliorer les performances d’un site. Ainsi, si je souhaite me connecter au site Reddit par exemple, il y a fort à parier que mon ordinateur n’ira pas se connecter à un serveur outre-Atlantique, mais plutôt à un des serveurs de Fastly qui sera géographiquement plus proches de moi.

Illustration d’une architecture sans (gauche) et avec CDN (droite) // Source : Kanoha – CC BY-SA 3.0

Car Internet a beau être rapide, même un octet met plus de temps pour traverser l’atlantique que pour aller à côté de chez lui. Cela se mesure en milliseconde, mais avec un haut volume de données, cela peut rapidement poser un problème. C’est pour cela que de très nombreux sites utilisent les services de Fastly. D’autres utilisent CloudFlare ou Akamai qui sont des CDN un peu plus connus.

Un seul client responsable

Ces trois géants discrets de l’Internet s’occupent donc de diriger une énorme partie du trafic, et quand l’un est en panne, c’est des pans entiers du web qui tombent. Dans le cas de Fastly, l’histoire est d’autant plus rocambolesque que la panne est intervenue après une manipulation opérée par… un seul de leurs clients. « Tôt le 8 juin, un client a effectué un changement de configuration valide qui incluait les circonstances spécifiques qui ont mené au bug, ce qui a provoqué des erreurs sur 85 % de notre réseau », a expliqué l’entreprise dans un billet de blog. Des dizaines de sites majeurs sont tombés partout dans le monde, à cause de quelques clics effectués par un responsable informatique quelque part sur le globe.

Cet incident illustre parfaitement bien le redouté principe informatique de point de défaillance unique (single point of failure ou SPOF en anglais). En se rendant dépendant d’un seul acteur pour délivrer du contenu pour des dizaines ou des centaines de sites, on s’expose mécaniquement à des problèmes lorsque ce dernier faillit. Dans un monde idéal, chaque site aurait une solution de secours et se reposerait par exemple sur plusieurs fournisseurs de CDN pour éviter ce genre de soucis, mais peu d’entreprises ont les moyens de faire ça.

L’explosion du trafic Internet et la demande pour un Internet toujours plus rapide ont énormément renforcé les fournisseurs de CDN qui sont devenus des centres névralgiques de l’Internet mondial. Pour le meilleur et pour le pire.

Partager sur les réseaux sociaux

La suite en vidéo