Après une matinée catastrophique, l'hébergeur français OVH tire un bilan du double incident exceptionnellement rare qui a mis de nombreux sites hors ligne.

Vous l’avez peut-être constaté si vous êtes client d’OVH ou si vous fréquentez l’un des nombreux sites hébergés sur les serveurs de l’entreprise française : pendant une bonne partie de la matinée du jeudi 9 novembre, il était impossible de joindre certains espaces, dont BFM Business ou Cozy Cloud. La raison ? L’hébergeur a eu le malheur d’être la victime d’un double incident.

À l’heure où nous écrivons ces lignes, la situation est en passe d’être complètement rétablie. D’après un message de service publié peu avant 13h, il restait encore toutefois à remettre en ligne les services de clients hébergés dans l’un des centres de données de Strasbourg. À Roubaix, l’autre incident est considéré comme terminé par les équipes techniques.

Mais alors que l’entreprise dit être « en train de récupérer les détails pour fournir les informations sur le temps de rétablissement à Strasbourg de tous les services et de tous les clients », Octave Klaba, le fondateur et patron d’OVH, a tenu à tirer un premier bilan des deux pannes, dont l’occurrence est normalement très rare, ce qui surprend d’autant plus lorsqu’elles surviennent en même temps.

Crédits : OVH

La situation à Strasbourg

Concernant l’incident survenu à Strasbourg, il est d’origine électrique. On apprenait dans la matinée que les deux arrivées électriques sont devenues soudainement inopérantes et les deux groupes électrogènes n’ont pas fonctionné. Du coup, la salle de routage n’était plus alimentée. À ce stade, nous ne connaissons pas les raisons ayant causé la chute électrique de ce centre de données.

« L’alimentation a été rétablie et les services sont en cours de redémarrage. Certains clients sont remis en ligne et d’autres pas encore. Si votre service n’est pas encore remis en ligne, le délai de rétablissement est compris entre 5 minutes et 3-4 heures. Notre système de suivi nous permet de savoir quel client est encore impacté et nous nous efforçons de les rétablir  », commente le groupe.

Un compte-rendu technique est disponible sur le site d’OVH.

reseau-internet-de-cix
Crédits : DE-CIX

La situation à Roubaix

Du côté de Roubaix, «  c’est un problème sur le réseau optique » qui a causé du souci aux équipes d’OVH. « L’origine du problème est un bug logiciel sur les équipements optiques qui a provoqué la perte de la configuration et la coupure de la connexion avec notre site de Roubaix […]. Avec le constructeur, nous cherchons l’origine du bug logiciel et comment ne plus subir ce genre d’incident critique », écrit le groupe

Cette liaison de fibre optique sert à connecter le centre de données de Roubaix avec les points d’interconnexion que l’hébergeur a en Europe, à savoir Amsterdam, Bruxelles, Francfort, Londres et Paris. Des précisions techniques sur le cas roubaisien sont données dans un message de service dédié. Quoiqu’il en soit, « le centre de données est à nouveau joignable ».

Les centres de données d’OVH.

Quelle ampleur pour ces incidents ?

Il est pour l’instant difficile de déterminer l’ampleur du double incident qui a frappé OVH. Selon OVH, les deux évènements « simultanés et indépendants » se sont déroulés entre 8h15 et 10h37 pour Roubaix et 7h15 et 11h15 pour Strasbourg. Mais cela n’inclut pas le temps qu’il a fallu pour relancer la machine et assurer un retour à la normale pour les clients — retour à la normale toujours en cours.

Les deux pannes ont en tout cas eu le mérite d’être une piqûre de rappel concernant le poids qu’a pris OVH ces dernières années dans le domaine de l’hébergement web. L’entreprise revendique en effet 1,3 million  de clients dans le monde, qu’elle héberge sur 300 00 serveurs répartis dans 27 centres de données situés dans 19 États. En Europe, OVH déclare être le numéro un.

Outre les milliers de sites de particuliers, OVH assure aussi l’hébergement de 14 des 40 sociétés cotées sur le CAC 40, 35 des 100 premiers sites  e-commerce français, 28 des 50plus grosses sociétés IT françaises, 155 des 1 000 plus grands groupes européens et 20 des 500 plus grands groupes mondiaux. Autant de sites qui ne peuvent guère se permettre d’être indisponibles, même quelques instants.

Parmi elles, citons CGI, Élysée.fr, Michelin, NextRadioTV, NRJ, So Foot, Twenga, Centre Pompidou, Trainline, Notez qu’il ne s’agit pas de dire que les espaces de ces médias, entreprises ou institutions étaient affectés par le problème de ce matin mais de montrer que la compagnie s’occupe aussi d’espaces de toute première importance

Partager sur les réseaux sociaux