Toutes nos excuses pour l’interruption de programme bien indépendante de notre volonté, tout cet après-midi. C’est l’été, la canicule s’installe progressivement sur l’hexagone, et il n’y a pas que nous les humains à souffrir de la chaleur pendant que l’on regarde les coureurs du Tour de France se mettre en danseuse pour escalader l’Alpe d’Huez. Les machines aussi souffrent, et parfois elles s’organisent sans prévenir pour avoir moins chaud. C’est le cas de nos serveurs, qui ont décidé juste après l’apéritif de s’offrir une petite douche de liquide de refroidissement.

Notre hébergeur OVH l’explique mieux que nous dans ce message reçu avant que les serveurs ne prennent leur serviette pour s’essuyer :

« Une erreur humaine est à l’origine du probleme. Des travaux d’ajout de nouvelles clims sont en cours dans la salle 1. Apparament l’un de nouveau circuit de refroidissement d’une nouvelle clim a été alimentée alors qu’il n’a pas été fini !? Et le liquide de refroidissement a aspergé 4 baies HG à certains endroits.

Nous avons dû sortir les serveurs de baies et nous sommes en train de les verifier un par un. Puis changer les pieces en cas de probleme.

Il faut compter entre 10 minutes à 8 heures pour le retablissement complet de tous les serveurs. Toutes nos équipes sont en alerte et aident dans le datacentre, mais le debugage de certains serveurs est long.

On retablit la situation puis on va chercher l’origine de probleme. »

On connaît un stagiaire qui va passer l’été au frais…


Abonnez-vous gratuitement à Artificielles, notre newsletter sur l’IA, conçue par des IA, vérifiée par Numerama !