Connexion
Abonnez-vous

OVHcloud publie un premier bilan suite à l’incendie de ses datacenters à Strasbourg

OVHcloud publie un premier bilan suite à l'incendie de ses datacenters à Strasbourg

Le 11 mars 2021 à 08h54

Hier matin, on apprenait que SBG2 avait pris feu dans la nuit, au point d'être détruit. Il avait emporté avec lui une partie de SBG1. Un incident d'ampleur pour l'entreprise et ses clients, même s'il ne s'agit là que d'un des sites français du groupe. Une centaine de pompiers ont été mobilisés. Aucun blessé n'est à déplorer.

Comme à chaque événement de ce type, on a rapidement vu l'impact, avec de nombreux sites et services indisponibles. Certains sont vite revenus en ligne, comme celui de la plateforme open data du gouvernement. D'autres sont encore en panne, comme celui du CNNP qui, ironie de l'histoire, délivre les certifications APSAD.

D'autres ont simplement tout perdu, à l'image de Facepunch, éditeur du jeu Rust qui avait 25 de ses serveurs contenant la progression des joueurs dans les datacenters touchés. Aucune redondance ni sauvegarde n'avaient été mises en place, ils ont donc été remplacés.

De nombreuses questions se posent désormais sur ce qui a pu être à l'origine d'un tel incident, malgré les protections mises en place. Et bien que les experts en incendie poussent comme des champignons, notamment sur les réseaux sociaux, il faudra attendre les conclusions de l'enquête.

D'ici là, OVHcloud et ses clients vont être occupés à remettre en place leurs services. Dans une mise à jour publiée hier soir, la société a prévenu que les travaux nécessiteraient plusieurs semaines, avec un plan aux priorités établies.

Une communication détaillée avec une FAQ sera publiée dans la journée. Les sites de Gravelines et Roubaix sont mobilisés pour remettre en place les infrastructures perdues à Strasbourg avec des serveurs déjà en production. 10 000 nouveaux doivent être produits dans les semaines à venir.

L'équipe a accès au site depuis hier midi. Il doit désormais être sécurisé et nettoyé avant une remise en route, même pour les datacenters peu impactés (SBG3 et SBG4 sont saufs). SBG1 et SBG4 devraient revenir d'ici le 15 mars, SBG3 le 19 mars. Les services d'email de SBG2 étaient encore en cours de restauration hier soir.

OVHcloud invite ses clients à être méfiants avec les communications reçues par email, certains pouvant chercher à profiter de cette période pour envoyer des messages frauduleux. Il invite à suivre les publications de son site et de son compte Twitter.

Le 11 mars 2021 à 08h54

Commentaires (40)

Vous devez être abonné pour pouvoir commenter.

Abonnez-vous
votre avatar

“Et bien que les experts en incendie poussent comme des champignons, notamment sur les réseaux sociaux”



:mdr2:

votre avatar

Je me demande si la première version de la brève incluait aussi “et dans les commentaires des sites d’actualité informatique” à la suite de cette phrase ! :D

votre avatar

On reste un espace en ligne comme un autre, même si ces mécaniques sont surtout amplifiées par les médias dit sociaux by design. Ce qui se produit ailleurs se produit aussi ici, mais ce n’est pas exclusif à nous, donc il n’y a pas de raison d’auto-centrer la remarque :chinois:

votre avatar

Je comprends bien, l’effet Dunning-Kruger est un biais cognitif qui ne touche pas que les INpactiens. Mais on a quand même quelques beaux spécimens ici ! :transpi:

votre avatar

Commentaire à l’ironie cachée vraiment croustillante vu qu’il prétend connaître la supposée incompétence reprochée aux commentateurs qui n’ont fait, pour l’essentiel, qu’émettre des suppositions ou des évidences (sécurité incendie déficiente, ce qui est combustible prend feu, etc.).



On n’est jamais mieux servi que par soi-même je suppose. :roll:



Inclinons-nous quand même devant cette exemplaire auto attribution involontaire ! :incline:

votre avatar

Étant moi-même humain, il m’arrive d’être victime de ce biais cognitif. Comme nous tous. Mais oui, tu fais clairement partie de ceux que j’avais en tête en disant ça ! :smack:

votre avatar

C’est bien de l’admettre, d’autant que le commandant des opérations a reconnu (AFP) que « les planchers sont en bois, et le matériel informatique, bien chauffé ; ça va brûler », soit précisément ce qui a été (d)écrit dans l’autre fil.



Note aussi plus généralement que s’aventurer hors de son domaine de compétence conduit certes à faire des erreurs mais surtout à évoluer et ajouter à son stock de connaissances : attribuer un biais à ce processus est faire l’erreur fatale de confondre bilan et compte de résultats.

votre avatar

Tu apprends de tes erreurs. C’est bien. Je pense que je vais faire la même chose.

votre avatar

“De nombreuses questions se posent désormais sur ce qui a pu être à l’origine d’un tel incident, malgré les protections mises en place. Et bien que les experts en incendie poussent comme des champignons, notamment sur les réseaux sociaux, il faudra attendre les conclusions de l’enquête.”



Merci, j’ai ri… :mdr2:

votre avatar

c’est ce que j’ai pensé en lisant ça XD

votre avatar


“Et bien que les experts en incendie poussent comme des champignons, notamment sur les réseaux sociaux”



:mdr2:


+1, assez exaspérant de le constater.

votre avatar

D’après ce que j’ai lu, les serveurs de jeu RUST ne concernaient que des serveurs temporaires qui étaient remis à zéro tous les mois. Le backup n’était donc pas prévu par design.

votre avatar

(reply:1859945:da-PabOu)


Pourtant dans leur communications, il dise qu’il on perdu toute les données des joueurs de L’UE.

votre avatar

Oui, mais en soit « ce n’est pas grave » car tous les joueurs sont reset entièrement soit hebdo, soit bi hebdo, ou lors des mises à jour du jeu.
Y’a aucune progression comme un RPG sur Rust. Donc très concrètement, pour eux, mis à part réinstaller des serveurs ce n’est pas très grave…
Des jeux comme Ark c’est plus chiant parce qu’un serveur peut rester up 1 an sans reset et là ça fout la mort.
Pour Rust c’est qu’un « full wipe » en avance en somme.

votre avatar

Les serveurs jouables sont individuels, il y a simplement des serveurs officiels.

votre avatar

Hmmm. Entre ça et d’autres data-centers qui prennent l’eau… Y’aura de quoi plaisanter quand l’enquête conclura.



Aller… je mets un jeton sur l’incendie d’origine électrique.

votre avatar

cencore un Linky qui chauffe !

votre avatar

+1




(reply:1860047:prog-amateur)


Plein, ca dépends quel prix on souhaite mettre




(reply:1860135:prog-amateur)


Il y a plusieurs types de détecteurs d’incendie : Température, fumée (optique), infrarouge (feu), gaz, etc. Chacun peuvent intervenir à un moment différent de l’incendie. Mais sans mesures permettant de retarder l’incendie, et sans mesure d’extinction, cela ne ressemblera qu’à un passager du Titanic voguant sur un canot de sauvetage et regardant désespérément sombrer le navire.

votre avatar

Merci pour vos retours, c’est très enrichissant pour moi qui ne suis pas un expert du domaine.

votre avatar

Bonjour, existe-t-il des matériaux/pièces à “retardement” d’incendie dans les datacenters ? merci

votre avatar

Ca n’arriverait pas avec des datacenters submergés :D :p ->[]

votre avatar

(quote:1860047:prog-amateur)
Bonjour, existe-t-il des matériaux/pièces à “retardement” d’incendie dans les datacenters ? merci
A minima ce genre de gaz https://www.journaldunet.com/solutions/cloud-computing/1178315-dans-les-coulisses-du-data-center-de-la-francaise-des-jeux/1178585-systeme-anti-incendie
Pour les matériaux je ne sais pas


votre avatar

(quote:1860047:prog-amateur)
Bonjour, existe-t-il des matériaux/pièces à “retardement” d’incendie dans les datacenters ? merci


Comme te l’a dit “Billylebegue”. Il y a les gaz (ce bon vieux FM200 qu’on ne devrait plus vraiment retrouver de nos jours… ). Ce sont des dispositifs “déclenchés”. Donc sur alarme d’un capteur.



Aller… un complément avant que tu ne pose la question suivante.



En fait c’est pas vraiment la peine parce que ce sont les serveurs les plus dangereux et fragiles. Dans les DataCenter c’est principalement :




  • des murs (parpaing / béton, et pas vraiment de BA10, BA13)

  • des aérations (pour le refroidissement) ce qui parfois favorise les incendies puisque cela apporte de l’oxygène en masse.

  • du métal (serveur, baie, goulottes, support plancher)

  • du plastique, tout ce qui est flexible (câbles, ou passe câble)

  • Parfois du verre pour les portes de baies mais c’est passé de mode.

  • Un peu de bois pour le fameux plancher technique (mais il est bien évidement traité et t’auras plus de mal à l’allumer que d’allumer une taule d’acier).



Maintenant il peut y avoir un incendie quand même du fait de la présence d’électricité (the famous “triphasé”). Éventuellement sur un défaut de climatisation qui ferait accumuler de la chaleur jusqu’à mise hors service automatique ou feu si défaillance. Mais ce qui prends feu ce ne sont pas les infrastructures inertes. Ce sont les équipements électriques et les serveurs.



Bref Tout est normé et on ne peut pas faire de DataCenter à moitié. Mais même avec toutes ces précautions il peut arriver des accidents/défaillances.



Ex: Un grand coup de bourre sur le réseau électrique et le panneau de distribution crame et ne fait plus office de bouclier pour ce qui est derrière. Les serveurs crament. Ca prends 3 secondes.

votre avatar

Et tu as oublié un petit truc croustillant sur le triphasé : Une phase mal serrée sur l’arrivée du triphasé, HOP un arc électrique se forme, et on se retrouve avec du 380V dans les lignes en 220V. Les équipements encaissent (surprenant), surchauffent tant qu’à faire (surtout les alims et leurs charmants condensateurs prêts à exploser), et quand ca décide de péter, autant dire c’est d’une fulgurance mémorable… :roll:

votre avatar

Ah ça, mon père électricien en sait quelque chose ! Cela s’était produit dans une usine, les dégâts ont été conséquents.

votre avatar

(reply:1860047:prog-amateur)


Pas que dans ce genre de structure, ne serait-ce qu’un parking couvert/enterré les plafonds et murs ont un béton et des matériaux prévus pour retarder le plus possible la propagation de l’incendie dans le cas où un véhicule prendrait feu.



C’est pas miraculeux non plus, mais ça peut permettre à la structure de tenir le temps que les pompiers arrivent.

votre avatar

Merci à vous (l’article sur la FDJ est intéressant). Oui mon idée était bien de retarder l’incendie le temps de l’arrivée des pompiers. Y aurait peut-être aussi un truc à faire avec des capteurs de température (genre un bond anormal, bien au dessus de ce que pourrait dégager un serveur par exemple), bref à explorer.

votre avatar

On a des experts dans les commentaires de Next inpact. Et j’en fais partie, la preuve : le béton est conducteur de chaleur (la chaleur est l’un des trois éléments d’un incendie). Et je dirais aussi, les équipements électroniques sont composés de … ? plastique (comburant) et de métal (chaleur).



Le bois traité n’est pas plus comburant que le béton. C’est même plus isolant contre les incendies.



Voilà ma pierre aux commérages du web 2.0 #incendie #OVHcloud

votre avatar

A part des serveurs de jeux vidéo (c’est triste pour eux mais bon, on s’en fout) il n’y a rien de plus grave sur les 29000 serveurs partis en fumée ? C’est confidentiel ou on pourra avoir une liste exhaustive des pertes ?

votre avatar

Exhaustive, sérieusement ? Tu pars du principe que tous les possesseurs de serveurs qui ont été concernés sont prêts à l’annoncer publiquement, c’est peut-être un peu trop utopiste :transpi:

votre avatar

J’ai vu météociel.fr, jusqu’il y a peu, c’était une page 404

votre avatar

Oui météociel a annoncé sur les réseaux sociaux depuis hier leur black out

votre avatar

Nouveau bilan
twitter.com Twitter

votre avatar

Pour les curieux, voici un enregistrement de température d’un des serveurs (température CPU, j’imagine) : twitter.com Twitter



C’est assez glauque, mais montre bien ce qui s’est passé. Après il n’y a plus eu de données car les transmissions ont été coupées : se serveur s’en est allé dans le cloud… :D

votre avatar

(quote:1860200:le hollandais volant)
Pour les curieux, voici un enregistrement de température d’un des serveurs (température CPU, j’imagine) : https://twitter.com/_Skunnyk_/status/1369638092810895366/photo/1



C’est assez glauque, mais montre bien ce qui s’est passé. Après il n’y a plus eu de données car les transmissions ont été coupées : se serveur s’en est allé dans le cloud… :D


Du coup, on peut conclure que tout a cramé en 1h environ, largement de quoi faire un backup déclenché automatiquement lorsque la température augmente :)

votre avatar

Kwacep a dit:


J’ai vu météociel.fr, jusqu’il y a peu, c’était une page 404


Meteociel, ce n’est pas une perte si le site ne fonctionne plus. Les mecs se prennent pour des dieux vivants, alors que quand ils ont raison sur le temps c’est qu’ils ne l’ont vraiment pas fait exprès…

votre avatar

Je ne sais même pas qui ils sont

votre avatar

Pour faire simple, c’est un gars de formation comptable, qui s’intéressait à la météo. il a fait un site “Météo” qui se basait originellement sur des stations météo amateur, sinon tout le reste ils le piquent à MétéoFrance et autres. Ce site à eu du succès, et du coup il a pris le melon.



Ce qui me fait rire, c’est que Meteociel est une société SASU enregistré sous le NAF Programmation informatique (6201Z) ce qui n’à rien à voir avec la météo :mdr2:

votre avatar

“D’autres sont encore en panne, comme celui du CNNP qui, ironie de l’histoire, délivre les certifications APSAD.”



:mdr2:

votre avatar

plop97 a dit:


Je ne sais même pas qui ils sont


Selon certaines sources non officielles, ils seraient météorologues et concurrents de Meteo France. Dans les faits, ils sont plus proches de la divination à moitié foireuse..

OVHcloud publie un premier bilan suite à l’incendie de ses datacenters à Strasbourg

Fermer