Connexion
Abonnez-vous

Pannes chez OVH : tous les services sont de retour

Pannes chez OVH : tous les services sont de retour

Le 13 novembre 2017 à 09h35

La semaine dernière, OVH rencontrait une série de problèmes dans ses centres de données de Roubaix et Strasbourg, touchant un nombre important de clients. Octave Klaba a rapidement communiqué sur le sujet de manière détaillée sur Twitter, en complément du service de suivi des travaux, dès qu'il a été à nouveau opérationnel.

Si une grosse partie des serveurs était de retour dans la journée, ce ne fut pas le cas de tous les services, notamment en raison de pannes matérielles. Samedi, les instances Public cloud et les VPS étaient de retour. Ce matin, on apprenait que les derniers serveurs concernés avaient été remplacés. Les équipes travaillent désormais à la reconstitution des stocks, au nettoyage, etc.

C'est désormais la question de l'indemnisation qui va se poser, une panne chez OVH ayant parfois des effets inattendus. La société a indiqué qu'une fois l'incident clos elle appliquera « les SLA prévus dans nos contrats ». Il faudra voir si l'hébergeur contacte directement ses clients ou si celui-ci doit effectuer une demande. Nous tenterons d'en savoir plus rapidement.

Le 13 novembre 2017 à 09h35

Commentaires (10)

Vous devez être abonné pour pouvoir commenter.

Abonnez-vous
votre avatar

Pour ceux qui veulent tous les détails de strasbourg sont là :

http://travaux.ovh.net/?do=details&id=28247&PHPSESSID=8020432fe3…



J’ai plus le lien pour le détail de roubaix (y a une tache sur le site)

votre avatar

Sacré communication, j’étais passé à coté ! Merci pour le lien <img data-src=" />

votre avatar

Le lien pour l’incident de Roubaix :http://travaux.ovh.net/?do=details&id=28244



La conclusion étant “Nous on met aussi souvent à jours nos noeux de réseaux que Equifax ses firewalls !” <img data-src=" />

votre avatar

Yep merci pour le lien ^^ j’avais la flemme de rechercher <img data-src=" />



En tout cas c’est sur que ça fait pas pro. Je sais que c’est l’horreur de suivre toutes les MAJ Soft et Hard sur leurs équipements mais là ils ont pris une grosse claque de rappel.



La conclusion pour Strasbourg c’est aussi pas mal “à l’avenir, un site prototype restera un site prototype, on mélange pas les test avec la prod”

(Pour connaître les équipes d’Electricité de Strasbourg c’est pas des champions… Franchement ça vaut pas Enedis, ils ont aussi une responsabilités)

votre avatar

Mouais, EDS a sans doute vendu un ligne à SLA de 99%, et ils vont la tenir. C’est OVH qui a besoin d’une alimentation à 99,99%, le métier du hosting est très particulier et on ne peut pas demander aux fournisseurs d’énergie de s’y adapter, eux leur coeurs de métier c’est des industriels pour qui 99% c’est largement suffisant. Sans compter qu’on ne connait pas la cause de rupture d’une des deux lignes, si c’est un de ces classiques “coup de pelleteuse”, ils n’y sont pour strictement rien !




 Ici OVH fait son méa culpa en disant "on aurait du en avoir 2", c'est bien gentil mais même ça c'est critiquable, les DC qui ont 3 alimentations distinctes ou plus ne sont pas rare, et pour certains 4 est le minimum avant de mettre un DC en prod. Là ils l'ont fait avec une seule et unique alimentation : dans le métier on appel ça du foutage de gueule.
votre avatar

Quand tu met 2 lignes à mon sens c’est sous entendu que si une se coupe le circuit se reconfigure…



Je suis d’accord avec toi ils sont sérieusement en dilettante je trouve …. Suffit de regarder sur lafibre.info la très bonne présentation du DC3 d’Iliad/Online et ses 6 groupes électrogènes qui le certifient Tier III

https://lafibre.info/online/dc3-iliad/



Car là ça fait vraiment pas propre chez OVH, ils tentent de réinventer le métier, mais pour le réinventer il faut déjà le maîtriser à plein :/

votre avatar







secouss a écrit :



Quand tu met 2 lignes à mon sens c’est sous entendu que si une se coupe le circuit se reconfigure…



&nbsp;



 Avec une seule ligne, le site s'est retrouvé en sous-tension (car moitié moins d'intensité dispo), ce qui a fait sauter le disjoncteur (sinon c'est toutes les alimentation qui auraient grillés...). Il aurait fallut que OVH prépare le coup et fasse un arrêt partiel automatique dans les différents DCs relié à cette alimentation (plusieurs DCs... une seule alimentation... Oh mon dieu le bordel, comment ils ont pensé que c'était une bonne idée quand ils ont tiré les câbles chez OVH ?!) pour équilibrer la consommation avec la fourniture, sauf que c'est pas vraiment une bonne solution, comparé à celles des groupes électrogènes, qui n'ont malheureusement pas pu se mettre en ligne à cause de leur automate défaillant.       






 Sachant que c'est pas la première fois qu'ils ont un problème d'automate, y s'en on eu un autre y a quelques années si je me souviens bien ^^

votre avatar







secouss a écrit :



Car là ça fait vraiment pas propre chez OVH, ils tentent de réinventer le métier, mais pour le réinventer il faut déjà le maîtriser à plein :/





Pécher par excès d’orgueil c’est la norme de nos jours. Et on couvre ça avec des “ouais mais c’est bien d’échouer, ça nous permet d’apprendre de nos erreurs, c’est comme ça qu’on avance, nous illettrés qui n’avons jamais appris à lire !”.



Comme disait l’autre (me souvient plus de l’auteur ^^) “Les fous apprennent de leurs erreurs, les sages de l’histoire”.


votre avatar

Sur lafibre.info ils en parlent justement ^^



https://lafibre.info/ovh-datacenter/sites-ovh-quasi-inacessibles-depuis-orange/



Leur système était sous dimensionné, mais c’était du style “on serre les fesses le temps de déployer le reste du bordel, avec du bol ça va le faire”



C’est sur que d’autres on eu des soucis d’automates comme tu dis, après je comprend mal la non redondance d’un équipement pareil.

Coupure à t0

t1 passage sur onduleur

t2 démarrage et stabilisation des groupes

t3 passage sur les groupes



&nbsp;Si passage non effectifs soit :

t4 intervention manuelle (mais vu les tension faut une formation spécifique)

ou

t4 essai avec automate 2



Sachant que 2 groupes elecs sur une seule boucle ça me semble light aussi. Normalement si tu fais du N+1 tu as 2x2 groupes. Tu démarre tout à t2 et tu arrête ta boucle de secours si les premiers groupes supportent la charge.

votre avatar

C’est donc pour ça que je n’arrive plus à accéder à un site hébergé chez OVH depuis jeudi dernier… mais bizarrement il n’est toujours pas revenu… j’ai visiblement raté la news de jeudi.



Au début j’avais connexion échoué (firefox) sans doute la panne de courant. Puis quelques heures plus tard, un 502 bad gateway qui est toujours là…



Soit les responsables du site ne savent pas quoi faire, soit le site a été perdu pour de bon <img data-src=" />

Pannes chez OVH : tous les services sont de retour

Fermer