Pannes chez OVH : tous les services sont de retour
Le 13 novembre 2017 à 09h35
1 min
Internet
Internet
La semaine dernière, OVH rencontrait une série de problèmes dans ses centres de données de Roubaix et Strasbourg, touchant un nombre important de clients. Octave Klaba a rapidement communiqué sur le sujet de manière détaillée sur Twitter, en complément du service de suivi des travaux, dès qu'il a été à nouveau opérationnel.
Si une grosse partie des serveurs était de retour dans la journée, ce ne fut pas le cas de tous les services, notamment en raison de pannes matérielles. Samedi, les instances Public cloud et les VPS étaient de retour. Ce matin, on apprenait que les derniers serveurs concernés avaient été remplacés. Les équipes travaillent désormais à la reconstitution des stocks, au nettoyage, etc.
C'est désormais la question de l'indemnisation qui va se poser, une panne chez OVH ayant parfois des effets inattendus. La société a indiqué qu'une fois l'incident clos elle appliquera « les SLA prévus dans nos contrats ». Il faudra voir si l'hébergeur contacte directement ses clients ou si celui-ci doit effectuer une demande. Nous tenterons d'en savoir plus rapidement.
Le 13 novembre 2017 à 09h35
Commentaires (10)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousLe 13/11/2017 à 10h30
Pour ceux qui veulent tous les détails de strasbourg sont là :
http://travaux.ovh.net/?do=details&id=28247&PHPSESSID=8020432fe3…
J’ai plus le lien pour le détail de roubaix (y a une tache sur le site)
Le 13/11/2017 à 12h22
Sacré communication, j’étais passé à coté ! Merci pour le lien " />
Le 13/11/2017 à 13h37
Le lien pour l’incident de Roubaix :http://travaux.ovh.net/?do=details&id=28244
La conclusion étant “Nous on met aussi souvent à jours nos noeux de réseaux que Equifax ses firewalls !” " />
Le 13/11/2017 à 13h45
Yep merci pour le lien ^^ j’avais la flemme de rechercher " />
En tout cas c’est sur que ça fait pas pro. Je sais que c’est l’horreur de suivre toutes les MAJ Soft et Hard sur leurs équipements mais là ils ont pris une grosse claque de rappel.
La conclusion pour Strasbourg c’est aussi pas mal “à l’avenir, un site prototype restera un site prototype, on mélange pas les test avec la prod”
(Pour connaître les équipes d’Electricité de Strasbourg c’est pas des champions… Franchement ça vaut pas Enedis, ils ont aussi une responsabilités)
Le 13/11/2017 à 13h53
Mouais, EDS a sans doute vendu un ligne à SLA de 99%, et ils vont la tenir. C’est OVH qui a besoin d’une alimentation à 99,99%, le métier du hosting est très particulier et on ne peut pas demander aux fournisseurs d’énergie de s’y adapter, eux leur coeurs de métier c’est des industriels pour qui 99% c’est largement suffisant. Sans compter qu’on ne connait pas la cause de rupture d’une des deux lignes, si c’est un de ces classiques “coup de pelleteuse”, ils n’y sont pour strictement rien !
Le 13/11/2017 à 14h14
Quand tu met 2 lignes à mon sens c’est sous entendu que si une se coupe le circuit se reconfigure…
Je suis d’accord avec toi ils sont sérieusement en dilettante je trouve …. Suffit de regarder sur lafibre.info la très bonne présentation du DC3 d’Iliad/Online et ses 6 groupes électrogènes qui le certifient Tier III
https://lafibre.info/online/dc3-iliad/
Car là ça fait vraiment pas propre chez OVH, ils tentent de réinventer le métier, mais pour le réinventer il faut déjà le maîtriser à plein :/
Le 13/11/2017 à 14h24
Le 13/11/2017 à 14h32
Le 13/11/2017 à 14h53
Sur lafibre.info ils en parlent justement ^^
https://lafibre.info/ovh-datacenter/sites-ovh-quasi-inacessibles-depuis-orange/
Leur système était sous dimensionné, mais c’était du style “on serre les fesses le temps de déployer le reste du bordel, avec du bol ça va le faire”
C’est sur que d’autres on eu des soucis d’automates comme tu dis, après je comprend mal la non redondance d’un équipement pareil.
Coupure à t0
t1 passage sur onduleur
t2 démarrage et stabilisation des groupes
t3 passage sur les groupes
Si passage non effectifs soit :
t4 intervention manuelle (mais vu les tension faut une formation spécifique)
ou
t4 essai avec automate 2
Sachant que 2 groupes elecs sur une seule boucle ça me semble light aussi. Normalement si tu fais du N+1 tu as 2x2 groupes. Tu démarre tout à t2 et tu arrête ta boucle de secours si les premiers groupes supportent la charge.
Le 13/11/2017 à 15h30
C’est donc pour ça que je n’arrive plus à accéder à un site hébergé chez OVH depuis jeudi dernier… mais bizarrement il n’est toujours pas revenu… j’ai visiblement raté la news de jeudi.
Au début j’avais connexion échoué (firefox) sans doute la panne de courant. Puis quelques heures plus tard, un 502 bad gateway qui est toujours là…
Soit les responsables du site ne savent pas quoi faire, soit le site a été perdu pour de bon " />