OVH a rencontré « un incident de l'infrastructure »

OVH a rencontré « un incident de l’infrastructure »

OVH a rencontré « un incident de l'infrastructure »

Les premiers messages sont apparus hier en fin d’après midi. « Les investigations sont en cours, nos équipes techniques travaillent à rétablir la situation dans les meilleurs délais », expliquait le support de l’hébergeur sur Twitter. Un ticket d’incident était ouvert dans la foulée.

À 18h15, la société annonce qu’un « incident de l'infrastructure est avéré » et qu’il « n'a pas de lien avec des éléments externes ». En clair, ce n’est pas une cyberattaque. 10 minutes plus tard, un retour à la normale progressif est annoncé : « Les services se rétablissent graduellement suite à l'isolation d'une infrastructure réseau défectueuse. Nous continuons de nous assurer du rétablissement des services ».

OVH précise que le problème impacte principalement le datacenter de Roubaix, avec des répercussions sur le trafic backbone (lire nos explications).

« Actuellement le fonctionnement de notre réseau est revenu à la normale », affirme OVH à 19h. La société ajoute avoir effectué un retour « auprès du constructeur avec la plus haute sévérité ». 

Il est 19h22 lorsque OVH annonce que « tous les services semblent maintenant être restaurés » et que ses équipes « travaillent maintenant à assurer la récupération complète ». L’origine de cet incident sera communiquée dans un second temps.

Peu avant 20h, le fabricant de l’équipement incriminé confirme le diagnostic, OVH réactive graduellement dans la foulée les liens de son infrastructure qui avaient été totalement isolés. L’opération se termine aux alentours de 23h.

« La situation est donc normalisée et l'ensemble de la capacité est de nouveau complètement disponible », affirmait alors l’hébergeur. Généralement actif pour tenir informé ses clients en cas de problème Octave Klaba est cette fois-ci resté silencieux sur Twitter.

On attend maintenant un post-mortem détaillé, comme l’hébergeur a déjà su le faire par le passé lorsque pas moins de 50 000 sites mutualisés ont connu des soucis.

Commentaires (15)


ah effectivement j’avais eu des soucis de connexion, ca explique beaucoup de choses..


Yep, Slack s’est mis en mode jingle bells entre les alertes Datadog ou Prometheus (suivant mes clients). Et après c’est le téléphone qui a continué 😂 (en mode « c’est pas nous c’est OVH »)



Perso je commence toujours par vérifier sur travaux.ovh.net quand j’ai des alertes avant de regarder si ça vient de moi.



Et là le site n’était même pas accessible !


On devient tellement dépendant qu’une heure de coupures/lenteurs et c’est la panique générale !



Ça marche pas, on réessaye un peu plus tard et puis voilà ;)

C’est en tout cas ce que je répond à mes clients dans ce genre de cas ;)


Dans le ticket :

http://travaux.ovh.net/?do=details&id=43793



“Nous allons prévoir le remplacement du composant isolé sous 72h afin de nous permettre de continuer le diagnostique de l’incident de ce jour.”



Visiblement une panne matérielle?


Tout dépend de la criticité applicative de ce qui est hébergé. Certains peuvent relativiser, d’autres moins quand ça bloque le travail de dizaines de personnes.


ça arrive tout de même de plus en plus chez OVH. Il y a quelques mois c’était les emails qui étaient inaccessibles. Un autre incident du même genre sur les sites hébergés. Plus le fameux incident du datacenter avec tous les serveurs inaccessibles pendant une journée ou plus. J’ai l’impression qu’il a de grosses pannes de ce genre assez régulièrement


En discutant avec un confrère, je dis “OVH c’est fiable quand même, quoique…”

Là je m’interromps en cherchant mes mots et il répond “ouais c’est fiable mais pas robuste” (ou l’inverse, je me rappelle plus).

On a tous les deux éclaté de rire.


Hier vers 17h et quelques minutes j’ai eu une coupure brutale d’une prise en main à distance (qui passe par un VPN d’un Serveur dédié OVH), j’ai mis un peu de temps à comprendre ce qu’il se passait, le temps que le VPN se coupe tout seul et la prise en main passe en direct sans VPN (merci AnyDesk, ouf).



En plus parallèlement j’essayais de me connecter à un autre PC en direct sur IP et port sur une autre connexion Internet (OVH ADSL cette fois), et idem, mais je n’ai fait le lien que plus tard, au début je croyais à une coupure de courant sur le site distant <img data-src=" />


on connais la marque du matos chez OVH qui est tombé en panne ?








ashlol a écrit :



on connais la marque du matos chez OVH qui est tombé en panne ?





Je pense que le fait qu’on la connaisse ou non sera fonction de la ristourne accordée&nbsp;<img data-src=" />



Je suis bien tombé mon cloud et ma visio n’ont pas été INpactés, mais si ça doit arriver, je pense que je vais me prendre…








BurritoBob a écrit :



ça arrive tout de même de plus en plus chez OVH. Il y a quelques mois c’était les emails qui étaient inaccessibles. Un autre incident du même genre sur les sites hébergés. Plus le fameux incident du datacenter avec tous les serveurs inaccessibles pendant une journée ou plus. J’ai l’impression qu’il a de grosses pannes de ce genre assez régulièrement





Ils font de plus en plus de choses, sont de plus en plus gros, donc ont de plus en plus d’incidents….



Les pannes sont inévitables. La compétence à les résoudre est là et c’est bien l’essentiel ^^



Perso j’ai eu de la chance aussi parce que mon serveur est à Strasbourg.








patos a écrit :



&nbsp;Les pannes sont inévitables. La compétence à les résoudre est là et c’est bien l’essentiel ^^





Oui, les pannes sont résolues assez rapidement. Ils ont aussi bien amélioré le temps de réponse de leur SAV (qui étaient devenu catastrophique, genre 10 jours pour répondre à un ticket et une réponse en copier/coller). Mais globalement pour plus de réactivité, il vaut mieux passer par leur forum. Les admins sont beaucoup plus rapides.



(Commentaire supprimé, désolé)


Fermer