Une panne entre Orange et Level 3 a affecté l’accès à certains sites, le problème est réglé
Down with the sickness
Le 15 novembre 2017 à 11h38
2 min
Internet
Internet
Ce matin, l'interconnexion entre l'opérateur de transit Level 3 et OpenTransit, dont dépend pour bonne part Orange France, aurait subit « un incident BGP ». L'opérateur de transit Level 3 n'est plus en mesure d'envoyer son trafic vers le FAI. Désormais, tout est rentré dans l'ordre.
Dès 8h20, des clients d'Orange se sont plaints de difficultés à accéder à certains sites, notamment outre-Atlantique. Selon nos informations, il s'agissait d'un incident BGP entre Level 3 (AS3356) et OpenTransit (AS5511), le transitaire international d'Orange France (AS3215). Dans la matinée, certains évoquaient un problème avec un routeur chez un prestataire tiers.
Le trafic descendant vers OpenTransit aurait donc été coupé. Le FAI, qui en est dépendant, avait ainsi des difficultés à recevoir le trafic passant par l'opérateur de transit américain. Sur Twitter, un spécialiste recommande de contourner OpenTransit pour rétablir l'accès d'un site aux clients Orange.
Après plusieurs remontées sur Twitter, transmises au service d'enquête, le compte Twitter Orange Conseil a confirmé la nature des soucis peu après midi. « Nos clients ont pu rencontrer depuis ce matin des difficultés pour se connecter à certains sites internet. Toutes nos équipes étaient mobilisées pour rétablir rapidement le service. Le service est désormais rétabli » vient de nous répondre officiellement le service presse de l'opérateur historique.
Une surveillance va être mise en place pour la journée afin de vérifier que tout va bien.
Commentaires (42)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousLe 15/11/2017 à 11h41
Impossible de joindre les sites de Radio France ce matin, c’était peut-être dû à ça !
Le 15/11/2017 à 11h43
Effectivement, j’avais constaté des problème sur plusieurs sites, mais je n’ai pas eu le réflexe Twitter, donc je me demandais si c’était mon téléphone ou…
Le 15/11/2017 à 11h55
En réponse au sous-titre, “Oh, ah, ah, ah, ah” " />
Le 15/11/2017 à 12h07
Ah, ça venais de là. Impossible de me connecter à Les Simpsons : Springfield ce matin via le wifi 😁. Heureusement que je suis chez Bouygues en données mobiles 🙂
Le 15/11/2017 à 12h24
Ce serait donc pour ça que https://developer.mozilla.org était inaccessible ce matin :o
Le 15/11/2017 à 12h31
Haha, j’ai deviné le sous-titre grâce au commentaire !
Le 15/11/2017 à 13h03
Down with the sickness!!
Le 15/11/2017 à 14h13
On avait plus accès Stackoverflow ! C’est bon on peut recommencer les copié/collé " />
Le 15/11/2017 à 15h03
Je confirme, la matinée à été catastrophique, c’est des 10aine de sites donc le mien qui le fonctionnait plus, ou presque plus, le manque de comm est toujours à déplorer dans se genre de situation, il faut toujours attendre des heures et des heures pour avoir une info du pourquoi sa ne marche pas et d’où viens le problème !
J’ai perdu une matinée de prod donc 2h00 a chercher le problème sur mes serveurs dans le vent …
Le 15/11/2017 à 15h24
idem, impossible de se connecter sur les sites partenaires XEROX, balot quand tu doit enregistrer des machines.
Le 15/11/2017 à 15h28
Level 3 c’est le groupe du propose des services de CDN ?
Le 15/11/2017 à 15h30
Le 15/11/2017 à 15h32
Il travaille peut-être à partir de 10h. 12h pause dej puis grosse AM (je faisais pareil , en finissant à 19h30).
Le 15/11/2017 à 15h56
La semaine dernière s’était OVH et là c’est Orange.
[Mode théorie du complot ON]C’est l’installation des boites noirs qui génère des coupures momentané ? [Mode théorie du complot OFF] " />
Le 16/11/2017 à 08h32
Le 16/11/2017 à 08h35
Tu peux rejeter la faute sur Orange autant que tu veux, mais il y a deux options:
Le 16/11/2017 à 08h38
Peu de chance que l’interface externe de Level3 te donne le numéro de son astreinte direct, ils vont l’appeler et lui dire “y’a tel et tel problème avec Orange”. Le mec va se co, faire son diag et dire “non y’a rien” à son interface externe qui va appeler Orange et ainsi de suite jusqu’à trouver le bon interlocuteur.
Une fois le bon trouvé, faut éventuellement le faire monter sur un pont d’incident, ici Orange est en incident mais pas forcément les autres malheureusement.
Puis quand le mec a trouvé la panne, faut qu’il la gère (un roll back de configuration ? une modification de conf ?), est ce que ça n’aura pas d’impact sur d’autres transitaires ou client ? Analyse à faire toussa toussa, vu l’heure si le problème est aux US l’astreinte devait dormir tranquillement. Le petit saut du lit qui ne fait pas plaisir haha
Le 16/11/2017 à 08h45
Le 16/11/2017 à 08h52
Oui oui je ne te fais pas dire ce que tu n’as pas dit non plus, mais avant de déclencher une astreinte t’as 4000 checks côté Orange pour vérifier que le problème vient pas de chez eux et pas passer pour des buses. Après oui ça communique mais pas assez rapidement et efficacement à mon sens d’où le fait que je parle d’un lien direct avec pont d’incident. Ca doit être des appels à des centres de supervision qui appellent les astreintes ainsi de suite, limite c’est des mails sur des boites génériques de centre de supervision je ne sais pas… Ca dépend certainement des volumétries en jeu et des clauses des contrats possiblement.
Pour avoir fait des incidents inter entreprises France c’est déjà la loose pas possible alors mettre les indiens, les états uniens et peut être d’autres bonjour le cirque….
Le 16/11/2017 à 08h55
Le 16/11/2017 à 08h58
il est possible oui, après savoir sur qui tu tombes, est ce que le mec comprend bien le truc ? est ce que tu arrives avec assez d’infos pertinentes pour que ça percutes chez lui ? est-ce qu’avec les horaires que tu lui donnes le mec se rend compte qu’il y a eu un TP ou des alarmes sur des équipements j’en sais absolument rien du process de contact en cas d’incident… Je pense que c’est vraiment pas de la tarte en tout cas.
Le 16/11/2017 à 09h38
Le 16/11/2017 à 09h41
Dis moi où j’ai explicitement dit que c’était impossible.. OKAY
Le 16/11/2017 à 12h38
Le 16/11/2017 à 19h40
Ça veut dire que c’est difficile… Mais bon
Le 18/11/2017 à 16h48
Le 15/11/2017 à 16h01
Ce type de problème de peering est effectivement pénible car c’est la dernière chose à laquelle on pense… Internet marche, le serveur lui même a bien accès à Internet… mais le service n’est pas accessible… " />
Dans le même genre, le peering entre le FAI de notre boite et OVH avait un packet drop de 50% en IPv6 seulement, ce qui causait des soucis en apparence de l’ordre de la magie noire, surtout que chaque logiciel réagit différemment aux problèmes de connectivité IPv6.
Le 15/11/2017 à 16h16
Reste à savoir si c’est des “techniciens” Russes, israéliens, chinois, coréens ou americains qui testent l’infrastructure réseau.
Le 15/11/2017 à 16h29
il me semblait qu’il y avait un soucis, je suis chez Orange Fibre et impossible d’accéder à iCloud ce matin.
Maintenant tout va bien.
Le 15/11/2017 à 16h47
Ce qui est fou c’est de ne pas avoir de message en bandeau sur l’interface livebox, juste pour confirmer le problème technique cote operateur/infrastructure…
Le 15/11/2017 à 16h59
AS3356 : can you feel that …oh shit
Le 15/11/2017 à 17h09
Le 15/11/2017 à 18h49
Le 15/11/2017 à 20h35
C’est courant chez Orange d’avoir des problèmes de transit IP, mais de cette ampleur c’est encore jamais arrivé cette année. J’espère qu’ils ont bien le nez dans leur merde cette fois-ci.
Généralement quand je vois que les requêtes sont anormalement longues vers des sites comme des gros sites étrangers ou que les connexions ssh vers notre infrastructure en Irlande freezent régulièrement par à coup, je sors mtr et ping (ça prend 1 minute) pour vérifier si Orange paume des paquets ip ce qui est généralement le cas.
De plus, j’ai le réflexe twitter et je n’hésite pas à faire de la délation/dénonciation non calomnieuse et véridique en pointant orange si nécessaire.
Le 15/11/2017 à 21h25
Le 15/11/2017 à 21h53
Sauf que le problème est pas chez Orange si tu lisais un peu la news, ils ont autant subi que l’ensemble des abonnés sur ce coup là… mais bon facile de cracher sa bile quand on ne lit pas (ou on ne sait pas lire).
T’as beau avoir la meilleure infra du monde, si c’est le mec en face qui fait de la merde sur ses annonces BGP t’en subis les conséquences, le temps de trouver d’où vient la panne. Ensuite plusieurs choix :
Le 15/11/2017 à 22h47
Le 15/11/2017 à 23h57
Pour être plus clair c’est Orange qui paye le prestataire pour faire transiter son traffic, donc c’est Orange qui doit fouetter son prestataire lorsque ça fonctionne pas/mal. C’est pas à l’abonné orange de s’occuper de ce qui se passe entre le destinataire et la livebox. Au pire , Orange n’a qu’à virer ses prestataires et demander à Free/Bouygues & cie comment ils font. Bon après peut-être que l’herbe n’est pas aussi verte ailleurs mais elle ne l’est définitivement pas chez l’agrume. (en tout cas pas pour l’année 2017)
C’est comme la poste, ce n’est pas au destinataire du colis de déclarer un colis perdu car ce n’est légalement pas le client, c’est à celui qui a envoyé le colis et payé les frais de port de le faire.
Le 15/11/2017 à 23h59
Aucun détail sur le pourquoi de l’incident (erreur humaine, buldozer qui a coupé un câble, orange qui n’avait pas payé ses factures à temps… ?)
Le 16/11/2017 à 08h20
Le 16/11/2017 à 08h22
Déjà quand je parle du 1/ et 2/ je ne parle pas de toi, mais bien de Orange dans ce cas là…
Fait ta réclamation, si t’as un contrat avec les bonnes clauses tu auras gain de cause mais Orange refacturera ça au tiers qui a causé la panne (et non un prestataire).
Merci de douter de mes compétences, elles semblent au dessus des tiennes sur le sujet.
Demander à Free en terme de peering ? C’est une blague ? On en parle du peering Netflix ? Twitch chez monsieur Niel ? Et bon sans être mauvaise langue, comparé les débits envoyés par Orange avec SFR et Bouygues c’est le jour et la nuit. Donc non on ne peut pas demander à ces gentils FAI comment ils fonctionnent parce que tu connais absolument rien de l’archi, des volumétries, des contrats et j’en passe.
Si t’es pas content d’Orange, comme apparemment t’as 3 autres FAI t’es libre d’aller voir ailleurs ou de dire à ton client de faire de même. Mais bon toujours plus facile de râler (on l’a bien compris sur les RS et forum) que d’essayer de comprendre d’où vient le problème, qui est responsable et pourquoi le retour à la normale ne s’est pas fait plus rapidement que ça.
Le 16/11/2017 à 08h28
Je pense que t’as jamais travaillé avec des mecs qui gèrent des AS dans le monde entier…Ici t’as dejà Orange avec Open Transit (en Inde) et Level3 (US). 3 gros fuseaux horaires différents, faut trouver la panne et la diagnostiquer puis ensuite tu as cru que Orange avait le numéro d’astreinte du mec de chez Level3 ? Bah non, y’a tout un process, une cellule de crise chez level3 qui évalue si oui ou non faut déclencher l’astreinte sur le bon secteur.
Suivant la volumétrie qui a un problème vu que ces gens gèrent des terrabits de trafic, si t’as 300 Go/s qui passent à la trappe le mec va te dire “non non c’est pas chez nous on voit rien sur les graphs”, effectivement 300Go sur 30To c’est peanut.
Dans tous les incidents informatiques, quelqu’ils soient. Le problème n’est pas la technique c’est la communication. Dans une grande boite la comm interne c’est déjà une tannée alors imagine inter entreprise sur des fuseaux horaires différents avec en plus plusieurs entreprises sur le coup (Orange, Open Transit, Level3 et le fameux tiers et peut être d’autres). Va synchroniser tout le monde… Très très dur malheureusement