Panne des numéros d’urgence : BT condamné à 20 millions d’euros… deux salles, deux ambiances
Pendant ce temps-là, chez Orange…
Au Royaume-Uni, l’opérateur BT (British Telecom, l’opérateur historique anglais) vient d’écoper d’une amende de 17,5 millions de livres (soit un peu plus de 20 millions d’euros) pour des « échecs de traitement » des appels vers le numéro d’urgence 999. Une histoire qui en rappelle une autre : la panne d’Orange en 2021 sur les numéros d’urgence. Deux histoires proches, mais avec un dénouement différent.
Le 24 juillet à 09h09
6 min
Société numérique
Société
Comme le rappelle le Consulat de France à Londres, le 999 permet de joindre la Police, les ambulances et les pompiers. L’opérateur BT est en charge de la gestion de ce numéro ainsi que du 112, le numéro d’urgence européen. C’est le pendant d’Orange outre-Manche.
25 juin 2023 : plus de 10 h d’incidents sur les appels d’urgence
Problème, le dimanche 25 juin 2023, « BT a connu une panne de réseau qui a affecté sa capacité à connecter les appels aux services d'urgence entre 06h24 et 16h56. Au cours de l’incident, près de 14 000 tentatives d’appel – provenant de 12 392 appelants différents – ont échoué », explique le régulateur britannique Ofcom (équivalent de notre Arcep).
Ce dernier a mené une enquête. Il en ressort que pendant plus d’une heure – de 6h24 à 7h33 – une « erreur de configuration dans un fichier de son serveur » a perturbé le traitement des appels. BT n’a pas été en mesure de déterminer la cause du problème rapidement et a tenté de passer sur une plateforme de secours. Hélas, cela n’a pas marché.
De 7h33 à 8h50 c’est la seconde phase de l’incident : la première tentative de migration échoue à « cause d’une erreur humaine » causée par des « instructions mal documentées » et le fait que « l’équipe ne connaissait pas le processus ». De problèmes sur certains appels seulement, l’incident passe à une panne totale du système. À partir de 8h50 et jusqu’à la fin de l’incident (16h56) c’est la troisième phase, avec une reprise progressive.
BT en prend pour son grade
Les constatations de l’Ofcom ne sont pas tendres : « BT ne disposait pas de systèmes d’alerte suffisants pour ce type d’incident, ni de procédures adéquates pour en évaluer rapidement la gravité, l’impact et la cause probable, ou pour identifier les mesures d’atténuation.
Nous avons également constaté que la plateforme de reprise après sinistre de BT n’avait pas la capacité ni les fonctionnalités suffisantes pour faire face à des demandes auxquelles on pouvait raisonnablement s’attendre ».
17.5 millions de livres pour ses « défaillances »
Ofcom rappelle que « BT est un opérateur de communication important, expérimenté et qu’il dispose de ressources suffisantes ». Suzanne Cater (directrice réglementaire à l’Ofcom), n‘y va pas par quatre chemins : « BT a manqué à ses responsabilités ».
Aucune conséquence grave n’a été identifié par les autorités, mais les risques causés par une telle panne étaient importants, ce que l’Ofcom prend en compte. « En raison des défaillances de BT, l'Ofcom a décidé d'infliger à l'entreprise une amende de 17 500 000 livres sterling ».
Le régulateur précise que BT a « pleinement coopéré » durant l’enquête, sans quoi l’amende aurait pu être plus élevée. Bien évidemment, des mesures ont été prises par l’opérateur pour éviter qu’une telle situation ne se reproduise.
Orange, souviens-toi de l’été 2021
Une affaire comme une autre ? Oui… et non. Elle nous replonge trois ans en arrière, en juin 2021 lorsqu’une panne touche des numéros d’urgence (15, 17, 18, 112) en France. La cause, un « incident technique » chez Orange.
Quelques jours plus tard, Orange dévoilait ses conclusions : « de 16h45 à minuit, les services voix d’Orange ainsi que l’accès à certains services d’urgence ont été perturbés sur le plan national. Pendant cette période environ 11 800 appels, soit 11 % du total d’appels, n’ont pas été acheminés vers les services d’urgence ».
« Six cas de décès signalés pouvant être liés à l’événement ».
Une panne un peu moins longue que celle de BT et avec un peu moins d’appels affectés, mais on reste dans les mêmes ordres de grandeur. En juillet de la même année, l’ANSSI dévoilait son rapport d’évaluation (les pages 11 à 19 donnent le déroulement minute par minute).
On y apprend notamment que les conséquences de la panne d’Orange étaient bien plus dramatiques que celle de BT avec « six cas de décès signalés pouvant être liés à l’événement ».
« Plusieurs dysfonctionnements internes à Orange »
L’ANSSI n’était pas tendre avec l’opérateur historique français : « Orange a mis près d’une heure à prendre conscience que la panne touchait en particulier les services d’urgence, deux heures pour en informer les autorités et près de trois heures pour mettre en place un dispositif adapté. Cela est dû à plusieurs dysfonctionnements internes à Orange ».
L’Agence note par contre que « les services d’urgence ont mis en place de nombreuses solutions de contournement et ce malgré l’absence de conseil du côté de l’opérateur », ce qui a permis de « limiter considérablement les conséquences de cette crise ».
En aout 2023, un décret et un arrêté sont venus fixer les modalités de la loi Matras (promulgué en novembre 2021) sur la « supervision technique de l’acheminement des communications d’urgence ». Il s’agissait de mettre en place des statistiques et des alertes, avec une entrée en vigueur au 1er janvier 2024.
Les modifications mises en place par Orange n’ont pas empêché une nouvelle panne, de bien moindre envergure, d’arriver en janvier 2023. Elle concernait « les appels fixe et mobile vers les services d’urgence (15, 18, 112) », avec des perturbations partout en France. Moins d’une heure plus tard, c’était réglé cette fois-ci.
Quid d’une sanction de l’Arcep ?
Deux situations proches entre BT et Orange, mais avec une différence de taille : une amende de plus de 20 millions d’euros prononcée par le régulateur au Royaume-Uni. Côté Arcep, rien pour le moment. Nous avons demandé au régulateur s’il avait le pouvoir de sanctionner Orange comme vient de le faire l’Ofcom avec BT, sans réponse pour le moment.
Panne des numéros d’urgence : BT condamné à 20 millions d’euros… deux salles, deux ambiances
-
25 juin 2023 : plus de 10 h d’incidents sur les appels d’urgence
-
BT en prend pour son grade
-
17.5 millions de livres pour ses « défaillances »
-
Orange, souviens-toi de l’été 2021
-
« Six cas de décès signalés pouvant être liés à l’événement ».
-
« Plusieurs dysfonctionnements internes à Orange »
-
Quid d’une sanction de l’Arcep ?
Commentaires (12)
Abonnez-vous pour prendre part au débat
Déjà abonné ? Se connecter
Cet article est en accès libre, mais il est le fruit du travail d'une rédaction qui ne travaille que pour ses lecteurs, sur un média sans pub et sans tracker. Soutenez le journalisme tech de qualité en vous abonnant.
Accédez en illimité aux articles
Profitez d’un média expert et unique
Intégrez la communauté et prenez part aux débats
Partagez des articles premium à vos contacts
Abonnez-vousLe 24/07/2024 à 09h24
C'est un peu la même histoire sur tous les projets informatiques qui tombent en panne d'une manière ou d'une autre...
Le 24/07/2024 à 10h03
Si un site informatique est bien conçu peu importe ce qui casse ça restera debout
Mais les PCO sont toujours délaissés au profit des PRA et rarement testé en situation réelle et le budget est la raison de cet état de fait.
Le 24/07/2024 à 10h45
L'erreur humaine n'est pas évitable. Les boulettes en cascade parce que plus personne ne sait gérer, c'est évitable.
Le 24/07/2024 à 23h07
Le 25/07/2024 à 19h05
Modifié le 24/07/2024 à 10h26
Mais il y a une phrase qui m’a « choqué » dans la suite (l'analyse des causes) :
« Le cold restart qui vise à redémarrer les modules des call servers en les forçant à charger une configuration présente sur le serveur de configuration n’a été utilisé qu’en dernier recours car un redémarrage à froid prenant près de 50 minutes. »
C’est des vieux Diesel ou voire même des chaudières à la vapeur les Call Servers (Passerelles VoIP / RTC) de chez Orange (en fait conçus & fabriqués par le sous-traitant Itatel) ?
Il faut les pré-chauffer avant de les rebooter et pouvoir charger le précèdent fichier -valide - de config?? Même Windows arrive à faire (beaucoup) mieux... enfin quand il y arrive… ou pas...
Le 24/07/2024 à 14h54
Pas forcément. Ce genre de truc, c'est sensé rester online 24h/24, 7j/7. Donc il suffit que quand ça démarre, ça lance toute une série de diagnostics pour s'assurer qu'il n'y a pas eu un soucis / panne matériel pour que cela prenne autant de temps.
Modifié le 24/07/2024 à 16h29
Le héro: " - Attends, attends, il ne nous reste plus que 3min avant que tout explose !"
Le Geek: " - Pas de problème, je reboote le serveur et alors on pourra se connecter sur le réseau pour stopper le compte-à-rebours de la bombe"
50min plus tard...
Ha ben soit ils sont tous morts maintenant, soit tous les spectateurs ont déjà quitté la salle depuis longtemps...
Le 24/07/2024 à 16h41
Modifié le 24/07/2024 à 17h32
Et bien, si tu as l’occasion, je t’invite à regarder le film « Forbidden Planet » sorti en 1956, un de mes films de Sci-Fi préféré et avec… Leslie Nielsen (en jeune 1er) mais qui joue ici un rôle très très diffèrent de ses futurs rôles comiques.
Ce n’est pas une comédie mais un film culte de l'univers de la Science Fiction, d'ailleurs nominé à l’époque dans la catégorie « Meilleurs Effets Spéciaux » aux Oscars.
Le robot dans ce film est devenu une icône de la Sci-Fi d'ailleurs.
Et Georges Lucas a sûrement dû repomper le début de la bande annonce pour ses Star Wars !
Le 24/07/2024 à 14h06
https://arstechnica.com/tech-policy/2024/07/fcc-details-att-screwups-behind-outage-that-blocked-25000-calls-to-911/
Modifié le 24/07/2024 à 17h10
Et merci pour cette histoire assez énorme que je ne connaissais pas (Février 2024) car apparemment juste de la faute d'un seul et juste un seul technicien du service de nuit en charge de la maintenance de routine qui a uploadé un nouveau fichier de config sans que PERSONNE d'autre ne verifie et ne valide la conformité de ce fichier et lui donne l'autorisation de le faire... et fichier avec des conneries dedans bien sûr...
La vache, les Best Practices et autres procédures, mon ...
En lisant les commentaires, mon préféré:
"With patching processes like this, who needs cyberattacks? They're doing a fabulous job at fucking things up all by themselves."