À cause d'un problème de purge sur un « petit pourcentage » de fichiers cache, Cloudflare a connu quelques dysfonctionnements. L'incident a été identifié aux alentours de 15h45 et résolu rapidement. À 16h09, le correctif était déployé et à 16h32 la situation était revenue à la normale, selon la société.
De nombreux utilisateurs se sont alors retrouvés face à une page blanche sur des sites qu'ils visitaient, avec une erreur 502 (“Bad Gateway”). Dans un billet de blog, la société explique que « cette panne était la conséquence du déploiement d’une seule règle mal configurée dans le Cloudflare Web Application Firewall (WAF) »
Une seule règle, mais contenant une expression régulière ayant la facheuse tendance à provoquer des pics de 100 % dans les processeurs. Le souci a affecté l'ensemble des machines du Cloudflare dans le monde. « Ce pic de 100 % [...] a provoqué les erreurs 502 constatées par nos clients. Dans le pire des cas, le trafic a chuté de 82% », explique l'éditeur.
Ce « bug » rappelle encore une fois le risque que représente un point unique de défaillance (single point of failure ou SPOF) sur Internet. Pour rappel, une fuite BGP a également entraîné une indisponibilité il y a quelques jours, notamment chez Cloudflare.
Commentaires (7)
#1
Ah ben ça… Y a des regexp qui peuvent produire une trop grosse récursivité si l’entrée est trop longue …
J’aimerai bien la voir, dés fois qu’on puisse l’ajouter dans un fichier robots.txt ou équivalent ^^
#2
Après, quelles sont alternatives à un CDN/anti-DDOS lorsqu’on est moyen/gros mais qu’on ne s’appelle pas Google?
Je n’en vois aucune pour le moment.
#3
Le problème BGP n’était pas la faute de Cloudflare par contre, mais de Verizon. Une petite précision.
#4
Expression régulière ? Vous vouliez dire expression rationnelle, non ? #fauxamis
#5
Beaucoup d’hébergeurs proposent des solutions anti DDoS plutôt poussées maintenant.
#6
Wikipedia ne fait pas grande différence entre les deux.
https://fr.wikipedia.org/wiki/Expression_r%C3%A9guli%C3%A8re
" />" />" />
#7