PH

Pierre Houllière

Retour

Les problèmes Cloudflare du 12 Septembre


Le 12 septembre 2025, Cloudflare a subi une panne du tableau de bord et de l’API, dont la cause immédiate était un bogue dans le tableau de bord. Ce bogue a provoqué des appels répétés et inutiles à l’API du Service Tenant (Tenant Service API). Spécifiquement, un hook React useEffect contenait un objet problématique dans son tableau de dépendances. Comme cet objet était recréé à chaque changement d’état ou de prop, React le traitait comme toujours nouveau, ce qui déclenchait la ré-exécution du hook et des appels d’API multiples, submergeant finalement le Service Tenant. L’impact était significatif car le Service Tenant est essentiel à la logique d’autorisation des requêtes API. Cloudflare a corrigé l’incident en limitant le débit du Service Tenant, en augmentant les ressources (pods GoLang/Kubernetes), et prévoit des améliorations pour réduire les boucles de relance (Thundering Herd) avec des délais aléatoires et pour migrer ce service vers Argo Rollouts.