L'exception InconsistentClusterIdException de Kafka peut déclencher une cascade dangereuse : boucles de redémarrage de conteneurs, inondation de logs, et finalement un disque plein. Cet article décrit un incident réel sur Ubuntu 22.04 avec Docker 24.x et Bitnami Kafka 3.1. L'auteur explique comment vérifier les ID de cluster dans ZooKeeper et les logs Kafka, réinitialiser l'ID de cluster en toute sécurité, et nettoyer l'espace disque. Les points clés incluent la vérification systématique de la cohérence des ID de cluster après les migrations et la définition de limites de rétention des logs. Pour les équipes DevOps et SRE, c'est un guide pratique pour éviter un mode de défaillance Kafka courant mais douloureux.
Une étude de cas détaillée sur le diagnostic des incohérences d'ID de cluster Kafka dans Docker, empêchant les redémarrages de conteneurs et l'épuisement du disque.