Kafka の InconsistentClusterIdException は危険な連鎖を引き起こします:コンテナの再起動ループ、ログの氾濫、そして最終的にはディスクフルです。この記事では、Ubuntu 22.04、Docker 24.x、Bitnami Kafka 3.1 での実際のインシデントを解説します。ZooKeeper と Kafka ログでクラスター ID を確認する方法、安全にクラスター ID をリセットする方法、ディスク容量をクリーンアップする方法を説明します。重要な教訓は、移行後に常にクラスター ID の一貫性を確認し、ログ保持制限を設定することです。DevOps および SRE チームにとって、一般的だが厄介な Kafka 障害モードを回避するための実践的なガイドです。
Docker 環境での Kafka クラスター ID 不一致を診断し、コンテナ再起動とディスク枯渇を防ぐ実践的なケーススタディ。