Las garantías de fiabilidad de Kafka son un pilar del streaming de datos moderno, pero lograr una semántica exactly-once requiere una configuración cuidadosa en cada etapa. Este artículo desglosa el lado del productor con productores idempotentes y acks=all, el lado del broker con replicación y gestión de ISR, y el lado del consumidor con lecturas transaccionales y gestión de offsets. Para los ingenieros que ejecutan Kafka en producción, comprender estos mecanismos es fundamental para evitar la pérdida o duplicación de datos. La pieza también cubre trampas comunes como elecciones de líder no limpias y reintentos mal configurados. Aunque el contenido es similar a un tutorial, los principios subyacentes son atemporales y directamente aplicables al diseño de sistemas. Recomendamos esto como referencia para equipos que diseñan tuberías tolerantes a fallos, pero notamos que el artículo original puede requerir adaptación a versiones específicas de Kafka y configuraciones de clúster.
Una guía práctica para garantizar que los mensajes de Kafka no se pierdan ni dupliquen en toda la tubería, con configuraciones listas para producción.