Las métricas de Prometheus son tan buenas como sus etiquetas. Un diseño deficiente de etiquetas provoca explosiones de cardinalidad, consultas lentas e hinchazón inmanejable de métricas. Esta guía destila las mejores prácticas de la comunidad de Prometheus: mantenga los valores de las etiquetas acotados, evite incrustar identificadores únicos como ID de usuario o ID de solicitud como etiquetas, y prefiera convenciones de nomenclatura estructuradas como snake_case. Ejemplos del mundo real muestran cómo una sola etiqueta de alta cardinalidad puede degradar el rendimiento de Prometheus de submilisegundos a minutos. El artículo también cubre la higiene de etiquetas para reglas de grabación y alertas, asegurando que sus SLO y paneles sigan siendo receptivos a medida que su infraestructura crece. Para los equipos que adoptan Prometheus a escala, estos principios son esenciales para la salud operativa a largo plazo.
Este artículo analiza las mejores prácticas para diseñar etiquetas de métricas de Prometheus para mejorar la eficiencia de las consultas y la mantenibilidad del sistema. Cubre errores comunes como las explosiones de cardinalidad y ofrece pautas para convenciones de nomenclatura y estructura de etiquetas. El tema es muy relevante para los equipos que escalan su infraestructura de monitoreo.