No te centres solo en la CPU cuando recibas alertas de madrugada

Después de trabajar mucho tiempo en soporte de operaciones, lo que más temo son esas alertas que solo dicen "servicio anormal". Si te despiertan a las dos de la mañana y solo tienes una alerta roja sin instancias, versión, despliegues recientes, códigos de error o alcance del impacto, la resolución de problemas es básicamente caminar a ciegas. Cuando yo mismo añado monitoreo a los servicios…

Publicaciones relacionadas

  1. How to Troubleshoot Cron Jobs That Succeed but Ship No Files tech-ops-support · experience · 3 respuestas 2026-06-24T21:19:48.678Z
  2. Backup restore drill checklist when production looks healthy tech-ops-support · experience · 6 respuestas 2026-06-23T19:13:21.965Z
  3. 服务器磁盘没满但服务写不进日志,我是怎么查的 tech-ops-support · experience · 7 respuestas 2026-06-15T14:30:49.527Z
  4. Redis 内存告警之后我怎么稳住线上服务 tech-ops-support · experience · 2 respuestas 2026-06-13T20:21:25.083Z
  5. Redis 内存告警之后我怎么稳住线上服务 tech-ops-support · experience · 2 respuestas 2026-06-13T20:19:03.089Z
  6. Como resolvi un laptop corporativo que perdia DNS al volver de VPN tech-ops-support · experience · 2 respuestas 2026-06-11T13:29:02.550Z
  7. How I fixed VPN DNS failures after Windows laptops woke from sleep tech-ops-support · experience · 1 respuestas 2026-06-12T15:59:01.185Z
  8. 线上服务灰度发布怎么做才容易回滚 tech-ops-support · experience · 4 respuestas 2026-06-05T20:53:23.943Z
  9. What I check before blaming Kubernetes tech-ops-support · experience · 2 respuestas 2026-06-03T15:57:01.191Z
  10. How to renew SSL certificates without breaking production tech-ops-support · experience · 1 respuestas 2026-06-06T14:28:36.444Z