小型团队的生产环境 DNS 切换检查清单

DNS 切换在规划会议上听起来总是比实际操作时简单。更改记录,等待传播,观察流量迁移。但在实践中,一个缓存的解析器、一个被遗忘的子域名,或者一个指向旧主机的健康检查,都可能让这个夜晚变得比预想中漫长。 我现在信赖的检查清单在切换前几天就开始了,而不是在切换期间。提前降低 TTL 并确认其确实已更改。列出所有重要的记录,而不仅仅是主应用域名:API、管理后台、静态资源、邮件相关记录、回调 URL、Webhook 端点,以及任何仍然出现在日志中的奇怪的遗留主机名。我还喜欢在迁移前检查旧系统的访问日志。如果一个主机名仍然有真实流量,那么它并没有因为没人记得拥有它而失效。 在迁移过程中,我需要打开两个监控:从我们网络外部观察到的用户端健康状况,以及旧目标和新目标上的服务器端流量。如果办公室的 DNS 与世界其他地方不同,内部检查可能会产生误导。我也不喜欢同时进行证书、负载均衡器、防火墙和应用程序…

相关公开内容

  1. systemd 服务启动慢怎么用 journalctl 和依赖顺序排查 tech-ops-support · rant · 3 条回复 2026-06-22T16:18:18.288Z
  2. Linux inode 用满服务异常,排查步骤别只看 df -h tech-ops-support · rant · 2 条回复 2026-06-21T12:53:39.917Z
  3. Shared laptops need naming rules before support tickets pile up tech-ops-support · rant · 2 条回复 2026-06-19T16:35:21.887Z
  4. Kubernetes Pod 重启但日志为空,运维值班怎么定位 tech-ops-support · rant · 1 条回复 2026-06-20T17:50:21.566Z
  5. 今天工单说 VPN 能连但内网站打不开,我这样缩小范围 tech-ops-support · rant · 1 条回复 2026-06-17T13:40:40.758Z
  6. IT运维值班遇到线上故障怎么快速排查 tech-ops-support · rant · 2 条回复 2026-06-04T13:56:59.540Z
  7. How to reduce alert fatigue without missing real incidents tech-ops-support · rant · 1 条回复 2026-06-04T17:51:11.596Z
  8. Nginx反向代理502怎么排查才不乱重启 tech-ops-support · rant 2026-06-06T13:07:51.754Z
  9. How to Troubleshoot Cron Jobs That Succeed but Ship No Files tech-ops-support · experience · 3 条回复 2026-06-24T21:19:48.678Z
  10. Backup restore drill checklist when production looks healthy tech-ops-support · experience · 6 条回复 2026-06-23T19:13:21.965Z