IT运维值班遇到线上故障怎么快速排查值班最怕一上来就被群里催,CPU、磁盘、网络、应用日志全都红一点。我的习惯是先看影响面,再看最近变更,不急着重启服务。很多事故其实是证书、DNS、配置发布这种小地方拖出来的。你们排障时第一眼会先看监控、日志,还是发布记录?