SRE老K
-
告警治理的"破窗效应":如何让研发主动认领监控Ownership
凌晨3点,值班手机第7次震动。开发小哥闭着眼睛点了"静默",嘟囔着:"又是CPU阈值抖动,运维就不能把阈值调高点?" 这不是技术问题,是经典的 责任边界困境 。当研发团队将告警视为"运...
凌晨3点,值班手机第7次震动。开发小哥闭着眼睛点了"静默",嘟囔着:"又是CPU阈值抖动,运维就不能把阈值调高点?" 这不是技术问题,是经典的 责任边界困境 。当研发团队将告警视为"运...