SRE事故报告正确的打开方式
1、事故回顾的重要性
在SRE在这一领域,事故报告是一件非常重要的事情,在中国流行的两本书中《SRE:Google运维解密》《SRE《生存指南》有一系列介绍。Mikey金字塔起着上下作用。在事故回顾中,以上所有层次都是关于未来(规划和改进过程),而下层(监控和事故响应)是关于处理当前事故的。
? ?
2、事故回顾的定义
事故回顾又称根本原因分析,Root Cause Analysis 根本原因分析,简称RCA。RCA系统地识别问题或事件的根源和应对方法,RCA概念是防火而不是防火。
? ?
三、事故报告的目的
写作后总结的主要目的是确保记录事故,澄清所有根本问题。同时,最重要的是确保有效措施的实施降低了未来重现的可能性和影响,甚至避免了重现。
? ?
四、事故分析
记录为什么会发生事故,从事故现场开始,深入挖掘各个方面。无论什么样的事故、生产事故、日常问题分析,都可以写报告,但不能只写报告。如果你不分析事故,找出发生了什么,写更多的报告是没有用的。
? ?
5.事故报告模板
根据自己的喜好调整模板格式。