SRE实践:从SRE SLO工程
到GOC体系建设
议题要点及收获:
传统的业务质量体系建设需要投入大量人力做业务梳理、场景定义、指标计算、异常盯盘等,效率低,成本高,SRE中的SLO工程给出了更科学、高效的质量体系建设方式。本议题将介绍SLO工程方法论、如何实践SLO工程,以及如何围绕SLO工程演进到GOC体系,来建设1-5-10能力和风险控制,主要包括以下内容:
可用性指标的观测对象、观测方案和落地实践;
Google SRE中最核心的SLO工程方法论及SLO实施经验;
如何以SLO为核心建设业务质量体系;
在没有GOC组织的情况下,GOC能力如何落地。
演讲时间:2023年7月21日
演讲地点:Gdevops全球敏捷运维峰会-北京站(北京新世纪日航饭店)
讲师介绍:
先后负责中间件运维、在线业务保障和SRE稳定性工程;从0到1带领运维向SRE转型,建设B站稳定性体系;主导建设SRE转型、SLO工程、容量管理体系、高可用架构、多活容灾等专项;当前专注SRE稳定性体系规划建设和落地实践;《2021.07.13 我们是这样崩的》文章作者。
以上议题内容将会在2023 Gdevops全球敏捷运维峰会-北京站完整呈现,更多关于稳定性保障、高可用架构设计、运维数智化转型等互联网大厂及大型商业银行的实战经验,都可以在7月21日的Gdevops北京站一次性看全。
峰会议程
码上报名
扫码可了解完整议题及报名
点这里了解峰会更多详情及报名
如果字段的最大可能长度超过255字节,那么长度值可能…
只能说作者太用心了,优秀
感谢详解
一般干个7-8年(即30岁左右),能做到年入40w-50w;有…
230721