运维数据价值升级:
基于SLO健康度体系探索与实践
议题要点及收获:
SLO为应用的服务质量定义了明确的目标,帮助团队提供一致的客户体验、平衡功能研发与平台稳定性,改善与内部和外部用户的沟通。本次分享将以蚂蚁集团内部实践为例,介绍如何从0到1构建SLO、如何将AI结合SLO使数据发挥更大价值,以及基于SLO的健康度体系在运维场景下的成功实践,并提供以下启发:
结合实际场景和需求,定义SLO的意义和出发点;
通过标准化设计,构建自动化能力,提升规模和场景覆盖,简化SLO配置的复杂度和费力度;
将SLO应用到日常的应急场景中,结合AI算法在异常检测、故障定位、预案推荐等场景下的使用,提升应急能力和效率。
演讲时间:2022年12月2日
演讲地点:DAMS中国数据智能管理峰会-上海站(国家会展中心上海洲际酒店)
演讲场次:运维专场
讲师介绍:
蚂蚁集团基础设施团队SRE技术专家,在蚂蚁基础设施团队从事关于SLO的健康度体系建设,以及异常检测、故障定位、预案推荐等场景下的AIOps实践;
曾就职于携程技术保障中心SRE专家岗,负责AIOps的实践探索和落地,以及多个AIOps产品的设计研发;
毕业于复旦大学信号处理方向,对人工智能、机器学习、神经网络及数学有浓厚的兴趣,在人工智能技术结合运维场景的实践方面有深入研究。
以上分享内容将会在2022 DAMS中国数据智能管理峰会-上海站完整呈现,更多关于数据治理、数据分析、数据资产管理、数据中台、实时数仓、湖仓一体、存算分离、离在线混部、时序数据库、智能运维等互联网大厂及大型银行的实战经验,都可以在12月2日的DAMS上海站一网打尽。
峰会议程
码上报名
扫码可了解完整议题及报名
如果字段的最大可能长度超过255字节,那么长度值可能…
只能说作者太用心了,优秀
感谢详解
一般干个7-8年(即30岁左右),能做到年入40w-50w;有…
230721