运维焦点:全链路监控、混沌工程、SRE、AIOps、核心系统迁移等逐一攻克丨Gdevops峰会

dbaplus社群 2022-05-17 10:36:52

从传统运维到云原生运维,整个运维模式、技术栈等必将发生很大变化,这些变化在带来便捷、弹性的同时,也会引起复杂的转型和改造,作为面向云原生的运维人员,应该提前做好哪些技能储备?2022 Gdevops全球敏捷运维峰会-广州站,精选以下运维热门议题,与产学研界技术同仁一起探索云原生时代、数字化转型背景下的新趋势、新挑战和新解法。

 
Gdevops全球敏捷运维峰会·广州站
 

图片

 

时间:2022年6月17日

地点:广州阳光酒店

指导单位:上海市软件行业协会、上海市计算机行业协会、中国信息通信研究院云计算与大数据研究所

主办单位:dbaplus社群

 

 

 

运维主题看点

 

  • 从监控到可观测性,面临着哪些变化和挑战?
  • 规模庞大、突发流量下的数据库可用性保障及故障自愈实战;

  • 智能运维在互联网大厂及大型银行的演进和应用缩影;

  • 打造SRE工具链体系,挖掘链路追踪的第二层价值与应用;

  • 混沌工程平台如何选型并落地?如何构建大规模自动化演练机制?
     

演讲嘉宾



议题要点及收获:

  • 近年来学术界提出了哪些新的算法?在工业界落地情况如何?

  • 算法应用问题多,智能运维真的智能吗?

  • 通过分析若干个算法在实际应用中效果欠佳的场景,思考如何让智能运维中的算法起到更好的成效。



议题要点及收获:

  • 构建SRE工具链在复杂微服务场景当中发挥怎样的作用?

  • 如何打造“三位一体”的SRE工具链体系,助力业务在”事前”提前发现潜在问题、“事中”快速定位问题根因、“事后”快速复盘历史故障,帮助业务实现服务高可靠性的目标?

  • 如何构建可观测性、混沌实验、全链路压测等能力?

  • 挖掘链路追踪的第二层价值与应用。

 


议题要点及收获:

  • 掌握可用性目标达成路径,包括规范制定、流程设计、平台化能力、标准落地等;

  • 在管理规模逐步增大的过程中,不同阶段应该关注哪些重点?

  • 可用性故障如何复盘?如何以点带面地解决同类问题?

  • 可用性与成本的冲突如何调和?

  • 如何与业务方共同提高数据库的可用性?

 


议题要点及收获:

  • 业务型公司为什么需要混沌工程?

  • 混沌工程平台如何选型并落地?

  • 如何构建大规模自动化演练机制?



议题要点及收获:

  • 如何让智能运维具备最优秀运维人员的能力,并持续赋能DBA?

  • 如何从0到1实现智能化运维?一般的实施路径是怎样的?

  • 平安银行在故障自愈领域构建的自学习平台,如何做到快速帮助DBA将运维经验转变为运维工具?



议题要点及收获:

  • 海量金融交易场景下,分布式架构如何设计?运维体系如何构建?

  • 智能化运维在金融业务系统中的矛盾点有哪些?会面临哪些挑战?

  • 智能化运维如何在金融业务系统中开展和实施?



议题要点及收获:

  • 如何构建自动化工具链和敏捷研发协作一站式平台,并量身定制适配的一套流程和工具集?

  • 如何拆解封装原大型机系统业务和功能模块,逐步构建迁移并上线基于微服务架构和云原生的新系统?

  • 如何保证新旧系统有机并行,采取“迭代式”重构,确保业务影响最小化,从而实现敏捷迁移?



议题要点及收获:

  • 数据库层面如何轻松应对电商大促?

  • 如何利用原生分布式数据库能力解决分库分表无法解决的各类问题?

  • OceanBase在每年双十一大促撑起数十亿高并发的运维避坑经验。

 



议题要点及收获:

  • 提前了解:不同活动对数据库的压力侧重点;

  • 事前发现:需要提前关注、优化的点;

  • 事中应急:活动中会出现的典型问题及应急方案;

  • 事后总结:经历这些大型活动后的心得体会。

 


 

议题要点及收获:

  • 监控平台建设思路:如何打通可观测性领域的各监控要素?

  • 如何从用户实际需求场景出发,设计一个让研发人员易用、让运维人员好用的报警系统?

  • 了解智能算法在报警规则配置、报警降噪、报警根因分析等方面的应用。

 


 

议题要点及收获:

  • 网易游戏智能运维平台的演进;

  • 如何进行时序数据的异常检测?

  • 如何有效缩短故障定位时长?

  • 如何进行硬件故障预测?

 


议题要点及收获:

  • 传统运维中的安全与云原生安全有哪些不同?

  • 常见的云原生安全攻击面有哪些?

  • 常见的云原生安全手段有哪些?

  • 云原生安全应该具备的防与护。



议题要点及收获:

  • 通信行业数据库运维未来发展的整体方向;

  • 如何将运维经验产品化输出,提升运维工作的整体效率与收益?

  • 如何构建数据库运维全流程的智能化解决方案?

  • 浙江移动如何从故障感知、定界定位、应急处置和底线恢复四方面推进数据库运维的自动化、数字化与智能化发展?

 

Gdevops广州站峰会议程


 

码上报名


图片

扫码可了解完整议题及报名

 

点击这里了解峰会更多详情及报名

活动预告