Gdevops峰会北京站:讲师全阵容及全议题先睹为快!

Gdevops峰会 2023-07-12 10:59:15

7月21日,2023 Gdevops全球敏捷运维峰会即将在北京举办!本次峰会将以智能为主线,探讨其在数据库、运维、架构、金融科技等领域的落地应用,与产学研各界技术同仁一起探索AIGC、云原生、数智化转型下的新机遇。峰会设置了主会场以及数据库、运维、行业&AI实践三大专场,邀请到来自中国信通院、华东师范大学、京东、美团、字节、中国移动、工行、建行、农行、平安银行、OceanBase、新浪微博、爱奇艺、哔哩哔哩、知乎、vivo、爱可生、新东方、货拉拉、新炬网络等20余家技术领跑单位的专家学者和技术代表,为大家带来可借鉴、易落地的满满干货。

 

Gdevops全球敏捷运维峰会-北京站
 
图片
 
时间:2023年7月21日
地点:北京新世纪日航饭店(北京市海淀区首都体育馆南路6号)
指导单位:上海市软件行业协会、上海市计算机行业协会、中国信息通信研究院云计算与大数据研究所
主办单位:dbaplus社群
 
 

 

 
演讲嘉宾及议题先睹为快

 

01
主 会 场
 

攻克数智化难题,打造企业级发展新引擎

 

适听人群:CEO、CTO、CIO、COO、技术总监、IT经理、架构师等企业决策者和战略布局者

 


 

 
 

近年来,人工智能、大数据、云计算等新一代信息技术加速创新,并日益融入经济社会发展的各个领域和阶段,数字经济的高质量发展已成为我国国际竞争力提升的重要领域。本议题将分享如何将XOps与SRE大运维体系作为重要抓手,赋能企业构建高质量创新发展新格局,主要包括以下内容:

  1. XOps应用创新发展体系;

  2. 构建新时代大运维体系;

  3. SRE系统可靠性与连续性保障能力。

 


 

 
 

在数据库系统的运维过程中,运维平台积累了大量有价值的数据,这些数据可能是故障诊断案例、索引创建案例等等。本次分享以索引推荐为主题,介绍如何从大量索引创建案例中学习DBA的经验,实现智能化索引推荐,主要内容包括:

  1. 索引推荐的问题定义和工业界的成熟方案;

  2. 索引推荐近几年的研究进展;

  3. 我们对索引推荐问题的建模;

  4. 索引推荐在业务场景下的效果。

 

 
 

随着云原生、国产化时代的开启,IT系统技术架构的复杂度越来越高,运维支撑的难度也越来越大,数字化、智能化转型是必然趋势。本议题将以某大型企业为例,分享混合云架构下全景可观测能力建设实践,主要包括以下内容:

  1. 某大型企业IT系统架构演进背景及路线;

  2. 混合云全景可观测平台建设方案;

  3. 可观测能力解读,如何快速发现及分析定位问题;

  4. 基于知识图谱的故障根因分析实践。

 

 

 
 

微博作为中文互联网舆论主战场,经常要经受突发超级热点事件的洗礼,随着近年热点事件带来的流量越来越高,峰值到达速度越来越快,微博面临着巨大的技术挑战。本议题将介绍微博如何通过基于混合云的高可用架构技术应对上述挑战,以及亿级用户规模场景下建设高可用架构体系的思路和实践经验。

 

 

 
 

本议题将介绍平安银行的数据库自主可控转型路线规划、数据库重构迁移的具体案例,包括产品架构选型、数据模型转换、数据迁移的工具与方法,应用流量双写与切换的框架,以及遇到的问题和解决方案:

  1. 选型新型数据库的评估维度;

  2. 如何进行安全、高效、透明的模型转换和数据迁移;

  3. 如何建设融合传统与新型数据库的统一自动化运维平台。

 

02
数 据 库 专 场
 

底层设计暗流涌动,数据库多元发展下的新跃迁

 

适听人群:DBA、数据库开发、分布式数据库、图数据库、向量数据库等从业人员

 
 

爱奇艺App作为国内头部的长视频应用,注册账号数及活跃用户数都非常庞大,对应的数据存储体系建设具有相当大的技术挑战,在提供每秒百万级高速读取能力的同时,需要保证持久层与缓存层的数据最终一致性。针对这类技术场景,将为大家分享以下实践经验:

  1. 分布式、高可用存储系统的建设;

  2. 数据一致性保障的实现;

  3. 可用性与一致性的设计平衡。

 

 

 
 

大模型具备强大的语言理解和生成能力,向量数据库能高效存储和索引大规模向量数据。将两者结合,可实现高速数据访问、智能决策和快速问题解决。通过大规模数据分析与大模型预测,我们能快速发现关键问题、优化系统、提升可靠性和效率。本议题将深入探讨原理、优势和应用场景,分享创新解决方案和成功案例,具体包括以下内容:

  1. 智能决策和问题解决:如何利用大模型的语言理解和生成能力,结合向量数据库的相似性搜索,快速做出敏捷决策和解决问题;

  2. 系统优化和故障排查:如何通过对大规模运维数据的分析和挖掘,结合大模型的预测能力,快速发现系统优化和故障排查的关键问题;

  3. 数据驱动的运维策略:如何利用大模型和向量数据库的结合,实现数据驱动的运维策略,提升系统的可靠性、效率和安全性。

 
 
  1. 讲述字节跳动自研图数据库ByteGraph的发展历史;

  2. 分析当前ByteGraph基于分布式KV架构的存储引擎问题;

  3. 剖析ByteGraph第三代分布式图存储层设计:基于提供分布式Blob存储构建图的Btree引擎;

  4. 结合图图语义,加速ByteGraph查询能力。

 


 
 

混合云作为云计算的一种形态,通过私有云和公有云协同工作,提高用户跨云的资源利用率、增加业务灵活性。本议题将分享OceanBase 4.x单机一体化架构如何解决敏捷态业务对资源池化与弹性扩缩容需求的同时,满足企业级混合云的业务架构和HTAP场景,以及RPO=0、RTO<8s的高可用保证。

 
 

我们一般会用服务可用性和数据可靠性两个指标来度量存储系统的服务能力。对于数据可靠性行业一般会用N个9来表示,但影响数据可靠性的因素众多,比如副本数、硬件等,我们在系统设计中如何控制这些可能会影响可靠性因素的指标,进而达成N个9的数据可靠性设计指标,这对存储系统的架构设计来说是个不小的挑战。本议题将结合vivo存储系统的实际案例来介绍数据可靠性的计算,以及如何在存储系统设计中进行控制。

 

03
运 维 专 场
 

AI技术加速狂飙,运维模式出现大变革

 

适听人群:应用运维、业务运维、智能运维、算法、SRE、云原生研发/运维等从业人员

 
 

本议题将介绍货拉拉监控团队在智能监控领域上的建设成果。其中,团队通过采集丰富的云产品的观测数据、收集所有自研中间件的指标数据、将链路与日志数据和指标数据融为一体,打造了一个功能强大的监控平台。在运维领域,团队提供了清晰易读的以图展示的业务拓扑,实现了业务指标大盘的自动巡检功能,开发了智能降噪、维度下钻、根因分析等功能的智能报警平台,大大简化了运维工作,显著提高了应用的稳定性。本次分享主要包括以下内容:

  1. 如何在多云环境下,集成云产品指标、中间件指标、业务指标,形成统一的监控平台;

  2. 如何从运维需求出发,设计行之有效的监控产品功能;

  3. 了解智能报警平台如何在货拉拉落地,及其具体实战效果。

 

 

 
 

近几年SRE在行业中越来越受到重视和关注,那SRE到底需要负责什么具体工作?这些工作的广度和深度如何界定?有没有SRE全局治理生命周期?浙江移动SRE团队开展了SRE运维体系成熟度研究,将给大家阐述和回答以上问题,同时也留给大家更广的研究探讨方向,本次分享主要包括:

  1. 如何快速组建SRE团队;

  2. SRE需要具备哪些专业能力;

  3. SRE全局治理生命周期;

  4. SRE实践案例技术分享。

 
 

新东方集团有几十个地方校和机构,各地散落的存储和计算资源没有统一化管理和流程,我们在此基础上,研发了新东方运维门户系统(Pandora),该系统承载了线上所有业务的云资源申请、基于FinOps的成本控制、数据平台、安全中心等,同时根据新东方业务的特殊性,将基础数据进行了资源整合,形成了运维一体化的安全数据平台,本次分享议题包括:

  1. 系统地了解平台研发设计初期,如何做好服务设计、开源软件与自研结合;

  2. 针对已有数据流程,利用最少的研发成本集成至平台,加快整合速度;

  3. 理解什么是安全开发,并分析其疑难杂症、问题点;

  4. 分享FinOps运维和研发关注的经验和建议。

 
 

传统的业务质量体系建设需要投入大量人力做业务梳理、场景定义、指标计算、异常盯盘等,效率低,成本高,SRE中的SLO工程给出了更科学、高效的质量体系建设方式。本议题将介绍SLO工程方法论、如何实践SLO工程,以及如何围绕SLO工程演进到GOC体系,来建设1-5-10能力和风险控制,主要包括以下内容:

  1. 可用性指标的观测对象、观测方案和落地实践;

  2. Google SRE中最核心的SLO工程方法论及SLO实施经验;

  3. 如何以SLO为核心建设业务质量体系;

  4. 在没有GOC组织的情况下GOC能力如何落地。

 

 

 
 

数据库的稳定性是业务稳定的基座,因此保障数据库稳定运行是所有DBA的首要职责所在,本次分享将展示知乎如何通过梳理、调优、平台化等手段,保障数据库的稳定和高效运行,主要内容包括:

  1. 数据库稳定性概要:定义+方式方法+指标;

  2. 数据库选型:合适的场景合适的DB;

  3. 数据库优化:DB规范+调优;

  4. 平台化:慢日志+监控报警+数据库巡检。

 

 

 
 

本议题将启发听众解决指标、日志、调用链等工具分散问题,实现AIOps低代码,以及实现业务级全局端到端。具体分享内容如下:

  1. 对现有的Skywalking、Dynatrace、Xtrace工具能力进行针对性整合综合互补端到端监控可视化能力,提升业务端到端监控能力的易用性和落地展示效果;

  2. 拉通metric、log、tracing(对应cmdb监控、日志、调用链等)三类数据,提供对IaaS、PaaS、SaaS层横向端到端、纵向端到端以及以业务为视角聚焦串联IaaS、PaaS、SaaS三层关系的业务端到端运维能力;

  3. 结合AI能力(根因定位、异常检测),提供实时业务调用拓扑,助力故障定位、根因分析等智慧运维场景。

 

04
行业&AI实践专场
 

数智化布局如火如荼,AI能力再升级

 

适听人群:数字化转型、智能化建设、金融科技落地、国产数据库研发/运维等技术从业人员

 

 
 

数据库自治指的是数据库具有自我管理和自我优化能力的能力,该能力可以帮助企业节约大量时间和人力成本,同时提高效率和保证数据安全性。AI4DB作为构建数据库自治能力的关键技术,在实践中发挥了非常重要的作用。在此次分享中,我们将为大家详细介绍AI4DB在美团数据库自治能力构建过程中,各方面的应用实践:

  1. AI在DevOps领域能解决哪些问题;

  2. 如何实现大规模时间序列的实时异常检测及诊断、自愈;

  3. 大语言模型LLM能带来什么新的改变。

 
 

工商银行统筹金融业务创新发展和技术体系演进需求,打造平稳、高效、安全、普遍适用的一体化数据库转型解决方案,突破传统数据库转型方面的主要技术瓶颈和实施障碍,有效屏蔽数据库特性差异和业务逻辑,有效降低技术复杂度和转型工作量,解放应用研发生产力,让科技力量更加聚焦于金融业务创新和数字化转型领域。本议题将聚焦传统数据库转型领域,分享工商银行平滑迁移技术方案及具体实践经验。

 

 

 
 

本议题将从AIOps建设背景、落地思路、实践案例、未来方向等四个方面介绍农业银行AIOps智能运维建设之路,主要包括以下内容:

  1. 大型银行如何通过数据赋能、场景驱动的方式建立AIOps智能运维体系;

  2. 大型银行在AIOps领域开展了哪些场景实践,如何通过场景建设来提升运维效能。

 
 

本次分享将介绍京东科技智能运维整体能力、传统运维与智能运维在故障预警到根因定位的直观比对时间轴,以及智能运维建设的价值。还将详述时序异常检测算法学件在京东科技线上横向业务场景,纵向监控、数据库、网络、资源调度等多个场景的落地经验,并提供以下启发:

  1. 运维算法学件建设经验,持续化迭代训练体系搭建方案;

  2. 运维算法学件与真实运维场景落地结合的实践经验;

  3. IEEE智能运维方向论文收录经验,知识产权创新点挖掘方法。

 
 

本议题将介绍智能运维的机遇与挑战,建设银行智能运维建设的目标、基本框架、主要创新点、具体实践以及智能运维标准的研制情况等,主要包括以下内容:

  1. 数字经济大背景下,智能运维的机遇和挑战有哪些;

  2. 国有大型商业银行IT运维数字化、智能化转型的方向及思路是什么;

  3. 建设银行在智能运维方面做了哪些研究与实践,取得了怎样的效果;

  4. 智能运维标准的研制进展如何。

 

 
峰会议程

图片

 

 
报名方式

 

图片

事不宜迟,码上报名

 

点这里了解峰会更多详情及报名

最新评论
访客 2024年04月08日

如果字段的最大可能长度超过255字节,那么长度值可能…

访客 2024年03月04日

只能说作者太用心了,优秀

访客 2024年02月23日

感谢详解

访客 2024年02月20日

一般干个7-8年(即30岁左右),能做到年入40w-50w;有…

访客 2023年08月20日

230721

活动预告