类比NBA队伍建设,趣谈如何打造一支运维明星团队

温峥峰 2018-02-24 18:30:31

作者:温峥峰

小鹏汽车互联网中心运维技术专家、车联网运维高级经理,超过8年互联网运维经验,曾就职于网易游戏、百田信息,经受过各类海量规模互联网业务模式的历练,专注于运维自动化、DevOps实践、运维服务体系建设与SRE时代下的运维价值挖掘。知乎专栏:https://zhuanlan.zhihu.com/hiphone-devops

 

笔者在专栏前文《论运维的职业发展和自我修养》里曾描述过广义的运维服务体系,而运维服务是通过团队中每位成员来具体落实的,它是团队能力输出的一个综合结果。

 

那么,如何搭建一个优秀的团队才能输出高质量、稳定、可靠的运维能力呢?

 

角色分工
 

 

此处写一段NBA队伍和运维团队的角色类比,纯粹瞎编,just for fun~

 

一个完整的篮球队伍体系,最少要包含以下角色:

 

1
 
组织者

 

负责全队组织、串联,是团队的战术发动机,具备良好的大局观。

 

代表人物:詹姆斯、保罗、哈登、纳什。

 

运维类比:具备长远的规划能力,能挖掘每位组员的潜能,能带领团队走向正确方向的Team Leader。
 

2
 
得分手

 

顶尖的得分能力,关键时刻能依赖个人能力打破得分僵局。

 

代表人物:乔丹、科比、杜兰特、艾佛森、麦迪。

 

运维类比:能在某些方向具备强悍技术攻关能力或者达到有业界影响力水平的技术专家。
 

3
 
策应者

 

团队战术的中转站,具备良好的视野和赛场阅读能力。

 

代表人物:邓肯、加内特。


运维类比:能和业务方或者第三方服务商进行良好的协作沟通和运维资源调度的运维人员。
 

4
 
防守者

 

防守尖兵,冻结对方的得分手。

 

代表人物:伦纳德、皮蓬、巴蒂尔。


运维类比:能利用各种技术手段和业务运营思维完成全方位业务运行质量监控的运维人员。
 

5
 
篮板保护者

 

控制篮板球且能主宰比赛的篮下怪物,由防守转向进攻的起点。

 

代表人物:奥尼尔、张伯伦、霍华德。


运维类比:能把运维工作从被动式运维进化为主动式技术运营的运维人员。

 

以上角色分配并非一成不变,有些人也能同时兼任几种角色,如詹姆斯能兼任以上5种角色,其他超级巨星也至少能兼任2、3种角色。

 

在虎扑BBS曾经对NBA历史第一阵容有过广泛的讨论,最终能让绝大多人信服的结论就是“魔神皇佛鲨”,组合名虽然画风中二,但很有辨识度,而这套阵容唯一的明显短板就只是缺乏稳定的三分输出而已。他们5人分别是:

 

1
 

 

控球后卫——魔术师约翰逊,身高206cm,利用身高优势用大屁股碾压对位的防守者,具备良好的大局观和无死角的传球能力。

 

 

 

 

2
 

 

得分后卫——篮球之神乔丹,身高198cm,历史最顶尖的得分能力,攻防一体,无需多介绍。

 

 

 

3
 

 

小前锋——皇帝詹姆斯,身高203cm体重110kg以上,历史级别的身体素质加顶级球商,现役最全面的球员没有之一。

 

 

4
 

 

大前锋——石佛邓肯,身高211cm,内线防守基石加上稳定的得分输出,兼备上乘的策应能力。

 

 

 

5
 

 

中锋——大鲨鱼奥尼尔,身高216cm体重135-160kg之间的重型坦克,可以在内线肌肉群里面翻江倒海,兼顾篮板、内线得分、防守。

 

 

 

对于不懂篮球的人可能会想:要赢比赛就是比得分而已,直接把历史前5的得分王弄一起不就行了吗?按这个逻辑,这个阵容很可能是乔丹、科比、杜兰特、艾佛森、麦蒂、张伯伦、贾巴尔等人的随机组合。那这样的得分王阵容能战胜上面的“魔神皇佛鲨 ”吗?

 

我认为是不行的。好的团队需要配置均衡与全面发展,这个道理对于任意的团队体育运动应该都是适用的。同理,对于运维团队,直接堆5个顶级技术专家在一起,这个团队的综合能力也未必能达到最好效果。

 

个人能力
 

 

如何量化一个运维工程师的个人能力,首先是要确立能力指标的种类,这里为了简化模型,只取了6个指标:操作系统、运维自动化、虚拟化与容器、网络与安全、监控体系建设、业务支撑能力。

 

现实世界中肯定需要有更多的指标项,而且考量的标准也会更加复杂,抛开现实中的繁杂,这里我们只做一个最简单的数字模型。

 

假设有4个运维工程师,分别是A、B、C、D,他们的各项数值我用下面的图例来表示。

 

 

 

如图所示,A 和 B 是能力数值比较平均的两个人,他们在这6项技能的数值都比较相近,有某些技术方向较好的能力值且其它方面没有明显短板;而 C 和 D 的有能力特长且有明显短板的两人,当这两类人分别组成团队时会产生怎样的化学反应呢?

 

团队能力
 

 

 

 

如图所示,我们假定整个团队的能力指标的数值取决于团队最强那个人的数值高低,其中蓝色线是由一群能力平均的 A 和 B 组成的团队, 而黄色线是由一群有能力特长的 C 和 D 组成的,而且 C 和 D 的技能项刚好互补,那么特长组合的团队能力的数值就会全面提高。

 

当然,上面所取的数值是比较极端的,是完全理想化的情况。

 

这是为了表达一种团队建设的思路:利用某些具备能力特长的人员大幅度提升团队的单项能力上限。

 

一些经验
 

 

前文的经验都是我最近工作中切身感受到的,因为我所在的初创公司正在组建运维团队,上级领导的思路是在人员总量不多的前提下,尽量招聘能独当一面的技术专才,而不是招聘各方面平庸的技术通才。

 

这和我以往的经验有很大的差异,我向来都是倾向于招聘和自己“类似”的队友,因为人很容易陷入自己的主观判断和心理舒适区,和自己“类似”的人往往更加容易沟通和管理,但这样的组建思路对整个团队的全面能力发展未必有好处,正如上图中的团队综合能力比较,可明显看出非常符合这个推论。

 

运维团队是为了解决业务保障问题而存在的,团队建设者要做的不是平衡每位成员的能力,而是要发挥团队的最大能力值,如果有成员在某些领域特别强,那么 Team Leader 需要竭尽所能为其创造最佳的能力输出场景,而非浪费资源和时间为其补上短板。

 

然而,凡事都是有两面性,一群技术专才组合起来的团队必然比一群平均的团队更加考验 Team Leader 的管理水平,挖掘各位队员的能力并使之带动整个团队的能力提高是 Team Leader 的工作重心之一。团队管理关注的不是人,而是人和目标、人和资源、人和人之间的关系,好的团队管理者是要引导人和资源以及和其他人能够更好的协作,达成目标。

 

对个人提升的建议
 

 

作为运维工程师,最理想的状态是没有明显的技能短板,又有某些技能特长能给团队带来更高的上限。比如你身边肯定有些大牛,他身上的标签可能类似“Docker大牛”、“AI算法专家”、“Linux内核代码提交者”、“MySQL性能调优圣手”等,这时只要你有某些方向足够牛逼,大家也不会关注你有哪些短板,例如即便是 AI 专家也很有可能不知道 TCP 三次握手四次挥手,但这不影响他的牛逼。

 

我们可以每隔一年或者半年对自己有一个完整的能力评估,评估的方法有很多,我自己习惯用两种方法快速地 review,分别是横向和纵向评估。

 

  • 横向:和同龄人相比,去掉一些大众化的技能之后,我还剩余哪些技能高于业界平均水平?

  • 纵向:和去年同期的自己相比,我有哪些技能有所提升?

 

如果横向和纵向对比都没有一个比较好的结果,大家也不用灰心,我在职业生涯的前5年基本也处于啥都会点却都不精通的状态,及早知道自己的优势与劣势,再从战术、战略层面提高自己也为时不晚。

 

如果发现自己没什么特别有竞争力的技能,不妨从业界当前最热门的技能中选择自己最感兴趣的一项重点突破,现在运维业界最热的词汇有:DevOps、虚拟化、容器、大数据、云计算......

 

花一两年时间专攻一项,下一年的 review 中你会发现自己会越来越有进步,然后有正向反馈让自己继续专注下去,以培养自己的核心竞争力。

 

注意是只选一项而不是多项,上面提到的几个热门方向都有足够高的迈入门槛,花一两年时间能完成一项已经是非常厉害了,新的一年祝好运!

最新评论
访客 2023年08月20日

230721

访客 2023年08月16日

1、导入Mongo Monitor监控工具表结构(mongo_monitor…

访客 2023年08月04日

上面提到: 在问题描述的架构图中我们可以看到,Click…

访客 2023年07月19日

PMM不香吗?

访客 2023年06月20日

如今看都很棒

活动预告