跳出传统IT视角,谈数据治理与公司治理的融合丨ITSS WG1国际组组长潘蓉

潘蓉 2016-08-11 10:02:24

本文根据潘蓉老师在〖2016 DAMS中国数据资产管理峰会〗现场演讲内容整理而成。



(点击这里获取潘蓉演讲完整PPT)

 

讲师介绍

潘蓉工信部ITSS WG1国际组组长,国际数据治理标准ISO38505推动者与联合编辑,中国首届“十大IT女性”,曾任英国标准协会中国及香港区首席IT专家,国际注册的信息安全、IT服务、业务连续性等主任审核员,带领团队为数百家知名大型企业、政府部门提供服务,受邀在云安全、业务连续性等国际论坛发表主题演讲,在IDG等IT领域杂志报纸发表多篇文章。《中国数据治理白皮书》执行主编、ISO技术文档《数据治理模型、框架和应用》撰写人。


大家好, 我是来自ITSS WG1国际组的潘蓉,今天我要分享的主题是数据治理。大家对数据治理这个词应该不陌生,我将重点从标准的角度对数据治理的定义和范围进行拓展。


本次分享将分成以下两部分:

  1. 数据治理是什么

    简单介绍数据治理要解决的问题,尤其是在大数据环境下,我们要如何看待数据治理这个概念。

  2. 数据治理框架

    这个框架也是在我参与主编的《大数据治理与服务》这本书中提出的,是对国家标准、国际标准的一个最基础的借鉴成果;同时,站在公司层面来看,数据无疑是一种资产,所以我也会将数据治理跟公司治理融合起来分享,而不仅限于传统的IT视角和技术视角。


一、什么是数据治理


1
 
数据治理要解决的问题

现在数据越来越重要,但我们在工作中时常会碰到这几个问题:



  • 销售预测


公司里销售部门给出的数据是不是正确的?我原来所在的公司,老板就经常说:月初的时候很高兴,到月底就要心脏病发了,因为销售给出的数据不正确。这个不正确有时不是市场的原因,有可能是销售本身的原因。尤其是在一些跨国的大企业里,集团层面的老总做决策,通常都是基于各个底层的汇总数据来进行,也就是说,如果他手头上的底层数据都是经过加工的数据,那这个决策的质量就可想而知了。这也是我所认为的数据治理中要解决的一个非技术层面问题。


  • 淘宝刷单


现在在网上随便输入“刷单”这两个字,就能搜到很多专业团队来做这个事情,但搜到的这些数据或者团队做出来的数据,它的质量可信性是靠专业技术能解决的吗?


  • 航班准点率


如果大家经常出差,去看一下航空公司给出的航班准点率,就会发现与你实际的感受是非常不一致的。从乘客角度来说,我们肯定希望航班准点率是端到端的,比如我今天从上海到北京,原来预计12点降落,如果这个航班没有12点之前到达,我们认为它就是不准点的。可是对航空公司来说,他们的航班准点率是只要关上了机舱门就算,因为它还要靠机场协调、后勤内部服务等相关部门配合。所以准点率的定义我们到底该站在客户还是企业的角度去定?然后航空公司能提供的是一个端到端的客户满意度吗?这些指标应该怎么去制定,这些都是数据治理中必须考虑的问题。


  • 中国人口统计


大家觉得网上对外曝光的中国人口数据是否准确呢?有的人对此抱有质疑,所以通过很多渠道,对一些公开的报道进行了仔细的计算,发现其实中国大陆人口只有7.5亿,和政府统计出来的数据是不一致的,那这种情况下,到底哪一方的数据可信?同样,这涉及到统计口径定义的问题。


  • 客户数据可以交易吗


数据能交易吗?当它脱离原来的业务联系时,我们可以把它当做一个货币商品的财务资产来交易吗?尤其是在大数据环境下,这一部分的数据治理,面临哪些问题?


我们再看下面一则新闻。



这则新闻相信很多人看过,今年4月4日,土耳其全国国民信息数据库遭到黑客攻击而导致数据泄露、曝光,并且曝光得非常彻底。可以看到,开放的底层数据涵盖数据库的每个字段,非常细,包括每个总统的姓名、他父母的名字、居住地址等等。那么,在大数据环境下,这些安全问题要怎么考虑?除了大数据本身环境下的基础架构安全之外,我们要如何基于这些敏感数据去做基础设施、基础架构,然后是分级、分类、分字段的安全保护、个人隐私的保护,这些实际上都是数据治理面临的一些难题。


2
 
大数据环境下的数据治理

今天我们所谈论大数据环境下的数据治理,相比传统的数据治理,有哪些不同?可以看到,原来我们在网上搜索“数据治理”这个词,可能大家会看到更多的是谈论“数据架构”,或者说作为一个数据治理的项目,它可能只是在做一个数据质量的管理。而现在我们谈数据的管控体系,实际上已经有几个新的需求是在传统数据治理中没有的。


  • 第一,数据的价值:

    这个价值既有对内的、对业务的,还有一些涉及到对外开放做融合的,这些价值是不是能有一个总的价值体系去管控?

  • 第二,数据安全:

    分工上做数据治理和做数据安全的常常是两个团队,两者相互没有沟通,底层也很少交流,这样的情况下要怎么做融合、做数据治理大的框架?

  • 第三,数据治理的工作:

    通过刚才那么多的例子我们发现,数据治理不仅仅是技术的问题,必须从技术、管理层再到治理层,真正把它当做一个治理的话题来谈。


那么大数据环境下,数据治理的概念到底是什么? ISO38500给出的定义是,数据治理是对数据资产利用的指导和控制。根据定义,首先,它是针对数据资产而言,然后再是怎么去利用数据资产,对它进行指导和控制。



这个指导和控制分为两个方面,一是面向数据,二是数据驱动。面向数据的管理也就是说把数据作为一个对象,怎么去管好它,这方面包括数据资产管理平台、元数据管理、统一资产视图、数据架构等;数据驱动的管理,即把数据作为一个类似的财务资产,并思考怎么去运营它。我下面将从这两个方面提出一些相关的管理流程,圈出一些数据管理标准化。


二、数据治理框架


1
 
数据资产价值使能框架

从数据治理的核心来看,我们认为数据是通过服务来产生价值的,而数据治理中主要的几项活动我们称之为EDL,即监督、指导和评估,也就是说,治理层要通过这三项具体的活动给数据管理作出指导。


通过前面对数据治理的一些理论研究和实践研究,我们推出了一个数据治理模型——数据资产价值使能框架。其中,理论研究参照了ISO、DGI、DAMA、IBM、Gartner、Cobit、新炬等公司的框架,而实践上,我们统一对金融、能源、电信、制造、事业单位以及BAT等领域进行了访谈。



从整个架子来看,模型的理论体系包含三个方面,第一是原则,即数据治理的原则是什么;第二是范围,指做数据治理时要关注的几个大领域与话题;还有就是实施与评估,这里面已给出了实施的流线图,而由于评估是上升到公司治理的层面,所以还增加了审计的模块。


下面详细展开。


关于战略这个模块,实际上是要求由治理层来决定一家企业的业务到底有多依赖数据。用打车来做个例子,可以想象一下,在这个行业最开始的时候,是没有出租车司机,没有出租车公司的,这时如果你有车,又有乘客的需求,那你就可以开始做出租车业务了,这个时候对数据的依赖度可以是0。后来有了出租车公司,而这时出租车公司的运营也开始依赖于数据,这个依赖度有可能是10%、30%抑或是50%,取决于它的管理精细度。当它要调度这些司机时,就得了解这些汽车的运能、司机所在的位置等,它可以推出一个要坐车就去打电话这样一个依赖于数据的系统。但是现在随着大数据的发展,像滴滴、Uber或者其他更多的一些打车APP,它既没有车,也没有司机,它有的是一个品牌,这时从背后来讲,这些公司的运营是一个数据公司,它对数据的依赖性已经达到了100%,而它的数据种类和丰富程度也取决并决定了它业务上能提供的服务丰富程度。


比如说滴滴在它的数据系统里附加了气象局数据,那它就可以根据气候的情况去做调价的处理,也可以提醒出行的人一些注意事项。就是这个数据的丰富程度,还有对数据的依赖程度,从战略的模块来说其实是公司的治理层必须要做的。只有当战略层做出这样的决定,才可能说这家公司适用于数据治理,否则它跟数据没关系,就不会去谈数据治理。当然战略层面的决定也要考虑到与业务战略的一致性。


而看到这个框架的底层——大数据架构,也就是刚刚前面谈到的企业的元数据管理,它可能会有一系列关于企业资产的分析视图,包括系统开发一直到系统上线的整个统一管理,以及它的关联关系。还有就是大数据存储、数据仓库、主数据,这都是在大数据架构这一大的模块里谈到的,同时标准也会加进去。另外就是大数据整个的全生命周期管理。从业务的角度,我的业务怎样产生数据、怎么去存储数据、然后使用数据。


再看到侧面的,一个叫大数据的安全、隐私与合规,一个是大数据质量。在大数据治理中,我们不仅要从技术层面去着手,还要从业务层面去考虑大数据安全。对于隐私与合规,像欧盟的话有数据保护法,用世界贸易组织来讲,它以前可能更多地是在规范食品、用品之类的传统商品贸易,但是现在这些法规实际上还新纳入了很多像数据的跨境流动、或者规定欧盟与美国之间可以实现数据流动的新章法。


还有大数据的质量,大数据质量与传统的质量管理可能又有所不同。如果这个管理是在企业内部的一个小范围环境,这时你还是可以追溯到业务的源头,进而控制质量。但大数据环境下很难,所以怎么去定义大数据管理下的质量,除了传统公司上的一些做法,我们在框架里也提出了一个质量的评定维度。


在实施与评估这一块,我们也有给出一个实施的方法论,成熟度的评估,还有数据的审计(尤其是在针对数据交易过程中的交易前、交易中、交易后)。我记得上海大数据交易所提到过,以后在交易所做数据交易的这些企业、会员都要做数据治理,否则数据的可信度到底是不是合法、质量可不可靠这一系列问题难以保障。


2
 
关于数字资产的价值

前面我们有讲到收购的发生等等,这些都是从财务的角度。对政府来说,数据资产的价值一方面是财务、财政,另一方面比如像气象局,它是政府最早在国内做数据公开的,它的数据开放价值不能仅仅从财务来讲,更多的可能从社会价值、政治价值出发。当它与农业数据、矿产数据的结合,可以更好帮助到农业生产或者矿产开发的安全,带来更大的社会价值与社会效益。而从政治价值来讲,政府数据的公开会带来政局的稳定,焕发生产力。


不过对企业内部来说,业务价值会体现更多,比如说我现在采集到一家广告类公司的数据,我可以拿它来提升销售的转发率,能够缩短销售订单的时间,通过数据将这些度量、细化,这些都是业务的价值体现。


从财务来说,数据资产的评估方式有成本法、市场法和收益法等,尤其是后面两种,成本法容易理解,就是采集这些数据用了多少成本,而市场法和受益法在实际运用当中我们可能会把它混合起来使用,以便更精确、容易地去做数据的估值。



在《大数据治理与服务》一书中我们也提到了数据资产怎么去做转型,提供了一些增值的路径。第一步,可以用于你业务内部的监控和探查,第二步是做业务的优化,第三部是把数据货币化,第四步是驱动业务转型。能够驱动业务转型的例子很多,像我接触到的一个广电印刷行业集团,它们其中有一家是做印刷出身的,它做了很多的印刷,积累了大量的数据,后来他们把这些数据开发成了一个交易行情,进而出售行业交易行情,推出指数交易等业务后,已逐步开始转型,后面已经和印刷没有直接关系了。



现在关于资产配置还有一个新的概念,叫做资产配置的耶鲁模式,这个是由万象所提出来的,它首先讲到数据是一个新型的另类资产,在资产配置的时候要考虑数据资产的预估,也给出了一个预估的数据。它还强调在未来的如果一家公司的数据资产配置里不考虑数据资产,那它的投资收益必定会小于平均收益。



最后讲一下数据治理与公司之间的关系,从组织成员来说,如果你的组织战略已经转型为数据战略,那么你公司的治理层面、管理层面也应该有相应的一些组织架构。首先,要有类似数据治理委员会或者是在现有的战略委员会、投资委员会等治理层的委员会中植入数据的话题。然后,在管理这个团队时,除了技术管理团队,还有质量管理、安全管理。如果把数据作为财产运营来看待,那还要有数据运营团队。当然财务也要加入到数据运营当中。


 
 
精选专题(点击蓝色标题可阅读全文)

近期活动:

Gdevops全球敏捷运维峰会广州站

峰会官网:www.gdevops.com

最新评论
访客 2024年04月08日

如果字段的最大可能长度超过255字节,那么长度值可能…

访客 2024年03月04日

只能说作者太用心了,优秀

访客 2024年02月23日

感谢详解

访客 2024年02月20日

一般干个7-8年(即30岁左右),能做到年入40w-50w;有…

访客 2023年08月20日

230721

活动预告