我观察到一个很有意思的现象:现在的企业在数据治理的路上,似乎总是在做“仰卧起坐”。
想躺平不管数据质量,但又不得不面对数据脏乱差,企业经营无数可用的窘境。
数据,成为企业在存量时代竞争绕不去的要素。
这样就导致,每隔一两年,企业内部就掀起一场数据治理运动,开大会、定规则、上工具。
可最终总是虎头蛇尾,治理成果难以持续。
一家零售企业的 CTO 就曾感慨:“我们的数据治理项目,好像每隔两年就要重启一次,问题反反复复解决不了。”
再看互联网大厂也不例外。
几乎每家企业都经历过类似的困境:数据治理一阵风,项目结束后一地鸡毛,数据问题依旧如影随形。
为什么数据治理总是陷入这种“周期性运动”?
这背后的核心原因是什么?
又有何解?
一、数据治理“仰卧起坐”困境始末
企业在数据治理上反复折腾,主要是因为“治标不治本”。
治理项目看似声势浩大,但往往缺乏持续性和系统性,尤其在数据标准方面做得不到位。
常见的几个问题包括:
1、局部治理,头疼医头
哪个部门数据出了问题,就集中治理哪个部门,缺乏全局视角。
2、缺少顶层设计
很多企业没有把数据治理上升到战略层面,只是被动应对业务问题。
3、过度依赖工具
认为买了数据治理平台就万事大吉,忽略了标准和流程的建设。
4、缺乏关键人才
数据治理需要懂技术、懂业务、懂管理的人才,但企业内部往往缺少这样的人,很多企业的数据治理是 IT 部门在牵头搞,搞了半年,数据治理要服务的业务场景和目的都整不明白,结果可想而知。
这几个问题有组织问题,也有人才问题,但归根结底,还是缺少了数据标准。
如果没有统一的数据标准,数据治理就像盖房子没有地基,看似搭起来了,但很快就会坍塌。
PS:可能很多人看到这,就准备走了,因为他们知道数据标准这件事情不好落地,甚至没法落地,一个字:搞不了。
二、数据标准为啥对数据治理重要
什么是数据标准?
简单来说,数据标准就是企业内部对数据的统一定义和规范,包括数据的命名、格式、口径、分类等规则。
数据标准贯穿数据的整个生命周期——从数据的采集、存储,到处理、分析和应用。
如果没有数据标准,各部门的数据各自为政,口径不一致,指标打架,数据分析结果自然难以信任。
想象一下,如果一个城市没有交通规则,每辆车都按自己的方式行驶,城市交通会变得多混乱?
同样的道理,企业的数据也需要“交通规则”,而数据标准就是企业数据的“红绿灯”和“分道线”。
这么说还是很抽象,我们看一个简单的例子。
一个完整的数据标准,涵盖了字段的命名规则、数据格式、业务口径、分类分级、数据质量要求等,下面以“手机号码”为例。
字段属性 |
|
字段名称 |
MOBILE_NUMBER |
|
员工的个人手机号码,用于联系员工及发送通知 |
|
全部采用大写字母+下划线分隔,字段名要体现业务含义。例如,MOBILE表示手机,NUMBER表示号码。 |
|
|
|
|
|
|
|
|
|
|
|
|
通过制定以上数据标准,可以有效地提高数据质量,确保数据可用性,提高数据的长期可维护性,更重要的是能够显著提升数据一致性,实现数据一致共享。
三、数据标准有哪些应用场景
很多人会有疑惑,制定了一堆标准有什么用呢?
接下来,我们一起看看,在数据治理过程中,数据标准有哪些应用场景。
在数据治理实践中,数据标准的应用场景非常广泛,主要体现在以下几个方面:
1、规范建模
很多企业在数据建模时,会遇到业务口径不一致的问题。
例如,财务部门和供应链部门对“成本”这个指标的定义可能完全不同,导致分析结果出现偏差。
通过数据标准,可以建立统一的模型定义模板,确保每个指标的口径一致。
2、数据研发规范
在数据开发过程中,企业经常遇到脚本不符合规范的情况,导致数据质量问题。
某零售企业在引入数据标准后,通过事前阻断机制杜绝了不规范脚本上线,从源头上提升了数据质量。
3、数据质量规则
数据标准可以用于数据质量的事前控制和事后治理。
在数据采集环节,设置事前阻断规则,避免错误数据流入系统;在数据分析环节,进行事后稽核,清理不合规数据。
4、数据安全管理
通过数据标准对数据进行分类分级管理,可以有效保护企业的数据资产。
比如,对敏感数据进行特征识别和监控,设置不同的访问权限,确保数据安全。
四、数据标准如何发挥价值
“我们明明已经制定了很多数据标准,但是,最终数据治理项目还是烂尾了,搞不懂啊”
我相信这不是一个人的心声。
为什么有了数据标准,数据治理还是失败了呢?
尽管数据标准如此重要,但很多企业在实际操作中却依然“踩坑”。
主要有以下几个原因:
1、一次性工程
很多企业将数据标准的建设当成一次性工程,标准制定好之后就束之高阁,没有动态更新和维护机制。
随着业务的发展,标准逐渐失效。
2、乙方撤场后,甲方无法持续运维
数据治理项目结束后,外部顾问团队撤场,企业内部缺乏持续运维数据标准的人才,导致标准无法真正落地,标准成了死标准,成了一堆废标准。
3、标准落标率缺乏监控
企业没有对标准的执行情况进行监控和考核,导致数据标准成为“纸面规则”,各部门执行松散,久而久之就被遗忘了。
总结一下就是:标准没有跟随业务发展持续做运营迭代,逐渐的标准无法跟上业务节奏,进而被业务抛弃,重新回到无数据标准时代。
那么,如何让数据标准真正发挥作用?
要想让数据标准真正落地,企业必须在以下几个方面下功夫:
1、建立数据标准委员会
设立专门的团队,负责数据标准的制定、更新和维护工作,确保标准始终与业务需求保持一致。
2、培养内部数据治理人才
减少对外部乙方的依赖,建立企业内部的数据治理能力,培养既懂业务又懂技术的复合型人才。
3、引入标准落标率监控机制
在数据平台中设置标准落标率的监控功能,将各部门的标准执行情况量化,纳入绩效考核指标。
这些其实并不难,但很少有企业能够真正落地。
国外企业已经很少谈论数据标准了,因为对于他们来说制定数据标准是一件基础且必要的事项,已经成为共识,不需要再被拿来讨论。
而我国很多企业依然处于数字化转型初期,缺乏对数据要素的前置治理投入和重视,相关人才储备也不足,进而导致企业反复推进数据治理工作。
说好听些叫,从实战中学习,说不好听些,就是...(这里构词有点困难,脑补吧!)
五、小结
没有数据标准的治理,都是治标不治本。
数据治理不是一次性的项目,而是一场长跑,需要持续优化、动态维护数据标准。
只有让数据标准活起来,成为企业日常数据管理的一部分,数据治理才能真正发挥价值。
如果字段的最大可能长度超过255字节,那么长度值可能…
只能说作者太用心了,优秀
感谢详解
一般干个7-8年(即30岁左右),能做到年入40w-50w;有…
230721