数字转型、治理先行

数据治理(Data Governance)是组织中涉及数据使用的一整套管理行为。由企业数据治理部门发起并推行,关于如何制定和实施针对整个企业内部数据的商业应用和技术管理的一系列政策和流程。

数据治理不是一蹴而就的,它是一个漫长而持续的过程,没有一针顶破天的诀窍,也没有立竿见影的途径。只有将数据治理变成一种常态化机制,就如同我们每天吃饭、睡觉一样,形成一种习惯、一种文化、持之以恒、不忘初心、不懈努力,才能达到预期目标。


为什么要做数据治理?

答:要建立数据标准,提升数据质量,实现数据资产统一管理。

问:为什么要建立数据标准、提升数据质量,不做会怎样?

答:数据质量问题比较多,无法提供准确的数据报表,影响业务效率,无法支撑企业的数字化转型。

问:都影响到了哪些数据报表、哪些业务?

答:XX报表不准确、统计口径不一致、系统之间数据孤岛,数据集成困难……

问:为什么会造成数据报表不准确,口径不一致,系统集成难?

答:因为数据标准一致,数据源的数据质量差。

采用咨询常用的5Why分析法,似乎已经得出了数据治理的现状和目标。将其总结下:通过数据治理实现企业数据的标准化、提高数据质量、提升业务处理的效率,为数据分析提供准确的数据支撑,赋能业务,助力企业实现数字化转型。

但是,仔细分析这样的调研结果是浮于表面的,围绕数据的问题在原地打转,没有将为什么要做数据治理真正想透。

数据要产生价值,需要一个合理的“业务目标”,数据治理的所有活动应该围绕真实的业务目标而开展,建立数据标准、提升数据质量只是手段,而不是目标。因此数据治理的第一步不是分析数据问题,而是分析业务问题,找到企业的核心业务诉求,定义数据治理的目标和范围。


数据治理主要目标

针对企业目前在数据管理方面存在的问题,需要对企业数据架构进行规划,构建企业数据管控体系,实现数据全生命周期的统一管理,建立数据标准与规范,提供全面、统一的数据服务,灵活支撑业务,为企业精细化管理提供保障,为企业发展创造价值,提升企业运营与管理能力,打造企业核心竞争力。

数据架构规划定义了数据标准、改造数据环境、规范数据模型、规范数据源、建立了标准的数据管控体系、形成了与管理层和决策层相结合的数据管控组织。其规划的目标如下:

  • 分析业务运作模式的本质,归类整理包括业务表单、统计报表等在内的业务实体。

  • 建立包含基本数据集、信息分类编码和数据模型等在内的数据架构。

  • 建立业务信息分布矩阵,使数据源分析定位到业务活动层面。

  • 形成规范的数据标准,标准化定义数据。

  • 以科学的方法识别出有价值的分域主数据,形成系统的主数据管理。

  • 建立数据管控体系和政策,对数据生命周期各个环节进行有效的评价和考核。


数据治理方案概略

企业数据架构的目标就是打破信息孤岛,实现企业信息数据共享;应用与数据分离,实现数据从部门到企业的提升;建立数据转换为价值的体系,让数据发挥出企业核心资源的效用,实现数据的增值。

数据规划的总体指导思路是:以企业组织架构、业务信息以及现有的数据管控体系等内容,参考行业较好实践以及国际参考模型(如TOGAF集成信息模型、FEA数据模型),形成企业数据规划报告,包括划分业务主题域,进行数据分类、识别相关实体、构建数据模型,规范主数据与编码规则,建立数据管控体系,构建数据管控平台。

其中:数据管控体系必须从组织、标准、规程和技术保障四个方面建立。明确的数据管控组织架构和角色职能划分可以有效地保障数据规程的落地;数据标准是数据管理的基础;数据管理规程定义了数据管理应当遵循的规范;技术平台的建设和优化为数据规范管理提供支撑。这四方面构成了完整的数据管控体系,保证数据管理有标准、有制度、有稽核、有手续、有手段、有检查、有考核,使得各项数据管理工作能够得到有效落实,达到数据准确、完整的目标,并能够提供有效的增值服务。


实施效益

建立企业数据架构规划,指引企业数据治理持续改进;

建立数据标准,提升管控能力,有效保障数据治理目标有效落地;

建立数据模型(主数据模型),规范数据全生命周期管理,打破信息孤岛,实现数据有效共享;

建立数据质量管控体系,提高业务数据的一致性,增强集团、跨域、跨业务的协调能力;有效支持内控,减低企业的信息安全风险;

建立和优化企业数据技术架构,形成端到端的信息流传递与管控,优化业务流程,建立可视化数据决策体系,充分利用数据资产,提升企业核心竞争力。


数据治理不是一个“项目”,难以立竿见影的效果!

数据治理的最终目标是赋能业务,提升数据价值。这是一个持续漫长的运营过程,需要逐步完善、分步迭代,指望一步到位完成数据治理是不现实的

项目型的数据治理,是不全面的,无延续性,能够解决一时的数据问题,但很难获得持续的数据价值。

因此说,数据治理不是一个“项目”,而是一个持续运营的过程。我们也可以将这个过程,看作是由一个个数据治理“微项目”组成,连续的、螺旋上升的模型。一个项目的结案,不是企业数据治理的终点,而是企业数据治理真正的起点!


做了数据治理,为什么数据质量依然很差?

例如企业多年前就做了数据治理,建立了数据治理平台,元数据管理、数据质量管理等功能都有了,但是数据质量问题还是很多,导致花了很多钱建设的BI系统基本都没人用,有什么好的方式解决?

原因是数据质量差、BI用不起来,这个问题虽然常见,但是10家有相同问题的企业中,有9家的原因是不一样的。在没有经过详细调查,不了解具体背景的情况下,是不能贸然给出建议的。

盘点了一般引发数据质量问题的各种原因:

  • 有业务方面的数据定义不明确,也有技术方面的数据抽取不完整;

  • 有管理方面的岗位职责不清晰,也有执行层面的数据操作不规范;

  • 有数据处理加工过程中出现了错误,也有数据源本身就有问题;

  • 有数据治理系统功能有缺陷,也有系统强大但是没人用……

做过了数据治理,企业的数据质量就一定能提升吗?其原意是要问:上过了数据治理系统或实施了数据治理项目,为什么还会有数据质量问题。这个问题很复杂。正如上文中的项目型数据治理,点到为止,治标不治本。有的企业认为数据治理就是上一套强大的数据治理平台,只要平台功能强大,就能管好数据,这恰恰是陷入了另一个误区——唯工具论,岂不知数据治理的本质是管理数据,而不是管理程序、脚本和任务。

另外,还有很多企业是出现了数据问题,并且对业务造成很大影响之后才去进行治理的——被动式治理,失去了治理数据的主动权,常常是解决了一个问题又引出了更多的问题。……

世界上没有“包治百病”的数据平台,只有将数据治理常态化,持续地去做才是王道。


数据治理之道

1. 数据治理需要体系建设

为发挥数据价值需要满足三个要素:合理的平台架构、完善的治理服务、体系化的运营手段

根据企业的规模、所属行业、数据量等情况选择合适的平台架构;治理服务需要贯穿数据全生命周期,保证数据在采集、加工、共享、存储、应用整个过程中的完整性、准确性、一致性和实效性;运营手段则应当包括规范的优化、组织的优化、平台的优化以及流程的优化等等方面。

2. 数据治理需要夯实基础

数据治理需要循序渐进,但在建设初期至少需要关注三个方面:数据规范、数据质量、数据安全。规范化的模型管理是保障数据可以被治理的前提条件,高质量的数据是数据可用的前提条件,数据的安全管控是数据可以共享交换的前提条件。

3. 数据治理需要IT赋能

数据治理不是一堆规范文档的堆砌,而是需要将治理过程中所产生的的规范、流程、标准落地到IT平台上,在数据生产过程中通过“以终为始”前向的方式进行数据治理,避免事后稽核带来各种被动和运维成本的增加。

4. 数据治理需要聚焦数据

数据治理的本质是管理数据,因此需要加强元数据管理和主数据管理,从源头治理数据,补齐数据的相关属性和信息,比如:元数据、质量、安全、业务逻辑、血缘等,通过元数据驱动的方式管理数据生产、加工和使用。

5. 数据治理需要建管一体化

数据模型血缘与任务调度的一致性是建管一体化的关键,有助于解决数据管理与数据生产口径不一致的问题,避免出现两张皮的低效管理模式