在上一篇随想篇中,介绍了数据资源资产化的过程,理解了数据资源、数据资产的区别。这些对于本章的介绍会有帮助,如果仍有疑问可以看上一篇【数据资源到数据资产的华丽转身 ——从“沉睡的石油”到“流动的黄金”】。
说到本章要介绍的数据目录,名字可以说五花八门“企业数据目录”、“元数据目录”、“数据资产目录”、“数据开放目录”、“数据资源目录”。各种目录,常常让人搞不清楚,每种目录都指代的什么?有什么区别?为什么会有这么多的数据目录?
(这也体现了一直说的那句话“数据领域是一个实践的学科”,并不追求各种概念的统一,各种名词、概念解释很多。只要在个人实践中能够适用即可。)
本章我们就梳理一下数据目录的分类,每种目录的用户、目的。通过建立数据目录,来摸清自己的数据家底。
1、数据目录,到底可以分为几类
个人理解数据目录,也可以称之为数据地图,两者其实是指一类的内容,就是展示有哪些表、字段信息的地方。让数据加工者,能够更加快速、便捷、没有重复的加工数据;能够让数据消费者快速的找到、了解,更好的消费使用数据。(数据加工者、数据消费者在【数据治理的边界在哪里】中提到的数据的三个参与方中有介绍。)
先说结论,在所有的数据目录分类方法中,目前个人倾向于分为三个目录:
- 数据资源目录
- 数据资产目录
- 数据开放目录
其中第三个,数据开放目录,也可以叫数据资产开放目录,这里简称数据开放目录,是在数据资产目录的基础上进一步进行开放说明。有时候,两者的区分不是特别明确,可能是一个目录,甚至大部分时候都会是同一个目录。这里为了做具体的定位区分,所有我们分两个目录介绍。
可以看到这三个目录,主要就是围绕着“数据资源”和“数据资产”的,这也是先在随想篇2中对相应概念做下介绍的目的。理解了数据资源、数据资产的概念能够更好的理解数据资源目录、数据资产目录及数据(资产)开放目录。
对于其他名字的数据目录,个人理解可以进行统一,如“元数据目录”、“技术数据目录”,均指“数据资源目录”。“企业数据目录”、“业务数据目录”均是指“数据资产目录”或者“数据开发目录”。
2、数据资源目录
数据资源目录,主要就是业务系统的元数据信息。目标是让数据加工者,更加快速、便捷、统一的了解企业的各个业务系统的元数据信息。这些业务系统的元数据,包括已经入湖的,也包括未入湖的。总之,是一个各个业务系统的数据资源全景。
在数据源模块【数据源的数据接入、业务属性梳理及监控】中,我们已经对公司所有业务系统的数据源进行了统一的梳理、统一的管理。而且,在数据源篇中也提到,良好的数据源信息梳理,能够为数据资源目录打下一个好基础。
原因就在于,数据源模块中对公司所有业务系统的数据源都进行了管理,形成了一个数据源的全景,那么通过这些数据源信息,就能够获取到所有业务系统的元数据信息,也就很容易将所有业务系统的数据资源获取到,形成所有业务系统的数据资源全景&#