企业数据资产目录的建设步骤,看这篇就够了
时间:2023-07-29 21:30:01 | 来源:网站运营
时间:2023-07-29 21:30:01 来源:网站运营
企业数据资产目录的建设步骤,看这篇就够了:越来越多的企业将数据视为转型发展和提升治理能力的重要战略资产,并对这一重要资产进行系统性、体系化的管理,以便充分挖掘数据的战略、战术价值。鉴于此,对数据资产进行全面盘点、构建企业级的数据资产目录成为了数据资产管理的一项基础性工作,正在各行各业如火如荼的开展。如何构建数据资产目录,如何管理与使用数据资产目录,也成为大家关心的话题。
为什么要建数据资产目录
通过数据资产目录,可以解决数据在哪里、数据谁负责,数据如何用等一系列问题。数据资产目录的准确性,也决定了应用时的效果。
- 数据在哪里:业务部门能够通过数据目录查询到现有数据资产情况以及索引对应的系统表字段,定位权威系统数据来源。
- 数据谁负责:在数据质量检核规则发现问题时,根据字段所属的数据资产来确定数据质量问题的牵头整改责任归属。
- 数据如何用:精准定位数据所在系统/表/字段,提升数据提取需求的准确性和效率;打通系统间形成的数据孤岛,实现编码规则等标准的统一规范、使数据互联互通。
一个实用友好的数据资产目录,能够打通查数/取数环节、打通基础类数据和指标类数据的联系,并通过人工智能和机器学习等先进技术,更好地支持数据的探查和关联推荐。
如何建设数据资产目录
我们在进行数据资产目录构建时,需要结合数据资产类型,定义数据资产的属性,不同资产类型对应不同业务属性,管理属性,应用模式、资产目录视角等,达到千数千面的效果,最终形成数据资产权威、可信、可用的企业级数据资产目录。
第一步:数据资产梳理数据资产管理最重要的是,企业如何确定哪些数据能够作为资产进行管理,并进行应用。识别企业自身的数据资产,一般用5个方面衡量:
- 业务权重:这个数据是否属于核心业务的运营范畴;
- 角色群众:这种数据对高层的决策是不是会带来直接的影响;
- 指标数据:一般情况下,95%的数据指标都可以放入到数据资产;
- 使用频率:频率越高,说明数据重要性越高;
- 技术存在与可控性:通过一些技术手段,能够对数据进行一个获取,维护,管控的状态,管控程度与可控性,都是辅助的一个数据指标。
以上划分维度和标准,企业可根据自身实际情况进行扩充或调整,最终目的是制定符合企业实际业务需要的数据资产划分标准,进一步筛选出企业自身的数据资产。然后是通过技术元数据、业务元数据、管理元数据将数据资产的业务权重、决策权重、使用频度、分布范围以及技术承载与可控性五类属性进行配置。
第二步:数据资产目录体系框架设计以业务领域构建资产目录为例,可以通过资产盘点,梳理银行数据主题分类/核心业务板块,再根据业务要素逐步向下划分二级目录、三级目录,最后到叶子结点的信息项上。信息项的定义也是从业务出发,梳理业务板块都有哪些数据内容,例如客户信息包括:客户名称、联系方式、地址、证件类型、证件号码等。
第三步:建立数据标签体系,完善分级分类在数据资产分类中,以目录结合标签的形式进行数据资产分类,通常以系统主题、业务主题、组织架构主题3个维度作为目录视角,其它的维度作为标签。上图中可能罗列得不是很全,但是分类的方法和维度应该对大家有所帮助,我们可以分为系统主题、业务主题、行业、组织架构主题、资产类型、服务分类、安全主题、资产形态主题等。
每一个数据资产具备多个属性,同样也归属于多个分类。按照不同的业务域、应用系统、重要程度、数据分布、更新频率、资产类型、安全等级、保密等级等维度,构建资源标签体系,完善资源画像,使各类数据消费者都能快速发现和获取需要的数据。
第四步:数据资产分布与映射关系建立在技术元数据采集的基础上,探索信息项所属系统来源,确认其系统分布情况,将数据资产信息项与物理表/字段间构建映射关系,并确定权威数据来源。对于单个业务系统而言,只需要将主表中经过分析最准的内容映射过来,而不是所有表,避免数据使用者因为多表冗余存储造成混淆。
我们以“客户中文姓名”这一信息项为例,梳理数据来源与系统表映射关系如下:
第五步:构建企业数据资产目录数据资产目录应满足不同角色用户的数据消费需求。基于“业务域-业务子域-业务活动”的架构思想,建立业务视角数据目录模板;基于资源类型、存储位置、安全等级、使用频率,生成技术视角数据目录;同时数据资产目录应能支持数据目录管理、资产查询、资产分析以及资产交换等场景。
第六步:数据资产目录应用与管理构建好数据资源目录后,需要进一步体现数据资产的价值,对于库表、文件等常见数据资产,可以开放数据查询、下载、交换、分析以及API服务。资产的价值在于向数据消费者的提供各类数据,资源管理者可以通过构建数据资产服务门户, 满足不同消费者的服务需要,也便于对资产的持续管理。
工具如何承载企业数据资产管理
数据资产目录管理已经变成了数据治理工作中不可或缺的一个环节,建设数据资产目录除了需要需要相应的组织和机制支撑,当然也离不开技术工具支持。
亿信华辰提供元数据管理平台和数据资产管理平台帮助构建数据资产目录,构建全景图,随时掌握数据资产的运行状态。元数据管理平台EsPowerMeta,是一款致力于处理技术元数据、业务元数据、管理元数据,帮助各行各业用户获得更多的数据洞察力,进而挖掘出资源隐藏价值的软件产品,包含全自动元数据采集和关联、元数据采集、 端到端元数据管理、字段级元数据分析等功能。
数据资产管理平台EsDataAssets,是一款通过定义、盘点、规划无序的数据类和应用类资源,提供全局统一的数据资产门户,开发授权丰富、高效、安全的数据服务方式,协助构建主题明确、服务完善、权责清晰的数据资产管理体系的软件产品。
具有如下特点:
1、将数据资产盘点方法论融入资产盘点工作流程,支撑企业跨业务域、跨部门、跨专业领域的常态化数据资产盘点;
2、利用智能化标签技术,对数据资产进行多维分类以及异常识别,提高资产盘点质量降低人工投入;
3、融合元数据、血缘关系、数据标准、数据质量、数据安全、认责管理等数据治理信息,构建适用不同业务场景的资产目录服务;
4、结合数据资产、业务知识、应用知识构建企业知识图谱,方便数据应用参与者高效获取技术、业务知识。
核心功能展示:案例分享
时代中国依托亿信华辰睿治数据治理平台,通过资产盘点了解集团总体数据规模和分布情况,实现对业务系统和数仓数据的线上化及时管控;并通过元数据、数据标准、数据质量三管齐下,实现数据治理流程线上化,实现数据分类自动化和数据资产可视化。