18143453325 在线咨询 在线咨询
18143453325 在线咨询
所在位置: 首页 > 营销资讯 > 信息时代 > 数据仓库元数据管理(数据库)

数据仓库元数据管理(数据库)

时间:2022-11-15 00:30:01 | 来源:信息时代

时间:2022-11-15 00:30:01 来源:信息时代

    数据仓库元数据管理 : 对数据仓库元数据进行组织、存储、维护和使用等的技术。数据仓库元数据(data warehouse metadata)是指对数据仓库中数据的所有属性进行描述的数据。利用数据仓库元数据来管理和使用数据仓库数据,从而把数据仓库系统的各组成部分有机地凝聚在一起。按描述的内容,可以将数据仓库元数据分为两大类: 技术元数据(technical metadata)与业务元数据(business metadata)。技术元数据主要包括数据仓库的数据模式、相关数据源、数据抽取、转换的规则和流程等的描述信息; 业务元数据描述了业务规则以及数据的业务用法等。
数据仓库元数据管理的核心是为数据仓库各组成部分的元数据制定共同遵守的元数据标准。CWM(common warehouse metamodel)是OMG(object management group)采纳的一个使用、共享元数据的集成数据仓库和业务分析工具的开放式行业标准。CWM是一个完整的描述数据仓库和业务分析领域的元模型(metamodel)。作为一个元模型,CWM提供构建元数据所需的语法和语义,利用这些元数据可以描述一个完整的数据仓库系统的所有组成部分。CWM元模型由多个若干层次的子元模型组成,如图1所示。
这些子元模型主要包括:
(1)资源层:描述组成数据仓库系统的各种不同类型数据资源(如面向对象数据、关系数据库、记录、多维数据和XML数据等)的元模型,这些元模型用来定义相应数据资源的元数据。
(2)分析层:描述数据转换、OLAP(online analytical processing)、数据挖掘、信息可视化、业务术语等的元模型,这些元模型提供了数据仓库系统进行数据分析时所需元数据的语义结构。


图1 CWM元模型


(3)管理层:描述数据仓库过程和数据仓库操作的元模型,这些元模型用于定义针对某些特定处理过程和特定周期性例程操作的元数据。对象模型层和基础层的元模型为上层模型提供支撑。
数据仓库系统由许多部分组成,每个组成部分都有自己的软件工具或系统来管理自己的元数据。目前主要有如下三种形式的体系结构:
(1)集中式体系结构:所有元数据保存在中央存储库中,并作为唯一共享基础,软件工具没有本地存储库。其优点是不存在元数据复制问题,缺点是软件工具不能拥有自己独立的元数据。
(2)分散式体系结构:不设中央存储库,软件工具拥有本地存储库并相互交换元数据。其优点是拥有自己独立的元数据,可优化工具性能,缺点是冗余和为交换元数据需要大量双向连接的开销。
(3)分布式体系结构:其基本思想是结合集中式和分散式方法的优点,各工具拥有各自的本地存储库,同时设置中央存储库复制保存所有共享元数据,各工具支持与中央存储库的接口。
元数据管理体系结构必须合理地平衡共享和自主的两种需求,从而使分布式方法成为主流的元数据管理体系结构,关键在于如何构造中央存储库,以达到集成、可扩展、健壮、开放的体系结构特性要求。

74
73
25
news

版权所有© 亿企邦 1997-2022 保留一切法律许可权利。

为了最佳展示效果,本站不支持IE9及以下版本的浏览器,建议您使用谷歌Chrome浏览器。 点击下载Chrome浏览器
关闭