时间:2022-11-14 14:30:01 | 来源:信息时代
时间:2022-11-14 14:30:01 来源:信息时代
数据集市 : 数据仓库的一个逻辑子集,是一种为满足特定部门的DSS(decision support system)处理需求而专门定制的数据集合。与数据仓库相比,两者主要有如下区别:
(1)数据仓库中的数据是为满足整个企业可能的分析需求而设计的,涵盖整个企业的分析主题域,而数据集市的数据则是为了满足部门的特定需求设计的,只涵盖了一个部门的分析主题域。
(2)数据仓库中不仅包含汇总数据,还包含大量细节数据,而数据集市一般除包含汇总数据外,仅包含少量细节数据。
(3)数据仓库包含丰富的历史数据,而数据集市仅包含有限的历史数据。
(4)数据仓库模型通常采用关系模型及其规范化技术进行设计,主要考虑海量数据的查询而选择优化技术。数据集市模型通常采用多维技术进行设计,如星型结构、雪花型结构等,主要针对分析的灵活性和效率而选择优化技术。
数据集市可分为两种类型: 独立型数据集市(independent data mart)和从属型数据集市(dependent data mart)。
独立型数据集市(图1)是指直接基于现有业务应用系统而创建的数据集市。
图1 独立型数据集市
图2 从属型数据集市