18143453325 在线咨询 在线咨询
18143453325 在线咨询
所在位置: 首页 > 营销资讯 > 信息时代 > 数据仓库分析(数据库)

数据仓库分析(数据库)

时间:2022-11-14 08:30:02 | 来源:信息时代

时间:2022-11-14 08:30:02 来源:信息时代

    数据仓库分析 : 数据仓库的建模分析。利用维度模型进行数据仓库分析设计的一般步骤为:
(1)数据调研:有关数据调研的内容和要求,采用数据流图和数据字典对问题进行描述。
(2)确定数据范围:确定数据范围实际上是对操作型数据存储(operational data store,ODS)进行主题划分的过程,这种划分是基于对业务系统调研的基础上而进行的,并不十分关心整个数据仓库系统上端的应用需求,但是需要把上端的应用需求与ODS数据范围进行验证,以确保应用所需的数据都已经从业务系统中抽取出来,并且得到了很好的组织。一般来讲,主题的划分是以业务系统的信息模型为依据的,设计者需要综合各种业务系统的信息模型,并进行宏观的归并,得到企业范围内的高层数据视图,并加以抽象,划定几个逻辑的数据主题范围。在这个阶段,以E-R模型表示数据主题关系最为恰当。
(3)根据数据范围进行进一步的数据分析和主题定义: 在第二步中定义出了企业范围内的高层数据视图,以及所收集到的各种业务系统的资料。在这一步中,需要对大的数据主题进行分解,并进行主题定义,直到每个主题能够直接对应一个主题数据模型为止。在这个阶段,将把第一步生成的每个E-R图中的实体进行分解,分解的结果仍以E-R图表示。
(4)定义主题元素: ①定义维、度量、主题、粒度、存储期限。②定义维的概念特性: 维名称,名称应该能够清晰表示出这个维的业务含义;维成员,也就是这个维所代表的具体的数据; 维层次,维成员之间的隶属与包含的层次关系,每个层次都需要定义名称。③定义度量的概念特性: 度量名称,名称应该能够清晰表示这个度量的业务含义。④定义主题的概念特性: 主题名称和含义,说明该主题主要包含哪些数据,用于什么分析; 主题所包含的维和度量; 主题的事实表,以及事实表的数据。⑤定义粒度: 主题的事实表中数据粒度说明,这种粒度可以通过对维的层次限制加以说明,也可以通过对事实表数据的业务细节程度进行说明。⑥定义存储期限: 主题的事实表中数据存储周期。
(5)迭代、归并维、度量的定义: 在ODS中,因数据来自于多个系统,数据主题划分时虽然对数据概念进行了一定程度上的归并,但具体的业务代码所形成的各个维及维成员等还需要进一步归并,把概念统一的维定义成一个维,不允许同一个维存在不同的实体表示。
(6)物理实现: 定义每个主题的数据抽取周期、抽取时间、抽取方式、数据接口、抽取流程和规则。物理设计不仅仅是ODS部分的数据库物理实现,除设计数据库参数、操作系统参数、数据存储设计之外,有关数据抽取接口等问题也必须清晰定义。

74
73
25
news

版权所有© 亿企邦 1997-2022 保留一切法律许可权利。

为了最佳展示效果,本站不支持IE9及以下版本的浏览器,建议您使用谷歌Chrome浏览器。 点击下载Chrome浏览器
关闭