18143453325 在线咨询 在线咨询
18143453325 在线咨询
所在位置: 首页 > 营销资讯 > 信息时代 > 数据仓库开发生命周期(数据库)

数据仓库开发生命周期(数据库)

时间:2022-11-14 16:30:01 | 来源:信息时代

时间:2022-11-14 16:30:01 来源:信息时代

    数据仓库开发生命周期 : 数据仓库开发实践的过程。数据仓库的开发过程通常采用螺旋模型,一般分为以下几个步骤:
(1)业务需求分析与数据分析:业务需求分析主要调研并整理用户所要分析的方向性需求,发现业务分析所涉及的问题和对象; 数据分析针对现有业务系统和外部数据源,开展数据业务特征、数据分布特征、数据质量和运行环境等分析; 在业务需求分析和数据分析的基础上,确定数据仓库的主题域。
(2)概念模型设计:在业务需求分析和数据分析的基础上设计数据仓库的概念数据模型,对每个主题域的内容进行明确的描述和定义,主要包括主题域的公共码键、主题域内具有代表性的属性组和主题域之间的联系。目前,E-R图仍是表示数据仓库概念模型的重要方法。
(3)逻辑模型设计:逻辑模型是数据仓库建设的一项重要工作内容,它是数据仓库主题域的逻辑描述,是数据仓库实施阶段的工作基础。目前主流数据仓库管理系统大多是基于关系模型,因此通常采用关系模式来表示数据仓库的逻辑结构。逻辑模型设计的主要内容包括: 按照轻重缓急确定主题域实现的先后次序,确定数据属性的分组策略,设计数据粒度层次,给出数据仓库的关系模式定义和记录系统的定义等。
(4)物理模型设计:基于数据仓库逻辑模型,考虑I/O存取时间、空间利用率和维护代价等因素,结合实施选用的数据仓库管理系统的特点,以提高性能为目标,设计数据仓库的物理模型。物理模型设计的主要任务包括: 确定数据的存储结构、数据的索引策略、制定数据分区的方法、数据的存放位置以及存储分配等。
(5)仓库生成与DSS(decision support system)应用开发: 仓库生成的主要任务是设计ETL(extract,transform,load)的流程,建立与数据源的接口,从操作型环境中抽取数据、经过转换和集成,按照合理的次序加载到数据仓库中,并确定定期刷新的策略。DSS应用开发主要是基于构建完成的数据仓库,设计、开发各类分析型应用。
(6)系统评估与复审: 根据数据仓库的使用情况,对数据仓库的概念模型、逻辑模型、物理模型、查询效率、容量规划等诸多方面进行科学评估,对数据仓库在功能和性能上是否满足需求做出明确的判断,并根据评估与复审的结果进行合理调优和进一步扩展。
数据仓库的开发采用增量和迭代的方式进行,它的构建和应用是一项长期、复杂并面临很大风险的工程,同时也是一个不断完善的过程。

74
73
25
news

版权所有© 亿企邦 1997-2022 保留一切法律许可权利。

为了最佳展示效果,本站不支持IE9及以下版本的浏览器,建议您使用谷歌Chrome浏览器。 点击下载Chrome浏览器
关闭