时间:2022-12-20 16:30:01 | 来源:信息时代
时间:2022-12-20 16:30:01 来源:信息时代
分布式数据仓库 : 由分布于计算机网络环境中各结点上的若干子数据仓库组成的数据仓库,它提供有效的协调和管理手段来访问这些子数据仓库。分布式数据仓库有三种类型: 基于局部数据仓库(local data warehouse)和全局数据仓库(global data warehouse)体系架构的分布式数据仓库,主要服务于拥有局部业务和全局业务的全球性企业; 技术分布式数据仓库(technically distributed data warehouse),是指数据仓库数据分布在多个物理存储空间上的数据仓库; 独立演进式数据仓库(independently evolving distributed data warehouse)是指企业中多个面向部门的、独立无关的数据仓库的集合,在这种情形下需要设计员来管理和协调。
1.局部数据仓库和全局数据仓库
局部数据仓库是数据仓库的一种形式,是为不同地区、不同业务类型的分支机构而创建的,仅包含对各分支机构有意义的数据。局部数据仓库是在局部站点上提供和处理数据,每个局部数据仓库都有自己的技术、数据、处理器等。除作用环境是局部以外,它具有与其他数据仓库相同的功能。
全局数据仓库的范围涵盖整个企业或组织,它根据企业级业务需要,把各局部数据仓库中相关的数据进行集成。全局数据仓库包含的数据是企业级公共的、需要全局管理的数据,这些数据有时相当多(如包含客户、产品、财务等),而有时则非常少(如仅包含财务数据)。同局部数据仓库一样,全局数据仓库也包含历史数据。
2.技术分布式数据仓库
技术分布式数据仓库是指从逻辑上看只有单个数据仓库,但从物理上看存在许多有紧密联系但存放在不同服务器上的数据仓库。
采用技术分布式数据仓库的优点包括: 引入代价低,最初采用分布式技术所付出的数据仓库的硬件代价,比最初采用传统的大型集中式硬件所付出的代价低得多; 而且,存放在数据仓库中的数据量在理论上没有限制,如果数据仓库中的数据量开始超过一个分布式服务器的处理能力,那么可以在网络中加入另一个服务器,实现持续增加数据。
采用技术分布式数据仓库的缺点是: 当数据仓库中的处理器扩展到一定数量时,网络上就会出现过量的传输负载; 当一个请求需要的数据分散在多个服务器上时,为了获得数据而访问多个服务器,带来数据传输的增加。
3. 独立演进式数据仓库
开发独立演进式数据仓库过程中,多个独立的数据仓库同时开发,且彼此之间不进行协调和约束。它们是拥有组织或管理上独立的、无关联的数据仓库。独立演进式数据仓库需要设计员来管理和协调。