现代数据仓库的升级路径
时间:2022-04-19 14:18:01 | 来源:行业动态
时间:2022-04-19 14:18:01 来源:行业动态
尽管将数据仓库建立在大数据平台上具有很多优势,比如成本节约、扩展更灵活,但不意味着企业就一定要将数据仓库一步到位迁移到大数据平台上,而是应该根据企业自己的实际应用情况决定是否要进行迁移,如果要进行这种迁移也应该渐进的,迁移路径应根据企业所处的不同阶段进行技术选择。
一般而言,企业数据仓库的建设分别处于如下三个阶段:
起始阶段:处于这一阶段的大多数企业已采购MPP 硬件搭建数据仓库。为了保证业务延续性,对于起始阶段的企业建议以传统技术为主,以大数据技术为辅。例如,ETL 处理主要部分仍然放在MPP 平台,只是利用HDFS 做历史数据归档并进行部分ETL流程改造,利用Spark Streaming 做小批量数据的实时处理。
发展阶段:这一阶段的企业用户已经掌握了大数据的核心技能,发展阶段建议以大数据技术为主,以传统技术为辅。例如:将ETL 处理全部转移到Hadoop 平台,而只将处理逻辑简单的固定报表部分放在MPP 上。
成熟阶段:建议使用Hadoop 平台作为整体架构,将大数据技术应用到极致。
如果经过认真评估,适合向新一代数据仓库迁移,专家建议按照如下步骤来进行:建议先从历史数据和日志数据的处理开始做技术验证,利用大数据技术处理海量的混合结构数据,同时支持实时、在线和离线处理。然后逐步从客户体验、营销为切入点,突出业务价值。利用大数据技术提供实时分析能力。第三,逐步把传统数仓和大数据架构进行完全融合,让全量数据可用 可视, 为业务人员提供自助式数据服务,培养数据思维。最后,从数据角度重构现有价值链,从用数据到养数据,再到数据经济,利用大数据技术建立企业数据资产。
值得一提的是,为了帮助用户顺利从传统数据仓库向新一代数据仓库迁移,Cloudera提供了丰富的工具和服务。比如,Cloudera 推出了针对企业应用进行优化并包含相应工具和售后服务的数据仓库软件版本。相较于免费版本,企业用户可以获得源码级的技术支持服务。其次,Cloudera提供大数据咨询和专业服务。Cloudera 拥有一支极富Hadoop 实践经验的资深专家团队,该团队专门为数据仓库项目提供最佳的现场服务。第三,Cloudera还提供人才培训。Cloudera 大学是世界领先的培训和认证的机构,提供业界最广泛的Apache Hadoop 培训和认证。
综上所述,数据仓库是企业迈向智能化的重要手段,基于Hadoop的大数据平台代表了数据仓库的未来发展趋势。为了尽快加速智能企业的进程,助力企业的数字化转型,企业有必要认真评估自己的数据仓库战略,并基于企业实际应用选择最佳部署路径,不失时机地完成数据仓库的转型。