Data Fabric 的最佳载体
时间:2022-03-03 19:48:01 | 来源:行业动态
时间:2022-03-03 19:48:01 来源:行业动态
基于开放的混合云平台 OpenShift,IBM 将 Intelligent Data Fabric 融入到 Cloud Pak for Data 中,以容器化产品的方式快速向客户交付。可以说,承载了 IBM 企业级 AI 能力的 Cloud Paks,是 IBM 混合云与 AI 战略的一个重要支点。在 Cloud Pak for Data 4.0 版本中,整合了 AutoSQL、AutoCatalog、AutoPrivacy、AutoAI 能力,以及 WKC、Watson Knowledge Catalog 等数仓、数据治理和机器学习能力。通过在实验室环境中与 Snowflake 的比较,Data Fabric 能够把查询的速度提高 8倍以上,成本降低一半。
不过,Data Fabric 并不是 IBM 独有的概念,诸如 NetApp、informatica、Talend 等 IT 企业均推出了针对 Data Fabric 的解决方案,那为什么说 IBM Cloud Pak for Data 应该是当前业界应对 Data Fabric 功能最完善的数据平台之一呢?首先,其对于 Data Fabric 需要具备的四种能力有着较好的支持,包括数据之间的虚拟连接、企业数据目录、自动化数据平台、自动化安全策略,这也使得上述四大自动化能力之间有着更好的化学反应。
其次,IBM 数十年来的技术积累给了 Cloud Pak for Data 更多的底气,例如容器化的 DB2 云数仓、数据虚拟化技术的沉淀,以及结合了机器学习、知识图谱等能力的 Watson Knowledge Catalog 等等,交付客户上线之初就能确保在数据共享的过程中能符合类似 GDPR 的数据隐私保护要求。同时,IBM 作为一家老牌的专业数据集成的供应商,数据复制和数据集成的自服务能力也在日趋完善。
许伟杰是 IBM 中国混合云与 AI 华东及华南大区的总经理,加入 IBM 已有 15年的时间。作为一线的业务人员,他深知企业需求的变化和客户对 IBM 产品的反馈。前段时间,我和上海某家着名的医疗大数据公司交流。面临的一个问题是,医院一方面不愿意把数据开放给某个大数据平台,但另一方面,医院又想分析数据,而单个医院的数据量又不够。如果采用了 Data Fabric 架构,加上 IBM 的区块链技术,使用类似联邦学习的概念,是不是就能让数据的读写、分析,以及拥有的权限相互独立?这样就把问题解决了。许伟杰说。