数据旅程的全覆盖
时间:2022-04-01 05:21:02 | 来源:行业动态
时间:2022-04-01 05:21:02 来源:行业动态
每一个企业的数据之旅都是独一无二的,但是数据停靠的四个站点基本是一致的,包括数据库、数据湖、数据分析、机器学习,亚马逊云科技也专注数据旅程的每一步构建适合的工具。
亚马逊云科技覆盖了所有类型的数据库,实现专库专用;在数据湖上Amazon Lake Formation可以快速构建数据湖的同时构建统一的数据湖管理,今年推出了Lake Formation行与单元级别安全新功能,支持在行一级以及行和列交叠的单元级别去做数据访问的权限精准控制;在数据分析上也提供了最适合的工作负载,今年最大的变化是无服务器数据分析,宣布了四个无服务器分析服务,分别是Amazon RedShift、Amazon EMR和Amazon MSK和Kinesis stream;机器学习除了在芯片有右面的布局,同时提供了Amazon SageMaker全托管机器学习集成开发环境。
顾凡指出,跨四大站点还有两件重要的事,数据融合和数据治理,同时需要考虑如何让公司或者组织中的每个人都可以更容易、更加自助地做数据分析和洞察。
同时,Amazon SageMaker发布了新功能Amazon SageMaker Canvas可以让业务人员通过拖拽的方式跨多个数据源收集数据做特征分析,然后用Amazon SageMaker Canvas AutoML技术创建模型,这样就可以让业务人员,包括对数据相对熟,但是Python不熟的人创建需要一个数据科学家进来才能创造的高质量模型,这样可以极大降低机器学习的门槛。