所在位置:
首页 >
营销资讯 >
行业动态 > 硬汉的软实力:BigDL 和 Analytics Zoo
硬汉的软实力:BigDL 和 Analytics Zoo
时间:2022-04-19 15:33:01 | 来源:行业动态
时间:2022-04-19 15:33:01 来源:行业动态
从设备端到边缘再到数据中心、云端完整的计算架构,英特尔攒足了硬件层面的全栈实力,嗅觉灵敏的它,还将触角伸向了充满探索的领域。
正如硬汉外表下,其实也有一颗软萌的心,这位善于用创新解决世界上最艰巨的问题和挑战的芯片巨人,现在还将硬件的端到端人工智能全栈实力复制到软件:
- 最底层的算法开源帮助用户更高效开发计算库
- 再到上层各种机器学习或者深度学习框架
- 再到最上层开源工具包
BigDL 和 Analytics Zoo是英特尔两个开源项目,它们的存在正是帮助大数据用户、数据工程师、数据科学家、数据分析师在已有的大数据平台上使用人工智能技术,英特尔于2016年开源了基于 Spark 的分布式深度学习框架 BigDL,此后不久又在 Spark、TensorFlow、Keras 和 BigDL 之上构建了大数据分析 AI 平台 Analytics Zoo。
简单来说,BigDL 是一套基于 Spark 分析流水线、以有机方式构建而成的分布式深度学习框架,能够实现主流深度学习框架 TensorFlow、Caffe 以及 Torch 等同样的功能。用户可以借助 BigDL 将 Spark/Hadoop 作为统一的分析平台,从数据摄取、清洁与预处理,到数据管理、机器学习、深度学习以及部署与可视化,一站式完成所有工作。
但这仍然不够。
在部署 BigDL 的过程中,有一部分用户反映希望能继续使用自己更熟悉的其它深度学习框架,例如 TensorFlow,并希望使用 TensorFlow 进行训练。因此,英特尔又在 BigDL 开源半年后推出了 Analytics Zoo,以帮助客户省去在大数据管道上手工拼接众多独立组件的繁琐操作。
Analytics Zoo 作为一个更高级别的数据分析 AI 平台,能够帮助用户利用 Spark 的各种流水线、内置模型、特征操作等,构建基于大数据的深度学习端到端应用。
某种意义上来看,Analytics Zoo是 Spark 和 BigDL 的扩充,可以将 Spark、TensorFlow、Keras 和 BigDL 无缝合并到一个集成管道中,方便地扩展到企业已有的大型 Apache Hadoop/Spark 集群,进行分布式训练或推理。
Analytics Zoo 最大的优势是能够在现有基于 Spark 与英特尔至强服务器的基础设施之上无缝运行各类主流深度学习框架和模型,让用户可以选择使用适合自身需求的深度学习框架做模型训练,无需购买或者设置不同的硬件基础设施。