18143453325 或

所在位置：首页 > 营销资讯 > 行业动态 > 挑战：内存规模限制使 Spark 优势无法充分发挥

挑战：内存规模限制使 Spark 优势无法充分发挥

时间：2022-03-28 21:39:01 | 来源：行业动态

时间：2022-03-28 21:39:01 来源：行业动态

Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎，常用来构建大型、低延迟的数据分析应用程序。Spark一个主要特点在于，其能够在内存中进行计算，这使得其数据分析效率往往高于其它计算引擎，但是，服务器内存资源的限制也使得其性能的扩展存在着一定的瓶颈，在超大规模负载中无法充分发挥其利用内存进行计算的性能优势。

某全球领先的语音识别服务提供商是最早将Spark应用到生产环境的团队之一，该公司的语音云通过几千台服务器构成的云计算平台向用户提供多样的、实时语音处理能力，日均服务终端用户超过15亿，日增数据超过100TB。
2014年该公司基于Spark和AI技术构建了DMP大数据平台（用户数据管理平台）。DMP平台的主要功能就是收集、存储、分析和挖掘庞大的用户数据，以实现广告精准投放。

客户业务逻辑结构图

Spark在该公司的大数据平台中主要用于海量用户数据分析，每天支撑稳定运行的Spark SQL统计分析指标和SQL脚本有几千个。但是在将Spark SQL用于海量用户数据分析的过程中，仍然面临着一些痛点，这些都限制了该公司语音云的数据分析能力。

Spark的性能不仅受到CPU、内存、网络、磁盘等硬件设备的制约，而且Spark SQL目前还不支持索引，也严重影响了Spark SQL在进行大规模数据分析时的性能，索引能够提升数据检索的效率，降低硬盘的IO瓶颈；

随着数据量越来越大，即席分析的需求越来越强烈，即席查询是用户根据用户自己的需求，灵活选择查询条件，系统能够根据用户的选择生成响应的统计报表和结果集；在数据仓库和大数据分析系统中，即席查询使用的越多，对系统的性能要求也就越高，如果内存能够缓存更多的热点数据，能够极大的提升即席查询处理速度并降低响应延迟；

数据既有随机读的需求（即席查询-Ad-hoc），又有全表扫描的需求(机器学习)；机器学习就是通过特定算法从海量的历史数据中学习规律，从而对新的样本进行分析并对未来做出预测，在模型训练的过程中会产生大量的中间结果数据，通常情况下需要将中间结果数据持久化到文件系统上，如果内存能够缓存更多的中间结果数据，可以提升模型训练的速度；

关键词：优势,无法,充分

网站
营销
设计
运营
优化
效率
专注
电商
方案
推广

解决方案&服务

客户&案例

营销资讯

关于我们

解决方案&服务

客户&案例

营销资讯

关于我们

微信公众号

为了最佳展示效果，本站不支持IE9及以下版本的浏览器，建议您使用谷歌Chrome浏览器。点击下载Chrome浏览器

关闭

快捷入口

挑战：内存规模限制使 Spark 优势无法充分发挥

全面的计算产品组合

婚纱摄影行业微信朋友圈广告投放案例

洞察客户需求，匹配最优选择

剧透3：现场实操，技术专家面对面教你高效开发

深度认证彰显合作价值

报名通道课程分享

被忽略的小游戏APP源码变现盈利方式

因此，为远程办公创造良好的沟通环境，是提升沟通效率

唱音乐剧的人有多可爱，看了《爱乐之都》你就明白

在线直播源码，和这些方面无法撇清的关系

快捷入口

挑战：内存规模限制使 Spark 优势无法充分发挥

推荐文章

在中国人民银行征信中心网站无法注册 说目前系统尚未收录您的个

我是怎么入了WEB开发的坑，无法自拔。

站长网播报：泡泡网部分地区无法正常打开 20多家小说网站因涉黄关

无法通过百度联盟申请的常见原因

CargoX平台付款400美元，Cargox网站第三方验证一直无法通过原因，aci

google广告无法上线 提示拒登:网站含有恶意软件或垃圾软件

zblog后台无法登陆 只刷新页面解决办法

百度站长平台抓取诊断总是出现抓取失败“DNS无法解析IP”

wordpress后台登陆缓慢，原因是谷歌Open Sans字体无法加载

DEDECMS后台提示系统关闭会员功能，无法访问此页面的解决方法

全面的计算产品组合

婚纱摄影行业微信朋友圈广告投放案例

洞察客户需求，匹配最优选择

剧透3：现场实操，技术专家面对面教你高效开发

深度认证彰显合作价值

报名通道 课程分享

被忽略的小游戏APP源码变现盈利方式

因此，为远程办公创造良好的沟通环境，是提升沟通效率

唱音乐剧的人有多可爱，看了《爱乐之都》你就明白

在线直播源码，和这些方面无法撇清的关系

在中国人民银行征信中心网站无法注册说目前系统尚未收录您的个

google广告无法上线提示拒登:网站含有恶意软件或垃圾软件

zblog后台无法登陆只刷新页面解决办法

报名通道课程分享