数据网格领域中有哪些供应商?
时间:2022-03-05 05:26:01 | 来源:行业动态
时间:2022-03-05 05:26:01 来源:行业动态
让我们来看看这个数据网格世界中的一些玩家,然后看看ETR数据。
现在,当然,ETR 没有数据网格这个类别也没有数据网格供应商这样的东西;你要构建数据网格,而不是购买它。因此,我们所做的是使用 ETR 数据集过滤某些行业,以识别可能对数据网格有贡献的一些公司,并了解它们的表现。
上面的图表描绘了一个我们经常喜欢分享的流行观点。它是一个二维图形,纵轴是Net Score或消费动量,横轴是数据集的市场份额或普及率。我们过滤了分析、数据仓库等板块的数据,这些数据反映了数据网格的参与状况。
让我们观察一下。
和通常情况一样,微软Azure和AWS以高消费速度和市场占有率在这个市场中遥遥领先。Oracle也很突出,因为这个世界上大部分的数据都存放在该公司的数据库之中它没有消费动量,但是该公司仍然很突出。你可以看到谷歌云几乎没有存在感,但是它的动量有所提升。
请记住,在40%处的红色虚线代表了我们对高水平消费动量的主观看法。
Snowflake的惊鸿一瞥
Snowflake公司一直被认为是Net Score方面的金标准,并且在Enterprise Technology Research数据集方面保持了较高的支出水平。在许多方面,Snowflake的数据市场、数据云愿景和数据分享方法都非常契合数据网格的概念。Snowflake在营销中使用了数据网格这个术语,但是在我们看来,这种表述还不够清晰,我们觉得该公司仍然在试图弄清楚如何才能传达它的真正含义。
我们不认为 Snowflake 是一种整体架构,但是该公司的营销有时候会使用一些术语,让听众按照传统思维进行推断。我们的感觉是这实际上是由客户驱动的。我们的意思是,Snowflake 客户非常习惯于整体架构方法,并且因为 Snowflake 使用起来非常简单,所以为他们在旧有的组织结构和思维模式下采用Snowflake的产品铺平了道路。
实际上,在数据网格的情境下,Snowflake 的价值在于能够快速轻松地启动(和关闭)虚拟数据存储,并通过联合治理在Snowflake 数据云中共享数据。Snowflake 的愿景是抽象物理云位置(即 AWS、GCP 或 Azure)的底层复杂性,并在其治理的数据云中实现全球共享。在理想的状况下,这种方法能够最大程度地减少为了分享数据而制作拷贝的需要尽管有时出于延迟的考虑,仍然需要拷贝。
最重要的是,实际上,我们认为Snowflake 非常契合数据网格概念,并且已经为未来做好了准备。
其他值得注意的供应商
Databricks这家公司也很有趣,因为该公司有动量,我们预计,该公司在IPO时在纵轴上的位置会进一步升高。该公司拥有强大的产品和非常好的管理服务。刚开始的时候,每个人都认为Databricks 会尝试成为大数据领域的红帽,并围绕着Spark 构建服务。
可是没有,这家公司努力的方向是构建具有强大人工智能和数据科学能力的托管服务,并且将数据湖提升到了新的水平。在我们看来,这家公司当然是值得关注的,并且会和Snowflake产生碰撞。我们需要做更多的研究,但是我们始终相信Databricks的做法非常契合联合式数据网格的模式。
出于显而易见的原因,我们把很多其他的数据库公司也纳入其中例如Redis Labs公司、MongoDB公司、MariaDB 公司、Couchbase和Teradata。还有SAP SE;这并不完全是因为HANA for SAP,还因为它是这个市场的重要参与者,IBM也是如此。
Cloudera公司包含了Hortonworks公司和慧与的Ezmeral,后者包括慧与公司收购的 MapR 业务。其中包括一些正在发展的早期 Hadoop 部署。当然,Talend SA 和 Informatica公司也是两家值得注意的数据集成公司。
我们还把一些人工智能/机器学习专业公司和数据科学公司也纳入进来了,比如DataRobot,该公司刚刚获得了2.5亿美元的巨额融资;还有Dataiku、H2O.ai和ThoughtSpot,最后这家是使用人工智能让数据民主化的专业公司,在我们看来,也非常契合数据网格的概念。
我们将VMware公司的云放在图中作为参考,因为它确实是主流的本地基础架构平台。