国产分布式数据库服务商有哪些?
时间:2023-03-31 02:42:01 | 来源:电子商务
时间:2023-03-31 02:42:01 来源:电子商务
利益相关。以一个案例切入,在西门子案例中,SIEMENS DE&DS DSM 团队开发的一套面向设备制造商的数字化解决方案——SIMICAS® OEM 设备远程运维套件,就因为数据库性能问题不得不进行数据架构升级。在它们的 1.0 系统中,使用的是 Flink + Kafka + PostgreSQL + Redis 的架构,落地之后,主要遇到了两大挑战,一个是部署繁琐,一个是应用复杂。
具体来说,因为引入了 Flink 和 Kafka,导致系统部署时非常繁琐,服务器开销巨大;同时为了满足大量数据的存储问题,PostgreSQL 中不得不做分库分表操作,应用程序较为复杂。如何降低系统复杂度、减少硬件资源开销,帮助客户减少成本,成为了研发团队的核心任务。
在确定选择跟数据类型匹配的分布式时序数据库(Time Series Database) TDengine 作为系统的数据库后,其在 SIMICAS® OEM 2.0 版本中移除了Flink、Kafka 以及 Redis,新系统的数据流如下:
先说下上面这个案例里的数据库主角,一款高性能、分布式、支持 SQL 的时序数据库——TDengine ,可以让大量设备、数据采集器每天产生的高达 TB 甚至 PB 级的数据能得到高效实时的处理,对业务的运行状态进行实时的监测、预警,从大数据中挖掘出商业价值。TDengine 能被广泛运用于物联网、工业互联网、车联网、IT 运维、能源、金融等领域。 官网:TDengine | 时序数据库_开源时序数据库_实时数据库 - 涛思数据
1、为什么选择分布式?
众所周知,TDengine 是陶建辉老师在2016年底启动和参与研发的产品。起初,在瞄准时序数据库这个赛道的他,调查和研究了很多在市场上已经很成熟的同类型产品,例如 InfluxDB、OpenTSDB 和TimeScale 等。所以有很多人都会问他,既然这个赛道已经相对成熟了,为什么还要选择迎难而上呢?又怎么才能让自己的产品脱引而出?这就引出了 TDengine 产品最重要的一个特性—分布式。
从 2016 年底到现在,大部分时序数据库都不是分布式的,换句话说,它们不支持水平扩展。即便是 InfluxDB,也只有企业版支持集群,开源版是不支持的。而传统实时数据库更是没有一个支持水平扩展,最多是双机热备。但是随着物联网、车联网的高速发展,IT 基础设施规模的增大,数据的采集量越来越大,单机是没有办法解决问题的,底层数据库必须具有水平扩展能力。
很多企业使用的是开源时序数据库的单机版,后续为了应对海量数据的处理,只好自己投入人力物力,在单机版的基础上,开发自己的 Proxy,对数据进行分片处理。对于数据写入,这种方法简单而且有效。但是对于查询,往往牵涉多个节点,那么 Proxy 就要做各种查询的聚合,导致开发的工作量很大。因此,整个 TDengine 的设计从第一天起,就是支持分布式的。为了便于更多使用开源版本的用户用得更好,在 2020 年 8 月,我们将 TDengine 的分布式版本开源了。
至此,聪明的你可以看出,单纯说一款分布式数据库的好坏是不准确的,优秀的团队肯定是从使用场景出发,为用户解决最根本的痛点。
2、关于产品设计的思考
“做好一款纯粹的产品”,一直是整个团队努力的目标。Jeff 自己也说,我不想把 TDengine 做成一款万能的基础工具,TDengine 只需要在时序数据库的领域持续深耕,将用户提出的痛点和难点作为每一次的技术突破,将自己打造成行业的标准,这才能锻造出一款好的产品,成就一个优秀的团队。除了分布式的特点,TDengine 还在高性能、易运维、零学习成本等方面都有很好的数据表现。
感兴趣的伙伴可以看看以下文章,关于产品架构设计以及性能对比测试
3、团队
尽管人员还未满百人,但涛思数据的团队成员还是很“niubility”的,不仅有来自中科大、卡内基梅隆、密歇根、马里兰、复旦、浙大、清华、北大、哈工大的研究生及博士生们,还有来自硅谷的研发小伙伴,一些员工在入职涛思之前,甚至是某国际一线公司里举重若轻的首席科学家、某公司CTO或技术专家。与优秀的人为伍,你也会变得越来越优秀!
涛思数据收获了来自思否、墨天轮、开源中国等颁发的多项荣誉