18143453325 在线咨询 在线咨询
18143453325 在线咨询
所在位置: 首页 > 营销资讯 > 行业动态 > 3 伸展集群(Stretched Cluster)双活数据中心

3 伸展集群(Stretched Cluster)双活数据中心

时间:2022-03-06 15:28:01 | 来源:行业动态

时间:2022-03-06 15:28:01 来源:行业动态

伸展集群(Stretched Cluster)将道熵统一存储平台(分布式存储集群)从一个数据中心(站点)扩展到两个数据中心(站点),以实现更高的可用性和容灾恢复。伸展集群通常部署在同一城市或园区之内,两个数据中心之间的距离通常不超过100公里,且有专用的高速低延迟通信线路相连接。

用户可以使用拉伸集群来实现站点维护计划以及满足容灾需求,因为一个站点的维护或意外丢失,无论是通信故障、意外掉电、火灾还是其他灾害,不会影响集群的整体运行。在拉伸集群配置中,两个数据站点都是活动站点,同时提供存储服务。如果其中一个站点发生故障,存储服务将自动切换到另一个站点。

每个伸展集群由两个数据中心(站点)和一个仲裁主机组成。仲裁主机通常是一台1U或2U服务器,驻留在第三个地点。它只包含元数据,不参与用户数据存储操作。一个最小的双活伸展集群包含两台存储服务器(每个站点各一台)和一台仲裁主机。单个数据中心最大可支持512个节点。



两个数据中心与仲裁主机形成3个独立的故障域。当任何一个站点出现服务中断故障,另外一个站点与仲裁主机将自动剔除故障站点,继续提供存储服务。当故障排除后,集群将新的数据自动同步到曾出现故障的站点。

当两个站点之间的网络连接丢失时,则必须对站点的可用性做出选择,仲裁主机起到了第三方见证和仲裁的作用。在这种情况下,仲裁主机通常会与其中一个站点形成一个集群,并屏蔽另一个站点。当被屏蔽站点再次在线时,数据会重新同步,以确保两个站点都有所有数据的最新副本。

伸展集群使用两个数据中心之间数据同步复制的策略来提供跨站点的冗余和故障保护。每个站点因此形成一个独立的故障域。每个数据块至少有两个副本,确保每个故障域(数据中心)至少保存一个数据副本。每个站点由一个或多个存储节点构成,每个节点内部还具有节点内RAID数据保护,比如RAID10、RAID50、或RAID60,称为本地数据保护,当硬盘出现故障时,可通过节点内的RAID功能实现数据本地恢复,既不占用网络带宽,也不会引起站点之间数据迁移或同步。当节点完全失效时,节点上的数据可自动迁移到本站点其余的节点上。当某个站点增加节点时,该站点上的数据可自动迁移部分数据到新的节点,使得存储空间的使用在站点内更加均衡。

用户也可以将一个站点指定为主站点。其他站点将成为辅助站点或备选站点。在无故障状态下,存储业务由主站点提供。只有在主站点不能提供服务的前提下,业务切换到备选站点。在大数据分析和AI训练及应用中,带有典型的反复读取大量数据的特点,可以选择将主站点配置为高性能的全闪存(SSD固态硬盘)站点,辅助站点为混合型(由SSD和HDD构成)站点,以较低的成本获得更高的性能。



伸展集群的数据中心网络采用二层交换机堆叠技术,即MC-LAG(Multi-Chassis Link Aggregation Group),以满足接入层、汇聚层的二层跨设备冗余、以及L3核心交换机的跨设备冗余。每台存储服务器分别连接MC-LAG中的任意两台交换机,任何网口或交换机出现网络故障都不会导致业务中断,具有极高的可靠性和故障包容能力。根据数据中心的规模大小,可以选择是否仅使用汇聚交换机,或使用更高性能的核心交换机。





基于伸展集群的双活数据中心适用于两个站点A、B间的 物理距离不超过100公里,数据网络往返时延RTT(Round-Trip Time) 不超过5毫秒,网络带宽速度不小于10Gbps。在此前提下,双活数据中心可实现RTO=0, RPO=0最高级别的灾难恢复能力。当两个数据中心的物理距离超过100公里以上,建议采用基于异步复制方法实现远程容灾与恢复功能。

关键词:数据,中心

74
73
25
news

版权所有© 亿企邦 1997-2022 保留一切法律许可权利。

为了最佳展示效果,本站不支持IE9及以下版本的浏览器,建议您使用谷歌Chrome浏览器。 点击下载Chrome浏览器
关闭