「Masakari优化」
时间:2022-03-07 14:42:01 | 来源:行业动态
时间:2022-03-07 14:42:01 来源:行业动态
Masakari项目是专注于OpenStack云平台高可用的开源项目,实现了云主机、关键进程和物理机三个不同层次的高可用,主要通过Monitor检测云主机、关键进程和物理主机的故障,一旦检测到故障,就触发故障恢复机制,恢复云主机和物理主机的重要业务。
浪潮云海OS研发团队则通过客户诉求、现场问题反馈等方式,有针对性的对Masakari项目进行深入研究和探讨,设计了针对云主机、关键进程和物理机等多层面故障检测、判断处理矩阵,能有效应对云平台可能触发的故障场景。
在最新的Wallaby版本,技术团队在主机状态检测机制的基础上进行创新,提出并实现了主机连续检测机制,通过检测主机的网络连接状态以确定主机是否故障,并设定故障节点云主机的疏散策略,增强了云平台的高可靠性。
图4中(左)为Masakari项目原故障检测机制,Monitor只探测一次,当云平台存在网络抖动时存在误判风险;图4(右)为改进后的故障检测机制,通过多次探测平滑预测物理主机的节点状态,管理员可设定Monitor探测阈值,仅当连续检测到节点故障时才会触发主机故障的高可用事件,提高主机故障检测的可靠性。