天梭M13的内存高可用挑战
时间:2022-03-10 17:51:01 | 来源:行业动态
时间:2022-03-10 17:51:01 来源:行业动态
RAS特性(即服务器的可靠性Reliability、可用性Availability以及可服务性Serviceability)对于大型关键应用主机来说尤为关键,能够让主机容忍各类软硬件故障,可以显着延长系统平均无故障时间,保证客户业务持续稳定运行,是保障系统高可用性的技术基础。
M13的可用性设计覆盖了系统的每个部分,极为复杂,本文只介绍一项内存可用性技术--IMS内存检测隔离。
内存错误和故障是引发系统硬件故障的原因之一,一方面,从SDR到DDR,再到目前的DDR3,内存的容量和性能不断提升,内存颗粒容量的增大、单元密度增加、生产工艺的复杂,客观上增加了内存缺陷检查和测试的难度;另一方面,天梭M13最大支持1536个DIMM插槽,内存容量高达48TB,使得内存发生错误和故障的概率显着增加。