具备先进性的K1 Power是如何炼成的?
时间:2022-03-06 23:15:02 | 来源:行业动态
时间:2022-03-06 23:15:02 来源:行业动态
K1 Power最显着的特点就是单机性能,强调纵向扩展。但是当落实到设计层面,包括处理器的主频和I/O扩展能力,它都是一个更高的数量级,这些对设计会有新的要求和挑战。在性能、可靠性、可扩展性,包括安全方面和管理方面,浪潮商用机器进行了诸多思考。
浪潮商用机器有限公司产品研发部副总经理尹宏伟表示,从最早的安腾处理器技术路线转到Power技术路线。浪潮商用机器把K1 Power打造成了一款高可用、高品质、高可靠和安全的服务器。性能卓越、安全可靠、自主可控是K1 Power的显着特点,在可管理性、能耗管理、安全性、可靠性、可扩展性、高性能等方面达到了一个新高度,并且通过部件品质、系统设计、制造工艺、生产过程、质量控制、流程管理等保证了K1 Power先进性。
在系统高性能的维度,尹宏伟说,Power服务器最核心的应用还是核心数据库应用,这就要求性能承载方面表现得足够强大。POWER9处理器性能、内存与I/O带宽优势,让K1 Power服务器在承载核心数据库和开源数据库方面性能优势明显。借助PowerVM,K1 Power服务器高度整合核心业务负载。
尹宏伟表示,K1 Power服务器不但要保证强大的性能,更看重整个系统的高度可靠,这是它设计上的一个很大的诉求。在高可靠性方面,K1 Power服务器秉持高RAS设计理念,通过卓越的设计有效避免出现错误和降低故障可能,包括最高品质的部件、最低数量和功耗的部件、严苛的单个部件测试、高效创新的散热设计、装配和集成测试。比如服务处理器FSP侦测及诊断任何潜在错误的发生,通过硬件设计保证系统持续运行确保可用性,最大程度保证非停机修复故障实现可服务性。
此外,K1 Power服务器关键部件全部冗余设计,包括冗余DRAM芯片 、冗余Fabric Bus、冗余内存总线、冗余I/O控制器、I/O柜、I/O柜链路、VIOS等实现可靠的系统设计。在系统时钟冗余方面,每个系统控制单元中有两个冗余的时钟卡,通过线缆对系统提供冗余的时钟。当任意一个时钟卡出现故障时,另一组时钟 可以无缝切换保持系统稳定运行。电源时序控制信号冗余设计实现更加可靠的电源开关控制。
K1 Power服务器多达16万个故障检查器实时监测系统运行状态,遍布全系统的错误检查器及故障隔离寄存器,实时监测系统的运行,预测、报告故障的发生,自动触发冗余机制修复故障,首错数据捕获FFDC(First Failure Data Capture)、校验与重试、隔离与修复。
尹宏伟说,K1 Power服务器坚持系统可靠性设计理念:Reliability FSP Availability Serviceability,在物理可靠性、软错误修复等方面实现系统全堆栈可靠性设计。
高品质实际上就是高质量或者是高可靠性。通过冗余实现故障的处理、隔离修复,这些是属于设计层面的。高品质是属于实现层面的,K1 Power服务器的纵向扩展服务器的主板层数多达40层,确保良好的信号完整性,从而保证整体系统的可靠性。尹宏伟解释说,高达40层主板设计为了保证高速信号在CPU、内存、I/O以及加速器之间传递的稳定性,所有与高速信号走线层相邻的平面层都是地平面,以此更好地隔绝电子噪音造成的信号串扰。
K1 Power服务器还采用了高效散热设计,包括选用低功耗器件,提升系统局部及整体可靠性;使用铟金属片导热材质,提升导热效率近10倍;采用动态分区散热控制技术,各发热区域独立风扇转速控制,提高散热利用率,保障CPU等元器件性能稳定发挥;通过合理的元器件布局,降低高温对元器件可靠性影响。此外,K1 Power服务器采用长寿命元器件及部件,提升部件结构化寿命。比如使用寿命22年的高可靠性风扇、远超7年设计寿命的抗硫化电阻。
另外,浪潮商用机器借助高精度仿真技术,降低设计风险,提升Power服务器整体设计品质和可靠性,涵盖结构仿真分析包括结构应力静态分析,振动及冲击结构动态分析,有效控制结构可靠性设计风险,提高设计质量;建立精度更高,粒度更细的散热仿真模型,提高散热仿真的效率,降低服务器的散热与能耗,提升整机可靠性;建立高精度信号仿真,保障Power产品信号传输速率,确保信号传输质量和抗干扰能力。
K1 POWER产品生产测试功能覆盖率100%、自动化的测试系统,并对每台产品都进行高强度的可靠性测试。自研部件在开发过程中进行严格的阶段测试和整机测试,确保质量和性能达到业界最高水准;浪潮商用机器自认证部件结合IBM部件合格标准进行认证测试,确保引入部件的品质。
在安全性方面,K1 Power服务器进行了增强的系统安全设计,支持多种国际标准和中国政府认证,符合商用密码证书的外置硬件安全模块(HSM)。开发国产可信计算模块(TPM),实现符合国家可信计算标准,AIX操作系统安全加固模块(K1 Power SSR)。SSR(Server Security Reinforcement)是浪潮具有自主知识 产权的操作系统安全增强系统,是构建国家三级安全操作系统的内核模块技术的解决方案产品,从根本上免疫现有的各种针对操作系统的攻击行为,如:病毒,蠕虫,黑客攻击等。
黄家明说,K1 Power服务器本地化开发固件Secure Boot功能,通过对PNOR代码的签名及验签过程,保障代码不被恶意篡改;自主构建系统微码,源码级安全检测。另外,多家本地安全可信操作系统厂商认证了Power服务器平台,并取得产品兼容性认证证书,为企业客户提供系统多样性选择,包括KUX安全操作系统证书、凝思安全操作系统证书、红旗操作系统证书、中标麒麟操作系统证书。
尹宏伟表示,Power服务器会从多个维度保证系统的安全、可靠和高性能。这种高标准只有在产品运行很长时间之后,我们才能发现这种高可靠的服务器和普通服务器的差距。K1 Power服务器对于可靠性和性能的要求是很高的,这也是用户长期对它品牌的认可。高性能高效率的K1 Power服务器也要遗传这些基因,保证满足核心用户的核心应用安全、稳定、可靠地运行。