分钟级定位异常边界范围
时间:2022-04-08 03:57:01 | 来源:行业动态
时间:2022-04-08 03:57:01 来源:行业动态
5G核心网中存在大量的、复杂的NFS间服务调用,具备有效的调用性能跟踪能力尤为重要。
图:服务间访问示例
如上图所示,一个简单的逻辑调用,AMF(Access and Mobility Management Function)中的NFS调用UDM(Unified Data Management)中的NFS获取用户信息,这个过程中,并不是像传统环境中直观简单。在5G现网环境中,普遍涉及宿主机、虚拟机、容器的网络虚拟化实现,以全栈分段来梳理访问调用,是应对新环境运维排障挑战所必须具备的。以全栈视角,展开以上调用,可以剖析NFS发起调用所经过的POD接口、虚拟机接口、宿主机接口乃至网关等链路。
图:服务调用全栈跟踪示意图
全栈跟踪针对云中服务间的调用访问,将虚拟化所实现的逻辑通信进行逐步展开,清晰便捷展示每段的网络状态,性能,结合知识图谱及丰富的指标数据,快速定位性能异常的问题范围边界。以上所述访问为例,如果排查调用延时故障,确定NFS调用服务双端后,展开全栈跟踪,直接定位延时所在的接口。如全栈跟踪示例图中,清晰展示出服务AMF服务实例至UDM服务实例两端访问延时瓶颈在UDM功能侧,且聚焦在其运行所属虚拟机的虚拟网络接口处。而排除UDM服务实例的POD网络接口及AMF所涵盖的虚拟机、POD等众多接口路径。
图:全栈跟踪示例
在没有DeepFlow全栈跟踪工具的情况下,排查服务访问调用的性能将是一个头绪纷乱、复杂繁琐且冗长的过程,同时对于一线运维人员要求所掌握的技术栈相对较多、要求综合能力强,很可能耽误宝贵的运维窗口时间。