admin

路由器故障:主用链路故障时没有实现50ms切换

admin 运维技术 2022-11-08 462浏览 0

链路就是从一个节点到相邻节点的一段物理线路,而中间没有任何其他的交换节点。以下就是主用链路故障时没有实现50ms切换的故障解决步骤:

网络环境

路由器故障:主用链路故障时没有实现50ms切换

AR1-CR1、AR2-CR2、AR1-AR2以及CR1-CR2运行IS-IS Level-2。

软交换MSC Server通过lanswitch连接至CR1和CR2,MGW通过lanswitch连接至AR1和AR2。MGW主用链路为AR1-CR1,AR1和CR1之间链路上设置APDP remote,并分别配置nexthop指向AR2和CR2。

通过使用APDP和强制下一跳技术来实现AR1-CR1链路故障时50ms内快速切换至AR2-CR2,保证NGN业务不中断。测试时发现AR1-CR1链路中断时需要1-2分钟才能切换至AR2-CR2。

故障分析

步骤 1 检查AR1-AR2,CR1-CR2两条链路,通信正常。

步骤 2 AR1-CR1之间链路故障后恢复AR1-CR1链路,待路由重新稳定后,检查AR2上到MSC Server的路由,下一跳为CR2,正确。

步骤 3 AR1-AR2,CR1-CR2链路正常,AR1-CR1之间链路故障后通过强制下一跳到AR2和CR2的转发也没问题,所以故障也不是出在此处。

步骤 4 鉴于以上分析,且四台路由器都运行在IS-IS Level-2层,判断问题应该出在AR2-CR2之间的路由学习上。可能的原因为AR2上没有到MSC Server的路由,或者CR2上没有到MGW的路由。

步骤 5 检查CR2上到MGW的路由,发现下一跳不是AR2,而是CR1,说明问题就出在此处。

处理步骤

步骤 1 检查链路的IS-IS开销值,链路开销分别为,

AR1-AR2开销为150,CR1-CR2开销为50,AR1-CR1开销为100,AR2-CR2开销为200。

而(AR2-CR2)开销值200大于(AR1-CR1)与(CR1-CR2)的链路开销总和150,所以CR2上到MGW的路由优选开销值小的,因此CR2上到MGW的路由下一跳为CR1。

步骤 2 执行命令isis cost将AR2-CR2之间的链路开销值改为100。

步骤 3 再检查CR2上到MGW的路由下一跳,已经变为AR2。

步骤 4 此时再将AR1-CR1断开,发现业务在50ms内切换至AR2-CR2之间的链路而不中断,故障排除。

案例总结

NGN承载网时通常使用两个平面,在主用平面接口上使用APDP和强制下一跳技术,可以实现主用平面链路故障时ms级切换至备用平面。但在两平面的IGP规划时,一定要注意平面内部的路由花销要小于经过平面间迂回的路由花销。否则即使倒换至备用平面后也要重新进行路由计算,从而达不到设计要求。

继续浏览有关 网络运维 的文章
发表评论