gtxyzz

路由器故障:A个平面业务中断

gtxyzz 运维技术 2022-11-08 420浏览 0

网络环境

承载网有主备两个平面,A平面流量模型为:UMG1-CE1-AR1-BR1-AR3-CE3,回来路径相同。

但在对B平面的AR2设备进行主备倒换时,发现A平面流量有少量丢包现象(1秒左右)。同样,对A平面AR1做主备倒换时,发现B平面也有丢包现象。

承载网主备双平面组网图

路由器故障:A个平面业务中断

故障分析

从现网拓扑和路由情况来分析,主备平面是相互独立的,不可能出现一个平面主备倒换影响到另一个平面的情况。

经过分析配置发现,在现网所有相关AR路由器上,OSPF多实例下都配置了路由聚合命令:

步骤 1 在所有AR路由器上执行display current-configuration检查配置文件。发现所有AR路由器上的OSPF多实例都配置了路由聚合:

ospf 1 vpn-instance 123

asbr-summary 10.0.0.0 255.0.0.0

步骤 2 然后在BGP上通过network方式把路由发布出去。这样,到远端路由会被聚合成一条10.0.0.0/8的路由。根据OSPF ABR的聚合原则,聚合后的路由的cost值为所有被聚合具体路由中cost值最大者(我司ASBR和ABR聚合后一样选cost值最大的下发)。举例说明,假设有如下三条路由:10.1.1.1/24 cost 10;10.2.1.1/24 cost 100;10.3.1.1/24 cost 1000;那么聚合后路由为:10.0.0.0/8 cost 1000 。

步骤 3 在备用平面主备倒换后,AR2上的私网路由将重新收敛;假设AR2先收到一条cost值小于200的10.x.x.x的路由,此时AR2向CE2发布的10.0.0.0/8的聚合路由的cost值就会比原来的小,通过ospf扩散到CE1。这时,主平面的流量模型变为:UMG1-CE1-CE2-AR2-BR2-AR4-CE4,但由于网络规模较大,这时AR2还未完全收敛,也就是AR2还没有目的地对应的明细路由,就发生如上现象。

—-结束

操作步骤

步骤 1 在系统视图下执行ospf process-id vpn-instance vpn-instance-name。

步骤 2 输入命令abr-summary ip-address mask cost cost,配置OSPF的ASBR路由聚合及cost值。

步骤 3 输入命令quit返回到系统视图。

步骤 4 保存配置。

配置如上命令后,CE1与CE2之间的链路上不再有流量经过,主平面的流量能够一直保持在主平面转发。另外,如果在AR上向CE下发明细路由也不会遇到这样的问题。

—-结束

案例总结

网络部署时注意避免双平面相互影响的隐患,比如ISIS的checksum-error问题,ospf cost值问题,ISIS的cost值问题等。

继续浏览有关 网络运维 的文章
发表评论