网络环境
承载网有主备两个平面,A平面流量模型为:UMG1-CE1-AR1-BR1-AR3-CE3,回来路径相同。
但在对B平面的AR2设备进行主备倒换时,发现A平面流量有少量丢包现象(1秒左右)。同样,对A平面AR1做主备倒换时,发现B平面也有丢包现象。
承载网主备双平面组网图
故障分析
从现网拓扑和路由情况来分析,主备平面是相互独立的,不可能出现一个平面主备倒换影响到另一个平面的情况。
经过分析配置发现,在现网所有相关AR路由器上,OSPF多实例下都配置了路由聚合命令:
步骤 1 在所有AR路由器上执行display current-configuration检查配置文件。发现所有AR路由器上的OSPF多实例都配置了路由聚合:
ospf 1 vpn-instance 123
asbr-summary 10.0.0.0 255.0.0.0
步骤 2 然后在BGP上通过network方式把路由发布出去。这样,到远端路由会被聚合成一条10.0.0.0/8的路由。根据OSPF ABR的聚合原则,聚合后的路由的cost值为所有被聚合具体路由中cost值最大者(我司ASBR和ABR聚合后一样选cost值最大的下发)。举例说明,假设有如下三条路由:10.1.1.1/24 cost 10;10.2.1.1/24 cost 100;10.3.1.1/24 cost 1000;那么聚合后路由为:10.0.0.0/8 cost 1000 。
步骤 3 在备用平面主备倒换后,AR2上的私网路由将重新收敛;假设AR2先收到一条cost值小于200的10.x.x.x的路由,此时AR2向CE2发布的10.0.0.0/8的聚合路由的cost值就会比原来的小,通过ospf扩散到CE1。这时,主平面的流量模型变为:UMG1-CE1-CE2-AR2-BR2-AR4-CE4,但由于网络规模较大,这时AR2还未完全收敛,也就是AR2还没有目的地对应的明细路由,就发生如上现象。
—-结束
操作步骤
步骤 1 在系统视图下执行ospf process-id vpn-instance vpn-instance-name。
步骤 2 输入命令abr-summary ip-address mask cost cost,配置OSPF的ASBR路由聚合及cost值。
步骤 3 输入命令quit返回到系统视图。
步骤 4 保存配置。
配置如上命令后,CE1与CE2之间的链路上不再有流量经过,主平面的流量能够一直保持在主平面转发。另外,如果在AR上向CE下发明细路由也不会遇到这样的问题。
—-结束
案例总结
网络部署时注意避免双平面相互影响的隐患,比如ISIS的checksum-error问题,ospf cost值问题,ISIS的cost值问题等。
转载请注明:IT运维空间 » 运维技术 » 路由器故障:A个平面业务中断
发表评论