kavin

网络病毒 诱发交换机缓存溢出故障

kavin 运维技术 2022-11-11 465浏览 0

交换机是局域网中一种很重要的数据交换、处理设备,该设备的性能好坏直接影响局域网的数据传输能力与网络传输速度。正常来说,交换机设备的工作性能是比较稳定的,特别是普通的二层交换机很少会出现问题,不过最近某单位局域网使用的一台普通二层交换机出现了不正常现象。考虑到这种现象很少出现,解决该不正常现象的过程也是与众不同,现在本文就将该不正常现象的详细解决过程贡献出来,供各位朋友参考交流!

故障回放

某单位局域网规模不是很大,10个处室中的大约40台工作站,分别连接到两台型号相同的普通24口TP-Link品牌交换机中,这两台交换机作为局域网的二层交换机,直接级联到单位的路由器设备上,路由器设备再通过宽带光纤线路与Internet网络保持连接,平时局域网中的所有工作站相互之间可以进行共享访问,每一台工作站也能通过局域网的路由器设备直接访问Internet网络中的目标站点内容。

最近一段时间,局域网中的某些工作站既不能正常访问内网其他工作站系统的共享内容,也不能访问Internet网络中的目标站点内容,不过其他一些工作站却能访问内网,同时也能访问Internet网络。考虑到局域网中有一些工作站可以访问Internet网络,这意味着局域网路由器设备的工作状态是正常的,那些不能上网的工作站很可能是自身原因或所连的普通二层交换机出现了问题引起的。

追查原因

为了弄清楚具体的故障原因,笔者随意从局域网中找到一台不能访问Internet网络的普通工作站,打开该工作站系统的运行对话框,在其中使用ping命令,依次测试了本地网卡设备的IP地址、交换机的IP地址、路由器的IP地址,结果发现本地网卡设备的IP地址能够被正常ping通,其他两个设备的IP地址不能正常ping通,这说明本地工作站的网卡设备工作状态是正常的,本地网卡设备到交换机设备和路由器设备之间的物理线路可能存在问题,为了判断这种问题是否由于网络连接线缆引起的,笔者立即找来了专业的线缆测试仪器,来对目标网络连接线缆的连通性进行测试,测试结果发现该物理连接线缆是正常的。

既然物理连接线路是通畅的,那为什么故障工作站的网卡设备到交换机设备和路由器设备之间的网络线路不能正常ping通呢?由于网卡设备确认工作状态是正常的,会不会是连接故障工作站的交换端口工作状态不正常,或者是整个二层交换机出现了什么意外呢?想到这一点,笔者立即顺着连接故障工作站的网络连接线缆,找到了连接故障工作站的那个交换端口,笔者立即尝试着换用了其他交换端口进行测试,结果发现测试还不正常。笔者立即又对连接故障工作站的交换机设备进行了仔细检查,结果发现该设备控制面板中的所有信号灯都处于全亮不闪烁状态,显然这种状态是不正常的,因为当某个交换端口正常转发、处理上网数据时,对应端口的信号灯应该处于点亮闪烁状态,现在所有端口的信号灯都不闪烁,那说明连接到这台二层交换机中的所有工作站都不存在数据转发行为,这时该二层交换机下面的所有工作站自然就不能正常上网了。

故障解决

遇到二层交换机工作状态不正常时,我们往往只要重新启动一下该设备就能解决问题了,毕竟二层交换机很少出现硬件质量问题;按照这样的分析,笔者立即将故障交换机的电源暂时切断,过一段时间重新接通电源,果不其然,待故障交换机重新启动稳定后,局域网中先前不能上网的故障工作站立即恢复了正常的网络连接状态。

原以为到了这里,局域网中的部分工作站不能上网故障就算解决成功了,可谁曾想到,一个小时还每到,那些不能上网的工作站再次出现了相同的故障现象,此时再次观察那台故障交换机设备时,笔者看到该设备控制面板中的所有信号灯又处于全亮不闪烁状态了,这说明该二层交换机又发生了相同的故障;经过反复测试与实践,笔者发现即使这台二层交换机不连接任何工作站,也会在相同的时间段内发生同样的故障现象,这是什么原因呢?为什么局域网中的另外一台二层交换机工作状态始终正常呢?

尽管笔者知道该单位局域网中有不少工作站系统中存在各色各样的网络病毒,但考虑到这两台普通二层交换机品牌相同,连接方式也相同,甚至它们的配置也是完全一样的,而现在只有一台交换机设备出现了问题,因此笔者估计肯定是这台故障交换机发生了硬件损坏,要想彻底地解决问题,***的办法就是更换该二层交换机。

由于笔者手头暂时没有现成的交换机设备可以替换,为此笔者打算先将局域网中的网络病毒进行一次彻底清查,必须确保新的交换机设备到位之前,整个局域网网络是非常“干净”的,不存在任何网络病毒或木马程序。在将局域网中的所有病毒程序全部清除干净之后,笔者又随手重新启动了一下故障交换机设备,之后笔者看到故障交换机设备的工作状态又正常了,由于笔者当时有事在身,就先行离开了故障现场,第二天早上上班时,笔者顺便看了那台故障交换机的工作状态,让笔者喜出望外的是,该交换机的工作状态竟然一直正常;当笔者随意找到一台先前不能上网的工作站系统进行测试时,发现现在它们的网络连接状态都已经恢复正常了。继续观察一段时间后,它们的上网状态仍然一直正常,至此这则部分工作站不能上网的故障现象终于解决了,而引起这种故障现象的最终“祸首”显然是局域网中的网络病毒。

深层剖析

上述故障现象从表面上来看,是由于局域网中的二层交换机工作状态不正常引起的,事实上故障交换机的工作状态受到了网络病毒的影响;由于局域网中存在网络病毒,网络病毒造成了局域网网络发生了广播风暴现象,这种现象导致故障交换机的缓存出现了溢出错误,最终使得该交换机发生了瘫痪现象,这也是故障交换机所有端口的信号灯状态都处于全亮不闪烁状态的原因。当将局域网中的所有网络病毒全部清除干净之后,故障交换机经过重新启动之后,它的缓存溢出错误也消失了,这时它的工作状态也能恢复正常了,并且以后由于网络病毒不会继续影响交换机了,所以该故障交换机的工作状态也就能始终保持正常了。

此外,局域网中的另外一台交换机之所以没有受到网络病毒的袭击,很可能是该交换机的性能比较稳定,换句话说,就是故障交换机设备可能存在元件老化的现象,这种现象导致故障交换机抵抗网络病毒的能力比较低下,这样一来相同型号的两台二层交换机,自然它们的工作状态不一定完全相同了。

为了尽可能避免由网络病毒引起的这种故障现象,我们在组建局域网网络时,应该尽量选用性能比较稳定、缓存容量较大的交换机设备;同时要经常使用正版的杀毒软件来清除局域网中的网络病毒,阻止广播风暴现象的发生。

继续浏览有关 网络运维 的文章
发表评论