BD交换机快速解决局域网网络环路问题
- 格式:docx
- 大小:17.18 KB
- 文档页数:3
交换机引起的路由环路故障破解交换机引起的路由环路故障破解在小型网络中,在维护路由表信息的时候,如果在拓扑发生改变后,网络收敛缓慢产生了不协调或者矛盾的路由选择条目,就会发生路由环路的问题,这种条件下,路由器对无法到达的网络路由不予理睬,导致用户的数据包不停在网络上循环发送,最终造成网络资源的严重浪费。
如何解决路由环路故障?下文是店铺收集的用实例演示如何破解由于交换机引起的故障,希望对你有帮助。
网络拓扑:某单位采用了标准的三层网络拓扑结构,即核心层、汇聚层、接入层。
接入交换机采用二层交换,汇聚交换机采用了三层交换,划分了多个VLAN,每个部门一个VLAN。
客户端连接24口接入交换机,接入接入交换机上联汇聚交换机,汇集交换机为每个部门分配一个VLAN,每个VLAN一个C段。
如:部门A的VLAN号为10,IP地址段为:192.168.10.0,子网掩码:255.255.255.0,网关:192.168.10.254。
一、故障现象某日接到部门B的电话,说整个部门都不能上网,于是先在自己电脑上进行测试,PING我部门网关显示正常(我部门网关和部门B的网关不同)显示正常,访问Internet也正常,也并没有其他部门反映网络故障,所以排除全网故障。
并不是部门B的某一台电脑不能上网,所以怀疑属于部门B的内部局域网故障。
二、故障排查过程1. 远程登录汇聚交换机,进行网络排查。
登录汇聚交换机,在汇聚交换机中Ping部门B的网关,Ping不通。
查看交换机接口状态,该部门的接口状态显示为:“err-disabled”.经过分析后,认为最可能的原因是环路引起的,但是还不能确定,因此需要现场测试。
2. 现场测试汇集交换机。
在汇聚交换机上拔下该部门的上联线,利用笔记本直接联入汇集交换机,将笔记本的IP地址设置成该部门的IP。
并通过Console口登录交换机,查看状态,发现此接口还是处于“err-disabled”状态,利用命令“shutdown”,再“no shutdown”,重启接口,接口状态变为“connected”。
解决路由器环路现象的方法路由器环路是指在计算机网络中,数据包在网络中传递时被路由器错误地传送回遍历的路径上,造成数据包不断循环。
这会导致网络拥塞、延迟增加甚至服务不可达等问题。
为了解决路由器环路现象,可以采取以下方法。
1.使用距离矢量路由协议(DVRP)距离矢量路由协议(Distance Vector Routing Protocol)是一种简单的路由选择算法,通过在网络中交换信息来建立路由表,并使网络中的每个路由器都能计算出到目的地的最佳路径。
DVRP可以避免环路形成,因为它使用了路由器之间的距离来计算路径成本,而不是直接通过之前的路径。
2.使用链路状态路由协议(LSRP)链路状态路由协议(Link State Routing Protocol)是一种更复杂的路由选择算法,它将网络中的每个路由器的链路状态信息(如带宽、延迟等)存储在路由器的链路状态数据库中。
通过交换链路状态信息,每个路由器可以计算出到目的地的最佳路径,并使用该路径转发数据包。
同样,LSRP可以避免环路形成,因为它计算路径时会考虑链路状态信息。
3.使用回环检测机制回环检测机制是一种可以检测并阻止环路的方法。
在实现中,路由器在转发数据包时,将数据包的源IP地址和传来的接口信息保存下来。
当同样的数据包重新出现在相同的接口上时,说明存在环路,路由器可以使用回环检测机制,丢弃数据包,阻止环路的产生。
4.利用路由器控制平面与数据平面分离路由器控制平面与数据平面分离是一种新兴的网络架构,它将路由器的控制决策从数据平面分离开来。
通过将控制平面与数据平面分离,可以在控制平面中实现环路检测和避免环路的算法,从而更好地管理网络中的路由器。
5.使用链路聚合技术链路聚合技术(Link Aggregation)是将多个链路捆绑为一个逻辑链路的技术。
在链路聚合中,多个链路可以同时传输数据,增加带宽和可靠性。
同时,通过链路聚合,可以避免环路的产生,因为传输数据的路径是预先配置好的,不会产生循环路径。
任务三:解决交换机组网过程中的环路问题一、实训名称每VLAN生成树的负载均衡与快速收敛二、实训目的1、了解生成树的工作原理;2、掌握stp树的控制方法;3、利用pvst实现VLAN负载均衡;4、掌握portyfast、uplinkfast和backbonefast的应用场合和使用方法。
三、实训内容生成树协议默认在交换机上是打开的,不做任何配置就可以有效避免冗余链路造成的网络环路,但是,生成树的阻塞端口会阻塞所有VLAN的流量,没有充分发挥冗余链路的带宽作用;端口状态转换需要花费较长的时间,不能满足有些应用的要求。
我们需要通过支持多生成树实例的生成树协议,经过人工干预生成树的收敛,解决以上的问题。
四、实训环境企业的各部门分别属于不同的VLAN子网,网络用户为高要求用户,不能出现通信中断和网络拥塞现象。
为了满足用户的要求,企业网络采用了设备备份和链路备份,企业的接入交换机通过两条上联链路分别接入两台核心交换机,核心交换机之间通过一条千兆端口背靠背连接,实现核心设备的热备份。
根据实训内容要求,我们可以选择两台相对高档次的交换机作为核心交换机,低档次的交换机作为接入交换机构建实训环境。
也可以使用三台低档次的交换机,只要达到实训目的就可以。
五、实训步骤1、按模拟的环境连接好设备2、配置VTP参数、创建VLAN将所有交换机之间连接的端口设置成Trunk模式,指定一台交换机为VTP服务器模式,创建两个VLAN;其他为VLAN服务器或客户机模式,通过VTP协议在域内统一VLAN数据库。
3、在S1交换机上执行show spanning-tree summary命令,查看生成树模式是不是PVST,有没有显示所创建的VLAN。
S1#show spanning-tree summary4.在S1交换机上执行show spanning-tree命令,分析VLAN10、VLAN20的根桥和阻塞端口,并记录。
VLAN10的根桥为S2交换机,阻塞端口为S1交换机上的f0/1端口。
交换机中网络环路常见问题详解以太网中的交换机之间存在不恰当的端口相连会造成网络环路,如果相关的交换机没有打开STP功能,这种环路会引发数据包的无休止重复转发,形成广播风暴,从而造成网络故障。
一天,我们在校园网的网络运行性能监控平台上发现某栋搂的VLAN有问题——其接入交换机与校园网的连接中断。
检查放置在网络中心的汇聚交换机,测得与之相连的100BASE-FX端口有大量的入流量,而出流量却非常少,显得很不正常。
然而这台汇聚交换机的性能似乎还行,感觉不到有什么问题。
于是,我们在这台汇聚交换机上镜像这个异常端口,用协议分析工具Sniffer来抓包,最多时每秒钟居然能抓到10万多个。
对这些数据包进行简单分析,我们发现其中一些共同特征。
当时,我们急于尽快抢修网络,没去深究这些数据包的特征,只看到第1点就以为网络受到不明来历的Syn Flood攻击,估计是由一种新网络病毒引起,马上把这台汇聚交换机上该端口禁用掉,以免造成网络性能的下降。
故障排除为了能在现场测试网络的连通性,在网络中心,我们把连接那栋大楼接入交换机的多模尾纤经光电转换器用双绞线连到一台PC上,并将其模拟成那个问题VLAN的网关。
然后,到现场找来大楼网管员,想让他协助我们尽快把感染了未知病毒的主机查到并隔离。
据大楼网管员反映,昨天网络还算正常,不过,当时本大楼某部门正在做网络调整,今天上班就发现网络不行了,不知跟他们有没有关系。
我们认为调整网络应该跟感染病毒关系不大。
在大楼主配线间,我们把该接入交换机上的网线都拔掉,接上手提电脑,能连通网络中心的测试主机。
我们确认链路没问题后,每次将剩余网线数量的一半插回该交换机,经测试没问题则如是继续下去,否则换插另一半,逐渐缩小怀疑有问题网线的数量。
我们最终找到一条会引起问题的网线,只要插上这根网线,该大楼网络就会与模拟网关中断连接。
经大楼网管员辨认,这条网线是连接昨天在做网络调整的那个部门的。
他还说以前该部们拉了一主一备两条网线,应该还有一条,并亲自在那台交换机上把另一条找了出来。
如何有效解决路由器环路现象
如何有效解决路由器环路现象
网吧路由器发生环路的原因有很多,当然解决方法也各不相同。
那么大家知道要如何有效解决路由器环路现象呢?下面一起来看看!
通常,我们在维护路由表信息的时候,如果在拓扑发生改变后,网络收敛缓慢产生了不协调或者矛盾的路由选择条目,就会发生路由环路的问题。
D-V主要的作用是通过向所有接口周期性的广播路由更新来跟踪整个网络的变化,这些广播包括了完整的路由表。
但是这样做会给cpu和带宽增加了负担,若会聚更新过慢会产生路由环路,路由环路解决办法如下:
1.抑制计时:
一条路由信息无效之后,一段时间内这条路由都处于抑制状态,如果,路由器从一个网段上得知一条路径失效,立即在另一个网段上得知这个路由有效,这个有效的信息往往是不正确的,抑制计时避免了这个问题,当一条链路频繁起停时,抑制计时减少了路由的浮动,增加了网络的稳定性。
2.毒性逆转:
当一条路径信息变为无效之后,路由器并不立即将它从路由表中删除,而是用16,即不可达的度量值将它广播出去,这样可以立即清除相邻路由器之间的任何环路。
3.触发更新:
当路由表发生变化时,更新报文立即广播给相邻的.所有路由器,而不是等待30秒的更新周期,当一个路由器刚启动RIP时,它广播请求报文,收到此广播的相邻路由器立即应答一个更新报文,而不必等到下一个更新周期,网络拓扑的变化会最快地在网络上传播开,减少了路由环路产生的可能性。
4.水平分割:
规定由1个接口发送出去的路由信息不能再朝这个接口往回发送.
这个办法减少了路由信息的不正确性和负载。
目录1介绍22网络业务故障,如何确认存在环路?22.1第一步:是否可以通过端口流量发现数据风暴?22.2第二步:是否可以通过MAC-Flapping检测漂移?3框式交换机4盒式交换机错误!未定义书签。
2.3第三步,是否可以通过环路检测发现环路?错误!未定义书签。
Loop Detection<框式>6Loopback Detection<盒式>73环路问题发生后,如何快速破环?错误!未定义书签。
3.1第一步:是否理解网络业务并明确拓扑?83.2第二步:是否需要用影响最小的方法破环?8方法一:端口退出成环VLAN破环8方法二:shutdown成环端口破环8方法三:通过拔出成环光纤破环83.3第三步:操作后确认业务是否恢复?94环路问题发生后,如何定位问题根因?94.1第一步:是否由于近期施工操作引入环路?94.2第二步:是否由于近期修改配置引入的环路?94.3第三步:是否典型的常见环路问题?9交换机自环出现环路9交换机下游设备自环出现环路10环形组网链路震荡导致环收敛震荡10环形组网寄存器下发失败无法破环10链路单通引入RRPP网络单向环11协议堵塞的端口L2PT〔bpdu-tunnel〕协议报文成环11下游设备报文转发异常导致疑似环路114.4第四步:收集信息返回研发分析115环路问题解决后,网络是否需要优化?125.1第一步:是否需要部署适当的破环协议?125.2第二步:是否需要提升链路质量和可靠性?135.3第三步:是否需要部署广播抑制提升网络健壮性?135.4第四步:是否需要部署QoS保证协议报文优先转发?136结束语131介绍以太网链路由于各种原因,导致数据或协议报文环形转发,导致网络形成数据风暴,最终影响正常业务.本文档仅介绍二层网络的常见环路问题识别和处理.本指导手册按照如下思路进行二层环路问题分析和处理:1、网络业务故障,如何观察确认存在二层环路?2、环路问题发生后,如何快速破环恢复业务?3、如何排查环路问题的根本原因,是否已知案例?.4、针对问题原因,对网络进行适当的优化.处理二层环路问题,您首先需要准备如下:1、整网的拓扑图,包含设备名称、登陆方式、系统MAC.2、登陆软件,记录全部的操作记录.准备好这些,我们开始二层环路问题的处理之旅.2网络业务故障,如何确认存在环路?网络业务故障后,如发生二层环路,通常会存端口流量数据风暴和反复大量的MAC漂移现象.因此,在骨干链路所在的节点,通过如下三步操作:图1:环路排查流程图可以判断网络是否可能存在二层环路.2.1第一步:是否可以通过端口流量发现数据风暴?通过display interface brief命令,查看所有接口下的流量,存在环路的接口上InUti和OutUti两个计数会逐步增加:第一次查询:[151]disp interface Ethernet brief | in upPHY: Physical*down: administratively down<l>: loopback<b>: BFD downInUti/OutUti: input utility/output utilityInterface PHY Auto-Neg Duplex Bandwidth InUtiOutUtiTrunkGigabitEthernet0/0/2 up enable full 100M 0% 0.01% --GigabitEthernet0/0/16 up enable full 1000M 0.56% 0.56% 1 GigabitEthernet1/0/12 up enable full 1000M 0.56% 0.56% 1 MEth0/0/1 up enable half 100M 0.01% 0.01% --最后一次查询:[151]disp interface Ethernet brief | in upPHY: Physical*down: administratively down<l>: loopback<b>: BFD downInUti/OutUti: input utility/output utilityInterface PHY Auto-Neg Duplex Bandwidth InUtiOutUtiTrunkGigabitEthernet0/0/2 up enable full 100M 0% 0.01% --GigabitEthernet0/0/16 up enable full 1000M 76% 76% 1GigabitEthernet1/0/12 up enable full 1000M 76% 76% 1MEth0/0/1 up enable half 100M 0.01% 0.01% --一般情况下,查询只能看到网络的当前流量结果,此时需要和网络的正常业务流量进行比较,业务流量的带宽可以从客户的网络流量监控图获取.如果只有一台设备的一个端口出入方向流量较大,可能是单端口环回.如果只有一台设备的两个端口流量较大,可能是本设备两个端口环回;如果某端口只有单方向流量,只有出或者只有入,需要重点排查,因为环路有可能在该端口的上下游设备.通常情况下:如果当前网络流量远大于正常业务,可能存在二层环路.如果当前网络流量正常,没有部署广播抑制,没有二层环路.如果当前网路流量比正常流量稍大,且部署了广播抑制,需要继续后面的第二步和第三步操作.2.2第二步:是否可以通过MAC-Flapping检测漂移?MAC地址漂移即设备上一个接口学习到的MAC地址在同一VLAN中另一个接口上也学习到,后学习到的MAC地址表项的覆盖原来的表项.导致MAC地址漂移的因为包括网络存在环路、或者非法用户进行网络攻击.例如下图,当Switch1向两个方向同时发报文时,在Switch2上的两个不同端口都会收到该报文,从而出现MAC地址漂移.当Switch2的两个端口出现了MAC地址漂移时,说明交换机的两个端口间可能出现了环路.图2:MAC-Flapping示意图MAC地址漂移,交换机所有形态和版本均默认支持漂移,具体的MAC漂移配置主要是指漂移后是否告警,漂移后是否设置端口堵塞的功能.由于框式交换机和盒式交换机MAC漂移检测的命令行和检测存在差异,我们分别介绍:2.2.1框式交换机V1R2版本,在非S系列单板上支持全局使能的MAC-Flapping检测功能〔全局使能,只支持发送TRAP〕.在V1R2上,开启MAC地址漂移检测:[Quidway]mac-flapping alarm enableV1R3与以后的版本,在V1R2版本的基础上,新增了基于VLAN的MAC地址漂移检测、检测到MAC地址漂移后执行对应的动作策略.在V1R3与以后的版本上,开启MAC地址漂移检测〔下面两个命令均可使用〕:系统视图下:[Quidway]loop-detect eth-loop alarm-onlyVLAN视图下:[Quidway -vlan1001]loop-detect eth-loop alarm-only各个版本的告警信息存在一定的差异,样例如下:2.2.2盒式交换机盒式交换机〔不包括23、27系列〕V1R3与以后版本,不支持全局使能的MAC地址漂移检测,只支持基于VLAN的MAC地址漂移检测,同时支持检测到漂移后的发送TRAP、阻塞端口等动作.开启MAC地址漂移检测:VLAN视图下:[Quidway -vlan1001]loop-detect eth-loop alarm-only各个版本的告警信息存在一定的差异,样例如下:2.3第三步:设备作为三层网关,是否存在大量ARP报文被CPCAR丢包记录?<dgg62aslhwug>disp clock2011-11-30 20:04:32WednesdayTime Zone : BJ add 08:00:00<dgg62aslhwug>dispcpu-defend arp-request statistics slot 3CPCAR on slot 3------------------------------------------------------------------------------- Packet Type Pass<Bytes> Drop<Bytes> Pass<Packets> Drop<Packets> arp-request 91720644 61001339156 1348833 897078517------------------------------------------------------------------------------- <dgg62aslhwug>dispcpu-defend arp-reply statistics slot 3CPCAR on slot 3------------------------------------------------------------------------------- Packet Type Pass<Bytes> Drop<Bytes> Pass<Packets> Drop<Packets> arp-reply 381073700 46925484540 5604025 690080655-------------------------------------------------------------------------------<dgg62aslhwug>disp clock2011-11-30 20:04:35WednesdayTime Zone : BJ add 08:00:00<dgg62aslhwug>dispcpu-defend arp-request statistics slot 3CPCAR on slot 3------------------------------------------------------------------------------- Packet Type Pass<Bytes> Drop<Bytes> Pass<Packets> Drop<Packets> arp-request 91728872 61001759940 1348954 897084705------------------------------------------------------------------------------- <dgg62aslhwug>dispcpu-defend arp-reply statistics slot 3CPCAR on slot 3------------------------------------------------------------------------------- Packet Type Pass<Bytes> Drop<Bytes> Pass<Packets> Drop<Packets> arp-reply 381082540 46925484540 5604155 690080655-------------------------------------------------------------------------------通常情况下,ARP的交互是有序进行,短时间内不会出现超多报文的丢弃.问题一般发生在9300作为汇聚网关场景,出现上述情况后,可能的原因是ARP的广播报文在物理环形的网络中转发,形成协议报文的风暴,当前设备上送CPU,被交换机CPU限速丢弃.2.4第四步,当前是否可以增加配置环路检测发现环路?框式交换机和盒式交换机都支持检测环,框式交换机的环路监测称为Loop Detection;盒式交换机的环回监测称为Loopback Detection.2.4.1Loop Detection<框式>框式交换机端口配置Loop Detection功能以后,设备会从该端口发送环路检测报文,在端口所属且使能Loop Detection功能的VLAN内进行环路检测,如果设备接收到自己发送的检测报文,网络上存在环路.框式交换机上的环路监测能检测到下面两种情况下的端口环路:1、设备上端口收到本端口发送的检测报文.2、设备上端口收到非本端口发送的检测报文.开启了Loop Detection以后,用display loop-detection命令可以查看当前环路检测的状态,用display loop-detection interface命令可以查看具体某一个端口的状态.<Quidway> display loop-detectionLoop Detection is enable.Detection interval time is 5 seconds.Following vlans enable loop-detection:vlan 556Following ports are blocked for loop:NULLFollowing ports are shutdown for loop:NULLFollowing ports are nolearning for loop:NULL<Quidway> display loop-detection interface gigabitethernet 1/0/0The port is enable.The port's status list:Status WorkMode Recovery-time EnabledVLAN-----------------------------------------------------------------------Normal Shutdown 200 556告警示例如下:2.4.2Loopback Detection<盒式>盒式交换机端口配置Loopback Detection功能以后,设备会从该端口发送环路检测报文,一个untagged报文和指定VLAN Tag报文.盒式交换机的Loopback Detection,只能针对设备上端口收到本端口发送的检测报文的环路.开启了Loop Detection以后,用display loop-detection命令可以查看环路检测功能的配置信息和接口状态信息.<Quidway> display loopback-detectLoopback-detect is enabled in the system viewLoopback-detect interval: 30Loopback-deteck sending-packet interval: 5Interface ProtocolIDRecoverTime Action Status--------------------------------------------------------------------------------GigabitEthernet0/0/2 602 30 block NORMAL3环路问题发生后,如何快速破环?以太网的环路,会在短时间内形成数据风暴,当端口的流量达到带宽的最大负荷,会形成链路拥塞,影响网络业务.因此,在确认网络发生数据环路后,请按照如下步骤处理:3.1第一步:是否理解网络业务并明确拓扑?环形网络拓扑一般较为复杂,可以向客户寻求网络拓扑结构全图,具体到网络的VLAN规划信息,每台设备名称、系统MAC、管理IP,本端端口名称、对端端口名称.完整的拓扑信息是解决环路问题的首要条件,如果没有拓扑图,需要从发现环路的设备,通过逐跳登陆,记录设备信息、端口信息和VLAN信息,手动绘制完整的拓扑.3.2第二步:是否需要用影响最小的方法破环?紧急破环又称手动破环,当网络风暴严重影响正常的业务时,需要在尽快恢复业务.可以通过如下三个方法紧急破环:<注意紧急破环不要影响远程telnet路径所在的设备、端口和VLAN,避免无法登陆.>3.2.1方法一:端口退出成环VLAN破环备注:需要注意不要shutdown远程telnet路径所在的端口,避免无法远程登陆.3.2.2方法二:shutdown成环端口破环Shutdown成环的物理端口,也可以达到破环的效果.此时,需要保证shutdown的端口两端在全部VLAN内能够通信.3.2.3方法三:通过拔出成环光纤破环通过拔出成环的光纤,可以紧急破环.备注:该方法可以使用shutdown端口代替,只有在设备无法登陆时才使用.3.3第三步:操作后确认业务是否恢复?通过ping等测证网络通信质量,并和客户一起观察现网业务是否已经恢复.环路拓扑存在冗余链路和配置,环路破除后业务会自行恢复,特殊情况在此不一概而论. 4环路问题发生后,如何定位问题根因?4.1第一步:是否由于近期施工操作引入环路?如果环路问题是由于近期施工操作引入,可以和施工方确认,了解施工的过程,特别是新增线路连接的细节,结合拓扑结构,确认后排出物理环路.4.2第二步:是否由于近期修改配置引入的环路?4.3第三步:是否典型的常见环路问题?4.3.1交换机自环出现环路图3:设备自环出现环路前置条件:交换机未配置STP和LDT问题现象:端口出方向和入方向流量持续增加.问题原因:端口自环或者链路环回.处理方法:1、首先在端口下去使能loopback internal.2、设备由于链路引入环路有两种:一种是单端口收发环回.第二种是设备上两个端口环路.此类环路造成的原因是光纤或者网线误接,需要拆除连线.4.3.2交换机下游设备自环出现环路图4:下游设备自环出现环路前置条件:设备未部署STP和LDT,本设备未环回.问题现象:端口入方向和出方向流量持续增大,环回链路在下游.问题原因:下游链路环回或者自环.处理方法:1、首先逐跳向下游寻找环路的链路.1、然后在端口下去使能loopback internal.2、设备由于链路引入环路有两种:一种是单端口收发环回.第二种是设备上两个端口环路.此类环路造成的原因是光纤或者网线误接,需要拆除连线.4.3.3环形组网链路震荡导致环收敛震荡图5:环路堵塞端口存在振荡前置条件:设备部署STP、RRPP、SEP或者SMLK等破环协议.问题现象:环路一段时间收敛正常,一段时间收敛失败,或者持续震荡.问题原因:网络上链路存在震荡,导致环网协议报文转发失败,反复超时震荡.如:1、链路存在错包,协议报文被丢弃.2、未知单播抑制、不合理的qos等配置丢弃协议报文.处理方法:1、如因为错包丢弃,建议更换问题网线、光纤或者光模块.2、如因为被抑制丢包,建议修改单播抑制和不合理的Qos配置.3、观察当前网络带宽,确认是否是网络流量拥塞,导致协议报文丢失,超时放开堵塞端口导致临时环路,此类问题需要进行网络优化.4.3.4环形组网寄存器下发失败无法破环图6:环形网络无法破环前置条件:物理环路,协议已经破环.问题现象:网络数据风暴问题原因:软件计算堵塞端口正确,但是芯片下发失败.处理方法:此类问题极其少见,可以通过shutdown、undo shutdown期望的堵塞端口,观察协议是否收敛成功.4.3.5链路单通引入RRPP网络单向环图7:链路单通造成的RRPP环前置条件:RRPP组网问题现象:RRPP堵塞端口超时放开问题原因:RRPP心跳检测方向,链路单通.处理方法:解决单通链路问题.该问题有两个规避方法:1、链路自协商,链路质量较差的情况下,链路单通无法协商UP,无单通问题.2、通过在链路上部署DLDP检测协议,检测到链路单通后,会完全shutdown两侧的端口,解决单向环环路问题.4.3.6协议堵塞的端口L2PT〔bpdu-tunnel〕协议报文成环图8:已经破环的网络协议报文成环前置条件:二层网络环路收敛正常,堵塞端口状态下发正常问题现象:disp l2protocol-tunnel statistics查看到报文增加很快,软转发成环.问题原因:由于堵塞端口软件转发L2PT〔bpdu-tunnel〕协议报文,未判断端口是否堵塞,从堵塞端口发送L2PT报文,引起的L2PT报文成环,处理方法:R6以前版本需要加载最新的补丁解决问题.V1R6C00SPC900解决该问题.4.3.7下游设备报文转发异常导致疑似环路图9:报文转发异常导致环路前置条件:二层网络环路收敛正常,堵塞端口状态下发正常问题现象:在LSW3形成频繁的MAC-Flapping,出现疑似环路问题.问题原因:二层网络的边缘设备,由于个别厂家实现差异,对于无法处理的报文,会反弹转发,常见的设备有机顶盒等.处理方法:由于报文反弹,此类问题需要更换边缘设备解决.4.4第四步:收集信息返回研发分析如果问题还没有解决,那么问题可能是由于交换机的软件或者硬件故障导致环路,您需要收集信息返回研发进行分析.相对其他单台设备问题,环路问题涉与多台设备或者整网.5环路问题解决后,网络是否需要优化?5.1第一步:是否需要部署适当的破环协议?如果当前的环路问题是由于物理环路引入,且没有配置破环协议,请按照网络规划合理部署破环协议.以太网交换机常见的破环协议为STP/RSTP/MSTP、RRPP、SEP等,具体应用请查询配置手册.5.2第二步:是否需要提升链路质量和可靠性?如果当前环路问题是由于物理链路质量不可靠,存在协议报文拥塞丢失导致超时临时环路,请检查链路,并更换光纤光模块.如果当前问题因为带宽不足导致协议报文被丢弃,需要扩充带宽或者使用聚合链路,提升链路可靠性.5.3第三步:是否需要部署广播抑制提升网络健壮性?为了避免再次成环,成环后再次引入数据风暴,建议在环上设备端口下,部署广播抑制,按照经验,部署5%的广播抑制可以很好的防止广播风暴,具体抑制的比例值可以按照客户并发网络广播流量来评估确认.5.4第四步:是否需要部署QoS保证协议报文优先转发?如果当前环路问题是由于网络拥塞导致协议报文,需要部署Qos,报文协议报文高优先级转发.5.5第五步:是否需要优化网络设计,提升网络?复杂组网可以通过分层控制,建议合理规划设计接入层、汇聚层.单层组网内设备数量较多时,建议按照逻辑组织和地理分布,划分不同的域.6结束语该文档可以指导简单的环路排查,复杂问题还是需要协调各方联合定位解决.关于本文档的建议和想法,请不吝赐教,反馈给我们,谢谢.。
交换机故障详细解决方法交换机设备是局域网中的重要设备之一,它的工作状态与局域网的工作状态息息相关。
可是,质量再好的交换机,持续运行的时间长了,也会出现这样或那样的故障,这些故障要是不能被快速解决掉,显然会影响局域网的运行稳定性。
为了帮助各位朋友快速、有效地发现和解决交换故障,店铺现在就对交换机各类常见故障现象进行解读,并将相关故障排除方法与大家分享一下。
解决交换端口故障一般来说,交换端口故障往往是由于交换机与其他连接设备在传输模式和传输速度等方面的参数无法保持匹配造成的,毕竟型号不同的网络设备,它们的默认端口参数可能会设置成不一样,或者是同一品牌不同型号的设备由于使用了不同的硬件芯片,造成交换端口与其他连接端口之间的协商能力不强,或者是交换端口与其他连接端口由于参数设置不匹配,造成端口通信时无法自动协商成功,从而引发了交换端口工作不正常、无法正常传输数据的故障现象。
对待由模式和速度不匹配引起的交换端口故障,我们只需要采用手工方法,进入交换机后台管理系统,进入对应交换端口视图配置界面,修改交换机的工作模式和传输速度等参数,让其与对端连接端口的工作模式和传输速度保持匹配,就能解决网络故障了系统之家。
当然,有的交换机不支持后台系统管理功能,在这种情形下,我们可以尝试修改对端设备的相关参数,来让该设备的端口参数与交换端口保持匹配;例如,要是网卡与交换机之间相连时,我们可以在客户端系统修改网卡端口的工作模式参数;在进行这种操作时,我们可以依次单击"开始"/"设置"/"网络连接"命令,弹出网络连接列表窗口,右击与交换机直接相连的本地连接图标,并点选快捷菜单中的"属性"命令,打开本地连接属性设置对话框,选中目标网卡设备,单击"配置"按钮,进入目标网卡设备的配置界面,继续单击"高级"标签,在对应标签设置页面中,我们就能修改网卡设备的工作模式和传输速度了。
局域网环路分析在网络通信中,局域网环路是指网络中存在多条路径连接相同的网络设备,导致网络数据在该环路上循环传递,从而造成网络拥堵和数据包丢失的问题。
为了保证局域网的正常运行,需要进行环路分析定位和解决问题。
本文将探讨局域网环路分析的方法和步骤,帮助解决局域网环路问题。
一、环路分析的意义和重要性局域网环路是一种常见的网络问题,它会导致网络性能下降、丢包率增加等问题。
进行环路分析可以帮助解决这些问题,保证网络通信的稳定性和可靠性。
通过定位环路并采取相应措施,可以有效减少网络拥堵,提高网络传输效率。
二、环路分析的步骤1. 收集网络拓扑图和设备信息:首先,需要收集局域网的网络拓扑图和相关设备信息,包括交换机、路由器等设备的型号、端口连接关系等。
2. 确定网络故障现象:根据网络故障的表现,如网络延迟、丢包率增加等,确定是否存在可能的环路问题。
3. 分析网络传输路径:通过查看网络拓扑图和设备信息,分析网络数据传输的路径,确定可能存在环路的部分。
4. 使用网络分析工具:借助网络分析工具,对网络数据进行抓包分析。
可以使用Wireshark等工具,捕获网络数据包,并对数据包进行详细分析,查看是否存在循环传递的情况。
5. 定位环路位置:通过分析捕获的网络数据包,可以定位到具体的网络设备和端口,判断是否存在环路,并确定环路的位置。
6. 解决环路问题:一旦确定环路的位置,需要采取相应的解决措施。
具体的解决方法可能包括关闭某些端口、调整网络设备的配置等,以消除环路的影响。
7. 验证解决效果:解决环路问题后,需要对网络进行验证,确保网络通信正常。
通过监测网络性能、检查丢包率等指标,判断环路问题是否得到了有效解决。
三、常见的环路分析工具1. Wireshark:Wireshark是一款流行的网络数据包分析工具,可以捕获和分析网络数据包,帮助发现和解决网络问题。
2. Ping命令:Ping命令可以用于检测网络连接和网络延迟等问题,在进行环路分析时也可以作为重要工具之一。
局域网环路快速排查在当今数字化的工作环境中,局域网对于企业和组织的正常运转起着至关重要的作用。
然而,局域网环路问题却可能时不时地给网络管理员带来头疼的挑战。
一旦出现局域网环路,可能会导致网络拥塞、数据包丢失、网速变慢甚至网络瘫痪,严重影响工作效率和业务的正常开展。
因此,掌握快速排查局域网环路的方法对于保障网络的稳定运行至关重要。
要排查局域网环路,首先我们得了解什么是局域网环路。
简单来说,局域网环路就是网络中存在的物理或逻辑上的连接回路,使得数据包在网络中不断循环传输,从而引发一系列网络问题。
那么,如何才能快速发现并解决局域网环路呢?以下是一些常见且实用的方法。
一、观察网络设备指示灯这是最直观也是最初步的排查方法。
网络交换机和路由器通常都配备有指示灯,用于显示设备的工作状态。
如果发现某个端口的指示灯快速闪烁或者常亮不灭,特别是多个端口出现这种情况,就有可能存在环路。
当然,这种方法只能提供初步的线索,不能确定一定存在环路,但可以帮助我们缩小排查范围。
二、使用网络管理工具现在有很多专门的网络管理软件和工具,能够帮助我们更深入地监测和分析网络状态。
比如,通过 SNMP(简单网络管理协议),我们可以获取交换机的端口流量、错误率等信息。
如果发现某个端口的流量异常高,或者错误率持续上升,就很有可能存在环路。
三、检查 MAC 地址表交换机通过 MAC 地址表来转发数据包。
如果在 MAC 地址表中发现同一个 MAC 地址出现在多个端口上,那么很可能存在环路。
因为正常情况下,一个 MAC 地址应该只与一个端口相关联。
四、使用 Ping 命令通过 Ping 命令向网络中的设备发送数据包,并观察响应时间和丢包情况。
如果发现响应时间过长或者存在大量丢包,可能是由于环路导致的数据包循环和丢失。
五、分析网络拓扑图一份清晰准确的网络拓扑图对于排查环路非常有帮助。
通过对比实际的网络连接和拓扑图,我们可以快速发现可能存在的异常连接,从而定位环路的位置。
局域网网络环路问题的解决方案作者:陈兴华来源:《卫星电视与宽带多媒体》2021年第10期【摘要】基于互联网时代发展背景下,我国计算机网络技术水平不断提升,并在各领域中广泛应用,发挥出此项技术应用价值与优势,而且还能为各领域创新发展提供有利条件。
单位在发展中借助计算机网络技术建设独立化局网络,实现无纸化办公目的,提升单位工作效率。
并在发展阶段加大局域网网络环路安全管控力度,从细节上管控与处理,从而为单位稳定发展奠定良好基础。
【关键词】局域网;网络环路;问题;办法中图分类号:TN929 文献标识码:A DOI:10.12246/j.issn.1673-0348.2021.10.025大部分单位在计算机网络技术应用阶段,会结合单位自身发展实况与各项业务要求,创建独立化的局网络,技术部门在此方面加大研究力度,高效排除各类故障,在根源上杜绝网络环路通道堵塞问题发生,注重满足单位各项工作实施要求,才可保证各单位自身良好效益。
同时,对局域网网络环路问题解决有具体方案与措施,能为各项工作顺利开展提供便利条件。
1. 局域网网络环路管控必要性当前,大多数单位在内部发展阶段,比较重视内部网络安全监管,并在此方面加大监管制度实施力度,并依据各项业务内容与实施标准,向智能化、信息化方向发展。
如:OA办公自动化、仓储智能化管理、客户关系维护等,均突出WEB在单位内部网络系统中的应用价值。
同时,借助计算机网络技术建设独立化局网络,实现办公无纸化发展目标,既能简化各项工作流程,又可增强单位内部综合实力,各项业务能在网络系统中有序开展,便于各部门对重点信息数据搜集、整理、储存等,并统一归置到数据库中,能为各项工作开展提供便利条件,提高信息数据共享率。
例如:单位在初期内网搭建时注重人人可上网,创建WIFI密码简单,忽视对安全和流量的严格管控,受人为因素影响,有部分员工在计算机使用时缺乏网络安全意识,无线网络、移动设备等乱接,导致单位内部网络被病毒侵袭。
网络环路故障解决处理方法网络环路故障描述VSI(虚拟交换接口)信令协议使用BGP,CE双归属到两台PE,网络中出现环路网络环境在下图的网络中配置KompellaVPLS业务,CE1双归属到PE1和PE2,CE2双归属到PE3和PE4。
下图为双归属VPLS组网图配置完成后,发现网络中出现环路。
网络环路故障分析在PE上执行displaycurrent-configurationconfigurationvsi命令,检查PE的VSI配置。
因为各PE配置相似,此处以PE1的显示结果为例:#vsivsi1autopwsignalbgproute-distinguisher100:1vpn-target100:1import-extcommunityvpn-target100:1export-extcommunitysite1range5default-offset0#Kompella方式VPLS,CE双归属组网,无任何特殊配置的情况下,会产生环路。
网络环路故障处理步骤在各PE上执行以下操作。
步骤1在PE上执行命令system-view,进入系统视图。
步骤2在PE上执行命令vsivsi-name,进入VSI实例视图。
步骤3在PE上执行命令multi-homing-preferencepreference-value,配置VSI实例的双归属优先级。
说明:1.优先级高的PE将作为主用PE,优先级低的PE将作为备用PE。
2.主用PE负责CE的流量的转发,而备用PE只负责检测主用PE的VSI是否处于Up状态。
3.被选为备用PE后,备用PE的VSI被置为Down状态。
步骤4执行命令return退回到用户视图,执行命令save,保存对配置的修改。
----结束完成上述操作后,网络中环路消除。
网络环路故障案例总结网络环路故障就此解决,Kompella方式VPLS,CE双归属组网,无任何特殊配置的情况下,会产生环路,可通过配置VSI实例优先级的方式区分主备用PE,消除网络环路。
交换机连接成环导致网络中断的解决办法网络环路导致网络瘫痪或中断是我们网管员们经常遇到的问题,但是在规模较大的网络环境中,这种故障常常具有较强的隐蔽性,让我们无法快速高效地处理。
笔者最近就遇到了一起这样的故障。
一天早晨5点多钟,笔者突然接到电话,说机房的网管系统无法访问网元设备。
披上衣服马上赶往公司。
到了公司机房,查看了一下省网管中心监控软件自动发给机房人员的短信告警信息,信息显示在两点左右,部分BSC和RNC设备脱管。
故障描述笔者单位的网管系统主要分为两部分,一部分是网管系统专用的域内终端系统,另一部分是对网元设备的监控系统。
为了全面排查故障,笔者先检查终端部分,发现各域内终端可以正常获取IP地址,并能正常访问办公、资源管理、电子运维系统(EOMS)等省公司接口服务器(Portal)。
接着检查网元部分,由于网元设备本地无权限监控,必须通过省公司4A认证服务器再访问网元设备。
现在可以访问省公司服务器进行验证,但是无法连接出问题的BSC、RNC等设备,并且也无法Ping通相关设备的IP地址。
网元系统拓扑结构如图1所示。
故障排查通过上面的检查,基本可以判端故障出现在网元部分。
通过查看端口登记发现,出问题的设备主要集中在网元交换机2华为S3952上,于是来到三层的传输机房,发现它与上联的网元汇总交换机Cisco 2960的级联端口存在故障。
这下故障点找到了,笔者认为可能是这条网线坏了或者是端口吊死了这样的小问题。
于是把网线重新插拔一下,然而故障依旧,重新换了一条网线,还是不能解决故障。
分别用网线把笔记本电脑与这两个级联口接上,发现Cisco交换机的级联口一直为Down 状态,而华为交换机的级联口就可以正常的UP。
笔者又判定是Cisco这个级联口存在故障,于是在Cisco交换机上找了一个空口并作了数据,这回将两个交换机连上,端口可用了。
满以为这下可以解决故障了,但谁知没过多久,端口又Down掉了。
静下心来笔者又将网线换回原来的接口,并对该接口进行shut、no shut操作,端口可用了,证明端口没有问题。
配置交换机快速解决局域网网络环路问题
在规模较大的局域网网络中,时常会遇到网络通道被严重堵塞的现象,造成这种故障现象的原因有很多,例如网络遭遇病毒攻击、网络设备发生硬件损坏、网络端口出现传输瓶颈等。
不过,从网络堵塞现象发生的统计概率来看,网络中发生过改动或变化的位置最容易发生故障现象,因为频繁改动网络时很容易引发网络环路,而由网络环路引起的网络堵塞现象常常具有较强的隐蔽性,不利于故障现象的高效排除。
那么我们能否找到一种合适的办法,来高效解决由网络环路引起的网络通道堵塞现象呢?其实,巧妙配置交换机的环回监测功能,我们可以快速地判断局域网中是否存在网络环路,那样一来由网络环路引起的故障现象就能被快速解决了!
判断网络环路的思路
由于现在新买回来的交换机几乎都支持端口环回监测功能,巧妙地利用该功能,我们就能让交换机自动判断出指定通信端口中是否发生了网络环路现象。
一旦我们在指定的以太网通信端口上启用环回监测功能后,交换机设备就能自动定时对所有通信端口进行扫描监测,以便判断通信端口是否存在网络环路现象。
要是监测到某个交换端口被网络环回时,该交换端口就会自动处于环回监测状态,依照交换端口参数设置以及端口类型的不同,交换机就会自动将指定交换端口关闭掉或者自动上报对应端口的日志信息,日后我们只要查看日志信息或根据端口的启用状态,就能快速判断出局域网中是否存在网络环路现象了。
现在,本文就以H3C S3050型号的交换机为操作蓝本,向各位详细介绍一下利用环回监测功能判断网络环路现象的具体配置步骤。
启用端口环回监测
为了能让交换机自动判断出本地局域网中是否存在网络环路现象,我们需要启用交换机的端口环回监测功能,同时还要启用端口环回监测受控功能,不过在默认状态下,这些功能都处于关闭状态,我们需要手工配置交换机,才能将交换机指定端口环回监测功能以及端口环回监测受控功能启用起来。
在启用交换机的端口环回监测功能时,我们可以先以系统管理员权限远程登录进入交换机后台管理界面,在该界面的命令行提示符下输入字符串命令“sys”,单击回车键后,将交换机切换到系统视图状态;接着在系统视图状态下,执行字符串命令“loopback-detection enable”,这样一来交换机的全局端口环回监测功能就被成功启用了。
下面,我们还需要将交换机指定以太网交换端口的环回监测功能启用起来;例如,要是我们想将以太网16端口的环回监测功能启用起来时,可以先在交换机的系统视图状态下,输入字符串命令“interface GigabitEthernet 1/0/16”,单击回车键后,交互机配置状态就会进入以太网16端口的视图状态,同时交换机的命令行提示符也会自动变成“H3C-
GigabitEthernet1/0/16”,在该命令行提示符下再次执行字符串命令“loopback-detection enable”,这样一来交换机的以太网16端口环回监测功能就被成功启用了;
接着,我们还需要在以太网16端口视图状态下启用Hybrid端口和Trunk端口的网络环回监测受控功能,在启用该功能时,我们只需要在“H3C-GigabitEthernet1/0/16”命令行提示符下,执行字符串命令“loopback-detection control enable”就可以了。
对不同VLAN环回监测
通过上面的配置,交换机系统只能在指定以太网端口下的Hybrid端口和Trunk 端口所属的默认VLAN中执行网络环回监测操作,而无法对其他VLAN执行自动监测操作,这样一来局域网中其他虚拟工作子网中要是存在网络环路现象,交换机仍然无法自动判断出来。
为此我们需要通过合适设置,来让交换机系统能够对其他VLAN也能自动执行网络环回监
测操作;例如,要想让交换机在以太网16端口下的Hybrid端口和Trunk端口所属的所有VLAN中执行网络环回监测操作时,必须进行以下配置操作:
首先将交换机切换到系统视图模式状态下,之后进入以太网16端口视图,在
“H3C-GigabitEthernet1/0/16”命令行提示符下,输入字符串命令“loopback-detection per-vlan enable”,单击回车键后,交换机系统就能在Hybrid端口和Trunk端口所属的所有VLAN中执行网络环回监测操作了。
当然,在上面的所有字符串命令都被执行成功后,我们还需要通过“quit”命令,退出交换机的系统视图状态,之后再执行“save”命令,将交换机的端口配置参数保存起来才可以,不然的话交换机日后重新启动一次时,之前进行的各种配置操作都会被自动丢失掉。
控制网络环回监测状态
有的时候,我们需要在开启某个交换端口的环回监测功能之前,先要查看一下对应端口的环回监测状态,如果发现对应端口的环回监测功能已经处于运行状态时,那就不需要再重复执行“loopback-detection enable”字符串命令了。
在查看某个特定以太网端口环回监测状态时,我们可以先按前面的操作,切换到交换机特定以太网端口的视图模式状态,之后在对应视图状态下执行字符串命令“display loopback-detection”,从打开的界面中我们就能看到指定交换端口的网络环回监测功能是否处于启用状态了,如果结果界面中显示
“Loopback-detection is running”,那就说明对应交换端口的网络环回监测功能已经被成功启
用了。
当然,从该结果界面中,我们还能看到其他一些监测参数,例如网络环回监测的时间间隔、网络环回监测的结果;换句话说,要是局域网中真的存在网络环路故障现象时,我们
就能从这里看到究竟是哪个交换端口存在网络环路现象了,此时网络管理员就能根据这样的监测结果对目标交换端口进行重点检查了,这样就能大大提高网络环路故障现象的解决效率了。
日后,我们想关闭交换机的网络环回监测功能时,只需要将交换机后台管理界面切换到系统视图模式状态,并在该状态的命令行提示符下执行字符串命令“undo loopback-detection”,如此一来交换机中的所有端口网络环回监测功能都将被自动关闭。
应对网络环路故障现象
启用了交换机的网络环回监测功能后,我们该如何利用监测结果,快速解决由网络环路引起的网络堵塞故障现象呢?其实,对于不同链路类型的交换端口,交换机会采用不同的方式来解决网络环路故障现象。
例如,要是指定以太网端口的链路类型为Hybrid端口和Trunk端口,那么该端口日后
一旦存在网络环路现象时,交换机系统就会自动把环回监测的结果上报给日志文件,此时我们如果将对应端口的环回监测受控功能启用起来,该交换端口才会自动与其他交换端口隔离开来,那样一来对应端口的网络环路现象才不会影响到其他交换端口的工作状态。
要是指定以太网端口的链路类型为Access端口时,那么交换机的网络环回监测功能一
旦发现该端口存在网络环路现象时,就会自动向网络管理员提示某个工作子网下面的某个交换端口存在环路故障,并且会自动关闭该交换端口的工作状态,同时会将监测到的结果上报给系统日志文件。
其他配置技巧
对于不同的交换端口,我们需要采用不同的配置,才能保证局域网网络始终处于高效运行状态,如果贸然地为交换端口启用网络环回监测功能时,可能会造成局域网中出现一些莫名其妙的故障现象。
例如,要是某个Access类型的交换端口上联了广域网或者下联了集线器等设备,此时
最好不要为该Access交换端口启用网络环回监测功能,不然的话该功能一旦检测到对应交
换端口下面存在网络环路现象时,就会自动关闭该交换端口的工作状态,这样一来上联或下联到该端口的广域网或局域网就会发生无法上网的故障现象。
对于通过Trunk端口上下连接的几台交换机,由于对应交换端口划分到不同的虚拟工作子网环境中,这时我们应该谨慎配置该Trunk端口的网络环回监测状态,如果我们贸然地将该交换端口配置成环回监测受控功能时,一旦其中某个交换机端口下面存在网络环路现象,那么Trunk端口的工作状态就会被自动关闭了,此时所有交换机的工作状态就会受到影响了。
此时,我们可以尝试启用所有Trunk端口的网络环回监测功能,不过不能将Trunk端口配
置成不受控状态。
日后,局域网中要是某端口下面存在网络环路故障现象时,Trunk端口就不会被强行受控关闭,到时网络管理员只要及时查看交换机的网络环回监测状态,就能快速查找到发生环路故障的特定交换端口了,这样就能高效解决网络通道堵塞故障现象了。