ETH专线丢包异常类问题定位指导
- 格式:ppt
- 大小:2.92 MB
- 文档页数:12
端口丢包原因解析及排查指南2010-9-28福建星网锐捷网络有限公司版权所有侵权必究修订记录目录1数据包处理流程说明 (3)1.1交换机芯片结构 (4)1.2数据包处理流程 (5)1.3缓冲区 (6)1.4IBP与HOL (6)1.4.1IBP (6)1.4.2HOL (6)1.4.3IBP与HOL的联系 (7)2端口丢包常见原因及处理办法 (9)2.1端口计数器的说明 (10)2.2底层常见计数器说明 (13)2.3端口丢包常见原因 (15)2.4端口丢包和转发丢包的联系与区别 (17)3端口丢包故障处理案例 (18)3.1S86端口下出现output方向的drop计数 (19)3.2S26开启组播,组播画面出现马赛克 (22)4常见FAQ (27)4.1Storm-control控制的报文方向 (28)4.2QOS限速导致的端口丢包是否会在show interface gi xx显示? (28)4.3生成树block的端口,output方向是否有丢弃包的计数? (28)1 数据包处理流程说明1 1.1 交换机芯片结构交换芯片是交换机的灵魂,交换芯片注定了交换机的数据转发性能及部分功能。
例如不同型号产品的芯片型号便有所不同,但芯片的总体逻辑架构基本都如下图所示,模块化的交换机也基本都是多线卡组合起来的,实质就是单芯片通过Hi-Gig口连接到背板形成星型结构,由引擎来进行集中管理和控制功能。
说明:强烈推荐大家阅读此篇文档,加深对交换机硬件的理解。
《千兆位以太网交换芯片BCM5690及其在交换机中的应用》名词解释:ASIC(MAC 芯片):为所有端口提供线速交换,ASIC:内部提供多种tables,如MAC地址表,VLAN表,MSTP表,链路聚合表,链路聚合流量平衡表,IPMC表(IP组播表),用于策略控制的FFP(Fast Filter Process)表等。
这些都是在MAC芯片内部存贮,以CAM或TACM的方式寻址,硬件实现,完全满足数据包需要线速处理和转发的需要。
如何解决网络丢包问题网络丢包问题是我们在使用网络时经常会遇到的一个常见问题,它会导致网络连接不稳定,影响我们的工作和生活。
针对这个问题,本文将介绍一些解决网络丢包问题的方法,希望能对读者有所帮助。
一、检查网络连接首先,我们需要检查网络连接是否正常。
可以尝试重新启动路由器或调制解调器,检查网线是否插好,电话线是否接触良好。
若有网线连接,则可以尝试更换网线,看是否能解决丢包问题。
如果网络仍有问题,可以联系网络服务提供商或技术支持,寻求进一步的帮助。
二、调整网络设置如果网络连接正常,但仍然出现丢包问题,我们可以尝试调整网络设置来解决问题。
1. MTU设置:MTU(Maximum Transmission Unit)是数据在网络传输中的最大长度,过大的MTU可能导致丢包现象。
我们可以通过在计算机上设置较小的MTU值来解决问题。
具体方法是,在Windows 系统中,打开命令提示符窗口,输入“netsh interface ipv4 show subinterfaces”命令查看网络接口,找到对应的接口名称,然后输入“netsh interface ipv4 set sub interface 接口名称mtu=1400 store=persistent”命令来设置MTU值为1400。
在其他操作系统中,可以参考相关文档或咨询技术支持进行设置。
2. DNS设置:DNS(Domain Name System)是将域名解析为IP地址的系统,不稳定的DNS服务器可能导致网络丢包问题。
我们可以尝试更改为可靠的DNS服务器,例如Google Public DNS或OpenDNS。
具体设置方法可以参考相关文档或咨询技术支持。
3. QoS设置:QoS(Quality of Service)可以优化网络传输质量,减少丢包现象。
我们可以在路由器的设置页面中找到QoS选项,并根据网络需求进行适当的配置。
例如,可以设置特定应用程序或设备的优先级,避免其占用过多的带宽而导致丢包。
02-以太⽹故障查询、定位⽅法⼩结以太⽹数据板的相关查询和定位(SS61ET1)我们希望各位能熟悉下⾯的相关内容,但本资料的⽂档结构顺序并不代表处理实际问题所应遵循的排查流程,因为故障类型多样,需要排查点多不相同,所以,希望通过本资料能给⼤家⼀个⽐较清晰的思路,同时在处理实际问题的时候结合相关的各种命令和⼿段来综合的处理,有关的故障处理流程请参考相关资料。
本资料虽然⼤多数命令是针对SS61ET1单板的,不过⽬前在⽤的⼤多数以太单板、业务相关故障都可参考本资料的⼤部分故障排查、处理思路。
原理都是相通的。
同时,也希望⼤家在了解本资料的同时能充分思考,结合各⾃⼯作中的实际情况不断的提出需求和指正,使本资料不断完善、充实、内容准确,从⽽能更好的帮助、指导我们的⼯作,更好的提⾼⽤户的满意度。
⼀.故障定位发⽣事故时该查询哪些数据,⼀直是困扰以太⽹板维护的⼀个问题,这⾥总结了⼀些常⽤的定位⽅法和查询命令,及其含义的注解,希望对以后的维护⼯作有所帮助。
与SDH故障定位思路⼀样,以太⽹故障定位也遵循“先外部、再内部;先软件、再硬件;先单板、再系统”的原则,充分利⽤性能事件、环回、测试帧等技术⼿段,结合⼯具软件、测试仪表进⾏有计划有步骤的定位。
⾸先需要对于事故做⼀下初步的定位,⾸先排除SDH层⾯的问题,通过查询相关的告警和性能,确认SDH层⾯没问题后,转⼊以太⽹层⾯的定位。
对于以太⽹业务的故障定位,还是⾸先检查有⽆和ET1板相关的告警,主要集中在⼀些低阶的告警。
⽐如BIP-EXEC,TU-LOP,LP-SLM等等。
注意查询时候最好使⽤单板侧的告警查询命令::ptp:bid,16,0如果存在低阶业务告警,可以对SDH层⾯进⾏⼀些相应的检查,否则就需要定位⼀下是否是对接的路由器或者以太⽹交换机的故障造成。
这种定位⽐较困难,⼿段也不多。
环回当然是我们的法宝了,有关环回的⼀些常⽤命令请参见第4节相关内容。
找局⽅数据维护⼈员配合也是很重要的,⼀般多⽤PING+环回⼿段来定位故障点。
网络丢包现象的剖析与应对摘要网络丢包是一种非常常见的现象,也是一种非常复杂和难以被发现的问题。
如果网络出现丢包,就会影响数据传输,计算机网络也就得不到正常应用,从而会极大的影响工作质量和效率。
本文对网络丢包的各种表现进行了深入分析,总结引起网络丢包的不同起因,通过对网络丢包的实时检测,提供详细的排除过程,从而有效的解决网络丢包问题。
关键词网络丢包;实时检测;解决办法1网络丢包的各种表现1.1无法自动获得IP地址具体表现如下:1)网络连接提示受限制或无连接,并且在系统托盘区中的连接图标上有感叹号。
2)一自动获取就自动分配了一个169.254.223.251之类的地址。
3)拨号软件无法连接服务器,提示网络连接错误。
4)无法访问Internet。
1.2网络速度不稳定具体表现如下:1)网络速度时快时慢,有时候慢得打不开网站。
2)网络连接过程中,检验用户名与密码停顿久。
3)玩网络游戏刚开始正常,玩一会就开始卡,卡一会又不卡,周而复始。
4)下载东西前几分钟快,几分钟后开始变慢,再过几分钟又变快,周而复始。
1.3网络时延大具体表现如下:1)上网无法浏览网页却能用QQ聊天。
2)开始网速正常,但过了一段时间后,网速变慢。
3)IE浏览器突然出现“找不到服务器”的提示。
4)QQ总是出现“与服务器连接中断”的提示,然后不断地进行反复登陆。
2网络丢包的不同起因2.1网络设备问题1)网卡故障。
①绑定的协议过多—网卡上如果绑定了许多协议,当数据通过网卡时,计算机就要花费很多时间来确定该数据使用哪种协议来传送,从而造成网速缓慢,引起丢包;②驱动程序安装错误—当网卡驱动程序安装错误时,会对数据传输造成影响,从而引起网络丢包;③设备老化—当集成网卡“服役”时间比较长后,很容易发生设备老化现象,而老化了的网卡设备在处理大量数据时几乎就不能正常工作,从而引起丢包。
2)ADSL故障。
ADSL设备工作时发热量比较大,许多用户把ADSL设备和路由器、集线器等放在一个机柜里,不利于散热,对ADSL的正常工作有影响,从而引起网络丢包。
华为MSTP以太网业务中断问题定位与SDH故障定位思路一样,以太网故障定位也遵循“先外部、再内部;先软件、再硬件;先单板、再系统”的原则,充分利用性能事件、环回、测试帧等技术手段,结合工具软件、测试仪表进行有计划有步骤的定位。
与SDH定位不同的是,以太网本身缺乏网络管理、监控能力,即OAM功能很弱,这种劣势往往需要更多的使用工具软件和仪表来弥补。
同时,故障往往牵涉传输和数通两大产品,这就要求维护人员能站在整个网络的高度、业务的角度来看待问题,而不是仅仅看到SDH网络。
下面简单介绍一些华为MSTP业务在运行中突然中断情况下的应急处理步骤:1、首先在网管上检查有无以下异常告警:另外,通过观察电路板指示灯闪烁情况,可以初步判断故障原因并做相应处理,如下表所示:从以上告警检查和设备指示灯可以首先判断设备SDH是否发生乐问题,如果出现上述现象,请按照SDH设备的故障处理方法进行处理。
2、检查以太网单板有无以下异常告警:如果出现ETH_LOS告警,说明传输设备以太网板与数据设备对接之间出现问题,可能是(1)断纤;(2)以太网线干扰太大;(3)以太网口失效(接口板故障);(4)以太网双绞线断;(5)PHY芯片损坏;(6)两端工作模式不匹配。
可以通过更换网线,更换端口等方法进行简单定位处理。
另外,确认一下ET1单板插网线的以太网接口是否有LINK灯亮(绿色),没有亮说明网线可能坏了,或者是交叉和公网线弄混了。
(注意光接口板的指示灯在接口板内部);同时看看接口上另外一个指示灯(黄色)是否在亮,有亮说明有数据收发,没有则说明无数据收发。
3、如果仅仅是丢包问题,还可以结合以太网性能事件进行判断。
如果是以太网中断问题,请按照下面的步骤继续处理。
4、如果经过检查,没有发现上述的告警信息,请检查以太网业务的基本配置。
正常情况下业务突然中断不会有以下原因导致,单如果存在人为误操作或个别单板故障,需要查询该项。
a)查询以太网口使能与工作模式。
OptiX 光网络以太网业务丢包故障处理专题华为技术支持网站1.1.1 华为以太网业务接入板-ET1V1系列(透传)早期提供的使用ML-PPP协议封装的以太网透传单板,绑定颗粒为VC12。
OptiX 2500+(Metro3000):SS61ET1OptiX 155/622H(Metro1000):SS42ET1OptiX 155/622(Metro2050):SS11ET11.1.2 华为以太网业务接入板-ET1V2系列(二层交换)使用ML-PPP协议封装的以太网二层交换单板,绑定颗粒为VC12。
OptiX 2500+(Metro3000):SS61ET1S(可以通过SS61ET1软件升级实现);OptiX 155/622H(Metro1000):SS42ET1O(可以通过SS42ET1软件升级实现)、SS42ET1D(两个MAC口)、SS42EF1(四个电口+两个光口);OptiX 155/622(Metro2050):SS11ET1S(可以通过SS11ET1软件升级实现)、SS11EF1D(两个光口)、SS11EF1Q(四个光口)。
1.1.3 华为以太网业务接入板-EFGS系列(透传&二层交换)使用LAPS/HDLC/GFP封装的新型以太网透传&二层交换单板,绑定颗粒为VC12/VC3。
全规格的单板仅仅支持GFP封装协议。
OptiX 2500+(Metro3000):SS61EFS0、SS61EMS1;OptiX 155/622H(Metro1000):SS42EFS4;OptiX 10G(Metro5000):SSA1EFS4、SSA1EGS2;OptiX Metro 1050:SSM1EMS3;OptiX OSN1500/2500/3500:SSN1EFS0、SSN1EFS4、SSN1EGS2,SSN2EFS0、SSN1EGS2。
1.1.4 华为以太网业务接入板-EFGT系列(纯透传)使用LAPS/HDLC/GFP封装的新型以太网纯透传单板,绑定颗粒为VC12/VC3(EFT)、VC3/VC4(EGT)。
版权所有:杭州华三通信技术有限公司无线终端丢包问题定位故障排查一、开始WLAN 在使用过程中,有时候会发现无线终端(STA )在ping 其他设备时,会出现连续丢包现象。
这种情况下可能还伴随ping 延时增大(几百毫秒),并导致一些应用感觉不是很好,例如下载速度变慢、视频出现抖动等等。
这种情况是WLAN 网络中比较棘手的问题,一方面WLAN本身有一个复杂的、不容易评估的空间媒质,导致空口的不稳定性,另一方面还要综合考虑整个有线、无线网络的网络配置和性能。
下面是一个典型的WLAN基本网络构成(FIT AP组网方式),当Station ping服务器丢包严重时,需要按照报文转发途经来考虑丢包的可能性。
定位故障的思路是:首先,通过测试判断终端能否正常连接、获取地址。
然后,判断有线网络是否存在丢包问题。
再次,判断无线终端状态、空口利用率、空口质量、底噪是否正常。
最后,通过收集debugging信息分析问题原因。
1、终端能否ping通网关(1)ping测试具体操作命令:ping 192.168.1.3例如:通过命令查看,可以确认当前网络丢包属于那种类型。
(2)无线网络丢包说明从目前的协议分析和实际应用来看,无线网络可能无法实现真正的零丢包。
空口利用率正常、无干扰的情况下,3%以内的丢包是可以接受的范围。
2、判断有线网络是否正常(1)如果网关不在AC上,需要做终端ping AC地址的测试。
第一、如果ping网关异常但是ping AC正常,则需要排查AC至网关二层网络。
第二、如果ping网关、AC均异常,则需要排查有线丢包。
(2)如果终端在线则直接通过命令行查到当前AP地址,然后通过AC ping版权所有:杭州华三通信技术有限公司AP判断AC到AP的有线网络链路状态,如果终端不在线,则直接进入下一个环节第一、查找当前终端所链接AP的名称命令:display wlan client mac-address 0024-d79c-af4c verbose 例如:通过命令查看,可以确认终端当前链接AP的名字。
、传输专线业务故障简易处理(一) 闪断现象1.传输网络有别于局域网,它由许多个传输系统共同组成,用户开通的电路经过若干个传输网元设备和光缆线路。
传输系统之间具备一定的保护机制,出现线路或设备故障时将产生切换保护动作,该保护动作将产生瞬间中断的现象,为此,按国际惯例SDH/MSTP电路可用性设置在≥99.99%。
每月中断允许时间为259.2 秒。
每次保护瞬断的时间50ms,但由于这个过程,会导致用户路由器端口协议会有中断的情况,引起用户端路由器协议需要重新协商,会造成电路在路由器上显示有瞬断的情况。
2.当出现闪断现象后,客户首先要记录瞬断时间和时长,统计瞬断是否规律性发生。
如果闪断是偶尔出现的状况,说明电路仍然处于正常运行,暂时无需报障;如果频繁出现可进行以下简易预处理。
3.检查用户端机房内线路经过的路径上是否出现新增强电场干扰。
4.检查接线是否松脱,可以拨动、整理一下线缆及接头,如果是由于松动导致的,必然再次产生一个瞬断45(二) 线路中断1.线路开通一般情况下在客户端机房放置传输设备,例如xDSLmodem 、光端机、PDH、协议转换器或传输网元。
此类设备故障将导致线路中断,请检查设备状态运行指示灯是否正常,是否掉电。
如果设备无法确定是否正常,建议你把设备重新加电尝试,观察线路是否恢复。
2.线缆接口松动也是造成线路中断的原因之一,请检查进入客户机房段的线缆是否出现松脱,线缆是否存在进水短路等。
3.老鼠咬断线缆。
客户可以顺着用户机房内槽道检查线路状况,发现有断点的可以先自行接驳起来恢复业务,同时通知运营商派人维修。
4.如上述问题都已排除,可以通知运营商进行线路的环路测试,首先可以使用我司提供的2M 直通头将协议转换器前的线路端口连接,同时通知运营商检查是否收到环路。
通过用户配合测试很容易判断故障点,从而节省处理时间。
(三) 线路丢包1.SDH/MSTP 以太网专线丢包率要求<0.01%,客户可以通过ping 测试,发送10000 个64 字节的数据包,观察丢包是否超出指标范围。