当前位置:文档之家› 网络故障分析案例-门户网站访问失败原因

网络故障分析案例-门户网站访问失败原因

网络故障分析案例-门户网站访问失败原因
网络故障分析案例-门户网站访问失败原因

CSNA网络分析专家

案例分析报告

2010年11月

目录

1.故障现象描述 (1)

1.1.故障现象描述 (1)

1.2.基本环境描述 (1)

2.分析方案设计 (2)

2.1.分析目标 (2)

2.2.分析设备部署 (2)

3.分析情况 (3)

3.1.基本流量分析 (3)

3.2.TCP连接分析 (4)

3.3.通过三次握手分析网络时延技巧 (4)

3.4.成功连接的分析模型 (5)

3.5.失败连接快速发现 (5)

3.6.失败原因分析 (6)

4.分析结论 (7)

1. 故障现象描述

1.1. 故障现象描述

某运营商为3G用户提供访问的web portal系统,在每天业务高峰(22:30至23:30)时段都会接到大量的用户投诉:网站访问不了!

在故障时间段, web服务器和各网络设备的进程、资源开销与平时相比并无异常;事后查看各设备的日志,也找不到故障的原因。

1.2. 基本环境描述

用户基本网络拓扑如下图所示,3G手机用户经过无线网络后,通过3G核心网访问web portal系统,web portal系统内部由多台服务器上联到一台交换机,通过Redware做负载均衡,再通过出口路由器和防火墙上联到3G核心网:

系统管理员一直尝试通过监控服务器和网络设备本身的状态、进程和日志的手段来解决问题,但这种传统的网管方式存在以下几个难点:

?系统结构复杂:系统管理员没有3G核心网的管理权限,而web portal系统内部需

要监控的设备很多,工作量大,无法迅速定位是web portal系统内部还是3G核心网端的问题;

?无法关联分析:不同设备的监控数据无法进行有效的关联分析,无法拿出一个整体

解决方案;

?缺乏故障回溯数据:各设备的日志系统内容有限,无法对故障进行回溯;

?监控网络设备时无法获取应用信息,监控应用服务器时无法获取网络信息。

2. 分析方案设计

2.1. 分析目标

借助网络协议分析工具,能够从网络的角度分析到应用信息,实现web portal系统端到端的性能监控,分析web portal系统在故障时间段与平时相比有何异常,最终定位到有问题的设备节点。

2.2. 分析设备部署

在web portal的出口路由器上抓包分析,能够迅速的定位到时web portal 内部问题还是3G核心网端的问题。

3. 分析情况

3.1. 基本流量分析

流量负载分析:

由下图可见,web portal系统的平均流量为8.060Mbps,与平时相比并无异常,也没有发现异常爆发的广播和组播流量;平均包长为718.507字节,并无异常。

流量突发分析:

由下图可见,在故障时间段,并未发现明显的流量突发。

包尺寸分析:未发现异常

小结:通过流量的负载和突发分析,没有发现异常现象,可以排除网络异常流量原因,可进一步分析网络层以上的信息

3.2. TCP连接分析

如下图所示,通过TCP统计信息我们发现:在故障时间段,总共有135个用户访问了该web服务器,建立的TCP连接数为5235个,而可疑的是这5235个连接,有2213次是通过TCP复位发送(RST)来结束连接,而不是通过正常的4次握手来结束连接。

3.3. 通过三次握手分析网络时延技巧

业界通过三次握手分析网络时延的技巧如下图所示:

我们可以利用网络时延分析的技巧,为正常的TCP连接建立模型,以便在对异常连接分析时能够提供对比。

3.4. 成功连接的分析模型

某对成功连接的TCP连接时序图如下所示:

由上图可见,该客户端通过三次握手与服务器建立连接,再进行数据传输:其中,第二个数据包“SYN,ACK”与第一个数据包“SYN”的时间差T1=0.032毫秒,可视为web portal系统内部网络时延,第三个数据包“ACK”与第二个数据包“SYN,ACK”的时间差T2=102.036毫秒,可视为手机用户到web portal系统的网络时延,包括了出口路由器、3G核心网端的网络时延。

通过以上分析分析,我们可以得出这样的结论:正常情况下,web portal 系统内部网络时延大致在1毫秒以内,而3G核心网端(包含出口路由器)的时延为100毫秒左右。

3.5. 失败连接快速发现

失败的连接一般数据量较少,因此我们根据“字节”进行排序,能够快速的定位到那些响应失败的连接:

3.6. 失败原因分析

下图为某对失败连接的TCP连接时序图,从图中可以看出,该客户端向服务器发起了三次建立连接的请求,三次都以失败告终。

右上图可见,服务器回应客户端同步请求的“SYN,ACK”数据包都是在1毫秒内完成的,由此可见,web portal系统能够快速的响应客户端的连接请求,并非连接失败的原因。

而在服务器同步确认后,客户端反而发送“RST(TCP复位发送)”数据包中断了连接,从而导致在10秒钟内三次连接都没有成功,从手机用户的角度来看就是“网页打不开”,之前的TCP统计中我们发现5235个连接中,有2213次这种连接失败,于是便有大量的用户投诉。

由于RST数据包来至客户端方向,我们可以初步定为问题在于:web portal出口路由器或者3G 核心网端。

进一步查看上图,我们发现这三次RST的时延分别为:

a) (0.398-0.032)毫秒= 0.366毫秒

b) (3.279895-3.275531)秒= 0.00034秒= 0.344毫秒

c) (9.359916-9.359537)秒=0.000379秒=0.379毫秒

全部都在1毫秒以内,结合我们之前建立的分析模型,如果该RST是由3G核心网端发起的,响应时延应该在100毫秒左右,而只有在本地网络的出口路由器的RST包能够1毫秒内到达我们的数据分析点。

通过时延的判定,可以确认出口路由器就是导致本次故障的根源。

4. 分析结论

Web portal管理员将分析结果提交给出口路由器得厂家支持人员,厂家支持人员很快发现这是路由器的bug,最后通过升级路由器解决问题。

运营商、金融、政府及大型企业的业务系统,由于网络业务系统结构复杂、网络节点及设备繁多,且业务量日益增长,系统管理员碰到的问题也会越来越复杂;当遇到问题时,很难迅速的定位到有问题的节点,通过传统的网管方式独立的去分析每一台网络设备或服务器,就像是管中窥豹,往往消耗很多时间也解决不了问题。而通过网络协议分析工具,用“旁观”的方式、从网络角度对业务应用进行端到端的分析,能更快速、有效的定位到问题。

最全的网络故障案例分析及解决方案

第一部:网络经脉篇2 [故事之一]三类线仿冒5类线,加上网卡出错,升级后比升级前速度反而慢2 [故事之二]UPS电源滤波质量下降,接地通路故障,谐波大量涌入系统,导致网络变慢、数据出错4 [故事之三]光纤链路造侵蚀损坏6 [故事之四]水晶头损坏引起大型网络故障7 [故事之五] 雏菊链效应引起得网络不能进行数据交换9 [故事之六]网线制作不标准,引起干扰,发生错误11 [故事之七]插头故障13 [故事之八]5类线Cat5勉强运行千兆以太网15 [故事之九]电缆超长,LAN可用,WAN不可用17 [故事之十]线缆连接错误,误用3类插头,致使网络升级到100BaseTX网络后无法上网18 [故事之十一]网线共用,升级100Mbps后干扰服务器21 [故事之十二]电梯动力线干扰,占用带宽,整个楼层速度降低24 [故事之十三]“水漫金山”,始发现用错光纤接头类型,网络不能联通27 [故事之十四]千兆网升级工程,主服务器不可用,自制跳线RL参数不合格29 [故事之十五]用错链路器件,超五类线系统工程验收,合格率仅76%32 [故事之十六]六类线作跳线,打线错误造成100M链路高额碰撞,速度缓慢,验收余量达不到合同规定的40%;34 [故事之十七]六类线工艺要求高,一次验收合格率仅80%36 第二部:网络脏腑篇39 [故事之一] 服务器网卡损坏引起广播风暴39 [故事之二]交换机软故障:电路板接触不良41 [故事之三]防火墙设置错误,合法用户进入受限44 [故事之四]路由器工作不稳定,自生垃圾太多,通道受阻47 [故事之五]PC机开关电源故障,导致网卡工作不正常,干扰系统运行49 [故事之六]私自运行Proxy发生冲突,服务器响应速度“变慢”,网虫太“勤快” 52 [故事之七]供电质量差,路由器工作不稳定,造成路由漂移和备份路由器拥塞54 [故事之八]中心DNS服务器主板“失常”,占用带宽资源并攻击其它子网的服务器57 [故事之九]网卡故障,用户变“狂人”,网络运行速度变慢60 [故事之十]PC机网卡故障,攻击服务器,速度下降62 [故事之十一]多协议使用,设置不良,服务器超流量工作65 [故事之十二]交换机设置不良,加之雏菊链效应和接头问题,100M升级失败67 [故事之十三]交换机端口低效,不能全部识别数据包,访问速度慢70 [故事之十四]服务器、交换机、工作站工作状态不匹配,访问速度慢72 第三部:网络免疫篇75 [故事之一]网络黑客程序激活,内部服务器攻击路由器,封闭网络75 [故事之二]局域网最常见十大错误及解决(转载)78 [故事之三] 浅谈局域网故障排除81 网络医院的故事 时间:2003/04/24 10:03am来源:sliuy0 整理人:蓝天(QQ:) [引言]网络正以空前的速度走进我们每个人的生活。网络的规模越来越大,结构越来越复杂,新的设备越来越多。一个正常工作的网络给人们带来方便和快捷是不言而喻的,但一个带病

典型的网络故障分析、检测与排除

典型的网络故障分析、检测与排除 摘要: 网络故障极为普遍,故障种类也十分繁杂。如果把网络故障的常见故障进行归类查找,那么无疑能够迅速而准确的查找故障根源,解决网络故障。文章主要就网络常见故障的分类诊断及排除进行了阐述。根据网络故障的性质把网络故障分为物理故障与逻辑故障。其物理故障也就是网络设备的故障。其逻辑故障是网络中配置管理的错误。也可根据网络故障的对象把网络故障分为线路故障、路由故障和主机故障。本文主要介绍路由器故障、配置故障、及连接故障的诊断与排除。通过运用工具和方法分析出导致网络故障的主要原因,及解决方法。 关键词:计算机网络,网络故障,分析诊断,物理类故障,逻辑类故障 引言 计算机网络故障是与网络畅通相对应的一个概念,计算机网络故障主要是指计算机无法实现联网或者无法实现全部联网。引起计算机网络故障的因素多种多样但总的来说可以分为物理故障与逻辑故障,或硬件故障与软件故障。采取有效的故障防预措施网络故障目前已经成为影响计算机网络使用稳定性的重要因素之一,加强对计算机网络故障的分析和网络维护已经成为网络用户经常性的工作之一。及时进行网络故障分析和网络维护也已经成为保障网络稳定性的重要方式方法。本文从实际出发,即工作中遇到的网络故障,描述了通过运用网络知识进行故障排除。按照故障现象—>故障分析-->故障解决的研究路线阐述了如何在实际中排除网络故障,及其在网络安全的应用中的重要性。 本文着重讲解了网络故障的排除方法,通过运用解决问题的策略与排除故障的思路在故障现场很快的检测出是属于哪种故障然后再基于故障提出方案给予解决。 正文: 一、网络故障 (一)物理类故障 物理故障,是指设备或线路损坏、插头松动、线路受到严重电磁干扰等情况。比如说,网络中某条线路突然中断,这时网络管理人员从监控界面上发现

配电网故障预控措施及典型案例分析

配电网故障预控措施及典型案例分析 发表时间:2016-11-04T15:05:20.767Z 来源:《电力设备》2016年第15期作者:章勇王浩张彬彬 [导读] 笔者配网故障防范措施入手进行阐述,再通过本单位出现的典型故障案例进行分析,并提出相关整改措施及事件启示。 (国网江苏省电力公司徐州供电公司江苏徐州 221005) 摘要:随着配电电网建设发展,提高供电可靠率、减少配电网故障是一个系统工程,不仅要加强配电网络的运行维护与管理,加强配电网络的建设,还需要加大对故障情况的分析,要从多方面努力才能取得实效。供电企业在进一步提高配电网络的供电可靠性和运行经济性、为广大用户提供优质服务的同时,也为企业带来更大的社会效益和经济效益。保障配网设备的安全稳定运行,减少设备故障的发生。笔者配网故障防范措施入手进行阐述,再通过本单位出现的典型故障案例进行分析,并提出相关整改措施及事件启示。 关键词:配电网,运行,供电可靠性,故障,异常 0 引言 提高供电可靠性、减少配电网故障率,是配电运检专业一项重要基础工作和综合性很强的生产工作,需要从配电网自动化管理作为抓手,针对造成配网故障的主要影响因素,了解故障根源,采取可靠的10kV配电网的预控故障管理措施,才能将各类故障异常遏制。配电网故障的原因气候环境有较大关联,其诱因最终导致的是配网设备故障,发展至事故,首先应对配电网气候环境、设备负荷及人员管理等因素采取相应预控措施。 1 配电网故障原因分析及预控措施 1社会环境造成配网故障的主要方面 社会经济高速发展带来了楼宇建设、交通繁忙,对线路通道造成一定安全隐患,车辆碰撞杆塔导致线路故障的情况时有发生,尤其在夜间或施工场所。基建施工场所对配电网的破坏也是有发生,主要表现在以下方面:①施工机械、物料超高超长碰触带电部位或破坏杆塔;②基面开挖伤及地下敷设电缆;③修路、建房、烧砖等取用土时,对架设在田间地头电杆地段进行取土,破坏了电杆基础,造成电杆倾斜倒塌。 2社会环境因素采取的预控措施 针对道路交通造成的隐患,采取的措施非常必要,一般建议采用反光漆作为方法措施之一,离地面20cm起往上粉刷杆塔,黄黑颜色相间,各3道,色带高度为20cm则可。对屡屡遭受碰撞的杆塔,可在来车前方1m处设置防撞混凝土墩,并刷上类似的反光漆并在拉线上套上带反光标示的护筒;或迁移该类杆塔。 针对施工现场的反故障措施主要有以下几个方面:加大宣传力度,利用各种传媒长期、广泛宣传保护电力设施的重要性,解释破坏电力设施所带来的严重后果以及肇事者应负的责任;有开挖可能的地下线路,适当设置警示牌,增加巡视的次数。 3气候环境造成配网故障的主要方面 根据多年来的配网运行管理经验,耐张点的悬式绝缘子在雷击时极少发生闪络故障,故障发生点集中在针式绝缘子上,应进一步提高针式绝缘子的耐雷水平有助于提高线路的防雷能力。 在配电架空线路抗击冰冻方面,加强线路的抗倾覆能力是关键。大雪会造成线路积雪增加导线荷载,当气温下降到一定程度时,伴随着雪雨水还会在导线上形成覆冰,从而引起导线弧垂增加,受力增大造成到杆断线故障。 2气候环境因素采取的预控措施 针对雷击事故,应提高绝缘子的耐雷水平,特别是针式绝缘子的耐雷水平。安装线路避雷器,部分特殊线路段加装避雷线。提高绝缘子的绝缘等级,只是其中一个方面,还不足以保障线路在遭受雷击后能安全运行,配套措施是增加泄雷通道,而安装线路避雷器则是一个经济、简单、有效的措施。线路避雷器安装地点的确定原则是尽量安装在周围无高层建筑物、地方开阔的线路段上,尤其是雷击多发区周围有高层建筑物屏蔽雷电的线路段可不用考虑安装,以节省投资。雷电高发区的确定可参考气象部门已确定的雷区分布图另一方面可借助雷电信息定位系统的统计数据核实线路是否处于雷击多发区。 10kV线路避雷器建议选用带金属氧化物避雷器的复合绝缘子。定期检测接地网,确保接地网的接地阻值合格。确保了足够数量的泄雷通道后还应保证泄雷通道畅通无阻,而合格的接地网是保障泄雷通道畅通的一个关键原因。定期进行接地网的阻值检测期,对阻值不合格的接地网,视运行时间和实际检测的阻值情况,可分别采用重新构造接地网或增打地极的方法处理。 针对冰雪灾害天气,建议在积雪结冰或风口地段尽量减少档距和多采用耐张段,拉线设置合理,拉盘合格,尽量防止故障进一步扩大。必要时采用人工除冰的办法,尽量减少损失。 5针对设备陈旧及负荷采取的预控措施 对于重载配电网线路和公用台区应每月开展负荷监测工作。对于长期稳定过负荷的馈线建议采取预警制度,及时制定整改方案转接负荷;对于柱上断路器、跌落式熔断器、阀式避雷器、针式绝缘子、高损配变、高低压配电柜、并沟线夹等早期投运的残旧设备,应选用技术参数高的现行产品结合全年的停电计划安排轮换工作。 6针对针对运行管理方面采取的预控措施 在运行管理方面,应着重抓好巡视维护及消缺两项工作。巡视维护方面应针对不同的天气、季节特点,每月度制定巡视计划,落实责任人,确保巡视到位。巡查发现的缺陷或隐患应设专人进行分析归类,按先急后缓、是否需要停电等的条件制定计划,落实消缺工作。同时应根据单位实际清况,建立健全考核激励机制,对每条线路应独立建立档案,分线分杆进行登记,将线路运行情况、巡查记录、设备缺陷、危险点、特殊区域或地段、消缺等全面录入生产系统,作为月度绩效考核的主要依据。 2 一起配电网故障的案例分析 配电网运行管理人员,应对管理制度的执行方面,加强对典型配电故障对分析,提出改进的措施。下面一起配网断路器渗水的设备故障进行分析,并提出相关措施及事件启示。

【干货】典型网络故障案例及处理思路

【干货】典型网络故障案例及处理思路 很多朋友经常提到网络故障,其中在交换机组网时常见的故障比较多。为了便于大家排除这些故障,在此介绍一些常见的典型故障案例及处理思路。 故障1:交换机刚加电时网络无法通信 故障现象 交换机刚刚开启的时候无法连接至其他网络,需要等待一段时间才可以。另外,需要使用一段时间之后,访问其他计算机的速度才快,如果有一段时间不使用网络,再访问的时候速度又会慢下来。 故障分析 由于这台交换机是一台可网管交换机,为了避免网络中存在拓扑环,从而导致网络瘫痪,可网管交换机在默认情况下都启用生成树协议。这样即使网络中存在环路,也会只保留一条路径,而自动切断其他链路。所以,当交换机在加电启动的时候,各端口需要依次进入监听、学习和转发状态,这个过程大约需要3~5分钟时间。

如果需要迅速启动交换机,可以在直接连接到计算机的端口上启动“PortFast”,使得该端口立即并且永久转换至转发状态,这样设备可以立即连接到网络,避免端口由监听和学习状态向转发状态过渡而必须的等待时间。 故障解决 如果需要在交换机加电之后迅速实现数据转发,可以禁用扩展树协议,或者将端口设置为PortFast模式。不过需要注意的是,这两种方法虽然省略了端口检测过程,但是一旦网络设备之间产生拓扑环,将导致网络通信瘫痪。 故障2:5口交换机只能使用4口 故障现象 办公室中有4台计算机,但是只有一个信息插座,于是配置了一台5口(其中一口为UpLink端口)交换机。原以为4台计算机刚好与4个接口连接,1个UpLink端口用于连接到局域网,但是接入到网络之后,与UpLink端口相邻的1号口无法正常使用。 故障分析 UpLink 端口不能被看作是一个单独的端口,这是因为它与相邻端口其实就是一个端口,只是适用的连接对象不同而已。借助UpLink端口,集线设备可以使

常见网络故障的分析及排除方法

常见网络故障的分析及排除方法 【摘要】计算机网络是一个复杂的综合系统,网络故障十分普遍,故障种类也极其繁杂。本文在对具体的网络故障分析基础上,给出了相应的排除方法。 【关键词】网络故障;常见故障;分类诊断;物理故障;逻辑故障 一、网络故障的分类 网络故障的成因无非是硬件和软件两个方面。按照网络故障的性质,网络故障可划分为物理故障与逻辑故障两类。物理故障也叫硬件故障,是指由硬件设备所引发的网络故障。在硬件故障中线路故障、端口故障、集线器或路由器故障及主机物理故障是较为常见的几种故障。 逻辑故障又称为软故障,表现特征为网络不通,或者同一个链路中有的网络服务通,有的网络服务不通。究其根源,是由于设备配置错误或者软件安装错误所致。路由器逻辑故障、主机逻辑故障、病毒故障是几种常见的逻辑故障。 二、排除故障的具体方法 排除故障的方法是不外乎从软件设置和硬件损坏两个方面来考虑: ㈠物理故障及排除方法 1、线路故障最普遍的情况是线路不通,是网络中常见的故障。线路损坏或线路受到严重电磁干扰时最容易引发该故障。诊断此故障时,若线路很短,最直接的方法是将该网络线一端插入一台能够正常连入局域网的主机的RJ45插空内,另一端插入正常的集线器端口中,然后在DOS环境下,使用PING命令在本主机上检测线路另一端主机(或路由器)的端口能否响应,用TRACEROUTE命令检查路由器配置是否正确,根据检测结果进行判断;若线路稍长,不方便移动,可使用网线测试仪器进行线路检测;若线路太长,或线路由电信供应商提供,则需要与提供商协同检查线路,确认是否线路中间出现了故障。 对于存在严重电磁干扰的检测,可以使用屏蔽性能很强的屏蔽线在该线路上进行通信测试,若通信正常,表明存在电磁干扰。若问题依旧,可排除电磁干扰故障。 2、端口故障分为插头松动及端口本身的物理故障。此类故障一般会直接影响到与其相连的其他设备的信号灯状态。信号灯较直观,通过信号灯大体上可以判断出故障的发生范围及有可能存在的因素。检测时,首先应检查RJ45插头是否松动或检查RJ45接口是否制作完好,然后查看集线器或交换机的接口,如果某个接口存在问题,可以更换接口后再进行验证是否真的存在端口故障。 3、路由器或集线器故障会直接导致网络不通。这类故障也是网络上一种常见的故障,故障的现象与线路故障很相近,在诊断此种故障时,必须用专门的诊断工具来收集路由器的端口流量、路由表、路由器CPU温度、负载及路由器的内存余量、计费数据等数据。检测时,可采用替换排除法,用通信正常的网线和主机来连接路由器或集线器,若通信正常,表明路由器或集线器没有故障;反之则应调换路由器(或集线器)的端口来确认故障;很多情况下,路由器(或集线器)的指示灯表明了其本身是否存在故障,正常的情况下对应端口的指示灯为绿色指示灯。通过以上测试后,若问题依旧,可断定路由器或集线器上存在故障。 4、主机物理故障包括网卡物理故障,网卡插槽故障,网卡松动及主机本身故障。对于网卡插槽故障和网卡松动的诊断可通过更换网卡插槽来进行。如果更换插槽仍不能解决故障,可将网卡放到其他正常工作的主机上测试,若正常通信,是主机本身故障,若无法工作,是网卡物理物理故障,更换网卡故障可排除。

典型网络故障总结

典型网络故障总结 网络故障的一般分类 网络故障一般分为两大类:连通性问题和性能问题。它们各自故障排除的关注点如下: ?连通性问题 硬件、系统、电源、媒介故障 配置错误 不正确的相互作用 ?性能问题 网络拥塞 到目的地不是最佳路由 转发异常 路由环路 网络错误 一般网络故障的解决步骤 故障排除系统化是合理地一步一步找出故障原因并解决的总体原则。它的基本思想是系统地将由故障可能的原因所构成的一个大集合缩减(或隔离)成几个小的子集,从而使问题的复杂度迅速下降。 故障排除时有序的思路有助于解决所遇到的任何困难,下图给出了一般网络故障解决的处理流程。 网络故障排除基本步骤 我们以一个故障排除的实例来学习如何应用这些步骤。

案例:某用户网段广播包过多造成该网段的服务器FTP业务传输速度变慢 组网图如下: 某校园网的三个局域网,其中10.11.56.0为一个用户网段,10.11.56.118为一个日志服务器;10.15.0.0是一个集中了很多应用服务器的网段。 用户网段广播包过多造成该网段的服务器FTP业务传输速度慢 1. 故障现象描述 要想对网络故障做出准确的分析,首先应该了解故障表现出来的各种现象,然后才能确定可能产生这些现象的故障根源或症结。因此,对网络故障做出完整、清晰的描述是重要的一步。 如上述案例,用户反映:“日志服务器与备份服务器间备份发生问题。”这就是一个不完整不清晰的故障现象描述。因为这个描述没有讲述清楚下列问题: ●这个问题是连续出现,还是间断出现的? ●是完全不能备份,还是备份的速度慢(即性能下降)? ●哪个或哪些局域网服务器受到影响,地址是什么? 正确的故障现象描述是: 在网络的高峰期,日志服务器10.11.56.11到集中备份服务器10.15.254.253之间进行备份时,FTP传输速度很慢,大约只有0.6Mbps。 2. 故障案例相关信息收集 本步骤是搜集有助于查找故障原因的更详细的信息。主要是三种途径: ●向受影响的用户、网络人员或其他关键人员提出问题; ●根据故障描述性质,使用各种工具搜集情况,如网络管理系统、协议分析仪、相关show命令等; ●测试性能与网络基线进行比较。 如上述案例,可以向用户提问或自行收集下列相关信息: ●网络结构或配置是否最近修改过,即问题出现是否与网络变化有关? ●是否有用户访问受影响的服务器时没有问题? ●在非高峰期日志服务器和备份服务器间FTP传输速度是多少? 通过该步骤,可以收集到了下面一些相关信息: ●最近10.11.56.0网段的客户机不断在增加; ●129.9.0.0网段的机器与备份服务器间进行FTP传输时速度正常为7Mbps,与日志服务器间进行FTP传输时速度慢,只有0.6Mbps;

地市级10kV配网典型故障处理案例分析

地市级10kV配网典型故障处理案例分析 摘要:本文着重分析了10kV配网运行中两点同相接地、两点不同相接地、疑似单相接地等特殊故障现象,并提出正确迅速的处理方法,确保配网安全运行。 关键词:配网运行;典型故障;处理方法 一、漯河电网配网故障分析的意义 漯河配网规模越来越大,配网故障也日趋复杂,对配网的安全可靠运行要求越来越高。漯河地区10kV电网正常运行方式为中性点不接地系统。10kV单相接地故障是漯河配网的各类故障中发生几率最高的一种,单相接地故障(不包括瞬间及间隙性接地)占比80%以上。现对配网典型故障进行分析,总结规律,从而作出正确迅速处理,确保电网安全稳定运行,同时作为经验学习材料供新进学员学习。 二、10kV小电流接地系统的判断 如何判断小电流接地系统的各种故障。中性点不接地电网发生单相接地短路的现象是:故障相电压降低为零,其他两相电压升高或上升为线电压,其接地相的判别方法为: 1、如果一相电压指示为零,另两相为线电压,则为零的相即为接地相; 2、如果一相电压指示较低,另两相较高,则较低的相即为接地相; 3、如果一相电压接近线电压,另两相电压相等且这两相电压较低时,判别原则是“电压高,下相糟”,即按A\B\C相序,哪一相电压高,则其下相即可能为接地相。 各种单相接地短路的特征 故障类型各相对地电压特点故障相判别 单相完全接地一相电压为零,两相升高为线电压电压为零的相为接地相 单相不完全接地一相电压降低但不到零,两相升高但不相等,其中一相可略超过线电压电压降低相为接地相 单相断线一相电压升高,不超过 1.5Ue,两相电压降低且相等,不低于0.866Ue 电压升高相为断线相

关于网络故障方面的一些常见的问题及解决方法

关于网络故障方面的一些常见的问题及解决方法 21 号。如果有,必须手工更改这些设备的中断和 I/O 地址设置。 34 、故障现象:在“网上邻居”或者“资源管理器”中只能找到本机的机器名。 故障分析、排除:网络通信错误,一般是网线断路或者与网卡的接触不良,还有 可能是 H u b 的问题。 35

故障现象: 可以访问服务器, 也可以访问 Int ern et , 却无法访问其他的工作站。 故障分析、排除:如果使用了 w i n s 解析,可能是 wins 服务器地址设置不当;检 查网关设置,若双方分属不同的子网而网关设置有误,则可能看到其他工作站;检查 子网掩码设置。 36 、故障现象:网卡在计算机系统无法安装。

故障分析。排除:第一种可能是计算机上安装了许多其他类型的接口卡,造成中 断和 I/O 地址冲突。可以先将其他不重要的卡拿下来,在安装网卡,最后在安装其他 接口卡。第二种可能是计算机中有一些安装不正确的设备,或者有未知设备一项,是 系统不能检测网卡。这时应该删除未知设备中的所有选项,让偶重新启动计算机。第 三种可能是计算机不能识别这一种类型的网卡,一般只有跟换网卡了。 37 、故障现象:局域网上可以 Ping 通 I P

地址,但 P i n g 不通域名? 故障分析、排除: T C P/I P 协议中的“DNS设置”不正确,请检查其中的配置。 对于对等网, “主机”应该填写自己机器本身的名字, “域”不需填写,DNS服务器 应该填自己的IP。对于服务器/工作站网,主机应该填写服务器的名字,域填写局 域网服务器设置的域, DNS 服务器应该填写服务器的 I P 。 38

5G通信网络优化最佳实践之5G演示之接入失败问题总结案例

5G通信网络优化最佳实践之5G演示之接入失败问题总结案例 目录 5G演示之接入失败问题总结案例...................................................................错误!未定义书签。 一、问题描述 (2) 二、分析过程 (4) 2.1SA组网架构和终端注册流程 (4) 2.2测试设备和SIM卡排查 (6) 2.3信令分析 (7) 2.4基站对比排查 (12) 2.5问题定位结论 (14) 三、解决措施 (14) 四、经验总结 (14)

【摘要】由于5G新技术刚投入使用,在业务演示中经常涌现各种各样的技术问题,对现场技术人员技能要求高。本文以佛山电信在业务演示中定位解决某紧急技术问题的过程为例,说明演示保障中应对技术问题的思路和方法。在这次保障中,5G手机和CPE不能附着网络,时间紧迫,现场技术人员通过更换SIM卡、更换终端设备、更换基站、核查对比参数和license、分析信令等多种手段进行快速排查,最终在业务正式演示开始前成功定位问题。本文总结了该问题的定位过程,为演示保障中如何处理技术问题提供参考。 【关键字】5G 演示 【业务类别】5G 一、问题描述 5G网络作为第五代移动通信网络,以其超高速率、超低时延和超大连接,将大大加速智能驾驶、智慧医疗、智能工业制造等新技术新应用的落地,推动构建一个全移动和全联接的社会。因此政府和各行各业也都对5G表达了浓厚的兴趣,2019年以来5G业务演示在佛山如火如荼地进行。 佛山电信为接待政府和行业伙伴,计划5月18号在电信魁奇大楼通过5G体验车和华为5G手机Mate20X演示5G业务,组网模式为SA组网。体验车业务包括5G速率体验、360 度VR直播、16路4K高清视频直播、IPTV点播等,体现5G网络超大带宽特点;Mate20X 演示业务包括5G速率体验、5G通话等。为了关键时刻不出问题,业务演示前一天分别进行了体验车和手机业务验证,业务正常。 下图为体验车内高清视频演示屏幕示意图。 下图为高清视频演示网络组网架构示意图。

某公司网络PING延迟故障案例解析

某公司网络PING延迟故障案例解析 一、故障描述 故障地点: 石家庄某公司 故障描述: 网络通讯严重阻塞,用户访问外网服务器以及互联网的速度均非常缓慢,甚至不能访问,PING 网关延期。如图: 二、故障详细分析 1. 前期分析 初步判断引起问题的原因可能是: ●ARP病毒 ●网络病毒攻击 开始实际工作配差 1、登录到各交换机,查看内存及CPU的利用率,均正常。 2、通过OMNIPEEK捕获并分析网络中传输的数据包,具体过程如下。 在核心交换机上做好端口镜像,启动OMNIPEEK,约3.08分钟后停止捕获并分析捕获到的数据包。 XX公司网的主机约为300台,一般情况下,有200台左右上网,等停止分析后,我们在OMNIPEEK主界面左边的节点浏览器中发现的主界面查看,在EXPERT的Hierarchy中查看,诊断tcp connection refused时间竟然达到了5731个,感觉很是不对。如图:

进行定位查看,发现有一台计算机极为不正常如图:

由以上看到,可能被外部的DDOS攻击,可能是此计算机感染病毒,进一步查看如图: 可以看到外网计算正在通过135端口正在扫描此计算机,因此可以断定正在被DDOS攻击,此计算机一定感染了木马之类的蠕虫病毒。 找到问题的根源后,正准备对CAI2主机进行隔离,过了一会儿,再次PING网关,还是延迟,但不是太严重了,感觉还是有计算机感染病毒或有ARP攻击,随即再次分析此包,但最终没

有找到可疑的计算机,其间也关闭了几个流量有问题的计算机,但问题还是不能解决,正在百思不得其解时,突然脑子一动:何不尝试着通过分析我自己的计算机,再排查故障呢? 于是笔者选择了科来网络分析系统6.7试用版啊?(笔者只有50个用户的抓包,因此刚开始选择了OMNIPEEK。)设置好过滤条件,这里为什么选在192.168.1.1呢,笔者怀疑是不是有人设置了和网关相同的IP地址呢?选择如下图: 打开自己的计算机进行PING,然后用科来进行抓包,58秒后如下图: 其中8c:68是笔者计算机的MAC,09:37为网关MAC,突然多出了一个A9:4D.查看分析如图:

网络故障案例与故障排除方法

网络故障案例与故障排除方法 一、网络故障案例 故障现象: 一日早晨上班开机,Windows XP系统正常启动后,顺手打开Internet Explorer浏览器,想好好浏览一下当日的新闻快报,却发现IE浏览器的窗口里空空如也。认真一查,发现IE提示为“DNS错误”,刷新几次都是如此,看来网络出问题了。 故障处理: 首先怀疑的当然是DNS服务器了,于是赶忙启动系统的“控制面板→网络连接→网络属性”菜单,点选其中的TCP/IP协议,查看罗列其中的DNS列表,发现配置并没有错误,打了个电话给当地的ISP机房热线,回答是出奇的肯定:DNS No Problem! 难道是我的网络或系统出了故障吗? 大概是最近病毒泛滥成灾的缘故吧,我又想到是否我的机子染了病毒或木马,于是马上拿出最新的防毒软件和防火墙软件,一阵穷追猛打,结果是病毒一个也没有,网站仍然登不上去。 这时我开始怀疑机子的网络配置出了问题,于是点“开始”菜单里的“运行”项,在其中输入cmd并回车,进入了DOS命令行窗口,在其中敲入“Ipconfig /all”回车。这时本机的网卡状态,包括MAC 地址,IP地址,子网掩码,网关地址及DNS服务器等关键参数全部罗列出来,我左顾右盼也没发现任何差错。看来问题不在软件上,而是硬件有麻烦了。

无意中我查看了一下桌面右下角图标的网络状态,发现网络的发送/接收数据包数目居然都是0!这怎么可能?难道是网卡不行了?可是网络右下角的连通状态提示分明给出了“以10M速度连接”的提示,而我在“运行”窗口中敲入“Ping 127.0.0.1”作回环测试,也报告一切正常。于是我理所当然地将网卡故障的可能性排除在外。 转念我又把矛头指向了单位局域网中那台价低位廉、年久失修的交换机上。跑过去一看,嘿!果然不出所料,连接我的桌面电脑的交换机端口指示灯居然不亮!难道这就是问题的根源?可是去问问同事,大伙儿异口同声表示上网正常,这表明这台年迈的交换机还健康长寿,再将同事所用的交换机端口与我互换,他们仍能正常上网,这表明交换机上与我机子相连的接口亦无问题,这下惟一的希望就在连通网卡与交换机之间的网线上了。 由于平时用此网线上网一直正常,因此对它的接线配对无可怀疑,惟一的可能或许是器件老化及经常拔插导致接触不好,四处奔波借来一个网线连通测试仪一测,接近100MB的良好连通性差点让我气歪了嘴!看着网络状态上几乎凝固了的“0”数据包收发,百般无奈之中抱着试试看的想法打开了机箱,看着固化在主板上的那个网卡,烦乱中我用手狠狠地敲了它两下——没想到奇迹发生了!网络状态上的收发数据包计数从“0”变成了“10”,“90”,“200”……顺手打开IE浏览器,一个个熟悉的网站顿时映入眼帘!原来故障的源头竟是这最不放在心上的网卡!它与主板的牢固粘合导致软件测试时报告一切正常,而它在与网线接口处的微小松动却使得网络在物理上已完全隔

传输故障排除案例集锦(HUAWEI)

1 业务中断的处理 1.1 更换光板类型错误导致对端收光不正常 【系统概述】 某传输组网如图1所示,4个OptiX 2500+设备组成双向复用段保护环;1号站为业务中心点,连接网管。其中,3号站和2号站之间距离较长,使用了BPA 光放板。 1w MSP OptiX 2500+23 4e e e e w w w 图1 系统组网图 【故障现象】 某日机房维护人员发现2号站接收3号站方向的S16有R-LOS 告警,全网正常倒换,业务未受影响,用网管查询2号站的告警,PA 有IP-FAIL (无输入光)告警,3号站的BA 有IP-FAIL 告警。 【故障分析及排除】 BPA 板光口1对应的是BA (功放,将 S16的输出光信号放大14或17dBm );光口2为PA (前放,当输入光功率在-22dBm ~-32dBm 之间时,光口OUT2输出光功率变化范围在-7dBm ~-21dBm )。光信号经过BPA 的尾纤连接及信号流向如图2所示:

OUT IN IN OUT OUT IN S16BA PA S16 3号站2号站 图2 BPA光信号流向 (1) 根据光信号经过BPA的信号流可以看出,由于3号站光放板 的BA未收到光信号,导致了2号站的PA、S16报收无光。 可以判断故障点在3号站; (2) 维护人员带S16、BPA、尾纤、光功率计到3号站; (3) 在3号站测试S16板的输出光功率值,光功率计显示无光信 号。可以判断是S16板故障; (4) 将带的S16板插上,测试S16输出光功率为0dBm,恢复尾 纤连接; (5) BA板告警消失,但S16仍有红灯一闪告警,查询为MS-RDI; (6) 查询2号站S16,仍有R-LOS告警; (7) 在3号站,将换上去的S16板发光功率衰减到-15dBm做自环, 告警消失。判断新换上去的S16并没有损坏; (8) 为什么仍有告警呢?分析原因是3号站的S16板使用有错, SS62S1605与SS62S1604波长是一样的,而色散受限距离不同,可能是色散过大导致对端收光不正常。 (9) 查看3号站原来使用的S16的光板类型,为SS62S1605;刚 换上去的S16类型为SS62S1604; (10) 更换同类型的S16,故障消除。

10个最常见的网络故障

10个最常见的网络故障(上) 网络发生故障是难免的,重要的是如何在发生故障后快速地隔离和排除故障。网络维护人员应该配备相应的工具和相应的知识,以便及时、有效的找到和解决问题。本文讨论了网络技术人员和工程师经常遇到的十个令人头疼的问题,通过分析问题的描述和症状的了解,讨论使用何种工具来帮助查找这些故障。本文的案例都具有广泛地应用价值。 问题1:逮捕物理层的滥用者 故障症状:不能登陆或时断时续。只影响一个工作站,而该站原先没有问题 问题分析:电缆终端链路太长。用户每天都移动,弯曲,连接和切断网络终端(尤其时膝上型笔记本电脑)。廉价的电缆测试仪就能检查这种问题。在你能确切地说是电缆的问题之前,通常首先考虑不是电缆的问题。这需要使用网络测试工具来证明本地网段的健康状况是否良好,集线器端口功能是否正常,网卡及其驱动程序工作是否良好。最后,检查网络互连设备是否有问题。 只有此时,你才会知道为了孤立有问题的终端,断开的连接器或是接地回路等问题该从何处着手测试电缆。在铜轴线网络中,搜寻在同轴“T型头”和网卡之间的断头,在UTP网络中,连续运行仪器图测试功能,不断扭动终端以识别接触不良或短路。 解决问题:更换工作站连接电缆,更换损坏的连接器,或者必要的话停止使用水平电缆。再次全面检查处理过的电缆。 问题2:快速以太网比升级前的以太网还慢 故障症状:10Mbps的以太网速度慢,升级为100Mbps快速以太网后甚至不能连接上网。影响新工作站或升级的工作站连接上网。 问题分析:对于UTP5类非屏蔽双绞线,用电缆测试仪测试其是否符合对应100Mbps 传输速率的EIA/TIA-TSB67标准。某些在10Mbps以太网工作正常的电缆链路因为近端串扰太大在100Mbps以太网就不能正常工作。信号耦合到邻近线对引起高频信号传输失败。将UTP的线对分开甚至会使网络在达到一定流量时瘫痪 解决问题:更换或停用不能连接的链路,故障清除后再全部测试处置过的链路。 问题3:无效的看门狗 故障症状:不能连接Novell网络的Netware远程服务器。影响本网段内与服务器相连的所有工作站 问题分析:检查网段的健康状况,注意观察其利用率,碰撞,错误帧和广播帧水平。此时可观察到大量的碰撞或错误帧,该碰撞或错误帧可引起客户机和服务器之间“Hello”帧出

电业局网络故障诊断案例分析

案例分析-某电业局网络故障诊断 一、故障描述 故障地点: 某电业局 故障现象: 网络严峻堵塞,内部主机上网甚至内部主机间的通讯均时断时续。 故障详细描述:

网络突然出现通讯中断,某些VLAN不能访问互联网,且与其它VLAN的访问也会出现中断,在机房中进行ping包测试,发觉中心交换机到该VLAN内主机的ping包响应时刻较长,且出现间歇性丢包,VLAN与VLAN间的丢包情况则更加严峻。 二、故障详细分析 1.前期分析 初步推断引起问题的缘故可能是: ●交换机ARP表更新问题 ●广播或路由环路故障 ●人为或病毒攻击 需要进一步猎取的信息: ●网络拓扑结构及正常工作时的情况 ●交换机ARP表信息及交换机负载情况 ●网络中传输的原始数据包 2.具体分析 首先,我们从网络治理员那儿,得知了网络中主机共450台左右,

同时得到了网络的简单拓扑图,如图1所示。 (图1 网络原始拓扑简图) 从图1能够明白,网络中划分了6个VLAN,分不是10.230.201.0/24、10.230.202.0/24、10.230.203.0/24、10.230.204.0/24、10.230.205.0/24、10.230.206.0/24、,其中201~205这5个VLAN分不用于一个部门,而206为服务器专用网段。各VLAN同时连接上中心交换机(Passport 8010),中心交换机再连接到防火墙,由防火墙连接到Internet以及省单位。大致了解了网络拓扑后,我们以超级终端方式登录中心交换机,发觉交换机的负载较大,立即清除交换机ARP表并重启,但故障仍然存在,因此我们决定对网络进行抓包分析。

LTE核心网常见投诉案例分析

LTE核心网常见投诉案例分析 案例一:临时方案用户预换卡不能使用2、3G业务 【故障现象】 临时方案的用户,在更换USIM卡但未开通4G业务的情况下,在4G网络的覆盖下,用4G手机终端可能无法正常使用2,3G业务。只能在4G手机上设置“2,3G only”,才能恢复正常使用。 【故障分析】 临时方案的用户,在更换USIM卡但未开通4G业务的情况下,当前BOSS系统只是将用户的IMSI鉴权信息通过BOSS指令存储到HSS,并未建立IMSI和MSISDN的关联,即未放号为签约用户的任何2、3G的分组域、电路域和4G 业务的签约信息。这种场景下HSS给MME返回 DIAMETER_ERROR_USER_UNKNOWN的错误码,MME收到HSS的DIAMETER_ERROR_USER_UNKNOWN码后,给终端返回#8 “EPS services and non-EPS services not allowed”的NAS原因值。终端收到“EPS services and non-EPS services not allowed”的NAS值后,不再尝试重新选网。【故障解决】 针对这种临时方案的用户,如果只更换USIM卡不签约4G业务,根据测试,MME给终端返回#7 “EPS services not allowed”的NAS值能够使终端较快地重选到2、3G网络。根据协议中定义的映射规则,HSS需要给MME返回DIAMETER_ERROR_UNKNOWN_EPS_SUBSCRIPTION (5420) with Error Diagnostic of NO_GPRS_DATA_SUBSCRIBED的错误原因值,对应到HSS上,

无线路由器故障经典案例追踪分析

在企业环境下部署无线网络,方便了企业内部的移动办公。而无线路由器则是无线网络的核心组件,它的运行状态决定了无线网络的传输能力。正因如此,维护无线路由器,使其安全高效地运行是管理员首先要考虑的问题。 下面列举几个无线路由器的经典案例,希望对大家有所帮助。 案例1:无法登录无线路由器的设置页面进行路由设置 原因:排除硬件及其连接故障,主要是之前登陆时所创建的连接有误。 排除故障: 第一步:首先检查路由器与电脑的硬件无线连接情况,检查路由器LAN口上的指示灯是否正常。 第二步:如果计算机中装有防火墙或实时监控的杀毒软件,都暂时先关闭,然后将本机IP 地址设为与路由器同一网段,再将网关地址设为路由器的默认IP地址。 第三步:打开浏览器的Internet选项对话框,在连接选项中,如果曾经创建过连接则勾选从不进行拨号连接选项,点击局域网设置按钮,将已勾选的选项全部取消选中即可。 案例2:提示网络不通,连接错误 原因:硬件错误,连接故障及其无线网卡的设置都可能造成网络连接故障。 排除故障: 第一步:首先要检查的是连接配置上有无错误,在确保路由器电源正常的前提下查看宽带接入端,路由器上的指示灯可以说明宽带线路接入端是否正常,由说明书上可以辨认哪一个亮灯为宽带接入端及用户端,观察其灯闪亮状态,连续闪烁为正常,不亮或长亮不闪烁为故障。我们可以换一根宽带胶线代替原来的线路进行连接。 第二步:如果故障依旧,查看路由器的摆放位置与接收电脑的距离是否过远或中间有大型障碍物阻隔。这时请重新放置路由器,使无线路由器与接收电脑不要间隔太多障碍物,并使接收电脑在无线路由器的信号发射范围之内即可。 第三步:无线网卡的检查也必不可少,可以更换新的网卡并重新安装驱动程序进行调试,再网卡中点击查看可用的无线连接刷新网络列表后设置网卡参数,并再属性中查看有无数据发送和接收情况,排除故障。 提示:当然路由器自身的硬件故障也是导致线路不通的直接原因,但这并不是我们所能解决的范围,应及时联系厂商进行维修或更换。

网络故障案例手册Ver1.0

网络故障案例手册 Ver1.0

目录 案例编号20130208 (4) 交换机硬件故障引起网络中断 (4) 典型症状 (4) 其它现象 (4) 处置方法 (4) 案例具体原因 (4) 扩展 (6) 案例编号20130604 (6) 症状 (6) 处置方法 (6) 处置结果 (8) 扩展 (8) 案例编号20130614 (9) 症状 (9) 处置方法 (9) 处置结果 (9) 扩展 (9) 案例编号20131016 (10) 症状 (11) 处置方法 (11)

处置结果 (11) 扩展 (11)

案例编号20130208 交换机硬件故障引起网络中断 典型症状 A.在交换机log中出现如下信息%SW_MATM-4-MACFLAP_NOTIF: Host 68b5.99cd.d276 in vlan 8 is flapping between port Gi0/33 and port Po2; B.交换机在线检查各项参数未见异常,交换机重启后报错,无法加载IOS; 其它现象 交机机载高,网络延迟大,网络丢包。 处置方法 交换机离线与网络隔离,与故障交换机连接的服务器切换到备用交换 机中。 如不确认引起此故障的具体交换机,可将交换机与主网络逐一隔离。 案例具体原因 管理网络端口Port-ASIC芯片自检Fail。 以下为故障交换机启动自检全过程Log front_end/ (directory)

extracting front_end/fe_type_1 (34760 bytes) extracting front_end/fe_type_2 (78400 bytes) extracting front_end/front_end_ucode_info (86 bytes) extracting ucode_info (76 bytes) POST: PortASIC CAM Subsystem Tests : Begin HTD POST: Basic Test Failed POST: POST Failed POST: PortASIC CAM Subsystem Tests : End, Status Failed POST: CAM test failed POST Failed: disabling stack links and shutting down SDP driver class subsystem initialization failed *Mar 1 00:00:35.668: %SYS-3-LOGGER_FLUSHING: System pausing to ensure console debugging output. *Mar 1 00:00:35.668: %SYS-2-ASSERTION_FAILED: Assertion failed: "reg_used_xdr_portid_to_lc_logical_slot()" -Process= "Init", ipl= 0, pid= 3 -Traceback= 1DDA7F8 1DDAF44 1D46E6C 11EC2B0 11EC4A0 286CC78 286CD10 1DE64B8 1DE66F4 1A2F5C8 1A26098

PING大包丢包网络故障分析案例、解决方案

PING大包丢包故障分析 1.1. 故障描述 1. 故障环境 网络结构如下图所示: 如上图所示,两边网络通过光纤相连,中间设备只有光电转换器,到单位B的内部网络有一台防火墙 2. 故障描述 单位B在进行网络测试时,在单位B的出口路由器处PING单位A的出口路由器时,PING大包会出现丢包现象,但是PING小包正常。 1.2. 故障分析 1. 分析方法 主要通过专有的网络分析工具(科来网络分析系统)将故障时相应的数据包捕获下来进行深度分析,并通过分析发现相应的异常,从而定位故障原因的方法。 2. 部署科来网络分析系统 我们在单位B的光电转换器和路由器之间串连一个交换机,利用交换机的端口镜像功能,镜像两个端口的流量,并将科来网络分析系统部署在交换机的镜像口,如下图所示: 3. 分析数据包 通过故障重现,即在路由器接口处进行PING测试,并同时捕获数据包,得到的数据包如下图所示:

如上图所示,我们在使用大包PING对端时,对端返回了一个超时的数据包,查看它具体的数据包解码,如下图: 造成该故障的原因是因为,我们在网络中传输大包时,由于网络中“最大传输单元”的限制,大数据包会发生分片,当分片数据包都到达目的端时会发生重组,一旦有一个分片丢失就会造成数据报重组超时,所以会发送超时的差错提示。 4. 分析结论 我们在进行PING测试时,数据包只经过了光电转换器和中间链路,所以造成该故障的原因就是光电转换器或中间链路丢包造成的。 1.3. 总结 当我们在分析数据包时,发现通信的数据包中有异常的数据包,那么我们就需要关注它是何种应用的数据包,通过分析异常的数据包可以帮助我们快速的找到故障原因,从而解决故障。

相关主题
文本预览
相关文档 最新文档