当前位置:文档之家› 第3章 故障定位的基本思路与方法

第3章 故障定位的基本思路与方法

第3章  故障定位的基本思路与方法
第3章  故障定位的基本思路与方法

第3章故障定位的基本思路与方法

本章介绍常见故障的基本处理思路和方法。包括:

对维护人员的要求

故障定位的基本原则

故障判断与定位的常用方法

故障处理的过程示例

3.1 对维护人员的要求

快速定位和及时排除光传送系统的故障,对维护人员的业务技能、操作规范等都有很高要求。维护人员应做到以下应知应会。

3.1.1 专业技能

1. 熟练掌握SDH的基本原理

参见《光同步数字传送网》主编:韦乐平人民邮电出版社。

2. 熟练掌握传输系统告警信号流及告警产生的机理

参见《OptiX OSN 3500/2500/1500智能光传输系统维护手册告警及性能事件分册》。

3. 熟练掌握以下常见告警信号的处理

(1)线路告警

R_LOS

R_LOF

R_OOF

AU_AIS

AU_LOP

MS_AIS

MS_RDI

B1_EXC

B2_EXC

HP_LOM

HP_SLM

HP_TIM

HP_UNEQ

(2)支路告警

TU_AIS

TU_LOP

T_ALOS

P_LOS

EXT_LOS

UP_E1_AIS

LP_RDI

LP_SLM

LP_TIM

LP_UNEQ

B3_EXC

(3)保护倒换告警

PS

(4)时钟告警

LTI

SYNC_C_LOS

SYN_BAD

(5)设备告警

POWER_FAIL

FAN_FAIL

BD_STATUS

告警信号的处理方法,参见《OptiX OSN 3500/2500/1500智能光传输系统维护手册告警及性能事件分册》。

4. 熟练掌握传输设备和网管的基本操作

参见网管操作手册和网管的联机帮助。

5. 熟练掌握传输常用仪表的基本操作

传输设备在维护中常用的仪表包括:2M误码仪、光功率计、SDH分析仪、示波器、万用表等,使用方法参见各仪表的使用手册。

3.1.2 工程组网信息

熟悉组网情况。

熟悉业务配置。

熟悉设备运行状况。

熟悉工程文档,并作好工程文档的维护工作。

3.1.3 故障现场数据的采集与保存

采集并保存设备的告警及性能事件。

采集并保存各网元及单板的配置数据。

采集并保存各网元及单板的运行状态数据。

采集并保存网管的操作日志。

3.2 故障定位的基本原则

故障定位关键是:将故障点准确地定位到单站。

故障定位的一般原则可总结为四句话:先外部,后传输;先网络,后网元;

先高速,后低速;先高级,后低级。

故障定位的一般原则可总结如下:

先定位外部,后定位传输。

在定位故障时,应先排除外部的可能因素,如光纤断,对接设备故障或电源问题等。

先定位网络,后定位网元。

在定位故障时,首先要尽可能准确地定位出是哪个站的问题。

先高速部分,后低速部分。

从告警信号流中可以看出,高速信号的告警常常会引起低速信号的告警;

因此在故障定位时,应先排除高速部分的故障。

先分析高级别告警,后分析低级别告警。

在分析告警时,应首先分析高级别的告警,如紧急告警、主要告警;然后再分析低级别的告警,如次要告警和提示告警。

3.3 故障判断与定位的常用方法

故障定位的常用方法可简单地总结为:“一分析,二环回,三换板”。

当故障发生时,首先通过对告警、性能事件、业务流向的分析,初步判断故障点范围。然后,通过逐段环回,排除外部故障或将故障定位到单个网元,以至单板。最后,更换引起故障的单板,排除故障。

对于较复杂的故障,需要综合使用表3-1所示的方法进行故障定位和处理。

表3-1 复杂故障的定位和处理

常用方法适用范围操作特点

告警、性能分析法通用

全网把握,可初步定位故障点;不影响

正常业务;依赖于网管。

环回法

分离外部故障,将故

障定位到单站、单板

不依赖于告警、性能事件的分析;快捷。

替换法

将故障定位到单板,

或分离外部故障

简单;对备件有需求;需要与其他方法

同时使用。

配置数据分析法

将故障定位到单站或

单板

可查清故障原因;定位时间长;依赖于

网管。

更改配置法将故障定位到单板风险高;依赖于网管。

仪表测试法

分离外部故障,解决

对接问题

通用,具有说服力,准确度高;对仪表

有需求;需要与其他方法同时使用。

经验处理法特殊情况处理快速;易误判;需经验积累。

3.3.1 告警、性能分析法

SDH信号的帧结构里定义了丰富的、包含系统告警和性能信息的开销字节。

因此,当SDH系统发生故障时,一般会伴随有大量的告警和性能事件信息,通过对这些信息的分析,可大概判断出所发生故障的类型和位置。

获取告警和性能事件信息的方式有以下两种:

通过网管查询传输系统当前或历史发生的告警和性能事件数据。

通过传输设备机柜和单板的运行灯、告警灯的状态,了解设备当前的运行状况。

1. 通过网管获取告警信息,进行故障定位

通过网管获取故障信息,定位故障的特点是:

全面:能够获取全网设备的故障信息。

准确:能够获取设备当前存在哪些告警、告警发生时间,以及设备的历史告警;能够获取设备性能事件的具体数值。

如果告警、性能事件太多,可能会面临无从着手分析的困难。

完全依赖于计算机、软件、通信三者的正常工作,一旦以上三者之一出问题,通过该途径获取故障信息的能力将大大降低,甚至于完全失

去。

下面通过举例,对告警、性能数据分析法给予说明。

在如图3-1所示的链形组网中,网管计算机设在NE1站。

图3-1 链形组网图

故障现象:NE1站和NE4站间的E1业务中断,从NE1站无法登录NE4站,且NE3站东向光板有MS_RDI告警和HP_RDI告警,NE1站与NE4站间的业务

所对应的E1通道有LP_RDI告警。

分析判断:通过分析告警,可知NE4站没有正确接收到NE3站发出的信号,而NE3站能正确接收到NE4站发出的信号。可能的故障原因包括:

NE3站东向光板发送信号有问题。

光缆线路问题(包括光纤和光纤接头)。

NE4站光板的接收信号问题。

故障定位:借助于网管软件,可以通过修改业务配置、人工插入告警等方法,对故障进行定位。例如,若我们怀疑图3-1中NE2站与NE3站间光纤接反

(即NE2站的东向光接口板误接NE3站的东向光接口板),则可以通过网管在

NE2站东向光接口板人工插入HP_RDI,然后通过网管观察NE3站告警上报情况:

若是西向光接口板上报HP_RDI告警,则说明NE2站的东向发送端接的是NE3站的西向接收端,光纤连接正确。

若是NE3站的东向光接口板上报了HP_RDI告警,则说明NE2站东向发送端接到了NE3站的东向接收端,光纤接反,需要纠正。

注意:

通过网管获取告警或性能信息时,应注意保证网络中各网元的当前网元运行时间设置正确,倘若网元时间设置错误,将会导致告警、性能信息上报错误或根本不上报。

在维护过程中,对某网元重下配置后,应特别注意将该网元的网元时间设为当前时间,否则网元会工作在缺省时间里,而缺省时间并不是当前时间。

2. 通过设备上的指示灯获取告警信息,进行故障定位

OptiX OSN 3500/2500/1500 设备上有不同颜色的运行和告警指示灯,这些指示灯的状态,反映出设备当前的运行状况或存在告警的级别。

机柜顶部指示灯的状态及含义参见《OptiX OSN 3500/2500/1500智能光传输系统设备手册》。

OptiX OSN 3500/2500/1500单板一般都有4个指示灯,其含义参见《OptiX OSN 3500/2500/1500智能光传输系统设备手册》。

3. 两种获取故障信息途径的比较

从上面的介绍可以看出,通过网管与通过观察设备指示灯这两个途径获取设备故障信息,各有其优点。因此,在实际的故障定位过程中,这两种手段要结合起来使用。

排除故障时,需要网管中心的维护人员与各站的设备维护人员共同参与,一般由网管中心的维护人员协调指挥,各站的设备维护人员密切配合,统一行动。

两种途径的比较如表3-2所示。

表3-2 通过网管和指示灯获取故障信息途径的比较

项目网管设备指示灯

主要使用者网管维护人员设备维护人员

定位作用主要配合

告警信息全网、大量、确切单站、少量、模糊

历史告警有无

告警时间可以看到无法知道

性能事件可以看到无法知道

计算机、软件、通信完全依赖无关

3.3.2 环回法

1. 概述

环回法是SDH传输设备定位故障最常用、最行之有效的一种方法。该方法最大的一个特色就是定位故障,可以不依赖于对大量告警及性能数据的深入分析。作为一名SDH传输设备维护人员,应熟练掌握。

警告:

环回操作可能会影响正常的业务,建议在业务量小的时候使用。

环回操作分为软件、硬件两种,这两种方式各有所长:

硬件环回相对于软件环回而言环回更为彻底,但它操作不是很方便,需要到设备现场才能进行操作;另外,光接口在硬件环回时要避免接收光功率过载。

软件环回虽然操作方便,但它定位故障的范围和位置不如硬件环回准确。比如,在单站测试时,若通过光口的软件内环回,业务测试正常,并不能确定该光板没有问题;但若通过尾纤将光口自环后,业务测试正常,则可确定该光板是好的。

2. OptiX OSN 3500/2500/1500 对软件环回操作的支持

OptiX光传输系统的软件环回操作及应用特点如表3-3所示。

表3-3 OptiX光传输系统软件环回操作及应用

支持软件环回的单

作工

软件环

回操作类型

环回级别应用

支路板

内环回、

外环回

按通道环回

可分离交换机故障还是传输

故障,且可初步判断支路板是否

存在故障。不需要更改业务配置。

线路板

内环回、

外环回

按光接口环

将故障定位到单站,且可初

步判断线路板是否存在故障。不

需要更改业务配置。

交叉时钟板

线路环

回、支路环回

按业务通道

环回

单站故障的定位中,可定位

是线路侧故障还是支路侧故障。

需要更改业务配置,对操作人员

要求较高。

由于支路板环回、线路板环回可将故障定位到单站,同时可初步定位支路板、线路板是否存在故障,因此在实际中使用最多,要求维护人员熟练掌握。

交叉时钟板环回可用于初步定位单站故障是线路侧故障、支路侧故障还是交叉故障,同时还可以定位出是哪一侧的线路板故障。由于交叉时钟板环回操

作起来比较复杂,一般很少使用。

窍门:

实现交叉时钟板环回最简单的方式就是通过网管配置一个线路板或支路板的环回业务。当然,环回前先要作好业务备份工作,以便恢复业务时使用。

3. 环回法的使用

在进行环回操作前,需确定对哪个通道、哪个时隙环回?应该在哪些位置环回?应该使用哪种环回——外环回,还是内环回?这可分四个步骤进行。

操作

1

通过咨询、观察和测试等手段,选取其中一个的确有故障的业务通道作为处理、分析的对象。环回业务通道采样简化的过程可以描述如下:

从多个有故障的站点中选择其中的一个站点。

从所选择一个站点的多个有问题的业务通道中,选择其中的一个业务通道。由于自环第一个VC-4通道,可能会影响ECC通信,因此尽量不要选择第一个VC-4通道内的业务。

对于所选择出来的业务通道,先分析其中一个方向的业务。

2

画出所选取业务一个方向的路径图。在路径图中表示出:该业务的源和宿,该业务所经过的站点,该业务所占用的VC-4通道和时隙。

3根据所画出的业务路径图,采取逐段、逐站环回的方法,定位出故障站点。

4

故障定位到单站后,通过线路、支路和交叉时钟板环回,进一步定位可能存在故障的单板。最后结合其他方法,确认存在故障的单板,并通过换板等方法排除故障。

窍门:

对于同时出问题的业务,一般都具有一定的相关性,因此只要恢复其中的一个业务,其他的业务常常能自动得到恢复。另外,采样简化的思路,也常常使得故障的分析、处理显得更加清晰、简单。尤其是在出故障的业务比较复杂的情况下,采样简化的方法更加显得行之有效,甚至是故障定位思路的出发点或突破口。

4. 环回法实际应用举例

环回法实际应用案例参见《OptiX OSN 3500/2500/1500智能光传输系统维护手册故障处理分册》第1章的“1.2.8 环回举例”。

5. 环回法小结

环回法不需要花费过多的时间去分析告警或性能事件,而可以将故障较快地定位到单站乃至单板。方法操作简单,维护人员较容易掌握。

但是,假若所环回的通道内有其他正常的业务,环回法必然会导致正常业务的暂时中断,这是该方法最大的一个缺点。因此,一般只有出现业务中断等

重大事故时,才使用环回法进行故障排除。

3.3.3 替换法

1. 概述

替换法就是使用一个工作正常的物件去替换一个被怀疑工作不正常的物件,从而达到定位故障、排除故障的目的。这里的物件,可以是一段线缆、一

个设备或一块单板。

2. 替换法的使用

替换法既适用于排除传输外部设备的问题,如光纤、中继电缆、交换机、供电设备等;也适用于故障定位到单站后,用于排除单站内单板的问题。

3. 替换法实际应用举例

如图3-1的示例中,如果怀疑NE3站发与NE4站收之间的光纤有问题,则可将NE3站与NE4站间收、发两根光纤互换。若互换后,NE3站东向光板的收有R_LOS告警,则说明是光纤的问题;若互换后,故障现象与原来一样,则说明光纤没有问题,而是光板的问题。此时,可以进一步使用替换法,分别替换NE3站东向光板和NE4站西向光板,来定位到底是哪块光板的问题。

如果支路板某个2M通道有T_ALOS告警,我们怀疑是交换机或中继线的问题,则可与其他正常通道互换一下。若互换后T_ALOS告警发生了转移,则说明是外部中继电缆或交换机的问题;若互换后故障现象不变,则可能是传输的问题。

利用“替换法”,我们还可以解决其他如电源、接地等问题。

4. 替换法小结

替换法的优势是:简单,对维护人员的要求不高,是一种比较实用的方法。

但该方法对备件有要求,且操作起来没有其他方法方便。插拔单板时,若不按规范执行,还可能导致板件损坏等其他问题的发生。

3.3.4 配置数据分析法

1. 概述

在某些特殊的情况下,如外界环境条件的突然改变,或由于误操作,可能会使设备的配置数据——网元数据和单板数据遭到破坏或改变,导致业务中断等故障的发生。此时,在将故障定位到单站后,可使用配置数据分析法进一步定位故障。

2. 配置数据分析法的使用

通过查询、分析设备当前的配置数据是否正确,来定位故障。配置数据包括:复用段的节点参数、线路板和支路板通道的环回设置、通道追踪字节等。

对于网管误操作,还可以通过查看网管的操作日志来进行确认。

3. 配置数据分析法小结

配置数据分析法适用于故障定位到单站后故障的进一步分析。该方法可以查清真正的故障原因。但该方法定位故障的时间相对较长,且对维护人员的要求非常高。一般只有对设备非常熟悉、且经验非常丰富的维护人员才使用。

3.3.5 更改配置法

1. 概述

更改配置法所更改的配置内容可以包括:时隙配置、板位配置、单板参数配置等。因此更改配置法适用于故障定位到单站后,排除由于配置错误导致的

故障。另外更改配置法最典型的应用就是用来排除指针调整问题。

2. 更改配置法的使用

如怀疑支路板的某些通道或某一块支路板有问题,可以更改时隙配置将业务下到另外的通道或另一块支路板;若怀疑某个槽位有问题,可通过更改板位

配置进行排除;若怀疑某一个VC-4有问题可以将时隙调整到另一个VC-4;另外

交叉时钟板的自环,也可以认为是“更改配置法”的一种。

在升级扩容改造中,若怀疑新的配置有错,可以重新下发原来的配置来定位是否配置问题。

但需要注意的是,我们通过更改时隙配置,并不能将故障确切地定位到是哪块单板的问题——线路板、交叉时钟板、支路板、还是母板问题。此时,需

进一步通过“替换法”进行故障定位。因此,该方法适用于没有备板的情况下,

初步定位故障类型,并使用其他业务通道或板位暂时恢复业务。

应用更改配置法在定位指针调整问题时,可以通过更改时钟的跟踪方向以及时钟的基准源进行定位。

3. 更改配置法小结

由于更改配置法操作起来比较复杂,对维护人员的要求较高;因此,通常只在没有备板的情况下,为了临时恢复业务而使用;或在定位指针调整问题时

使用。此外在使用该方法前,应保存好原有配置,同时对所进行的步骤予以详

细记录,以便于故障定位。

注意:

对于复用段保护环,倒换状态下修改业务配置可能会造成复用段协议停止,造成业务中断。

3.3.6 仪表测试法

1. 概述

仪表测试法一般用于排除传输设备外部问题以及与其他设备的对接问题。

2. 仪表测试法应用

如我们怀疑电源供电电压过高或过低,则可以用万用表进行测试;若怀疑传输设备与其他设备对接不上是由于接地的问题,则可用万用表测量对接通道

发端和收端同轴端口屏蔽层之间的电压值,若电压值超过0.5V,则可认为接地

有问题;若怀疑对接不上是由于信号不对,则可通过相应的分析仪表观察帧信号是否正常,开销字节是否正常,是否有异常告警等。

3. 仪表测试法小结

通过仪表测试法分析定位故障,说服力比较强。缺点是对仪表有需求,同时对维护人员的要求也比较高。

3.3.7 经验处理法

1. 概述

在一些特殊的情况下,如由于瞬间供电异常、低压或外部强烈的电磁干扰,致使传输设备某些单板进入异常工作状态。此时的故障现象,如业务中断、ECC 通信中断等,可能伴随有相应的告警,也可能没有任何告警,检查各单板的配置数据可能也是完全正常的。经验证明,在这种情况下,通过复位单板、单站重启、重新下发配置或将业务倒到备用通道等手段,可有效地及时排除故障、恢复业务。

2. 经验处理法小结

建议尽量少使用该方法来处理,因为该方法不利于故障原因的彻底查清。

遇到这种情况,除非情况紧急,一般还是应尽量使用前面介绍的几种方法,或通过正确渠道请求技术支援,尽可能地将故障定位出来,以消除设备内外隐患。

3.3.8 各种故障定位法的比较

故障定位过程中常用的方法各有特点。表3-4所示为各种故障定位方法的对照表。在实际的应用中,维护人员常常需综合应用各种方法,完成对故障的定位和排除。

表3-4 各种故障定位方法对照表

3.4 故障处理的过程示例

对于传输设备的故障处理来说,不管对于哪种类型的故障,其处理过程都是大致相同的,即首先排除传输设备外部的问题,然后将故障定位到单站,接着定位单板问题,并最终将故障排除。

3.4.1 排除传输设备外部故障

在进行传输设备的故障定位前,首先排除外部设备的问题。这些外部设备问题包括:接地、光纤、中继线、交换机、电源故障等问题。

1. 分离传输设备问题还是交换机问题

【方法1】可以通过自环交换机中继接口来判断。如果中继接口自环后,交换机中继板状态异常,则为交换机问题。如果中继接口自环后,交换机中继板状态正常,则一般为传输设备问题。

【方法2】通过测试传输设备2M/34M/140M业务通道的好坏,来判断是否是交换机故障。测试时,使用电口环回的方法,如图3-2所示。

图3-2 电口环回的方法

在站点NE2选择一故障业务通道,进行挂表测试,在站点NE1的支路板上把对应业务通道设置为内环回,这样就隔离了交换机。如果环回后仪表显示业务正常,则说明传输设备没有问题,故障可能在交换机或中继电缆;如果业务仍不正常,则说明传输设备有问题。

2. 光纤故障的排除

对于怀疑断纤的情况,此时,光板必然有R_LOS告警。为进一步定位是光板问题还是光纤问题,可采取如下方法。

方法1:使用OTDR(Optical Time-Domain Reflectometer)仪表直接测量光纤。可以通过分析仪表显示的线路衰减曲线判断是否断纤,及断纤的位置。但需注意,OTDR仪表在很近的距离内,有一段盲区。

注意:

测试时,需要断开与光板相连的尾纤,因为OTDR的发光功率比较大,光板接收光功率过载,造成光板损坏。

方法2:测量光纤两端光板的发送和接收光功率,若对端光板发送光功率正常,而本端接收光功率异常,则说明是光纤问题;若光板发光功率已经很低,

则判断为光板问题。

方法3:测试光板的发光功率正常后,使用尾纤将光板收发接口自环(注意不要出现光功率过载),若自环后光板红灯仍有紧急告警,则说明是光板的问

题;若自环后红灯熄灭,则需使用相同的方法,测试对端光板。若对端光板自

环后,红灯也熄灭,则可判断是光纤问题。

方法4:使用替换法。用一根好的光纤来替代被怀疑是故障的光纤,判断是否的确是光纤的问题。

3. 光纤连接故障的排除

对于环形网中的ADM(Add/Drop Multiplexer)站点,要求本站的东向光板接下一站的西向光板,其他站点依此类推;对于链形网中的ADM站点,光纤连

接也要按照一个确定的方向,本站的东向光板接下一站的西向光板。在光纤接

错时,一般都会有大量的指针调整事件发生,进一步的定位可使用以下三种方

法。

方法1:可以通过拔纤、关断激光器等方法来判断光纤是否接错。该方法会影响业务,建议不使用这种方法。

方法2:通过网管插入MS_RDI告警的方法来进行判断。该方法不影响业务,推荐使用。

方法3:通过网管修改高阶通道追踪字节J1的方法。注意修改追踪字节可能会影响业务,谨慎使用。

以上三种方法都是通过观察相邻站的对应光板是否上报正确的告警来分析的,对方法一,相邻站对应光板由于接收不到光信号,应上报R_LOS告警。对

方法二,相邻站对应光板应报MS_RDI告警。对方法三,相邻站对应光板应报

HP_TIM告警。如果发现相邻站的对应光板无正确告警上报,但是相邻站另一块

光板却有正确告警上报,则可以确定是光纤连接错。

4. 中继线缆故障的排除

如果在交换设备侧自环,交换中继状态正常;在传输设备的子架接线区上自环,传输测试也正常,则一般为中继电缆问题。当电缆不通或接触不良时,

一般可以在对应的支路板通道上看到T_ALOS告警。在这种情况下,可以采用

“对线”方法来判断电缆的通断和连接正确性,也可通过与其他正常通道互换

线缆的方法排除。

5. 供电电源故障的排除

如果某站登录不上,且与该站相连的光板均有R_LOS告警,则可能是该站的电源故障。若该站从正常运行中突然进入异常工作状态,如出现通道倒换或复用段倒换失败、某些单板工作异常、业务中断、登录不正常等情况,则需检查传输设备供电电压是否过低,或者曾经出现过瞬间电压剧烈波动的情况。

6. 接地问题的排除

如设备出现被雷击或对接不上的问题,则检查接地是否存在问题。首先检查设备接地是否符合规范,是否有设备不共地的情况;同一个机房中各种设备的接地是否一致;其次可通过仪表测量接地电阻值和工作地、保护地之间的电压差是否在允许的范围内。

3.4.2 故障定位到单站

故障定位中最关键的一步,就是将故障尽可能准确地定位到单站。而将故障定位到单站,最常用的方法就是“环回法”,即通过逐站对光板的外环回和内环回,定位出可能存在故障的站点或光板。另外,告警性能分析法,也是将故障定位到站点比较常用的方法。一般来说,综合使用这两种方法,基本都可以将故障定位到单站。

3.4.3 故障定位到单板并最终排除

故障定位到单站后,进一步定位故障位置最常用的方法就是替换法。通过单板替换法可定位出存在问题的单板。另外更改配置法、配置数据分析法以及经验处理法,也是解决单站问题比较常用和有效的方法。

表3-5给出了故障处理的各个过程及其常用的方法。

表3-5 故障处理的过程及其方法

常见问题定位方法

1.1 故障定位思路 1.1.1 OSPF网上问题解决要点 OSPF网上问题和其他模块的网上问题不同,大多数模块的问题往往只会导致部分报文丢掉,部分业务不通;而OSPF网上问题一旦发生往往会导致某个区域到某个区域所有业务都不通了,持续的时间长,影响的范围广,报的事故级别也就高。 解决OSPF网上问题首先必须要做的就是收集信息;然后就是要快速恢复业务;最后就是分析问题,解决问题。 1信息收集: 如果你用的是Windows自带的telnet,请通过菜单选择:然后请将以下命令粘贴到telnet:为了方便收集信息,可以输入以下命令,使输出信息不分屏: 然后输入以下命令收集OSPF信息:

最好再收集一下fib信息。 2恢复业务,一般情况,采用以下三种措施就能够暂时将业务恢复,因此在收集完信息后马上就做,以减小事故的影响 2.1如果配置了“引入直连或静态路由”,但却没有生成对应的ASE(这种问题已发 生多次):去掉引入配置,再重新引入;如果问题不属于此类 2.2使用reset ospf,重起ospf;不过,推荐做法是把OSPF配置清掉,重新配置OSPF; 如果还不行 2.3配置静态路由恢复业务;如果有多台路由器配置静态路由,可以先在某台路由器 配置静态路由,然后再引入静态路由到OSPF通告出去。但是,由于外部路由会 通告到整个自治域,所以一定要慎重考虑。 3业务恢复了,我们就可以静下心来分析一下问题在哪。 1.1.2 OSPF问题分析: OSPF绝大部分网上问题表现就是“不通”,再细分下去 1不通

1.1没有生成路由 1.1.1有LSA,但没有生成路由 1.1.1.1ASE没有生成对应的路由: 这时候要看看OSPF路由表中有无到forwarding address的路由,可以通 过display ospf routing看有无“Routing for ASEs”: Routing for Network Destination Cost Type NextHop AdvRouter Area 3.0.0.0/8 1 Net 3.0.0.1 1.0.0.2 1 2.0.0.0/8 1562 Stub 2.0.0.1 2.0.0.2 1.0.0.0/8 1563 Stub 3.0.0.1 1.0.0.2 1 Routing for ASEs Destination Cost Type Tag NextHop AdvRotuer 101.0.0.0/8 1 2 1 3.0.0.1 1.0.0.1 9.0.0.0/8 1 2 1 3.0.0.3 1.0.0.2 Total Nets: 3 Intra Area: 3 Inter Area: 0 ASE: 2 NSSA: 0 如果没有的话,往往是因为没有到达ASBR或forwarding address的自治 域内路由。 1.1.1.1.1ASE LSA的forwarding address不为0.0.0.0 通过display ospf lsdb ase命令,可以看到 Link State Data Base type : ASE ls id : 101.0.0.0 adv rtr : 1.0.0.1 ls age : 239 len : 36 seq# : 80000003 chksum : 0x247 options : (DC) Net mask : 255.0.0.0 Tos 0 metric: 1 E type : 2 Forwarding Address :3.3.3.3 Tag: 1

OTN告警介绍及故障定位方法.

OTN告警介绍及故障定位方法 1 OTN帧结构简介 1.1 OTN产生的背景 目前随着通信行业的发展,对光网络的要求越来越高,要求光网络所承载的信息量也越来越大,承载的客户信号种类也各种各样,包括SDH、ATM、以太网、IP等多种信号都要求能在光网络中快速、高效、透明、可靠的传输。为此,国际电信联盟ITU制订光传送网OTN的相关标准,来指导OTN的发展。 光传送网OTN是下一代光网络的发展方向。OTN设备主要完成的功能就是将客户信号封装在OTN的相应帧格式中,透明、高效的进行传输,同时,通过相应的OTN开销对信号的好坏进行检测。因此,理解好OTN开销对深入理解OTN设备有着重要意义。 ITU-T在G.709标准中规定了OTN的帧格式和映射方式,;在G.798标准中规定了设备的功能特性。因此,本手册主要以G.709和G.798为标准,结合我司M820V2.5设备和 ZXONE 8X00设备,主要讲述我司设备OTN开销的实现以及检测。 1.2 OTN的网络层次 光传送网OTN的一个主要特征就是网络的层次化。将光传送网划分为多个网络层次,每个层次之间彼此互为服务层与客户层。客户信号在不同层次之间进行传输,每一层次都有着自己的开销,用于检测本层次信号的好坏。 根据ITU-T的G.709规定,OTN分为客户信号层、光通道净荷单元(OPU)、光通道数据单元(ODU)、光通道传送单元(OTU)、光通道层(OCH)、光复用段层(OMS)、光传输段层(OTS)。以上各层之间,前者是后者的客户层,后者是前者的服务层。下面是对各层的简单说明: 1. 客户信号层:该层主要指OTN网络所要承载的局方信号,主要包括:SDH、以太网、 IP业务等。 2. 光通道净荷单元OPU:该层主要是用来适配客户信号以便使其适合在光通道上传输, 即:承载客户信号的“容器”。该层的开销主要用来指示客户信号映射到OTN信号的过程。 3. 光通道数据单元ODU:该层是由OPU层和ODU层相关开销构成的,该层的开销可 以支持对传输信号质量端到端的检测。 4. 光通道传送单元OTU:该层是在光路上传输信息的基本单元结构,有ODU层和OTU 层相关开销构成。

OTN介绍及故障定位方法

OTN介绍及故障定位方法 1 OTN帧结构简介 1.1 OTN产生的背景 目前随着通信行业的发展,对光网络的要求越来越高,要求光网络所承载的信息量也越来越大,承载的客户信号种类也各种各样,包括SDH、ATM、以太网、IP等多种信号都要求能在光网络中快速、高效、透明、可靠的传输。为此,国际电信联盟ITU制订光传送网OTN的相关标准,来指导OTN的发展。 光传送网OTN是下一代光网络的发展方向。OTN设备主要完成的功能就是将客户信号封装在OTN的相应帧格式中,透明、高效的进行传输,同时,通过相应的OTN开销对信号的好坏进行检测。因此,理解好OTN开销对深入理解OTN设备有着重要意义。 ITU-T在G.709标准中规定了OTN的帧格式和映射方式,;在G.798标准中规定了设备的功能特性。因此,本手册主要以G.709和G.798为标准,结合我司M820V2.5设备和 ZXONE 8X00设备,主要讲述我司设备OTN开销的实现以及检测。 1.2 OTN的网络层次 光传送网OTN的一个主要特征就是网络的层次化。将光传送网划分为多个网络层次,每个层次之间彼此互为服务层与客户层。客户信号在不同层次之间进行传输,每一层次都有着自己的开销,用于检测本层次信号的好坏。 根据ITU-T的G.709规定,OTN分为客户信号层、光通道净荷单元(OPU)、光通道数据单元(ODU)、光通道传送单元(OTU)、光通道层(OCH)、光复用段层(OMS)、光传输段层(OTS)。以上各层之间,前者是后者的客户层,后者是前者的服务层。下面是对各层的简单说明: 1. 客户信号层:该层主要指OTN网络所要承载的局方信号,主要包括:SDH、以太网、 IP业务等。 2. 光通道净荷单元OPU:该层主要是用来适配客户信号以便使其适合在光通道上传输, 即:承载客户信号的“容器”。该层的开销主要用来指示客户信号映射到OTN信号的过程。 3. 光通道数据单元ODU:该层是由OPU层和ODU层相关开销构成的,该层的开销可 以支持对传输信号质量端到端的检测。 4. 光通道传送单元OTU:该层是在光路上传输信息的基本单元结构,有ODU层和OTU 层相关开销构成。

Cortex-M3 内核HardFault错误调试定位方法

Cortex-M3 内核HardFault错误调试定位方法 1、首先更改startup.s的启动文件,把里面的HardFault_Handler代码段换成下面的代码: HardFault_Handler\ PROC IMPORT hard_fault_handler_c TST LR, #4 ITE EQ MRSEQ R0, MSP MRSNE R0, PSP B hard_fault_handler_c ENDP 2、然后把hard_fault_handler_c函数放在c文件的代码中。代码如下: void hard_fault_handler_c(unsigned int * hardfault_args) { static unsigned int stacked_r0; static unsigned int stacked_r1; static unsigned int stacked_r2; static unsigned int stacked_r3; static unsigned int stacked_r12; static unsigned int stacked_lr; static unsigned int stacked_pc; static unsigned int stacked_psr; static unsigned int SHCSR; static unsigned char MFSR; static unsigned char BFSR; static unsigned short int UFSR; static unsigned int HFSR; static unsigned int DFSR; static unsigned int MMAR; static unsigned int BFAR; stacked_r0 = ((unsigned long) hardfault_args[0]); stacked_r1 = ((unsigned long) hardfault_args[1]); stacked_r2 = ((unsigned long) hardfault_args[2]); stacked_r3 = ((unsigned long) hardfault_args[3]); stacked_r12 = ((unsigned long) hardfault_args[4]); /*异常中断发生时,这个异常模式特定的物理R14,即lr被设置成该异常模式将要返回的地址*/ stacked_lr = ((unsigned long) hardfault_args[5]); stacked_pc = ((unsigned long) hardfault_args[6]); stacked_psr = ((unsigned long) hardfault_args[7]);

相关主题
文本预览
相关文档 最新文档