华为MSTP以太网故障处理指导书要点

  • 格式:doc
  • 大小:327.50 KB
  • 文档页数:17

下载文档原格式

  / 17
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

华为MSTP以太网故障处理指导书

华为技术有限公司

目录

1说明 (3)

2故障处理总流程 (3)

2.1流程图 (3)

2.2流程说明 (5)

3MSTP故障处理思路及方法 (5)

3.1MSTP故障处理思路与方法 (5)

3.2MSTP故障类似及原因 (6)

3.3MSTP故障处理方法 (7)

3.3.1对于以太链路完全中断的问题定位 (7)

3.3.2对于以太链路持续存在丢包的问题定位 (9)

4附件 (10)

4.1各种业务开通时需要注意的事项 (10)

4.2以太网性能门限的设置建议 (11)

4.3告警列表 (12)

1 说明

●目的

本指导书是针对华为MSTP系统出现故障时的处理措施,其目的是指导维护

人员尽快恢复设备的正常运行。

●使用对象

OptiX系列SDH光传输设备MSTP系统维护人员。

●适用场合

设备出现故障时,指导设备维护人员快速进行故障定位与排除。

2 故障处理总流程

因掉电、断纤等外部原因,或操作不当以及设备软、硬件故障引起的SDH

系统业务中断,维护人员可参照此流程快速定位故障,或及时寻求帮助,直

到业务恢复。

注意事项:

按照此流程处理业务中断或其它紧急问题时,需要注意以下几点:

1)以尽快恢复业务为原则。

2)应先分析故障现象,定位原因后再进行处理。在原因不明的情况下应避

免盲目操作, 导致问题扩大化。

3)处理过程中遇到困难,及时联系华为公司以获取技术支持,并配合华为

公司处理故障,最大程度减少业务中断时间。

4)处理过程中一定要作好故障记录,保存好故障的原始数据。

2.1 流程图

图1.故障处理总流程

2.2 流程说明

(1) 进行故障记录时,力求做到对故障发生的全过程进行真实、详细的记

录。对于像故障发生的时间,在故障出现前后曾经做过哪些操作等重

要信息都要进行详实地记录,同时对于网管中的告警信息,性能事件

等重要数据也要进行保存。

(2) 外部原因造成的故障,如电源问题、光缆问题、机房环境(温度

等)、终端设备(交换机等)等,应及时进入其它相应处理流程。

(3) 通过查询相关的告警和性能判断是否是SDH层面造成的故障,如果是

SDH层面产生的故障,转SDH故障处理指导书进行处理。华为

EFGS系列单板还提供测试帧功能,能够非常方便的确认SDH侧

VCTRUNK的LINK状态是否正常,操作简单实用。

(4) 如果是由于以太网层面故障,参照《MSTP处理思路及方法》进行处

理。在解决问题时,对设备的操作应该严格按照操作规范进行,如必

须佩戴防静电手带等。

(5) 遇到困难无法排除故障时,拨打华为公司24小时问题受理电话:800-

830-2118,以获取技术支持,并配合华为公司工程师处理故障。

(6) 在业务恢复后,对运行情况进行观察,确认故障已经排除。

(7) 在故障处理完后,应及时填写相关的处理报告。

3 MSTP故障处理思路及方法

对OptiX 系列SDH光传输设备MSTP系统来说,除了遵照故障处理流程

外,还应尽可能采取其它的应急措施(如提供备用电路),减少业务中断时

长。

3.1 MSTP故障处理思路与方法

与SDH故障定位思路一样,以太网故障定位也遵循“先外部、再内部;先软

件、再硬件;先单板、再系统”的原则,充分利用性能事件、环回、测试帧

等技术手段,结合工具软件、测试仪表进行有计划有步骤的定位。

首先需要对于事故做一下初步的定位,首先排除SDH层面的问题:通过查

询相关的告警和性能,EFGS系列单板提供GFP测试帧验证VCTRUNK端

口之间互通性;确认SDH层面没问题后,转入以太网层面的定位。

环回当然是我们的法宝。与数据维护人员配合也是很重要的,一般多用

PING和测试帧+环回手段来定位故障点。比如通过MSTP设备数据单板网

口PING对端路由器或者交换机的IP地址,能够PING通基本证明我们这边

正常,建议采用如下的格式PING包:

ping xxx.xxx.xxx.xxx –l 1000 –t

–l 1000代表是1000字节的包长,-t代表是持续ping包。可以变换多种包

长,同时多开几个ping窗口试试。当然ping包正常也不能完全排除metro

设备的问题,因为在端口工作模式不正确的时候,小流量的ping也是可以

ping通的。它更多意义上是证明我们以太网链路的配置没问题,SDH层面

也是没有问题的。我们的首先需要检查、确认SDH层的配置和通道没有问

题,才能集中精力来排查以太网数据层面的问题。

如业务配置是基于VLAN报文的业务或基于MPLS报文的业务,最好的手段

就是通过数据分析仪来辅助定位问题,在不具备测试仪表的情况下,可通过

“模拟发包”类的软件,利用计算机网卡仿真设备发送业务报文,协助定位

问题。

3.2 MSTP故障类似及原因

一般来说以太网板(这里以EFGS为例)的故障都分成两种类型:

1)链路完全中断

2)链路上持续存在丢包

从目前来看可能造成故障的原因如下:

3.3 MSTP故障处理方法

3.3.1 对于以太链路完全中断的问题定位

对于第一种链路完全中断故障类型,一般表现为对接的路由器和交换机接收

不到任何报文,业务完全中断,完全无法PING通对端设备等等,主要检查

以下几个部位:

(1) 端口TAG属性(TAG/UNTAG)设置不当