Optix metro2050告警及性能事件产生原理
- 格式:doc
- 大小:649.03 KB
- 文档页数:21
OptiX Metro500EFS单板常见告警和性能事件EFS板的常见告警、性能告警和性能事件分别见表1-1、表1-2、表1-3。
表1-1 EFS板的常见告警告警名称告警描述告警产生的可能原因缺省告警级别ALM_GFP_dCSF GFP客户信号丢失GFP客户信号丢失。
紧急ALM_GFP_dLFD GFP失步GFP状态机跳出SYNC状态。
主要ALM_GFP_dSSF GFP服务层信号丢失GFP服务层信号丢失。
紧急B3_EXC_VC3 B3_EXC告警表示高阶通道(B3)误码过量●接收信号衰减偏大。
●光纤头不清洁或光纤连接器不正确。
●上游站发送部分故障。
●本站接收部分故障。
主要B3_SD_VC3 B3_SD为高阶通道(B信号劣化●接收信号衰减偏大。
●光纤头不清洁或光纤连接器不正确。
●上游站发送部分故障。
●本站接收部分故障。
次要BD_STATUS 单板不在位告警●单板未插。
●单板插座已松动。
主要BIP_EXC BIP误码过量BIP2误码过大。
次要BIP_SD BIP信号劣化BIP2误码过大。
次要ETH_LOS 以太网输入信号丢失●以太网网线断掉。
●两个以太网端口工作模式不匹配。
紧急FCS_ERR 校验和出错封装协议一致但是协议参数内容不一致。
紧急FPGA_ABN FPGA状态异常芯片中加载的FPGA数据为FLASH备份区的数据,主区没有FPGA数据或数据错误。
主要HARD_BAD 硬件故障硬件故障。
紧急LCAS_FOPR LCAS接收方向协议失效LCAS模块宿端检测到异常,导致LCAS无法协商或协商不正确。
主要LCAS_FOPT LCAS发送方向协议失效LCAS模块源端检测到异常,导致LCAS无法协商或协商不正确。
主要LCAS_PLCR LCAS接收方向的带宽部分丢失接收方向的实际通道个数小于配置个数,且不为零。
次要LCAS_PLCT LCAS发送方向的带宽部分丢失发送方向的实际通道个数小于配置个数,且不为零。
OptiX metro100告警处理A_LOC项目描述告警名称上路总线时钟丢失(Add to bus - loss of clock)告警级别主要告警单元FP1D告警指示设备面板MAJ指示灯闪烁,相应通道E1指示灯红色闪亮告警原因∙交叉板故障或不在位∙时钟板故障或不在位处理步骤1. 设备复位,查看告警是否排除。
2. 更换设备。
APS_FAIL项目描述告警名称保护倒换失败指示(APS protection switching failed)告警级别主要告警单元SCC告警指示设备面板MAJ指示灯闪烁告警原因∙在复用段保护倒换过程中失败∙复用段节点信息设置错误∙复用段节点信息丢失处理步骤1. 检查全网复用段节点信息是否设置正确,修改错误配置后,查看告警是否排除。
2. 检查全网的复用段协议是否正常,重新停止、启动协议后,查看告警是否排除。
APS_INDI项目描述告警名称保护倒换指示(APS protection switching indication)告警级别主要告警单元SCC告警指示设备面板MAJ指示灯闪烁告警原因发生复用段保护倒换处理步骤1. 对于环形复用段保护组网,本告警表示发生了复用段倒换,排除复用段保护故障后,查看告警是否排除。
2. 对于非环形复用段保护组网,本告警表示APS协议非正常启动,检查复用段节点参数是否设置正确,修改错误配置后,查看告警是否排除。
APS_PARA_ERR项目描述告警名称复用段节点参数校验失败告警(APS fail to verify multiplex section node parameter)告警级别紧急告警单元SCC告警指示设备面板MAJ指示灯闪烁告警原因∙没有配置复用段节点参数∙节点参数配置错误∙节点参数逆时针配置(网元一的东-----网元二的西为顺时针)项目描述处理步骤检查复用段节点参数配置是否正确,进行正确的配置后,查询告警是否消失。
AU_AIS项目描述告警名称AU告警指示(AU alarm indication signal)告警级别主要告警单元SFP告警指示设备面板MAJ指示灯闪烁告警原因∙由上游站点的R_LOS、R_LOF告警引发的AU_AIS告警∙由本站MS_AIS、R_LOS、R_LOF告警引发的AU_AIS告警∙业务配置错误处理步骤1. 检查上游站点的告警,如果有R_LOS或R_LOF告警,则请参见“R_LOS”或“R_LOF”进行处理。
OptiX2500+(Metro3000)SDH 误码事件产生和检测1.产生机理在SDH 系统中,误码检测是采用比特间插奇偶校验的方法,即用B1、B2、B3、V5字节对再生段、复用段、高阶通道和低阶通道的校验矩阵进行奇偶校验。
B1字节用于再生段层误码监测,使用偶校验的比特间插奇偶校验码。
B1字节的工作机理:发送端对本帧(第N 帧)加扰后的所有字节进行BIP-8偶校验,将结果放在下一个待扰码帧(第N+1帧)中的B1字节;接收端将当前待解扰帧(第N-1帧)的所有比特进行BIP-8校验,所得的结果与下一帧(第N 帧)解扰后的B1字节的值相异或比较,若这两个值不一致则异或有1出现,根据出现多少个1,则可监测出第N 帧在传输中出现了多少个误码块。
B2字节用于复用段层的误码监测,B2的工作机理与B1类似。
B1字节是对整个STM-N 帧信号进行传输误码检测的,一个STM-N 帧中只有一个B1字节,而B2字节是对STM-N 帧中的每一个STM-1帧的传输误码情况进行监测,STM-N 帧中有N 3个B2字节,每三个B2对应一个STM-1帧。
检测机理是发端B2字节对前一个待扰的STM-1帧中除了RSOH (RSOH 包括在B1对整个STM-N 帧的校验中了)的全部比特进行BIP-24计算,结果放于本帧待扰STM-1帧的B2字节位置。
收端对当前解扰后STM-1的除了RSOH 的全部比特进行BIP-24校验,其结果与下一STM-1帧解扰后的B2字节相异或,根据异或后出现1的个数来判断该STM-1在STM-N 帧中的传输过程中出现了多少个误码块。
可检测出的最大误码块个数是24个。
B3字节负责监测VC-4在STM-N 帧中传输的误码性能,也就监测140Mbit/s 的信号在STM-N 帧中传输的误码性能。
监测机理与B1、B2相类似,只不过B3是对VC-4帧进行BIP-8校验。
V5具有误码校测,信号标记和VC-12通道状态表示等功能,V5字节通过b1~b3检测VC-12在STM-N 帧中传输的误码性能。
华为公司OptiX2500常见告警及产生原因华为公司OptiX 2500常见告警及产生原因1、APS_FAIL:告警表明复用段自动保护倒换失败。
原因:复用段节点信息丢失或新旧协议不一致2、APS_INDI:告警表明已经发生了复用段保护倒换。
原因:有R_LOS R_LOF MS_AIS B2_EXC或者有 B2_SD使能或下发了外部倒换命令3、AU_AIS:告警表明线路接收的信号中AU指针全部为“1”产生该告警表明该AU4的业务不可用,系统会向对端回传HP_RDI告警,如果配置有子网连接保护(SNCP),则会发生信号失效(SF)倒换4、AU_LOP:告警表明线路板接收的信号中的AU指针丢失。
该AU4的业务不可用。
系统会向对端回传HP_RDI告警,如果配置有子网连接保护(SNCP),则会发生信号失效(SF)倒换5、B1_EXC:告警表明线路接收的信号中再生段(B1)误码越限。
光口上接收的信号再生段误码(B1)过大,超过了性能门限,导致该光口的业务不可用。
产生该告警后,系统默认会向交叉方向下插AU_AIS。
6、B2_EXC:告警表明线路接收的信号中复用段(B2)误码越限。
光口业务不可用,默认下插AU_AIS,同时将B2误码块数放入回传M1字节,对端会收到MS_REI告警7、BD_STATUS:告警表明系统中已创建逻辑板的单板不在位或离线8、BIP_EXC:告警表明支路板低阶BIP2误码越限较大的低阶通道误码(BIP),会影响该通道的业务使用,产生此告警后,系统会向对端回传LP_REI告警9、HP_LOM:告警表明高阶通道复帧丢失VC12业务的复帧指示丢失,VC12业务不可用。
产生该告警后,单板会向相应通道下插TU_AIS10、HP_RDI:告警表明本端线路收到对端线路回告的高阶通道远端接收失效指示产生该告警表明对端接收到的业务有AU_AIS或AU_LOP或HP_TIM或HP_SLM告警,将向本端回告此告警11、HP_REI:告警表明本端线路收到对端线路回告的高阶通道远端误码指示对端站接收到B3误码12、HP_SLM:告警表明线路板接收的高阶通道信号标记(C2)失配该告警表明本端接收到的高阶开销的C2字节与应收的字节不一致,会造成净荷中的业务不可用。
OptiX155/622(Metro2050)支路接口介绍OptiX155/622设备提供了丰富的支路接口类型。
有E1、E3、T3、E4等PDH电接口,音频和RS-232/RS-422数据接口,10M/100M以太网数据接口,STM-1光/电接口。
所有这些接口单元可以在子架的支路接口板位任意混插。
支路区的业务容量为8个等效STM-1。
单子架最大可以上下252个E1,如果接口数目太多而无法在一个子架全部上下,可以采用STM-1/STM-4的光接口或STM-1电接口进行扩展,将多余的部分接口转移到扩展子架上。
当设备被用于中心节点时,子架的支路接口区通过STM-1光接口可以带出最多8条STM-1的链路,或者3个STM-1的两纤环。
支路链上的业务支持1+1/1:1线性保护,支路环上业务支持双向/单向复用段保护。
所有PDH电接口单元可以对每个业务通道进行配置、告警和性能监测,并能利用“外环回(亦称本地环回)”和“内环回(亦称远端环回)”的方式对业务质量进行测试或对通道故障进行定位。
外环回和内环回的说明如图1-1和图1-2所示。
站点外环回PDH信号入PDH信号出说明:外环回执行后,输入的PDH信号不上光纤,将在本站直接被环回到对应的输出口,以便于本地交换机或仪表测试本站物理接口是否正常。
图1-1外环回说明PDH信号入PDH信号出映射解映射站点A站点B内环回PDH信号入PDH信号出说明:站点A和站点B之间用光纤连接,对B站的某一通道执行内环回操作后,该通道解映射后的PDH信号被环回到映射功能块,重新进行映射。
这样通过光纤被送到A站点做解映射处理,所以A站点该通道对应端口的出口信号与入口相同。
此操作等效于将B站对应于该通道的PDH端口用电缆短接,以便于测试业务配置是否正确或进行故障隔离判断。
图1-2内环回说明PDH支路业务(E1、E3/T3)除了可以通过网络得到保护以外,还可以实现1:n(n≤3)支路保护,这是通过支路保护倒换板(TPS)来实现的。
OptiX Metro500EFT单板常见告警和性能事件EFT板的常见告警、性能告警和性能事件分别见表1-1、0、表1-1。
表1-1 EFT板的常见告警告警名称告警描述告警产生的可能原因缺省告警级别ALM_GFP_dCSF GFP客户信号丢失GFP客户信号丢失。
紧急ALM_GFP_dLFD GFP失步GFP状态机跳出SYNC状态。
主要ALM_GFP_dSSF GFP服务层信号丢失GFP服务层信号丢失。
紧急B3_EXC_VC3 B3_EXC告警表示高阶通道(B3)误码过量●接收信号衰减偏大。
●光纤头不清洁或光纤连接器不正确。
●上游站发送部分故障。
●本站接收部分故障。
主要B3_SD_VC3 B3_SD为高阶通道(B信号劣化●接收信号衰减偏大。
●光纤头不清洁或光纤连接器不正确。
●上游站发送部分故障。
●本站接收部分故障。
次要BD_STATUS 单板不在位告警●单板未插。
●单板插座已松动。
主要BIP_EXC BIP误码过量BIP2误码过大。
次要BIP_SD BIP信号劣化BIP2误码过大。
次要ETH_LOS 以太网输入信号丢失●以太网网线断掉。
●两个以太网端口工作模式不匹配。
紧急FCS_ERR 校验和出错封装协议一致但是协议参数内容不一致。
紧急HARD_BAD 硬件故障硬件故障。
紧急LCAS_FOPR LCAS接收方向协议失效LCAS模块宿端检测到异常,导致LCAS无法协商或协商不正确。
主要LCAS_FOPT LCAS发送方向协议失效LCAS模块源端检测到异常,导致LCAS无法协商或协商不正确。
主要LCAS_PLCR LCAS接收方向的带宽部分丢失接收方向的实际通道个数小于配置个数,且不为零。
次要LCAS_PLCT LCAS发送方向的带宽部分丢失发送方向的实际通道个数小于配置个数,且不为零。
次要LCAS_TLCR LCAS接收方向的带宽全部丢失接收方向的实际通道个数为零,而配置个数不为零。
主要告警名称告警描述告警产生的可能原因缺省告警级别LCAS_TLCT LCAS发送方向的带宽全部丢失发送方向的实际通道个数为零,而配置个数不为零。
Optix metro2050告警及性能事件产生原理本章介绍以下两个方面的内容:SDH业务的告警、性能事件产生原理以及在故障定位中的应用;以太网业务的告警、性能事件产生原理以及在故障定位中的应用。
1.1 SDH告警及性能事件综述在SDH的帧结构中有着丰富的开销字节,包括再生段开销、复用段开销、通道开销。
正是借助于这些开销字节传递的告警、性能信息,使得SDH系统具有很强的在线告警和误码监测能力。
通过对这些告警信息的产生方式和检测方式的了解,可以做到对故障的快速定位。
SDH告警信号流程如图1-1所示。
T1512780-93/d02SPI RST (Note 1)MST MSA HPOMHUGHPCHPTHPALPOMLUGLPCLPTLPAPhysical Section RegeneratorSectionMultiplex Section Higher Order PathLower Order PathNOTES1 This column represents the degenerate connection function present in a regenerator.2 The insertion of all-ones (AIS) and FERF on certain defects may be optional.This figure shows these options as dashed lines. See Recommendation G.783.FIGURE 2-2/G.782SDH maintenance signal interactionUnused LPC output/LP-UNEQLOF RS-BIP Error (B1)Regenerated signal passed through HP-UNEQ HP-TIM HP-SLMHP-BIP Error (B3)HP-FEBE HP-FERF HP-FERF HP-FEBELOSMS-AISMS-Exc. Error (B2)MS-BIP Error (B2)MS-FERFMS-FERF AU-AIS AU-LOPHP-LOM/TU-LOPLP-UNEQ LP-TIM LP-SLMLP-BIP Error (B3/V5)LP-FEBE LP-FERF LP-FERF LP-FEBEAU-AISTU-AISTU-AISHO Path signal passed throughHOVC with POH and unspecified payload HO unequipped signalLO Path signal passed throughLOVC with POH and unspecified payload LO unequipped signalUnused HPC output/HQ-UNEQ«1»«1»«1»«1»«1»«1»«1»«1»«1»Detection GenerationInsertion of all-ones (AIS) signal Alarm Indication Signal Far End Block Error Far End Receive Failure Loss Of Frame Loss Of Multiframe Loss Of Pointer Loss Of SignalSignal Label Mismatch Trace Identifier MismatchUnequipped signal per Recommendation G.709«1»AIS FEBE FERF LOF LOM LOP LOS SLM TIM UNEQ图1-1 SDH 告警信号流程图1. 术语约定为了便于对主要告警和性能产生的位置以及产生方式的说明,不妨沿着信号流对这些主要告警和性能作一一描述。
在这里,根据信号流的流向,将之分为下行信号流和上行信号流。
下行信号流是指信号流向为SDH接口→交叉板→PDH接口这条路由。
上行信号流则是指信号流向为PDH接口→交叉板→SDH接口这条路由。
另外,由于在该信号流程中,交叉板不处理任何开销字节。
为了表述具有层次性,我们以它为界线,将信号流分为高阶部分(SDH接口←→交叉板)和低阶部分(交叉板←→PDH接口)加以说明。
2. 两种通用告警AIS告警(全“1”告警),对下一级电路插全“1”,告知该信号不可用。
常见的AIS告警有MS_AIS、AU_AIS、TU_AIS、E1_AIS等。
RDI告警(远端接收缺陷指示),指示对端站检测到LOS(信号丢失)、AIS、TIM(追踪识别符失配)等告警后,而传给本站的回告。
常见的告警有MS_RDI、HP_RDI、LP_RDI等。
注意:有一个错误观点需要纠正,那就是并不是某站有告警就说明该站有问题,只能说明该站检测到了告警。
而引起该告警产生的原因可能来自于对端站或其它原因。
如实际中光纤断裂引起的R_LOS、对端站交叉板坏引起本站HP_LOM(高阶通道复帧丢失)告警等。
1.2 SDH 高阶部分信号流中告警、性能的产生和检测根据故障定位中“先线路,后支路;先高级,后低级”的原则,SDH 接口与交叉单元间产生的告警、性能信息是我们在维护过程中应首先关心的焦点,因为通常情况下,正是这段高阶部分产生的告警、性能数据引起了低阶告警、性能数据的上报。
这段路由中信号流如图1-2所示。
"1"LOS STM-N 光 接 口B1BI Err.K2AIS MS-AISk2MS-RDIB2M1帧同步器和再生段开销处理器复用段开销处理器C2AU-AIS AU-LOP J1HP-UNEQ HP-TIMB3B3 Err.G1G1HP-REI HP-RDI MS-REIH4C2HP-LOM HP-SLM交叉板高阶通道开销处理器B2-Err.指针处理器AISA1, A2LOF信号传递点告警终结点(上报主控)(下插全"1"信号)和H1,H2H1,H2"1""1"告警上报或回告图1-2 SDH 接口与交叉单元间告警信号产生流程图说明:我们常根据各开销字节在STM-1帧结构中的处理位置,将其分为四个大的模块:再生段开销、复用段开销、高阶通道开销及指针。
其中前两个模块出问题,通常会影响所有的高阶通道,而最后一个模块中的开销字节出问题则只是针对某一个高阶通道。
根据这一点,我们常常可以推断出问题的影响面,以及测试时如何对那些通道进行选用等。
以下将采取分模块的方式对信号的流程和各开销字节处理进行表述。
1.2.1 下行信号流1. 帧同步器和再生段开销处理器这部分主要处理的与告警、性能相关的再生段开销有:帧定位字节(A1、A2)、再生段追踪字节(J0)、误码校验字节(B1)。
告警信号流程如下:(1) 从光路上来的STM-N 光信号进入线路板的光接收模块后,首先经过光电转换(O/E转换),被恢复成电信号送往帧同步器和扰码器处理。
在这过程中,光电转换模块(O/E 模块)会对该信号进行检测,如果发现输入信号无光、光功率过低或光功率过高以及输入信号码型不匹配时会上报R_LOS (信号丢失)告警。
提示:无光情况一般在光纤中断、对端站发送光模块坏或本站接收光模块坏等情况下会发生;光功率过低的情况有光纤衰耗太大或光接头接触不良等;光功率过高是指接收光功率过载,这时应检查光衰耗器是否损坏或光板的发送距离是否合适等。
码型不匹配通常发生在上、下游站间信号速率不一致或上游站时钟板会导致其发送数据紊乱等,这时需要检测上游站的光板是否匹配或时钟板、交叉板是否工作正常等。
R_LOS告警与开销字节无关,只是与输入的信号质量有关。
产生R_LOS告警后,系统只有在本站的接收光模块连续检测到2个正确的码型图案,并且同时没有检测到新的R_LOS告警产生时,SDH设备才会退出R_LOS状态而进入正常状态。
发生R_LOS告警时,系统会对下一级电路插入全“1”信号。
(2) 帧同步器接收到从光/电转换模块发来的STM-N信号后,根据该信号中的A1、A2字节来完成对帧定位信号的捕捉,同时从中提取线路参考同步定时源,发送给时钟板进行时钟锁定。
正常情况下,A1值恒为F6H,A2值恒为28H,但如果连续5帧检测到错误的A1、A2值,将上报R_OOF 告警(帧失步报警)。
如果R_OOF告警持续超过3ms,则上报帧丢失告警R_LOF并下插全“1”信号。
在R_LOF状态下,若连续1ms以上又处于定帧状态,那么设备又回到正常状态。
J0字节用于确认再生段两端处于连续的连接状态,要求收发两端的J0字节完全匹配,如果不匹配,则会上告J0_MM追踪识别符失配告警。
扰码器主要完成STM-N信号中除A1、A2和J0字节以外其它字节的解扰。
(3) 再生段开销处理器提取STM-N信号中的其它再生段开销字节进行处理。
其中最重要的为B1字节。
如果从STM-N信号中恢复出的B1字节和接收到的前一个STM-N 帧中的BIP-8计算结果不一致,则上报B1误码。
如果B1误码超过门限10-3(默认值),就产生B1_OVER告警。
当连续出现10个再生段严重误码秒SES(一秒内误码块达到30%)后,则认为发生RSUATEVENT(再生段不可用时间事件)。
与此同时,在该部分会将F1、D1-D3和E1这些与告警性能无关的字节送往主控模块和开销模块。
2. 复用段开销处理器这部分主要处理的与告警、性能相关的再生段开销字节有:自动保护倒换通路字节(K1、K2)、复用段误码监视字节(B2)、复用段远端误块指示(M1)。
信号流程如下:(1) 复用段开销处理器提取STM-N信号中的复用段开销字节进行处理并完成SF和SD检测,将D4-D12、S1和E2送往主控单元和开销单元,同时利用K1、K2字节和主控单元、交叉单元共同实现共享复用段保护(MSP)功能。
如果检测到K2字节中b6-b8是111,则上报MS_AIS告警并下插全"1"信号。
如果检测到K2字节中b6-b8是110,则上报MS_RDI告警。
(2) 如果从STM-N信号中恢复出的B2字节和前一个STM-N帧(除再生段开销外的所有比特)的BIP-24计算结果不一致,则上报B2误码。
同时根据M1字节判断是否上报MS_REI告警,MS_REI传递的是由B2字节检出的错误间插比特块数目。