告警、性能专题
- 格式:ppt
- 大小:882.00 KB
- 文档页数:67
阿尔卡特SDH常见告警及处理方法阿尔卡特SDH故障2.1 RUP, RUM, ICP类告警处理告警名称或故障现象:Replaceable Unit Problem机盘故障; Replaceable Unit Missed机盘不在位; Internal Communication Problem 内部通信(控制信号)故障,相应的故障机盘报故障。
告警产生原因:1.原因1 RUM还可能是网管配置了板,但实际配插板2.原因2 机盘硬件故障3.原因3 ICP有可能是其它盘引起,如1660的矩阵、主控;1662的SYNTH16;1642的MB板告警处理方法:1.原因1 对于RUM首先核实是否现场每插板,如没插板可在网管去配置(对于有配置电路或作为时钟源的,需先删除这些配置),当然现场每插板,由配置了电路或时钟源需仔细核实是否是垃圾数据在删。
2.原因2 替换相应的故障盘3.对于ICP告警如替换故障盘后仍不消失,则需考虑可能是其它的矩阵、主控、SYNTH16、MB盘等引起。
可先对这些怀疑的板做插拔(注意对业务和监控的影响,一般主控盘插拔只影响监控;矩阵和SYNTH16均有保护,如无异常状态或第二处故障,插拔备用也不影响业务(要插拔当前的主用矩阵需先切换成备用角色再插拔,切换后等15分钟让它同步完再操作)),定位到故障板后替换故障板。
2.2 TD, URU, TF告警告警名称或故障现象:设备光口或端口报TD(Transmitter Degraded), URU (Underlying Resource Unavailable), TF (Transmitter Failure)告警。
告警产生原因:1.原因1 如有光模块的机盘,则可能是故障2.原因2 机盘故障告警处理方法:1.原因1 替换光模块2.原因2 替换机盘2.3 LOS, LOF告警处理告警名称或故障现象:LOS(Loss of signal;LOF(Loss Of Frame);MS-AIS;MS-RDI告警告警产生原因:1.原因1 光缆故障2.原因2 对端设备停电或吊死(主要是接入设备)3.原因3 显现硬件故障,相应光板报RUP、RUM、ICP、URU、TD、TF等告警4.原因4 隐性硬件故障5.原因5 光模块吊死告警处理方法:1.原因1 对光及OTDR测试等排查光路故障,清除光缆故障(具体见光缆故障处理)2.原因2 现场开电或环MB板3.原因3 显现硬件故障请替换相应的故障板4.原因4 当光路对光正常,无明显的硬件故障后,则可能是隐性硬件故障。
华为SDH故障1.1 R_LOS告警名称或故障现象:R_LOS告警表示接收线路侧信号丢失(Receive loss of signal),为紧急告警。
告警产生原因:1、断纤;2、线路衰耗过大;3、本板接收方向故障;4、对端站发送部分故障,线路发送失效;5、对端站交叉时钟板故障或不在位。
告警处理方法:1、现场用光功率计检测告警单板的接收光功率是否正常。
如果接收光功率正常,请转至步骤8。
2、检查光缆是否有故障,排除光缆故障后,查看告警是否排除。
3、清洁本站尾纤接头和线路板接收光口,查看告警是否排除。
4、检查本站的法兰盘和光衰减器是否连接正确,光衰减器的衰减值是否过大。
正确使用法兰盘和光衰减器后,查看告警是否排除。
5、用光功率计检查对端站的发射光功率是否正常,如果发射光功率不正常,更换线路板。
6、如果发射光功率正常,清洁对端站的尾纤接头,查看告警是否排除。
7、检查对端站的法兰盘和光衰减器是否连接正确,光衰减器的衰减值是否过大。
正确使用法兰盘和光衰减器后,查看告警是否排除。
8、更换本站上报告警的线路板,查看告警是否排除。
9、更换对端站的线路板,查看告警是否排除。
1.2 R_LOF、R_OOF告警名称或故障现象:R_LOF告警表示接收线路侧帧丢失(Receive loss of frame),为紧急告警。
告警产生原因:1、接收信号衰减过大;2、对端站发送信号无帧结构;3、本板接收方向故障。
告警处理方法:1、在网管上查看是否有高级别的R_LOS告警,优先处理这些高级别告警后,查看告警是否排除。
2、检测告警单板的接收光功率是否正常。
如果接收光功率正常,请转至步骤9。
如果收光不正常,让现场定位衰耗点在机房内还是在线路上,如果在线路上,转至步骤8。
3、清洁本站尾纤接头和线路板接收光口,查看告警是否排除。
4、检查本站的法兰盘和光衰减器是否连接正确,光衰减器的衰减值是否过大。
正确使用法兰盘和光衰减器后,查看告警是否排除。
OptiX 误码原理和问题处理专题华为技术有限公司版权所有侵权必究修订记录目录1误码性能事件介绍 (5)2误码性能事件与相关的告警 (7)3误码性能检测的机理 (8)4误码性能在维护的应用 (13)5关于误码的维护建议 (17)6误码测试 (18)7关于最大误码率检测说明 (20)8OptiX光传输设备误码问题处理 (21)关键词:误码告警性能摘要:本文主要介绍SDH误码性能、告警等相关方面的知识,以及常用的误码问题处理方法。
缩略语清单:无。
参考资料清单无。
OptiX 误码性能和问题处理专题1 误码性能事件介绍误码是指在传输过程中码元发生了错误。
确切地讲,误码是接收与发送数字信号之间单个数字的差错。
充分理解和掌握误码性能事件,是做好SDH系统维护的基础。
1.1 误码性能事件列表OptiX 系列SDH传输设备检测或上报的误码性能事件,如下表所列:1.2 SDH误码性能定义说明EB:块是通道上连续比特的集合,通俗地说就是一组比特。
每一比特属于,且仅属于唯一的一块。
将一组码看成一个整体,在其中有1个或多个比特差错,则称块差错,即G.826建议中所用的术语“误块”(Errored Block)。
BBE:背景误块,是指发生在SES以外的误块。
ES:误码秒:G.821定义,在一秒时间周期有一个或多个差错比特,称误码秒;误块秒:G.826定义,在一秒时间周期有一个或多个误块,称误块秒;差错秒:误码秒和误块秒的统称。
SES:严重误码秒:G.821定义,在1秒时间周期的比特差错率≥10-3。
严重误块秒:G.826定义,在1秒中含有≥30℅的误块,或至少有一个缺陷。
UAS:不可用秒:一个不可用时间周期从10个连续的严重误码秒(SES)事件的第一秒开始,这10秒被认定为不可用时间的一部分;一个新的可用时间周期从10个连续的非严重误码秒事件的第一秒开始,这10秒被认定为可用时间的一部分。
CSES:连续严重误块秒:表示连续的X个SES,X介于2~9之间。
工艺流程改进在告警采集系统性能优化中的应用摘要:本文主要是研究工艺流程改进,在告警解析系统性能优化中的应用与实现。
其主要目标是使告警解析系统,通过工艺流程的改进来提升系统处理告警效率,提高产品质量,改善用户体验。
在系统的实现过程中,对关键问题进行重点分析并制定了解决方案。
关键词:告警风暴;动态解析;正则编译中图分类号:tp393 文献标识码:a 文章编号:1007-9599 (2013) 02-0000-02针对“srch模块调用sql”的数据库效率问题,在实现的过程中采用动态解析sql原始配置文件,主要着重设计如何将伪sql代码解析成标准sql语言的设计过程和优化odbc处理数据访问的工艺流程。
针对“频繁的正则校验匹配”这一问题的解决分为两部分,一是梳理全局业务,通过对正则表达式调用的关系,找到关键点,实施正则编译全局化;二是梳理调用的配置ini文件,将频繁重复出现的正则校验,通过改造工艺流程简化编译频度。
以上两点是直接影响解析效率的关键所在,通过改造sql的工艺流程,可以提高系统在调用sql执行工作效率。
同时对业务工艺流程的改进,对正则编译的处理,也带来非常可观的告警性能提升。
针对以上问题提出设计整改思路,发现有以下技术难点:(1)正则函数的跨平台选择:针对于unix系统和linux系统上,正则匹配函数regcmp和regcomp的使用是不相同的,并且其实现方式也不同。
因此在考虑正则解析函数时,需要具体分析适当的正则函数,并且修改其实现方式。
(2)设计以数组的方式,存放regcmp的编译结果,通过传递地址的方式,实现一处编译,可反复被调用。
从而大大节省正则匹配速率。
(3)修改代码中针对正则匹配的业务逻辑,将混杂在代码中的正则匹配方法,进行清理分割,重新生成业务逻辑函数。
(4)动态解析伪sql,将用正则描述的sql变量,转换成sql占位符的描述方式。
期间针对各种五花八门的写法,通过位移指针技术,结合严谨的设计思路,才能细致准确的解析成功。
FCS_ERR告警告警解释本内容介绍华为SDH设备OSN系列产品FCS_ERR告警产生原因及其处理方法。
该告警为FCS(Frame Check Sequence)校验出错告警。
本端对接收的GFP格式封装的帧进行FCS校验,若校验出错,则上报该告警。
当本端接收的业务为GFP业务时,该告警才可能上报。
因为IDLE帧中缺少FCS字段,若检测到GFP封装的IDLE帧,也会导致FCS校验出错。
告警属性告警参数在网管中浏览告警时,选中该告警,在“告警详细信息”中会显示该告警的相关参数。
告警参数的格式为“告警参数(16 进制):参数1 参数2…参数n”。
每个参数的含义说明参见下表。
对系统的影响∙若是因为封装协议不一致而引起该告警,则业务中断。
∙若是因为系统中存在误码而引起该告警,则业务会丢包或中断。
常见故障现象若可能原因无对应故障现象,或者故障现象不在本内容列举的故障现象内,请按“处理步骤”中推荐的操作顺序处理。
告警FCS_ERR产生的常见故障现象如表1所示。
可能原因告警FCS_ERR产生的可能原因如下:∙原因1:两端封装协议参数设置不一致。
∙原因2:业务传输光路性能劣化。
∙原因3:单板故障。
处理步骤1.在网管上查询告警。
根据告警参数确定上报告警的VCTRUNK编号。
2.原因1:两端封装协议参数设置不一致。
a.本端和对端采用的“映射协议”不一致,如本端采用“GFP”封装,对端采用“LAPS”封装。
或者协议参数的内容设置等不一致,如:当两端均为GFP封装,本端的“扩展头选项”设置为“Yes”,对端的“扩展头选项”设置为“No”,均会导致FCS_ERR上报。
b.查询本端和对端上报告警的VCTRUNK端口封装协议,以及协议的参数内容设置是否一致,如是否“扰码”、是否“CRC取反”等。
c.查询告警是否消除。
若告警未消除,转3。
3.原因2:业务传输光路性能劣化。
a.光纤连接器松动,光纤连接器不清洁,光缆故障,光路传输中部件接触不良等,均会造成传输性能劣化。