常见传输告警含义.
- 格式:doc
- 大小:33.00 KB
- 文档页数:2
保护子网维护:保护子网维护设置保护的一些参数,如倒换,锁定、协议的启动停止等。
只有部分类型的保护需要进行保护子网的维护,包括的保护类型为复用段四纤共享保护环、复用段双纤共享保护环,复用段双纤专用保护环,复用段线性保护1+1,复用段线性保护M:N,而其他的保护子网在需要进行保护设置。
协议控制器状态:保护子网的协议控制器的启动工停止状态,包括协议未启动、协议启动、协议正在启动、部分启动等状态。
倒换状态:保护子网是否发生了倒换,包括强制倒换、人工倒换、练习倒换、信号劣化倒换、信号失效倒换、双端非恢复倒换、不恢复请求、强制倒换锁定、人工倒换锁定、强制跨段倒换、强制环倒换、人工跨段倒换、人工环倒换、练习跨段倒换、练习环倒换、信号失效跨段倒换、信号失效环倒换、保护信道信号失效、区段信号劣化、信号劣化跨段倒换、信号劣化环倒换、等待恢复、等待倒换、正常、穿通等状态。
锁定状态:保护子网是否被锁定,包括锁定,未锁定2种状态。
自动倒换:环路复用段网元节点信息配置完成后将自动启动复用段倒换控制器。
在线路上出现故障时,由线路板栓测到SK或SF条件,然后上报到主控板,主控板根据APS协议产生K字节并通过线路板发送出去,其穹节点的线路板收到K字节后上报主控板,由主控板完成APS协议。
最后主控板根据协议确定本节点的倒换状态,然后下发命令到交叉板进行业务的切换。
当故障修复以后,该环路就会在设置的复用段恢复时间内恢复时间内恢复正常的工作状态。
强制倒换:是指强制业务从工作信道倒换到保护信道,不管保护信的状态如何;别外强制侄换不管主路信号是否正常都不在恢复时间后倒换回主路,也就是说强制倒换将导臻一直处于倒换状态下,再也不会自动恢复,除非再人为解除这一倒换操作。
人工倒换:是指命令将业务从工作信道倒换到保护信道,如果保护道下于正常状态,则倒换将发生,若保护信道处于失效或正在满足一个更高级别的倒换,则倒换不会发生;这一操作主要是设备维护时用来测试网络目前是否还具有保护能力。
爱立信LTE无线专业常见告警目录Heartbeat Failure (2)ServiceUnavailable (2)ServiceDegraded (2)Gigabit Ethernet Link Fault (3)Remote IP Address Unreachable (3)Loss of Tracking (4)Network Synch Time from GPS Missing (6)System Clock Quality Degradation (6)PowerFailure (6)LinkFailure (7)LinkStability (7)VswrOverThreshold (8)CalibrationFailure (8)Plug-In Unit HW Failure (9)Plug-In Unit General Problem (9)GeneralHwError (10)HwFault (10)GeneralSwError (10)License Key File Fault (11)LicenseKeyMissing (11)Heartbeat Failure(基站退服或断站) 告警解释:此告警表示基站心跳告警,即基站脱管。
可能原因:(1)DU掉电(2)传输故障(3)DU故障(4)OSS原因(网管)处理步骤:(1)检查电源状态。
(2)检查DU电源接头是否松动,如有松动重做接头。
(3)检查基站传输连接,如有虚接或者尾纤破损则进行重接或者更换。
(4)通知传输检查传输状态。
(5)DU下电重启.(6)更换DU。
(7)配置原因,检查数据原因,回落到割接之前的地址,更换IP ServiceUnavailable告警解释:此告警表示小区服务质量不可用,即小区退服。
该告警为伴生告警,其提示作用。
能够触发该告警的常见子告警为:●PowerFailure(电源故障)●LinkFailure(光路告警)●HwFault(RRU硬件故障)●TemperatureExceptionalTakenOutOfService(RRU高温告警)可能原因:由于该告警为伴生告警,可能原因请参见其伴生的子告警。
传输设备常见告警解释及处理建议LianLv一、 LOS 告警:信号丢失1、正常情况下两个网元之间要通信,中间的信号流必须是畅通的,如下图;2、从上图可以看书信号从MSC 发出2M 信号,经过SDH 设备复用后传递给下一个设备,最后末端SDH 设备解复用出2M 信号给另一端的MSC 。
也就是说,产生信号源的设备是发出信号的设备,当相邻的设备收不到对端发出的信号时就会上报LOS 告警,即信号丢失;A 、上图中由于SDH2发出的光信号SDH1收不到所以SDH1的收光口会上报LOS 告警;B 、上图中MSC2发出的2M 信号由于2M 线中断导致SDH2的2M接口收不到信号,所以SDH2的2M 接口会上报LOS 告警;C 、 上图是MSC1收不到信号的情况;说明:在通信标准中信号丢失的告警名都为LOS,但是不同厂家在编写网管软件时其有所不同,比如:华为公司传输设备,光口收不到信号上报告警为R-LOS ,支路口(2M 口)收不到信号时报T-ALOS;二、 LOF 告警:帧丢失1、当收到的信号功率太大或太小时都会上报OOF 告警;2、是指可以收到信号,但是检测不到信号的开始位置。
一般在波分和SDH 相连时,由于中继段线路中断,造成SDH 设备收到的信号为非调制光。
四、 AIS 告警:全1指示告警举例:SDH2收不到BTS 发来的2M 信号,SDH2会上报LOS 告警,并下插“1”码,当BSC1收到的2M 信号为全要“1”的时候就会上报AIS 告警。
这个故障我们日常维护中经常碰到,如果基站发送处理的2M 信号在中间传输环节中中断,BSC 的dip 端口都会上报AIS 告警。
五、 RDI 告警:远端告警指示举例:当BTS 收到的2M 信号在传输途中中断,但是BSC 可以收到BTS 发送的信号,那么BTS 就会发送AIS 信号给BSC ,当BSC 收到AIS 信号时就会上报RDI ,即远端告警指示说明故障点在BTS 端。
传输告警意义表示:1、Lost Of Signal(LOS)收端在176个连续脉冲周期内没有检查到E1线上信号变化,则上报此告警,同时通过NFAS 向对端发送Remote Alarm Signal,即第三位被置“1”。
2、Remote Alarm Indication(RAI)收端接收到NFAS,发现第三位被置“1”,说明对端发送了Remote Alarm Signal,则上报此告警。
对端发送Remote Alarm 的原因包括:未收到信号、帧定界错误、误码率高、编解码错误、电源故障等。
3、Alarm Indication Signal(AIS)当发端停止发送正常数据,而改为发送全“1”时,收端在2个帧周期内检查到的”0”的数量少于3,则上报此告警。
E1线上具体信号的传送采用HDB3线码方式,实际上就是AMI(Alternate Mark Inversion)方式的一种改进。
所以出现AIS告警时,E1线上的信号肯定是变化的,注意与LOS告警的区别。
在什么情况下发送方会发送全“1”信号,常见的情况有:发送方E1本地环回;传输设备的上级接收异常,向下游设备发送AIS信号。
收端接收到AIS信号后,会通过NFAS向对端发送Remote Alarm Signal.4、Loss of Frame Alignment(LFA)收方连续3帧内无法获得正确的FAS,则上报此告警。
此时收端通过NFAS向对端发送Remote Alarm Signal.5、Loss of Multi-frame Alignmen(LMFA)t收端无法获得正确的多帧定界信号后,则上报此告警,同时通过NMFAS中的Ybit通知对端。
6、Distant Multi-frame Alarm(DMFA)收端发现接收到的NMFAS中的Ybit被置位,则上报此告警。
LOS:信号丢失,输入无光功率、光功率过低、光功率过高,使BER劣于10-3。
OOF:帧失步,搜索不到A1、A2字节时间超过625us 。
4G重要告警解析一、影响小区发射的告警1. ReachabilityProblem(基站退服或脱管)●Alarm Code:ReachabilityProblem●告警影响:e Node B 设备监控失去●告警原因分析:导致该告警的原因主要体现在三个方面:电源、传输、主控卡(C板)故障:1)电源:交流停电等,此时应该有相关环境告警上传;2)传输:传输断3)主控卡故障:主控卡出现掉死、无法正常启动、不断重启等故障;●告警解决方法:电源或传输问题,请相关人员解决;如果是主控卡故障,需要维护人员上站解决;更换主控卡后,需要先问网管人员要一个Yang WO 文件重新下软件并导入WO文件激活。
2.CB INIT FAILURE (C板初始化失败)●Alarm Code:IK4004001●告警影响:整站退服,设备可监控;●告警原因分析:C板故障或者高温导致●告警解决方法:需上站下电重启设备,或热插拔C板,若故障依旧需要更换C板,更换流程请参考ReachabilityProblem(基站退服或脱管)3. NO CONTACT TO BOARD (B板退服)●Alarm Code:IK4009041●告警影响:整站退服,小区不发射;●告警原因分析:若基站无C板或者GPS告警的话,则是B板故障●告警解决方法:网管重启基站不管用的话,需要上站更换,更换B板会自动下软件,基站侧不需要做任何操作,大概需要10分钟左右4. LTECellAdminDown (小区退服)●Alarm Code:LTECellAdminDown●告警影响:相应小区退服;●告警原因分析:一般都是由于基站硬件告警或者小区被lock所致●告警解决方法:首先排除小区或基站是否被locked,其次查看是否有导致小区退服的硬件告警5. NO CONTACT TO BOARD(RRH脱离)●Alarm Code:IK4009138●告警影响:某个RRH对应的小区不发射●告警原因分析:造成此告警的原因可能是电源,光纤及RRH故障●告警解决方法:需下站查看电源及RRH和C板连接的光纤衰耗,如果两种情况都正常的话,就要考虑RRH本身的问题了,最好的方法是塔上和别的正常小区做对调来排查6. CB LOS LOF CPRIPORT *(某个小区RRH脱离)●Alarm Code:IK4004030●告警影响:对应小区不发射●告警原因分析:造成此告警的原因可能是电源,光纤及RRH故障●告警解决方法:需下站查看电源及RRH和C板连接的光纤衰耗,如果两种情况都正常的话,就要考虑RRH本身的问题了,最好的方法是塔上和别的正常小区做对调来排查7.CB ALL CPRIPORTS FAILED (所有小区不RRH脱离)●Alarm Code:IK4004061●告警影响:所有小区不发射●告警原因分析:造成此告警的原因可能是电源,光纤及RRH故障●告警解决方法:需下站查看电源及RRH和C板连接的光纤衰耗,如果两种情况都正常的话,就要考虑RRH本身的问题了,最好的方法是塔上和别的正常小区做对调来排查8.CB TRANS RX LOS CPRIPORT * (某个RRH脱离)●Alarm Code:IK4004042●告警影响:造成此告警的原因可能是电源,光纤及RRH故障●告警原因分析:RRH掉电、不加电,RRH掉死,光纤故障,CCM板卡故障等原因都会出现RRH脱离告警;●告警解决方法:需下站查看电源及RRH和C板连接的光纤衰耗,如果两种情况都正常的话,就要考虑RRH本身的问题了,最好的方法是塔上和别的正常小区做对调来排查;9. CB GPS ANT●Alarm Code:IK4004082●告警影响:GPS时钟不同步,长期告警会造成整站退服●告警原因分析:GPS天线安装问题或者接头等问题●告警解决方法:检查GPS天线及各个接头,告警同时会伴随产生以下告警IK4004012,IK4004014,IK4004157(GPS锁卫星失败)10. ANTENNA_PORT TX VSWR THRESH2(2级驻波)●Alarm Code:IK4011011●告警影响:小区不发射●告警原因分析:天馈接口问题●告警解决方法:下站基站馈线头是否松动或者进水等等11. ANTENNA_PORT GAIN CONTROL TX(天线口传输主分支增益已经超出范围)●Alarm Code:IK4011005●告警影响:小区不发射●告警原因分析:RRH硬件故障●告警解决方法:step1:SAM侧重启该RRH。
NE_NOT_LOGIN告警解释NE_NOT_LOGIN表示网元未登录。
告警属性告警参数无。
对系统的影响∙无法从网元侧查询该网元的配置数据。
∙无法在网管上管理该网元。
可能原因∙原因1:网元与网管通讯中断。
∙原因2:用户退出登录或登录失败。
处理步骤∙原因1:网元与网管通讯中断。
解决网元与网管通讯中断方法,参见NE_COMMU_BREAK。
∙原因2:用户退出登录或登录网元失败。
以其他正确的网元用户登录网元。
∙查看告警是否结束,若未结束,请进行下一步。
∙如果故障依然存在,请联系华为工程师。
MPLS_TUNNEL_LOCV告警解释MPLS_TUNNEL_LOCV为Tunnel连通性丢失告警。
连续3个周期内没有收到希望的CV/FFD报文时出现此告警。
告警属性告警参数在网管中浏览告警时,选中该告警,在“告警详细信息”中会显示该告警的相关参数。
告警参数的格式为“告警参数(16进制):参数1 参数2…参数n”,如:告警参数(16进制):0x01 0x08…。
每个参数的含义说明参见下表。
对系统的影响∙该告警产生时,会触发MPLS APS倒换,将业务倒换到保护Tunnel。
∙MPLS_TUNNEL_FDI告警将抑制MPLS_TUNNEL_LOCV告警的上报。
可能原因告警MPLS_TUNNEL_LOCV产生的可能原因如下:∙原因1:Tunnel的Ingress节点停止CV/FFD。
∙原因2:物理链路故障。
∙原因3:Ingress节点的单板正在复位。
∙原因4:业务接口配置错误。
∙原因5:网络出现严重拥塞。
∙原因6:CPU占用率饱和,无法处理ARP协议报文。
处理步骤∙原因1:Tunnel的Ingress节点停止CV/FFD。
1.在网管上分别进入上报告警的Tunnel的Ingress节点和Egress节点的“网元管理器”,在功能树中选择“配置 > MPLS管理 >单播Tunnel管理”。
选择“OAM参数”选项卡。
华为SDH故障1.1 R_LOS告警名称或故障现象:R_LOS告警表示接收线路侧信号丢失(Receive loss of signal),为紧急告警。
告警产生原因:1、 断纤;2、 线路衰耗过大;3、 本板接收方向故障;4、 对端站发送部分故障,线路发送失效;5、 对端站交叉时钟板故障或不在位。
告警处理方法:1、 现场用光功率计检测告警单板的接收光功率是否正常。
如果接收光功率正常,请转至步骤8。
2、 检查光缆是否有故障,排除光缆故障后,查看告警是否排除。
3、 清洁本站尾纤接头和线路板接收光口,查看告警是否排除。
4、 检查本站的法兰盘和光衰减器是否连接正确,光衰减器的衰减值是否过大。
正确使用法兰盘和光衰减器后,查看告警是否排除。
5、 用光功率计检查对端站的发射光功率是否正常,如果发射光功率不正常,更换线路板。
6、 如果发射光功率正常,清洁对端站的尾纤接头,查看告警是否排除。
7、 检查对端站的法兰盘和光衰减器是否连接正确,光衰减器的衰减值是否过大。
正确使用法兰盘和光衰减器后,查看告警是否排除。
8、 更换本站上报告警的线路板,查看告警是否排除。
9、 更换对端站的线路板,查看告警是否排除。
1.2 R_LOF、R_OOF告警名称或故障现象:R_LOF告警表示接收线路侧帧丢失(Receive loss of frame),为紧急告警。
告警产生原因:1、 接收信号衰减过大;2、 对端站发送信号无帧结构;3、 本板接收方向故障。
告警处理方法:1、 在网管上查看是否有高级别的R_LOS告警,优先处理这些高级别告警后,查看告警是否排除。
2、 检测告警单板的接收光功率是否正常。
如果接收光功率正常,请转至步骤9。
如果收光不正常,让现场定位衰耗点在机房内还是在线路上,如果在线路上,转至步骤8。
3、 清洁本站尾纤接头和线路板接收光口,查看告警是否排除。
4、 检查本站的法兰盘和光衰减器是否连接正确,光衰减器的衰减值是否过大。
SDH常见告警汇总
一、外部线路问题
1.高端端口丢失光信号告警(LOS):被监视端口的光收模块内输出
的光功率太低,高端端口控制器检测到已经达到LOS(丢失光信号)告警
的门限值,告警产生。
2.线路信号失常告警(AIS):被监视端口的光收模块内的光功率正常,但线路上传输的数据帧出现必须要求的信号(同步字、数据字和非数
据字)比例不满足要求,发生AIS(线路信号失常)告警。
3.线路错误率过高告警(RDI):被监视端口的光收模块内的光功率
正常,且线路上传输的数据帧正常,但线路上连续监测到一定时间内(大
于80毫秒)连续出现的线路级错误率高于预设的门限(大于等于10-6),则发生RDI(线路错误率过高)告警。
4.光纤断路告警(LOF):被监视端口的光收模块内的光功率以及线
路上传输的数据帧都达到正常状态,但是被监视端口一定时间内(大于
0.5秒)连续检测到线路上的信号丢失,发生LOF(光纤断路)告警。
二、内部线路问题
1.远端端口接口故障告警(RDI-R):被监视端口的光收模块内的光
功率正常,但与远端端口接口之间出现一些故障(如:线路反转、接口不
匹配)。
常见告警、性能及处理一:告警处理1.LOS:信号丢失告警。
表示本端接收不到光信号。
主要引起的原因是①光纤断;②对端发送光信号没有;③本端光收模块坏。
处理方法:①先将本端用一根光纤自环,若告警消失,表示本端是好的,问题在对端。
若对端自环也好,则可以肯定两端间光纤的断了;若对端自环不好,也是LOS告警,用光功率计测量其光发功率,若功率过小(-50dB或更低)则可断定光发坏了;若功率正常,则是由于没有时钟引起的,换掉时钟板,告警消失。
②若本端自环还是LOS告警,则是由于光收模块坏了,更换后告警消失。
2.LOF/OOF:帧丢失、帧失步告警。
原因和处理同1。
帧失步:连续5帧以上,找不到正确的A1、A2,则进入帧失步状态。
帧丢失:如果OOF状态持续一段时间,则进入帧丢失状态。
3.MS-AIS:该告警是伴随着远端LOS/LOF出现而出现的,或者从网管上插入该告警。
处理方法:①若本端自环也有该告警,则更换光板。
②本端自环是好的,对端又没有LOS告警,则可能是网管上插入了AIS告警,从网管上将插入AIS操作取消,若此处理不消除告警,则更换远端光板。
③若远端有LOS告警,则按1将LOS告警消除。
4.MS-FERF/RDI:复用段远端接收故障。
产生原因是由于远端有LOS、LOF、MS-AIS告警引起的。
处理方法:按1、2、3方法消除远端告警则可。
实际工程中,我们经常遇到这样的情况:5.B1、B2、B3信号劣化告警。
原因:光板接收光功率过强或过弱,或系统本身所有。
处理方法:将本端自环,适当调节光纤插入深度,若告警消失,则是由于光功率过强或过弱引起,过强加衰减,过弱将光纤洗干净,法兰盘连接处拧紧或换光发功率强的光模块;若不是光功率引起的,则是光板或时钟板所致,更换光板或时钟板则可(误码性能的参数意义见后面详细介绍)。
6.LOM:复帧丢失。
原因:通常由对端交叉板引起。
处理方法:①更换对端交叉板则可。
②检查背板是否断针。
③交叉板是否插好。
以上这些告警维护信号产生机理的简要说明如下:
●ITU-T建议规定了各告警信号的含义:
●LOS:信号丢失,输入无光功率、光功率过低、光功率过高,使BER劣于10-3。
●OOF:帧失步,搜索不到A1、A2字节时间超过625μs 。
●LOF:帧丢失,OOF持续3ms以上。
●RS-BBE:再生段背景误码块,B1校验到再生段——STM-N的误码块。
●MS-AIS:复用段告警指示信号,K2[6 —8]=111超过3帧。
●MS-RDI:复用段远端劣化指示,对端检测到MS-AIS、MS-EXC,由K2[6 - 8]回发过来。
●MS-REI:复用段远端误码指示,由对端通过M1字节回发由B2检测出的复用段误块数。
●MS-BBE:复用段背景误码块,由B2检测。
●MS-EXC:复用段误码过量,由B2检测。
●AU-AIS:管理单元告警指示信号,整个AU为全“1”(包括AU-PTR)。
●AU-LOP:管理单元指针丢失,连续8帧收到无效指针或NDF。
●HP-RDI:高阶通道远端劣化指示,收到HP-TIM、HP-SLM。
●HP-REI:高阶通道远端误码指示,回送给发端由收端B3字节检测出的误块数。
●HP-BBE:高阶通道背景误码块,显示本端由B3字节检测出的误块数。
●HP-TIM:高阶通道踪迹字节失配,J1应收和实际所收的不一致。
●HP-SLM:高阶通道信号标记失配,C2应收和实际所收的不一致。
●HP-UNEQ:高阶通道未装载,C2=00H超过了5帧。
●TU-AIS:支路单元告警指示信号,整个TU为全“1”(包括TU指针)。
●TU-LOP:支路单元指针丢失,连续8帧收到无效指针或NDF。
●TU-LOM:支路单元复帧丢失,H4连续2—10帧不等于复帧次序或无效的H4值。
●LP-RDI:低阶通道远端劣化指示,接收到TU-AIS或LP-SLM、LP-TIM。
●LP-REI:低阶通道远端误码指示,由V5[1 —2]检测。
●LP-TIM:低阶通道踪迹字节失配,由J2检测。
●LP-SLM:低阶通道信号标记字节适配,由V5[5 —7]检测。
●LP-UNEQ:低阶通道未装载,V5[5 —7]=000超过了5帧。
为了理顺这些告警维护信号的内在关系,我们在下面列出了两个告警流程图。
图4-13是简明的TU-AIS告警产生流程图。
TU-AIS在维护设备时会经常碰到,通过图4-13分析,就可以方便的定位TU-AIS及其它相关告警的故障点和原因。
图4-13 简明TU-AIS告警产生流程图。