常见传输告警含义
- 格式:doc
- 大小:33.00 KB
- 文档页数:2
保护子网维护:保护子网维护设置保护的一些参数,如倒换,锁定、协议的启动停止等。
只有部分类型的保护需要进行保护子网的维护,包括的保护类型为复用段四纤共享保护环、复用段双纤共享保护环,复用段双纤专用保护环,复用段线性保护1+1,复用段线性保护M:N,而其他的保护子网在需要进行保护设置。
协议控制器状态:保护子网的协议控制器的启动工停止状态,包括协议未启动、协议启动、协议正在启动、部分启动等状态。
倒换状态:保护子网是否发生了倒换,包括强制倒换、人工倒换、练习倒换、信号劣化倒换、信号失效倒换、双端非恢复倒换、不恢复请求、强制倒换锁定、人工倒换锁定、强制跨段倒换、强制环倒换、人工跨段倒换、人工环倒换、练习跨段倒换、练习环倒换、信号失效跨段倒换、信号失效环倒换、保护信道信号失效、区段信号劣化、信号劣化跨段倒换、信号劣化环倒换、等待恢复、等待倒换、正常、穿通等状态。
锁定状态:保护子网是否被锁定,包括锁定,未锁定2种状态。
自动倒换:环路复用段网元节点信息配置完成后将自动启动复用段倒换控制器。
在线路上出现故障时,由线路板栓测到SK或SF条件,然后上报到主控板,主控板根据APS协议产生K字节并通过线路板发送出去,其穹节点的线路板收到K字节后上报主控板,由主控板完成APS协议。
最后主控板根据协议确定本节点的倒换状态,然后下发命令到交叉板进行业务的切换。
当故障修复以后,该环路就会在设置的复用段恢复时间内恢复时间内恢复正常的工作状态。
强制倒换:是指强制业务从工作信道倒换到保护信道,不管保护信的状态如何;别外强制侄换不管主路信号是否正常都不在恢复时间后倒换回主路,也就是说强制倒换将导臻一直处于倒换状态下,再也不会自动恢复,除非再人为解除这一倒换操作。
人工倒换:是指命令将业务从工作信道倒换到保护信道,如果保护道下于正常状态,则倒换将发生,若保护信道处于失效或正在满足一个更高级别的倒换,则倒换不会发生;这一操作主要是设备维护时用来测试网络目前是否还具有保护能力。
以上这些告警维护信号产生机理的简要说明如下:●ITU-T建议规定了各告警信号的含义:●LOS:信号丢失,输入无光功率、光功率过低、光功率过高,使BER劣于10-3。
●OOF:帧失步,搜索不到A1、A2字节时间超过625μs 。
●LOF:帧丢失,OOF持续3ms以上。
●RS-BBE:再生段背景误码块,B1校验到再生段——STM-N的误码块。
●MS-AIS:复用段告警指示信号,K2[6 —8]=111超过3帧。
●MS-RDI:复用段远端劣化指示,对端检测到MS-AIS、MS-EXC,由K2[6 - 8]回发过来。
●MS-REI:复用段远端误码指示,由对端通过M1字节回发由B2检测出的复用段误块数。
●MS-BBE:复用段背景误码块,由B2检测。
●MS-EXC:复用段误码过量,由B2检测。
●AU-AIS:管理单元告警指示信号,整个AU为全“1”(包括AU-PTR)。
●AU-LOP:管理单元指针丢失,连续8帧收到无效指针或NDF。
●HP-RDI:高阶通道远端劣化指示,收到HP-TIM、HP-SLM。
●HP-REI:高阶通道远端误码指示,回送给发端由收端B3字节检测出的误块数。
●HP-BBE:高阶通道背景误码块,显示本端由B3字节检测出的误块数。
●HP-TIM:高阶通道踪迹字节失配,J1应收和实际所收的不一致。
●HP-SLM:高阶通道信号标记失配,C2应收和实际所收的不一致。
●HP-UNEQ:高阶通道未装载,C2=00H超过了5帧。
●TU-AIS:支路单元告警指示信号,整个TU为全“1”(包括TU指针)。
●TU-LOP:支路单元指针丢失,连续8帧收到无效指针或NDF。
●TU-LOM:支路单元复帧丢失,H4连续2—10帧不等于复帧次序或无效的H4值。
●LP-RDI:低阶通道远端劣化指示,接收到TU-AIS或LP-SLM、LP-TIM。
●LP-REI:低阶通道远端误码指示,由V5[1 —2]检测。
●LP-TIM:低阶通道踪迹字节失配,由J2检测。
SDH原理告警与性能部分SDH(同步数字体系)是一种基于光纤传输的数字传输技术,它提供了高速、灵活和可靠的通信传输能力。
在SDH中,原理告警和性能监测是两个重要的方面,用于确保网络的正常运行和性能优化。
一、SDH原理告警原理告警是指在SDH网络中,当出现网络故障或异常时,设备会产生一些告警信息,以通知运维人员及时处理。
常见的SDH原理告警包括:1.异常事件告警:包括LOF(线路失去同步)、LOS(线路失去信号)和LOP(线路失去指针)等告警。
这些告警通常是由于光纤中断、光模块故障或设备故障引起的,需要及时检修。
2.通信质量告警:包括BER(误码率)告警和ES(错误秒)告警等。
BER告警表示传输错误的比特数超过了一定阈值,ES告警表示在一个时间段内传输错误的次数超过了一定阈值。
这些告警通常是由于光纤质量差、光模块老化或设备性能退化引起的,需要及时排查和修复。
3.设备故障告警:包括OTU(光传送单元)失去同步、OTL(光传输线路)失去同步和OOF(光光传送失去同步)等告警。
这些告警通常是由于设备硬件故障或软件异常引起的,需要及时维修或重启。
4.网络拓扑告警:包括MS-REI(主站远端终止信息)、RS-REI(复用段远端终止信息)和BI(背景初始化)等告警。
这些告警通常是由于网络配置错误或拓扑调整引起的,需要及时调整配置或修改拓扑。
二、SDH性能监测性能监测是指对SDH网络中的各项性能指标进行实时监控和评估,以便及时发现网络问题并采取措施进行优化。
在SDH中,常见的性能监测项目包括:1.误码率(BER)监测:通过对传输数据进行统计和对比,实时监测SDH网络中的误码率,以判断网络的质量。
当误码率超过一定阈值时,需要进行排查和修复。
2.空闲信道利用率监测:对SDH网络中的空闲信道进行监测,以评估信道的利用率和网络的负载情况。
通过监测空闲信道利用率,可以进行网络规划和资源优化。
3.时钟稳定度监测:对SDH网络中的时钟进行监测,以确保时钟的稳定性和准确性。
传输设备常见告警解释及处理建议LianLv一、 LOS 告警:信号丢失1、正常情况下两个网元之间要通信,中间的信号流必须是畅通的,如下图;2、从上图可以看书信号从MSC 发出2M 信号,经过SDH 设备复用后传递给下一个设备,最后末端SDH 设备解复用出2M 信号给另一端的MSC 。
也就是说,产生信号源的设备是发出信号的设备,当相邻的设备收不到对端发出的信号时就会上报LOS 告警,即信号丢失;A 、上图中由于SDH2发出的光信号SDH1收不到所以SDH1的收光口会上报LOS 告警;B 、上图中MSC2发出的2M 信号由于2M 线中断导致SDH2的2M接口收不到信号,所以SDH2的2M 接口会上报LOS 告警;C 、 上图是MSC1收不到信号的情况;说明:在通信标准中信号丢失的告警名都为LOS,但是不同厂家在编写网管软件时其有所不同,比如:华为公司传输设备,光口收不到信号上报告警为R-LOS ,支路口(2M 口)收不到信号时报T-ALOS;二、 LOF 告警:帧丢失1、当收到的信号功率太大或太小时都会上报OOF 告警;2、是指可以收到信号,但是检测不到信号的开始位置。
一般在波分和SDH 相连时,由于中继段线路中断,造成SDH 设备收到的信号为非调制光。
四、 AIS 告警:全1指示告警举例:SDH2收不到BTS 发来的2M 信号,SDH2会上报LOS 告警,并下插“1”码,当BSC1收到的2M 信号为全要“1”的时候就会上报AIS 告警。
这个故障我们日常维护中经常碰到,如果基站发送处理的2M 信号在中间传输环节中中断,BSC 的dip 端口都会上报AIS 告警。
五、 RDI 告警:远端告警指示举例:当BTS 收到的2M 信号在传输途中中断,但是BSC 可以收到BTS 发送的信号,那么BTS 就会发送AIS 信号给BSC ,当BSC 收到AIS 信号时就会上报RDI ,即远端告警指示说明故障点在BTS 端。
传输告警意义表示:1、Lost Of Signal(LOS)收端在176个连续脉冲周期内没有检查到E1线上信号变化,则上报此告警,同时通过NFAS 向对端发送Remote Alarm Signal,即第三位被置“1”。
2、Remote Alarm Indication(RAI)收端接收到NFAS,发现第三位被置“1”,说明对端发送了Remote Alarm Signal,则上报此告警。
对端发送Remote Alarm 的原因包括:未收到信号、帧定界错误、误码率高、编解码错误、电源故障等。
3、Alarm Indication Signal(AIS)当发端停止发送正常数据,而改为发送全“1”时,收端在2个帧周期内检查到的”0”的数量少于3,则上报此告警。
E1线上具体信号的传送采用HDB3线码方式,实际上就是AMI(Alternate Mark Inversion)方式的一种改进。
所以出现AIS告警时,E1线上的信号肯定是变化的,注意与LOS告警的区别。
在什么情况下发送方会发送全“1”信号,常见的情况有:发送方E1本地环回;传输设备的上级接收异常,向下游设备发送AIS信号。
收端接收到AIS信号后,会通过NFAS向对端发送Remote Alarm Signal.4、Loss of Frame Alignment(LFA)收方连续3帧内无法获得正确的FAS,则上报此告警。
此时收端通过NFAS向对端发送Remote Alarm Signal.5、Loss of Multi-frame Alignmen(LMFA)t收端无法获得正确的多帧定界信号后,则上报此告警,同时通过NMFAS中的Ybit通知对端。
6、Distant Multi-frame Alarm(DMFA)收端发现接收到的NMFAS中的Ybit被置位,则上报此告警。
LOS:信号丢失,输入无光功率、光功率过低、光功率过高,使BER劣于10-3。
OOF:帧失步,搜索不到A1、A2字节时间超过625us 。
4G重要告警解析一、影响小区发射的告警1. ReachabilityProblem(基站退服或脱管)●Alarm Code:ReachabilityProblem●告警影响:e Node B 设备监控失去●告警原因分析:导致该告警的原因主要体现在三个方面:电源、传输、主控卡(C板)故障:1)电源:交流停电等,此时应该有相关环境告警上传;2)传输:传输断3)主控卡故障:主控卡出现掉死、无法正常启动、不断重启等故障;●告警解决方法:电源或传输问题,请相关人员解决;如果是主控卡故障,需要维护人员上站解决;更换主控卡后,需要先问网管人员要一个Yang WO 文件重新下软件并导入WO文件激活。
2.CB INIT FAILURE (C板初始化失败)●Alarm Code:IK4004001●告警影响:整站退服,设备可监控;●告警原因分析:C板故障或者高温导致●告警解决方法:需上站下电重启设备,或热插拔C板,若故障依旧需要更换C板,更换流程请参考ReachabilityProblem(基站退服或脱管)3. NO CONTACT TO BOARD (B板退服)●Alarm Code:IK4009041●告警影响:整站退服,小区不发射;●告警原因分析:若基站无C板或者GPS告警的话,则是B板故障●告警解决方法:网管重启基站不管用的话,需要上站更换,更换B板会自动下软件,基站侧不需要做任何操作,大概需要10分钟左右4. LTECellAdminDown (小区退服)●Alarm Code:LTECellAdminDown●告警影响:相应小区退服;●告警原因分析:一般都是由于基站硬件告警或者小区被lock所致●告警解决方法:首先排除小区或基站是否被locked,其次查看是否有导致小区退服的硬件告警5. NO CONTACT TO BOARD(RRH脱离)●Alarm Code:IK4009138●告警影响:某个RRH对应的小区不发射●告警原因分析:造成此告警的原因可能是电源,光纤及RRH故障●告警解决方法:需下站查看电源及RRH和C板连接的光纤衰耗,如果两种情况都正常的话,就要考虑RRH本身的问题了,最好的方法是塔上和别的正常小区做对调来排查6. CB LOS LOF CPRIPORT *(某个小区RRH脱离)●Alarm Code:IK4004030●告警影响:对应小区不发射●告警原因分析:造成此告警的原因可能是电源,光纤及RRH故障●告警解决方法:需下站查看电源及RRH和C板连接的光纤衰耗,如果两种情况都正常的话,就要考虑RRH本身的问题了,最好的方法是塔上和别的正常小区做对调来排查7.CB ALL CPRIPORTS FAILED (所有小区不RRH脱离)●Alarm Code:IK4004061●告警影响:所有小区不发射●告警原因分析:造成此告警的原因可能是电源,光纤及RRH故障●告警解决方法:需下站查看电源及RRH和C板连接的光纤衰耗,如果两种情况都正常的话,就要考虑RRH本身的问题了,最好的方法是塔上和别的正常小区做对调来排查8.CB TRANS RX LOS CPRIPORT * (某个RRH脱离)●Alarm Code:IK4004042●告警影响:造成此告警的原因可能是电源,光纤及RRH故障●告警原因分析:RRH掉电、不加电,RRH掉死,光纤故障,CCM板卡故障等原因都会出现RRH脱离告警;●告警解决方法:需下站查看电源及RRH和C板连接的光纤衰耗,如果两种情况都正常的话,就要考虑RRH本身的问题了,最好的方法是塔上和别的正常小区做对调来排查;9. CB GPS ANT●Alarm Code:IK4004082●告警影响:GPS时钟不同步,长期告警会造成整站退服●告警原因分析:GPS天线安装问题或者接头等问题●告警解决方法:检查GPS天线及各个接头,告警同时会伴随产生以下告警IK4004012,IK4004014,IK4004157(GPS锁卫星失败)10. ANTENNA_PORT TX VSWR THRESH2(2级驻波)●Alarm Code:IK4011011●告警影响:小区不发射●告警原因分析:天馈接口问题●告警解决方法:下站基站馈线头是否松动或者进水等等11. ANTENNA_PORT GAIN CONTROL TX(天线口传输主分支增益已经超出范围)●Alarm Code:IK4011005●告警影响:小区不发射●告警原因分析:RRH硬件故障●告警解决方法:step1:SAM侧重启该RRH。
NE_NOT_LOGIN告警解释NE_NOT_LOGIN表示网元未登录。
告警属性告警参数无。
对系统的影响∙无法从网元侧查询该网元的配置数据。
∙无法在网管上管理该网元。
可能原因∙原因1:网元与网管通讯中断。
∙原因2:用户退出登录或登录失败。
处理步骤∙原因1:网元与网管通讯中断。
解决网元与网管通讯中断方法,参见NE_COMMU_BREAK。
∙原因2:用户退出登录或登录网元失败。
以其他正确的网元用户登录网元。
∙查看告警是否结束,若未结束,请进行下一步。
∙如果故障依然存在,请联系华为工程师。
MPLS_TUNNEL_LOCV告警解释MPLS_TUNNEL_LOCV为Tunnel连通性丢失告警。
连续3个周期内没有收到希望的CV/FFD报文时出现此告警。
告警属性告警参数在网管中浏览告警时,选中该告警,在“告警详细信息”中会显示该告警的相关参数。
告警参数的格式为“告警参数(16进制):参数1 参数2…参数n”,如:告警参数(16进制):0x01 0x08…。
每个参数的含义说明参见下表。
对系统的影响∙该告警产生时,会触发MPLS APS倒换,将业务倒换到保护Tunnel。
∙MPLS_TUNNEL_FDI告警将抑制MPLS_TUNNEL_LOCV告警的上报。
可能原因告警MPLS_TUNNEL_LOCV产生的可能原因如下:∙原因1:Tunnel的Ingress节点停止CV/FFD。
∙原因2:物理链路故障。
∙原因3:Ingress节点的单板正在复位。
∙原因4:业务接口配置错误。
∙原因5:网络出现严重拥塞。
∙原因6:CPU占用率饱和,无法处理ARP协议报文。
处理步骤∙原因1:Tunnel的Ingress节点停止CV/FFD。
1.在网管上分别进入上报告警的Tunnel的Ingress节点和Egress节点的“网元管理器”,在功能树中选择“配置 > MPLS管理 >单播Tunnel管理”。
选择“OAM参数”选项卡。
华为SDH故障1.1 R_LOS告警名称或故障现象:R_LOS告警表示接收线路侧信号丢失(Receive loss of signal),为紧急告警。
告警产生原因:1、 断纤;2、 线路衰耗过大;3、 本板接收方向故障;4、 对端站发送部分故障,线路发送失效;5、 对端站交叉时钟板故障或不在位。
告警处理方法:1、 现场用光功率计检测告警单板的接收光功率是否正常。
如果接收光功率正常,请转至步骤8。
2、 检查光缆是否有故障,排除光缆故障后,查看告警是否排除。
3、 清洁本站尾纤接头和线路板接收光口,查看告警是否排除。
4、 检查本站的法兰盘和光衰减器是否连接正确,光衰减器的衰减值是否过大。
正确使用法兰盘和光衰减器后,查看告警是否排除。
5、 用光功率计检查对端站的发射光功率是否正常,如果发射光功率不正常,更换线路板。
6、 如果发射光功率正常,清洁对端站的尾纤接头,查看告警是否排除。
7、 检查对端站的法兰盘和光衰减器是否连接正确,光衰减器的衰减值是否过大。
正确使用法兰盘和光衰减器后,查看告警是否排除。
8、 更换本站上报告警的线路板,查看告警是否排除。
9、 更换对端站的线路板,查看告警是否排除。
1.2 R_LOF、R_OOF告警名称或故障现象:R_LOF告警表示接收线路侧帧丢失(Receive loss of frame),为紧急告警。
告警产生原因:1、 接收信号衰减过大;2、 对端站发送信号无帧结构;3、 本板接收方向故障。
告警处理方法:1、 在网管上查看是否有高级别的R_LOS告警,优先处理这些高级别告警后,查看告警是否排除。
2、 检测告警单板的接收光功率是否正常。
如果接收光功率正常,请转至步骤9。
如果收光不正常,让现场定位衰耗点在机房内还是在线路上,如果在线路上,转至步骤8。
3、 清洁本站尾纤接头和线路板接收光口,查看告警是否排除。
4、 检查本站的法兰盘和光衰减器是否连接正确,光衰减器的衰减值是否过大。
1、 Lost Of Signal(LOS)收端在176个连续脉冲周期内没有检查到E1线上信号变化,则上报此告警,同时通过NFAS 向对端发送Remote Alarm Signal,即第三位被置“1”。
2、 Remote Alarm Indication(RAI)收端接收到NFAS,发现第三位被置“1”,说明对端发送了Remote Alarm Signal,则上报此告警。
对端发送Remote Alarm 的原因包括:未收到信号、帧定界错误、误码率高、编解码错误、电源故障等。
3、 Alarm Indication Signal(AIS)当发端停止发送正常数据,而改为发送全“1”时,收端在2个帧周期内检查到的”0”的数量少于3,则上报此告警。
E1线上具体信号的传送采用HDB3线码方式,实际上就是AMI(Alternate Mark Inversion)方式的一种改进。
所以出现AIS告警时,E1线上的信号肯定是变化的,注意与LOS告警的区别。
在什么情况下发送方会发送全“1”信号,常见的情况有:发送方E1本地环回;传输设备的上级接收异常,向下游设备发送AIS信号。
收端接收到AIS信号后,会通过NFAS向对端发送Remote Alarm Signal.4、 Loss of Frame Alignment(LFA)收方连续3帧内无法获得正确的FAS,则上报此告警。
此时收端通过NFAS向对端发送Remote Alarm Signal.5、 Loss of Multi-frame Alignmen(LMFA)t收端无法获得正确的多帧定界信号后,则上报此告警,同时通过NMFAS中的Ybit通知对端。
6、 Distant Multi-frame Alarm(DMFA)收端发现接收到的NMFAS中的Ybit被置位,则上报此告警。
LOS:信号丢失,输入无光功率、光功率过低、光功率过高,使BER劣于10-3。
OOF:帧失步,搜索不到A1、A2字节时间超过625us 。
以上这些告警维护信号产生机理的简要说明如下:
●ITU-T建议规定了各告警信号的含义:
●LOS:信号丢失,输入无光功率、光功率过低、光功率过高,使BER劣于10-3。
●OOF:帧失步,搜索不到A1、A2字节时间超过625μs 。
●LOF:帧丢失,OOF持续3ms以上。
●RS-BBE:再生段背景误码块,B1校验到再生段——STM-N的误码块。
●MS-AIS:复用段告警指示信号,K2[6 —8]=111超过3帧。
●MS-RDI:复用段远端劣化指示,对端检测到MS-AIS、MS-EXC,由K2[6 - 8]回发过来。
●MS-REI:复用段远端误码指示,由对端通过M1字节回发由B2检测出的复用段误块数。
●MS-BBE:复用段背景误码块,由B2检测。
●MS-EXC:复用段误码过量,由B2检测。
●AU-AIS:管理单元告警指示信号,整个AU为全“1”(包括AU-PTR)。
●AU-LOP:管理单元指针丢失,连续8帧收到无效指针或NDF。
●HP-RDI:高阶通道远端劣化指示,收到HP-TIM、HP-SLM。
●HP-REI:高阶通道远端误码指示,回送给发端由收端B3字节检测出的误块数。
●HP-BBE:高阶通道背景误码块,显示本端由B3字节检测出的误块数。
●HP-TIM:高阶通道踪迹字节失配,J1应收和实际所收的不一致。
●HP-SLM:高阶通道信号标记失配,C2应收和实际所收的不一致。
●HP-UNEQ:高阶通道未装载,C2=00H超过了5帧。
●TU-AIS:支路单元告警指示信号,整个TU为全“1”(包括TU指针)。
●TU-LOP:支路单元指针丢失,连续8帧收到无效指针或NDF。
●TU-LOM:支路单元复帧丢失,H4连续2—10帧不等于复帧次序或无效的H4值。
●LP-RDI:低阶通道远端劣化指示,接收到TU-AIS或LP-SLM、LP-TIM。
●LP-REI:低阶通道远端误码指示,由V5[1 —2]检测。
●LP-TIM:低阶通道踪迹字节失配,由J2检测。
●LP-SLM:低阶通道信号标记字节适配,由V5[5 —7]检测。
●LP-UNEQ:低阶通道未装载,V5[5 —7]=000超过了5帧。
为了理顺这些告警维护信号的内在关系,我们在下面列出了两个告警流程图。
图4-13是简明的TU-AIS告警产生流程图。
TU-AIS在维护设备时会经常碰到,通过图4-13分析,就可以方便的定位TU-AIS及其它相关告警的故障点和原因。
图4-13 简明TU-AIS告警产生流程图。