九博MSAP常见告警及故障分析手册
- 格式:doc
- 大小:469.00 KB
- 文档页数:18
中国铁塔动环常见告警处理指导手册一、FSU离线告警告警名称:FSU离线;告警解释:FSU和铁塔集团平台连接通讯中断;原因分析:1)信号差或不稳定;2)FSU设备掉电;3)无线模块硬件故障;4)FSU设备硬件故障;5)天线和无线模块连接中断,或天线丢失;6)VPN服务器连接不上;7)SIM卡被盗、欠费或故障。
平台处理方法:查询历史告警记录,如频繁离线或长时间离线,需现场检查。
现场处理方法:第一步检查供电:1)在运维监控系统检查离线站点是否有停电告警,判断是否现场停电;2)现场检查FSU指示灯不亮设备没有供电。
原因分析:FSU供电异常。
解决方案:1)检查整个基站是否停电,如停电则通知相关人员取电;2)检查FSU供电空开是否跳闸及通电线路是否正常。
第二步检查无线模块:检查无线模块指示灯都不亮或都常亮。
原因分析:无线模块供电异常或无线模块故障。
解决方案:1)无线模块供电故障,则检查给无线模块供电接线是否正常如正常,则用万用表测量给无线模块供电FSU输出端是否有12V,如没有则为FSU供电板问题,更换FSU供电板。
2)确认供电正常,则更换无线模块进行测试。
下站建议:下站时建议随身带上一套可以成功拨号的无线网卡和SIM 卡,下站的时候作对比验证,快速确认是SIM卡问题,还是无线模块问题。
第三步FSU检查通过EISUConfig软件登陆FSU设备,点击设备诊断管理。
1)信号强度弱:通过设备软件登录设备,如信号强度小于15。
解决方案:更换运营商无线模块或将天线外延(室内站放到室外,室外柜放到底部隐蔽区域或有外层保护情况下放到机柜顶部)2)铁塔VPN网络连接异常:铁塔VPN网络提示连接异常3)铁塔网管未注册:铁塔网管提示连接异常(正常显示连接正常)解决方案:确认总部平台正常,重启FSU(等待程序连接)。
如重启后未恢复,联系厂家专业人员。
平台恢复确认:告警管理-活动告警监控-当前告警查询该站点,确认告警是否消除。
二、电源配套告警2.1开关电源类告警:2.1.1开关电源通信状态告警告警名称:开关电源通信状态告警;告警解释:开关电源和FSU之间的通讯中断;原因分析:开关电源和FSU之间的通讯中断平台处理方法:无现场处理方法:检查开关电源屏幕是否显示正常,和FSU的监控线连接是否正常。
BTS常见故障告警处理步骤BTS常见故障处理步骤一、载频单板驻波告警定位方法问题原因:1、从载频到射频前端的射频线缆连接不牢固。
2、载频到射频前端的射频线缆质量存在问题。
3、载频单板本身故障导致载频驻波告警。
4、射频前端单板(如CDU、DDPU等)本身故障导致。
5、天馈线可能存在问题。
处理步骤:1、检查载频单板到射频前端的连接线缆连接是否牢固,拧紧射频线缆和射频前端连接,拧紧射频线缆和载频单板的连接。
2、检查载频到射频前端的射频连接线缆是否存在质量问题,是否有损坏现象,更换载频到射频前端的射频连接线缆。
3、检查是否载频单板本身存在故障,更换载频单板观察载频驻波告警是否消除。
4、检查是否射频前端单板(如CDU、DDPU等)本身故障导致,更换射频前端单板观察告警是否消除。
5、检查是否天馈存在问题,测试天馈驻波比是否过大。
二、无线链路提示告警定位方法问题原因:无线链路告警有四种原因值,需要根据不同的告警原因值进行处理。
1、无线链路提示告警支路号0,表示信道激活异常,原因是SCP 与BSC的信道类型或信道状态不一致,产生此告警。
2、无线链路提示告警支路号1,表示信道释放异常,包含SDCCH异常释放和TCH异常释放。
产生信道异常释放的原因值有设备问题(如TRX单板故障)引起告警,干扰引起告警,数据配置不当SDCCH异常释放引起无线链路告警,数据配置不当TCH异常释放引起无线链路告警。
3、无线链路提示告警支路号2,表示主BCCH无话务,主BCCH 载频在连续的检测时间内没有话务,产生此告警。
4、无线链路提示告警支路号3,表示上下行不平衡,导致上下行不平衡的原因有载频或天溃上行和下行通道问题,数据配置不当等。
处理步骤:1、信道激活异常的告警:(1)对于信道激活异常的告警,查看数据配置,是否有BTS与BSC信道状态和信道类型不一致,如果有修改信道状态一致。
(2)是否进行过信道、频点、跳频数据等修改,有可能配置未下发到基站并生效,导致不一致,对于该种情况,重新配置数据并下发基站生效。
湖北省公司某客户MSTP电路LCAS故障处理分析案例——湖北武汉联通集团客户响应中心杨慧丽一、故障现象湖北省武汉某客户(某银行)某日至湖北省黄冈MSTP电路不通。
二、故障情况分析湖北省武汉某银行至黄冈的电路承载于烽火780,该设备端口是武汉某银行到各个地市电路的光路汇聚端口,承载了多条业务,此次故障发生后,武汉传输网管查看到黄冈方向有告警。
经黄冈传输网管向武汉方向打环,武汉可以收到环,排除线路故障。
武汉某银行拓扑图经排查发现,当黄冈本地格力威尔MSTP与武汉烽火780设备在双方开启LCAS协议并且双方设备光路为连接状态时,当格林威尔设备发生掉电或VCG重启,会引起烽火LCAS出现异常,从而出现双方握手不成功情况,此为发生业务中断的主要原因。
对于此种情况,湖北省公司要求烽火和格林威尔公司进行分析排查,并彻底解决问题。
三、故障排查及处理过程(一)第一步:根据测试数据查找LCAS握手不成功原因。
实现方案:搭建测试平台,模拟现场测试环境(烽火以太网盘与格林威尔MSAP对开通业务,并开启LCAS功能);按照测试方案连接设备,如图所示:780A与格林威尔MSAP 设备通过155光口开通以太网业务,同时开启两块单盘的LCAS功能。
为便于定位问题,只在WAN口配置一个VC12,并开启烽火以太网软件中LCAS模块的调试开关。
确认业务正常,检查单盘LCAS 状态正常。
1.重复100次现场测试项目,记录测试结果;按照测试内容:“验证双方在LCAS运行正常情况下,遇到掉电情况时,业务运行状态和LCAS握手状态”以及“验证在传输通道发生重启时,业务运行状态和LCAS运行状态”进行测试,测试结果为:当对端格林威尔设备掉电重启后,业务中断。
查看WAN 口成员状态不正确,如下图所示:单盘底层调试打印的信息如下:2.以主网分析仪记录测试中出现异常时的信息并进行综合分析;对底层打印的调试分析发现:当格林威尔设备重启后,烽火单盘LCAS宿端状态机接收到的控制字也有相应变化,从FIX变为EOS(只建立一个VC12),此时宿端会根据接收到的控制对成员状态MST 进行调整,MST = 0为OK。
GT-MSAP综合接入平台常见告警及故障分析手册广东九博电子科技有限公司版本号:1.1目录一、设备告警列表 (3)二、告警名称说明 (4)三、MSAP板卡故障分析 (7)四、告警故障分析 (11)1、电源告警 (11)2、风扇告警 (11)3、温度过高 (11)4、网管失联 (11)5、插卡与配置不符合 (12)6、插卡不在位 (12)7、SDH光口收无光(STM-LOS) (12)8、SDH光口收信号帧丢失(STM-LOF) (12)9、SDH再生段帧失步(RS-OOF) (12)10、再生段通道识别符失配(RS-TIM) (12)11、复用段告警指示信号(MS-AIS) (12)12、复用段远端失效指示(MS-RDI). (12)13、复用段远端错误指示(MS-REI) (13)14、复用段信号劣化(MS-SD) (13)15、AU指针丢失(AU-LOP) (13)16、AU告警指示信号(AU-AIS) (13)17、高阶复用指针丢失(HP-LOM) (13)18、高阶通道识别符失配(HP-TIM) (13)19、高阶通道识别符丢失(HP-SLM) (13)20、高阶远端失效指示(HP-RDI) (14)21、高阶远端错误指示(HP-REI) (14)22、高阶未装载(HP-UNEQ) (14)23、时钟失效 (14)24、TU指针丢失(TU-LOP) (14)25、TU告警信号指示(TU-AIS) (14)26、低阶远端失效指示(LP-RFI) (14)27、低阶远端失效指示(LP-RDI) (15)28、低阶远端错误指示(LP-REI) (15)29、低阶通道识别符失配(LP-TIM) (15)30、低阶通道识别符丢失(LP-SLM) (15)31、低阶信号劣化(LP-SD) (15)32、低阶未装载(LP-UNEQ) (15)33、E1告警指示信号(PORT-AIS) (15)34、E1信号丢失(PORT-LOS) (15)35、PDH光信号丢失(PDHOPT-LOS) (16)36、PDH光信号帧失步(PDHOPT-LOF) (16)37、PDH光口误码率达到E-3(PDHOPT-E3) (16)38、PDH光口误码率达到E-6(PDHOPT-E6) (16)39、PDH光口误码率达到E-9(PDHOPT-E9) (16)40、100Base-FX光信号丢失(OFE-LOS) (16)41、以太接口LINK断(LINK_DOWN) (16)42、远端光纤收发器以太口连接信号(LINK/ACT) (16)43、远端光纤收发器以太口工作状态指示(AUTO) (17)44、远端光纤收发器以太口全/半双工指示(全/半双工) (17)45、远端光纤收发器以太口速率指示(10/100M) (17)46、掉电告警 (17)五.MSAP网元数据的异常恢复 (17)1.直接通过网管中心网管台进行网元数据的恢复 (17)2.直接通过本地终端进行网元数据的恢复 (17)3.手工数据的恢复 (18)一、设备告警列表设备名称告警名称机框DO1C/DMU与DO4/DMUPDA4PDB22MM16SDA2SDA4SDAT2SDAT4ESO4ESE4ESO8ESE8电源告警√风扇告警√温度过高√时钟失效√STM-LOS √√√√√STM-LOF √√√√√RS-OOF √√√√√RS-TIM √√√√√MS-AIS √√√√√MS-RDI √√√√√MS-REI √√√√√MS-SD √√√√√AU-LOP √√√√√AU-AIS √√√√√HP-LOM √√√√√二、告警名称说明告警名称告警描述HP-TIM √ √ √ √ √ HP-SLM √ √ √ √ √ HP-RDI √ √ √ √ √ HP-REI √ √ √ √ √ HP-UNEQ √ √ √ √ √ TU-LOP √ √ √ √ √ √ √ TU-AIS √ √ √ √ √ √ √ LP-RFI √ √ √ √ √ √ √ LP-RDI √ √ √ √ √ √ √ LP-REI √ √ √ √ √ √ √ LP-TIM √ √ √ √ √ √ √ LP-SLM √ √ √ √ √ √ √ LP-SD √ √ √ √ √ √ √ LP-UNEQ √ √ √ √ √ √ √ PORT-AIS √ √ √ PORT-LOS √ √ √ PDHOPT -LOS √ √ PDHOPT -LOF √ √ PDHOPT -E3 √ √ PDHOPT E6 √ √ PDHOPT- E9 √ √ OFE-LOS √ √ √ √ LINK_DOWN √ √ √ √ LINK/ACT √ √ √ √ AUTO √ √ √ √ 全/半双工 √ √ √ √ 10/100M √ √ √ √ 掉电告警 √ √ √ √ √ √ √ √ √ √ 网管失联 √ √ √ √ √ √ √ √ √ √ √ 插卡与配置不符合 √ √ √ √ √ √ √ √ √ √ √ 插卡不在位√√√√√√√√√√√STM1_LOS SDH光口信号丢失STM1_LOF SDH光口帧丢失RS_OOF SDH光口帧失步RS_TIM J0不匹配MS_AIS 复用段全1告警MS_RDI 复用段对端信号丢失MS_REI 复用段对端误码指示MS_SD 复用段信号劣化AU_LOP 高阶通道指针丢失AU_AIS 高阶通道全1告警HP_LOM 高阶通道复帧失步HP_TIM J1不匹配HP_SLM C2信号失配HP_RDI 高阶通道对端信号丢失HP_REI 高阶通道对端误码HP_UNEQ 高阶通道未装载TU_LOP 低阶通道指针丢失TU_AIS 低阶通道全1告警LP_RFI 低阶通道对端失效LP_RDI 低阶通道对端缺陷LP_TIM J2不匹配LP_SLM V5信号失配LP_REI 低阶通道对端误码LP_UNEQ 低阶通道未装载LP_SD 低阶通道信号缺陷PORT_AIS 端口输入AISPORT_LOS 端口信号丢失PDHOPT_LOS PDH光口信号丢失PDHOPT_LOF PDH光口帧失步PDHOPT_E3 PDH光口E3误码PDHOPT_E6 PDH光口E6误码PDHOPT_E9 PDH光口E9误码掉电告警设备电源掉电插卡与配置不符合配置板卡与实际插卡不匹配插卡不在位配置板卡被拔出或坏掉时钟失效时钟信号失效PORT_LOF 端口帧失步PORT_ERR 端口误码与网管失联设备与网管间通道不通LINK_DOWN 以太接口LINK断ETH_LOA 以太接口Loss of alignmentETH_LAPS_ADDR 以太接口LAPS ADDRESS mismatched ETH_LAPS_CTRL 以太接口LAPS CONTROL mismatched ETH_LAPS_SAPI 以太接口LAPS SAPI mismatchedETH_GFP_LOF 以太接口GFP loss of frameETH_GFP_PTI 以太接口GFP PTI mismatched ETH_GFP_EXI 以太接口GFP EXI mismatched ETH_GFP_UPI 以太接口GFP UPI mismatched ETH_GFP_CID 以太接口GFP CID mismatched ETH_GFP_SPARE 以太接口GFP SPARE mismatched ETH_LCAS_RSACK_TOGGLE 以太接口LCAS RSACK TOGGLEETH_LCAS_RSACK_TIMEOUT 以太接口LCAS RSACK TIMEOUT ETH_LCAS_RXVCG_SIZE_CHANGE 以太接口LCAS RXVCG SIZE CHANGE ETH_LCAS_TXVCG_SIZE_CHANGE 以太接口LCAS TXVCG SIZE CHANGE ETH_LCAS_LOSS_OF_SINK_SEQ 以太接口LCAS LOSS OF SINK SEQ ETH_MEM_AIS 以太接口通道成员全1告警ETH_MEM_LOP 以太接口通道成员指针丢失ETH_MEM_RDI 以太接口通道成员远端告警ETH_MEM_SLM 以太接口通道成员信号标号不匹配ETH_MEM_K4LOM 以太接口通道成员K4丢失复帧ETH_MEM_SEQ 以太接口通道成员序列号不匹配ETH_MEM_UNEQ 以太接口通道成员未装载SUE性能越限开始不可用事件性能越限SEP性能越限连续严重误码周期性能越限BBE性能越限背景误码块性能越限ES性能越限误码秒性能越限SES性能越限严重误码秒性能越限UAS性能越限不可用秒性能越限正指针性能越限正指针性能越限负指针性能越限负指针性能越限RSUE性能越限对端开始不可用事件性能越限RSEP性能越限对端连续严重误码周期性能越限RBBE性能越限对端背景误码块性能越限RES性能越限对端误码秒性能越限RSES性能越限对端严重误码秒性能越限RUAS性能越限对端不可用秒性能越限15分钟性能越界15分钟性能越界24小时性能越界24小时性能越界风扇告警风扇告警温度过高温度过高告警RS_ES 再生段ES15分钟性能越界RS_SES 再生段SES15分钟性能越界RS_UAS 再生段UAS15分钟性能越界RS_BBE 再生段BBE15分钟性能越界MS_ES 复用段ES15分钟性能越界MS_SES 复用段SES15分钟性能越界MS_UAS 复用段UAS15分钟性能越界MS_BBE 复用段BBE15分钟性能越界HP_ES 高阶ES15分钟性能越界HP_SES 高阶SES15分钟性能越界HP_UAS 高阶UAS15分钟性能越界HP_BBE 高阶BBE15分钟性能越界HP_PJE 高阶PJE15分钟性能越界ETH_RxCRCerror 校验错误数15分钟性能高于上限告警ETH_RxAlignmentError 对齐错误数15分钟性能高于上限告警ETH_TxDeferred 被延迟发送的帧数15分钟性能高于上限告警ETH_TxLateCollision 在发送后一个时隙时间内检测到的冲突次数15分钟性能高于上限告警ETH_TxTotalCollision 检测到的碰撞次数15分钟性能高于上限告警ETH_TxExcessiveCollision 由于连续碰撞(超过16次)而发送失败的帧数15分钟性能高于上限告警RS_ES 再生段ES24小时性能越界RS_SES 再生段SES24小时性能越界RS_UAS 再生段UAS24小时性能越界RS_BBE 再生段BBE24小时性能越界MS_ES 复用段ES24小时性能越界MS_SES 复用段SES24小时性能越界MS_UAS 复用段UAS24小时性能越界MS_BBE 复用段BBE24小时性能越界HP_ES 高阶ES24小时性能越界HP_SES 高阶SES24小时性能越界HP_UAS 高阶UAS24小时性能越界HP_BBE 高阶BBE24小时性能越界HP_PJE 高阶PJE24小时性能越界ETH_RxCRCerror 校验错误数24小时性能高于上限告警ETH_RxAlignmentError 对齐错误数15分钟性能高于上限告警ETH_TxDeferred 被延迟发送的帧数24小时性能高于上限告警ETH_TxLateCollision 在发送后一个时隙时间内检测到的冲突次数24小时性能高于上限告警ETH_TxTotalCollision 检测到的碰撞次数24小时性能高于上限告警ETH_TxExcessiveCollision 由于连续碰撞(超过16次)而发送失败的帧数24小时性能高于上限告警三、MSAP板卡故障分析DO1C/DMU及DO4/DMU告警名称解释故障分析STM-LOS 光口收无光光纤故障或对方光发故障STM-LOF 光口收信号帧丢失光纤故障或对方设备发信号错误,回复对方MS-RDIRS-OOF 再生段帧失步光纤故障或对方设备发信号错误,回复对方MS-RDI RS-TIM 再生段通道识别符失配一般不影响设备正常,可屏蔽此告警MS-AIS 复用段告警指示信号光纤故障或对方设备发信号错误,回复对方MS-RDI MS-RDI 复用段远端失效指示可能是光纤故障或本设备发送部分故障,对方检测到RS-LOF、MS-AIS等告警,回应过来MS-RDIMS-REI 复用段远端错误指示可能是光纤故障或本设备发送部分故障,对方检测到B2误码后,回应过来MS-REIMS-SD 复用段信号劣化本设备检测到B2误码,可能是光纤故障或对端设备发送部分故障,回复对方MS-REIAU-LOP AU指针丢失对方设备发信号错误或本端收电路有故障,回复对方HP-RDIAU-AIS AU告警指示信号对方设备发信号错误或本端收电路有故障,回复对方HP-RDIHP-LOM 高阶复用指针丢失对方设备发信号错误或本端收电路有故障,回复对方HP-RDIHP-TIM 高阶通道识别符失配一般不影响设备正常,可屏蔽此告警HP-SLM 高阶通道识别符丢失一般不影响设备正常,可屏蔽此告警HP-RDI 高阶远端失效指示本设备发送部分故障或对端收电路故障,对方检测到AU-LOP、AU-AIS、HP-LOM等告警,回应MS-RDI HP-REI 高阶远端错误指示光纤故障或本设备发送部分故障或对端收电路故障,对方检测到B2误码后,回应HP-REIHP-UNEQ 高阶未装载对方发信号未按标准装载负荷时钟失效光口收故障,造成从该光口接收的线路时钟失效SDA2/SDAT2/SDA4/SDAT4盘的各种告警名称解释故障分析STM-LOS 光口收无光光纤故障或对应的远端SDH光端机光发故障STM-LOF 光口收信号帧丢失光纤故障或对应的远端SDH光端机发信号错误,回复对方MS-RDIRS-OOF 再生段帧失步光纤故障或对应的远端SDH光端机发信号错误,回复对方MS-RDIRS-TIM 再生段通道识别符失配一般不影响设备正常,可屏蔽此告警MS-AIS 复用段告警指示信号光纤故障或对应的远端SDH光端机发信号错误,回复对方MS-RDIMS-RDI 复用段远端失效指示光纤故障或本板发送部分故障,对应的远端SDH光端机检测到RS-LOF、MS-AIS等告警,回应过来MS-RDI MS-REI 复用段远端错误指示光纤故障或本板发送部分故障,对应的远端SDH光端机检测到B2误码后,回应过来MS-REIMS-SD 复用段信号劣化本板检测到B2误码,可能是光纤故障或对应的远端SDH光端机发送部分故障,回复对方MS-REIAU-LOP AU指针丢失对应的远端SDH光端机发信号错误或本板接收部分故障,回复对方HP-RDIAU-AIS AU告警指示信号对应的远端SDH光端机发信号错误或本板接收部分故障,回复对方HP-RDIHP-LOM 高阶复用指针丢失对应的远端SDH光端机发信号错误或本板接收部分故障,回复对方HP-RDIHP-TIM 高阶通道识别符失配一般不影响设备正常,可屏蔽此告警HP-SLM 高阶通道识别符丢失一般不影响设备正常,可屏蔽此告警HP-RDI 高阶远端失效指示本板发送部分故障或对应的远端SDH光端机接收部分故障,对方检测到AU-LOP、AU-AIS、HP-LOM等告警,回应MS-RDIHP-REI 高阶远端错误指示本板发送部分故障或对应的远端SDH光端机接收部分故障,对方检测到B2误码后,回应HP-REIHP-UNEQ 高阶未装载对应的远端SDH光端机发信号未按标准装载负荷PDA4/PDB2盘告警名称解释故障分析TU-LOP TU指针丢失本端接收对端设备发送的VC12信号故障,可能是对端VC12发的问题或本端DMU故障,本盘回应LP-REITU-AIS TU告警信号指示本端接收对端设备发送的VC12信号故障,可能是对端VC12发的问题或本端DMU故障,本盘回应LP-REILP-RFI 低阶远端失效指示对端接受本端发送的VC12通道未装载正确信号类型,可能是本盘VC12发的问题LP-RDI 低阶远端失效指示对端接受本端发送的VC12信号故障,如TU-LOP、TU-AIS,可能是本盘VC12发的问题LP-REI 低阶远端错误指示对端接受本端发送的VC12信号误码,可能是本盘VC12发的问题或线路问题LP-TIM 低阶通道识别符失配不影响使用,可屏蔽LP-SLM 低阶通道识别符丢失不影响使用,可屏蔽LP-SD 低阶信号劣化本端接受对端发送的VC12信号误码,可能是对端VC12发的问题或线路问题,本盘回应LP-REILP-UNEQ 低阶未装载对端发送的VC12信号有问题,本盘回应LP-RFIPORT-AIS E1告警指示信号与本盘PDH光口相连的远端PDH光端机的E1接口连接的终端设备发送全“1”告警信号,该设备有故障。