当前位置:文档之家› 中兴基站设备故障处理指导书

中兴基站设备故障处理指导书

中兴基站设备故障处理指导书
中兴基站设备故障处理指导书

中兴基站设备故障处理指导书

V 1.0

网优中心系统分析部

2010年2月

版本说明

目录

前言 (5)

告警级别说明 (5)

紧急告警 (5)

硬件狗或LICENSE文件非法。 (5)

主要告警 (6)

未探测到CCM/BDM/CBM。 (6)

PWRD485通信链路断。 (6)

BTS掉站。 (7)

一次电源电池充电压过高。 (7)

一次电源电压过低。 (7)

GPS处于搜星状态。 (7)

GPS天馈开路。 (8)

GPS卫星丢失。 (9)

E1底层误码率高。 (9)

PPP_UID链路中断。 (9)

第一条中继线错误。 (10)

检测到A BIS口E1连接变化。 (11)

温度告警。 (11)

机房烟雾告警。 (12)

次要告警 (12)

PPM板异常或不在位。 (12)

PSMB的+5V无输出告警。 (13)

PSMB异常或不在位。 (13)

PSMC异常或不在位。 (13)

PSMD板异常或不在位。 (13)

SAM板上DC-DC电源模块无输出告警。 (14)

PPP链路HDLC故障。 (14)

PPP链路故障。 (14)

中继线不可用。 (14)

背板拨码开关被改变。 (15)

未探测到CHM。 (16)

未探测到PA。 (16)

未探测到RFE。 (16)

未探测到TRX。 (17)

无法探测到GCM。 (17)

CCM检测到GPS状态异常告警。 (17)

CSM自检未通过。 (18)

RFCM数据链路告警。 (18)

RFIM数据链路告警。 (19)

未探测到RTR。 (19)

PA关断。 (19)

PA去使能。 (20)

低功率告警。 (20)

TRX反向链路RSSI低告警。 (21)

反向RSSI偏高。 (21)

未探测到FCE。 (22)

风扇故障告警。 (22)

湿度传感器没有安装或已经损坏告警。 (22)

湿度告警。 (23)

防雷器告警。 (23)

提示告警 (23)

GPS长时间预热。 (23)

GPS天馈故障。 (24)

时钟模块处于预热状态。 (24)

网元中单板已插,但OMC未配置。 (24)

未探测到SAM。 (24)

中继告警指示信号。 (25)

HDLC通道不可用。 (25)

中继信号丢失。 (25)

RFCM自动定标失败告警。 (26)

TRX射频频综异常。 (26)

RFE接收链路LNA过欠流。 (26)

RFE低功率告警。 (26)

过去15分钟内中继链路误码水平超过阈值。 (27)

前言

本文档主要对中兴基站设备的常见故障维护进行了说明。本文根据常见故障的重要性以及对系统的影响程度将告警分为4个级别:紧急告警、重要告警、次要告警和提示告警。针对不同告警罗列了它们在前台出现的告警信息、告警原因、对系统的影响以及处理措施,方便大家查找。由于每个告警的级别可以根据网络或设备的具体情况自行设置,所以本文档中各个告警的级别也不是绝对的,应视实际情况而定。另外,部分告警会伴随相应告警同时出现,需要结合具体情况综合判断定位故障。备注内容为平日维护工作中的经验,供大家参考。如有不当之处,望大家予以指正,共同完善该维护文档。

告警级别说明

紧急告警:此类级别的故障影响到系统提供的服务,需要立即采取相应动作。如某设备或资源完全不可用,需进行恢复,即使该故障在非工作时间内发生,也需立即采取措施。

主要告警:此类级别的故障影响到服务质量,需要采取紧急动作。如某设备或资源服务质量下降,需对其进行还原,恢复全部能力,需在工作时间内立即采取措施。

次要告警:此类级别的故障还未影响到服务质量,但为了避免更严重的故障,需要在适当时候进行处理或进一步观察。

提示告警:此类级别的故障指示可能有潜在的错误影响到提供的服务,根据不同的错误采取相应的措施进行处理。

紧急告警

告警信息:硬件狗或license文件非法。

告警原因:硬件狗未插或用户非法。

对系统的影响:对在网业务无影响,但如果要新增站点CE或做其他重

要更改操作时将被不允许。

处理措施:1、将硬件狗插好并保证license文件合法;

2、提交中兴厂家处理。

主要告警

告警信息:未探测到CCM/BDM/CBM。

告警原因:1、CCM/BDM/CBM运行异常(包括CCM/BDM/CBM以及DSM单板的问题或软件版本的问题);

2、CCM/BDM/CBM与OMP通信断(可能是传输中断或异

常,如果基站掉电也会有相同告警出现)。

对系统的影响:基站业务中断。

处理措施:1、检查CCM是否在位和上电;

2、初始化查询版本是否正确;

3、检查该通道上的BSC侧DTB、BTS侧CDSU、以及CDSU

的E1连线是否正常;

4、检查BDS机框的通道号拨位是否正确;

5、检查E1连接关系和数据库配置是否一致;

6、检查之前是否更改同步过Abis口的配置信息;

7、如果以上措施无效就请更换CCM单板;

8、如果告警仍未消除,请申报故障。

备注:根据经验,如果该告警出现,基站频繁闪断,多数情况是由于基

站传输问题导致。

告警信息:PWRD485通信链路断。

告警原因:PWRD485通信线缆未插好或者电源监控板MCU芯片损坏。

对系统的影响:对业务无影响,但BSC从架电源环境温度告警信息不

能上报。

处理措施:1、检查PWRD485线缆是否插好;

2、单板本身的RS485通讯模块损坏,报厂家对坏芯片进行

检查更换。

告警信息:BTS掉站。

告警原因:1、基站掉电;

2、BTS与BSC连接断。

对系统的影响:基站业务中断。

处理措施:1、检查abis链路;

2、可能是基站掉电;

3、也可能是CCM\BDM\CBM板坏。

告警信息:一次电源电池充电压过高。

告警原因:无

对系统的影响:无

处理措施:使用万用表或其他工具检查直流电源系统的输出电压是否过高,如果过高更换直流电源系统,如果正常则更换电源单板。

告警信息:一次电源电压过低。

告警原因:无

对系统的影响:无

处理措施:使用万用表或其他工具检查直流电源系统的输出电压是否过低,如果过高更换直流电源系统,如果正常则更换电源单板。

告警信息:GPS处于搜星状态。

告警原因:1、站点是否刚因为掉电重起;

2、站点是否刚刚复位过重起;

3、GPS是否还有别的异常告警:如天馈断路等。

对系统的影响:长期处于搜星状态会影响扇区间的切换。

处理措施:1、单板上电15分钟后,观察告警是否自动恢复;

2、复位单板;

3、用手持GPS工具测试是否可以搜索到3颗以上的卫星信

号;

4、利用频谱仪测试1575.42MHz频点周围是否存在干扰;

5、关闭单板电源,然后打开单板电源;

6、拔插单板;

7、更换单板;

8、更换GPS天线。

告警信息:GPS天馈开路。

告警原因:1、GPS天馈线断开;

2、GPS天线坏;

3、背板连接器未插牢;

4、GPS单板故障。

对系统的影响:长期天馈开路会影响时钟同步失败,结果会造成扇区间的切换。

处理措施:1、检查背板连接器是否插牢;

2、用万用表电压档测试单板天馈口电压是否为4.75~5.25V,

否则更换单板,或者采用电阻档测试GPS蘑菇头到该接口值,如果

无穷大或者没有,检查GPS馈线到GPS蘑菇头通路是否正常;

3、检查GPS天馈系统的蘑菇头处天馈口电压是否为

4.75~

5.25V,否则更换馈线;

4、拧紧天馈接头;

5、更换天线;

6、更换单板。

告警信息:GPS卫星丢失。

告警原因:1、GPS天馈线缆连接不良;

2、GPS天馈架设不合理;

3、GPS天线故障;

4、GCM单板内部GPS模块失效;

5、存在干扰信号。

对系统的影响:长期天馈开路会影响扇区间的切换。

处理措施:1、复位单板;

2、用手持GPS工具测试是否可以搜索到3颗以上的卫星信

号;

3、利用频谱仪测试1575.42MHz频点周围是否存在干扰;

4、关闭单板电源,然后打开单板电源;

5、拔插单板;

6、更换单板;

7、更换GPS天线;

8、如果频繁出现,要检查天馈系统是否正常;

9、检查天馈馈电。

告警信息:E1底层误码率高。

告警原因:底层链路出现误码。

对系统的影响:误码超过10的负3次方就会影响业务。

处理措施:检查本端中继链路有无故障;检查该中继链路的上行方向有无其他设备故障。

告警信息:PPP_UID链路中断。

告警原因:1、因为端口多为动态创建,所以端口在初始创建时会有此告警;

2、若此前IPCP状态为OPENED,当链路由通变为不通或

者底层模块故障(比如BSP或微码故障),导致PPP连续丢包5

次,会有此告警。而且PPP状态迁移,将重新协商;

3、若此前IPCP状态为OPENED,当链路质量不好,导致

PPP链路5次丢包,会有此告警。而且PPP状态迁移,将重新协

商。

对系统的影响:如果基站所有在用的E1都出现此问题则基站掉站,中断业务。

处理措施:1、检查BTS是否已经启动。检查至BTS的E1链路是否正常;

2、若链路连通而且IPCP能够协商成功,则告警恢复;

3、对于没有OPENED的端口,若删除它,也需先恢复告警,

以免下次生成该端口时没有告警。根据逻辑板的不同,PPP端口

生成、删除的方式也不同。INLP和ABPM、IB_PPP都是动态增

删。而POSI是固定的(只有1个对外端口)。

告警信息:第一条中继线错误。

告警原因:1、接收载波丢失;

2、接收帧失步;

3、远端告警;

4、输出开路;

5、输出过流;

6、编码违例。

对系统的影响:严重时候影响业务。

处理措施:对于告警原因1~2:

1、检查传输链路;

2、更换BIM电缆;

3、更换BIM;

对于告警原因3:

1、检查电缆阻抗与配置是否一致;

2、检查发送端传输链路;

对于告警原因4:

1、检查BIM电缆是否开路;

2、更换BIM电缆;

对于告警原因5:

1、检查BIM电缆确认是否短路;

2、更换BIM;

对于告警原因6:

1、检查电缆插头是否插到位;

2、检查配线架上的跳线是否可靠连通;

3、检查BIM单板上的跳线是否正确;

4、更换电缆。

5、更换中继器或光端机的端口。

告警信息:检测到Abis口E1连接变化。

告警原因:BTS和BSC的Abis口之间E1连接关系改变。

处理措施:1. 进行BTS和BSC的Abis口之间E1连接关系的检测,是否存在E1交叉连接的情况。

2. 该告警不能自动恢复,需要手动删除

告警信息:温度告警。

告警原因:以下一个或多个传感器探测到的温度高于门限值:

1、PPD/DPD温度传感器;

2、蓄电池温度传感器;

3、PMM2温度传感器;

4、机架温度传感器告警;

5、外环境(PRM)出风口温度;

6、加热器温度;

7、热交换器进风口的传感器;

8、蓄电池温度过门限;

9、进风口的温度的传感器;

10、机架或者机架的传感器;

11、机房温度传感器。

对系统的影响:温度过高会导致基站关闭(基站自我保护)。

处理措施:1、在配置管理中检查门限设置是否合理;

2、改善环境温度状况;

3、更换相应传感器。

告警信息:机房烟雾告警。

告警原因:1、出现烟雾告警;

2、烟雾传感器坏。

对系统的影响:无

处理措施:1、检查环境烟雾状况是否正常;

2、更换烟雾传感器。

次要告警

告警信息:PPM板异常或不在位。

告警原因:PPM板异常或不在位。

对系统的影响:如果所有的PPM板异常则部分单板会运行异常,影响

业务。

处理措施:1、检查主控模块CCM是否正常;

2、检查PPM板是否在位和上电;

3、复位PPM板;

4、如果以上措施无效请更换单板。

告警信息:PSMB的+5V无输出告警。

告警原因:1、PSMB1故障;

2、PSMB2故障。

对系统的影响:部分单板运行会异常,业务中断。

处理措施:更换电源模块。

告警信息:PSMB异常或不在位。

告警原因:PSMB异常或不在位。

对系统的影响:无

处理措施:1、检查监控模块(BSC侧为PAM单板,BTS侧为SAM单板)是否正常;

2、检查PSMB电源是否打开;

3、拔插PSMB;

4、更换PSMB;

告警信息:PSMC异常或不在位。

告警原因:PSMC异常或不在位。

对系统的影响:无

处理措施:1、检查SAM运行是否正常;

2、检查PSMD和PSMB之间的后背板485连线是否插好;

3、检查PSMC电源是否打开;

4、拔插PSMC;

5、更换PSMC。

告警信息:PSMD板异常或不在位。

告警原因:PSMD板异常或不在位、主控CCM运行异常。

对系统的影响:无

处理措施:检查主控模块CCM是否正常。

告警信息:SAM板上DC-DC电源模块无输出告警。

告警原因:SAM板件问题。

对系统的影响:对该站存在的所有电源单板监控异常,该站上所有电源单板会上报探测不到的虚告警;此外该站的环境信息无法上

报。

处理措施:更换SAM板。

备注:出现该告警最大的可能是SAM板出问题,但也不排除其背板连线及相连的相关部件出问题(在开县告警清零工作中,该告警是由烟雾传感器损坏而导致SAM板告警)。

告警信息:PPP链路HDLC故障。

告警原因:DSM上HDLC链路状态故障。

对系统的影响:如果基站只用一条E1则会导致掉站。

处理措施:1、在动态管理中检查是否是人工闭塞E1;

2、检查网元E1连线是否和OMC配置一致;

3、检查E1链路;

4、复位DSM。

备注:在开县告警清零工作中,该告警是由传输设备损坏引起。

告警信息:PPP链路故障。

告警原因:DSM上PPP链路故障。

对系统的影响:如果基站只用一条E1则会导致掉站。

处理措施:1、检查是否存在PPP链路HDLC告警;

2、检查E1链路;

3、复位DSM。

告警信息:中继线不可用。

告警原因:1、输入端异常;

2、输出端异常;

3、E1故障,可能是输出端异常。

对系统的影响:基站业务中断。

处理措施:1、检查E1\T1连线及传输链路。关注接收方向,特别是到光端机的连接;

2、检查E1\T1连线及传输链路,重点关注发送方向;

3、更换本单板;

4、更换E1\T1对端连接的单板。

告警信息:背板拨码开关被改变。

告警原因:1. 背板的SLOT拨码被改变;

2. 背板的RACK(BSC/BTS)、SHELF(BSC)或PATH(BTS)

拨码被改变。

对系统的影响:无

处理措施:1、可能CDSU/SAM单板引起背板槽位的电压跳变,建议更换单板;

2、如果是人为改动,请复位相关的单板;

3、如果没有人为改动,可能是单板引起拨码开关电压跳变,

不要轻易复位单板:BSC侧需要检查背板及框内的CDSU单板

是否故障。BTS侧需要检查该框背板及框内的CDSU,CCM等

单板是否故障。

备注:可能是BDS机框内某块单板故障拉低后背板拨码开关电压造成的。处理方法与BSC侧的方法类似,一般是通过插拔CHM/SAM/CCM/CDSU单板来逐步确认。HIRS系统“背板拨码开关被改变”的告警一般是由于某一块或几块单板故障拉低后背板拨码开关电压造成的,当然也不排除后背板拨码开关确实损坏的情况,不过这种情况不常见。对于BSC侧,该告警一般都是2路的CDSU单板故障造成的。对于BTS侧,一般是SAM板或者CCM板故障造成的。

告警信息:未探测到CHM。

告警原因:1、CHM单板运行异常;

2、CHM存在媒体流故障;

3、CHM和CCM通信异常。

对系统的影响:业务中断。

处理措施:1、检查CCM是否运行正常;

2、检查CHM是否在位和上电;

3、检查CCM上的CHM版本是否正确;

4、复位CHM;

5、更换CHM。

备注:后台出现CHM探测不到的告警,基带其它单板没有告警,且该基站的三个扇区的射频部分工作都不正常,如果实施“未探测到CHM”告警的处理措施后,该告警仍存在,则考虑RFIM板故障,对RFIM单板进行更换。

告警信息:未探测到PA。

告警原因:PA未加电或者坏。

对系统的影响:会导致小区低功率告警,影响业务。

处理措施:1、关电PA,然后打开PA电源;

2、复位PA;

3、拔插PA;

4、更换PA。

告警信息:未探测到RFE。

告警原因:RFE未上电或故障。

对系统的影响:如果是收发共用的RFE则影响小区业务。

处理措施:1、检查主控模块CCM是否正常;

2、检查TRX是否正常;

3、检查RFE板是否在位和上电;

4、如果以上措施无效请更换RFE。

告警信息:未探测到TRX。

告警原因:TRX未上电或故障。

对系统的影响:影响小区业务。

处理措施:1、检查基带子系统是否正常;

2、检查TRX板是否在位和上电;

3、复位TRX板;

4、更换单板。

告警信息:无法探测到GCM。

告警原因:1、GCM未上电;

2、GCM未下载到单板软件版本;

3、GCM未下载到单板逻辑版本;

4、CCM未收到正确的TOD消息。

处理措施:1、确认GCM单板已插到位,并已上电;

2、在前台确认GCM单板是否已运行起来,如果没有运行

起来,则根据指示灯的状态,判断故障所在;

3、如果GCM单板已运行起来,则检查、复位CCM单板,

排除CCM单板故障,如CCM单板正常,则判定为GCM单板

故障。

备注:如果CCM在9s内没有收到GCM周期上报的TOD消息,该告警便会出现。

告警信息:CCM检测到GPS状态异常告警。

告警原因:1、GPS状态异常,可能是天馈故障;

2、HIRS驱动发送错误告警。

对系统的影响:GPS时钟异常会影响小区间切换。

处理措施:1、检查天馈线;

2、复位GPS。

告警信息:CSM自检未通过。

告警原因:1. BIT测试未通过。

2. BIT测试结果错误。

3. 部分芯片没有通过BIT测试。

4. 部分芯片没有响应BIT测试。

5. 总线接口测试失败。

6. 内部中断测试失败。

7. CHIPX16测试失败。

8. 偶秒信号测试失败。

9. PCG中断测试失败。

10. OS中断测试失败。

11. 时间测试失败。

12. RAM测试失败。

13. Signature测试失败。

14. ARM中断测试失败。

15. ARM寄存器测试失败。

16. 信道板chipx32信号丢失。

17. 信道板芯片CSM67

对系统的影响:CHM板运行异常,业务中断。

处理措施:1、检查时钟信号是否正常;

2、复位CHM单板;

3、拔插CHM单板;

4、更换CHM单板。

告警信息:RFCM数据链路告警。

告警原因:1、RFCM数据链路误帧率级别:轻微;

2、RFCM数据链路误帧率级别:一般;

3、RFCM数据链路误帧率级别:严重。

对系统的影响:对应TRX运行异常,严重时影响业务。

处理措施:1、TRX复位启动时,偶尔有此告警;

2、检查时钟系统是否正常;

3、以上措施无效,请更换TRX模块;

4、如果告警仍未消除,请申报故障。

告警信息:RFIM数据链路告警。

告警原因:1、RFIM与CHM的前向数据错;

2、RFIM与扇区的反向数据错;

3、RFIM与CHM的前向数据错;

4、RFIM与扇区的反向数据错。

对系统的影响:无

处理措施:1、后台检查数据配置;

2、更换RFIM单板。

告警信息:未探测到RTR。

处理措施:1、检查RTR是否在位和上电;

2、检查RTR与其基带主控板之间的物理媒介是否连接或者

连接牢靠;

3、复位RTR单板;

4、更换单板。

备注:如果后台上看到的是第2小区单板告警,可能是FSA的软件版本不匹配造成。

告警信息:PA关断。

告警原因:1、PA过功率异常;

2、PA温度异常;

3、PA器件失效;

4、PA驻波比异常。

对系统的影响:PA关断会导致小区低功率告警,影响业务。

处理措施:1、检查是否人为关断;

2、使能PA是否能够恢复;

3、请复位PA;

4、请更换PA。

告警信息:PA去使能。

告警原因:1、后台去使能;

2、PA关断。

对系统的影响:PA去使能会导致小区低功率告警,影响业务。

处理措施:1、检查基带功率是否正常;

2、检查射频衰减是否偏小;

3、使能功放。

告警信息:低功率告警。

告警原因:1、PA去使能;

2、定标功率过低

对系统的影响:影响业务。

处理措施:1、检查是否存在PA去使能告警;

2、在诊断测试中检查基带功率是否过低;

3、在动态管理中检查定标功率是否过低,并停自动定标后

手动抬升功率,如果能,说明HPA正常,反之更换HPA;

4、对于RFEA/RFEB,复位RFE;对于RFEC/RFED,复位

PIM;

5、对于RFEA/RFEB,更换RFE;对于RFEC/RFED,更换

PIM。

相关主题
文本预览
相关文档 最新文档