常见爱立信基站告警处理方法
- 格式:doc
- 大小:154.50 KB
- 文档页数:29
常见告警处理A1类告警CP FAULT一、告警产生原因:CP FAULT一般是位于CPS或MAU中的硬件故障。
当系统发现一个永久性故障或三个相同类型的暂时性故障或暂时性故障出现频率太高时,MAS 的软件就会产生CP FAULT的告警。
二、告警处理流程:具体告警处理和操作规程请参考B-MODULE ALEX相应的OPI。
以下为主要操作步骤:当CP FAULT告警出现时,首先察看CP的状态,若状态为<DPWSP;CP STATEMAU SB SBSTATENRM B WO为正常状态,此类的CP FAULT是A3或A2告警,则留到晚上低话务量时处理;其余均为不正常状态,必须马上根据OPI:CP FAULT的ACTIONS进行现场处理。
CP FAULT的诊断测试:<REPCI;诊断。
同时出现O1告警:SYSTEM STATE REPAIR OF CP OR MAU。
诊断结果有两种情况:(1).无怀疑板块列出。
<RECCI;检修,将告警消掉。
(2).有怀疑板块列出。
a. 错误类型为Permanent(永久性)。
根据提示选择最怀疑板块,准备现场更换。
b. 错误类型为Temporary(临时性)。
若所有的最怀疑板块在最近30天内都换过,则用:<DIRCP;<DIECP:INF=PAR;<DIRRP;收好报告,留待爱立信专家分析。
<REPCE;将诊断进程结束。
若尚有板块可以更换,则参照错误类型为Permanent进行。
在进行现场操作时,故障管理人员对CP的结构、性能和应急措施因相当的清楚, 以避免因操作不当,造成直接的经济损失。
在修理过程种,故障管理人员要仔细确认REPCI的诊断结果, MAG和PCB的准确名称和位置, 若选错MAG和PCB,不但RECCI不能修过, 且会引起A1的CP FAULT和一侧CP的单边。
<REMCI:MAG= ,PCB= ;此刻系统将所需换的板子隔离出来,我们根据提示,按顺序关电,换板,再开电。
关于爱立信G网RBS2202基站设备的简介及一些告警处理办法1.设备简介以下为爱立信基站设备RBS2202的外观图:PSU:电源供给模块,以湖北联通为例,机柜有四路-48V转24V并行电源供给模块(最大配臵)ECU:电能控制模块,该模块控制所有模块供电,例如:所有散热风扇供电控制,ECU根据温度决定风扇是否启动。
DXU:分配交换单元,实际为基站主控单元,两M接口。
Base frame:底座CDU:合路及分离模块,提供全双工的信号合路,信号分离TRU:收发信模块,射频的调制和解调模块IDM/fans:内部分配模块/及散热风扇,机柜的加电空开面板2.基本配臵湖北联通定购的基站按CDU类型分为CDU_A和CDU_C+两种,基本站型除一些特例外基本为CDU_A型2+2+2,CDU_C+型2+2+2以及CDU_C+型4+4+4这三种。
以下为这三种配臵的CDU内部结构图(1)CDU_A型2+2+2一块CDU_A型包涵两种共四个功能块,两个双工器(Duplexer),两个接收信号分离放大电路(RXDA),TRU1的发射信号经双工器,直接去天线A。
天线A接受到的RXA信号经RXDA后分离成两路一路去TRU1的RXA接口,另一路去TRU2的RXA接口。
同理天线B。
(2)CDU_C+型2+2+2CDU_C+型包涵一个合路器,一个双工器,两个放大器,一个四路均分器一个两路均分器。
可以看到TRU1和TRU2的TX1和TX2发射信号经合路器合并成一路发射信号去了双工器,再去天线A。
同时天线A的RXA经双工器再由一放大器到四路均分器为TRU1和TRU2提供RXA信号,而天线B只提供一路RXB信号,经放大器到HLoutB接口,再通过CDU一根外部连线到HLin接口,最终到达两路均分器。
为TRU1和TRU2提供RXB信号。
(3)CDU_C+型4+4+4(两机柜三小区)这是一个用于城区话务忙的一个配臵,其一个小区最多支持四个TRU。
爱立信 WCDMA 基站常见告警处理方法1. PDH Loss of Signal:PDH信令丢失告警Maj PDH Loss of Sign loss_of_signalSubrack=1,Slot=1,PlugInUnit=1,Cbu=1,ExchangeTerminal=1,E1PhysPathTerm=pp4告警原因:传输不通。
2. Plug-In Unit General Problem:配置错误告警Maj Plug-In Unit General Problem replaceable_unit_problem Subrack=1,Slot=2,PlugInUnit=1告警原因:对应槽位没有板子,或板子读取不到。
处理方法:拔插相应槽位的板子,如拔插无效,则需更换板子。
3. AuxPlugInUnit_PiuConnectionLost:辅助单元设备告警Maj AuxPlugInUnit_PiuConnectionLost equipment_malfunction AuxPlugInUnit=1告警原因:外部告警先没接。
影响:无处理方法:由于现在外部告警线不需要接,可闭掉AuxPlugInUnit=1 这个MO,以消除告警。
4. AuxPlugInUnit_LossOfMains:RRU电源告警Maj AuxPlugInUnit_LossOfMains commerical_power_failure SectorAntenna=1,AuxPlugInUnit=RRU-1 告警原因:RRU掉电影响:该小区将退服。
处理方法:到现场检查RRU电源。
5. Carrier_RejectSignalFromHardware:Carrier_SignalNotReceivedWithinTime:载频告警Maj Carrier_RejectSignalFromHardware message_not_expected Sector=1,Carrier=1Maj Carrier_RejectSignalFromHardware message_not_expected Sector=2,Carrier=1Maj Carrier_SignalNotReceivedWithinTime timeout_expired Sector=2,Carrier=1告警原因:RU或RRU故障。
爱立信LTE无线告警现场处理手册日常故障处理方法(1)---Loss of Tracking➢告警解释:此告警是由于系统或者无线时钟失步导致,可能造成基站退服。
➢可能原因:(1)GPS硬件故障;(2)基站进程吊死;(3)DU硬件故障;TD-LTE采用GPS进行同步。
其硬件以及连接方式如下:➢处理步骤:检查GPS信号接收器上的工作状态灯状态。
(1)灯不亮1.检查GPS信号接收器和连接DU的RJ45网线,如有问题则进行更换。
2.检查DU上的GPS端口是否存在问题,如有问题则更换DU。
(2)绿灯常亮1.检查连接DU的RJ45网线,如有问题进行更换。
2.通知后台重启基站3.更换DU。
(3)绿灯闪1.按照上面GPS硬件连接图按照从DU到GPS天线的顺序检查各个接口是否有虚接、各线缆是否有破损、各个单元硬件是否存在问题,如有问题则进行重接或者更换。
2.通知后台重启基站3.更换DU。
(2)---Network Synch Time from GPS Missing➢告警解释:此告警是由于GPS信号丢失导致,可能导致基站退服。
➢可能原因:(1)GPS硬件故障;(2)基站进程吊死;(3)DU硬件故障;➢处理步骤:请参考“Loss of Tracking”告警的处理步骤。
(3)---System Clock Quality Degradation➢告警解释:此告警表示系统或者无线时钟进入了“free-running”模式,不能满足系统正常工作的需求。
该告警为伴生告警,其提示作用。
能够触发该告警的子告警为:●Network Synch Time from GPS Missing●Loss of Tracking●TU Synch Reference Loss of Signal➢可能原因:由于该告警为伴生告警,可能原因请参见其伴生的子告警。
➢处理步骤:由于该告警为伴生告警,处理步骤请参见其伴生的子告警。
(4)---Remote IP Address Unreachable➢告警解释:此告警表示远端IP地址不可达,多为到核心网的IP地址不可用。
基站常见故障处理CF EC10(Main fail (External Power Source Fail)):外部电源故障处理步骤:1.检查出现故障小区的PSU是否工作正常:检查指示灯是否正常;2.检查电源链路,包括电缆、熔丝空开等;3.检查IDB中配置的电源系统是否和实际使用的电源系统一致;4.检查交流电源是否连接正确;5.更换PSU。
HW and IDB inconsistency(硬件和IDB数据不一致):处理步骤:1.检查硬件的频段、配置数量是否和IDB的配置数据相一致。
2.如发现数据不同,需要重新传建IDB或者在IDB中进行修改。
Climate sensor fault, System voltage sensor fault,A/D converter fault告警处理步骤:1.检查出现告警小区的PSU、ECU是否工作正常。
2.如PSU出现问题,则更换。
(参照例三)3.如ECU出现问题,则更换。
4.将出现告警的ECU电源关闭,更换ECU。
5.更换后,将其电源开启。
TRX 1A/13 (RF loop test fault): RF 环路测试故障处理步骤:1,检查TX电缆与TRU是否正确连接。
2,对TRU进行复位或者断电后重新加电,看是否能够恢复。
3,讲该载频进行退出/进入服务的操作,或者将该载频对应的TG退服后重新进入,看是否可以恢复。
4,若经过上述操作后,故障仍然存在,或者以后再次出现,建议更换该TRU。
TRX 1A/21 (Internal configuration failed): 内部配置失败处理步骤:1,检查CDU电源是否正常。
2,检查IDB中CDU配置是否正确。
3,检查TRU是否安装正确,与Y-link线连接是否正确。
4,检查IDB中TRU配置是否正确。
5,检查CDU-BUS线包括背板连线。
6,将CDU进行断电/加电操作。
7,重启DXU,CDU,TRU。
8,更换TRU。
目录1 版本信息 12 前言 23 常见故障处理 23.1 告警Disk Volume C Full 23.2 告警Disk Volume D Full 33.3 告警FanFailure 43.4 告警loss of synch reference redundancy 63.5 告警Gigabit Ethernet Link Fault 73.6 告警Synch Reference Path HW Fault 93.7 告警NoContact 103.8 告警License Key 123.9 告警NTP Server Reachability Fault 123.10 告警Plug-In Unit General Problem 133.11 告警Power feeding fault 151 版本信息日期版本修订信息2013年5月10日初稿2 前言本文档描述了爱立信LTE EnodeB基站的一些常见故障现场处理方法。
本手册适用于RBS6000系列。
软件版本为L12B。
本文档的目的在于提供现场操作流程以及故障处理方法的中文描述,以帮助了解一些常见故障的处理过程,实际操作时请严格按照爱立信的ALEX文档步骤进行。
3 常见故障处理3.1 告警Disk Volume C Full3.1.1 故障描述Disk Volume C Full是一个主要告警,这个告警由MO ManagedElementData发出。
如果Main Processor(主处理器MP)的C卷上存储的数据过多,会导致该卷的可用空间耗尽或几乎耗尽,此时系统会发出Disk Volume C Full告警。
系统一般每隔15分钟对C卷进行一次检测,如果可用空间小于等于MO ManagedElementData的属性minimumHdVolumeCFreespace的值(单位为兆),告警就会出现。
只要可用空间比minimumHdVolumeCFreespace的值大1M,告警就能消除。
爱立信LTE无线专业常见告警目录Heartbeat Failure (2)ServiceUnavailable (2)ServiceDegraded (2)Gigabit Ethernet Link Fault (3)Remote IP Address Unreachable (3)Loss of Tracking (4)Network Synch Time from GPS Missing (6)System Clock Quality Degradation (6)PowerFailure (6)LinkFailure (7)LinkStability (7)VswrOverThreshold (8)CalibrationFailure (8)Plug-In Unit HW Failure (9)Plug-In Unit General Problem (9)GeneralHwError (10)HwFault (10)GeneralSwError (10)License Key File Fault (11)LicenseKeyMissing (11)Heartbeat Failure(基站退服或断站) 告警解释:此告警表示基站心跳告警,即基站脱管。
可能原因:(1)DU掉电(2)传输故障(3)DU故障(4)OSS原因(网管)处理步骤:(1)检查电源状态。
(2)检查DU电源接头是否松动,如有松动重做接头。
(3)检查基站传输连接,如有虚接或者尾纤破损则进行重接或者更换。
(4)通知传输检查传输状态。
(5)DU下电重启.(6)更换DU。
(7)配置原因,检查数据原因,回落到割接之前的地址,更换IP ServiceUnavailable告警解释:此告警表示小区服务质量不可用,即小区退服。
该告警为伴生告警,其提示作用。
能够触发该告警的常见子告警为:●PowerFailure(电源故障)●LinkFailure(光路告警)●HwFault(RRU硬件故障)●TemperatureExceptionalTakenOutOfService(RRU高温告警)可能原因:由于该告警为伴生告警,可能原因请参见其伴生的子告警。
基站常见故障处理CF EC10(Main fail (External Power Source Fail)):外部电源故障处理步骤:1.检查出现故障小区的PSU是否工作正常:检查指示灯是否正常;2.检查电源链路,包括电缆、熔丝空开等;3.检查IDB中配置的电源系统是否和实际使用的电源系统一致;4.检查交流电源是否连接正确;5.更换PSU。
HW and IDB inconsistency(硬件和IDB数据不一致):处理步骤:1.检查硬件的频段、配置数量是否和IDB的配置数据相一致。
2.如发现数据不同,需要重新传建IDB或者在IDB中进行修改。
Climate sensor fault, System voltage sensor fault,A/D converter fault告警处理步骤:1.检查出现告警小区的PSU、ECU是否工作正常。
2.如PSU出现问题,则更换。
(参照例三)3.如ECU出现问题,则更换。
4.将出现告警的ECU电源关闭,更换ECU。
5.更换后,将其电源开启。
TRX 1A/13 (RF loop test fault): RF 环路测试故障处理步骤:1,检查TX电缆与TRU是否正确连接。
2,对TRU进行复位或者断电后重新加电,看是否能够恢复。
3,讲该载频进行退出/进入服务的操作,或者将该载频对应的TG退服后重新进入,看是否可以恢复。
4,若经过上述操作后,故障仍然存在,或者以后再次出现,建议更换该TRU。
TRX 1A/21 (Internal configuration failed): 内部配置失败处理步骤:1,检查CDU电源是否正常。
2,检查IDB中CDU配置是否正确。
3,检查TRU是否安装正确,与Y-link线连接是否正确。
4,检查IDB中TRU配置是否正确。
5,检查CDU-BUS线包括背板连线。
6,将CDU进行断电/加电操作。
7,重启DXU,CDU,TRU。
8,更换TRU。
常见告警处理A1类告警CP FAUL T一、告警产生原因:CP FAULT一般是位于CPS或MAU中的硬件故障。
当系统发现一个永久性故障或三个相同类型的暂时性故障或暂时性故障出现频率太高时,MAS 的软件就会产生CP FAULT的告警。
二、告警处理流程:具体告警处理和操作规程请参考B-MODULE ALEX相应的OPI。
以下为主要操作步骤:当CP FAULT告警出现时,首先察看CP的状态,若状态为<DPWSP;CP STATEMAU SB SBSTATENRM B WO为正常状态,此类的CP FAULT是A3或A2告警,则留到晚上低话务量时处理;其余均为不正常状态,必须马上根据OPI:CP FAULT的ACTIONS进行现场处理。
CP FAULT的诊断测试:<REPCI;诊断。
同时出现O1告警:SYSTEM STATE REPAIR OF CP OR MAU。
诊断结果有两种情况:(1).无怀疑板块列出。
<RECCI;检修,将告警消掉。
(2).有怀疑板块列出。
a. 错误类型为Permanent(永久性)。
根据提示选择最怀疑板块,准备现场更换。
b. 错误类型为Temporary(临时性)。
若所有的最怀疑板块在最近30天内都换过,则用:<DIRCP;<DIECP:INF=PAR;<DIRRP;收好报告,留待爱立信专家分析。
<REPCE;将诊断进程结束。
若尚有板块可以更换,则参照错误类型为Permanent进行。
在进行现场操作时,故障管理人员对CP的结构、性能和应急措施因相当的清楚, 以避免因操作不当,造成直接的经济损失。
在修理过程种,故障管理人员要仔细确认REPCI的诊断结果, MAG和PCB的准确名称和位置, 若选错MAG和PCB,不但RECCI不能修过, 且会引起A1的CP FAULT和一侧CP的单边。
<REMCI:MAG= ,PCB= ;此刻系统将所需换的板子隔离出来,我们根据提示,按顺序关电,换板,再开电。
<RECCI;检修。
成功,则CP FAULT告警消失,O1告警消失,CP状态恢复正常。
若不成功,则CP FAULT告警仍在,O1告警仍在。
此时最好再次进行诊断。
注意,在再次诊断之前,只要有O1告警在,就须先将上次诊断进程结束:<REPCE;O1告警消失。
<REPCI;再次诊断。
<REMCI:MAG= ,PCB= ;选择最怀疑板块关电换板。
<RECCI;检修。
成功,OK。
不成功,则重复上述四步。
BLOCKING SUPERVISION一、告警产生原因:中继闭塞监测告警,通过指令设置告警门限:〈BLURC:R=,ACL=,LVB=;如路由中NBLO(DEV闭塞数)大于告警门限值便会发生此告警。
二、告警处理流程:1.STRSP:R=r;2.STRDP:R=,STATE=BLOC;显示闭塞的DEV3.EXDEP:DEV=dev; 显示dev对应的SNT,从而找出对应的DIP4.DTSTP:DIP=;NTSTP:SNT=;检查DIP、SNT状态。
5.若DIP状态为ABL,说明传输中断,报传输人员处理CCITT7 SIGNALLING LINK FAILURE一、告警产生原因:信令被激活状态下无法正常服务或信令出错后无法恢复正常二、告警处理流程:1.查看信令链路状态:C7LTP:LS= ;2.将故障SLC进行闭解:C7LAE:LS= ,SLC= ;C7LAI:LS= ,SLC= ;3.若闭解无效则查看信令链路数据:C7LDP:LS= ;EXDEP:DEV= ;查看SNTNTCOP:SNT= ;找到DIPDTSTP:DIP= ;看DIP状态若DIP为ABL则报传输处理,若DIP为WO,EXSCP:NAME= ;看信令所在半永久状态,若状态为ACT则联系对端局闭解或删定信令链路,若状态不为ACT则删定半永久连接,具体操作见“SEMIPERMANENT CONNECTION FAUL T”如进行以上操作后,告警仍没有清除,报故障管理人员CCITT7 DESTINA TION INACCESSIBLE一、告警产生原因:信令网中的某个信令点无法被访问,即信令点不可及告警。
如某一SP瘫掉,或到某一SP的LINK全部中断,没有迂回信令路由的情况,产生此告警。
该告警一般会伴随“CCITT7 SIGNALLING LINK FAILURE”出现二、告警处理流程:<C7RSP:DEST= ;查看到该DEST信令路由情况C7LTP:LS= ;以下同处理“CCITT7 SIGNALLING LINK FAILURE”告警步骤CCITT7 LINK SET SUPERVISION一、告警产生原因:两个交换局之间有多条信令链路,通过指令设置告警门限:<C7SUC:LS= ,LVA= ,ACL= ,DMI= ;若被闭掉的链路数大于告警门限便会发生此告警。
二、告警处理流程:1.去、激活告警的信令链路:<C7LAE:LS= ,SLC= ;<C7LAI:LS= ,SLC= ;2.根据告警内容,判断是否由传输故障引起:C7LDP:LS=ls; 查信令的一些参数EXDEP:DEV=dev; DEV对应的SNTNTCOP:SNT=snt; SNT对应的DIPDTSTP:DIP=dip; 传输是否中断DTQUP:DIP=dip; 传输是否误码NETWORK SYNCHRONIZATION FAUL T一、告警产生原因:网络同步采用主从方式,外部时钟是通过话务数字链路接入到ETC板,由ETC板识别出帧同步信息,产生一个8KHZ的信号分别接入三个时钟模块(CLM),经锁相环调整,输出三个互不相干的时钟信号到接收模块(TSS、SPM),由接收模块择优选用。
交换机自身有一个时钟模块,为参考时钟模块(RCM),参考时钟模块是由晶体振荡源组成的时钟,主要用于交换机的备用时钟源,CLM-1 和CLM-2相位锁定为CLM-0(MASTER),当CLM-0输出值较大时,CLM-1、CLM-2跟随CLM-0导致输出值偏差较大,导致NETWORK SYNCHRONIZATION FAULT。
日常维护中必须对交换机的CLM进行检查、调整,保证其工作在正常值2048+-200范围内。
二、告警处理流程:NSSTP;查看CLOCK-REFERENRE 状态。
NSDAP; 查看网同步时钟数据GSCVP; 查看CLM的值NSBLI;闭掉NSTEI;测试NSBLE;解闭如测试不通过,需由故障管理人员根据相关告警信息进行处理。
测试正常解闭后该时钟参考源会处于UPD状态,此过程约需12小时。
EXTERNAL ALARM一、告警产生原因:交换机某些重要的辅助设备,如:电源、风扇,以及基站的天线等发生故障时,在交换机上产生相应的外部告警。
二、告警处理流程:具体告警处理和操作规程请参考B-MODULE ALEX相应的OPI。
以下为主要操作步骤:1.若出现的外部告警为电源告警,则应立即通知相关人员到达现场检查电源设备;2.若为其他外部告警:(1)则用ALRDP:DEV=ALEX2—;查询外部告警相关参数;(2)闭解外部告警:BLEAI:DEV=ALEX2—;BLEAE:DEV=ALEX2—;(3)若闭解后告警重新出现,则要通知相关人员到达现场处理硬件故障。
SP UNIT FAUL T一、告警产生原因:SP(支持处理)单元发生故障。
二、告警处理流程:具体告警处理和操作规程请参考B-MODULE ALEX相应的OPI。
以下为主要操作步骤:因主要涉及硬件修理,故由故障管理人员操作。
1.查看两个NODE(NODE A和NODE B)的状态:IMLCT:SPG=0;(假设SPG=0发生故障)IMCSP;END;2.如果出错的是执行侧(EX),则进行测试:RESUI:SPG=0,NODE= ;3.若测试通过则将其解开:BLSNE:SPG=0,NODE= ;4.若出错的为备用侧(SB),则将其闭掉:BLSNI:SPG=0,NODE= ;显示检测报告:DISFP:SPG=0,NODE= ;若未有错误单元列出则执行2、3步骤,若有错误单元列出则:RESUP:SPG=0,NODE= ;找出错误单元进行硬件修理,修理成功后执行步骤3。
FILE PROCESS UTILITY AUTOMATIC TRANSFER FAILURE 一、告警产生原因:具有FPU功能的文件自动传送失败。
二、告警处理流程:ALLIP;根据告警内容确认是什么文件出现告警。
IMLCT: SPG=X; (0 或 1)ILLUP;ILNPP (: PORT=ALL);END;相应的端口是否ABL, 若ABL进行闭解:IMLCT: SPG=X; (0 或 1)ILBLI: PORT=X-X-X-X;/ ILBLI: NP=X-X-X-X;ILBLE: PORT=X-X-X-X;/ ILBLE: NP=X-X-X-X;ILNPP (: PORT=ALL);若端口状态仍为ABL,确认硬件损坏,需要更换硬件处理.若端口状态WO,表示端口状态正常,则进行人工传送文件:INFUP: FILE=XXX;INFSP: FILE=XXX, DEST=YYY;INFTI: FILE=XXX-AAA, DEST=YYY;INFSP: FILE=XXX, DEST=YYY;SWITCHING NETWORK TERMINAL FAUL T一、告警产生原因:1.SNT和GROUP SWITCH之间接口错误被检测到;2.SNT的外部硬件设备或SNT和外部设备间的接口错误被检测到;3.SNT单元硬件板子被检测到错误。
二、告警处理流程:1.闭掉相应SNT:NTBLI:SNT= ;2.测试SNT,找出故障原因:NTTEI:SNT= ;3.若有被怀疑硬件列出,交故障管理人员处理,更换硬件后继续测试SNT。
若测试通过则解闭SNT:NTBLE:SNT= ;告警清除。
GROUP SWITCH FAUL T一、告警产生原因:GROUP SWITCH被检测到有错误。
二、告警处理流程:1.检查故障单元状态。
有3种设备类型:Clock Module (CLM) 、Space Switch Module (SPM) 、Time Switch Module (TSM) 。
2.TSM故障的处理步骤:1)查看所有TSM状态 GSSTP: TSM= ;2)闭掉有故障的单元GSBLI:TSM= ;3)测试该TSM GSTEI:TSM= ;4)若测试结果有错误单元列出则更换硬件,若无则解开TSM:GSBLE:TSM= ;若测试结果为硬件故障,交故障管理人员更换硬件处理。