爱立信BSC常见故障告警处理
- 格式:doc
- 大小:200.00 KB
- 文档页数:31
常见告警处理A1类告警CP FAULT一、告警产生原因:CP FAULT一般是位于CPS或MAU中的硬件故障。
当系统发现一个永久性故障或三个相同类型的暂时性故障或暂时性故障出现频率太高时,MAS 的软件就会产生CP FAULT的告警。
二、告警处理流程:具体告警处理和操作规程请参考B-MODULE ALEX相应的OPI。
以下为主要操作步骤:当CP FAULT告警出现时,首先察看CP的状态,若状态为<DPWSP;CP STATEMAU SB SBSTATENRM B WO为正常状态,此类的CP FAULT是A3或A2告警,则留到晚上低话务量时处理;其余均为不正常状态,必须马上根据OPI:CP FAULT的ACTIONS进行现场处理。
CP FAULT的诊断测试:<REPCI;诊断。
同时出现O1告警:SYSTEM STATE REPAIR OF CP OR MAU。
诊断结果有两种情况:(1).无怀疑板块列出。
<RECCI;检修,将告警消掉。
(2).有怀疑板块列出。
a. 错误类型为Permanent(永久性)。
根据提示选择最怀疑板块,准备现场更换。
b. 错误类型为Temporary(临时性)。
若所有的最怀疑板块在最近30天内都换过,则用:<DIRCP;<DIECP:INF=PAR;<DIRRP;收好报告,留待爱立信专家分析。
<REPCE;将诊断进程结束。
若尚有板块可以更换,则参照错误类型为Permanent进行。
在进行现场操作时,故障管理人员对CP的结构、性能和应急措施因相当的清楚, 以避免因操作不当,造成直接的经济损失。
在修理过程种,故障管理人员要仔细确认REPCI的诊断结果, MAG和PCB的准确名称和位置, 若选错MAG和PCB,不但RECCI不能修过, 且会引起A1的CP FAULT和一侧CP的单边。
<REMCI:MAG= ,PCB= ;此刻系统将所需换的板子隔离出来,我们根据提示,按顺序关电,换板,再开电。
移动通信维护手册爱立信交换设备维护分册-故障处理版本号:1.0.02007-6-30发布2007-6-30实施中国移动通信有限公司分公司发布目录1 APZ部分: (1)1.1 故障描述:告警BACKUP INFORMA TION FAULT (1)1.2 故障描述:告警SIZE ALTERATION OF DATA FILES SIZE CHANGEREQUIRED (1)1.3 故障描述:告警AUDIT FUNCTION THRESHOLD SUPERVISION (2)1.4 故障描述:告警CP FAULT (2)1.5 故障描述:告警SOFTWARE ERROR (3)1.6 故障描述:告警SYSTEM RESTART (3)2 APT部分: (3)2.1 故障描述:告警ANAL YSIS DATA FAULT (3)2.2 故障描述:告警BLOCKING SUPERVISION (4)2.3 故障描述:告警CCITT7 DESTINATION INACCESSIBLE (5)2.4 故障描述:告警CCITT7 SIGNALLING LINK FAILURE (5)2.5 故障描述:告警CCITT7 LINK SET SUPERVISION (6)2.6 故障描述:告警DIGITAL PATH FAULT SUPERVISION (6)2.7 故障描述:告警DISTURBANCE SUPERVISION OF TRUNK ROUTES (7)2.8 故障描述:告警GROUP SWITCH FAULT (7)2.9 故障描述:告警SEMIPERMANENT CONNECTION FAULT (8)2.10 故障描述:告警SWITCHING NETWORK TERMINAL FAULT (9)2.11 故障描述:告警NM ROUTE LOAD STATE CHANGE (10)2.12 故障描述:告警RP FAULT (10)2.13 故障描述:告警SIGNALLING FAULT SUPERVISION (11)2.14 故障描述:告警SYNCHRONOUS DIGITAL PATH FAULT SUPERVISION (11)2.15 故障描述:告警NETWORK SYNCHRONIZATION FAULT (12)2.16 故障描述:告警EVENT REPORTING THRESHOLD REACHED,门限已达到80% (12)2.17 故障描述:告警M3UA DESTINA TION INACCESSIBLE (12)3 IOG部分: (13)3.1 故障描述:告警ALI FAULT MAG PCB ADDINFO ALI-0 - NO CONTACT (13)3.2 故障描述:告警PORT BLOCKED (14)3.3 故障描述:告警PVC SET-UP FAILURE (14)3.4 故障描述:告警LINE UNIT BLOCKED (15)3.5 故障描述:告警SP NODE AUTOMA TICALL Y BLOCKED (16)3.6、故障描述:告警SP TRANSIENT FAULT SUPERVISION (16)4 APG部分 (17)4.1 故障描述:告警AP LOG STATISTICS (17)4.2 故障描述:告警AP ANTIVIRUS FUNCTION FAULT (17)4.3 故障描述:告警AP FAULT (18)4.3.1 MIRRORED DISKS NOT REDUNDANT:磁盘镜像有问题引起。
BSC的故障的明确定义:1、对于有主备用的BSC模块,当模块出现一侧故障告警,且不影响BSC正常运行时,该类故障称为BSC模块故障;2、出现BSC阻断、或同一BSC模块主备用两块或两块以上故障告警、出现无话务量、GPRS功能断失、同一BSC的NO.7出现3条或3条以上闭塞等网络非正常运行而耽误告警的模块故障,称为BSC故障处理流程:BSC一般故障的处理流程:BSC重大故障处理流程BSC的重大故障,目前主要有两个原因引起:设备吊死影响正常运行和BSC负荷过高超出设计容量,我们制定相应的应急方案,一旦发生重大故障则按照方案执行。
如遇到无法解决的故障:1. 对于故障较小,涉及个别小区故障的,应及时向上级汇报,同时安排好接班人员继续处理故障,直到故障排除。
2. 对于故障牵涉面较大的,如一个BSC下所带的小区或者某片区域故障,应及时向上级汇报,若超过割接计划设计时间任无法排除,应督促工程实施人员将所实施的工程全部还原到割接前,以保证现网用户能正常使用。
Siemens BSC故障等级1.一根PCMA故障影响:一根PCMA 故障2.TRAU故障影响:该TRAU所带的4根PCMA故障3.TRAU0故障影响:该BSC前4根PCMA 故障,该BSC的O-LINK故障(omc无法监控该BSC,但不影响该BSC正常工作)4.BSC单边工作影响:该BSC正常工作,但该BSC的所有模块都无冗余5.整个BSC故障影响:此BSC所有BTS,TRAU,PCMA都故障ERICSSON BSC故障等级1.一根RALT故障影响:一根A口中继故障2.一侧RP故障影响:该RP管理的功能模块正常工作,但该RP管理的功能模块与CP之间的通信都无冗余3.两侧RP故障影响:RP管理的所有功能模块均无法正常工作4.CP单边工作影响:该BSC正常工作,但该BSC的所有CP模块单元都无冗余5.整个BSC故障影响:此BSC所有BTS,A口中继都无法正常工作。
BSC操作维护手册第一节查传输指令1RBS200基站传输指令RXTCP:MOTY=RXETG,CELL=小区名;(通过已知小区名,查出小区的TG 号)RXCDP:MO=RXETG-<tg>;(查看小区的整体配置)RXMOP:MO=RXETRX-<tg>-X&&-Y;(查看小区的传输时隙分配,其中X 和Y表示具体哪个载波)RADEP:DEV=RBLT-X;(查具体传输号,其中X表示传输时隙)DTSTP:DIP=RBLT<dip>;(查传输状态)DTQUP:DIP=RBLT<dip>;(查看传输质量)DTQSR:DIP=RBLT<dip>,UNACC,DEGR,SF;(清传输质差误码和滑码)NTCOP:SNT=ETRBLT-<dip>;(知传输号查传输设备DEV号)RXMDP:MOTY=RXOTS,DEV=RBLT-X;(知传输号反查TG号)DTBLI:DIP=RBLT<dip>;(闭传输)DTBLE:DIP=RBLT<dip>;(解传输)STDEP:DEV=RBLT-X;(查传输设备状态)BLODI:DEV=RBLT-X;(闭传输设备状态)BLODE:DEV=RBLT-X;(解传输设备状态)DTIDP:DIP=RBLT<dip>;(查传输的MODE)DTIDC:DIP=RBLT<dip>,MODE=0/1;(200站时为1,2000站时为0;)2RBS2000基站传输指令RXTCP:MOTY=RXOTG,CELL=小区名;(查出小区的TG号)RXCDP:MO=RXOTG-<tg>;(查看小区的整体配置)RXAPP:MO=RXOTG-<tg>;(查看小区的传输时隙分配)RADEP:DEV=RBLT-X;(查具体传输号,其中X表示传输时隙)DTSTP:DIP=RBLT<dip>;(查传输状态)DTQUP:DIP=RBLT<dip>;(查看传输质量)DTQSR:DIP=RBLT<dip>,UNACC,DEGR,SF;(清传输质差误码和滑码)NTCOP:SNT=ETRBLT-<dip>;(知传输号反查传输设备DEV号)RXMDP:MOTY=RXOTS,DEV=RBLT-X;(知传输号反查TG号)DTBLI:DIP=RBLT<dip>;(闭传输)DTBLE:DIP=RBLT<dip>;(解传输)STDEP:DEV=RBLT-X;(查传输设备状态)BLODI:DEV=RBLT-X;(闭传输设备状态)BLODE:DEV=RBLT-X;(解传输设备状态)DTIDP:DIP=RBLT<dip>;(查传输的MODE)DTIDC:DIP=RBLT<dip>,MODE=0/1;(200站时为1,2000站时为0;)第二节基站设备扩容常用指令1GSM900基站扩容以DGABSC1网元的洪梅GSM900DGAHMI1为例,TG号为253,一套传输开三个小区,DIP=RBLT63,所给待加的频点为15,扩容一个载波(3+1),加在-3位置。
基站常见故障处理CF EC10(Main fail (External Power Source Fail)):外部电源故障处理步骤:1.检查出现故障小区的PSU是否工作正常:检查指示灯是否正常;2.检查电源链路,包括电缆、熔丝空开等;3.检查IDB中配置的电源系统是否和实际使用的电源系统一致;4.检查交流电源是否连接正确;5.更换PSU。
HW and IDB inconsistency(硬件和IDB数据不一致):处理步骤:1.检查硬件的频段、配置数量是否和IDB的配置数据相一致。
2.如发现数据不同,需要重新传建IDB或者在IDB中进行修改。
Climate sensor fault, System voltage sensor fault,A/D converter fault告警处理步骤:1.检查出现告警小区的PSU、ECU是否工作正常。
2.如PSU出现问题,则更换。
(参照例三)3.如ECU出现问题,则更换。
4.将出现告警的ECU电源关闭,更换ECU。
5.更换后,将其电源开启。
TRX 1A/13 (RF loop test fault): RF 环路测试故障处理步骤:1,检查TX电缆与TRU是否正确连接。
2,对TRU进行复位或者断电后重新加电,看是否能够恢复。
3,讲该载频进行退出/进入服务的操作,或者将该载频对应的TG退服后重新进入,看是否可以恢复。
4,若经过上述操作后,故障仍然存在,或者以后再次出现,建议更换该TRU。
TRX 1A/21 (Internal configuration failed): 内部配置失败处理步骤:1,检查CDU电源是否正常。
2,检查IDB中CDU配置是否正确。
3,检查TRU是否安装正确,与Y-link线连接是否正确。
4,检查IDB中TRU配置是否正确。
5,检查CDU-BUS线包括背板连线。
6,将CDU进行断电/加电操作。
7,重启DXU,CDU,TRU。
8,更换TRU。
常见故障告警处理一. 硬件设备告警1、CP FAULTDPWSP;看CP状态。
REPCI;测试出错部件(排第一个是最可能出错的部件)。
REMCI:MAG=XX,PCB=XX;换板(可以再REMCI第二个部件)。
RECCI;测试并复位。
若修时出FC301说明交换机自己在修,此时CP状态为SE-FM(分离),无法人工修,只要等片刻就会发现CP状态变为UPDATING,再等就应该WORKING了。
2、RP FAULTEXRPP:RP=XX;看RP状态REPRI;测试出错部件(排第一个是最可能出错的部件)REMRI:RP=XX,PCB=XX;(也可以换第二个部件)RECRI;测试并复位闭解RP BLRPI/E:RP=XX;3、EMRP FAULT(emrp:Extension Module Regional Processor )REPEI:EMG=XX,EMRP=XX;REMEI:EMG=XX,MAG=XX,PCB=XX;RECEI:EMG=XX,PCB=XX;4、EM FAULTEXEMP:RP=X,EM=XX;看EM状态若无RPT时:REPRI:RP=XX,EM=XX;REMRI:RP=XX,EM=XX,PCB=XX;RECCI:RP=XX,EM=XX;若有RPT时:EXEMP:RP=XX,EM=XX;BLEMI:RP=XX,EM=XX,RPT=XX;BLEME:RP=XX,EM=XX,RPT=XX;若与TSM相关时:GSBLI: TSM=XX;进行(2)或(3)闭解EMGSBLE: TSM=XX;5、SWITCHING NETWORK TERMINAL FAULTNTSTP:SNT=XX;看SNT状态(常见FC38可闭解修好)NTCOP:SNT=XX;查DEV号对MSC:EXDRP:DEV=XX;查控制设备的RP号和EM号对BSC:RADAP:DEV=XX;查控制设备的RP号和EM号EXRPP:RP=XX;NTBLI:SNT=XX;闭NTTEI:SNT=XX;测NTBLE:SNT=XX;解若解不开,可试以下方法:EXEGP:EMG=XXXXX;查CICEXCLP:EQM=CLC-9;查对应的DEV,记下相关数据BLCLI:EQM=XX;闭CICEXCLE:EQM=XX;拆数据NTBLI:SNT=XX;闭NTBLE:SNT=XX;解EXCLI:EQM=XX,SPEED=XX,DEV=XX;重新定义原来的数据BLCLE:EQM=XX;解CIC6、GROUP SWITCH FAULT(TSM FAULT)(或GROUP SWITCH RESTRICTIONS)GSSTP:CLM/SPM/TSM=ALL;找出错部位(或用GSREP;列出故障的设备)。
GSBLI:TSM=XX;闭GSTEI:TSM=XX;测GSBLE:TSM=XX;解NTSTP:SNTP=TSM-XX;找SNT号GSDSP;看干扰值,查干扰源RRDSP:SNT=XX;查SUID号RRDSL:SNT=XX,SUID=XX;LOAD7、SP LINK FAULT(RPA FAULT时)EXSLP:SPG=ALL;查哪条状态不正常BLSNI:SPG=XX,node=a/b;闭LINK不好的NODE,BLSNE:SPG=XX,node=a/b;解LINK不好的NODE8、SP NODE FAULTIMMCT:SPG=0/1;IMCSP;看SP状态(SP做RESTART后会分离主备边,并UPDATE备用边) END;(用IMSIP:NODE=XX;可看到SP操作的STEP)BLSNI:SPG=X,NODE=X;闭DISUI:SPG=X,NODE=X,UNIT=HD-1,TEST=0~6;逐个板测RESUI:SPG=X,NODE=X;测BLSUI:SPG=X,NODE=X;测(SP TRSNSIENT FAULT SUPERVISION)BLSNE:SPG=X,NODE=X;解9、CPT FAULTIMLCT:SPG=0;ILNPP:PORT=ALL;找带CPT的端口,并查端口状态、速率ILLBI:NP=1-2-2-1-1;闭PPILLBI:NP=1-2-2-1;闭NPILLBE:PP=XX;解PPILLBE:NP=XX;解NPEND;(但要等半小时才好)二、传输告警1、DIP FAULTDTSTP:DIP=XX;看DIP状态(FC是NODE则是SNT问题)DTDIP:DIP=XX;查SNT号NTCOP:SNT=XX;查DEV号STDEP:DEV=XX;看设备是否连接(NC未连,无方向号的是空端口)或EXDEP:DEV=XX;R下面是C说明已有路由,S下面是NC还未使用。
或STRSP:R=XX,STATE=BLOC;看有无BLOCK的路由,若无说明设备未连上。
若是空端口则:DTBLI:DIP=XX;闭DIP若DIP是ABL或有反复按传输故障流程处理对MSC:EXDEP:DEC=XX;查具体数据(路由号、CLC号)对BSC:RADEP:DEV=XX;查具体数据注:将CIC号(MISC1)除以32即可以算出第几套FC1:表示全1码FC2:表示帧丢失FC3:表示误码高DTQUP:DIP=XX;查DIP质量,看计算器是否累计太多DTQSR:DIP=XX[,ES,ES2,SES,SES2,SF];清相应计算器FC4:表示对端问题联系对端局,同时闭解设备(BLODI/E:DEV=XX;)FC9:表示信号丢失FC1&2:表示有可能没断,只是设备发了乱码FC2&9:表示真的断DTIDP:DIP=XX;看DIP的参数DTIDC:DIP=XX,NODE=0;改DIP的参数BLODI/E:DEV=XX;闭解设备BLORI/E:R=XX;闭解路由EXDAE/I:DIP=XX;闭解DIP的设备EXDRE/I:DIP=XX;拆建DIP的路由2、SEMIPERNANENT CONNECTION FAULTEXSCP:NAME=XX;查DEV号EXDEP:DEV=XX;查DIP号DTSTP:DIP=XX;看DIP状态若需释放EXSCE:NAME=XX,DEV=XX;拆(一定记DEV值)EXSPI:NAME=XX;定义半永久连接的数据EXSSI:DEV1=XX;EXSSI:DEV2=XX;EXSPE:NAME=XX;EXSCI:NAME=XX,DEV=XX;连回若中间不成功:EXDAE:DEV=XX;去活设备三、7号信令问题1、信令链路问题C7RSP:DEST=ALL;看当前局到各局向的LS号C7LTP:LS=XX;看LS状态(FC5是EM问题)C7LDP:LS=XX;查ST号和DEV号C7STP:ST=XX;看信令终端对应的RP、EMEXDRP:DEV=XX;查DEV对应的RP、EMEXRPP:RP=XX;看RP状态EXEMP:RP=XX,EM=XX;看EM状态查对应中继C7LDP:LS=XX;查DEV号EXDEP:DEV=XX;查SNT号(若设备状态为TP对端问题)NTCOP:SNT=XX;查DIP号DTSTP:DIP=XX;看DIP状态也可试着清误码:DTQUP:DIP=XX;看有否累计太多的计算器DTQSR:DIP=XX[,ES,ES2,SES,SES2,SF];清相应的计算器若无异常则监听与对端局联系,同时闭解C7LAE/I:LS=XX,SLC=XX;若同时有对应的半永久连接告警C7LDP:LS=XX;2、CCITT7 SIGNALLING LINK FAULURE若FC0表示ST硬件坏若FC3人工闭解即可若FC100/104表示误码高若FC200表示经常反复(可能由于不稳定)四、文件告警的处理VOLUME LIMIT EXCEEDEDINMCT:SPG=0;INVOP;看硬盘有哪些VOL(VOL=RELVOLUME不能随便删!ICIFILE是立即计费的文件RELFSW9是升级用的RELFSW101是TESTLOAD用的)INVOP:VOL=XX;看使用的和未用的文件有多少INFIP:FILE=TLOG/TLOGON/TLOGRESTART;看哪些文件可以删,TLOG文件是记录所有操作的文件INFIR:FILE=TLOG-XXXXX;删掉过期的文件END;INFINITE FILE END WARINGFC214:(1)INFUP:FILE=XX;查出DEST名(2)再看其他局,看有否定义错DEST名(3)INFSP:FILE=XX,DEST=XX;看硬盘里已发文件和未发文件INMCT:SPG=X;INFIP:FILE=XX;看光盘里的文件END;(4)若已登记则删文件INMCT:SPG=X;INFIR:FILE=XXXX;END;(5)看文件属性有否定义错:IOIFP;若错则改文件属性:IOIFC:FIEL=XX[,NSUB=XX,MAXSIZE=XX,MAXTIME=XX];文件操作IOFAT:FILE=icifile00-xxxx[,HEX];看文件内容INFCC:FILE=relcmdhdf,REMOVE=14800;INFUP:FILE=relcmdhdf/bsclsts;记下文件参数INFDP;看不同的SPG用的DEST有哪些INFDR:FILE=XXX,DEST=XX;删除(若有其他表指向他则不能直接删)INFUE:FILE=XX;在FPU表中删INFDI:FILE= relcmdhdf,DEST=colgdest,EQUIP=nolink,FILEID2=relcmdhdf,RULE2=1;重新定义文件INMCT:SPG=1;INFIP:FILE=relcmdhdf;END;INFSI:FILE=relcmdhdf-0000;五、其他告警1、SIZE ALTERATION OF DATA FILES SIZE CHANGE REQUIREDDBTSP:TAB=SAACTIONS;看哪个BLOCK要扩SAAEP:SAE=…,BLOCK=ALL;看该BLOCK用了多少要扩多少SASTP;看物理内存(PS,RS,DS)(会很慢)SAALI;可扩SIZE,并看到SAE和BLOCKSAAII:SAE=……,BLOCK=……,NI=……;手工扩SIZE(注:扩完当晚24:00要做DUMP to HD!)2、WITCHING PART CHARGING VIEWS OR LOGS CONGESTION (软件拥塞)SAAEP:SAE=……,BLOCK=ALL;检查按照上面的方法扩SIZE3、CCITT7 DISTURBANCE SUPERVISION LIMIT REACHEDC7DSP:ENUM=……;看C7DSR:ENUM=……;清告警4、BLOCKING SUPERVISION (常与DIP/SNT FAULT 跟随出,应先修DIP/SNT) STRSP:R=……;看路由状态有没有SEAL的STRDP:R=……,STATE=SEAL;看路由下每个设备的状态若有SEAL的则清告警,否则闭解若有LIBL的让对方闭解,若不成功:C7RAE:DEST=……;闭C7RAI:DEST=……;解再不成功则报障。