爱立信常见告警处理说明
- 格式:doc
- 大小:156.00 KB
- 文档页数:29
常见告警处理A1类告警CP FAULT一、告警产生原因:CP FAULT一般是位于CPS或MAU中的硬件故障。
当系统发现一个永久性故障或三个相同类型的暂时性故障或暂时性故障出现频率太高时,MAS 的软件就会产生CP FAULT的告警。
二、告警处理流程:具体告警处理和操作规程请参考B-MODULE ALEX相应的OPI。
以下为主要操作步骤:当CP FAULT告警出现时,首先察看CP的状态,若状态为<DPWSP;CP STATEMAU SB SBSTATENRM B WO为正常状态,此类的CP FAULT是A3或A2告警,则留到晚上低话务量时处理;其余均为不正常状态,必须马上根据OPI:CP FAULT的ACTIONS进行现场处理。
CP FAULT的诊断测试:<REPCI;诊断。
同时出现O1告警:SYSTEM STATE REPAIR OF CP OR MAU。
诊断结果有两种情况:(1).无怀疑板块列出。
<RECCI;检修,将告警消掉。
(2).有怀疑板块列出。
a. 错误类型为Permanent(永久性)。
根据提示选择最怀疑板块,准备现场更换。
b. 错误类型为Temporary(临时性)。
若所有的最怀疑板块在最近30天内都换过,则用:<DIRCP;<DIECP:INF=PAR;<DIRRP;收好报告,留待爱立信专家分析。
<REPCE;将诊断进程结束。
若尚有板块可以更换,则参照错误类型为Permanent进行。
在进行现场操作时,故障管理人员对CP的结构、性能和应急措施因相当的清楚, 以避免因操作不当,造成直接的经济损失。
在修理过程种,故障管理人员要仔细确认REPCI的诊断结果, MAG和PCB的准确名称和位置, 若选错MAG和PCB,不但RECCI不能修过, 且会引起A1的CP FAULT和一侧CP的单边。
<REMCI:MAG= ,PCB= ;此刻系统将所需换的板子隔离出来,我们根据提示,按顺序关电,换板,再开电。
爱立信 WCDMA 基站常见告警处理方法1. PDH Loss of Signal:PDH信令丢失告警Maj PDH Loss of Sign loss_of_signalSubrack=1,Slot=1,PlugInUnit=1,Cbu=1,ExchangeTerminal=1,E1PhysPathTerm=pp4告警原因:传输不通。
2. Plug-In Unit General Problem:配置错误告警Maj Plug-In Unit General Problem replaceable_unit_problem Subrack=1,Slot=2,PlugInUnit=1告警原因:对应槽位没有板子,或板子读取不到。
处理方法:拔插相应槽位的板子,如拔插无效,则需更换板子。
3. AuxPlugInUnit_PiuConnectionLost:辅助单元设备告警Maj AuxPlugInUnit_PiuConnectionLost equipment_malfunction AuxPlugInUnit=1告警原因:外部告警先没接。
影响:无处理方法:由于现在外部告警线不需要接,可闭掉AuxPlugInUnit=1 这个MO,以消除告警。
4. AuxPlugInUnit_LossOfMains:RRU电源告警Maj AuxPlugInUnit_LossOfMains commerical_power_failure SectorAntenna=1,AuxPlugInUnit=RRU-1 告警原因:RRU掉电影响:该小区将退服。
处理方法:到现场检查RRU电源。
5. Carrier_RejectSignalFromHardware:Carrier_SignalNotReceivedWithinTime:载频告警Maj Carrier_RejectSignalFromHardware message_not_expected Sector=1,Carrier=1Maj Carrier_RejectSignalFromHardware message_not_expected Sector=2,Carrier=1Maj Carrier_SignalNotReceivedWithinTime timeout_expired Sector=2,Carrier=1告警原因:RU或RRU故障。
爱立信BTS设备二级告警操作手册第一部分OMT(R31_5版本)的使用方法OMT查看BTS告警(处理一般故障及告警时使用)1:打开OMT软件,用串线将PC与BTS(DXU上的OMT接口)相连,点击左上方RBS2000下的Connect使PC通过软件与BTS连接。
2:点击Configuration下的Read IDB读取BTS数据(屏幕下方会有蓝色进度条,数据读取完后,框架图色会变亮)3:鼠标右键点击System下的框架图中央的RBS2000,选定Monitor点击鼠标左键,再点击弹出窗口的Statrt Monitor4:右边弹出的窗口显示的为当前BTS的告警代码OMT查看TRX告警监测SSI值(处理分集接收告警时使用)1:打开OMT软件,用串线将PC与BTS(DXU上的OMT接口)相连,点击左上方RBS2000下的Connect使PC通过软件与BTS连接。
2:点击Configuration下的Read IDB读取BTS数据(屏幕下方会有蓝色进度条,数据读取完后,框架图色会变亮)3:点击Object栏,在Object types下的Object里MO里选定要查看的TRX,鼠标右键点击右边框架里出现的相应的TRX,鼠标左键点击Monitor等待读取数据(屏幕下方会有蓝色进度条,数据读取完后,会弹出一个选择框)4:在弹出的选择框中选定Diversity Supervision Measurement点左键,在右边会弹出该TRX 的SSI(Signal Strength Imbanlance)值。
即每个TRU的接收分路RXA减去RXB,如为正值,表明B路接收分路存在问题,如为负值,表明A路接收分路存在问题。
SSI绝对值≤12为正常。
这样的测量每5分钟自动更新一次,只有在有话务的情况(即CRU值不为0)下得到的SSI 值才是有参考价值的数据。
OMT查看设备连线故障(处理连线故障告警时使用)1:打开OMT软件,用串线将PC与BTS(DXU上的OMT接口)相连,点击左上方RBS2000下的Connect使PC通过软件与BTS连接。
爱立信LTE无线告警现场处理手册日常故障处理方法(1)---Loss of Tracking➢告警解释:此告警是由于系统或者无线时钟失步导致,可能造成基站退服。
➢可能原因:(1)GPS硬件故障;(2)基站进程吊死;(3)DU硬件故障;TD-LTE采用GPS进行同步。
其硬件以及连接方式如下:➢处理步骤:检查GPS信号接收器上的工作状态灯状态。
(1)灯不亮1.检查GPS信号接收器和连接DU的RJ45网线,如有问题则进行更换。
2.检查DU上的GPS端口是否存在问题,如有问题则更换DU。
(2)绿灯常亮1.检查连接DU的RJ45网线,如有问题进行更换。
2.通知后台重启基站3.更换DU。
(3)绿灯闪1.按照上面GPS硬件连接图按照从DU到GPS天线的顺序检查各个接口是否有虚接、各线缆是否有破损、各个单元硬件是否存在问题,如有问题则进行重接或者更换。
2.通知后台重启基站3.更换DU。
(2)---Network Synch Time from GPS Missing➢告警解释:此告警是由于GPS信号丢失导致,可能导致基站退服。
➢可能原因:(1)GPS硬件故障;(2)基站进程吊死;(3)DU硬件故障;➢处理步骤:请参考“Loss of Tracking”告警的处理步骤。
(3)---System Clock Quality Degradation➢告警解释:此告警表示系统或者无线时钟进入了“free-running”模式,不能满足系统正常工作的需求。
该告警为伴生告警,其提示作用。
能够触发该告警的子告警为:●Network Synch Time from GPS Missing●Loss of Tracking●TU Synch Reference Loss of Signal➢可能原因:由于该告警为伴生告警,可能原因请参见其伴生的子告警。
➢处理步骤:由于该告警为伴生告警,处理步骤请参见其伴生的子告警。
(4)---Remote IP Address Unreachable➢告警解释:此告警表示远端IP地址不可达,多为到核心网的IP地址不可用。
绪论:BTS的故障是按故障的起因和重要性进行分类的:▪ 1A级:MO内的故障,它会影响MO的功能特性.▪ 1B级:MO外的故障,它也会影响MO的功能特性.▪ 2A级:MO内的故障,它不会影响MO的功能特性.BSC要接收以上的BTS故障报告,应采用下列措施:▪ 1A级: MO退出操作和测试.- 如果测试结果表明MO没有故障,那么MO将返回操作状态,并且其故障以间歇性故障处理.故障计数器将对间歇性故障进行累加,当发生间歇性故障的次数太高时,MO将会永久地退出工作状态.- 如果测试结果表明MO有故障,那么MO将永久地退出工作状态,直到故障停止或人工干涉才能恢复正常状态. 在BSC/OSS上将会产生一个A2告警.▪ 1B级: MO将永久地退出工作状态,直到故障停止或人工干涉才能恢复正常状态. 在BSC/OSS上将会产生一个A2告警.▪ 2A级:在BSC/OSS上将会产生一个A2或A3告示警. 但MO仍处于工作状态.应注意的是:CF或TRXC上的2A级故障在从属MO中却被认为是1级故障.总是在CF/TRXC上读取RU的故障映象来进行故障定位.但有时应紧记要替换的被检测到的故障单元,以便更换. BTS的故障信息可以从BSC上或站上OMT接口用人机命令MML来获得。
▪从BSC上获得:- 在MO中所有激活的告警: RXASP:MO=RXO…;- 在TG中所有激活的故障(1级): RXMFP:MO=RXOTG-x,FAULTY,SUBORD;- 在MO中所有激活的故障: RXMFP:MO=RXO…;- MO的故障记录: RXELP:MO=RXO…;▪从OMT上获得:- 在TG中所有激活的故障: ”System view(系统视图) / 选择 RBS 2000 / Operations操作(或按右键) /Monitor(监视)/ Fault status(故障状态)”- 某个RU的故障记录: ”Hardware view(硬件视图) /选择RU / Operations操作(或按右键) / Save log(保存记录)” (只有 DXU, TRU和ECU才有记录区).如果在CF/TRXC上产生RU单元的故障映象,其上的红灯将会发亮. 但这不一定就指此单元一定有故障,这也可能指此单元检测到其他单元有故障。
中国移动通信有限公司分公司 发布2007-6-30发布 2007-6-30实施 移动通信维护手册爱立信交换设备维护分册-故障处理版本号:1.0.0目录1 APZ部分: (1)1.1 故障描述:告警BACKUP INFORMATION FAULT (1)1.2 故障描述:告警SIZE ALTERATION OF DATA FILES SIZE CHANGE REQUIRED (1)1.3 故障描述:告警AUDIT FUNCTION THRESHOLD SUPERVISION (2)1.4 故障描述:告警CP FAULT (2)1.5 故障描述:告警SOFTWARE ERROR (3)1.6 故障描述:告警SYSTEM RESTART (3)2 APT部分: (3)2.1 故障描述:告警ANALYSIS DATA FAULT (3)2.2 故障描述:告警BLOCKING SUPERVISION (4)2.3 故障描述:告警CCITT7 DESTINATION INACCESSIBLE (5)2.4 故障描述:告警CCITT7 SIGNALLING LINK FAILURE (5)2.5 故障描述:告警CCITT7 LINK SET SUPERVISION (6)2.6 故障描述:告警DIGITAL PATH FAULT SUPERVISION (6)2.7 故障描述:告警DISTURBANCE SUPERVISION OF TRUNK ROUTES (7)2.8 故障描述:告警GROUP SWITCH FAULT (7)2.9 故障描述:告警SEMIPERMANENT CONNECTION FAULT (8)2.10 故障描述:告警SWITCHING NETWORK TERMINAL FAULT (9)2.11 故障描述:告警NM ROUTE LOAD STATE CHANGE (10)2.12 故障描述:告警RP FAULT (10)2.13 故障描述:告警SIGNALLING FAULT SUPERVISION (11)2.14 故障描述:告警SYNCHRONOUS DIGITAL PATH FAULT SUPERVISION (11)2.15 故障描述:告警NETWORK SYNCHRONIZATION FAULT (12)2.16 故障描述:告警EVENT REPORTING THRESHOLD REACHED,门限已达到80% (12)2.17 故障描述:告警M3UA DESTINATION INACCESSIBLE (12)3 IOG部分: (13)3.1 故障描述:告警ALI FAULT MAG PCB ADDINFO ALI-0 - NO CONTACT (13)3.2 故障描述:告警PORT BLOCKED (14)3.3 故障描述:告警PVC SET-UP FAILURE (14)3.4 故障描述:告警LINE UNIT BLOCKED (15)3.5 故障描述:告警SP NODE AUTOMATICALLY BLOCKED (16)3.6、故障描述:告警SP TRANSIENT FAULT SUPERVISION (16)4 APG部分 (17)4.1 故障描述:告警AP LOG STATISTICS (17)4.2 故障描述:告警AP ANTIVIRUS FUNCTION FAULT (17)4.3 故障描述:告警AP FAULT (18)4.3.1 MIRRORED DISKS NOT REDUNDANT:磁盘镜像有问题引起。
常见故障告警处理一. 硬件设备告警1、CP FAULTDPWSP;看CP状态。
REPCI;测试出错部件(排第一个是最可能出错的部件)。
REMCI:MAG=XX,PCB=XX;换板(可以再REMCI第二个部件)。
RECCI;测试并复位。
若修时出FC301说明交换机自己在修,此时CP状态为SE-FM(分离),无法人工修,只要等片刻就会发现CP状态变为UPDATING,再等就应该WORKING了。
2、RP FAULTEXRPP:RP=XX;看RP状态REPRI;测试出错部件(排第一个是最可能出错的部件)REMRI:RP=XX,PCB=XX;(也可以换第二个部件)RECRI;测试并复位闭解RP BLRPI/E:RP=XX;3、EMRP FAULT(emrp:Extension Module Regional Processor )REPEI:EMG=XX,EMRP=XX;REMEI:EMG=XX,MAG=XX,PCB=XX;RECEI:EMG=XX,PCB=XX;4、EM FAULTEXEMP:RP=X,EM=XX;看EM状态若无RPT时:REPRI:RP=XX,EM=XX;REMRI:RP=XX,EM=XX,PCB=XX;RECCI:RP=XX,EM=XX;若有RPT时:EXEMP:RP=XX,EM=XX;BLEMI:RP=XX,EM=XX,RPT=XX;BLEME:RP=XX,EM=XX,RPT=XX;若与TSM相关时:GSBLI: TSM=XX;进行(2)或(3)闭解EMGSBLE: TSM=XX;5、SWITCHING NETWORK TERMINAL FAULTNTSTP:SNT=XX;看SNT状态(常见FC38可闭解修好)NTCOP:SNT=XX;查DEV号对MSC:EXDRP:DEV=XX;查控制设备的RP号和EM号对BSC:RADAP:DEV=XX;查控制设备的RP号和EM号EXRPP:RP=XX;NTBLI:SNT=XX;闭NTTEI:SNT=XX;测NTBLE:SNT=XX;解若解不开,可试以下方法:EXEGP:EMG=XXXXX;查CICEXCLP:EQM=CLC-9;查对应的DEV,记下相关数据BLCLI:EQM=XX;闭CICEXCLE:EQM=XX;拆数据NTBLI:SNT=XX;闭NTBLE:SNT=XX;解EXCLI:EQM=XX,SPEED=XX,DEV=XX;重新定义原来的数据BLCLE:EQM=XX;解CIC6、GROUP SWITCH FAULT(TSM FAULT)(或GROUP SWITCH RESTRICTIONS)GSSTP:CLM/SPM/TSM=ALL;找出错部位(或用GSREP;列出故障的设备)。
CF 2A 33:RX分级接受丢失产生条件为:基站的一个或若干载频的2路接收信号A、B的强度相差至少为12dB(即≥12 dB),并且持续50分钟以上,基站就会产生分集接收告警。
产生分集接收告警的TRU的接收机灵敏度会因此降低大约3.5dB。
处理方法:此故障对DXU进行复位,BS FAULT会消除,但没有真正解决问题,不久后会再出现此故障。
这可能是小区间天线调乱,需对天线进行对线处理,把天线调整好。
这也可能是HL-out和HL-in之间的连线有问题。
如果CDU为D型,可能是DU的故障,可用万用表测量其上的接收输入口的电压,正常为5~6V之间,若不对,更换DU。
在移动通信的无线环境中,信号衰落将会产生严重问题,分集接收技术通过在若干支路上接收相关性很小的载有同一消息的信号,从而可在接收端大大降低信号衰弱的影响。
频率分集是一种典型的分集技术,当一个基站的某个扇区使用2个或2个以上的频率工作时,就能得到较好的分集效果,但这时分发现有三阶交调干扰问题,这需要在网络规划中仔细地分配频率资源。
另一种是使用(无源)接收分集技术,因为是无源的,所以不会产生任何干扰,同时设备也较为简单,所以被广泛地应用。
最常用的分集接收技术有空间分集和极化分集两种。
当然在使用分集接收时,还必须考虑如何合成分集接收到的两个信号,合适的合成技术会产生较好的结果。
1 空间分集接收技术M S C BSC移动通信论坛通信工程师的首选技术论坛*u*e`4G~采用空间分集接收的基站,在每一个扇需放置二面单极化(垂直极化)天线。
如果一个基站是分成三个扇区,则一个基站需6面天线。
需要据天线的架设高度来确定两面天线的最佳水平间距,以使两天线接收到的信号相关性最小。
w A D{v-2 极化分集接收技术/d)h w W%N9_P如果用两个极化方向相互垂直的天线来实现分集接收,就称为极化分集技术。
通常是将这两付天线制作在一起,从外表上看像一面天线,故称为双极化天线。
爱立信LTE无线专业常见告警目录Heartbeat Failure (2)ServiceUnavailable (2)ServiceDegraded (2)Gigabit Ethernet Link Fault (3)Remote IP Address Unreachable (3)Loss of Tracking (4)Network Synch Time from GPS Missing (6)System Clock Quality Degradation (6)PowerFailure (6)LinkFailure (7)LinkStability (7)VswrOverThreshold (8)CalibrationFailure (8)Plug-In Unit HW Failure (9)Plug-In Unit General Problem (9)GeneralHwError (10)HwFault (10)GeneralSwError (10)License Key File Fault (11)LicenseKeyMissing (11)Heartbeat Failure(基站退服或断站) 告警解释:此告警表示基站心跳告警,即基站脱管。
可能原因:(1)DU掉电(2)传输故障(3)DU故障(4)OSS原因(网管)处理步骤:(1)检查电源状态。
(2)检查DU电源接头是否松动,如有松动重做接头。
(3)检查基站传输连接,如有虚接或者尾纤破损则进行重接或者更换。
(4)通知传输检查传输状态。
(5)DU下电重启.(6)更换DU。
(7)配置原因,检查数据原因,回落到割接之前的地址,更换IP ServiceUnavailable告警解释:此告警表示小区服务质量不可用,即小区退服。
该告警为伴生告警,其提示作用。
能够触发该告警的常见子告警为:●PowerFailure(电源故障)●LinkFailure(光路告警)●HwFault(RRU硬件故障)●TemperatureExceptionalTakenOutOfService(RRU高温告警)可能原因:由于该告警为伴生告警,可能原因请参见其伴生的子告警。
爱立信LTE告警说明Alarm_JSCMCC告警标题厂家告警级别告警解释Loss of Tracking1这个是一个主告警,和Synchronization· MO相关。
当TU系统的时钟进入失步状态,出现此告警,同时syncRefStatus 变为LOSS_OF_TRACKINGNetwork Synch Time from GP1当TU没接收到1PPS或者接收到大量GPS的信息时产生System Clock Quality Degra1系统时钟失准Remote IP Address Unreacha1远端IP地址不可达License Key File Fault2安装的许可秘钥文件不可用Inter-PIU Link Fault4Inter-PIU的连接电缆缺失,有问题或者没有正确连接TU Hardware Fault2时钟模块硬件故障Slave TU Out of Synchroniz4副时钟模块失步LinkFailure1告警原因有可能是工程阶段某些站点安装调测未完成导致的。
也有可能是光纤/光模块或者DU/RU的硬件端口故障HwFault 1硬件故障VswrOverThreshold3回路损耗减少导致低于驻波比门限值,问题通常发生在天线单元GeneralHwError3一般性硬件单元故障Gigabit Ethernet Link Faul1千兆以太网传输上的没有速率,或者一直以极低速率传输PowerFailure1电源故障ServiceDegraded232ServiceUnavailable 1由于S1链路中断导致小区服务不可用而出现该告警,这种情况下可能没有其他相关主告警,但Serviceunavailable 告警内容会列明告警原因为S1中断;? 由硬件故障等其他故障引起的小区服务不可用,有其他相关主告警,本告警为伴随告警。
主要告警包括:HwFault, PowerFailure, LinkFailure,InconsitentConfiguration,ResourceConfigurationFailure,NoC ontact, GeneralSwError 和TemperatureExceptionalTakenOutOfService.CalibrationFailure4由于外界信号的突发干扰,导致校准信号异常,也有可能是内部干扰导致Heartbeat Failure1硬件错误预警Plug-In Unit HW Failure4插入单元硬件错误Plug-In Unit General Probl4当所有可恢复的操作已经在PIU上操作过,当PIU至少缺失5分钟以上产生Disk Volume C Full4如果Main Processor(主处理器MP)的C卷上存储的数据过多,会导致该卷的可用空间耗尽或几乎耗尽,此时系统会发出Disk Volume C Full 告警Disk Volume D Full 4如果Main Processor(主处理器MP)的D卷上存储的数据过多,会导致该卷的可用空间耗尽或几乎耗尽,此时系统会发出Disk Volume D Full告警FanFailure3风扇故障loss of synch reference re3此告警是次生告警,是由MOSynchronization发出。
基站常见故障处理CF EC10(Main fail (External Power Source Fail)):外部电源故障处理步骤:1.检查出现故障小区的PSU是否工作正常:检查指示灯是否正常;2.检查电源链路,包括电缆、熔丝空开等;3.检查IDB中配置的电源系统是否和实际使用的电源系统一致;4.检查交流电源是否连接正确;5.更换PSU。
HW and IDB inconsistency(硬件和IDB数据不一致):处理步骤:1.检查硬件的频段、配置数量是否和IDB的配置数据相一致。
2.如发现数据不同,需要重新传建IDB或者在IDB中进行修改。
Climate sensor fault, System voltage sensor fault,A/D converter fault告警处理步骤:1.检查出现告警小区的PSU、ECU是否工作正常。
2.如PSU出现问题,则更换。
(参照例三)3.如ECU出现问题,则更换。
4.将出现告警的ECU电源关闭,更换ECU。
5.更换后,将其电源开启。
TRX 1A/13 (RF loop test fault): RF 环路测试故障处理步骤:1,检查TX电缆与TRU是否正确连接。
2,对TRU进行复位或者断电后重新加电,看是否能够恢复。
3,讲该载频进行退出/进入服务的操作,或者将该载频对应的TG退服后重新进入,看是否可以恢复。
4,若经过上述操作后,故障仍然存在,或者以后再次出现,建议更换该TRU。
TRX 1A/21 (Internal configuration failed): 内部配置失败处理步骤:1,检查CDU电源是否正常。
2,检查IDB中CDU配置是否正确。
3,检查TRU是否安装正确,与Y-link线连接是否正确。
4,检查IDB中TRU配置是否正确。
5,检查CDU-BUS线包括背板连线。
6,将CDU进行断电/加电操作。
7,重启DXU,CDU,TRU。
8,更换TRU。
基站告警处理告警:Maj OpticalInterfaceLink_OpticalInterfaceLinkFailure equipment_malfunction OpticalInterfaceLink=1-UL处理办法:●检查rru是否安装,是否加电●检查RRU到MU之间光缆是否正常告警:Maj FcuDeviceGroup_NumberOfHwEntitiesMismatch configuration_or_customizing_error AuxPlugInUnit=2,FcuDeviceGroup=1处理办法:●检查FCU连接线是否连好●重启RBS告警:Maj PDH Loss of Signal loss_of_signal Subrack=1,Slot=1,PlugInUnit=1,Cbu=1,ExchangeTerminal=1,E1PhysPathTerm=pp1处理办法:●2M传输不好,PP1表示第一个2E1传输不好,检查传输。
告警:Crit License Key File Fault configuration_or_customizing_error Licensing=1处理办法:●为基站加载licenseMaj AuxPlugInUnit_LossOfMains commerical_power_failure SectorAntenna=1,AuxPlugInUnit=RRU-1处理办法:●检查RRU供电情况;●检查RRU与MU之间的光缆是否正常●查看RRU是否正常,不正常更换RRU告警:Maj AuxPlugInUnit_PiuConnectionLost equipment_malfunction AuxPlugInUnit=1处理办法:●现外部告警均未接,所以锁定相关告警MO(Equipment---- External Alarm—AuxPlugInUnit=1).告警:Maj Plug-In Unit General Problem replaceable_unit_problem Subrack=1,Slot=8,PlugInUnit=1Min DownlinkBaseBandPool_DlHwLessThanDlCapacity configuration_or_customizing_error Subrack=1,DownlinkBaseBandPool=1Min UplinkBaseBandPool_UlHwLessThanUlCapacity configuration_or_customizing_error Subrack=1,UplinkBaseBandPool=1处理办法:●Moshell里登陆到该站,ST PLUG命令,查看单板状态,若第8块板Disable,锁住第8块板,解锁第8块板,查看故障是否消除;不消除择需带上备板上站处理,首先热插拔下第8块板,故障不消除就更换第8块板。
常见告警处理A1类告警CP FAUL T一、告警产生原因:CP FAULT一般是位于CPS或MAU中的硬件故障。
当系统发现一个永久性故障或三个相同类型的暂时性故障或暂时性故障出现频率太高时,MAS 的软件就会产生CP FAULT的告警。
二、告警处理流程:具体告警处理和操作规程请参考B-MODULE ALEX相应的OPI。
以下为主要操作步骤:当CP FAULT告警出现时,首先察看CP的状态,若状态为<DPWSP;CP STATEMAU SB SBSTATENRM B WO为正常状态,此类的CP FAULT是A3或A2告警,则留到晚上低话务量时处理;其余均为不正常状态,必须马上根据OPI:CP FAULT的ACTIONS进行现场处理。
CP FAULT的诊断测试:<REPCI;诊断。
同时出现O1告警:SYSTEM STATE REPAIR OF CP OR MAU。
诊断结果有两种情况:(1).无怀疑板块列出。
<RECCI;检修,将告警消掉。
(2).有怀疑板块列出。
a. 错误类型为Permanent(永久性)。
根据提示选择最怀疑板块,准备现场更换。
b. 错误类型为Temporary(临时性)。
若所有的最怀疑板块在最近30天内都换过,则用:<DIRCP;<DIECP:INF=PAR;<DIRRP;收好报告,留待爱立信专家分析。
<REPCE;将诊断进程结束。
若尚有板块可以更换,则参照错误类型为Permanent进行。
在进行现场操作时,故障管理人员对CP的结构、性能和应急措施因相当的清楚, 以避免因操作不当,造成直接的经济损失。
在修理过程种,故障管理人员要仔细确认REPCI的诊断结果, MAG和PCB的准确名称和位置, 若选错MAG和PCB,不但RECCI不能修过, 且会引起A1的CP FAULT和一侧CP的单边。
<REMCI:MAG= ,PCB= ;此刻系统将所需换的板子隔离出来,我们根据提示,按顺序关电,换板,再开电。
<RECCI;检修。
成功,则CP FAULT告警消失,O1告警消失,CP状态恢复正常。
若不成功,则CP FAULT告警仍在,O1告警仍在。
此时最好再次进行诊断。
注意,在再次诊断之前,只要有O1告警在,就须先将上次诊断进程结束:<REPCE;O1告警消失。
<REPCI;再次诊断。
<REMCI:MAG= ,PCB= ;选择最怀疑板块关电换板。
<RECCI;检修。
成功,OK。
不成功,则重复上述四步。
BLOCKING SUPERVISION一、告警产生原因:中继闭塞监测告警,通过指令设置告警门限:〈BLURC:R=,ACL=,LVB=;如路由中NBLO(DEV闭塞数)大于告警门限值便会发生此告警。
二、告警处理流程:1.STRSP:R=r;2.STRDP:R=,STATE=BLOC;显示闭塞的DEV3.EXDEP:DEV=dev; 显示dev对应的SNT,从而找出对应的DIP4.DTSTP:DIP=;NTSTP:SNT=;检查DIP、SNT状态。
5.若DIP状态为ABL,说明传输中断,报传输人员处理CCITT7 SIGNALLING LINK FAILURE一、告警产生原因:信令被激活状态下无法正常服务或信令出错后无法恢复正常二、告警处理流程:1.查看信令链路状态:C7LTP:LS= ;2.将故障SLC进行闭解:C7LAE:LS= ,SLC= ;C7LAI:LS= ,SLC= ;3.若闭解无效则查看信令链路数据:C7LDP:LS= ;EXDEP:DEV= ;查看SNTNTCOP:SNT= ;找到DIPDTSTP:DIP= ;看DIP状态若DIP为ABL则报传输处理,若DIP为WO,EXSCP:NAME= ;看信令所在半永久状态,若状态为ACT则联系对端局闭解或删定信令链路,若状态不为ACT则删定半永久连接,具体操作见“SEMIPERMANENT CONNECTION FAUL T”如进行以上操作后,告警仍没有清除,报故障管理人员CCITT7 DESTINA TION INACCESSIBLE一、告警产生原因:信令网中的某个信令点无法被访问,即信令点不可及告警。
如某一SP瘫掉,或到某一SP的LINK全部中断,没有迂回信令路由的情况,产生此告警。
该告警一般会伴随“CCITT7 SIGNALLING LINK FAILURE”出现二、告警处理流程:<C7RSP:DEST= ;查看到该DEST信令路由情况C7LTP:LS= ;以下同处理“CCITT7 SIGNALLING LINK FAILURE”告警步骤CCITT7 LINK SET SUPERVISION一、告警产生原因:两个交换局之间有多条信令链路,通过指令设置告警门限:<C7SUC:LS= ,LVA= ,ACL= ,DMI= ;若被闭掉的链路数大于告警门限便会发生此告警。
二、告警处理流程:1.去、激活告警的信令链路:<C7LAE:LS= ,SLC= ;<C7LAI:LS= ,SLC= ;2.根据告警内容,判断是否由传输故障引起:C7LDP:LS=ls; 查信令的一些参数EXDEP:DEV=dev; DEV对应的SNTNTCOP:SNT=snt; SNT对应的DIPDTSTP:DIP=dip; 传输是否中断DTQUP:DIP=dip; 传输是否误码NETWORK SYNCHRONIZATION FAUL T一、告警产生原因:网络同步采用主从方式,外部时钟是通过话务数字链路接入到ETC板,由ETC板识别出帧同步信息,产生一个8KHZ的信号分别接入三个时钟模块(CLM),经锁相环调整,输出三个互不相干的时钟信号到接收模块(TSS、SPM),由接收模块择优选用。
交换机自身有一个时钟模块,为参考时钟模块(RCM),参考时钟模块是由晶体振荡源组成的时钟,主要用于交换机的备用时钟源,CLM-1 和CLM-2相位锁定为CLM-0(MASTER),当CLM-0输出值较大时,CLM-1、CLM-2跟随CLM-0导致输出值偏差较大,导致NETWORK SYNCHRONIZATION FAULT。
日常维护中必须对交换机的CLM进行检查、调整,保证其工作在正常值2048+-200范围内。
二、告警处理流程:NSSTP;查看CLOCK-REFERENRE 状态。
NSDAP; 查看网同步时钟数据GSCVP; 查看CLM的值NSBLI;闭掉NSTEI;测试NSBLE;解闭如测试不通过,需由故障管理人员根据相关告警信息进行处理。
测试正常解闭后该时钟参考源会处于UPD状态,此过程约需12小时。
EXTERNAL ALARM一、告警产生原因:交换机某些重要的辅助设备,如:电源、风扇,以及基站的天线等发生故障时,在交换机上产生相应的外部告警。
二、告警处理流程:具体告警处理和操作规程请参考B-MODULE ALEX相应的OPI。
以下为主要操作步骤:1.若出现的外部告警为电源告警,则应立即通知相关人员到达现场检查电源设备;2.若为其他外部告警:(1)则用ALRDP:DEV=ALEX2—;查询外部告警相关参数;(2)闭解外部告警:BLEAI:DEV=ALEX2—;BLEAE:DEV=ALEX2—;(3)若闭解后告警重新出现,则要通知相关人员到达现场处理硬件故障。
SP UNIT FAUL T一、告警产生原因:SP(支持处理)单元发生故障。
二、告警处理流程:具体告警处理和操作规程请参考B-MODULE ALEX相应的OPI。
以下为主要操作步骤:因主要涉及硬件修理,故由故障管理人员操作。
1.查看两个NODE(NODE A和NODE B)的状态:IMLCT:SPG=0;(假设SPG=0发生故障)IMCSP;END;2.如果出错的是执行侧(EX),则进行测试:RESUI:SPG=0,NODE= ;3.若测试通过则将其解开:BLSNE:SPG=0,NODE= ;4.若出错的为备用侧(SB),则将其闭掉:BLSNI:SPG=0,NODE= ;显示检测报告:DISFP:SPG=0,NODE= ;若未有错误单元列出则执行2、3步骤,若有错误单元列出则:RESUP:SPG=0,NODE= ;找出错误单元进行硬件修理,修理成功后执行步骤3。
FILE PROCESS UTILITY AUTOMATIC TRANSFER FAILURE 一、告警产生原因:具有FPU功能的文件自动传送失败。
二、告警处理流程:ALLIP;根据告警内容确认是什么文件出现告警。
IMLCT: SPG=X; (0 或 1)ILLUP;ILNPP (: PORT=ALL);END;相应的端口是否ABL, 若ABL进行闭解:IMLCT: SPG=X; (0 或 1)ILBLI: PORT=X-X-X-X;/ ILBLI: NP=X-X-X-X;ILBLE: PORT=X-X-X-X;/ ILBLE: NP=X-X-X-X;ILNPP (: PORT=ALL);若端口状态仍为ABL,确认硬件损坏,需要更换硬件处理.若端口状态WO,表示端口状态正常,则进行人工传送文件:INFUP: FILE=XXX;INFSP: FILE=XXX, DEST=YYY;INFTI: FILE=XXX-AAA, DEST=YYY;INFSP: FILE=XXX, DEST=YYY;SWITCHING NETWORK TERMINAL FAUL T一、告警产生原因:1.SNT和GROUP SWITCH之间接口错误被检测到;2.SNT的外部硬件设备或SNT和外部设备间的接口错误被检测到;3.SNT单元硬件板子被检测到错误。
二、告警处理流程:1.闭掉相应SNT:NTBLI:SNT= ;2.测试SNT,找出故障原因:NTTEI:SNT= ;3.若有被怀疑硬件列出,交故障管理人员处理,更换硬件后继续测试SNT。
若测试通过则解闭SNT:NTBLE:SNT= ;告警清除。
GROUP SWITCH FAUL T一、告警产生原因:GROUP SWITCH被检测到有错误。
二、告警处理流程:1.检查故障单元状态。
有3种设备类型:Clock Module (CLM) 、Space Switch Module (SPM) 、Time Switch Module (TSM) 。
2.TSM故障的处理步骤:1)查看所有TSM状态 GSSTP: TSM= ;2)闭掉有故障的单元GSBLI:TSM= ;3)测试该TSM GSTEI:TSM= ;4)若测试结果有错误单元列出则更换硬件,若无则解开TSM:GSBLE:TSM= ;若测试结果为硬件故障,交故障管理人员更换硬件处理。