爱立信LTE告警
- 格式:docx
- 大小:22.55 KB
- 文档页数:5
爱立信 WCDMA 基站常见告警处理方法1. PDH Loss of Signal:PDH信令丢失告警Maj PDH Loss of Sign loss_of_signalSubrack=1,Slot=1,PlugInUnit=1,Cbu=1,ExchangeTerminal=1,E1PhysPathTerm=pp4告警原因:传输不通。
2. Plug-In Unit General Problem:配置错误告警Maj Plug-In Unit General Problem replaceable_unit_problem Subrack=1,Slot=2,PlugInUnit=1告警原因:对应槽位没有板子,或板子读取不到。
处理方法:拔插相应槽位的板子,如拔插无效,则需更换板子。
3. AuxPlugInUnit_PiuConnectionLost:辅助单元设备告警Maj AuxPlugInUnit_PiuConnectionLost equipment_malfunction AuxPlugInUnit=1告警原因:外部告警先没接。
影响:无处理方法:由于现在外部告警线不需要接,可闭掉AuxPlugInUnit=1 这个MO,以消除告警。
4. AuxPlugInUnit_LossOfMains:RRU电源告警Maj AuxPlugInUnit_LossOfMains commerical_power_failure SectorAntenna=1,AuxPlugInUnit=RRU-1 告警原因:RRU掉电影响:该小区将退服。
处理方法:到现场检查RRU电源。
5. Carrier_RejectSignalFromHardware:Carrier_SignalNotReceivedWithinTime:载频告警Maj Carrier_RejectSignalFromHardware message_not_expected Sector=1,Carrier=1Maj Carrier_RejectSignalFromHardware message_not_expected Sector=2,Carrier=1Maj Carrier_SignalNotReceivedWithinTime timeout_expired Sector=2,Carrier=1告警原因:RU或RRU故障。
爱立信设备告警处理爱立信设备告警远程处理手册前言本汇编共包括两个部分。
第一部分是对爱立信设备发生较频繁的、等级较高的51种告警进行了原因分析,并对这些告警的远程处理步骤做了说明。
第二部分是省监控中心成立以来,监控人员在对重大故障处理过程中总结出的维护经验的汇总。
目录第一部分告警分析 (7)一、可以远程初步处理的告警 (7)§1、A1类告警 (7)§1.1 FILE PROCESS UTILITY AUTOMATIC TRANSFER FAILURE (7)§1.2 SWITCHING NETWORK TERMINAL FAULT (8)§1.3 CCITT7 SIGNALLING LINK FAILURE (8)§1.4 GROUP SWITCH FAULT (9)§1.5 DIGITAL PATH QUALITY SUPERVISION (10)DIGITAL PATH UNAVAILABLE STATE FAULT (10)§1.6 SYNCHRONOUS DIGITAL PATH QUALITY SUPERVISION (10)SYNCHRONOUS DIGITAL PATH F AULT(ET155硬件) (10)§1.7 RP INTERCOMMUNICATION GROUP FAULT (11)§1.8RADIO TRANSMISSION GB INTERFACE FAULT (11)§1.9 NM ROUTE ASR SUPERVISION (12)§2、A2类告警 (12)§2.1 INFINITE FILE END WARNING (12)§2.2 VOLUME LIMIT EXCEEDED (13)§2.3 LINE UNIT BLOCKED (14)§2.4 SIZE ALTERATION OF DATA FILES SIZE CHANGE REQUIRED (14)§2.5 RP FAULT (15)§2.6 EM FAULT (15)§2.7 BACKUP INFORMATION FAULT (16)§2.8 SOFTWARE ERROR (16)§2.9 APPLICATION DET ECTED SOFTWARE ERROR (17)§2.10 PVC SET-UP FAILURE (17)§2.11 AUDIT FUNCTION THRESHOLD SUPERVISION (18)§3、A3类告警 (18)§3.1 CCITT7 DISTURBANCE SUPERVISION LIMIT REACHED (18)§3.2 DISTURBANCE SUPERVISION OF TRUNK ROUTES (19)§3.3 HLR AUTHENTICATION DATA REQU EST FAULT (19)§3.4 MT FAILED AUTHENTICATION (20)§3.5 SEIZURE QUALITY SUPERVISION (20)§3.6 SIGNALLING FAULT SUPERVISION (20)§3.7 ALI FAULT (21)二、无法远程处理的告警 (21)§1、A1类告警 (21)§1.1 CP FAULT (21)§1.2 BLOCKING SUPERVISION (24)§1.3 CCITT7 DESTINATION INAC CESSIBLE (24)§1.4 CCITT7 LINK SET SUPERVISION (24)§1.5 NETWORK SYNCHRONIZATION FAULT (25)§1.6 EXTERNAL ALARM (26)§1.7 CELL LOGICAL CHANNELS SEIZURE SUPERVISION (26)§1.8 CELL LOGICAL CHANNEL AVAILABILITY SUPERVISION (27)§1.9 SP UNIT FAULT (28)§1.10 COMMON CHARGING OUTPUT ERROR (29)§1.11 RADIO TRANSMISSION TRANSCODER POOL IDLE LEVEL SUPERVISION (31)§1.12 NM ROUTE LOAD STATE CHANGE (32)§1.13 SP TRANSIENT FAULT SUPERVISION (33)§1.14 EMG CONTROL DOWN (33)§2、A2类告警 (34)§2.1 SEMIPERMANENT CONNECTION F AULT (34)§2.2 PORT BLOCKED (35)§2.3 BLOCKING SUPERVISION OF DEVICE (36)§2.4 COMMAND LOG BLOCKED (36)§2.5 RADIO INTERFACE LAPD CONCENTRATOR PROCESSOR OVERLOAD SUPERVISION (37)§2.6 STATISTIC DATA COUNTER COLLECTION TIME LIMIT SUPERVISION (37)§2.7 HLR S UBSCRIBERS WITH INCOMPATIBLE DATA SUPERVISION (38)§3、O1类告警 (38)§3.1 ROUTE RESTRICTION ACTIVATED (38)第二部分部分SUPERVISION告警级别定义标准 (39)第一部分告警分析一、可以远程初步处理的告警§1、A1类告警§1.1 FILE PROCESS UTILITY AUTOMATIC TRANSFER FAILURE一、告警产生原因:具有FPU功能的文件自动传送失败。
基站常见故障处理CF EC10(Main fail (External Power Source Fail)):外部电源故障处理步骤:1.检查出现故障小区的PSU是否工作正常:检查指示灯是否正常;2.检查电源链路,包括电缆、熔丝空开等;3.检查IDB中配置的电源系统是否和实际使用的电源系统一致;4.检查交流电源是否连接正确;5.更换PSU。
HW and IDB inconsistency(硬件和IDB数据不一致):处理步骤:1.检查硬件的频段、配置数量是否和IDB的配置数据相一致。
2.如发现数据不同,需要重新传建IDB或者在IDB中进行修改。
Climate sensor fault, System voltage sensor fault,A/D converter fault告警处理步骤:1.检查出现告警小区的PSU、ECU是否工作正常。
2.如PSU出现问题,则更换。
(参照例三)3.如ECU出现问题,则更换。
4.将出现告警的ECU电源关闭,更换ECU。
5.更换后,将其电源开启。
TRX 1A/13 (RF loop test fault): RF 环路测试故障处理步骤:1,检查TX电缆与TRU是否正确连接。
2,对TRU进行复位或者断电后重新加电,看是否能够恢复。
3,讲该载频进行退出/进入服务的操作,或者将该载频对应的TG退服后重新进入,看是否可以恢复。
4,若经过上述操作后,故障仍然存在,或者以后再次出现,建议更换该TRU。
TRX 1A/21 (Internal configuration failed): 内部配置失败处理步骤:1,检查CDU电源是否正常。
2,检查IDB中CDU配置是否正确。
3,检查TRU是否安装正确,与Y-link线连接是否正确。
4,检查IDB中TRU配置是否正确。
5,检查CDU-BUS线包括背板连线。
6,将CDU进行断电/加电操作。
7,重启DXU,CDU,TRU。
8,更换TRU。
爱立信L TE网管基本功能介绍1.告警处理1.查看站点状态使用OSS Common Explorer(OCE)查看站点状态打开OCE打开OCE后右上角第一个按钮“Open Perspective”可以切换两种界面:Network Status:可以查看全网小区状态、指定站点的告警状态。
Network Configuration:可以查看全网站点的连接状态、同步状态、是否AI开站等信息。
1.查看全网小区状态在Network Status界面下,Status的标签页下,ECell标签可以看到全网小区状态:ERBS标签可以看到站点名称及其对应的eNB ID、IP地址等。
2.查看指定站点的告警状态在Network Status界面下,Alarm的标签页下,可以看到指定站点的告警。
选中某一行告警,下面的区域可以显示告警的详细信息。
2.告警查询1.查看全网告警打开Alarm List Viewer(ALV)找到LTE网络,右键View Alarms会看到所有站点当前的告警信息。
Alarm Viewer右上角已用颜色区分不同等级的告警及数目:1个Critical告警2个Major告警1个Minor告警0个Warning告警0个Indeterminate告警427个Cleared告警(表示已经清除的告警)2.导出实时告警如果需要统计Alarm成表格,可以采取以下方法。
下图是所有告警先把已经Clear的Alarm屏蔽(点击),会出现如下图只剩当前活动的告警:【注意】当前Cleared告警已经设置为系统自动确认,因此不会再出现在该界面。
选中上图中所有告警,然后如下图右键选择Save Alarm,保存成文件:出现如下界面,把需要保存的Alarm文件名字填写好,点击OK,alarm_20130122.log就保存在当前用户目录路径下边,我们可以通过FTP到此路径下载文件。
下载完alarm_20130122.log,打开后可以全选复制到Excel进行分列等整理,就能得到当前的告警表格。
基站常见故障处理CF EC10(Main fail (External Power Source Fail)):外部电源故障处理步骤:1.检查出现故障小区的PSU是否工作正常:检查指示灯是否正常;2.检查电源链路,包括电缆、熔丝空开等;3.检查IDB中配置的电源系统是否和实际使用的电源系统一致;4.检查交流电源是否连接正确;5.更换PSU。
HW and IDB inconsistency(硬件和IDB数据不一致):处理步骤:1.检查硬件的频段、配置数量是否和IDB的配置数据相一致。
2.如发现数据不同,需要重新传建IDB或者在IDB中进行修改。
Climate sensor fault, System voltage sensor fault,A/D converter fault告警处理步骤:1.检查出现告警小区的PSU、ECU是否工作正常。
2.如PSU出现问题,则更换。
(参照例三)3.如ECU出现问题,则更换。
4.将出现告警的ECU电源关闭,更换ECU。
5.更换后,将其电源开启。
TRX 1A/13 (RF loop test fault): RF 环路测试故障处理步骤:1,检查TX电缆与TRU是否正确连接。
2,对TRU进行复位或者断电后重新加电,看是否能够恢复。
3,讲该载频进行退出/进入服务的操作,或者将该载频对应的TG退服后重新进入,看是否可以恢复。
4,若经过上述操作后,故障仍然存在,或者以后再次出现,建议更换该TRU。
TRX 1A/21 (Internal configuration failed): 内部配置失败处理步骤:1,检查CDU电源是否正常。
2,检查IDB中CDU配置是否正确。
3,检查TRU是否安装正确,与Y-link线连接是否正确。
4,检查IDB中TRU配置是否正确。
5,检查CDU-BUS线包括背板连线。
6,将CDU进行断电/加电操作。
7,重启DXU,CDU,TRU。
8,更换TRU。
Auto-Configuration of Board Not Possible 无法自动识别板件Automatic CV Creation Failed 自动创建CV失败BatteryBackupTimeTooShort 报警表明电池的容量是不够的,应更换电池,以满足所需时间BatteryMissing 由于电源损坏或者电缆不通而产生BatteryVoltageTooLowMainLoadDisconnected 低电压至主控单元失效BatteryVoltageTooLowPrioLoadDisconnected 低电压至电池单元失效Board Overheated 板件过热CalibrationFailure 由于外界信号的突发干扰,导致校准信号异常,也有可能是内部干扰导致CircuitBreakerTripped 断路器跳闸Clock Calibration Expiry Soon 由于同步问题时钟校准即将失效Configuration Version Corrupt CV损坏Contact to Default Router 0 Lost 失去与默认路由0的连接Contact to Default Router 1 Lost 失去与默认路由1的连接Contact to Default Router 2 Lost 失去与默认路由2的连接Credentials Enrollment Fault 证书登入错误Credentials Validity Fault 证书即将在7天内过期CurrentTooHigh 电流过高Disconnected 各个硬件如果失去连接即产生此告警Disk Volume C Full 如果Main Processor(主处理器MP)的C卷上存储的数据过多,会导致该卷的可用空间耗尽或几乎耗尽,此时系统会发出Disk Volume C Full告警Disk Volume D Full 如果Main Processor(主处理器MP)的D卷上存储的数据过多,会导致该卷的可用空间耗尽或几乎耗尽,此时系统会发出Disk Volume D Full告警Duplicate IP Address Fault 重复IP地址冲突Emergency Unlock of Software Licensing 当激活紧急状态时,会产生这个alarm EnclosureDoorOpen 外部门开启EnclosureProductDataMismatch 外部产品的信息空缺或者不匹配EnclosureSmoke 检测到机柜里有烟雾EnclosureSmokeDetectorFailure 外部烟雾感应器实效ET IP Hardware Fault 以太网传输硬件故障ExternalAlarm 超过系统对外部设备监控的极限或者外部设备有问题ExternalLinkFailure 至少一个邻区的X2链接断开FanFailure 风扇故障FeatureResourceMissing 特性相关资源丢失,一般由于license缺失FeatureResourceMissing 特性相关资源丢失,一般由于license缺失FeatureResourceMissing 特性相关资源丢失,一般由于license缺失File System Diagnostic Error 文件系统诊断错误GeneralHwError 一般性硬件单元故障GeneralSwError 一般性软件故障GeneralSwError 一般性软件故障Gigabit Ethernet Link Fault 千兆以太网传输上的没有速率,或者一直以极低速率传输Gigabit Ethernet Link Redundancy Fault 两个千兆以太网连接冗余设备中的一个故障GpsConnectivityDownstreamFault GPS下游连接故障GpsHardwareFault 在GPS和XMU之间的通信出现问题,可能由于电缆断了,电缆无法连接,或硬件问题Hardware Failure Imminent 硬件错误预警HighOperatingTemperatureMainLoadDisconnected 高温至主控单元失效HwFault 硬件故障IKE Peer Not Reachable IKE对端无反馈或者鉴权失败,或者没有协议选择InconsistentConfiguration 配置不一致InconsistentConfiguration 配置不一致InsufficientBatteryCharging 10天内电池一直充电不满Inter-PIU Link Fault Inter-PIU的连接电缆缺失,有问题或者没有正确连接Invalid Ethernet Optical Module 以太网光纤模块不可用或者未安装IPsec Certificate Expiry 在IpSec MO下定义的certExpirWarnTime 过期后,IPSec证书将过期IPsec Certificate Fault 在IpSec MO下定义的certExpirWarnTime 过期后,IPSec证书将过期Large Number of Counters 激活计数器数量多License Key File Fault 安装的许可秘钥文件不可用LinkFailure 告警原因有可能是工程阶段某些站点安装调测未完成导致的。
也有可能是光纤/光模块或者DU/RU 的硬件端口故障Local AA DB Installation Fault 本地AA数据库安装错误Loss of Synch Reference Redundancy 此告警是次生告警,是由MO Synchronization发出。
可以参考主告警:TU Synch Reference Loss of SignalNetwork Synch Time from GPS MissingLoss of TrackingSynch Reference Path HW FaultPacket Server Availability FaultSynch Reference Not ReliableSync Reference PDV ProblemSDH 相关告警: Loss of Signal, Loss of Frame, MS Alarm Indication Signal, MS Degraded Signal, MS Excessive Bit Error Rate, Plug-In Unit HW Failure, or ET Hardware FaultIP同步源: NTP Server Reachability Fault, or Gigabit Ethernet Link Fault此告警的后果是,同步源的数量减少或者只剩一个同步源,如果最后一个同步源也丢失,系统时钟会进入”holdover mode”,然后是”free-running mode”,这样就不能满足无线模块所要求的时钟精度。
Loss of Tracking 这个是一个主告警,和Synchronization· MO相关。
当TU系统的时钟进入失步状态,出现此告警,同时syncRefStatus 变为LOSS_OF_TRACKING LossOfMains 供电故障产生LowBatteryCapacity 电池容量低于预期,断电时间比预期时间短。
Maximum Number of Counters Exceeded 计数器数量超过最大限额Network Synch Time from GPS Missing 当TU没接收到1PPS或者接收到大量GPS的信息时产生NoContact 相关资源缺失或者链接没有建议NTP Server Reachability Fault 这是一个主要告警,是由MO IpSyncRef 触发的,当NTP(Network Time Protocol) 客户端检测到NTP 服务器为not reachability 时,产生该告警. 同步参考信号的状态会变为NOT_REACHABLENTP System Time Sync Fault NTP server无法完全正确同步时或者当系统的始终被改变超过1000s时产生NTP System Time Sync Problem 当系统时间以大于2s但小于1000s递进时产生NumberOfHwEntitiesMismatch 硬件实体数量不匹配OperatingTemperatureTooHighBatteryDisconnected 高温至电池单元失效OperatingTemperatureTooHighCapacityReduced 操作温度过高,容量减小OperatingTemperatureTooHighNoService 操作温度过高,无法服务OperatingTemperatureTooLowCapacityReduced 操作温度过低,容量减小OperatingTemperatureTooLowCommunicationLost 操作温度过低,失去通信Packet Server Availability Fault 当包同步源存在“Server Availability Fault”告警时。
根据packetSyncStatus的值可以指出相应的告警原因Password File Fault 密码错误Plug-In Unit General Problem 当所有可恢复的操作已经在PIU上操作过,当PIU 至少缺失5分钟以上产生Plug-In Unit HW Failure 插入单元硬件错误Power Feeding Fault 电源供给故障PowerFailure 电源故障ProblemsToScheduleSiMessages 系统消息量太大以至于无法调度Remote IP Address Unreachable 远端IP地址不可达ResourceAllocationFailure 资源配置或调配错误ResourceConfigurationFailure 资源配置失败,分配失败,资源冲突或者软硬件之间不匹配ResourceConfigurationFailure 资源配置失败,分配失败,资源冲突或者软硬件之间不匹配ResourceConfigurationFailure 资源配置失败,分配失败,资源冲突或者软硬件之间不匹配RetFailure 配置文件错误,无法移动天线或者有干扰RunningOnBatterySupply 电池供电运行中Security Level Fault 当前操作安全级别低于站点要求安全级别ServiceDegraded • 由硬件故障等其他故障引起的小区降质,有其他相关主告警,本告警为伴随告警。