爱立信基站故障处理案例
- 格式:ppt
- 大小:246.50 KB
- 文档页数:17
告警分析处理流程通常去解决一个基站的故障,从下面的这个顺序来分析处理1.首先检查发生故障基站的小区是否正常工作。
2.检查基站是否有告警若有告警,根据告警的详细内容定位故障的位置3.检查RNC侧各信道(FACH.RACH.PCH.HSDSCH.Eul)状态和基站侧无线.基带.传输.控制等状态。
4.检查基站各模块工作状态3418/3518A.R RUB.O BIF板C.T X板D.R AX板E.ET-MFX板ET-MFX板注意看Port6的状态,PS业务都是从这个口出去的F.CBU板在Ports下面,pp1~pp4分别显示1~4条E1状态32063206与3418/3518不同的是分为FU和RU,RUIF板与信号相关的故障,先检查天馈,FU,RU(或RRU)如果以上设备工作不正常的话,将会影响基站发出的信号。
当然RUIF(或OBIF)的故障会影响到该基站所有小区的信号发射。
CS业务受阻,检查TX,RAX还有CBU板的工作状态。
PS业务受阻,检查ET-MFX板和CBU板工作状态。
CBU1. 传输闪断,频繁出现Heartbeat Failure告警,在确定传输无异常的情况下,上站检查CBU板2M(E1)线是否异常和CBU板的工作状况(CBU板温度和灯的状态等);CBU板工作状态和E1若无异常,可以对CBU板进行重新拔插【拔插前与机房确认,先lock该板】,后续观察是否还有闪断情况出现;若依旧闪断,对CBU板进行更换。
2. 基站出现Heartbeat Failure告警,确定传输无异常的情况下,RNC侧观察VC12状态正常,而E1状态disable,上站检查基站是否断电和E1状态,若无断电,主要检查E1接口或尝试对E1线进行更换,或发现CBU板红灯长亮,需进行更换。
3. TimDevice_RadioClockIsNotStable分析:时钟device故障,导致基站无法时钟同步处理方法:CBU板时钟device故障,通常情况下可以通过重启基站解决;若重启后无法消除该告警,应上站检查CBU工作状态(CBU板温度和灯的状态等),可以对CBU板进行重新拔插,观察告警是否消除;若告警仍在,对CBU板进行更换。
关于爱立信G网RBS2202基站设备的简介及一些告警处理办法1.设备简介以下为爱立信基站设备RBS2202的外观图:PSU:电源供给模块,以湖北联通为例,机柜有四路-48V转24V并行电源供给模块(最大配臵)ECU:电能控制模块,该模块控制所有模块供电,例如:所有散热风扇供电控制,ECU根据温度决定风扇是否启动。
DXU:分配交换单元,实际为基站主控单元,两M接口。
Base frame:底座CDU:合路及分离模块,提供全双工的信号合路,信号分离TRU:收发信模块,射频的调制和解调模块IDM/fans:内部分配模块/及散热风扇,机柜的加电空开面板2.基本配臵湖北联通定购的基站按CDU类型分为CDU_A和CDU_C+两种,基本站型除一些特例外基本为CDU_A型2+2+2,CDU_C+型2+2+2以及CDU_C+型4+4+4这三种。
以下为这三种配臵的CDU内部结构图(1)CDU_A型2+2+2一块CDU_A型包涵两种共四个功能块,两个双工器(Duplexer),两个接收信号分离放大电路(RXDA),TRU1的发射信号经双工器,直接去天线A。
天线A接受到的RXA信号经RXDA后分离成两路一路去TRU1的RXA接口,另一路去TRU2的RXA接口。
同理天线B。
(2)CDU_C+型2+2+2CDU_C+型包涵一个合路器,一个双工器,两个放大器,一个四路均分器一个两路均分器。
可以看到TRU1和TRU2的TX1和TX2发射信号经合路器合并成一路发射信号去了双工器,再去天线A。
同时天线A的RXA经双工器再由一放大器到四路均分器为TRU1和TRU2提供RXA信号,而天线B只提供一路RXB信号,经放大器到HLoutB接口,再通过CDU一根外部连线到HLin接口,最终到达两路均分器。
为TRU1和TRU2提供RXB信号。
(3)CDU_C+型4+4+4(两机柜三小区)这是一个用于城区话务忙的一个配臵,其一个小区最多支持四个TRU。
第一部分:概述爱立信的基站设备由于较高的稳定性和友好的人机接口,被广泛应用于我国的移动通信系统中,本文将联系实际,介绍一些笔者在RBS2000的维护和故障处理方面总结的一些经验和方法,并希望能起到抛砖引玉的作用。
维护工作是一项要求严谨细致的工作,由于设备本身和各个单元之间联系的复杂性,要求维护人员一定要对设备的工作原理有较深刻的认识,对各单元之间的联系了如指掌,同时也要懂得必要的BSC知识和传输知识。
尽管不可能百分百地掌握一切故障的处理方法,但充分理解各单元的功能原理及硬件结构却是解决问题的关键所在。
下图是设备连接图例:第二部分:故障原因爱立信用户手册中列举的故障是按其起因和重要性进行分类的,共分为5个类别:1、内部故障映射级别I1A,出错硬件在信令MO 中,影响MO功能。
2、内部故障映射级别I1B,故障原因与信令MO无关,影响MO功能。
3、内部故障映射级别I2A,出错硬件在信令MO中,不会影响MO功能。
4、外部条件映射级别EC1,这些条件是外部TG,会影响MO功能。
5、外部条件映射级别EC2,这些条件是外部TG,不会影响MO功能。
这5个类别中共有故障达230个之多,综合分析引起这些故障的原因主要在以下几个方面:1、设备硬件引起的故障:因为设备本身电路的高集成度和对工作环境的苛刻要求,设备硬件引起的故障是最常见的,在整个基站故障中占了相当大的比例。
例如载波永久性故障。
2、人为引起的故障:1) 对软件操作错误,包括IDB中的TEI定义不对,BSC中的传输定义的不够多,MO与CELL没有连接起来,频率设置或功率设置错误等等。
2) 对硬件操作错误,主要是连线连接错误或接口没有拧紧造成。
常见的包括馈线口没有打紧出现的驻波比告警,接反引起的掉话等等。
3、软件问题引起的故障:随着设备软件版本的不断更新,这类故障一般出现较少。
现在比较常见的大多是设备在升版过程中引起的故障,DXU多次升版不成功引起的设备坏,TRU 升/降版过程中引起的CF 2A 41 等等。
常见故障告警处理一. 硬件设备告警1、CP FAULTDPWSP;看CP状态。
REPCI;测试出错部件(排第一个是最可能出错的部件)。
REMCI:MAG=XX,PCB=XX;换板(可以再REMCI第二个部件)。
RECCI;测试并复位。
若修时出FC301说明交换机自己在修,此时CP状态为SE-FM(分离),无法人工修,只要等片刻就会发现CP状态变为UPDATING,再等就应该WORKING了。
2、RP FAULTEXRPP:RP=XX;看RP状态REPRI;测试出错部件(排第一个是最可能出错的部件)REMRI:RP=XX,PCB=XX;(也可以换第二个部件)RECRI;测试并复位闭解RP BLRPI/E:RP=XX;3、EMRP FAULT(emrp:Extension Module Regional Processor )REPEI:EMG=XX,EMRP=XX;REMEI:EMG=XX,MAG=XX,PCB=XX;RECEI:EMG=XX,PCB=XX;4、EM FAULTEXEMP:RP=X,EM=XX;看EM状态若无RPT时:REPRI:RP=XX,EM=XX;REMRI:RP=XX,EM=XX,PCB=XX;RECCI:RP=XX,EM=XX;若有RPT时:EXEMP:RP=XX,EM=XX;BLEMI:RP=XX,EM=XX,RPT=XX;BLEME:RP=XX,EM=XX,RPT=XX;若与TSM相关时:GSBLI: TSM=XX;进行(2)或(3)闭解EMGSBLE: TSM=XX;5、SWITCHING NETWORK TERMINAL FAULTNTSTP:SNT=XX;看SNT状态(常见FC38可闭解修好)NTCOP:SNT=XX;查DEV号对MSC:EXDRP:DEV=XX;查控制设备的RP号和EM号对BSC:RADAP:DEV=XX;查控制设备的RP号和EM号EXRPP:RP=XX;NTBLI:SNT=XX;闭NTTEI:SNT=XX;测NTBLE:SNT=XX;解若解不开,可试以下方法:EXEGP:EMG=XXXXX;查CICEXCLP:EQM=CLC-9;查对应的DEV,记下相关数据BLCLI:EQM=XX;闭CICEXCLE:EQM=XX;拆数据NTBLI:SNT=XX;闭NTBLE:SNT=XX;解EXCLI:EQM=XX,SPEED=XX,DEV=XX;重新定义原来的数据BLCLE:EQM=XX;解CIC6、GROUP SWITCH FAULT(TSM FAULT)(或GROUP SWITCH RESTRICTIONS)GSSTP:CLM/SPM/TSM=ALL;找出错部位(或用GSREP;列出故障的设备)。
基站常见故障处理CF EC10(Main fail (External Power Source Fail)):外部电源故障处理步骤:1.检查出现故障小区的PSU是否工作正常:检查指示灯是否正常;2.检查电源链路,包括电缆、熔丝空开等;3.检查IDB中配置的电源系统是否和实际使用的电源系统一致;4.检查交流电源是否连接正确;5.更换PSU。
HW and IDB inconsistency(硬件和IDB数据不一致):处理步骤:1.检查硬件的频段、配置数量是否和IDB的配置数据相一致。
2.如发现数据不同,需要重新传建IDB或者在IDB中进行修改。
Climate sensor fault, System voltage sensor fault,A/D converter fault告警处理步骤:1.检查出现告警小区的PSU、ECU是否工作正常。
2.如PSU出现问题,则更换。
(参照例三)3.如ECU出现问题,则更换。
4.将出现告警的ECU电源关闭,更换ECU。
5.更换后,将其电源开启。
TRX 1A/13 (RF loop test fault): RF 环路测试故障处理步骤:1,检查TX电缆与TRU是否正确连接。
2,对TRU进行复位或者断电后重新加电,看是否能够恢复。
3,讲该载频进行退出/进入服务的操作,或者将该载频对应的TG退服后重新进入,看是否可以恢复。
4,若经过上述操作后,故障仍然存在,或者以后再次出现,建议更换该TRU。
TRX 1A/21 (Internal configuration failed): 内部配置失败处理步骤:1,检查CDU电源是否正常。
2,检查IDB中CDU配置是否正确。
3,检查TRU是否安装正确,与Y-link线连接是否正确。
4,检查IDB中TRU配置是否正确。
5,检查CDU-BUS线包括背板连线。
6,将CDU进行断电/加电操作。
7,重启DXU,CDU,TRU。
8,更换TRU。
1爱立信基站疑难故障分析大家都知道在无线基站维护过程中,交换提供的故障信息对基站现场维护至关重要,但是有许多疑难故障,交换并不能提供准确信息,基站现场的告警灯及操作维护终端OMT也不能提供相应信息,这就需要维护人员有丰富的维护经验及对设备的深入了解,才能解决难题。
现将本人在实际工作中所遇到的几个故障及处理过程介绍给人家,以供交流与探讨。
1.1同、邻频及其它干扰成为基站疑难故障原因之一在安装抚顺大酒店爱立信微蜂窝时,此基站安装室外全向天线,在电源及传输均正常的情况下,由BSC LOAD基站数据后,启动基站,但瞬间基站既脱机,检查微蜂窝硬件及BSC数据均正常,就是启动即脱机,在室外天线所在位置可检测到本不该存在的该基站的邻频信号。
所以判断此故障为强邻频干扰所造成,查出干扰源为邻近娱乐场所私自安装GSM的直放站。
强令其拆除后,该基站正常启动并工作正常。
因此,当基站出现疑难故障时对其进行同频、邻频及其它干扰源检测是非常重要的。
1.2天馈线质量是基站运行的重要保证造纸厂爱立信RBS200基站搬迁后,A扇区掉话5%,B扇区掉话10%,检查BSC数据无问题,基站无任何告警,网优进行拨打测试,发现A、B扇区相邻地区掉话,怀疑有载频“假好”停部分载频进行测试,发现使用任何载频进行测试,均有掉话,于是,判断可能为A、B扇区各有一条接收天线接反。
理顺馈线发现一条A扇区的接收天线接到了B扇区的机架上,而将B扇区的接收天线连到A 扇区的机架上,由于该基站使用收发单工的定向天线,天线接反不仅造成分集接收的丢失,而且会造成局部区域的严重掉话。
由于工程建设中对馈线管理不严,在实际工作中经常发生馈线装反现象,其中,带有BCCH及下行信号的馈线装错,在拨打测试中很容易被发现,而接收馈线装反,却较难发现,并造成疑难故障。
加强天馈线系统预检预修,严格执行作业计划,使故障隐患消除在萌芽状态。
由于工程中对馈线与软跳线或天线与软跳线的接头处理的不好,防水胶泥封得不严,会造成馈线进水,接头生锈,如果只从表面上看,很难发现故障。
爱立信解决因传输不同步而导致大量基站切换失败的案例作者:刘博邮箱:liubo@所在省:黑龙江省设备厂家:爱立信专业:GSM无线网设备类型:BTS设备型号:RBS6000&RBS2000软件版本:R12一、故障现象:通过日常指标数据观察一个BSC中突然出现多个小区切换成功率降低,连续多个时段固定小区的切换成功率降至50%左右,严重影响测试情况,用户感知大幅下降。
观察切换成功率指标如下表:现场测试时发现当测试至上述小区时出现大量切换失败现象,几乎没有成功的切换事件,测试过程中静态测试时问题小区存在C1、C2无法解析情况。
如下图:二、故障分析:1、处理流程图:2、分析故障现象可能原因:检查基站硬件障碍:突发的切换成功率异常事件通常要先检查基站运行状态是否出现异常,即基站硬件是否出现障碍。
由于本次同时发生切换成功率异常的小区较多,而同时出现大量基站出现同一硬件障碍的情况几率很小,所以基本排除基站硬件障碍而导致的小区切换成功率低的问题。
但经过工参资料查询,问题小区分属9个基站,其中有8个基站为GSM900M基站与GSM1800M 基站共站,而这9个基站距离较近,并且9个基站建设时间比较接近,所以需要到基站现场确认基站硬件是否存在障碍。
在基站现场检查基站硬件,同时通过现场IDB读取基站运行状态,没有发现以上问题基站硬件障碍历史记录,同时观察问题基站的站型包括RBS2000系列和RBS6000系列各不相同,检查各问题小区可能发生的载频隐形障碍,通过替换等操作排除了所有小区存在载频隐形障碍的可能,所以彻底排除因基站障碍而导致小区切换失败的因素。
检查是否存在其他基站硬件告警:通过OSS系统利用RXELP指令以及RXMFP指令提取问题小区的系统告警以及历史告警信息,并通过基站现场采集IDB告警数据检查问题基站相关的即时告警信息以及历史告警信息并未发现基站存在任何告警信息。
同时通过ALOG、TRH EVENT LOG并结合RALHP、RRMAP检查TRA、TRH运行状态以及告警信息,未发现TRA、TRH运行异常。