爱立信基站常见故障分析
- 格式:ppt
- 大小:8.46 MB
- 文档页数:70
告警分析处理流程通常去解决一个基站的故障,从下面的这个顺序来分析处理1.首先检查发生故障基站的小区是否正常工作。
2.检查基站是否有告警若有告警,根据告警的详细内容定位故障的位置3.检查RNC侧各信道(FACH.RACH.PCH.HSDSCH.Eul)状态和基站侧无线.基带.传输.控制等状态。
4.检查基站各模块工作状态3418/3518A.R RUB.O BIF板C.T X板D.R AX板E.ET-MFX板ET-MFX板注意看Port6的状态,PS业务都是从这个口出去的F.CBU板在Ports下面,pp1~pp4分别显示1~4条E1状态32063206与3418/3518不同的是分为FU和RU,RUIF板与信号相关的故障,先检查天馈,FU,RU(或RRU)如果以上设备工作不正常的话,将会影响基站发出的信号。
当然RUIF(或OBIF)的故障会影响到该基站所有小区的信号发射。
CS业务受阻,检查TX,RAX还有CBU板的工作状态。
PS业务受阻,检查ET-MFX板和CBU板工作状态。
CBU1. 传输闪断,频繁出现Heartbeat Failure告警,在确定传输无异常的情况下,上站检查CBU板2M(E1)线是否异常和CBU板的工作状况(CBU板温度和灯的状态等);CBU板工作状态和E1若无异常,可以对CBU板进行重新拔插【拔插前与机房确认,先lock该板】,后续观察是否还有闪断情况出现;若依旧闪断,对CBU板进行更换。
2. 基站出现Heartbeat Failure告警,确定传输无异常的情况下,RNC侧观察VC12状态正常,而E1状态disable,上站检查基站是否断电和E1状态,若无断电,主要检查E1接口或尝试对E1线进行更换,或发现CBU板红灯长亮,需进行更换。
3. TimDevice_RadioClockIsNotStable分析:时钟device故障,导致基站无法时钟同步处理方法:CBU板时钟device故障,通常情况下可以通过重启基站解决;若重启后无法消除该告警,应上站检查CBU工作状态(CBU板温度和灯的状态等),可以对CBU板进行重新拔插,观察告警是否消除;若告警仍在,对CBU板进行更换。
1.起局后,传输不通常见问题处理:
1).先看TNB口灯亮不亮
如果不亮:把光模块拔下来,检查一下,LTE的是1G的光模块, NR的是10G的光模块。
如果搞错了,灯也会不亮。
例:上周调杭州大华5G站点,起局后,LTE站点传输不通, TNB口灯不亮,经检查BBU上的是10G光模块,导致不通,灯不亮。
换成1G光模块后,ok。
2). st eth ,检查端口状态,正常是 enabled (LTE/NR站点指令一样)
3). 查看 TNB口定义的是1G还是10G,自适应配置都要和传输侧保持一致
get Transport=1,EthernetPort=1
4).查看本站 OAM/TRAFFIC ip地址 MO:
pr ipv4
可以查看具体 IP地址情况:
get 2219 或者: get InterfaceIPv4=Traffic,AddressIPv4=Traffic
如何ping 到网关是否通:
先查下网关地址: get nexthop
然后执行下面指令:
2.小区起不来,光口不亮。
AAS, disable, 光纤插错端口 A, D
st rilink ,查看 rilink状态
st 227,查看 riport 信息
从上面可以看到,脚本定义的 rilink 一端接到 BBU上A口,如果把光纤插到了其他端口,link就起不来,小区起不来。
所以发现小区光纤口不亮,要查一下是不是纤插错了。
2.软件包问题,导致无法正常起局,这时需要重新下载软件包。
第一部分:概述爱立信的基站设备由于较高的稳定性和友好的人机接口,被广泛应用于我国的移动通信系统中,本文将联系实际,介绍一些笔者在RBS2000的维护和故障处理方面总结的一些经验和方法,并希望能起到抛砖引玉的作用。
维护工作是一项要求严谨细致的工作,由于设备本身和各个单元之间联系的复杂性,要求维护人员一定要对设备的工作原理有较深刻的认识,对各单元之间的联系了如指掌,同时也要懂得必要的BSC知识和传输知识。
尽管不可能百分百地掌握一切故障的处理方法,但充分理解各单元的功能原理及硬件结构却是解决问题的关键所在。
下图是设备连接图例:第二部分:故障原因爱立信用户手册中列举的故障是按其起因和重要性进行分类的,共分为5个类别:1、内部故障映射级别I1A,出错硬件在信令MO 中,影响MO功能。
2、内部故障映射级别I1B,故障原因与信令MO无关,影响MO功能。
3、内部故障映射级别I2A,出错硬件在信令MO中,不会影响MO功能。
4、外部条件映射级别EC1,这些条件是外部TG,会影响MO功能。
5、外部条件映射级别EC2,这些条件是外部TG,不会影响MO功能。
这5个类别中共有故障达230个之多,综合分析引起这些故障的原因主要在以下几个方面:1、设备硬件引起的故障:因为设备本身电路的高集成度和对工作环境的苛刻要求,设备硬件引起的故障是最常见的,在整个基站故障中占了相当大的比例。
例如载波永久性故障。
2、人为引起的故障:1) 对软件操作错误,包括IDB中的TEI定义不对,BSC中的传输定义的不够多,MO与CELL没有连接起来,频率设置或功率设置错误等等。
2) 对硬件操作错误,主要是连线连接错误或接口没有拧紧造成。
常见的包括馈线口没有打紧出现的驻波比告警,接反引起的掉话等等。
3、软件问题引起的故障:随着设备软件版本的不断更新,这类故障一般出现较少。
现在比较常见的大多是设备在升版过程中引起的故障,DXU多次升版不成功引起的设备坏,TRU 升/降版过程中引起的CF 2A 41 等等。
爱立信 WCDMA 基站常见告警处理方法1. PDH Loss of Signal:PDH信令丢失告警Maj PDH Loss of Sign loss_of_signalSubrack=1,Slot=1,PlugInUnit=1,Cbu=1,ExchangeTerminal=1,E1PhysPathTerm=pp4告警原因:传输不通。
2. Plug-In Unit General Problem:配置错误告警Maj Plug-In Unit General Problem replaceable_unit_problem Subrack=1,Slot=2,PlugInUnit=1告警原因:对应槽位没有板子,或板子读取不到。
处理方法:拔插相应槽位的板子,如拔插无效,则需更换板子。
3. AuxPlugInUnit_PiuConnectionLost:辅助单元设备告警Maj AuxPlugInUnit_PiuConnectionLost equipment_malfunction AuxPlugInUnit=1告警原因:外部告警先没接。
影响:无处理方法:由于现在外部告警线不需要接,可闭掉AuxPlugInUnit=1 这个MO,以消除告警。
4. AuxPlugInUnit_LossOfMains:RRU电源告警Maj AuxPlugInUnit_LossOfMains commerical_power_failure SectorAntenna=1,AuxPlugInUnit=RRU-1 告警原因:RRU掉电影响:该小区将退服。
处理方法:到现场检查RRU电源。
5. Carrier_RejectSignalFromHardware:Carrier_SignalNotReceivedWithinTime:载频告警Maj Carrier_RejectSignalFromHardware message_not_expected Sector=1,Carrier=1Maj Carrier_RejectSignalFromHardware message_not_expected Sector=2,Carrier=1Maj Carrier_SignalNotReceivedWithinTime timeout_expired Sector=2,Carrier=1告警原因:RU或RRU故障。
爱立信LTE无线告警现场处理手册日常故障处理方法(1)---Loss of Tracking➢告警解释:此告警是由于系统或者无线时钟失步导致,可能造成基站退服。
➢可能原因:(1)GPS硬件故障;(2)基站进程吊死;(3)DU硬件故障;TD-LTE采用GPS进行同步。
其硬件以及连接方式如下:➢处理步骤:检查GPS信号接收器上的工作状态灯状态。
(1)灯不亮1.检查GPS信号接收器和连接DU的RJ45网线,如有问题则进行更换。
2.检查DU上的GPS端口是否存在问题,如有问题则更换DU。
(2)绿灯常亮1.检查连接DU的RJ45网线,如有问题进行更换。
2.通知后台重启基站3.更换DU。
(3)绿灯闪1.按照上面GPS硬件连接图按照从DU到GPS天线的顺序检查各个接口是否有虚接、各线缆是否有破损、各个单元硬件是否存在问题,如有问题则进行重接或者更换。
2.通知后台重启基站3.更换DU。
(2)---Network Synch Time from GPS Missing➢告警解释:此告警是由于GPS信号丢失导致,可能导致基站退服。
➢可能原因:(1)GPS硬件故障;(2)基站进程吊死;(3)DU硬件故障;➢处理步骤:请参考“Loss of Tracking”告警的处理步骤。
(3)---System Clock Quality Degradation➢告警解释:此告警表示系统或者无线时钟进入了“free-running”模式,不能满足系统正常工作的需求。
该告警为伴生告警,其提示作用。
能够触发该告警的子告警为:●Network Synch Time from GPS Missing●Loss of Tracking●TU Synch Reference Loss of Signal➢可能原因:由于该告警为伴生告警,可能原因请参见其伴生的子告警。
➢处理步骤:由于该告警为伴生告警,处理步骤请参见其伴生的子告警。
(4)---Remote IP Address Unreachable➢告警解释:此告警表示远端IP地址不可达,多为到核心网的IP地址不可用。
爱立信BTS高负荷时重启问题的分析和处理四川移动通信公司绵阳分公司姚震宇故障设备的软件版本:R8故障原因归类:软件关键字:爱立信 BTS 重启一段时间以来,发现本地个别基站出现频繁倒站甚至SDCCH掉死现象。
用户感觉表现为信号不稳、无法呼叫或短信收发不成功。
此问题常见于高SDCCH话务量的基站,具有一定的普遍意义,这里对这种现象的表现形式、产生原因和处理办法进行分析。
故障表现此问题常见于高SDCCH负荷的基站,表现为平时SDCCH负荷不高时基站一切正常,用户感受良好,但是一旦SDCCH量上升到一定程度时容易发生问题,表现为以下三种形式:1、基站正常,但部分TRU退服。
用指令RXBLI、RXBLE闭塞解闭后可以恢复工作。
2、基站退服,某些时候还会出现反复重启。
用指令RLCRP观察信道状态可以发现退服时BCCH首先从正常时的“BUSY”变为“BLOC”,随即基站退服。
3、基站状态正常,用RLCRP观察信道齐全,但SDCCH全部为“BUSY”状态。
上面三种情况中以第三种状态最为隐蔽,注意与正常的高话务基站区别开。
区别的方法是观察相邻基站是否繁忙,以及SDCCH统计是否正常,如果相邻基站负荷不高,且统计异常,试呼和拥塞远高于正常范围时可以判断此基站已吊死。
如图一所示:图一图中MY4063C可见试呼与拥塞都非常高,成功分配次数很低,可以判断处这个基站已经吊死。
原因分析由于此问题只在基站高SDCCH时才会发生,很容易认为是基站容量不够,但实际上并非如此。
也与传输或BSC无关。
通过对本地问题基站的分析,可以发现出问题的基站有以下几个共同点:1、重启只发生于覆盖一定地区的基站。
不覆盖此地区的其他基站无此问题。
具有区域性。
2、基站重启具有规律性。
重启发生时间与该地区用户作息时间有一定关联性。
3、与该区域用户构成有紧密联系,特别是高校周围动感用户集中的区域基站出问题的可能性很大。
4、发生问题的基站SDCCH话务量很大,达到正常基站的十倍左右并伴有严重的LAPD信令拥塞。
移动通信基站设备常见故障处理案例第一章爱立信基站主设备常见故障一、载频盘故障(一)故障现象:fault灯亮;fault灯亮,operation灯亮;operation灯亮,TX not 灯常亮等载频盘指示灯图1(二)故障定位:载频盘故障(三)故障所用仪器仪表:笔记本电脑(四)处理步骤:1、检查所坏的载频盘的位置,确认位置无误。
2、通知机房将故障载频盘闭掉等待机房闭掉故障载频后,戴上静电手镯,把故障载频的状态切换到本地。
3、掉电后将故障载频卸下换上备件载频加电。
4、待自检完毕后,将载频状态切换至远端,通知机房激活载频。
二、PSU故障(一)、故障现象:PSU fault灯亮PSU指示灯图2(二)、故障定位:检查是PSU故障还是PSU光纤环路故障,或ECU故障,确定故障为PSU故障后进行更换PSU。
(三)、所用仪器仪表:笔记本电脑(四)、处理步骤:1、连接笔记本电脑与主设备,打开OMT管理软件读取主设备数据库2、用OMT软件找出故障PSU进行更换。
3、进行更换PSU的时候我们要遵守的原则是:断PSU电源的时候要先直流后交流,接PSU电源的时候要先交流后直流。
4、遵守更换PSU的原则,将故障PSU拆下,换上备件PSU,观察故障告警是否消除。
三、CDU A 、C、C+故障(一)、故障现象:CDU fault灯亮(二)、故障定位:CDU A 、C、C+故障(三)、所用仪器仪表:笔记本电脑(四)、处理步骤:1、连接笔记本电脑与主设备,打开OMT管理软件读取主设备数据库2、用OMT软件确定是否CDU故障3、若不是CDU故障用OMT软件重新进行故障定位,找出故障点;若是CDU故障,进行更换故障CDU4、更换前要通知机房将故障单元所在小区闭掉。
更换的时候首先将故障CDU断电,然后用专用工具T10将CDU拆下,将备件CDU装上后,确认连线无误后将CDU 加电,观察基站告警是否消除。
5、待CDU、TRU状态正常后通知机房将基站激活,观察设备是否运行正常,正常后清洁卫生离开现场。
基站常见故障处理CF EC10(Main fail (External Power Source Fail)):外部电源故障处理步骤:1.检查出现故障小区的PSU是否工作正常:检查指示灯是否正常;2.检查电源链路,包括电缆、熔丝空开等;3.检查IDB中配置的电源系统是否和实际使用的电源系统一致;4.检查交流电源是否连接正确;5.更换PSU。
HW and IDB inconsistency(硬件和IDB数据不一致):处理步骤:1.检查硬件的频段、配置数量是否和IDB的配置数据相一致。
2.如发现数据不同,需要重新传建IDB或者在IDB中进行修改。
Climate sensor fault, System voltage sensor fault,A/D converter fault告警处理步骤:1.检查出现告警小区的PSU、ECU是否工作正常。
2.如PSU出现问题,则更换。
(参照例三)3.如ECU出现问题,则更换。
4.将出现告警的ECU电源关闭,更换ECU。
5.更换后,将其电源开启。
TRX 1A/13 (RF loop test fault): RF 环路测试故障处理步骤:1,检查TX电缆与TRU是否正确连接。
2,对TRU进行复位或者断电后重新加电,看是否能够恢复。
3,讲该载频进行退出/进入服务的操作,或者将该载频对应的TG退服后重新进入,看是否可以恢复。
4,若经过上述操作后,故障仍然存在,或者以后再次出现,建议更换该TRU。
TRX 1A/21 (Internal configuration failed): 内部配置失败处理步骤:1,检查CDU电源是否正常。
2,检查IDB中CDU配置是否正确。
3,检查TRU是否安装正确,与Y-link线连接是否正确。
4,检查IDB中TRU配置是否正确。
5,检查CDU-BUS线包括背板连线。
6,将CDU进行断电/加电操作。
7,重启DXU,CDU,TRU。
8,更换TRU。
1爱立信基站疑难故障分析大家都知道在无线基站维护过程中,交换提供的故障信息对基站现场维护至关重要,但是有许多疑难故障,交换并不能提供准确信息,基站现场的告警灯及操作维护终端OMT也不能提供相应信息,这就需要维护人员有丰富的维护经验及对设备的深入了解,才能解决难题。
现将本人在实际工作中所遇到的几个故障及处理过程介绍给人家,以供交流与探讨。
1.1同、邻频及其它干扰成为基站疑难故障原因之一在安装抚顺大酒店爱立信微蜂窝时,此基站安装室外全向天线,在电源及传输均正常的情况下,由BSC LOAD基站数据后,启动基站,但瞬间基站既脱机,检查微蜂窝硬件及BSC数据均正常,就是启动即脱机,在室外天线所在位置可检测到本不该存在的该基站的邻频信号。
所以判断此故障为强邻频干扰所造成,查出干扰源为邻近娱乐场所私自安装GSM的直放站。
强令其拆除后,该基站正常启动并工作正常。
因此,当基站出现疑难故障时对其进行同频、邻频及其它干扰源检测是非常重要的。
1.2天馈线质量是基站运行的重要保证造纸厂爱立信RBS200基站搬迁后,A扇区掉话5%,B扇区掉话10%,检查BSC数据无问题,基站无任何告警,网优进行拨打测试,发现A、B扇区相邻地区掉话,怀疑有载频“假好”停部分载频进行测试,发现使用任何载频进行测试,均有掉话,于是,判断可能为A、B扇区各有一条接收天线接反。
理顺馈线发现一条A扇区的接收天线接到了B扇区的机架上,而将B扇区的接收天线连到A 扇区的机架上,由于该基站使用收发单工的定向天线,天线接反不仅造成分集接收的丢失,而且会造成局部区域的严重掉话。
由于工程建设中对馈线管理不严,在实际工作中经常发生馈线装反现象,其中,带有BCCH及下行信号的馈线装错,在拨打测试中很容易被发现,而接收馈线装反,却较难发现,并造成疑难故障。
加强天馈线系统预检预修,严格执行作业计划,使故障隐患消除在萌芽状态。
由于工程中对馈线与软跳线或天线与软跳线的接头处理的不好,防水胶泥封得不严,会造成馈线进水,接头生锈,如果只从表面上看,很难发现故障。
案例1:对基站进行IDB的配置总是无法完成,提示为时间超时。
当对基站进行IDB数据的配置时,因为TRU与DXU软件版本不一致,或BSC下载软件的同时进行DXU数据配置而产生冲突,或第一次IDB配置电源电压类型错误,或短时间内频繁的对DXU进行IDB配置等原因,偶尔可能导致再进行IDB的数据配置时,出现提示为时间超时而无法完成的现象。
导致DXU同机架内部的通信上存在异常现象,出现类似机架掉死的现象,更换DXU无效。
解决的办法是,将DXU(或新的DXU)放到同基站的其它机架上,或另外的基站上,仅对DXU加电,按照存在问题的机架配置进行IDB的重新配置,完成后再安装到存在问题的机架上,不必再重新配置,对DXU等各模块加电重起,即可解决问题。
案例2:RBS200基站工作不稳定,经常退服。
基站各部件的稳定工作离不开稳定的时钟信号,而基站的时钟信号是从PCM传输中提取的,爱立信的基站不提供外部时钟输入的端口, RBS200基站是爱立信早期推出的GSM基站产品,这些基站设备是基于采用传统的PDH传输组网方式而设计的,并不非常适用于SDH传输组网方式,这就会导致RBS200基站在和某些厂家的SDH传输设备配合使用时,导致基站工作不稳定,频繁出现时钟同步的告警,经常退服,严重影响了基站的正常运行。
解决办法有两种:一种是将RBS200基站使用的SDH传输更换为PDH传输;另一种是将RBS200基站设备更换为RBS2000基站设备,因为RBS2000对同步要求较RBS200低,能够很好同SDH传输配合工作。
案例3:开始时,马厂湖基站有部分TS总是无法正常工作,且不固定在某个载频上,更换TRU、DXU无效,对基站的数据进行拆掉重新加载后仍无效,后来整个基站所有的TS均无法正常工作,基站硬件、传输、数据等均不存在问题。
点检查了基站的所有硬件均不存在故障现象,对怀疑有问题的TRU、DXU进行了更换;对传输进行了环路测量,也未发现传输电路存在质量问题;检查小区、基站的定义数据也都正常。