基站故障定位及排障案例分析
- 格式:ppt
- 大小:19.02 MB
- 文档页数:36
1、基站接入段常见故障现象:1)、接收无信号(LOS)2)、接收AIS3)、接收帧丢失(LOF)4)、远端告警(RDI)5)、无传输告警处理方法:(一)HDSL故障处理方法:1、通过观察HDSL设备面板指示灯,初步判断故障点.2、利用设备内部自环,及配合使用2M仪表和万用表,判断设备是否有故障.3、通过终端进行登录,观察设备配置情况,线路传输质量,配合使用万用表测量环组及线间电压.4、在排除设备自身故障后,如确认为线路故障,记录下专线号,与接入局所的测量室联系,测试专线(二)微波故障处理方法:1、观察室内单元面板指示灯,在理解各告警指示灯的前提下,初步判断故障点。
2、用万用表测量接收电平,判断无线链路是否工作在正常电平范围内。
3、用2M测试仪表对输入输出端口进行测量,分析告警原因。
4、用LCT登录设备,观察设备配置及各告警信息。
(三)光端机故障处理方法1、通过观察面板告警指示灯,初步判断设备是否存在故障.2、用光功率计测量发送和接收光功率,判断设备是否存在故障.3、用光跳线对设备光路环回插入适当衰耗,从支路2M口进行发收测试,判断设备性能是否良好.经验总结:1)、在光口上出现LOS告警可能是由于光缆断或远端光设备故障或掉电. 2)、在电口上出现LOS告警可能是由于近端线路断或线路接反造成.3)、接收AIS是由于远端设备故障或远端线路中断造成的.4)、接收帧丢失(LOF)是由于设备故障造成定位错误,引起告警或是由于线路质量(如专线)存在问题造成帧错误.5)、远端告警(RDI)是由于远端设备收到LOS、LOF、或AIS后向本端发出的告警.6)、无传输告警是由于两套或两套以上中继混线,只有中断一条时,另一套出现告警或频率或相位出现偏差,造成相位失锁,引起掉话,此多是由于设备自身内部时钟漂移或网络同步不良造成.。
第五章案例分析:故障案例分析一:驻马店市区刘阁基站(DE34)TRX2有7533告警(TX ANTENNA OR CONBINER CONNECTION FAULTY)由于连接在同一个合路器上的TRX1工作正常,初步判断AFEA 没有故障,TX连线紧固,则判断可能是TRX坏或者TX连线坏,更换TRX后故障解除。
但是到3月9号,TRX2再次出现7533告警,由于TRX为新换的,TX连线无故障,分析认为合路器AFEA不稳定,存在隐患,更换AFE后故障解除,没有重复出现。
故障案例分析二:西平人和基站(DE34)BCFA故障,更换后无法自启,检查发现软件包不对应(使用的板件是返修的库存板件,没有考虑软件包问题),灌入对应软件包重启后,Sec2和Sec3无法正常工作,其中Sec2的TRX7正常,而TRX8和Sec3的TRX9和TRX10均有7514告警(13MHZ CLOCK IS MISSING IN TRX)按照Nokia告警处理提示应更换TRX,但三块TRX同时坏的可能性不大,考虑可能为其他原因引起。
于是将Sec2正常运行的TRX7和出故障的TRX8倒换位置,(操作过程中对该层PSUA断电)结果Sec2两块TRX均恢复正常。
于是将Sec3的PSUA断电再加电,该扇区亦恢复正常。
分析认为有时TRX内部软件需要重新掉电初始化。
这一点和后来改半速率过程中,有些DE34站虽然数据与BSC完全对应,仍然出现OMU信令不活的现象类似,出现这种情况时,对基站供电单元CSUA掉电再加电就可以解决。
故障案例分析三:遂平红堂基站(UltraSite)O改S后,Sec1一直占不上用户,且有7602(Mismatch between BSC/MMI configuration file and the actual)告警,经检查发现,硬件数据库中Sec1的数据不完整,补充完整后再上传进去,重启BCF,故障解除。
故障案例分析四:妇幼保健院(ULTRASITE)断站,且断站时有7606告警,告警提示为合路器反射功率过高。
爱立信基站典型故障处理案例案例1:对基站进行IDB的配置总是无法完成,提示为时间超时。
当对基站进行IDB数据的配置时,因为TRU与DXU软件版本不一致,或BSC下载软件的同时进行DXU数据配置而产生冲突,或第一次IDB配置电源电压类型错误,或短时间内频繁的对DXU进行IDB配置等原因,偶尔可能导致再进行IDB的数据配置时,出现提示为时间超时而无法完成的现象。
导致DXU同机架内部的通信上存在异常现象,出现类似机架掉死的现象,更换DXU无效。
解决的办法是,将DXU(或新的DXU)放到同基站的其它机架上,或另外的基站上,仅对DXU加电,按照存在问题的机架配置进行IDB的重新配置,完成后再安装到存在问题的机架上,不必再重新配置,对DXU等各模块加电重起,即可解决问题。
案例2:RBS200基站工作不稳定,经常退服。
基站各部件的稳定工作离不开稳定的时钟信号,而基站的时钟信号是从PCM传输中提取的,爱立信的基站不提供外部时钟输入的端口, RBS200基站是爱立信早期推出的GSM基站产品,这些基站设备是基于采用传统的PDH传输组网方式而设计的,并不非常适用于SDH传输组网方式,这就会导致RBS200基站在和某些厂家的SDH传输设备配合使用时,导致基站工作不稳定,频繁出现时钟同步的告警,经常退服,严重影响了基站的正常运行。
解决办法有两种:一种是将RBS200基站使用的SDH传输更换为PDH传输;另一种是将RBS200基站设备更换为RBS2000基站设备,因为RBS2000对同步要求较RBS200低,能够很好同SDH传输配合工作。
案例3:开始时,马厂湖基站有部分TS总是无法正常工作,且不固定在某个载频上,更换TRU、DXU无效,对基站的数据进行拆掉重新加载后仍无效,后来整个基站所有的TS均无法正常工作,基站硬件、传输、数据等均不存在问题。
点检查了基站的所有硬件均不存在故障现象,对怀疑有问题的TRU、DXU进行了更换;对传输进行了环路测量,也未发现传输电路存在质量问题;检查小区、基站的定义数据也都正常。
移动通信基站设备常见故障处理案例第一章爱立信基站主设备常见故障一、载频盘故障(一)故障现象:fault灯亮;fault灯亮,operation灯亮;operation灯亮,TX not 灯常亮等载频盘指示灯图1(二)故障定位:载频盘故障(三)故障所用仪器仪表:笔记本电脑(四)处理步骤:1、检查所坏的载频盘的位置,确认位置无误。
2、通知机房将故障载频盘闭掉等待机房闭掉故障载频后,戴上静电手镯,把故障载频的状态切换到本地。
3、掉电后将故障载频卸下换上备件载频加电。
4、待自检完毕后,将载频状态切换至远端,通知机房激活载频。
二、PSU故障(一)、故障现象:PSU fault灯亮PSU指示灯图2(二)、故障定位:检查是PSU故障还是PSU光纤环路故障,或ECU故障,确定故障为PSU故障后进行更换PSU。
(三)、所用仪器仪表:笔记本电脑(四)、处理步骤:1、连接笔记本电脑与主设备,打开OMT管理软件读取主设备数据库2、用OMT软件找出故障PSU进行更换。
3、进行更换PSU的时候我们要遵守的原则是:断PSU电源的时候要先直流后交流,接PSU电源的时候要先交流后直流。
4、遵守更换PSU的原则,将故障PSU拆下,换上备件PSU,观察故障告警是否消除。
三、CDU A 、C、C+故障(一)、故障现象:CDU fault灯亮(二)、故障定位:CDU A 、C、C+故障(三)、所用仪器仪表:笔记本电脑(四)、处理步骤:1、连接笔记本电脑与主设备,打开OMT管理软件读取主设备数据库2、用OMT软件确定是否CDU故障3、若不是CDU故障用OMT软件重新进行故障定位,找出故障点;若是CDU故障,进行更换故障CDU4、更换前要通知机房将故障单元所在小区闭掉。
更换的时候首先将故障CDU断电,然后用专用工具T10将CDU拆下,将备件CDU装上后,确认连线无误后将CDU 加电,观察基站告警是否消除。
5、待CDU、TRU状态正常后通知机房将基站激活,观察设备是否运行正常,正常后清洁卫生离开现场。
5.2.3华为基站故障处理实例1. 天馈连接鸳鸯线导致扩容载频后话务量减小现象描述:反映某 312 基站第二小区话务量减小,该站话务量减小是从扩容后,原来是一个载频,采用一个 CDU ,扩容后加了一块载频,同时将 CDU 更换为 EDU ,至此话务量急剧下降,连续 3 天话务量不足原来的 1/4 ,用户怀疑是覆盖范围减小。
告警信息:在告警台中观察不到任何关于该基站的告警,单板指示灯和运行状态均正常。
原因分析:由于用户增加了一块载频,该基站下的四块载频变为五块,但是 PSU 单板只用两块,所以初步分析可能由以下原因造成话务量减小:1 ) PSU 单板不够用,由于每两块 TRX 需要一个 PSU ,所以有可能是这个原因所致;2 )新更换的 EDU 有问题;3 )扩容时连接跳线时接头没有连接牢靠,造成驻波比过大;4 )小区的天馈连接错误。
处理过程:现场检查数据,没有任何问题,观察话统,发现的确从扩容后话务量就一直维持在 1ERL 左右,没有异常告警。
到达现场后加入一块 PSU 板,通过话统对该小区进行测量报告数量的测量,发现很少,话务量没有提高,将 1 、 2 小区的 EDU 更换,现象依旧,仔细检查 TRX 和EDU 之间的连线,也没有错误,又检查天馈连线,发现第二小区的 EDU 的第二个发射端口 TX/RX_ANTB 错误的连接到第一小区天线的发端口,这样以来,第二小区的 BCCH 和 TCH 是通过不同的天线发出去的,造成可能指配信道所在的载频信号很弱,进而发生切换或掉话,切分集接收也不正确,所以造成该小区吸收不了话务量。
将小区天线重新连接,二小区的话务量立刻提升了。
建议与总结:扩容,更换硬件时一定要信心连接线缆,避免连成鸳鸯线,交叉线,如果连接错误通常不会产生告警,故障比较隐蔽,同时会造成一些切换,掉话,话务量上不去的现象。
2. 数据配置不当导致 BTS3006A 在市电掉后出现非主 BCCH 载频退服现象描述:某基站业务信道可用率突然下降,严重影响了考核指标。
基站系统故障案例分析与应急预案汇总总则:深圳电信CDMA无线接入网经过近三年的开通运行,为深圳电信提供了大量的维护移动通讯系统的实际工作经验,在总结前期的维护工作、中兴公司相关维护手册的基础上,我们特编制此手册,希望能够对大家在维护工作中遇到的问题和进行系统维护工作有所帮助。
按照基站系统的工作原理,我们将基站系统的故障分为五个部分,包括1、时钟部分2、射频部分3、电源部分4、传输部分5、数字基带部分,以下我们将按照基站的分类进行分别说明。
第一节时钟系统故障1.1未探测到GPS故障现象在后台的操作维护系统告警管理程序中,出现“未探测到GPS”的未恢复告警。
故障分析GPSTM只要电源正常、天馈正常即可正常工作。
如果只有未探测到GPS的告警,说明GPSTM与CCM的通信中断,但GPSTM 的时钟输出基本正常。
造成GPSTM与CCM的通信中断的原因可能是:(1)GPSTM模块与后背板接触不良(2)GPSTM与CCM的后背板连线有问题或接触不良(3)CCM模块与后背板接触不良(4)GPSTM失效(5)数据配置错误。
由于系统机架提供了两个GPSTM插槽,而实际配置可能只有一个GPSTM模块。
如果数据配置出现与实际配置不同的错误,也会出现告警。
故障定位和排除检查物理配置数据,确认该槽位是否确实应该存在GPSTM模块;如果不应该存在GPSTM模块,更改配置数据,并做数据同步。
如果数据配置无问题,解决该故障必须到前台处理。
倒换或拔插CCM模块,检查CCM模块与后背板接触不良。
检查GPSTM与CCM的后背板连线。
拔插GPSTM模块,检查GPSTM模块是否与后背板接触不良。
用代换法验证是否GPSTM模块失效。
1.2GPS处于时延阶段故障现象在后台的操作维护系统告警管理程序中,出现“G PS处于时延阶段”的未恢复告警。
该告警暂时不会影响该基站用户打电话,但会影响切换,也有可能引起该基站服务区和相邻基站服务区内通话用户掉话或通话质量下降或时钟不正确。
因电源问题引起大面积基站中断的故障处理案例下面是一个实际案例报告(略去了地名),供参考。
2006年4月4日约19时,在×县发生了29个基站通信中断的故障,经全力抢修,于4月5日3时45分完全恢复正常。
一、故障现象2006年4月4日18:59分,网络监控室值班人员通过基站监控终端发现×县29个基站大面积通信中断。
二、故障经过1、2006年4月4日18:59分,网络监控室值班人员通过基站监控终端发现××等29个基站大面积中断。
2、19:10分,网络部相关技术人员根据故障现象,初步判断原因为×基站电源故障引起传输中断进而导致大面积断站。
3、19:35分,基站代维公司代维人员到达×基站现场,发现基站市电未停,但开关电源未工作并且机房内所有设备均已掉电。
4、19:45分,网络部相关技术人员指示现场代维人员在查找市电故障的同时使用自备发电机向基站供电。
在发电机供电情况下,×基站内的开关电源设备开始工作,并对蓄电池充电。
5、19:50分,基站代维人员在确认设备无短路漏电后合上传输空气开关,设备开始上电,传输电路开始恢复。
6、20:34分,基站电路全部恢复正常通信,基站故障消除。
7、20:40分,网络部技术人员指导×基站现场代维人员继续查找市电故障原因,现场代维人员立即联系当地供电部门对基站交流供电进行检查。
8、4月5日凌晨00:10分,×基站及其传输链路上的共计27个基站再次发生中断。
9、4月5日凌晨00:40分,正在会同供电部门检查交流线路的代维人员迅速赶回基站,发现5kW发电机因蓄电池充电电流过大,发电机长时间过载运行导致不能正常工作,代维人员立即关闭基站主设备的电源以保证传输设备的供电。
10、4月5日凌晨01:32分,除×站外的26个基站全部恢复。
11、4月5日凌晨02:05分,现场代维人员与当地供电部门人员经过仔细排查后,确定了市电故障原因:故障发生时,当地正下暴雨并有大风,从山下供电处到基站之间的交流供电线路的零线因年久老化,在恶劣天气情况下出现接触不良,引起基站的交流引入异常。