4G基站故障处理手册LTE
- 格式:docx
- 大小:972.25 KB
- 文档页数:11
TD-LTE故障处理手册及典型案例LTE故障处理手册一. 重大故障处理方法1. 重大故障实时告警列表告警类别华为告警设备 ENODEB 传输设备表述描述网管批量网元断链或小区不可用网管批量网元断链可能的原因及影响基站断电,或大批量双模站点TD测GPS故障基站断电,或传输原因中断 2. 重大故障处理步骤●【批量基站断站或小区不可用】●原因分析基站批量断点或或批量双模站点TD测GPS出现故障及传输设备故障●关注重点批量基站断站或小区不可用●常见处理方法序号 1 2 3 4 5 6 处理方法联系传输人员,看是否为传输设备故障联系代维人员确定基站是否断电联系代维人员确定基站是否为双模基站并确定TD测GPS完好通知传输人员处理通知代维人员处理结束“是”4 5 5 6 6 “否” 2 3 二.告警预处理告警分类1. 实时告警分类总表告警等级本机网管 ENODEB 紧急重要重要重要重要重要重要重要重要重要重要告警号 29243 19240 26205 29207 25621 26276 26238 26529 26322 告警名称网元连接中断小区服务能力下降告警小区不可用告警 BBU单板维护链路异常告警基站控制面传输中断告警直流输出异常告警制式间站点配置冲突告警 RRU组网拓扑类型与配置不一致告警 BBP心跳检测失败告警射频单元驻波告警 BBU测收发光异常重要重要重要重要重要重要重要 26503 26233 29201 25888 26235 26506 26260 RRU测收发光异常 BBU IR光接口性能恶化告警 S1接口故障告警 SCTP链路故障告警射频单元维护链路异常告警 RRU测光口性能恶化系统时钟不可用告警 2. 主要告警分析和常见的处理手段。
1)【网元链接中断】●告警解释:网元与OMC网管之间的链接中断,一般来讲,为断电或传输问题● 对系统的影响对该网元无法控制● 告警处理序号 1 2 3 4 处理方法“是” “否” 3 3检查同一环路下基站是否全部中断 2 (基站侧检查光路和电源是否OK.) 4 通知传输中心处理通知机房巡检处理故障(基站侧更换传输光模块/光纤) 结束 42) 【29243:小区服务能力下降】●告警解释当基站射频资源或基带资源不能满足当前小区的配置规格时,产生此告警●对系统的影响告警小区提供给客户可用的无线空口资源会减少。
一、业务通、管理断。
1.1相关告警、拓扑断站截图相关告警:在网管“当前告警浏览”里筛选OSS的告警,即可查到网元连接中断的告警,出现此告警的站点,即为管理断的站点。
拓扑图上的断站显示:站点图标的左上角出现小红点即为断站站点。
1.2配置查询方法,查询命令截图因为维护链路断链,所以无法从网管上对站点进行维护,因此无查询方法和命令。
1.3处理建议找传输人员配合处理,查询传输侧配置的VLAN、IP和路由是否和调单一直。
二、管理通、业务断1.4相关告警、拓扑断站截图管理通、业务端的站点因为维护链路正常所以在主拓扑上和正常站点的图标没有差别,所以只能通过告警来识别。
相关告警:a.S1接口故障告警b.SCTP链路故障告警c.小区不可用告警d.用户面承载链路故障告警2. 配置查询方法,查询命令截图a.查询命令 DSP S1b.查询命令 DSP SCTPLINK1.4.1C.查询命令 DSP CELLd.查询命令 LST ALMAF1.5 LST ALMAF:;天津西青投资中心F-HLH[132887]+++ 天津西青投资中心F-HLH[132887] 2014-07-31 14:46:00O&M #173864%%/*35446265*/LST ALMAF:;%%RETCODE = 0 执行成功ALARM 2251 故障重要告警eNodeB 25952 中继系统告警同步号= 4534告警名称= 用户面承载链路故障告警告警发生时间= 2014-07-31 13:56:37定位信息= 用户面本端对象标识=0, 对端IP地址=100.72.92.80, 描述信息=eNB:MCC_460 MNC_00 GlobaleNBId_460-00-132502, 业务类型=X2附加信息= 基站制式=L, 影响制式=L, 部署标识=NULL附加信息1 = AF_L=天津西青投资中心F-HLH[132887]ALARM 2252 故障重要告警eNodeB 25952 中继系统告警同步号= 4535告警名称= 用户面承载链路故障告警告警发生时间= 2014-07-31 13:56:37定位信息= 用户面本端对象标识=0, 对端IP地址=100.72.52.235, 描述信息=eNB:MCC_460 MNC_00 GlobaleNBId_460-00-132527, 业务类型=X2附加信息= 基站制式=L, 影响制式=L, 部署标识=NULL附加信息1 = AF_L=天津西青投资中心F-HLH[132887]ALARM 2253 故障重要告警eNodeB 25952 中继系统告警同步号= 4536告警名称= 用户面承载链路故障告警告警发生时间= 2014-07-31 14:16:38定位信息= 用户面本端对象标识=0, 对端IP地址=100.72.72.164, 描述信息=eNB:MCC_460 MNC_00 GlobaleNBId_460-00-132609, 业务类型=X2附加信息= 基站制式=L, 影响制式=L, 部署标识=NULL附加信息1 = AF_L=天津西青投资中心F-HLH[132887](结果个数= 3)--- END注:但这里需要区别一下描述信息中的业务类型,只有显示业务类型=S1时,才会影响业务。
前言本手册简单介绍了LTE基本原理、网络结构、无线设备介绍、故障处理,旨在提高分公司网络维护人员、代维人员故障处理能力,保障电信LTE无线网健康运行。
第一部分基本概念篇1、LTE网络基本原理介绍对于LTE网络而言,主要得设计目标:●更小的时延,包括控制面连接建立时间(<100ms)和用户面数传的时间(<10ms)●支持更高的用户速率,在20M的频谱带宽分配内,下行和上行的峰值速率分别能达到150M bit/s和50M bit/s的要求●更高的频谱效率●支持inter-rat 移动性,例如GSM和WCDMA/HSPA●支持灵活的频谱分配来满足各种复杂频谱情况的需求●支持更简单、扁平的网络结构●手机终端的耗电控制在合理的范围内LTE网络技术特点:●LTE下行传送体系是基于OFDM,下行OFDM和上行SC-FDMA技术●LTE采用共享信道传输,在共享信道中time-frequency资源在各用户间实现动态分配,这点有些类似HSDPA●软合并的快速混合ARQ技术应用于LTE●LTE支持MIMO这种空间分集多路技术,显著的提高了传送速率●LTE支持灵活的频谱分配,双工技术既支持FDD,又支持TDD,带宽分配范围: 1.4,3,5,10,15 和20 MHz●支持SON技术LTE网络组网结构:2、LTE 无线设备介绍主设备BBU:本次发货典型配置:包含一块主控板(UMPT)、一块基带板(LBBP)、一块电源监控板(UPEU)、一块风扇板(FAN),结构如下图;2.1 主控板(UMPT板):主控板WMPT单板面板图如图所示:UMPT单板的功能为:●完成基站的配置管理、设备管理、性能监视、信令处理等功能。
●为BBU内其他单板提供信令处理和资源管理功能。
●提供USB接口、传输接口、维护接口,完成信号传输、软件自动升级、在LMT或M2000上维护BBU的功能。
2.2基带板(LBBP板)基带板(LBBP)面板如下图:LBBP单板的主要功能包括:●提供与射频模块的CPRI接口。
4G重要告警解析一、影响小区发射的告警1. ReachabilityProblem(基站退服或脱管)●Alarm Code:ReachabilityProblem●告警影响:e Node B 设备监控失去●告警原因分析:导致该告警的原因主要体现在三个方面:电源、传输、主控卡(C板)故障:1)电源:交流停电等,此时应该有相关环境告警上传;2)传输:传输断3)主控卡故障:主控卡出现掉死、无法正常启动、不断重启等故障;●告警解决方法:电源或传输问题,请相关人员解决;如果是主控卡故障,需要维护人员上站解决;更换主控卡后,需要先问网管人员要一个Yang WO 文件重新下软件并导入WO文件激活。
2.CB INIT FAILURE (C板初始化失败)●Alarm Code:IK4004001●告警影响:整站退服,设备可监控;●告警原因分析:C板故障或者高温导致●告警解决方法:需上站下电重启设备,或热插拔C板,若故障依旧需要更换C板,更换流程请参考ReachabilityProblem(基站退服或脱管)3. NO CONTACT TO BOARD (B板退服)●Alarm Code:IK4009041●告警影响:整站退服,小区不发射;●告警原因分析:若基站无C板或者GPS告警的话,则是B板故障●告警解决方法:网管重启基站不管用的话,需要上站更换,更换B板会自动下软件,基站侧不需要做任何操作,大概需要10分钟左右4. LTECellAdminDown (小区退服)●Alarm Code:LTECellAdminDown●告警影响:相应小区退服;●告警原因分析:一般都是由于基站硬件告警或者小区被lock所致●告警解决方法:首先排除小区或基站是否被locked,其次查看是否有导致小区退服的硬件告警5. NO CONTACT TO BOARD(RRH脱离)●Alarm Code:IK4009138●告警影响:某个RRH对应的小区不发射●告警原因分析:造成此告警的原因可能是电源,光纤及RRH故障●告警解决方法:需下站查看电源及RRH和C板连接的光纤衰耗,如果两种情况都正常的话,就要考虑RRH本身的问题了,最好的方法是塔上和别的正常小区做对调来排查6. CB LOS LOF CPRIPORT *(某个小区RRH脱离)●Alarm Code:IK4004030●告警影响:对应小区不发射●告警原因分析:造成此告警的原因可能是电源,光纤及RRH故障●告警解决方法:需下站查看电源及RRH和C板连接的光纤衰耗,如果两种情况都正常的话,就要考虑RRH本身的问题了,最好的方法是塔上和别的正常小区做对调来排查7.CB ALL CPRIPORTS FAILED (所有小区不RRH脱离)●Alarm Code:IK4004061●告警影响:所有小区不发射●告警原因分析:造成此告警的原因可能是电源,光纤及RRH故障●告警解决方法:需下站查看电源及RRH和C板连接的光纤衰耗,如果两种情况都正常的话,就要考虑RRH本身的问题了,最好的方法是塔上和别的正常小区做对调来排查8.CB TRANS RX LOS CPRIPORT * (某个RRH脱离)●Alarm Code:IK4004042●告警影响:造成此告警的原因可能是电源,光纤及RRH故障●告警原因分析:RRH掉电、不加电,RRH掉死,光纤故障,CCM板卡故障等原因都会出现RRH脱离告警;●告警解决方法:需下站查看电源及RRH和C板连接的光纤衰耗,如果两种情况都正常的话,就要考虑RRH本身的问题了,最好的方法是塔上和别的正常小区做对调来排查;9. CB GPS ANT●Alarm Code:IK4004082●告警影响:GPS时钟不同步,长期告警会造成整站退服●告警原因分析:GPS天线安装问题或者接头等问题●告警解决方法:检查GPS天线及各个接头,告警同时会伴随产生以下告警IK4004012,IK4004014,IK4004157(GPS锁卫星失败)10. ANTENNA_PORT TX VSWR THRESH2(2级驻波)●Alarm Code:IK4011011●告警影响:小区不发射●告警原因分析:天馈接口问题●告警解决方法:下站基站馈线头是否松动或者进水等等11. ANTENNA_PORT GAIN CONTROL TX(天线口传输主分支增益已经超出范围)●Alarm Code:IK4011005●告警影响:小区不发射●告警原因分析:RRH硬件故障●告警解决方法:step1:SAM侧重启该RRH。
LTE相关故障定位指导书一、常用维测手段1)基本原则硬件问题原则:通过下电复位、拔插单板操作,解决的问题,不用更换单板,不需返板分析,可以继续使用。
1、基带板问题三板斧:1、使用下电、上电命令(OPR BRDPWR)复位单板;2、复位主控板(RST BRD);3、拔插单板及换板。
2、主控板问题三板斧:1、复位主控板;2、拔插主控板;3、更换主控板3、RRU问题三板斧:1、光功率仪测试RRU端收发光功率;2、下电、再上电;3、更换RRU4、光模块问题三板斧:1、同好的光模块(带光纤)交叉验证;2、更换光模块或光纤;3、复位两端设备及更换设备。
2)指示灯状态与含义风扇板指示灯说明二、典型问题2.1主控板相关问题1 主区版本不可用告警故障说明:基站有主区和备区两个存储区域,主区用于存放系统当前运行的软件版本,备区用于存放上一个软件版本。
当网元启动过程中,出现主区软件版本不完整或者为空,或者无法识别主区软件时,产生此告警。
处理对策:1、检查备区版本是否正常:执行MML命令LST SOFTWARE查询网元软件版本,根据版本状态判断备区版本是否可用。
若备区可用,并且版本号同主区版本一致,激活备区版本2、重新下载基站软件,并激活。
3、若连续3次下载单板软件都失败,请更换主控板。
4、重新下载并激活软件后,若故障仍然还在,请联系华为研发分析。
问题2 单板硬件故障告警故障说明:主控板出现这个告警的情况较少,常见的故障主要是电源、时钟异常或关键器件自检和加载失败。
处理对策:1、对单板进行下电复位操作。
2、拔插单板,看故障是否解决。
3、将单板插入其它槽位测试,确认是否有相同故障,若更换槽位后单板无故障,那故障可能是软件异常引起,可排除单板硬件故障。
4、提取主控板一键式日志,发送给研发分析。
5、更换主控板。
问题3 板间CANBUS通信异常告警故障说明:CANBUS是一种总线,用于管理基站设备。
当主控板无法通过CANBUS与单板进行通信时,产生此告警。
目录1 版本信息 12 前言 23 常见故障处理 23.1 告警Disk Volume C Full 23.2 告警Disk Volume D Full 33.3 告警FanFailure 43.4 告警loss of synch reference redundancy 63.5 告警Gigabit Ethernet Link Fault 73.6 告警Synch Reference Path HW Fault 93.7 告警NoContact 103.8 告警License Key File Fault 123.9 告警NTP Server Reachability Fault 123.10 告警Plug-In Unit General Problem 133.11 告警Power feeding fault 151 版本信息日期版本修订信息2013年5月10日初稿2 前言本文档描述了爱立信LTE EnodeB基站的一些常见故障现场处理方法。
本手册适用于RBS6000系列。
软件版本为L12B。
本文档的目的在于提供现场操作流程以及故障处理方法的中文描述,以帮助了解一些常见故障的处理过程,实际操作时请严格按照爱立信的ALEX文档步骤进行。
3 常见故障处理3.1 告警Disk Volume C Full3.1.1 故障描述Disk Volume C Full是一个主要告警,这个告警由MO ManagedElementData发出。
如果Main Processor(主处理器MP)的C卷上存储的数据过多,会导致该卷的可用空间耗尽或几乎耗尽,此时系统会发出Disk Volume C Full告警。
系统一般每隔15分钟对C卷进行一次检测,如果可用空间小于等于MO ManagedElementData的属性minimumHdVolumeCFreespace的值(单位为兆),告警就会出现。
只要可用空间比minimumHdVolumeCFreespace的值大1M,告警就能消除。
大唐LTE站点告警处理指导手册一、小区退服➢告警解释:故障小区业务全阻,不能提供任何服务➢可能原因:1、射频单元不在位;2、辅光口故障;3、人为去激活小区;4、GPS故障;5、传输故障;6、基带板故障。
➢处理步骤:1、查找故障站点;2、查看承建故障小区的射频单元是否在位,物理设备-射频单元拓扑,如下图,一般情况小区1~3分别建立在射频单元拓扑0~2上。
射频单元不在位告警处理方法:(1)远程确认现场供电是否正常;(2)近端更换光模块观察告警是否恢复;(3)近端更换光纤观察告警是否清除;(4)近端更换RRU观察告警是否清除。
请参考“射频单元不在位告警”处理方法故障告警依然没有恢复,请联系大唐工程师。
如果射频单元存在,则转步骤3处理;3、查看承载小区射频单元接入BBU的光口信息,如下图,射频单元0接入基站板卡槽位号为4,射频单元光口1接入板卡光口号为0,射频单元光口2(辅光口)接入板卡光口号为1;查看光模块光口信号,位置物理设备-机架-机框-板卡-光模块,如果对应光模块的光口信号丢失状态为丢信号,请参考“BBU Ir光链路光信号丢失告警”处理方法;如果没有丢信号,则转步骤4处理;4、请查看操作记录,确认人为去激活小区原因;如果不是人为去激活,则转步骤5处理;5、查看基站GPS工作状态是否正常,位置物理设备-时钟信息-当前时钟,如果当前时钟不是锁定状态,请参考“GPS告警”处理方法,如果当前时钟是锁定状态,转步骤6处理;6、查看传输链路信息是否正常,如果链路公共信息是故障,请参考“S1链路断开告警”处理方法。
故障告警依然没有恢复,请联系大唐工程师。
二、基站退服➢告警解释:基站所有小区业务全阻,不能提供任何服务➢可能原因:1、传输故障2、时钟故障3、基带板卡退服即所有小区退服后,上报基站退服告警。
➢处理方法:1、查找故障站点;2、查看基站传输链路是否故障如下图,传输管理-SCTP链路,如果SCTP链路建立状态不是与对端建立成功,运行状态为故障,请参考“S1链路断开告警”处理方法;如果传输链路运行正常,转步骤3处理;3、查看时钟是否故障如下图,时钟可用状态为不可用,时钟运行状态为Holdover超时状态,请参考“时钟holdover超时”告警处理方法;如果时钟可用状态为可用,时钟运行状态锁定状态,如下图,则转步骤4处理;4、查询基带处理板是否故障或不在位,如下图(仅供参考)。
TD-LTE产品维护手册
1、基站操作维护常用命令
●LTE登陆IP:局向设置为192.168.0.49 电脑IP设置为192.168.0.X
255.255.255.0
●查询RRU光路信息: DSP SFP
●查询RRU驻波状态: DSP VSWR
●查询基站版本命令:LST SOFWARE
●查询盲启开关命令:DSP DHCPSW
2、近端处理光路故障
●TDS侧光路查询可使用命令DSP OPINFO 查询原有TDS光路好坏,是
否有光衰,通过查看BBU和RRU光口的输入输出功率来确定。
●LTE侧光路查询可使用命令DSP SFP 查询光路好坏,是否有光衰,目前
开站要求收发光功率一般不小于1500,最小不能小于1000 。
3、近端处驻波故障
●现网驻波值门限一般设置为1.5,LTE开通后门限一般都改为1.8了,也
就是说如果驻波值不超过1.8,是不会上报驻波告警的。
TDL 的通道编号为0~7,驻波可通过命令DSP VSWR 来查询。
●TDS的通道编号为1~8,驻波可通过DSP RRUPARA 来查询
4、基站近端登陆可查到的常见告警
5、故障处理流程和方法
(1)故障处理流程:
●故障处理流程包括以下几个环节:备份数据、收集并记录相关信息、确定
故障范围和类别、定位故障原因、故障排除、确认故障是否被排除、记录故障处理过程。
6、故障处理方法
●备份数据
为确保数据安全,在故障处理的过程中,用户应首先保存现场数据,备份相关数据库、告警信息、日志文件等。
●故障信息收集
故障信息是故障处理的重要依据。
任何一个故障的处理过程都是从维护人员获得故障信息开始,维护人员应尽量收集需要的故障信息。
●确定故障范围和类别
根据故障现象,确定故障的范围和种类。
●定位故障原因
故障定位就是从众多可能原因中找出故障原因的过程,通过一定的方法或手段分析、比较各种可能的故障成因,不断排除非可能因素。
7、常用故障维护功能
●用户跟踪
用户跟踪基于用户号码,可以按照发生时序完整的跟踪用户的标准接口、内部接口消息、内部状态信息,并显示在屏幕上。
●接口跟踪
接口跟踪基于某个标准(或内部)接口,可以按照发生时序完整的跟踪该接口上的所有消息,并显示在屏幕上。
●对比/互换
对比/互换可以帮助用户判断故障的范围或位置。
●倒换/复位
倒换用于确定主用设备是否异常或者主备用关系是否协调;复位主要用于排除软件运行异常。
8、处理小区类故障
●小区不可用故障是在当基站检测到小区激活失败导致小区业务不可用时,
产生此告警。
9、处理IP 传输类故障
IP 传输故障是指通信的设备之间无法正常交互报文、业务不通,并且无法Ping 通对端设备。
10、LMT介绍及使用
LMT 计算机与BBU3900 连接
(1)BBU3900 (2)交叉网线/USB 转网口的线缆(3)LMT 计算机
●在浏览器地址栏中输入eNodeB 主控板的近端维护IP 地址(默认的IP
地址为:192.168.0.49),进入“本地维护终端”的登录界面
●eNodeB LMT 主要用于辅助开站、近端定位和排除故障。
●LMT 界面介绍
11、GPS故障处理技术案例(处理过程)
●若为GPS状态告警,原因值为GPS开路或短路,首先检查GPS天线的
物理连接是否出现异常,接口是否存在松动或渗水现象;如果都正常则可能为GPS天线故障或MPT单板星卡问题,可尝试更换处理。
●若为时钟源状态或锁相环告警,首先用DSP GPS查询该站点的GPS收
星个数,每隔1分钟查询一次,连续查询5次,如果收星个数小于等于4颗则基本可以判定是"GPS收星不足问题"。
这时需要检查GPS天线的安装位置及环境是否符合要求。
●请检查天线安装是否存在某个方向上的遮挡;
●请检查天线周围是否存在同频段的干扰(GPS频段为1.6G左右)。
观察
GPS天线周围,看是否存在大功率的微波发射天线,看附近是否存在高
压输电电缆以及电视发射塔的发射天线等电磁干扰源。
●检查星卡到底板的连接线是否连接正常。
用万用表测试主控板SMA头,
测量电压应为5V左右。
●若GPS收星个数超过4个,但仍然存在时钟源状态或锁相环告警,则可
能是周边环境存在GPS信号频段的干扰,需排查干扰源或改变GPS安装位置解决。
12、RRU不可用告警技术案例(处理过程)
●首先检查RRU的运行状态,看是否掉电。
如RRU在电运行,查看光口状
态。
●BBP与RRU之间没有拉光缆,通过一根光纤直接相连,光口为红色。
(注;
此时应为多模光纤多模模块)
●首先查看BBP侧与RRU侧光模块是否匹配,例如BBP侧是多模光模块,
但RRU侧是单模光模块。
如果两端光模块一致,用好的光模块把它们都换下,在查看状态,定位是否为光模块故障引起的告警。
如果此时告警还存在,再换上一根好的光纤,定位是否为光纤故障引起的告警。
如果告警依然存在,再更换好的RRU或者BBP单板,定位是否为硬件故障引起的告警。
●BBP与RRU之间距离较远,中间通过拉光缆相连,光口为红色。
(注:
此时应为单模光纤单模模块)
●首先查看BBP侧与RRU侧光模块是否匹配。
如果两端光模块一致,用好
的光模块把它们都换下,在查看状态,定位是否为光模块故障引起的告警。
如果告警还存在,就把RRU侧和BBP侧的光纤都拿到BBP侧,把它们依次打环,观察BBP的指示灯,变绿色说明光纤正常,模块正常,打环时用的法兰盘,BBP单板正常。
如果两端光纤检测后发现都没问题,先把BBP侧光纤还按原来的位置插好,在到RRU那一侧通过ODF盒对中间光缆到BBP之间的光路进行打环测试,观察BBP指示灯状态,这是检查中间的光缆是否存在问题。
如果中间牵涉到跳纤,还要到跳纤点往BBP 侧进行打环测试及检查跳纤时是否跳错。
●检测后发现都没问题,再用光功率表检测BBP到RRU间光路的收发是否
冲突。
如果都没问题,再更换好的BBP或者RRU,在观察。
●在基站查询RRU的版本是否与基站版本一致。
13、RRU驻波告警处理技术案例(处理过程)
根据告警信息进行故障定位处理:
●当NodeB检测到现场RRU射频通道馈线接口呈现不牢固状态,RRU驻
波告警指示灯红色常亮。
当NodeB与施工队将此馈线接头重新安装后指示灯常灭,告警恢复。
●RRU射频通道异常告警:当NodeB将RNC所告知告警通道的馈线与其
他正常通道互换对接,从RNC得知告警仍处于原状态。
当NodeB将校准线重新检查安装后告警消失。