LTE站点业务链路故障分析_控制面故障定位
- 格式:ppt
- 大小:2.62 MB
- 文档页数:10
FAQ-TD站点常见故障告警处理一、射频单元RRU类告警 (2)1.1、射频单元驻波告警 (2)1.2、射频单元通道异常告警 (3)1.3、射频单元校准通道异常告警 (3)1.4、射频单元通道幅相一致性告警 (4)1.5、射频单元发射通道增益异常告警 (5)1.6、射频单元下行输出功率异常告警 (5)1.7、射频单元硬件故障告警 (5)1.8、射频单元时钟异常告警 (6)1.9、射频单元光接口性能恶化告警 (6)1.10、BBU连接的射频单元交流掉电告警 (6)1.11、射频单元配置但不可用告警 (7)二、基带单元BBU类告警 (7)2.1、BBU IR光模块收发异常告警 (7)2.2、BBU IR接口异常告警 (8)2.3、BBU IR光接口性能恶化告警 (9)2.4、光模块混插告警 (9)2.5、单板心跳检测失败告警 (9)2.6、单板硬件故障告警 (10)2.7、单板温度异常告警 (10)2.8、单板时钟输入异常告警 (11)2.9、BBU单板维护链路异常告警 (11)三、GPS类告警 (12)3.1、星卡天线故障告警 (12)3.2、时钟参考源异常告警 (13)3.3、系统时钟失锁告警 (13)3.4、星卡维护链路异常告警 (14)3.5、星卡时钟输出异常告警 (14)一、射频单元RRU类告警1.1、射频单元驻波告警告警影响:射频单元RRU发射通道的天馈接口驻波超过了设置的驻波告警门限,对于单通道RRU,该RRU的覆盖区域的业务会中断;对于多通道RRU,发射功率下降,小区覆盖减小。
可能原因与处理建议:1)DSP RRUPARA查询射频单元的驻波值与驻波告警门限2)用负载堵住告警端口,告警恢复,则排查RRU故障,否则更换RRU3)检查天馈接口的馈缆接头是否拧紧或进水4)尝试更换或倒换馈线,重启RRU,观察告警是否恢复5)检查对端天线、合路器是否正常,如故障则予以更换小结:上站处理前建议携带堵头或小天线、RRU馈线及接头等,定位问题时需要用到1.2、射频单元通道异常告警告警影响:下行通道或者上行通道故障,影响小区边缘处的用户接入成功率和边缘处HSDPA用户的速率可能原因与处理建议:1)跟网管确认是否存在“射频单元驻波告警”、“射频单元通道异常告警”,如有,则先处理该告警//////驻波导致通道异常2)执行MML命令RST RRU,远程复位射频单元3)近端检查故障通道与天线的连接4)将故障通道和无故障通道馈线调换,如果告警跟随馈线倒换,则判断是馈线问题,更换故障通道馈线5)如果通道馈线调换后告警没有变化,则判断是RRU问题,更换故障RRU 小结:上站处理前建议携带堵头、RRU馈线及接头等,定位问题时需要用到,准备好相关备件,每次调换通道馈线来判断故障点时,最好重启一下射频单元RRU1.3、射频单元校准通道异常告警告警影响:多通道的RRU的校准通道出现故障,导致无法完成通道的校准功能,小区覆盖减小可能原因与处理建议:1)执行MML命令RST RRU,等待10分钟左右,判断告警是否恢复2)近端检查校准馈线与天线的连接3)将故障通道和无故障通道馈线调换,如果告警跟随馈线倒换,则判断是馈线问题,更换故障通道馈线4)如果通道馈线调换后告警没有变化,则判断是RRU问题,更换故障RRU小结:上站处理前建议携带堵头、RRU馈线及接头等,定位问题时需要用到,准备好相关备件,每次调换通道馈线来判断故障点时,最好重启一下射频单元RRU1.4、射频单元通道幅相一致性告警告警影响:宏站RRU对每个载波下所有通道进行幅度相位的校准时,出现了某个载波下的某个通道的幅度异常:影响小区边缘处的用户接入成功率;影响小区边缘处的HSDPA用户的速率可能原因与处理建议:1)跟网管确认是否同时存在“射频单元驻波告警”、“射频单元通道异常告警”,如有,则先处理该告警2)执行MML命令RST RRU,远程复位射频单元3)近端更换故障RRU4)如以上操作后,告警仍未恢复,请联系网优工程师远程检查同频干扰问题(更换载波对应的频点观察告警是否恢复)小结:上站处理前携带相应备件,如需复位或更换射频单元RRU,会中断业务,请在话务量较小时处理1.5、射频单元发射通道增益异常告警告警影响:射频通道的空口实际输出功率与期望功率不一致,可能会影响业务。
室分问题定位思路1.分析思路根据室分问题,将问题分类,进行排查,并参考吞吐量排查指导书,排查告警、传输、配置方面的问题。
(告警、传输这些都是基础,务必要核查)RSRP覆盖是关键因素,室分系统SINR一般都不会太差,没有干扰.RSRP过高或者过低,都会对终端解调性能产生影响;RSRP过关后,再排查传输和来水量问题,防止FTP服务器或者传输导致的来水量不足导致的吞吐量异常;以上都没有问题后,对于双流室分,需要排查通道是否平衡;最后在所有问题都排查完,依然没有进展时,外接小天线进行对比测试,更直接的排出产品侧问题.2.覆盖类问题2.1. RSRP过高问题多个室分测试发现终端接收RSRP过高,(尤其是营业厅室分)会造成接收器件的削波,下载经常出现误码,有时很高,导致吞吐量下降。
2.1.1.案例1福营WE RSRP过高导致速率波动以下是福营WE营业厅测试数据:平均速率为32mbps,RSRP均值为—50.62dBm,SINR均值为29。
42dB,如下:➢下载速率图➢RSRP图➢SINR图2.1.2.案例2翠竹服营厅RSRP过高导致速率波动天线下方测试RSRP达到-50dB左右,下行速率波动较大,误码率较高移动到营业厅外进行测试2021-11-53页,共14页2.1.3.问题分析需要核对室分施工图纸,目前出现问题较多的是营业厅场景,室分规划RRU出口0。
1dBm,实际后台配置为12.2dBm,相差12dB,这就导致天线口功率过强。
2.1.4.解决方案单验时可让后台降低RS功率,双流室分最低可降低5dB,单流室分最低可降低7dB。
后续推动室分添加对应衰减器,务必保证天线下测试RSRP低于—60dBm同时对测试人员要求,测试点选择也需要符合这个标准,特殊情况可选择室分外进行测试。
2.2. RSRP过低问题一般来说问题是室分引入的较多。
排查产品侧问题跟踪RRU输出功率检测,如果输出功率正常,则基本可确认为室分系统问题。
LTE故障处理手册重大故障处理方法1.重大故障实时告警列表告警类别告警设备表述描述可能的原因及影响华为ENODEB网管批量网兀断链或小区不可用基站断电,或大批量双模站点TD测GPS故障传输设备网管批量网兀断链基站断电,或传输原因中断2.重大故障处理步骤•【批量基站断站或小区不可用】•原因分析基站批量断点或或批量双模站点TD测GPS出现故障及传输设备故障•关注重点批量基站断站或小区不可用•常见处理方法序号处理方法“是”“否”1联系传输人员,看是否为传输设备故障422联系代维人员确定基站是否断电533联系代维人员确定基站是否为双模基站并确定TD测GPS完好54通知传输人员处理65通知代维人员处理66结束1.实时告警分类总表告警等级口警号告警名称本机网管紧急网元连接中断ENODEB重要29243小区服务能力下降告警重要19240小区不可用告警重要26205BBU单板维护链路异常告警重要29207基站控制面传输中断告警重要25621直流输出异常告警重要26276制古同寺上占耐罟油奉壬敛制式冋站点配置冲突□警重要26238RRU组网拓扑类型与配置不一致告警重要BBP心跳检测失败告警重要26529射频单元驻波告警重要26322BBU测收发光异常告警预处理告警分类2.主要告警分析和常见的处理手段。
1)【网元链接中断】•告警解释:网元与OMC 网管之间的链接中断,一般来讲,为断电或传输问题 •对系统的影响 对该网元无法控制nriuDiAh71U2&b^ .nJ&A帕1U 牡QK 靳.naNA h■1710 359^1,.Ah 了江箔了淞广.nh7156Gig ;Arhsuiaassfej..m世界阖中心,主揺LTE羊辭扌斤工區蹄大酒JTTFflM.H BimjfAttLTE诵育乐屮则豊花』乳JE丸厦JEM』新华医?克n^tS-'resM」Jjf学妬:国乩怔射』J 杭姑市鱼■査居启叽M2)【29243 :小区服务能力下降】ittr^-TESM_U^rtta^EsMZZtlEM曲I住耳皆辰北酣巾酣屢痊汀惡齐花丘丽祥sI琢勿葩H•告警解释当基站射频资源或基带资源不能满足当前小区的配置规格时,产生此告警•对系统的影响告警小区提供给客户可用的无线空口资源会减少。
故障总结目录故障总结 (1)告警部分 (2)1.System module failure (0010) (2)2.BTS reference clock missing (1898) (3)3.Configuration error: Unit initialization failure (0012) (3)4.Configuration error: Not enough HW for LCR (1868) (3)5.Configuration error: Power level not supported (4008) (4)6.Cell configuration data distribution failed (6253) (4)7.Failure in optical RP3 interface (4064) (4)8.Failure in optical RP3 interface (0010) (5)9.Baseband bus failure (3020,1906) (5)10.RF module failure (6259,1911、1711、1712) (5)11.Cell power failure (4090) (6)12.GPS Receiver alarm: Control Interface not available (4011) (7)13.X2 interface setup failure(6304) (7)14.Transport layer connection failure in X2 interface (7)15.Failure in replaceable baseband unit (7)16.Temperature alarm(0002) (8)17.VSWR(1838) (8)18.Failure in optical RP3 interface (2004) (8)19.GPS时钟盒闪断,时钟信号不正常,无法识别RRU (9)20.Failure in optical RP3 interface(2000) (9)21.光纤交叉连接 (9)22.基站始终无法建立S1连接,只到configed状态 (9)23.某一个小区的RRU无法识别 (10)24.BBU版本无法识别 (11)26.校准初步排查 (11)27.本地IP地址和路由正常,ping不通MME和网关 (12)28.TRS文件始终无法生效 (12)29.远程ping不通基站(断链) (12)31.风扇告警 (13)32.BTSlog有link消息,但是pinger始终不亮 (13)34.pinger正常,但是SM里小区显示橙黄色告警 (13)36.FOSI 和FOSN的光功率范围 (13)38.MAC绑定及载波冲突 (13)39.传输不通 (14)40.升级完成后出现驻波告警 (14)案例部分 (14)特殊操作部分 (20)1、登录RRU 查看RRU光路状态。
LTE相关故障定位指导书一、常用维测手段1)基本原则硬件问题原则:通过下电复位、拔插单板操作,解决的问题,不用更换单板,不需返板分析,可以继续使用。
1、基带板问题三板斧:1、使用下电、上电命令(OPR BRDPWR)复位单板;2、复位主控板(RST BRD);3、拔插单板及换板。
2、主控板问题三板斧:1、复位主控板;2、拔插主控板;3、更换主控板3、RRU问题三板斧:1、光功率仪测试RRU端收发光功率;2、下电、再上电;3、更换RRU4、光模块问题三板斧:1、同好的光模块(带光纤)交叉验证;2、更换光模块或光纤;3、复位两端设备及更换设备。
2)指示灯状态与含义风扇板指示灯说明二、典型问题2.1主控板相关问题1 主区版本不可用告警故障说明:基站有主区和备区两个存储区域,主区用于存放系统当前运行的软件版本,备区用于存放上一个软件版本。
当网元启动过程中,出现主区软件版本不完整或者为空,或者无法识别主区软件时,产生此告警。
处理对策:1、检查备区版本是否正常:执行MML命令LST SOFTWARE查询网元软件版本,根据版本状态判断备区版本是否可用。
若备区可用,并且版本号同主区版本一致,激活备区版本2、重新下载基站软件,并激活。
3、若连续3次下载单板软件都失败,请更换主控板。
4、重新下载并激活软件后,若故障仍然还在,请联系华为研发分析。
问题2 单板硬件故障告警故障说明:主控板出现这个告警的情况较少,常见的故障主要是电源、时钟异常或关键器件自检和加载失败。
处理对策:1、对单板进行下电复位操作。
2、拔插单板,看故障是否解决。
3、将单板插入其它槽位测试,确认是否有相同故障,若更换槽位后单板无故障,那故障可能是软件异常引起,可排除单板硬件故障。
4、提取主控板一键式日志,发送给研发分析。
5、更换主控板。
问题3 板间CANBUS通信异常告警故障说明:CANBUS是一种总线,用于管理基站设备。
当主控板无法通过CANBUS与单板进行通信时,产生此告警。
LTE常见告警故障分析1.1光口接收链路故障原因分析:•光纤有损坏•光模块问题•ODF架处法兰盘有光损•近端、远端之间的线路故障处理方法:•根据所出的光口接收链路故障的位置(基带处理板光口或RRU光口)更换相应的光纤•同上,更换相应的光模块•排除以上2种原因外,可试更换光纤连接处的法兰盘•可通过在远近端处互相发光、收光,以此判断线路是否存在故障1.2RRU链路断原因分析:•RRU掉电•光路故障•光模块损坏•基带板故障引起RRU链路断处理方法:•检查RRU是否上电•如果RRU正常上电,排除光模块或光路是否有光损•观察基带板指示灯闪烁状态是否正常,如异常,如此先插拔基带板使其复位;如果以上因素全都排除,如此更好RRU1.3天馈驻波比异常原因分析:•RRU通道接口与天线端口之间连接的跳线未连接好•设备接口渗进雨水• RRU与天线端口之间连接的跳线有损坏•RRU内部出现故障处理方法:•检查RRU通道接口与天线端口之间连接的跳线是否连接好,重新连接•检查RRU故障通道口内是否有渗进雨水,如有,需清理干净;另外设备被雨水浸泡后会有所腐蚀生锈,可用砂纸打磨后重新连接•如无以上情况,请尝试更换跳线,之后重启RRU,查看是否还会出现驻波比告警•通过以上操作后再出现,直接更换RRU1.4天线校正失败原因分析:•LTE天线校正序列发射电平上下行为同一个DV参数,经过研发部门分析600版本中默认的下行校正序列发射电平过大,有可能会导致局部RRU校正序列接收电平饱和,导致校正失败。
处理方法:•修改DV参数降低校正序列发射电平后,可以躲避由此造成的天线校正失败问题。
•经过修改DV参数仍然出现此告警,如此更换RRU室外的话TD通常是通道馈线分为9铲除了八个通道之外还有一个校准线,如果那个接错了会造成通道功率校准失败,驻波比忽高忽低。
可能是校准线损坏,更换校准跳线就行了;也可能是校准通道故障,这个就要更换RRU 设备了。
1.5智能天线校准异常原因分析:•智能天线校准线缆连接故障•RRU内部故障处理方法:•更换RRU校准通道跳线•更换RRU校准通道跳线无效,直接更换RRU1.6输入电压异常原因分析:•输入电压异常一般常见于拉远站,由于室外交转直电源柜供电功率不足或接电异常会导致出现此故障处理方法:•检查设备电源线与电源柜是否有连接问题•如连接没问题,如此考虑电源柜所带设备是否过多,可减少连接的设备或增加电源柜解决此问题1.7基站退出服务原因分析:•基带板故障•如果1个基站的所有RRU光口链路故障、设备掉电或其它原因导致RRU链路断,如此会引起基站退出服务•数据有误:无线参数—>TD-LTE—>资源接口配置—>基带资源:未调整RRU通道口为2即LTE通道处理方法:•检查BBU基带板指示灯闪烁状态是否正常,可试插拔复位,待查看告警是否消除•假如基带板无故障,通过光功率计等测试仪确定光路光信号是否有衰减,查看整站RRU是否有掉电情况发生•以上情况均排除后,检查后台数据是否有误即资源接口配置—>基带资源:查看RRU通道口(LTE通道)是否已调整为2 (此情况只适用于室分的双通道RRU) 1.8内部故障原因分析:•RRU内部时钟类出现异常处理方法:•先查看故障小区是否存在其它告警,如:驻波比告警、RRU功率检测异常、输入电压异常等,假如有,先排除此类告警•假如无其它告警,如此对设备下电复位,此告警如再次出现,直接更换RRU1.9基站同步异常、没有可用的空口时钟源、GNSS天馈链路故障原因分析:•一个基站如果GPS出现故障,这3种告警如此会同时出现•未连接GPS•已连接GPS,但室内外接头处接触不良•GPS馈线有弯折等硬伤•主控板损坏处理方法:•首先应检查机房和室外是否连接GPS•如已连接,如此检查室内外GPS直弯头处连接情况,重新连接•重新连接后告警仍不能消除,如此需检查GPS馈线是否有弯折类的硬伤,假如有,如此更换新的馈线•以上因素排除后告警仍不能消除,如此直接更换主控板1.10设备掉电原因分析:• RRU所接市电停电•有市电但RRU因内部故障不上电处理方法:•先检查RRU所接市电是否有电,如果停电,待市电恢复后查看告警•如果有市电,但RRU未显示上电,掉电重新上电RRU假如仍无反映直接更换RRU1.11单板通讯链路断原因分析:•单板掉电•BBU的PM板供电功率不足•主控板故障导致其他单板不能正常上电•单板软件故障、反复重启处理方法:•热插拔单板复位后,查看单板是否正常•如果插拔无反响,计算PM板供电功率是否满足当前BBU 的所有单板所需功率•如果PM板无本身无故障,供电功率也满足,需查看主控板是否正常•以上因素排除后告警仍不消除,直接更换该单板1.12硬件类型和配置不一致原因分析:•实际设备连接的单板与OMC配置的单板类型不一致处理方法:•根据实际需要,更换前台所插单板或修改后台配置的单板类型1.13网元断链告警原因分析:•前后台数据不一致•机房设备掉电•传输线路光缆断•主控板故障处理方法:•在站点已开通的情况下出现网元断链,需检查后台数据是否有修改导致前后数据不一致•如果数据一致,核实机房设备是否掉电•核查传输线路光缆是否断开•排除以上因素外,核实BBU的主控板是否出现故障(软件故障、单板电路损坏等),如果有此类故障,更换主控板1.14X2断链告警以下三条都会影响切换的,无论出现哪条,都代表X2链路出现了问题。