TD-LTE eNodeB故障排查
- 格式:pptx
- 大小:1.67 MB
- 文档页数:22
eNodeB常见故障处理指导书目录Table of Contents1站点断链 (4)1.1问题现象 (4)1.2原因分析 (4)1.3处理建议 (4)1.4信息反馈 (5)2驻波过高问题 (5)2.1问题现象 (5)2.2原因分析 (5)2.3处理建议 (5)2.4信息采集 (6)3光接口类型故障 (7)3.1问题现象 (7)3.2原因分析 (7)3.3处理建议 (8)3.3.1BBU CPRI光模块故障告警/射频单元光模块故障告警 (8)3.3.2BBU CPRI光接口性能恶化告警/射频单元光接口性能恶化告警 (8)3.3.3BBU光模块收发异常告警 (8)4RRU断链 (9)4.1问题现象 (9)4.2原因分析 (9)4.3处理建议 (9)4.4信息采集 (10)5单板硬件故障 (10)5.1问题现象 (10)5.2原因分析 (11)5.3处理建议 (11)5.4信息采集 (11)6X2接口故障 (11)6.1问题现象 (11)6.2原因分析 (11)6.3处理建议 (12)6.4信息反馈 (12)7小区服务能力下降 (12)7.1问题现象 (12)7.2原因分析 (12)7.3处理建议 (12)7.4信息采集 (14)1 站点断链站点断链问题可大致分为开站失败问题和开站完成后站点断链问题。
开站相关问题处理方法在《eRAN6.1 eNodeB 开站问题定位指导书》已有详细描述,故在本文中不再赘述。
下面着重讨论开站完成后站点断链问题的处理方法。
1.1 问题现象M2000上报告警源为OSS的“ALM-301 网元连接中断告警”并且在M2000主拓扑上显示的图标左上方多出一个红叉,如。
1.2 原因分析此处站点断链指的是站点脱管,M2000不能进行站点维护,也不能通过远端登陆LMT的方法进行维护。
如果站点脱管M2000会周期性(30秒)的向eNodeB发送OM通道的链请求。
1.3 处理建议●确认此站点在M2000上信息在M2000拓扑上找到此站点,右键->属性,打开后确认eNodeB的IP地址和连接类型是否正确;●确认M2000上是否安装此版本适配层在M2000 -> “软件”> “软件浏览”-> “OSS服务器”-> “OSS”-> “Mediation”中查找此站点的版本对应的适配层已安装到M2000上;●找IPRAN侧的同事确认M2000到网元的传输是否正常;●上站处理使用DSP SFP查看对应光口是否有接收光,如果没有需要排查光纤光模块。
LTE故障处理手册一.重大故障处理方法2.重大故障处理步骤●【批量基站断站或小区不可用】●原因分析基站批量断点或或批量双模站点TD测GPS出现故障及传输设备故障●关注重点批量基站断站或小区不可用●常见处理方法二.告警预处理告警分类2.主要告警分析和常见的处理手段。
1)【网元链接中断】●告警解释:网元与OMC网管之间的链接中断,一般来讲,为断电或传输问题●对系统的影响对该网元无法控制4 结束2) 【29243:小区服务能力下降】●告警解释当基站射频资源或基带资源不能满足当前小区的配置规格时,产生此告警●对系统的影响告警小区提供给客户可用的无线空口资源会减少。
9 结束查询RRU配置通道:查询基站当前告警信息:查询驻波:查询光模块型号,速率:3)【19240:小区不可用告警】●告警解释当基站检测到小区不能提供业务时,产生此告警。
●对系统的影响告警小区不能提供业务。
查询小区是否可用:查看RRU是否有告警:查询光路是否OK:查询GPS是否可用:查看是否有License告警:4) 【29207:基站控制面传输中断告警】(注:由于网元断链,网管无法对基站控制)●告警解释当基站所有SCTP链路状态都异常时,产生此告警。
●对系统的影响基站所有承载S1Interface、X2Interface的SCTP链路(链路个数不少于2条)状态都异常,导致基站所有S1接口、X2接口无法建立成功,小区无法激活,用户无法入网。
●告警处理5)【26233:BBU IR光接口性能恶化告警】●告警解释当BBU的IR端口上的光模块的接收或发送性能恶化时,产生此告警。
●对系统影响1、光模块的收发性能严重恶化,可能导致IR链路承载的业务质量严重下降,或导致下级射频单元业务中断。
2、光模块的收发性能轻微恶化,可能导致射频单元该IR链路承载的业务质量出现轻微恶化。
查询RRU收发光:6)【26260:系统时钟不可用告警】●告警解释当基站使用本地晶振的时间超过其可保持的时限时,产生此告警。
NodeB常见故障排查方法目录一.小区退服告警,nodeb退服告警 (3)二.GPS及SYN故障 (4)三.GPS保持状态告警故障 (6)四.RRU板卡心跳丢失告警、CPB板光纤链路信号丢失(LOS,LOF)告警 (9)五.RRU1308C(RRU1308Ci)(三维)天线通道幅相一致性告警 (10)六.天线驻波比告警: (16)一.小区退服告警,nodeb退服告警小区退服告警:顾名思义,就是指这个小区服务不可用了,不能做任何的CS,PS业务。
Nodeb退服告警:顾名思义,就是指这个nodeb的所有小区均不可用,当这个nodeb的所有小区都退服后,那么便会伴随产生Nodeb退服告警。
产品型号:NB1306A +8通道RRU或1通道RRUNB1327A +8通道RRU或1通道RRUNB1324A +8通道RRU或1通道RRU软件版本:均适用此nodeb的退服小区或者整个nodeb退服的小区均不可用,UE无法搜索到该站信号,无法在退服小区和退服nodeb做任何业务。
造成该故障的原因比较多,举如下几个例子:(1)RRU软硬件故障,比如所有支路出现驻波比告警,福相一致性告警,或者软件版本问题(2)光纤链路不稳定,比如光纤抖动,或者光纤损坏。
(3)BBU和RRU人为原因断电。
(4)BBU侧的RFIB或者CPB(1324A)光模块故障(5)BBU侧的RFIB或者CPB(1324A)故障(6)BBU失锁(7)传输闪断或者断开携带光纤若干,光功率计一个,光模块若干,rru若干,防水胶泥和其他安装TD设备工具等。
1)查看RRU的工作状态,如果RRU没有复位,并且通过-B查看RRU各个支路是否存在告警,比如驻波比告警,福相一致性告警等。
2)查看RRU的工作状态,如果RRU复位了,那么需要查看告警判断是光纤问题还是RRU复位导致小区退服,确定引起退服问题的设备或者物理器件,设备查看BBU各板卡的运行状态。
3)查看bbu侧各个板卡的运行状态,查看各个板卡的告警情况,通过告警判断是否有产生小区退服的告警,比如CPB板卡重启或者故障挂死,RfIB故障等。
TDD-LTE eNodeB标识配置错误导致入切换失败1【问题描述】外场拉网测试过程中发现TDL小区得力纺织入切换异常,该站周围所有小区均无法切入该小区,在UE多次上报测量报告无法正常切换情况下,后台虚用户跟踪信令出现MME回复S1AP_HANDOVER_PREPARATION_FAIL消息,详细原因为MME无法识别目标基站,提示unknown-targetid(未知目标标识)。
图1 连续发送测量报告但无法切换2【处理过程】2.1 告警分析查看当前和历史告警,该站点无任何告警信息。
2.2 话统数据分析提取该站一周话统指标分析,发现eNodeB间入切换尝试次数、执行次数和成功次数均为0。
而该站eNodeB内切换正常、eNodeB间切出正常,所以该站小区状态应该是正常的。
但是周边小区无法切换,可能存在切换参数配置异常导致,所以对小区切换参数进行了全面核查,并未发现参数异常现象。
另外,双模站点GPS故障或收星不足也可能导致入切换异常,故通过TDS系统查询GPS装置工作状态,也并未发现状态异常。
通知外场测试人员对该切换问题复测,并结合信令辅助分析,测试结果显示该站eNodeB间入切换仍然异常。
信令分析结果发现,当占用华新电缆3小区时,UE是可以测量到邻区得力纺织的RSRP 电平值、RSRQ值,但是在满足A3同频切换条件后,源eNodeB往MME发送切换请求时,MME 回复信息内容一直为unknown-targetid,说明源eNodeB上报的邻区信息内容有误或者MME无法识别,即MME接收到eNodeB上报的邻区信息后无法解析或解析后无法找到目标eNodeB。
由于目前华为所有eNodeB均下挂在同一套华为核心网EPC下面,所以不存在多个EPC之间交互的问题,所以只要EPC工作正常,出现MME回复信息内容为unknown-targetid消息,存在两种可能:一、上报的目标eNodeB不存在;二、根据前期优化经验,在同一核心网EPC下如果上报的目标eNodeB ID存在重复现象,核心网在无法辨别的情况下,也是发送unknown-targetid消息的。
TDD-LTE站点eNodeB间入切换异常分析处理小结关键字:TD-LTE eNodeB MME S1AP链路切换 S1接口复位 TAC类别:华为LTE优化公司:江苏省邮电建设工程有限公司(陶天根)问题描述:上塘移动演示站点三个小区eNodeB间入切换尝试次数、入切换执行次数,以及入切换成功次数均为0,eNodeB间出切换和eNodeB内小区间出入切换均正常。
由于该站从OMC45网管割接到OMC40网管,前期话统数据已经丢失,后台备份的KPI指标并无eNodeB间入切换单项切换指标,故只能查询到最近一周的话统指标。
同时周边丝联实业、大关明珠大厦、大浒东苑二期、拱宸桥等站点小区,eNodeB间出切换成功率较低,提取“特定两小区间切换出测量”指标分析,这三个站点往上塘移动演示站点所有小区切换均失败,且严重影响主要几个小区eNodeB间出切换成功率。
告警信息:查看历史告警信息,近期该小区无任何告警记录。
分析处理:1)基站数据检查与冗余数据删除从话统指标和外场测试分析,上塘移动演示站点周边站点均无法往该站三个小区切换,初步判断为上塘移动演示站点存在问题。
检查上塘移动演示站点三个小区邻区关系,均与周边小区配置了双向邻区,进一步检查周边基站添加上塘移动演示站点三个小区的外部小区中PCI、TAC和基站标识等属性均与原小区数据一致,其它切换参数无异常。
由于该站三个小区均无入切换,基本判断并非单个小区问题,而可能是公共通道存在问题,所以对上塘移动演示站点eNodeB配置数据进行全面检查。
怀疑上塘移动演示站点GPS 工作异常导致时钟失步引起eNodeB间入切换失败,检查GPS收星正常。
通过操作日志查询上塘移动演示站点eNodeB原归属EPC1,后割接到新EPC2上,但是基站数据查询发现eNodeB 到MME的IP地址存在冗余数据,割接后增加了新EPC-MME的IP地址后,原EPC-MME的IP 地址并未删除:删除原EPC-MME冗余IP地址后,外场复测上塘移动演示站点周边小区仍无法往该站三个小区切换,话统指标显示上塘移动演示站点三个小区仍无eNodeB间入切换。
华为ENODEB告警分析一:29240 小区退服告警当小区建立失败,并且失败原因不是配置管理员人为闭塞时,产生此告警。
1、告警影响小区建立失败,所有业务中断。
2、可能原因小区内RRU不可用。
GPS故障或者收星不足。
基站单板故障。
基站传输中断。
3、处理步骤1、检查设备是否正常加电确保 DBBP530采用-48V DC输入时,外部输入电源电压应在-36V DC~-60V DC 范围内,检查设备能否正常加电。
2、观察设备各种指示灯是否正常观察风扇是否运行正常,无异常噪音、RUN指示灯1S亮1S灭;观察机柜各模块面板上的指示灯状态,单板正常运行时ALM灯长灭,RUN灯1S亮1S灭,ACT 灯常亮。
如出现ALM等红色常亮,或者其他指示灯亮红色表示处于不正常状态,通过插拔单板,下电复位,更换排除告警。
注:触碰机柜内各种单板前,首先要带上静电腕带。
3、检查基站GPS是否正常GPS不能与全向天线安装同一水平面安装,天线垂直向上视角应大于90°范围没有遮挡,远离尺寸大于20CM的金属物体至少2米,GPS 天线上面没有正对天线或微波;基站天线垂直距离大于3 米,必要时更换GPS位置,保证GPS搜星大于4颗,如果GPS不正常,先处理GPS告警,退服告警自动恢复。
4、检查基站RRU及光纤光模块是否正常正常情况下RRU的RUN指示灯1s 亮,1s灭,ALM等长灭,ACT常亮,如发现ALM红灯闪烁,有可能是相关单板,接口,光纤或光模块故障引起,可通过插拔,下电复位,更换模块等方式解决。
5、检查是否软件运行异常近端下电复位RRU,复位BBP单板,主控板,查看告警是否恢复;必要时更换相关单板。
二:GPS类告警TD-LTE双模站点时钟配置由于与TDS共模,因此采用与TDS基站共GPS的方法来获取时钟信号,命令如下:ADD PEERCLK:;//增加对端时钟源SET CLKMODE:MODE=MANUAL(手工方式),CLKSRC=PEERCLK(对端时钟); DSP CLKSRC:;//查询时钟源状态如果显示对端时钟源不可用,那么就会上报“系统时钟不可用告警”,导致小区建立失败,如下图所示,这时候就需要在TDS检查GPS时钟状态。
LTE故障处理手册一.重大故障处理方法1.重大故障实时告警列表告警类别告警设备表述描述可能的原因及影响华为ENODEB网管批量网元断链或小区不可用基站断电,或大批量双模站点TD测GPS故障传输设备网管批量网元断链基站断电,或传输原因中断2.重大故障处理步骤●【批量基站断站或小区不可用】●原因分析基站批量断点或或批量双模站点TD测GPS出现故障及传输设备故障●关注重点批量基站断站或小区不可用●常见处理方法序号处理方法“是”“否”1联系传输人员,看是否为传输设备故障422联系代维人员确定基站是否断电533联系代维人员确定基站是否为双模基站并确定TD测GPS完好54通知传输人员处理65通知代维人员处理66结束二.告警预处理告警分类1.实时告警分类总表告警等级告警号告警名称本机网管紧急网元连接中断ENODEB重要29243小区服务能力下降告警重要19240小区不可用告警重要26205BBU单板维护链路异常告警重要29207基站控制面传输中断告警重要25621直流输出异常告警重要26276制式间站点配置冲突告警重要26238RRU组网拓扑类型与配置不一致告警重要BBP心跳检测失败告警重要26529射频单元驻波告警重要26322BBU测收发光异常重要26503RRU测收发光异常重要26233BBU IR光接口性能恶化告警重要29201S1接口故障告警重要25888SCTP链路故障告警重要26235射频单元维护链路异常告警重要26506RRU测光口性能恶化重要26260系统时钟不可用告警2.主要告警分析和常见的处理手段。
1)【网元链接中断】●告警解释:网元与OMC网管之间的链接中断,一般来讲,为断电或传输问题●对系统的影响对该网元无法控制●告警处理序号处理方法“是”“否”23 1检查同一环路下基站是否全部中断(基站侧检查光路和电源是否OK.)2通知传输中心处理4343通知机房巡检处理故障(基站侧更换传输光模块/光纤)4结束2)【29243:小区服务能力下降】●告警解释当基站射频资源或基带资源不能满足当前小区的配置规格时,产生此告警●对系统的影响告警小区提供给客户可用的无线空口资源会减少。