LTE学习总结—掉话类KPI基本分析方法
- 格式:docx
- 大小:218.14 KB
- 文档页数:9
TOP筛选条件◆当日掉话次数大于3次为TOP小区◆一周内出现3次TOP小区为高掉话TOP小区TOP分析方法手段掉话问题掉话原因分析➢按照掉话分子,按原因值提取相关计数器进行分析;➢检查站点是否存在邻区漏配或者配置不合理,导致无法及时切换出而吊死,引发掉线;➢小区存在异频邻区时,需要核查异频切换类相关A2、A3配置门限是否合理;➢检查小区是否存在超远覆盖,导致覆盖孤岛,无法及时切换到周边基站,可通过后台信令跟踪,观察测量报告,补齐漏配的邻区,随后及时对覆盖进行控制;➢对于弱覆盖引起的掉线,若终端处于覆盖边缘,周围无可用LTE小区,可以合理添加异系统邻区,合理配置重定门限,及时重定向到异系统,减少掉线。
➢关注小区无线环境,分析是否NI过高;➢关注影响业务的故障类告警;掉话Context归类如下:●ENB由于S1链路故障发起释放分为三类◆Context释放,Gtpu ErrInd触发释放:主要是核心网参数问题,部分原因是TAC边界不和导致,可以优化TAC边界◆Context释放,Path故障触发释放:传输故障导致,需核查传输◆Context释放,光口故障触发释放:光口、S1链路故障等原因,推维护处理●Context释放,ENB切换失败引发释放:检查切换参数、功率参数、定时器设置;●Context释放,由于小区关断或复位引发释放:检查掉线对应时间段内基站小区故障类告警●Context释放,ENB由于其他原因引发释放:容量等其他问题;●Context释放,ENB重建立失败导致释放:检查小区NI是否过高,RS功率设置是否偏小,检查现场无线环境,开启X2口进行优化(重建立如果在目标基站没有上下文,重建肯定失败);●ENB空口失败引发释放次数分四类◆ERAB释放,空口定时器超时:检查CPU负荷,同时在线用户数是否偏高,如是可增加SR信道配置容量进行优化,排除MR开启时间段内计时器增多,提故障交研发处理;◆ERAB释放,空口质量差触发RLF:检查无线环境是否存在弱覆盖、模三干扰、越区覆盖、底噪偏高、基站存在故障;◆ERAB释放和RLC达到最大重传次数:检查RLC参数设置,排除MR开启时间段内计时器增多,提故障交研发处理;◆ERAB释放,PDCP完整性保护失败:检查加密完保参数设置,排除MR开启时间段内计时器增多,提故障交研发处理;Context整理情况如下:切换问题:切换分为切换准备阶段和切换执行阶段切换准备阶段多由外部邻区参数配置错误(邻区配置正确)或者切换准备目标基站故障引起。
掉话分析报告1. 引言掉话是指在通信过程中电话突然中断或无法连接的问题。
它是移动通信网络中常见的质量问题之一,对用户体验和运营商的服务质量都有重要影响。
本报告旨在对掉话问题进行分析,帮助运营商了解掉话发生的原因,并提供相应的解决方案。
2. 数据概述本次掉话分析使用的数据集包含了1000个通话记录,每个通话记录包含呼叫起始时间、结束时间、呼叫时长、信号强度等信息。
以下是对数据集的基本描述:•数据集大小:1000行•字段数量:6个•数据格式:CSV3. 掉话分析3.1 掉话率计算掉话率是衡量掉话问题严重程度的指标之一,它表示在所有通话中发生掉话的比例。
根据数据集中的通话记录信息,我们可以计算出掉话率。
具体计算公式如下:掉话率 = (掉话次数 / 总通话次数) * 100%根据数据集,我们计算出的掉话率为5%。
3.2 掉话时间分布分析为了更好地理解掉话发生的时间分布情况,我们对掉话时间进行了统计和分析。
根据数据集中的呼叫起始时间和结束时间信息,我们可以计算出每个通话的掉话时间。
然后,我们对掉话时间进行分布统计,并绘制出柱状图进行可视化展示。
图1展示了掉话时间分布情况。
图1. 掉话时间分布图1. 掉话时间分布从图1中可以看出,在通话开始后的前5分钟内,掉话次数较多,之后逐渐降低。
这可能与网络连接过程中的初始化和信号衰减有关。
3.3 掉话原因分析掉话原因是导致掉话问题发生的主要因素之一。
为了深入了解掉话原因,我们对数据集中的其他字段进行了分析,包括信号强度、通话时长等。
首先,我们计算了每次通话的平均信号强度。
根据数据集中的信号强度信息,我们得到平均信号强度为-80dBm。
根据经验,信号强度越强,掉话问题越少。
其次,我们比较了通话时长和掉话次数之间的关系。
根据数据集中的通话时长信息,我们发现通话时长在1分钟以内的通话掉话率较高,而在1分钟以上的通话掉话率较低。
这可能与网络连接稳定性和信号质量有关。
3.4 解决方案基于对掉话率、掉话时间分布和掉话原因的分析,我们提出以下几点解决方案:•加强网络覆盖:提高网络覆盖范围和密度,特别是在通话质量较差的地区加强信号覆盖。
LTE的掉话原因分析及处理思路LTE“掉话”是指UE异常退出RRC_CONNECTED状态导致的连接中断。
统计节点为“RrcConnctionReconfigurationComplete”消息正确达到网络侧开始,之后进行的各类业务,未正常释放的均计为“掉话”。
正常释放流程如下:一、外场常见掉话原因分析目前LTE常见掉话原因包括弱覆盖、越区覆盖、切换失败、邻区漏配、系统设备异常、干扰、拥塞等。
掉话原因1:弱覆盖现象:由于弱覆盖导致的掉话,通常有以下表现:1.掉话前服务小区的RSRP持续变差(低于弱覆盖标准,如小于-105dBm),同时服务小区的SINR也一起持续变差(小于0dB,甚至小于-3dB)。
2.掉话后可能会有一段时间(数秒至数分钟不等,取决于实际网络覆盖情况),UE无数据上报(类似于UE脱网)。
解决方案:要解决此类掉话,需要改善覆盖。
具体手段有:1.首先明确当前的弱覆盖区域由哪些扇区的信号覆盖。
2.根据网络拓扑结构和相关无线环境来确定最适合覆盖该区域的扇区,并加强它的覆盖。
如常用的天馈调整、站点建设等。
具体案例:对呼和浩特市大昭寺前街DT过程中占用到大昭寺华隆小区-FL_3小区,覆盖较差存在掉线风险。
通过调整PA:3→0,RS参考功率:13.4dB→15.2dB,覆盖改善,掉线风险大大降低。
掉话原因2:越区覆盖现象:在支持切换的移动通信网络中,由于无法精确控制无线信号的传播,因此或多或少都会存在越区覆盖的情况,导致“孤岛覆盖”无法与周边站点进行正常切换掉话,通常有以下表现:1.越区覆盖导致的“导频污染”。
在覆盖区内,没有稳定的强信号作为主服务小区。
服务小区信号的频繁变化,是导致掉话的一个主要原因。
2.越区覆盖对主服务小区的干扰(包括邻区漏配、越区信号的迅速变化等)。
在某些区域,主服务小区收到越区信号的干扰,最终导致掉话。
解决方案:1.越区覆盖的一般优化原则是:在区域中已有合理的稳定信号覆盖的情况下,尽可能的控制越区覆盖的信号。
LTE——KPI指标详解LTE(Long Term Evolution)是第四代无线移动通信技术,它有一套完善的关键性能指标(Key Performance Indicators, KPIs)来衡量网络的质量和效能。
本文将对LTE的KPI指标进行详细解析。
1. 初始接入成功率(Initial Access Success Rate):衡量用户设备在连接到LTE网络时的成功率。
初始接入成功率取决于各种因素,包括网络覆盖范围、信号强度、干扰和用户密度等。
2. 控制信道物理分配成功率(Control Channel Physical Assignment Success Rate):衡量基站成功将控制信道资源分配给用户设备的比例。
这对确保用户设备能够收发数据和接收网络命令至关重要。
3. 用户面协议数据传输成功率(User Plane Protocol Data Transfer Success Rate):衡量用户设备通过无线接口成功传输数据的比例。
这个指标反映了网络的可靠性和性能。
4. 接口信令延迟(Interface Signaling Delay):衡量网络信令在各个接口传递的延迟时间。
较低的接口信令延迟对于提供实时通信和无缝服务至关重要。
5. 切换成功率(Handover Success Rate):衡量用户设备在从一个基站切换到另一个基站时成功的比例。
切换成功率是衡量移动网络的无缝性和连续性的重要指标。
6. 反向链路丢包率(Reverse Link Packet Loss Rate):衡量用户设备通过无线接口向基站发送的数据包丢失的比例。
较高的反向链路丢包率可能导致通信质量下降和数据传输错误。
7. 前向链路速率(Forward Link Throughput):衡量基站向用户设备传输数据的速率。
前向链路速率反映了网络的容量和性能,在视频流和大型文件传输等应用中尤为重要。
8. 用户面流量平均时延(User Plane Flow Average Delay):衡量用户设备传输数据时的平均延迟时间。
LTE的KPI指标分析及优化LTE的KPI(Key Performance Indicator)指标分析及优化,是对LTE网络性能进行评估和改进的重要工作。
本文将从LTE的关键指标出发,对各项指标进行分析及优化措施,以提高LTE网络的性能。
1. 数据速率(Data Rate):数据速率是衡量LTE网络性能的重要指标之一、提高数据速率可通过以下优化措施实现:-增加基站数量:增加基站的覆盖范围和密度,提高用户的连接质量和数据传输速率。
-频谱优化:合理调配频谱资源,提高频谱利用率,增加数据传输速率。
-天线优化:合理设置天线方向和倾角,增加信号覆盖范围和传输效果,提高数据速率。
2. 接入性能(Access Performance):接入性能主要衡量用户接入LTE网络的效率和成功率。
优化措施包括:-增加小区数量:提高网络容量,缓解网络拥塞,提高用户接入成功率。
-加强手动重选功能:在网络负载高或信号弱的情况下,引导用户手动选择其他小区,提高接入成功率。
-优化小区切换参数:合理设置小区切换的优先级和门限值,减少掉话率和呼叫失败率。
3. 话音质量(Voice Quality):话音质量是衡量通话体验的重要指标。
提高话音质量的措施包括:-提高信道质量:通过天线优化,减少信号干扰和衰减,保证通话质量。
-优化码率和编解码算法:选择更高的编解码算法和合适的码率,提高语音的清晰度和准确性。
-减少呼叫丢失率:通过合理设置小区切换和优化呼叫控制流程,减少呼叫丢失率,提高通话质量。
4. 无线覆盖(Wireless Coverage):无线覆盖是衡量LTE网络覆盖能力的主要指标。
提高无线覆盖的措施包括:-增加基站密度:增加基站数量,提高网络覆盖范围和密度,弥补信号覆盖死角。
-使用辅助覆盖技术:如室内小区、中继站等,弥补室内和远离基站的覆盖缺陷。
-天线优化:调整天线方向和倾角,改善信号传播特性,提高覆盖范围和强度。
5. QoS(Quality of Service):QoS是衡量用户体验和网络服务质量的重要指标。
接入KPI处理1.检查操作,告警,传输问题,是否存在网络变动和升级行为等(1.通过LST ALMAF 查询站点实时告警,参考历史告警;2.通过DSP BRD 查询单板运行情况;3.传输及EPC侧有网络变动(升级,割接,参数修改等)。
4.通过Mapinfo查看小区PCI复用是否合理,是否存在模三冲突;5.检查小区时隙配比是否设置准确(室分:SA2\SSP7;宏站:SA2\SSP5)6.如每PRB上干扰噪声平均值>-110dBm,确认小区存在上行干扰,同时可通过后台跟踪,确认干扰类型;7.检查传输模式,是否为TM3,如长时间为TM2,确认设置正确的情况下,基本确定小区存在弱覆盖;8.对比64QAM和QPSK占比,如后者比例远大于前者,可确定小区覆盖异9.邻区告警、故障等导致TOP小区存在弱覆盖;10.天馈问题,无线环境差;11.天线权值配置与现场天线参数不一致。
12.核查参考信号功率是否偏低(常规设置92,122,需结合现场设置);1、接入各个流程失败原因接入流程可以分为四个步骤:随机接入RRC连接建立鉴权E-RAB建立接入问题的主要表现也体现在这四个步骤上。
1.1、随机接入失败随机接入失败的常见原因:ENB侧参数配置问题UE侧参数配置问题信道环境影响核心网侧配置问题备注:由于随机接入是L2的过程,在ENB侧没有明显的特征表现,需要结合UE侧的log 来进行观察与判断影响RRC连接建立成功率的因素主要以下因素有关:空口信号质量;参数配置(定时器、功率控制等);干扰;网络拥塞;设备故障;1、上行随机接入的问题UE发出RRC Connection Request消息,ENB没有收到,如果此时的下行信道质量正常,一般是随机接入参数中的初始接收目标功率设置偏低的问题。
2、小区重选参数问题ENB收到UE发的RRC建立请求消息后,下发了RRC Connection Setup消息而UE没有收到。
查看此时的SINR,如果偏低,而且监视集中没有质量更好的小区,那么是覆盖的问题可以适当提高下行公共信道的功率。
VoLTE感知掉话原因值与KPI指标关联性分析1、概述目前南通感知掉话率在0.28左右,在全省落后,统计发现由于Radio Connection With UE Lost、INSUFFICIENT_BEARER_RESOURCES(2)两类原因值的感知掉话发生频次最多,占感知掉话的60%左右,对感知掉话影响较为明显。
本文的研究主要是分析两类原因值对应的KPI指标情况,观察掉话与各KPI间的关联性,发现规律,为后续优化提供指导和借鉴。
2、感知掉话原因值与KPI关联性分析本次感知掉话的数据的提取主要来自DO感知平台的“固定报表”及“感知掉话”单元侧,KPI指标主要来源于无线网优平台。
数据的统计根据感知掉话的发生时间粒度提取对应时间段的KPI指标情况,对比分析对应掉话与各KPI指标间的关联性。
2.1、Radio Connection With UE Lost在3月11日~4月7日四周时间内,共596个小区发生过733次原因值为Radio Connection With UE Lost的感知掉话,指标统计粒度为小时级,由于感知掉话发生的随机性,以上原因值的掉话中,四周内仅发生1次掉话的小区为501个,发生过2次掉话的小区为67个,发生3~6次掉话的小区共28个。
以下讨论将1次感知掉话为1个采样点分别分析发生1次掉话与多次掉话的小区KPI指标分布情况(若1个小时内发生了多次掉话,均算作1个采样点,对应该小时段的KPI指标)。
2.1.1、仅发生1次感知掉话的小区4G掉线率发生1次Radio Connection With UE Lost掉话的小区共501个,其中449个小区有值,449个小区中有158个小区4G掉话率介于0~0.5%间,占比35%;介于0.5%~1%间的小区共91个,占比约20%;介于1%~2%间的小区68个,占比约15%;介于2%~3%间的小区27个,占比6%;介于3%~5%间的小区46个,占比10%;介于5%~10%间的小区37个,占比8%;介于10%~20%间的小区18个,占比4%;有3个小区4G掉线率介于20%~30%;4G掉线率分布情况,可以看出其中有30%的小区4G掉线率高于2%,高于10%的小区占比约5%。
LTE的掉话原因分析及处理思路LTE“掉话”是指UE异常退出RRC_CONNECTED状态导致的连接中断。
统计节点为“RrcConnctionReconfigurationComplete”消息正确达到网络侧开始,之后进行的各类业务,未正常释放的均计为“掉话”。
正常释放流程如下:一、外场常见掉话原因分析目前LTE常见掉话原因包括弱覆盖、越区覆盖、切换失败、邻区漏配、系统设备异常、干扰、拥塞等。
掉话原因1:弱覆盖现象:由于弱覆盖导致的掉话,通常有以下表现:1.掉话前服务小区的RSRP持续变差(低于弱覆盖标准,如小于-105dBm),同时服务小区的SINR也一起持续变差(小于0dB,甚至小于-3dB)。
2.掉话后可能会有一段时间(数秒至数分钟不等,取决于实际网络覆盖情况),UE无数据上报(类似于UE脱网)。
解决方案:要解决此类掉话,需要改善覆盖。
具体手段有:1.首先明确当前的弱覆盖区域由哪些扇区的信号覆盖。
2.根据网络拓扑结构和相关无线环境来确定最适合覆盖该区域的扇区,并加强它的覆盖。
如常用的天馈调整、站点建设等。
具体案例:对呼和浩特市大昭寺前街DT过程中占用到大昭寺华隆小区-FL_3小区,覆盖较差存在掉线风险。
通过调整PA:3→0,RS参考功率:13.4dB→15.2dB,覆盖改善,掉线风险大大降低。
掉话原因2:越区覆盖现象:在支持切换的移动通信网络中,由于无法精确控制无线信号的传播,因此或多或少都会存在越区覆盖的情况,导致“孤岛覆盖”无法与周边站点进行正常切换掉话,通常有以下表现:1.越区覆盖导致的“导频污染”。
在覆盖区内,没有稳定的强信号作为主服务小区。
服务小区信号的频繁变化,是导致掉话的一个主要原因。
2.越区覆盖对主服务小区的干扰(包括邻区漏配、越区信号的迅速变化等)。
在某些区域,主服务小区收到越区信号的干扰,最终导致掉话。
解决方案:1.越区覆盖的一般优化原则是:在区域中已有合理的稳定信号覆盖的情况下,尽可能的控制越区覆盖的信号。
TDD-LTE网络KPI处理过程总结1. RRC建立成功率分析1.1. RRC连接建立成功率相关公式和指标描述:RRC连接建立成功率主要通过话务统计结果获得,推荐的公式为:RRC建立成功率= [RRC连接建立完成次数]/[RRC连接请求次数(不包括重发)];公式中相关各指标的具体统计方式如下所示:1.2. RRC建立信令流程图1.1 RRC连接建立成功信令流程1.3. 影响RRC连接建立成功率的因素以及优化手段影响RRC连接建立成功率的因素定位方法优化手段空口信号质量路测数据RF优化参数配置(定时器、功率控制等)OMC核查OMC修改干扰1.通过OMC→监控→信令跟踪→信令跟踪管理→LTE→小区性能测试→TDD干扰检测/RSSI统计/干扰检测等跟踪。
2.若通过以上跟踪确认干扰存在,则通过OMSTRA分析干扰源。
1.解决干扰问题。
说明:目前,现网中,RRC建立成功率低站点的原因值主要为上行存在干扰,干扰源主要为站点星卡隐性异常,以及少数RRU帧偏置问题,主要解决手段如下案列所示。
时钟失锁干扰导致切换接入某小区速率掉2. E-RAB建立成功率分析2.1. E-RAB建立成功率相关公式和指标描述:E-RAB建立成功率主要通过话务统计结果获得,推荐的公式为:E-RAB建立成功率= [E-RAB建立成功总次数]/[ E-RAB建立尝试总次数];公式中相关各指标的具体统计方式如下所示:2.2. E-RAB建立信令流程图2.1MME初始E-RAB建立流程图2.2 UE触发E-RAB建立流程2.3. 影响E-RAB建立成功率的因素以及优化手段3. 掉话率分析3.1. 掉话率相关公式和指标描述:无线掉线率主要通过话务统计结果获得,推荐的公式为:无线掉线率= [E-RAB异常释放次数]/[ E-RAB异常释放次数+E-RAB正常释放次数];公式中相关各指标的具体统计方式如下所示:3.2. E-RAB释放信令流程图3.1MME初始E-RAB建立流程如图3.1所示,当eNodeB向MME发送E-RAB Release Indication 消息或者UE Context Release Request消息并且释放原因不为“Normal Release”,“Detach”,“User Inactivity”,“CS fallback triggered”,“UE Not Available For PS Service”,“Inter-RAT redirection”同时相应承载有数传时,统计E-RAB 异常释放,反之,其他情况统计为E-RAB 正常释放。
TOP筛选条件◆当日掉话次数大于3次为TOP小区◆一周内出现3次TOP小区为高掉话TOP小区TOP分析方法手段掉话问题掉话原因分析➢按照掉话分子,按原因值提取相关计数器进行分析;➢检查站点是否存在邻区漏配或者配置不合理,导致无法及时切换出而吊死,引发掉线;➢小区存在异频邻区时,需要核查异频切换类相关A2、A3配置门限是否合理;➢检查小区是否存在超远覆盖,导致覆盖孤岛,无法及时切换到周边基站,可通过后台信令跟踪,观察测量报告,补齐漏配的邻区,随后及时对覆盖进行控制;➢对于弱覆盖引起的掉线,若终端处于覆盖边缘,周围无可用LTE小区,可以合理添加异系统邻区,合理配置重定门限,及时重定向到异系统,减少掉线。
➢关注小区无线环境,分析是否NI过高;➢关注影响业务的故障类告警;掉话Context归类如下:●ENB由于S1链路故障发起释放分为三类◆Context释放,Gtpu ErrInd触发释放:主要是核心网参数问题,部分原因是TAC边界不和导致,可以优化TAC边界◆Context释放,Path故障触发释放:传输故障导致,需核查传输◆Context释放,光口故障触发释放:光口、S1链路故障等原因,推维护处理●Context释放,ENB切换失败引发释放:检查切换参数、功率参数、定时器设置;●Context释放,由于小区关断或复位引发释放:检查掉线对应时间段内基站小区故障类告警●Context释放,ENB由于其他原因引发释放:容量等其他问题;●Context释放,ENB重建立失败导致释放:检查小区NI是否过高,RS功率设置是否偏小,检查现场无线环境,开启X2口进行优化(重建立如果在目标基站没有上下文,重建肯定失败);●ENB空口失败引发释放次数分四类◆ERAB释放,空口定时器超时:检查CPU负荷,同时在线用户数是否偏高,如是可增加SR信道配置容量进行优化,排除MR开启时间段内计时器增多,提故障交研发处理;◆ERAB释放,空口质量差触发RLF:检查无线环境是否存在弱覆盖、模三干扰、越区覆盖、底噪偏高、基站存在故障;◆ERAB释放和RLC达到最大重传次数:检查RLC参数设置,排除MR开启时间段内计时器增多,提故障交研发处理;◆ERAB释放,PDCP完整性保护失败:检查加密完保参数设置,排除MR开启时间段内计时器增多,提故障交研发处理;Context整理情况如下:切换问题:切换分为切换准备阶段和切换执行阶段切换准备阶段多由外部邻区参数配置错误(邻区配置正确)或者切换准备目标基站故障引起。
掉话类KPI1.通过LST ALMAF查询站点实时告警,参考历史告警;2.通过DSP BRD 查询单板运行情况;3.提取两两小区切换,确定目标小区:A.确定目标小区运行情况,是否基站故障或异常告警;B.检查邻区间参数设置是否正确;C.通过Mapinfo检查小区邻区配置是否合理,进行邻区合理性优化;D.检查基站是否周边站点缺少,如为孤站,可视为正常;4.检查参数设置是否合理:A.查询掉线类定时器设置是否正确;(T310、N311、N310、T311、T301).如掉线率突增,B.查询操作日志,确认是否有修改,导致小区异常;5.检查是否存在干扰:A.通过Mapinfo查看小区PCI复用是否合理,是否存在模三冲突;B.检查小区时隙配比是否设置准确(室分:SA2\SSP7;宏站:SA2\SSP5);C.如每PRB上干扰噪声平均值>-110dBm,确认小区存在上行干扰,同时可通过后台跟踪,确认干扰类型;6.是否存在高质差:A.通过观察小区上下行丢包率是否正常,如丢包率偏高,基本断定小区存在质差;B. 通过后台误码率跟踪,如BLER>10%,确定小区存在高误码;7.是否存在弱覆盖:A.检查传输模式,是否为TM3,如长时间为TM2,确认设置正确的情况下,基本确定小区存在弱覆盖;B. 对比64QAM和QPSK占比,如后者比例远大于前者,可确定小区覆盖异常;8.现场测试及后台跟踪:A.安排前场人员现场测试,同时后台通过信令跟踪,配合查找问题原因;B.如果确认问题后,需第三方配合解决,转发相关人员处理,做好跟踪工作,直至问题闭环。
1、关于掉话的定义话统掉话的定义当ENodeB收到来自MME的ERAB ReleaseCommand(UE Context Release Command)消息或eNodeB向MME发送E-RAB RELEASE INDICATION(UE CONTEXT RELEASE REQUEST )消息,且释放原因不为“Normal Release”,“User Inactivity”,“Partial Handover”,“Handover triggered”,“successful-handover”,“cs-fallback-triggered”时统计该指标。
如果E-RAB RELEASE COMMAND消息中要求同时释放多个E-RAB,则相应指标按各个业务的QCI分别进行累加。
2、掉话基本排查步骤2.1、基本排查首先需要在话统侧获取全网的掉话率指标以及趋势,掉话率趋势分析至少1到2周的数据,如果掉话率指标突然偏高,一般执行步骤:是否全网问题对全网MME及eNodeB侧进行告警核查(传输,设备等告警),观察期间是否实施版本升级是否存在Top小区:小区级的掉话率指标和掉话绝对次数按从高到低的顺序进行排序,优先分析掉话绝对次数多而且掉话率高的Top小区对Top小区进行参数核查、告警检查等对引起掉话的Top原因进行定位分析若是共性问题,将优化结果复制到全网参数对比随机抽取部分站点的脚本与基线参数进行核对,对不一致的参数进行分析;告警核查是否存在传输告警:观察S1传输是否出现问题;是否存在设备告警:观察eNB侧是否存在告警;检查系统是否升级、打补丁等动作;小区筛查将小区级的掉话率指标和掉话绝对次数按从高到低的顺序进行排序,优先分析掉话绝对次数多且掉话率高的Top小区;通常取每天掉话率高于平均指标的Top5小区进行分析,确定掉话的主要原因;2.2、掉话问题分析规定动作获取小区级话统掉话率指标及趋势,掉话率趋势至少分析1到2周数据如果小区的掉话率指标突然偏高,需要核查ENB侧是否存在该小区的相关告警信息,检测该小区所属ENodeB的相关告警,确认该小区是否存在故障分析CHR数据,获取导致掉话的各种原因的比例,按照比例从高到低的顺序分别针对不同的问题原因进行定位,并针对各TOP原因进行分析处理判断是否存在OM操作导致的站点复位,重启等导致的掉话,检测是否有TOP用户存在,如果有,需要对TOP用户的数据进行针对分析如果无法通过CHR数据定位解决问题,通过抓取该小区ENodeB侧IFTS跟踪如果无法进行深一步分析在需要使用测试终端进行复现,并抓取UE侧LOG和内部打印信息进行进一步定位2.3、CHR原因统计取每天的Top5站点通过InsightSharp对CHR数据进行分析,找到影响每个Top小区掉话率的主要原因:编号CHR打点内部RelCause中文解释含义1UEM_UECNT_REL_AUDIT_CELLM_RELEASE小区资源核查基带板与主控板见小区资源核查不一致导致的用户释放2UEM_UECNT_REL_HO_OUT_X2_REL_BACK_FAILX2切换目标侧失败X2切换过程中,源小区侧没有收到正常释放UE_CONTEXT_REL消息,原因可能是:1、PATHSWITCH处理失败(包括以下几种情况:pathswitch 消息没有发送出去,或者收到pathswitchfailure 或者处理path switch 过程失败)2、在SN STATUS 尚未处理完毕的情况下,收到重建请求3、没有收到切换完成也没有收到重建请求4、收到重建请求,但是重建过程失败(除了2以外的情况)3UEM_UECNT_REL_RB_RECFG_FAILRB重配置失败1、核心网下发erab mod 流程涉及的空口重配置失败2、算法流程涉及的空口重配置失败(包括MIMO,CQI,DRX,PUCCH资源以及其他)3、小区内切换涉及的空口重配置失败(TTIbudding触发,ROHC,MME下发的安全模式修改)4UEM_UECNT_REL_RRC_REEST_OTHER_RB_RESTORE_FAILother RB恢复失败一般重建完成有5条消息(3条Reestablishment及2条重建重配置),在最后两条消息处理过程中发送了重建过程中的SRB/DRB重配置但是没有收到重配置完成。
5UEM_UECNT_REL_RRC_REEST_SRB1_FAIL重建失败重建SRB1失败,一般可以细化为以下几个场景1、连续多次收到重建请求2、安全校验失败3、多场景交叉情况下,如果当前场景不支持重建,也是重建拒绝6UEM_UECNT_REL_SAE_BEARER_REL_NUM_MAX释放承载个数达到最大请求释放的SAE Bearer数目和已建立的SAE Bearer数目相同1、传输链路异常原因2、重传达到最大次数,并且等待长时间之后UE不重建3、其他(一般不会出现)7UEM_UECNT_REL_SCTP_ABORT传输IPPATH异常IPPATH由于资源不足或者是过载出现异常时8UEM_UECNT_REL_UE_RESYNC_TIMEROUT_REL_CAUSEUE重同步定时器超时L2上报重同步定时器超时导致的用户释放9UEM_UECNT_REL_WAIT_RRC_CONN_RECFG_RSP_TIMEOUT测量控制重配置失败测量控制重配置失败10UEM_UECNT_REL_S1_UESR_ABORTS1接口用户面异常S1链路锻链或者是IPPATH异常导致的用户释放11UEM_UECNT_REL_UE_RLC_UNRESTORE_INDL2上报RLC重传次数达到最大值时的无法恢复指示消息SRB达到最大重传次数12UEM_UECNT_REL_AUDIT_S1ITF_RELEASES1接口核查释放与S1接口核查结果不一致的场景下释放用户2.4、TOP用户排查2.4.1、Top用户的确定Top用户的判断主要是依据终端接入时上报的TMSI进行判定,华为核心网TMSI分配的机制是对于同一个IMSI用户,TMSI的右起第5位进行随机赋值,即某用户的TMSI中只有*指示的8bits位置发生变化,就是同一个用户,C0 6* 00 05;TMSI可以通过CHR数据分析获取:2.4.2、Top用户log分析●Step1:分析是否存在同频邻小区漏配或者错配导致的掉话;●Step2:分析是否存在弱覆盖导致的掉话;●Step3:分析是否由于切换来不及导致的掉话;●Step4:分析是否导频污染引起的掉话:●Step5:分析是否存在上行干扰导致的掉话:●如果掉话原因不是步骤1~5所述的原因,则很有可能是非RF原因导致的掉话,需要结合IFTS信息进一步定位;●如果是异常导致的掉话,则需要结合一键式日志、TTI跟踪等信息进行异常定位。
2.4.3、Top用户隔离定位输入数据eNB IFTS跟踪UE TTI跟踪UE侧路测logeNB表口log一键式日志CHR日志2.4.5、Top用户掉话分析四步曲●Step1:标口流程分析谁主动发起释放☐eNB主动发起释放⏹eNB主动向核心网发起释放请求,收到核心网下发的释放命令后释放用户RRCConnRel、并向核心网反馈释放完成⏹核心网主动发起释放⏹eNB收到核心网下发的释放命令,释放用户RRCConnRel、并向核心网反馈释放完成⏹Step2:通过S1释放请求/命令中的释放原因值隔离掉话原因⏹无线侧原因触发释放⏹传输原因触发释放⏹NAS原因触发释放⏹协议原因触发释放⏹其他混合原因触发释放⏹Step3:CHR分析详细释放原因⏹Step4:复现问题抓取IFTS跟踪、UE侧Log,深度定位掉话根因。