当前位置:文档之家› 华为TDD-LTE指标监控指导书(经典,值得下载。)

华为TDD-LTE指标监控指导书(经典,值得下载。)

舟山L TE指标监控指导书V1.0

一、指标监控内容和KPI指标定义

1. 主要监控内容

话统KPI主要包括以下几大类:接入性指标、保持性指标、移动性指标、业务量指标、产品运行类指标、系统可用性指标和网络资源利用率指标。

通过上述重点话统KPI指标的监测,可以达到:识别突发问题、风险提前预警、话统KPI的稳定与提升,目前TD-LTE系统需要重点关注的话统KPI指标如下表:

2. KPI指标公式定义

请参考附件中OMC920对应指标定义:

中国移动集团要求

上报TDD LTE网络指标V

二、数据提取方法

1. OMC自定义指标

以eNB间切换成功率为例:

1、查看工具栏,点击自定义指标管理,选择功能子集模块eNODEB,选择测量族和测量组(指标所在的测量族请参考文档《中国移动集团要求上报TDD LTE网络指标V2.1.8》),如图1:

图1

2、右击系统内切换出测量,选择添加后出现下图窗口,输入指标名称(注意单位的选择),填写公式后,点击应用

图2

3、在自定义指标管理界面找到定义的指标,右击,选择测量设置,如图3

图3

4、在弹出的窗口,如图4,勾选新对象自动测量,点击应用,结束。

图4

2. KPI指标提取

1、点击结果查询,选择新查询,选择对象,如需选取部分站点(点击第一个对象后,按住“Shift”键,再点击最后一个站点,可将这些对象全选),如图5

图5

2、选取需要查询的指标和对应的周期类型,如图6,按需要选择日期范围和时间方式,如图7

图6

图7

3、指标查询结果如图8

图8 3. 告警提取

主要告警分析和常见的处理手段。

下面以“网元链路中断”为例说明如何查看和处理常见告警,其他告警类可查看附件内容。(附件:)

常见告警处理方法.

docx

示例:

【网元链接中断】

●告警解释:

网元与OMC网管之间的链接中断,一般来讲,为断电或传输问题

●对系统的影响

对该网元无法控制

●告警处理

三、坏小区(TOP小区)查找和分析处理

每小时对上一个小时的全网整体指标进行提取,如果指标变化波动较大,需提取小区级别指标进行查看,将小区级的掉话率指标和掉话绝对次数按从高到低的顺序进行排序, 确认是全网的整体问题还是TOP 小区引起的指标波动,若剔除TOP小区后,指标恢复正常,则是TOP小区问题,优先分析掉话绝对次数多且掉话率高的Top小区;否则是全网性问题,以下是关于TOP小区筛选的方法和主要KPI处理方法流程:

1. 接入性TOP分析处理

1.1 指标定义

1.2 指标分析及统计点介绍

RRC连接建立成功率

图1中【A点】

(1)指标L.RRC.ConnReq.Att加1,不统计重发的次数。

Case1:eNB下发RRC_Conn_Setup消息后,在T300定时器超时前,收到相同的UeID发起的RRC_Conn_Req (Setup丢失,UE MAC冲突解决定时器超时后重发RRC_Conn_Req,UeID不变),记为一次重发RRC_Conn_Req 消息。

Case2:T300超时后,UE仍未收到RRC_Conn_Setup,UE重新搜网,发起初始接入,UeID是取0~239的随

机值或上层下发的TMSI。eNB侧记为新的一次初始接入,L.RRC.ConnReq.Att加1。

Case3:发起Attach后会启动T310定时器。如果UE发出RRC_Conn_Setup_Cmp后,ENB没有收到,UE会在定时器超时后重新发起Attach,ENB侧记为新的一次初始接入;RRC_Conn_Setup_Cmp丢失不会触发重建,发起重建的前提是安全已经激活。

(2)如果RRC Connection Request消息信元Establishment Cause为“emergency”,指标

L.RRC.ConnReq.Att.Emc加1。

(3)如果RRC Connection Request消息信元Establishment Cause为“highPriorityAccess”,指标

L.RRC.ConnReq.Att.HighPri加1。

(4)如果RRC Connection Request消息信元Establishment Cause为“mt-Access”,指标

L.RRC.ConnReq.Att.Mt加1。

(5)如果RRC Connection Request消息信元Establishment Cause为“mo-Singnalling”,指标

L.RRC.ConnReq.Att.MoSig加1。

(6)如果RRC Connection Request消息信元Establishment Cause为“mo-Data”,指标

L.RRC.ConnReq.Att.MoData加1。

【B点】

当eNodeB下小区接收到UE发送的RRC Connection Request消息并下发RRC Connection Setup消息给UE 时,指标L.RRC.ConnSetup加1。

【C点】

当eNodeB收到UE返回的RRC Connection Setup Complete消息时统计相应指标,L.RRC.ConnReq.Succ加1。

RRC Setup Success Rate计算: RRCSetupSuccessRate=(L.RRC.ConnReq.Succ)

/(L.RRC.ConnReq.Att)*100%

E-RAB建立成功率

如图2、3中【A点】所示,当eNodeB收到来自MME的E-RAB SETUP REQUEST或者INITIAL CONTEXT SETUP

REQUEST消息时统计该指标。如果E-RAB SETUP REQUEST或者INITIAL CONTEXT SETUP REQUEST消息中要求同时建立多个E-RAB,则相应指标按各个业务的QCI分别进行累加。

【B点】

当MME收到来自eNodeB的E-RAB SETUP RESPONSE或者INITIAL CONTEXT SETUP RESPONSE消息时E-RAB建立成功次数累加。

ERAB Setup Success Rate计算公式:

ErabSetupSuccessRate=(L.E-RAB.SuccEst)/(L.E-RAB.AttEst)*100%

1.3 TOP小区分析和处理

处理流程和方法

通过对TOP小区建立失败的原因进行观察,通过对不同的原因做相应的观察,不同失败原因对于相应指标有不同的变化,应对观察指标和优化策略均不同,下表为指标提取的建立失败的不同原因分类和相应说明:

①小区RRC建立失败次数:

1、□资源分配失败而导致RRC连接建立失败的次数,指标ID:1526727083;重点关注top资源是否足够,包括top用户数,传输、PRB等;

2、□UE无应答而导致RRC连接建立失败的次数,指标ID:1526727084;关注质差、干扰、无线环境等;

3、□小区发送RRC Connection Reject消息次数,指标ID:1526728269;关注传输问题、是否拥塞、干扰;

4、□因为SRS资源分配失败而导致RRC连接建立失败的次数,指标ID:1526728485;重点关注SRS带宽、配置指示、配置方式、SRS ACK/NACK设置是否合理等;

5、□因为PUCCH资源分配失败而导致RRC连接建立失败的次数,指标ID:1526728486;关注PUCCH信道相关参数设置是否合理,CQI RB数配置是否合理等;d

6、□流控导致的RRC Connection Request 消息丢弃次数,指标ID:1526728489;关注拥塞,业务流控相关参数是否设置正确等;

7、□流控导致的发送RRC Connection Reject消息次数,指标ID:1526728490;关注拥塞,业务流控相关参数是否设置正确等;

②对小区E-RAB建立失败次数:

1、□因未收到UE响应而导致E-RAB建立失败的次数,指标ID:1526726717;处理建议:需排查覆盖,干

扰,质差,ENODEB参数设置错误,终端及用户行为异常等原因。

2、□核心网问题导致E-RAB建立失败次数,指标ID:1526728276;处理建议:需跟踪信令,排查核心网问题(EPC参数设置,TAC码设置的一致性,对用户开卡限制,硬件故障方面排查);

3、□传输层问题导致E-RAB建立失败次数,指标ID:1526728277;处理建议:需查询传输是否有故障,高误码,闪断,传输侧参数设置问题。

4、□无线层问题导致E-RAB建立失败次数,指标ID:1526728278;处理建议:处理建议:需排查覆盖,干扰,质差,ENODEB参数设置错误,终端及用户行为异常等原因。

5、□无线资源不足导致E-RAB建立失败次数,指标ID:1526728279;处理建议:1、排查TOP小区资源是否足够,是否故障引起,若存在资源不足问题,可考虑参数调整,流量均衡(小区选择,重选和切换类参数);2、结合现场调整天馈,流量均衡;3、热点区域,增补基站等;

6、□安全模式配置失败导致E-RAB建立失败次数,指标ID:1526728280;处理建议:需排查覆盖,干扰,质差,ENODEB参数设置错误,终端及用户行为异常等原因。

在一般正常情况下建立失败的通常为无线侧问题导致的可以处理,具体常见处理方法和流程如下:

1.检查操作,告警,传输问题,是否存在网络变动和升级行为等(1.通过LST ALMAF查询站点实时告警,用LST ALMLOG参考历史告警;→存在告警则降低功率切出用户,严重的临时去激活小区,通知维护人员处理;

2.通过DSP BRD查询单板运行情况;→异常则通知维护人员;

3.传输及EPC侧有网络变动(升级,割接,参数修改等)。→一般为突发,及时同时相关人员;

4.通过Mapinfo查看小区PCI复用是否合理,是否存在模三冲突;→用MOD CELL修改PCI

5.检查小区时隙配比是否设置准确(室分:SA2\SSP7;宏站:SA2\SSP5)→LST CELL查看,MOD CELL 修改;

6.如每PRB上干扰噪声平均值>-110dBm,确认小区存在上行干扰,同时可通过后台跟踪,确认干扰类型;→统计话务统计看是突发的还是持续的,可应急通过MOD PDSCH降功率处理;

7.检查传输模式,是否为TM3,如长时间为TM2,确认设置正确的情况下,基本确定小区存在弱覆盖;

8.对比64QAM和QPSK占比,如后者比例远大于前者,可确定小区覆盖异常;

9.邻区告警、故障等导致TOP小区存在弱覆盖;

10.天馈问题,无线环境差;

11.天线权值配置与现场天线参数不一致。

12.核查参考信号功率是否偏低(常规设置92,122,需结合现场设置);→MOD PDSCH进行修改;

N O

N O

Y E S

YES Y E S

N O

N O

N O

N O

N O

N O

Y E S

保存跟踪信令及测试数据,提交问题排查交付件至华为研发定位问题。

是否大部分小区恶化

筛选TOP小区

筛选TOP小区

检查操作,告警,传输问题,是否存在网络变动和升级行为等(1.通过LST ALMAF查询站点实时告警,参考历史告警;2.通过DSP BRD 查询单板运行情况;3.传输及EPC侧有网络变动(升级,割接,参是否存在干扰

是否终端、用户行为异常

1.结合用户投诉情况,安排前场人员现场测试,同时后台通过信令跟踪,配合查找问题原因;

指标是否正常

结束

无线接通率低于98%

RRC建立成功率低于98%E-RAB建立成功率低于98%

是否大部分小区恶化RRC建立成功率TOP、E-RAB建立成功率TOP条件相同:建立成功率<98%,连接请求次数极少。

1、通过Mapinfo查看小区PCI复用是否合理,是否存在模三冲突;

2、检查小区时隙配比是否设置准确

(DE:SA2\SSP7;F:SA2\SSP5)3、如每PRB上干扰噪声平均值>-110dBm,确认小区存在上行干扰,同时可通过后台跟踪,确认干扰类型;4、发送干扰组协助处理。

1.检查传输模式,是否为TM3,如长时间为TM2,确认设置正确的情况下,基本确定小区存在弱覆盖;2、对比64QAM和QPSK占比,如后者比例远大于前者,可确定小区覆盖异常;3、邻区告警、故障等导致TOP小区存在弱覆盖;4、天馈问题;5、无线环境差;6、基站规划、建设、施工问题;7,天线权值配置与现场天线参数不一致。8.核查参考信号功率是否偏低(常规设置92,122,需结合现场设置);

是否存在覆盖问题

1、参数调整,流量均衡;

2、天馈调整,分担流量;

3、热点区域,增补基站;

是否存在高质差是否存在资源不足 1.通过观察小区上下行丢包率是否正常,如丢包率偏高,基本断定小区存在质差;2、通过后台误码率跟踪,如BLER>10%,确定小区存在高误码;

2. 保持性TOP分析处理2.1 指标定义

2.2 指标分析及统计点介绍

无线掉线率

如上图:【图1】中A点所示,当eNodeB向MME发送UE CONTEXT RELEASE REQUEST消息,会释放UE的所有E-RAB。当释放原因不为“Normal Release”,“Detach”,“User Inactivity”,“CS Fallback triggered”,“UE Not Available for PS Service”,“Inter-RAT Redirection”,“Time Critical Handover”,“Handover Cancelled”时,测量指标L.UECNTX.AbnormRel加1。

如【图2】中A点所示,当eNodeB向MME发送S1 RESET消息时,根据包含的上下文个数,指标

L.UECNTX.Rel.S1Reset.eNodeB进行累加。

如【图3】中A点所示,当MME向eNodeB发送S1 RESET消息时,根据包含的上下文个数,指标L.UECNTX.Rel.S1Reset.MME进行累加。

E-RAB掉线率

E-RAB掉线分2部分,为eNodeB触发的释放原因为异常的E-RAB释放总次数和切换出E-RAB异常释放总次数,分别如下:

上图中,图1表示eNodeB内切换,图2表示X2接口切换,图3表示S1接口切换,图4表示E-UTRAN系统切换到WCDMA系统、GERAN系统、或者TD-SCDMA系统。如图1、图2、图3和图4中C点所示,切换执行成功,但目标小区有建立失败的承载,源小区异常释放对应的E-RAB,则在源小区按各个业务的QCI 分别统计该指标。同时,在源小区根据相应E-RAB的个数将总次数累加,即指标L.E-RAB.AbnormRel.HOOut 累加。

如图1中A点所示,当eNodeB发出E-RAB RELEASE INDICATION消息,且释放原因不为“Normal Release”,“Detach”,“User Inactivity”,“CS Fallback triggered”,“UE Not Available For PS Service”,“Inter-RAT Redirection”,“Successful Handover”时统计L.E-RAB.AbnormRel.eNBTot指标,当判断相应承载有数传时统计L.E-RAB.AbnormRel指标。如果E-RAB RELEASE INDICATION信令中要求同时释放多个E-RAB,则相应的指标统计多次;

如图2中A点所示,当eNodeB向MME发送UE CONTEXT RELEASE REQUEST消息,会释放UE的所有E-RAB。当释放原因不为“Normal Release”,“Detach”,“User Inactivity”,“CS Fallback triggered”,“UE Not Available For PS Service”,“Inter-RAT Redirection”,“Time Critical Handover”,“Handover Cancelled”时统计L.E-RAB.AbnormRel.eNBTot指标,当判断相应承载有数传时统计

L.E-RAB.AbnormRel指标。如果被释放用户建立了多个E-RAB,则相应的指标统计多次。并且在MME回复UE CONTEXT RELEASE COMMAND消息时,相应指标不会被重复记录。

2.3 TOP小区分析流程

TOP小区分析可通过OMC 920提取异常释放原因:

无线掉线率释放原因如下:

□eNodeB发起的原因为UE LOST的UE Context释放次数

□eNodeB发起的原因为切换失败的UE Context释放次数

□eNodeB发起的原因为无线层问题的UE Context释放次数

□eNodeB发起的S1 RESET导致的UE Context释放次数

E-RAB掉线率释放原因如下:

□无线层问题导致的激活的E-RAB异常释放次数

□传输层问题导致的激活的E-RAB异常释放次数

□网络拥塞导致的激活的E-RAB异常释放次数

□切换流程失败导致激活的E-RAB异常释放次数

□核心网问题导致E-RAB异常释放次数

1.通过LST ALMAF查询站点实时告警,参考历史告警LST ALMLOG;→存在告警则降低功率切出用户,严重的临时去激活小区,通知维护人员处理;

2.通过DSP BRD 查询单板运行情况;→若异常,通知维护人员处理;

3.提取两两小区切换,确定目标小区:

A.确定目标小区运行情况,是否基站故障或异常告警;→若异常,通知维护人员处理;

B.检查邻区间参数设置是否正确;→核查修改邻区外部小区参数是否正确,切换偏置是否合理;

C.通过Mapinfo检查小区邻区配置是否合理,进行邻区合理性优化;→进行邻区的合理删除和添加;

D.检查基站是否周边站点缺少,如为孤站,可视为正常;→暂不做处理,观察;

4.检查参数设置是否合理:

A.查询掉线类定时器设置是否正确;(T310、N311、N310、T311、T301).

LST UETIMERCONST:;

B. 如掉线率突增,查询操作日志,确认是否有修改,导致小区异常;→用LST OPTLOG查看是否指

标异常开始时段有相应修改操作,询问修改人进行相应恢复观察;

5.检查是否存在干扰:

A.通过Mapinfo查看小区PCI复用是否合理,是否存在模三冲突;→修改PCI

B.检查小区时隙配比是否设置准确(E频段室分:SA2\SSP7; F和D频段宏站:SA2\SSP5);→修改时隙配比配比MOD CELL;

C.如每PRB上干扰噪声平均值>-110dBm,确认小区存在上行干扰,同时可通过后台跟踪,确认干扰类型;→统计话务统计看是突发的还是持续的,可应急通过MOD PDSCH降功率处理;

6.是否存在高质差:

A.通过观察小区上下行丢包率是否正常,如丢包率偏高,基本断定小区存在质差;

B. 通过后台误码率跟踪,如BLER>10%,确定小区存在高误码;

7.是否存在弱覆盖:

A.检查传输模式,是否为TM3,如长时间为TM2,确认设置正确的情况下,基本确定小区存在弱覆盖;

B. 对比64QAM和QPSK占比,如后者比例远大于前者,可确定小区覆盖异常;

8.现场测试及后台跟踪:

A.安排前场人员现场测试,同时后台通过信令跟踪,配合查找问题原因;

B.如果确认问题后,需配合解决,转发相关人员处理,做好跟踪工作,直至问题闭环。

3. 移动性TOP分析处理3.1 指标定义

3.2 指标分析及统计点介绍

统计小区范围内不同原因的切换出失败的次数。切换出失败一般发生在切换准备阶段,包括几种典型场景:核心网问题,目标小区无响应,目标小区回复切换准备失败以及源小区发送切换取消消息。切换准备阶段是从切换判决到切换执行之间的切换资源准备阶段。

●如图1和图2中B点所示,在S1接口切换及X2接口切换过程中的切换准备阶段,源小区收到来自MME的UE CONTEXT

RELEASE COMMAND消息时,指标L.HHO.Prep.FailOut.MME加1。

●如图3和图4中B点所示,在X2接口切换及S1接口切换过程中的切换准备阶段结束时,源小区未收到来自目标

eNodeB的任何消息,包括如下场景:在X2切换时,未收到对端eNodeB发出的HANDOVER REQUEST ACKNOWLEDEG

消息及HANDOVER PREPARATION FAILURE消息;在S1接口切换时,未收到MME发出的HANDOVER COMMAND消息

及HANDOVER PREPARATION FAILURE消息。指标L.HHO.Prep.FailOut.NoReply加1。

●如图5和图6中B点所示,在X2接口切换过程中的切换准备阶段,当源小区收到来自目标小区的HANDOVER

PREPARATION FAILURE消息时,指标L.HHO.Prep.FailOut.PrepFailure加1。在S1接口切换过程中的切换准备阶段,当

源小区收到来自MME的HANDOVER PREPARATION FAILURE消息时,指标L.HHO.Prep.FailOut.PrepFailure加1。

如图7和图8中B点所示,在X2接口切换及S1接口切换过程中,切换准备阶段未结束且没有收到来自目标测的任何消息,源小区判决取消本次切换,并发送HANDOVER CANCEL消息时,指标L.HHO.Prep.FailOut.HOCancel加1。

如果准备阶段结束,由于其他异常原因,UE未完成切换流程,源小区向目标小区发送HANDOVER CANCEL消息时,不

统计到该指标中。如图7和图8中B点所示,在X2接口切换及S1接口切换过程中,源小区发送HANDOVER CANCEL

消息时,指标L.HHO.FailOut.HOCancel加1。该指标不考虑切换准备是否完成,只要源小区发送HANDOVER CANCEL

消息,指标就统计。

3.3 TOP小区分析流程

TOP小区分析可通过OMC 920提取切换出失败原因:

□核心网原因导致切换出准备失败次数

□目标小区无响应导致切换出准备失败次数

□目标小区回复切换准备失败消息导致切换出准备失败次数

□源小区发送切换取消导致切换出准备失败次数

□ eNodeB间切换出取消次数

对TOP问题小区常见如下处理:

1查询站点有无告警,小区状态是否正常;(1.通过LST ALMAF查询站点实时告警,用LST ALMLOG参考历史告警;→存在告警则降低功率切出用户,严重的临时去激活小区,通知维护人员处理;

2.查询有无外部干扰(每PRB上干扰噪声平均值>-110dBm,则存在外部干扰);→统计话务统计看是突发的还是持续的,可应急通过MOD PDSCH降功率处理;

3.提取两两小区切换,确定切换出目标小区,核查外部小区参数(PCI、TAC、频点、小区标识、切换参数)配置有无错误;→若错误则对外部定义的小区参数进行修改,另外关注两两小区切换过早和过玩或者乒乓切换统计,进行相应的CIO调整;

4.查看MAPINFO图层,查看邻区是否存在MOD干扰,确认基站规划是否合理,是否会产生弱覆盖。→用MOD CELL修改PCI或者降功率,降功率需注意是否会造成其他地方覆盖差;

四、附录文件

常用指令:

TDL站点状态查询指令:

LST CELL:; 查询小区静态参数

DSP CELL:; 查询小区动态参数

LST ALMAF:; 查询当前告警

LST BFANT:;查询天线配置信息(静态)

是是否否

告警处理后是

否恢复

核心网原因导致切换出准备失败次

数目标小区无

响应导致切

换出准备失

败次数

目标小区回

复切换准备

失败消息导

致切换出准

备失败次数

源小区发送

切换取消导

致切换出准

备失败次数

eNodeB间切

换出取消次

数切换成功率低

是否存在异常告警

或传输闪断

核查邻区干扰弱覆盖

请核心网人员对参数一致性进行核

查(TAI、TAL等)

核心网信令跟踪排查

拥塞

模3干扰

外部干

外部小区核

查、合理规

划、修改邻区

参数合理

1.小区PCI

2.TA

3.小区标识

4.频率

5.切换参数等

1.天馈调整

2.更改天馈类

3.增加小区功

4.新增站点

1.扩容

2.话务均衡

3.新增站点

合理规划

修改PCI

扫频排

结束

?若以上手段都不能解决问题则安排前场人员现场测试,同时后台通过信令跟

踪,配合查找问题原因;如果确认问题后,需第三方配合解决,转发相关人

员处理,做好跟踪工作,直至问题闭环;

相关主题
文本预览
相关文档 最新文档