切换异常的几种原因分析及排查
- 格式:doc
- 大小:151.00 KB
- 文档页数:17
关于新建电联共享站点无法进行S1切换以及回落的问题关键字:电联共享、S1切换回落异常、SCTP对端、MME地址摘要:4G电联共享新建站,对基站进行测试时发现手机无法进行S1切换和回落,通过排查和处理,在核心网测进行跟踪发现SCTP对端S1地址配置错误。
经过修改SCTP 对端S1地址,再次测试,基站切换和回落都已正常。
案例正文:1、背景河北xx市xx站点电联共享新建基站,此共享站为电信承建,共享给联通,联通侧需要对基站进行业务测试。
2、问题、事件描述在测试过程中,手机可以正常接入网络,呼叫和上网等测试都正常,但是在进行回落和切换测试时却无法正常切换和回落。
3、分析与对策(1)查询现网告警,存在用户面承载链路异常告警,业务类型为S1。
(2)排查基站小区故障告警,邻区关系配置问题原因。
通过查询现网小区故障告警,与工参比较邻区配置发现并没有什么异常情况。
(3)排查基站数据配置是否存在错误:通过与MML脚本核对,发现未配置X2,S1切换流程与X2切换类似,只不过所有的站间交互信令及数据转发都需要通过S1口到核心网进行转发,时延比X2口略大。
eNodeB间切换一般都要通过X2接口进行,但当如下条件中的任何一个成立时则会触发S1接口的eNodeB间切换:(1)源eNodeB和目标eNodeB之间不存在X2接口;(2)源eNodeB尝试通过X2接口切换,但被目标eNodeB拒绝。
由于未配置X2接口导致在切换时全部为S1切换,但是S1接口也未切换成功,因此怀疑在电联共享情况下切换是否必须配置X2链路。
因此加载了X2链路重新进行测试,发现S1链路依旧不能进行切换。
(3)为了定位S1链路故障位置,在网管侧进行了信令跟踪。
跟踪S1信令,对S1AP_HANDOVER_PREPARATION_FAIL 原因进行分析,从跟踪站点情况看,切换失败原因值为“ho-failure-in-target-EPC-eNB-or-target-system(6)"。
H3C以太网交换机异常重启原因的排查方法一、组网:无二、问题描述:某客户H3C5500以太网交换机在使用中突然异常重启,导致业务中断。
三、过程分析:通过收集设备重启之后的诊断信息,查看下面的命令来判断设备上次异常重启的原因。
===============================================================================_diplaydrvlot1ymboot===============================================================================w_reet:0(1-reetwitchbyreboot)wdt_reet:0(1-reetwitchbywatchdog)power_up:0(0-reetwitchbypowerdown/up)对比绿色(字段值)和红色(标准值)的取值,如果两值相同,则即为该种类型的重启。
其中设备标准值的说明如下:1.w_reet和wdt_reet字段取值为1,一般表示上次重启与软件相关,其中包含命令行输入reboot命令,也包括软件检测到有任务异常后在后台reboot交换机。
如果现场设备出现了重启,并且不存在人为输入reboot命令的现象,建议咨询H3C厂商5500设备重启的具体原因;2.power_up字段取值为0,一般表示上次重启与硬件相关,触发条件一般是非软件因素:设备供电中断、设备电源或其它硬件故障导致的自动重启,可以建议客户排除设备的供电系统是否存在问题。
四、解决方法:根据现场收集的诊断信息查看_diplaydrvlot1ymboot命令(同上),发现设备异常重启的原因和软件无关。
经过客户现场排查,发现设备电源模块出现故障,更换后问题解决。
特别说明:此命令不适用于H3C5500HI设备。
切换异常的几种原因分析及排查名称:切换异常的几种原因分析及排查提交人:张鑫提交日期:2011-12-24软件版本:硬件版本:1.1 RNC内切换过程中的异常1.1.1 总体描述RNC内切换相关的异常主要有如下几种典型场景:物理信道重配失败:网络侧在下发physicalChannelReconfiguration消息后,终端回physicalChannelReconfigurationFailure消息,导致切换过程失败,此类异常影响RNC内切换成功率,但不会导致掉话;物理信道重配超时:网络侧在下发physicalChannelReconfiguration消息后,终端没有响应,网络侧等待一段时间后,终端仍然未上报cellUpdate,超时后释放,此类异常会同时影响切换成功率;小区更新后物理信道重配超时:网络侧在下发physicalChannelReconfiguration消息后,终端没有响应,网络侧等待一段时间后,终端上报cellUpdate,网络侧下发cellUpdateConfirm 消息,终端响应超时后释放,此类异常会同时影响切换成功率;网络侧收到测量报告但未发起切换:网络侧收到终端上报的1G或2A测量报告,但未在目标小区发起无线链路建立过程,也未向终端下发physicalChannelReconfiguration,此类异常不会对KPI指标造成直接影响;1.1.2 典型信令过程1.1.2.1 物理信道重配失败1. 信令截图:第 1 页2. 信令分析:第 3 页原因分析及排查手段:查看PhysicalChannelReconfigurationFailure 中携带的失败原因,比如最常见的Failure cause 为physical channel failure ,表示UE 无法在建立新的物理信道,即UE 无法在新的信道配置上完成L1同步(UE 在T312时间内,收到N312个同步指示,即认为新的信道建立成功)。
NSA站点切换失败处理案例一、关键词:高通终端,NSA切换二、案例分类:1、问题分类:移动性能等2、手段分类:参数调整三、优化背景NSA站基站进行高通商用终端接入及speedtest测速测试。
四、问题现象进行NSA拉网测试,测试中UE发起携带SN的切换失败,原因值为:synchReconfigFailureSCG,说明UE同步重配置失败。
初步判断为上行问题,若下行无线链路失败原值一般为T310-Expiry,如下列图示:五、原因分析➢synchReconfigFailureSCG可能原因有1):无线覆盖质量问题,如上行干扰,或上行覆盖;2):数据配置问题,上行随机接入参数,邻区参数配置;3):小区存在异常。
➢问题分析排查1)小区状态核查,在5G UME网管REM容器中RAN CLI中查询小区状态,如下图所示2)AAU与gNB间传输正常,如下图:3)核查Prach相关参数,目前5G干扰较小,其“PRACH功率攀升步长”、“基站期望的前导接收功率”、“前导码最大发送次数”设置正常。
“基于逻辑根序列的循环位移参数”为0,覆盖半径2~3km,”PRACH时域资源配置索引”为162,参数配置正常。
4)核查邻区数据,无同频同PCI169,PLMN46007,频段41,配置数据无误。
5)检查基站NI,发现该小区存在干扰,最大干扰达-60dbm左右。
六、解决方案干扰排查,经现场扫频发现部分频段受存在干扰,NR小区周边存在TD-LTE D1/D2频段小区,导致系统内干扰。
七、效果评估将该小区带宽设置为60M后,干扰恢复正常,切换恢复正常。
随即进行复测,LTE小区由182切向180,同时NR小区由PCI840切向169,切换正常。
如下图所示:八、基于案例提炼的方法、流程及评估标准建议在携带SN切换中Scgfail常见的失败原因有:synchReconfigFailure-SCG: 一般为同步问题, 如上行干扰,Gps定时等问题,如上文中案例中所示失败原因为D1,D2频段对5G NR小区干扰造成同步重配失败;t310-Expiry:T310超时,重点关注UE所在位置的无线信道质量,如RSCP和SINR,同时关注射频类告警,终端异常原因等;如下图所示UE携带SN切换时同覆盖LTE小区电平-69dbm,SINR22db,属于极好点。
某电厂远动设备信号点跳变故障的原因分析及对策作者:尚平来源:《中国新通信》 2018年第13期【摘要】本文详细叙述了某电厂远动设备部分遥测信号测点跳变的故障,并针对该故障进行分析,找出原因,进而提出一些改进措施。
【关键字】远动设备故障措施2015 年4 月22 日某电厂远动设备出现遥测测点#2 机组变中有功功率数据传输到某地区调度主站发生跳变的故障,数据由正常值跳变为0,导致某地区调度负荷瞬间丢失,给电网的安全运行造成了一定的影响。
一、跳变故障原因分析1.1 厂站远动设备的作用远动终端,是电网为了进行监视和控制而安装在变电站及厂站的一种远动装置,让调度员在任何时刻都能看到厂站端系统的运行方式与运行参数,有效监控系统的运行状态。
远动终端的职能是采集变电站及厂站运行状态的模拟量和状态量,监视并向调度中心传送这些模拟量和状态量,执行调度中心发往所在变电站及厂站的控制和调节命令。
而远动终端的主要功能是要实现:遥信、遥控、遥调、遥测功能,四个功能介绍如下:遥信:是远方状态信号, 简记为YX。
它是将被监视厂站的设备状态信号远距离传送给调度。
例如开关位置信号。
遥测:是远方测量, 简记为YC。
它是将被监视厂站的主要参数变量远距离传送给调度。
例如厂、站端的功率、电压、电流等。
遥控:是远方操作, 简记为YK。
它是从调度发出命令以实现远方操作和切换。
这种命令通常只取两种状态指令, 例如命令开关的“合”、 " 分"。
遥调:是远方调节, 简记为YT。
它是从调度发出命令以实现对远方的设备进行调整操作, 如实现变压器档位调节等。
1.2 故障原因分析遥测数据采集的是厂内的电压、电流及功率信息,是反映电网运行稳态状况的基本信息。
如果遥测数据发生问题,会严重影响到电网的安全。
而遥测数据的采集及传输要经过诸多环节,任何一个环节出现问题,都会造成遥测数据异常。
某厂由于为旧厂,目前采用的是分布式RTU设备,采用新的分布式概念。
设备异常排查和分析对于设备异常问题的排查和分析是保障设备正常运行的重要一环。
在日常工作中,经常会遇到设备出现异常情况,例如设备无法启动、运行速度变慢、出现错误提示等问题。
针对这些异常情况,我们需要进行细致的排查和分析,找出问题的根本原因,进而采取适当的解决措施,以确保设备的正常运行。
首先,对于设备异常问题的排查,我们应该进行全面的检查。
可以从以下几个方面入手:1. 硬件检查:检查设备是否有明显的物理损坏,如电线、连接器、面板等是否完好,电池是否电量充足,联网设备的网络连接是否正常等。
2. 软件检查:检查设备的软件是否有问题,如操作系统是否有异常或崩溃记录,设备是否安装了不受信任的第三方软件,是否有病毒或恶意软件等。
3. 驱动程序检查:检查设备的驱动程序是否有问题,例如查看驱动程序是否有更新,是否存在冲突或兼容性问题等。
4. 网络连接检查:对于有网络功能的设备,检查其网络连接是否正常,可以通过Ping命令检测网络是否通畅,或使用网页访问测试检查网络服务是否可用。
5. 日志文件分析:设备的操作系统或应用程序通常会生成日志文件,这些日志文件可以提供设备出现异常的关键信息,我们可以分析这些日志文件来找出问题的原因。
上述排查步骤可以帮助我们快速定位设备异常问题的所在,然而,仅仅排查异常问题还不够,我们还需要对问题进行分析,以确定最佳的解决方案。
设备异常问题的分析应从以下几个方面进行:1. 异常发生时间和频率:记录设备异常发生的时间和频率,这有助于判断问题是否是突发性的,或者是否存在某种规律或模式。
2. 测试环境的变化:注意到设备异常发生前是否有任何环境变化,例如安装了新的软件、更新了设备驱动程序,或者更换了硬件等。
这些变化可能与设备异常问题有关。
3. 异常现象的详细描述:尽可能详细地描述设备异常现象,例如出现错误提示的具体内容、设备响应的时间变化等。
这有助于更准确地判断问题所在。
4. 相关历史记录的回顾:回顾设备的历史记录,特别是之前出现过的类似问题以及解决方案。
站内锚点小区切换失败导致NR异常释放问题
案例上报省份:浙江案例上报人:张波
一、关键词:
CELLOP
二、案例分类
1.问题分类:切换类
2.手段分类:参数调整
三、优化背景
采用FDD1800频点作为锚点。
拉网测试过程中发现LTE一直上报大量A3事件,但始终不进行切换,直至LTE异常释放后NR小区异常释放。
四、问题现象
终端占用锚点站为PCI145的小区,但是邻区PCI341和PCI18的电平值均好于主服务小区,而主服务LTE小区也上报A3事件想要进行切换,但是一直不进行切换导致LTE和NR异常释放;
五、原因分析
LST CNOPERATOR:查看运营商信息,获取运营商索引值与移动
网络码的对应关系;
LST CNOPERATORTA:查看跟踪区域配置信息,获取本地跟踪区域标识与运营商索引值的对应关系;
LST CELLOP:查看小区运营商信息,获取本地小区标识和本地跟踪区域标识的对应关系;
将上述三个图关联分析即可得到:本地小区标识->本地跟踪区域标识->运营商索引值->移动网络码的对应关系;而问题所述的小区就是PCI341和PCI 18的小区未配置1的本地区域跟踪标识,即无对应的08运营商信息;
六、解决方案
添加如下命令后,小区切换正常
ADD CELLOP:LOCALCELLID=X,TRACKINGAREAID=X,MMECFGNUM=CELL_MME_CFG_NUM_0;
七、效果评估
问题得到解决,切换接入正常
八、基于案例提炼的方法、流程及评估标准建议
站内锚点小区不切换的情况,应该首先排查小区间邻区、CELLOP信息配置情况;。
设备异常处理流程中的故障诊断与排查步骤设备在运行过程中难免会出现各种故障,为了保证设备的正常运行,及时进行故障诊断与排查是非常重要的工作。
以下是设备异常处理流程中常见的故障诊断与排查步骤,供参考:1. 收集故障信息当设备出现异常时,首先要收集相关的故障信息,包括设备的型号、规格、使用环境、异常现象、出现时间等。
可以通过设备日志、报警信息等途径获取这些信息,有助于更准确地进行故障诊断。
2. 分析异常现象根据收集到的故障信息,开始分析异常现象的特点和可能的原因。
可以通过设备手册、技术文档以及与设备厂商的沟通来获取更多的参考信息。
对于复杂的故障,可以借助专业的故障分析软件或设备来帮助分析异常现象。
3. 确定故障原因在分析异常现象的基础上,结合设备的工作原理和设备使用的环境等因素,逐步缩小故障原因的范围。
可以通过检查设备的各个组件、连接线路和控制系统等来确定是否存在故障。
如果有必要,可以借助故障诊断工具进行进一步的检测和验证。
4. 制定排查方案根据确定的故障原因,制定相应的排查方案。
这包括确定所需的排查工具、技术手段和排查顺序等。
在排查过程中,要尽量遵循从简单到复杂、由表及里的原则,以便更快地定位和解决故障。
5. 进行排查根据制定的排查方案,开始进行相应的排查工作。
可以使用各种测试仪器和工具进行电气测试、机械检查、信号测试等,以排除或确认故障。
在排查过程中,要仔细记录每一步的结果和排查的进展情况。
6. 故障修复与测试如果在排查过程中发现故障,根据故障的性质和具体情况,采取相应的修复手段。
修复后,应进行相应的测试,确保故障已经得到解决,设备恢复正常工作。
7. 总结与记录在故障修复后,应及时总结和记录故障的诊断与排查过程。
这包括记录故障的原因、排查的步骤、使用的工具与方法等。
这些记录对于以后的类似故障的处理和设备维护都非常有帮助。
8. 预防措施根据故障的原因和排查过程中的经验,确定相应的预防措施,以避免类似故障的再次发生。
双电源切换出现短路的原因主要有以下几点:
1.内部电路故障:双电源自动切换开关的内部电路出现故障,可能导致短路问题。
2.负载电流过大:负载电流超过额定电流时,可能导致双电源切换装置的触点过热,从而引起短路。
3.负载不平衡:三相不平衡值设置得过小,可能会引发三相不平衡,从而导致短路。
4.过电压或欠电压:欠电压值设置得太大,或者过电压值设置得太小时,可能会引发短路。
5.端子螺钉和导线接线螺钉松动:这可能导致连接不良,从而引发短路。
6.启动控制电流大、时间长:启动控制电流大、时间长时,可能导致跳闸动作延迟,从而引发短路。
7.电容器的充电工作电流和荧光灯的启动电流过大:这可能引起瞬时跳闸保护动作,从而引发短路。
8.震动、冲击:震动或冲击可能导致双电源切换装置的内部元件受损,从而引发短路。
9.企业内部管理控制局部短路:电动机等设备内部可能发生的局部短路,也可能引发双电源切换装置的短路问题。
以上信息仅供参考,具体情况还需要专业人员进一步排查。
变电运行中的常见故障与检修措施分析一、进出线闸切换不良进出线闸门闭不紧或开不开,是造成进出线切换不良的原因之一,可能由于闸门松动或阻塞。
另外,因为过载引起进出线闸烧毁也是常见故障。
在检修中,我们应该注意以下几个方面:1.检查闸门是否松动、损坏,适时进行维修或调整;2.检查闸门下游电器设备是否存在问题(如短路等),及时处理;3.检查当前负荷是否超过变电站设计,适当减负后再切换;4.进出线闸烧毁,需将闸换新,同时排查原因,预防再次发生。
二、设备过热引起的故障在变电站日常运行中,由于过载、短路等原因,容易导致电器设备过热,引发灼伤、烧毁等故障。
因此,在日常维护和检修过程中,我们应该重视以下几个问题:1.设置温度保护装置,确保设备运行温度不超过额定温度;2.每周检查一遍设备温度,发现问题及时处理;3.加强设备冷却,安装通风设备,防止电器设备过热;4.及时更换老化设备。
三、接地故障引起的故障变电站接地故障是常见且严重的一种故障。
其危害不仅可能引发火灾、爆炸等危险事故,还会导致设备烧毁、中断供电等重大后果。
对接地故障,我们应该注意以下几个方面:1.加强对设备绝缘的维护管理和监测,防止绝缘损坏;2.加强对设备接地的检查和维护,确保接地电阻符合标准;3.启用多点接地保护装置;4.加强人员培训,提高检修检测层次,发现并及时处理接地故障。
电压暂降是指变电站负荷大、线路短路等原因导致的电源电压短时下降。
电压暂降可能对电力设备产生一定的影响,如继电器误动、计算机系统程序错误等,因此我们应该注意以下几个方面:2.安装电容器、静态无功发生器等设备,提高供电系统抗干扰能力;3.及时发现和处理电压暂降故障;4.加强巡视、检修人员定期培训,提高检查技能水平。
五、运行中断开(开关跳闸)引起的故障运行中断开,一般是指电缆或设备内部故障引起的。
当电缆、设备内部损坏或过载时,开关则会自动跳闸,此时需及时排查故障。
我们应该注意以下几个方面:1.加强运行监测,在设备出现异常时及时停机检查;2.及时更换裂纹、老化电缆设备,确保电缆设备符合标准;3.加强设备检修检测,及时发现、处理设备异常;4.确保开关装置设备处于良好运行状态。
名称:切换异常的几种原因分析及排查提交人:张鑫提交日期:2011-12-24软件版本:硬件版本:1.1 RNC内切换过程中的异常1.1.1 总体描述RNC内切换相关的异常主要有如下几种典型场景:物理信道重配失败:网络侧在下发physicalChannelReconfiguration消息后,终端回physicalChannelReconfigurationFailure消息,导致切换过程失败,此类异常影响RNC内切换成功率,但不会导致掉话;物理信道重配超时:网络侧在下发physicalChannelReconfiguration消息后,终端没有响应,网络侧等待一段时间后,终端仍然未上报cellUpdate,超时后释放,此类异常会同时影响切换成功率;小区更新后物理信道重配超时:网络侧在下发physicalChannelReconfiguration消息后,终端没有响应,网络侧等待一段时间后,终端上报cellUpdate,网络侧下发cellUpdateConfirm消息,终端响应超时后释放,此类异常会同时影响切换成功率;网络侧收到测量报告但未发起切换:网络侧收到终端上报的1G或2A测量报告,但未在目标小区发起无线链路建立过程,也未向终端下发physicalChannelReconfiguration,此类异常不会对KPI指标造成直接影响;1.1.2 典型信令过程1.1.2.1 物理信道重配失败1. 信令截图:第 1 页2. 信令分析:第 3 页原因分析及排查手段:查看PhysicalChannelReconfigurationFailure 中携带的失败原因,比如最常见的Failure cause 为physical channel failure ,表示UE 无法在建立新的物理信道,即UE 无法在新的信道配置上完成L1同步(UE 在T312时间内,收到N312个同步指示,即认为新的信道建立成功)。
交换机出故障最可能的几个原因分析交换机出故障了,不知道如何下手?如何维修,下面笔者为大家推荐一篇总结的非常详细的交换机可能发生故障的原因,助您一个个地排查,希望对您有帮助。
在日常的网络故障维护中我们接触最多的设备就是交换机,特别是接入层交换机,它是连接用户和交换路由设备的桥梁,交换机作为一个中间体,对我们排查网络故障起到非常重要的作用,如果我们对它本身的故障有个了解,或许就能帮助我们更快、更准的发现和解决问题,现就底层交换机故障排除和大家分享下。
交换机故障问题大致包括物理层故障、端口协商以及自环问题、Vlan问题、设备兼容问题和其他问题等,下面对于这些问题我们来一一讲解。
一、物理层故障从广义的角度来看,物理层故障主要是指交换机本身的硬件故障和连接交换机的物理线路故障。
1、硬件故障设备本身的硬件故障一般包括:接口或者设备硬件损坏,接口Bootrom或者VRP软件版本不正确或者不配套,光模块接口类型不正确,用户PC网卡故障或者配置不正确等。
通常交换机某个或某些接口坏掉后,其他的接口也会逐渐的坏掉。
2、物理线路故障连接交换机的物理线路故障一般包括:网线或者光纤线路本身物理损坏,网线类型错误(支持MDI/MDI-X自适应除外)或者光纤收发连接不正确,中间传输设备(光电转换器,协议转换器等)故障或者工作不正常,接口线缆所支持的最大传输长度、最大速率等超出使用范围等。
还有设备接口之间的工作速率、工作方式、帧格式协商和匹配问题等也会导致现象表现为物理层故障。
对于上面这些问题我们可以通过一些方法来找寻问题所在,比如:1、借助设备接口指示灯的状态进行初判。
Line灯灭表示线路没有连通,灯亮表示线路已经连通;Active灯灭表示没有数据收发,灯闪烁表示有数据收发。
2、通过端口显示命令查看输出来判断。
比如display interface ethernet0/1。
3、采用替换法进行判断。
包括线路、电缆和光纤、板卡、槽位、整机,调换线路收发等。
双电源转换开关常见故障
双电源转换开关是一种用于切换电路系统供电源的设备,常见于电力系统中,用于在一电源出现故障或需要维护时,将负载切换到备用电源上,以确保电力系统的连续供电。
以下是双电源转换开关常见的故障:
1.机械故障:由于长期使用或不当操作,转换开关内部的机械部件(如机构、传动装置等)可能会出现磨损、松动、断裂等问题,导致转换动作不准确或无法正常切换。
2.接触不良:转换开关在切换时需要确保电路的良好接触,如果接触不良(如接触点氧化、松动、烧毁等),会导致转换开关在切换时出现断电、跳闸或短路等问题。
3.电气故障:转换开关内部的电路元件(如继电器、开关器件等)可能会因电压过高、电流过大、过载、短路等原因损坏,导致转换开关无法正常工作。
4.控制电路故障:转换开关的控制电路(如控制电源、控制信号线路等)出现故障,可能导致转换动作失效或误操作。
5.外部环境因素:双电源转换开关通常安装在室外或恶劣环境中,可能受到温度、湿度、震动、腐蚀等外部因素的影响,导致设备老化、损坏或失效。
6.人为操作失误:误操作、操作不当或维护保养不及时等因素也可能导致双电源转换开关出现故障。
为避免以上故障,需要定期对双电源转换开关进行检查、维护和保养,并采取必要的防护措施,如安装过流保护、过压保护、接地保护等装置,以确保其安全可靠地运行。
同时,在使用过程中,操作人员应按照操作规程操作,避免误操作或操作失误。
1 / 1。
忻州LTE网络切换优化总结1 概述忻州的切换成功率指标较差,通过本次集中优化,梳理、排查切换成功率低的主要问题,并通过对这些问题的处理,逐步提升了切换成功率指标。
项目组从参数核查、故障处理、覆盖优化等多方面对可能影响切换的因素进行排查优化,切换成功率取得了明显的提升。
一般情况下,导致切换失败的原因有以下几种:1)越区覆盖、弱覆盖、质差等无线质量问题2)邻区漏配、外部小区配置不一致3)小区半径、PRACH等问题导致的随机接入失败4)同频切换参数不合理5)异频切换参数不合理6)干扰、设备故障等因素2 优化思路2.1 切换成功率指标公式切换成功率反映的是小区切换出的相关性能指标。
计算公式如下:小区切换成功率=(切换出成功次数-通过重建回源小区的切换出执行成功次数)/切换出尝试次数2.2 优化思路忻州系统内切换类型绝大多数是X2口切换,eNodeB间X2口切换流程如下图:源小区在收到终端上发的MR后如果判决需要切换,则打点记录切换出尝试次数,在收到目标小区回复的HANDOVER REQ ACK时向UE发送RRC Connection Reconfiguration消息后记录切换出执行次数。
切换出尝试次数与切换出执行次数的差值记为切换出尝试失败次数,切换出尝试失败问题一般为目标小区存在上行干扰、小区故障原因导致。
源小区在收到目标小区发来的UE CONTEXT RELEASE后记录切换出成功次数。
切换出执行次数与切换出成功次数的差值记为切换出执行失败次数,切换出执行失败问题一般为随机接入失败、漏配邻区、无线环境差导致。
整体优化思路如下:1、核查全网跟切换相关参数的合理性,针对不合理参数进行规划、优化。
2、全网邻区核查,包括邻区漏配、外部小区参数不一致等。
3、分析优化切换失败TOP小区。
4、干扰、故障小区处理。
5、MR弱覆盖小区优化。
3 具体优化工作3.1 PRACH根序列优化(乡镇农村小区半径重新规划)如果根序列分配不合理,相邻小区或近距离两小区使用该根序列生成的前导序列相同,则会导致UE随机接入阶段相互干扰。
第二章网络交换机1、数据流控导致网络应用速度慢(二层)故障现象:网吧系统软件对网吧内机器进行一对多的数据复制非常慢。
原因分析:网吧系统软件安装采用的网络克隆软件是利用网络多播的技术,实现一对多的数据更新,交换机默认的广播、组播、DLF限制会导致网络克隆很慢。
解决办法:关闭广播、组播、DLF限制。
2、网管不通(三层)故障现象:S3528MF二层透传,业务通,下联设备网管不通。
原因分析:由于S3528MF上联口配置了filter arp any any,导致所有ARP请求被S3528MF的CPU获取,导致设备网管不通,而业务的ARP请求流向是从下往上,且下联业务口没有配置filter。
解决办法:重新配置S3528MF以后禁止配置filter arp any any,只能配置将针对本设备的ARP请求送CPU处理。
3、交换机故障的一般分类和排障步骤交换机的优越性能和价格的迅速下降,促使了交换机的迅速普及。
管理员在工作中,接触较多,经常会遇到各种各样的交换机故障,关键是如何快速、准确的查出故障并排除故障。
本文就常见的故障类型和排障步骤作一个简单的介绍。
交换机故障分类所有交换机故障一般可以分为硬件故障和软件故障两大类。
硬件故障主要指交换机电源、背板、模块、端口等部件的故障,可以分为以下几类:1、电源故障由于外部供电不稳定,或者电源线路老化或者雷击等原因导致电源损坏或者风扇停止,从而不能正常工作。
由于电源缘故而导致机内其他部件损坏的事情也经常发生。
如果面板上的POWER指示灯是绿色的,就表明是正常的;如果该指示灯灭了,则说明交换机没有正常供电。
这类问题很容易发现,也很容易解决,同时也是最容易预防的。
针对这类故障,首先应该做好外部电源的供应工作,一般通过引入独立的电力线来提供独立的电源,并添加稳压器来避免瞬间高压或低压现象。
如果条件允许,可以添加UPS(不间断电源)来保证交换机的正常供电,有的UPS提供稳压功能,而有的没有,选择时要注意。
第37卷第5期红水河Vol.37No.52018年10月HongShuiRiverOct.2018某水电厂AGC负荷给定方式异常切换分析及处理胡㊀明,赵㊀健(贵州乌江水电开发有限责任公司,贵州㊀贵阳㊀550002)摘㊀要:某水电厂AGC负荷给定方式为调度控制方式时,在无人工操作的情况下异常切换至厂站控制方式㊂根据相关报警信息,结合负荷给定方式切换条件,深入分析异常切换的原因,提出相应处理措施并模拟反演验证,在论证后完善了AGC相关程序,该方法进一步提高了该水电厂AGC的安全可靠性㊂关键词:水电厂;AGC;负荷;方式;异常;切换中图分类号:TV736文献标识码:B文章编号:1001-408X(2018)05-0090-031㊀概述某水电厂装机容量4ˑ280MW,多年平均发电量45.52亿kW∙h,设计利用小时数4064h㊂该水电厂计算机监控系统采用全开放的分层分布式双星型网络结构(交叉冗余),与省调㊁流域集控中心采用广域网(WAN)联接㊂计算机监控系统与省调EMS数据传输包括调度数据网和2M专线,采用专用的冗余远动通信机通过IEC104协议实现与省调数据传输㊂计算机监控系统上位机采用HERC8000系统,于2013年5月投入运行㊂水电厂自动发电控制(AGC)是电力系统自动发电控制的一个子系统㊂它的任务是在满足各项限制条件的前提下,以迅速㊁经济的方式控制整个电站的有功功率来满足电力系统的需要[1]㊂该水电厂AGC控制画面如图1所示,正常情况下,该水电厂AGC投入[2]操作为:1)投入至少1台正常发电的机组的单机AGC功能;2)投入全厂AGC功能;3)将负荷给定方式切为远方;4)将负荷给定来源切为调度;5)将AGC调节方式切为闭环㊂AGC退出操作与此相反㊂在水电厂与省调通信正常㊁全厂无事故㊁母线频率正常等情况下,水电厂计算机监控系统应能实现上级调度控制中心控制调节[3]㊂2013年9月,该水电厂已完成AGC厂内试验㊁与省调的联合试验㊂同年12月,AGC功能正式投入运行,截至AGC负荷给定方式发生异常切换前,维护人员未对AGC程序进行修改或升级,AGC程序整体运行正常,AGC功能正常,未发现异常情况㊂图1㊀某水电厂AGC负荷给定方式异常切换时显示图2㊀事件经过2014年1月25日至2014年2月10日,某水电厂AGC负荷给定方式为调度控制方式[4],在无人工操作的情况下,AGC负荷给定方式多次异常切换至厂站控制方式[4]㊂上位机AGC控制画面显示 全厂AGC 在 投入 状态,负荷给定方式为厂站控制方式;上位机简报窗口显示 全厂AGC未投,禁止投入调度 某水电站:全厂AGC控制方式切为电厂 ㊂3㊀原因分析在无人工操作情况下,该电厂AGC负荷控制方式异常切换为厂站控制方式的原因有2个:一是电厂与省调通信中断;二是 全厂AGC 在 退出㊀㊀收稿日期:2018-05-15;修回日期:2018-07-02㊀㊀作者简介:胡㊀明(1985),男,贵州湄潭人,工程师,学士,主要从事水电站自动化专业工作,E-mail:281617544@qq.com㊂09胡㊀明,赵㊀健:某水电厂AGC负荷给定方式异常切换分析及处理㊀状态㊂3.1㊀与省调通信中断查询上位机相关报警记录,在AGC负荷给定方式异常切换至厂站控制方式前后,检查该电厂与省调通信正常,2台远动通信机工作正常,没有与省调通信中断的报警记录;检查该电厂与省调通信中断后导致负荷给定方式自动切换的控制脚本(如图2),当电厂与省调通信中断后,脚本会自动将通信中断相关报文录入历史信息报警记录㊂通过以上排查,脚本与上位机报警记录一致,故排除负荷给定方式异常切换是由于该电厂与省调通信中断后导致的㊂图2㊀负荷给定方式切换至电厂判据1图3.2㊀全厂AGC退出查询上位机相关报警记录,在AGC负荷给定方式异常切换至厂站控制方式前后,均能查询到 全厂AGC未投,禁止投入调度 某水电站:全厂AGC控制方式切为电厂 2条报警信息,但没有查询到导致全厂AGC退出的相关报警记录,如:母线频率异常㊁机组事故㊁全厂总事故㊁全厂总有功功率落在联合振动区内等㊂同时,查询上位机历史曲线,该时段母线频率在正常范围内,全厂总有功功率未落入联合振动区㊂根据检查结果,结合图3,分析可知,在无人工操作的情况下,AGC负荷给定方式异常切换至厂站控制方式是由于 全厂AGC 退出导致的,那么, 全厂AGC 又是怎样退出的呢?图3㊀负荷给定方式切换至电厂判据2图㊀㊀分别对agcavc[5]㊁agcdrv[5]㊁unitydrv㊁iec104等与AGC相关程序进行进程和抓包检查,发现各程序进程均运行正常,没有丢包现象及其他异常情况㊂据此,初步判断数据库脚本(图3)随机读值或plant文件随机写值导致 ɦ全厂AGC投入ɦ==0 ,即全厂AGC退出,AGC负荷给定方式由调度控制方式异常切换至厂站控制方式㊂通过编写测试代码用mmap方式(一种内存映射文件的方法)向plant文件中写入 ɦ全厂AGC投入ɦ==0 时,AGC负荷给定方式由调度控制方式切换至厂站控制方式㊂结合以上分析,对计算机监控系统的数据库文件和源代码进行检查,发现在源代码底层程序段中的int型变量处理程序中,程序会把文件中的int型变量值先清零,接着再将int型变量实际值写到文件中,agcdrv(写数据文件进程)会调用上述源代码,将agcavc进程广播过来的数据先清零,再写实际值㊂结合该电厂AGC负荷给定方式异常切换的现象,在AGC负荷给定方式为调度控制方式下,先将 ɦ全厂AGC投入ɦ 变量清零(即退出全厂AGC),上位机简报窗口报 全厂AGC未投,禁止投入调度 ,再写入 ɦ全厂AGC投入ɦ 变量实际值1(即投入全厂AGC),AGC控制画面显示 全厂AGC 在 投入 状态㊂实时数据库脚本(图3)在读取变量值时,lsdmn(读取变量的进程)与agcdrv(写数据文件进程)是并行执行的程序, ɦ全厂AGC投入ɦ 变量在清零和写1的切换是瞬间完成的,AGC控制画面来不及刷新 全厂AGC 为 退出 的状态,因此,在AGC控制画面中看不到 全厂AGC 由 投入 到 退出 和 退出 到 投入 的状态转换㊂3.3㊀模拟反演通过编写测试程序,搭建AGC调度控制方式模拟平台进行反演,为便于区别,测试程序中以stsdz@PAGCONOFF作为代替 ɦ全厂AGC投入ɦ 的变量㊂反演10h左右,程序捕捉到将stsdz@PAGCONOFF置为0的情况有10余次,在每次将变量stsdz@PAGCONOFF清零后立即恢复为实际值1,模拟反演如图4所示㊂综上所述,该电厂AGC负荷给定方式异常切换为厂站控制方式的原因是:源代码程序在处理int型变量时,将 ɦ全厂AGC投入ɦ 变量清零, 全厂AGC 在 退出 状态,导致负荷给定19㊀红水河2018年第5期图4㊀模拟反演结果图方式切换至厂站控制方式㊂4㊀处理措施根据以上分析,一方面,为避免程序读取数据出错,将原数据库中AGC负荷给定方式切换的运算脚本(图3)移至AGC程序中,删除原数据库中AGC负荷给定方式切换的运行脚本;另一方面,针对本次变量赋值处理时出错的问题,删除源程序中关于int型变量清零的语句,直接将采集到的实际值赋给变量㊂按照以上措施将程序完善后放入模拟平台进行测试,运行48h内,AGC负荷给定方式未发生自动切换现象㊂最后,将完善后的程序更新至计算机监控系统实时数据库,AGC负荷给定方式未再发生异常切换现象㊂5㊀结语通过AGC负荷给定方式异常切换的现象,深入分析异常切换原因,提出初步解决方案并模拟反演验证,在进行充分论证后再执行相应的处理措施,此举进一步提高了该水电厂AGC的安全可靠性㊂参考文献:[1]㊀DLT578-2008,水电厂计算机监控系统基本技术条件[S].[2]㊀中国南方电网有限责任公司电力调度通信中心.中国南方电网自动发电控制(AGC)技术规范(试行)[Z].广州:中国南方电网有限公司电力调度通信中心,2009.[3]㊀DLT5065-2009,水力发电厂计算机监控系统设计规范[S].[4]㊀DLT822-2012,水电厂计算机监控系统试验验收规程[S].[5]㊀国电南京自动化股份有限公司.HERC8000计算机监控系统使用维护手册[Z].南京:国电南京自动化股份有限公司,2011.AnalysisandTreatmentofAbnormalSwitchingofAssignedModeofAGCLoadinaHydropowerPlantHUMing ZHAOJianGuizhouWujiangHydropowerDevelopmentCo. Ltd. Guiyang Guizhou 550002Abstract WhentheassignedmodeofAGCloadofahydropowerplantisdispatchingcontrolmode itisabnormaltoswitchtoplantcontrolmodewithoutmanualoperation.Accordingtotherelevantalarminformation combinedwiththeswitchingconditionofloadassignedmode thecausesofabnormalswitchingareanalyzedindepth andthecorrespondingtreatmentmeasuresareputforwardandverifiedbysimulation.Afterthedemonstration therelevantAGCprogramisperfected whichfurtherimprovesthesafetyandreliabilityofAGCinthehydropowerplant.Keywords hydropowerplant AGC load mode abnormal switching29。
虚假电平导致切换异常故障现象:11月25日分析指标发现最近几天H057161柯桥滨海马鞍北_1切出成功率低,而其对面小区H050265柯桥滨海天马集团V_3切入成功率低,两小区位置情况如下:原因分析:流程图:切换成功率低分析判断可能原因:1、基站时钟不同步2、BCCH同邻频干扰3、上行干扰4、信号不稳定5、虚假电平导致误切换原因排查:先查看两基站告警未发现基站时钟不同步问题、两小区周边也没有明显BCCH同频干扰、两小区上行干扰均在正常范围之内,所以排除分析的前三种原因。
由于两小区地理位置相近,且查看邻区间切换统计发现,就是H057161柯桥滨海马鞍北_1切往H050265柯桥滨海天马集团V_3小区失败次数多导致两小区切换成功率低。
怀疑:虚假电平导致误发起切换请求由于近期也发现几个案例是虚假电平导致误发起切换请求,查看H050265柯桥滨海天马集团V_3小区BCCH频点发现,该小区BCCH频点=1,而H057161柯桥滨海马鞍北_1小区也存在1号频点,但是TCH频点,怀疑H057161柯桥滨海马鞍北_1小区将自己的1号频点信号强度误判为H050265柯桥滨海天马集团V_3小区的信号强度进而起呼。
解决措施:在11月25日17点将H057161柯桥滨海马鞍北_1小区将自己的1号TCH 频点调整为69号TCH频点,调整前后小区间切换指标如下:因为信号误判断减少所以误判定的切换请求次数也明显减少,从调整后观察两小区间正常切换次数并不多,切换成功率也提高了。
H057161柯桥滨海马鞍北_1切出成功率变化H050265柯桥滨海天马集团V_3切入成功率变化经验总结:日常我们只关注两小区同BCCH频点导致测试或切换指标会这边因为MS对虚假电平判断错误导致误切换而恶化,但同样的情况也会因为TCH频点和BCCH频点一样导致,所以对BCCH频点规划需要按照规划原则来。
名称:切换异常的几种原因分析及排查提交人:张鑫提交日期:2011-12-24软件版本:硬件版本:1.1 RNC内切换过程中的异常1.1.1 总体描述RNC内切换相关的异常主要有如下几种典型场景:物理信道重配失败:网络侧在下发physicalChannelReconfiguration消息后,终端回physicalChannelReconfigurationFailure消息,导致切换过程失败,此类异常影响RNC内切换成功率,但不会导致掉话;物理信道重配超时:网络侧在下发physicalChannelReconfiguration消息后,终端没有响应,网络侧等待一段时间后,终端仍然未上报cellUpdate,超时后释放,此类异常会同时影响切换成功率;小区更新后物理信道重配超时:网络侧在下发physicalChannelReconfiguration消息后,终端没有响应,网络侧等待一段时间后,终端上报cellUpdate,网络侧下发cellUpdateConfirm消息,终端响应超时后释放,此类异常会同时影响切换成功率;网络侧收到测量报告但未发起切换:网络侧收到终端上报的1G或2A测量报告,但未在目标小区发起无线链路建立过程,也未向终端下发physicalChannelReconfiguration,此类异常不会对KPI指标造成直接影响;1.1.2 典型信令过程1.1.2.1 物理信道重配失败1. 信令截图:第 1 页2. 信令分析:第 3 页原因分析及排查手段:查看PhysicalChannelReconfigurationFailure 中携带的失败原因,比如最常见的Failure cause 为physical channel failure ,表示UE 无法在建立新的物理信道,即UE 无法在新的信道配置上完成L1同步(UE 在T312时间内,收到N312个同步指示,即认为新的信道建立成功)。
造成这种现象的原因可能为物理信道所在的时隙干扰较大,或目标小区存在UP 干扰。
排查方法:查看各时隙干扰情况,如果发现时隙干扰很大,查看NODEB 载扇是否正常,同时查看邻小区是否有大量同频邻区,若在话务量小的情况下,ISCP 仍然很高,则干扰可能来自异系统,如:GSM ,PHS 等;查看目标小区UP 干扰,若较大,则进行UP 位置偏移;时隙干扰经常性偏大时,可以尝试调低UE 的上、下行开环功率;无效配置、配置不支持等配置错误:换个手机测试,若各厂家手机测试都有问题,将本小区的重配消息和正常小区的重配消息进行对比,查看配置是否正确; 注:物理信道/RB 重配失败后测量控制下发说明:切换失败后,RNC 会重新下发测量控制消息,测量控制消息中携带邻区列表但不包含频点扰码等具体信息,如图所示,因为之前的测量控制消息中已经携带了邻区的扰码、频点等信息,UE 侧已经保存了相关邻区的详细信息,因此网络侧不需要重新携带邻区的详细信息,只需要指示邻区序号。
1.1.2.2物理信道重配超时原因分析及排查手段:UE收到了RECONFIGURATION消息,并发送了COMPLETE消息,但RNC未收到(上行功率不足或存在干扰等原因);UE收到了RECONFIGURATION消息,但没发送COMPLETE消息(消息错误或UE 内部错误等原因);排查方法:若UE未收到重配消息:调整后台下行最小发送功率,增加UE接收到重配消息的几率,或者调整周围网络的覆盖、频点、功率等,尽量降低下行方向上的干扰;若网络侧没有收到重配完成消息:则调整后台DPCH的期望接收功率,同时利用网规网优手段,降低上行方向上的干扰;1.1.2.3 小区更新后物理信道重配超时第 5 页原因分析及排查手段:可能原因为:UE未收到CONFIRM消息(下行功率不足或存在干扰等原因);UE收到了CONFIRM消息,并发送了COMPLETE消息,但RNC未收到(上行功率不足或存在干扰等原因);UE收到了CONFIRM消息,但没发送COMPLETE消息(消息错误或UE内部错误等原因);排查方法:若UE未收到CONFIRM消息:调整后台下行最小发送功率,增加UE接收到CONFIRM消息的几率,或者调整周围网络的覆盖、频点、功率等,尽量降低下行方向上的干扰;若网络侧没有收到重配完成消息:则调整后台DPCH的期望接收功率,同时利用网规网优手段,降低上行方向上的干扰;1.1.2.4 网络侧收到测量报告但未发起切换1. 信令截图:2. 信令分析:3. 原因分析及排查手段:一般为RNC资源申请失败导致,如码道资源不足,软资源(功率、干扰)接纳失败等(此时信令跟踪工具上没有IUB口和空口消息);可查看目标小区剩余的码道资源数看是否有足够的剩余资源,并查看公共测量值和配置的接纳门限,是否为功率干扰等软资源受限。
1.1.2.5 网络侧在RAB指派过程中收到测量报告1. 信令截图:2. 原因分析及排查手段:RNC在收到CN RAB指派后,UE上报一个测量报告,但此时RNC在处理CN RAB 指派,无法同时处理测量报告,RNC缓存此条测量报告,等RAB指派完成后,在发起切换过程,由于此案例中测量报告中的目标小区来自邻RNC,因此发起了重定位流程。
第 7 页1.2 RNC间切换过程中的异常1.2.1 总体描述RNC内切换相关的异常主要有如下几种典型场景,CN侧响应RelocationPrepareFailure:CN响应超时;CN响应IuReleaseCommand;终端RB重配失败;终端RB重配失败;下面分别详细描述各类异常发生的场景及原因,并给出对应排查手段。
1.2.2 典型信令过程及异常分析1.2.2.1 CN侧响应RelocationPrepareFailure异常描述当S-RNC向CN发送Relocation Required消息后,CN向D-RNC发送Relocation Request,D-RNC侧发起类似于业务接入的流程,分配信令、业务所需的物理资源,并建立无线链路及相应承载,其中任何一个步骤发生异常,则会向CN响应Relocation Failure消息,携带D侧失败的错误码,CN通过Relocation Preparation Failure消息透传该错误码到S-RNC,由于是重定位准备阶段流程发生异常,不会记入跨RNC切换失败,因此不会影响任何KPI指标,但此类异常会导致终端脱离源小区覆盖而又无法切换,最终因覆盖问题导致掉话。
信令过程由于比较难于搜集同一次跨RNC切换异常过程中S侧和D侧的信令,因此本部分未以截图的形式给出行令流程。
S侧信令:D侧信令:原因分析及排查根据S侧Relocation Preparation Failure消息或Relocation Failure消息中的错误码,参考非标准原因错误码对应表中说明,进行排查;第 9 页1.2.2.2 CN响应超时异常描述当CN Iu口负荷过高或CN存在某种异常时,会不处理S侧发送的Relocation Required消息,D侧表现为看不到任何信令,S侧在发送Relocation Required 后会设置等待定时器,定时器时长内CN未响应任何消息,则S侧认为对方状态不可知,则发起Iu连接释放过程,记作一次掉话,此类异常影响业务掉话率指标。
信令过程S侧信令:D侧信令:D侧未收到任何CN下发的信令消息。
原因分析及排查需要确认和CN的Iu口链路是否存在问题,如故障、拥塞等,重点在CN侧排查问题。
1.2.2.3 CN响应IuReleaseCommand异常描述当CN存在某种异常时,收到S侧发送的Relocation Required消息,立即下发IuReleaseCommand,D侧表现为看不到任何信令,此种异常不会导致任何KPI 指标异常,但会影响用户感受。
信令过程S侧信令:D侧信令:D侧未收到任何CN下发的信令消息。
原因分析及排查需要确认和CN是否存在问题,如故障、拥塞等,重点在CN侧排查问题。
1.2.2.4 终端RB重配失败异常描述当S-RNC向CN发送Relocation Required消息后,D侧完成资源分配及建立过程,S侧下发RB重配消息,由于终端在目标侧同步失败,终端上报RB重配失败消息,记作一次跨RNC切换失败,此类异常影响系统RNC间切换成功率,此外该异常会导致终端脱离源小区覆盖而又无法完成切换,最终因覆盖问题导致掉话。
信令过程S侧信令:第 11 页D侧信令:第 13 页原因分析及排查排查方法参考物理信道重配失败。
1.2.2.5终端RB 重配超时异常描述当S-RNC 向CN 发送Relocation Required 消息后,D 侧完成资源分配及建立过程,S 侧下发RB 重配消息,由于终端在目标侧同步失败,终端上报RB 重配失败消息,记作一次跨RNC 切换失败,此类异常影响系统RNC 间切换成功率,此外该异常会导致终端脱离源小区覆盖而又无法完成切换,最终因覆盖问题导致掉话。
信令过程 S 侧信令:D侧信令:原因分析及排查排查方法参考物理信道重配超时。
1.3 CS系统间切换过程中的异常1.3.1 总体描述1.3.2 典型信令过程及异常分析1.3.2.1 重定位失败信令过程原因分析及排查TRANAP_relocation_failure_in_target_CN_RNC_or_target_system:在2G 网络侧重定位失败,原因不明,可能是GSM侧资源分配问题;TRANAP_unknown_target_rnc:可能原因如下:23G CN对接参数配置错误:外场初期进行23G测试时都是这个原因,正确配置后问题即可解决;在Not_BSICVerficationRequired配置,有时UE会上报非要求测量的频点测量事件结果,也会出现此现象;TRANAP_unspecified_failure:原因不明;1.3.2.2 UE返回handoverFromUTRANFailure信令过程原因分析及排查切换失败的原因都为configurationUnacceptable时,目前认为和UE能力有关,协议上规定,UE返回原因为configurationUnacceptable切换失败的可能为:UTRAN要求UE在不支持的情况下进行切换;或UTRAN要求UE使用其不支持的配置;或HANDOVER FROM UTRAN COMMAND消息中包含了信元“RAB information第 15 页List”,并且这个信元不包含任何一个其信元“CN domain Identity”被设置为“CS domain”的信元“RAB info”。
目前版本中HANDOVER FROM UTRAN COMMAND消息是不携带“RAB information List”信元的,因此应该是和UE能力相关。