重要活动应急保障方案-修改
- 格式:doc
- 大小:965.00 KB
- 文档页数:8
重要活动应急保障方案
-修改
-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN
重要活动应急通信保障方案
一、应急保障分类
恰当的应急分类是指导应急方案制定和实施的重要一环,明确应急保障分类,是分析应急保障事件特征的重要工具,进而明确保障的重点和难点,明确制约应急保障的主因和次因,并制定针对性的保障方案。
一般应急保障分为常规性通信保障、突发事件通信保障、重大事件通信保障。
二、重大事件应急保障流程
针对重大事件应急保障,一般分事前、事中、事后保障三个阶段。
三、应急保障举例
东荷体育馆许巍演唱会应急保障方案
1、信息采集(保障时间、地点及范围)
据演唱会官方发布,许巍将于11月29日于东荷体育馆举行巡回演唱会,为满足界时大量突发通信需求,济南移动提前进行通信测试保障,具体测试安排如下:
1)活动时间:
2014年11月25日至29日
2)测试设备:MIFI终端及D2测试手机
3)测试范围:
活动范围为济南东荷体育馆,重点保障区域为1-4层看台及走廊人员聚集区域及三楼包厢区域。
2、演唱会测试保障方案
测试前注意事项:
1)确认测试区域:活动进行前提前模清体育馆现场建筑结构,各RRU布放位置及覆盖范
围,确保各RRU运行正常。
2)测试人员提前到位:由于早忙时堵车严重,要求测试人员提前进入场馆进
行通信保障。
3)风险点规避:活动期间设备故障及大话务带来的拥塞等指标恶化,需要提前协调应急
通信车及工程设备RRU备件,避免打不通电话引起的大量投诉。
4)测试范围站点状态监控:后台人员测试前提前到位,提取现网各站点运行、告警及话
务量状态,如发现问题及时报保障人员,及时进行有效规避处理。
5)关键配置检查
------修改TDD SRS配置方式为接入优先。
------打开SRI资源自动调整开关。
------关闭DRX开关。
------扩双载波并配置负载均衡。
------保证周围邻区关系完整。
活动保障方案实施施
1)提前进行话务分析,预估话务需求。分析活动现场占用小区情况,针对活动现场人员情况对相应小区进行扩容处理,提前协调应急通信车到现场进行保障2)对重点人物入场路线及重点场所进行模底保障。对活动周边道路进行遍历测试及重点区域的CQT拨测,确保目标人物的通信体验。
3)加强设备监控力度.加大话统分析和告警监控力度,对每日指标性能最差小区进行分析,拿出解决方案,及时解决。每小区发出告警及话务监控信息,抄送全体保障组人员,准备相关应急板件,保障基站稳定运行,预留部份重要的备品备件以便能及时处理重要基站的故障
4)应对突发事件通信保障
突发事件的一个突出现象就是某个特定区域内短时间话务激增,出现高拥塞现象,为很好的应对此类事件,我们从以下5个方面做好应急保障工作:
A、应急小区预安装:应急小区数据、装传输电路及基站数据预先制作并调试完成,根据活动需要随时可以开启应急。
B、专项应急设备:仓库常年备存BBU\RRU等相关设备,同时有配套的天馈系统和其它配套设施,作为应急通信的专项备品备件。
C、专项车辆配备:网优中心配有应急通信车辆1台,承担应对突发事件的开站、扩容、测试和故障处理工作。
D、专项人员配备:各个专业有专门处理突发事件的应急人员
3、应急预案
一般情况下,通过活动前巡检,不会出现如上告警。但是一旦出现如上告警,轻则影响性能,重则业务中断。请按照如下原则进行处理:
1)首先按照告警帮助进行处理(重启和换板措施在本步骤先不考虑);
2)若不能消除告警,尝试重启;
3)若仍然不能解决问题,尝试更换单板。(需要提前准备好备板)
RRC建立成功率急剧恶化应急处理
【入口条件】
通过实时监控或15分钟话统发现RRC建立成功率已经急剧恶化(恶化程度已经超过客户预期),且
通过15分钟话统看到指标<=100,且
实时监控主控&基带CPU最大利用率低于60%。
满足以上条件按,说明用户数可能先于系统处理能力受限。
【应急措施】
缩短UE不活动定时器(如果当前值大于10s,则改到10s;否则不能修改,否则有可能导致RRC建立次数大幅上升,对系统形成冲击)。
若实施后RRC建立成功率仍然低于客户要求,则考虑使用拉长T302定时器或者降功率缩小小区覆盖的措施,将部分边缘用户迁移到负载较轻的LTE邻区或异系统邻区,但需
确认邻区未过载,并跟网规网优人员确认压缩后不会出现覆盖盲区。
注意:一旦执行了某项措施后发现主控或基带CPU最大利用率超过80%,需要立即将该措施回退。
CPU过载的应急处理
【入口条件】
基站上报CPU过载告警,且
通过15分钟粒度话统看到指标>100,且
通过15分钟粒度话统看到CPU峰值超过预设门限的次数()超过5%。假如话统周期是15分钟,那么每个话统周期共检测15*60=900次。如果这个counter值超过45,就认为满足过载条件。
【应急措施】
应急方案
启动AC BAR,降低导频功率,缩少覆盖范围。
参数回退
上述方案影响用户体验,尤其是AC BAR。因此当从15分钟话统中看到CPU最大占有率低于70%后,需要将上述措施依次回退。每回退一个,观察15分钟。
C ELLACBAR时间因子回退到70;
取消CELLACBAR;
U E不活动定时器恢复为初始值;
回退过程中如果又出现CPU过载,则取消上一步回退。
4、测试保障团队人员职责
济南LTE网络ATU测试保障团队人员职责
分组人员职责
李长安(华为)华为服务经理;协调人员、资源
王献永(华为)华为网优负责人;对各模块之间的沟通,测试华为保障人员进行工作协调安排、测试全程保障
测试维护保障组王根(华为)前场电话联系,现场问题处理协调
赵鹏(华为)
话务、告警、干扰监控/15分钟,告警站点、不可用小区及
时告知,协调处理
杨永亮(华为)
现场测试保障工作,对现场各区域测试并反馈测试情况,结
合现场情况提出合理处理建议
崔亮(华为)
现场测试保障工作,对现场各区域测试并反馈测试情况,结
合现场情况提出合理处理建议