网优常见指令及告警分析(精选)
- 格式:ppt
- 大小:820.50 KB
- 文档页数:46
SDH常见告警分析与信号流
一、SDH常见告警分析
1、告警概述
SDH(Synchronous Optical Network)是一个如今非常流行的高速数字
传输技术,它将各种网络服务联接到一个基于光纤的正交网中。
通过在此
网络上提供端到端的数据传输,SDH能够实现更高的带宽,更低的成本以
及更高的可靠性。
SDH技术具有较高的灵活性和可靠性,但它也存在一定的风险,典型
表现为传输质量下降、网络中断,网络性能下降等。
要确保网络可靠,运营商必须采取一些措施来监控网络,检测可能会
引起故障的事件,并及时采取有效的故障处理措施。
其中SDH告警检测是一种常见的故障监控技术,它可以发现和跟踪SDH网络中出现的异常情况,从而及时发现故障源,有效的处理网络故障。
2、常见SDH告警
SDH网络中的常见告警主要包括以下几类:
(1)信号失步:又叫网元失步,是指在SDH网络中,网元的时钟和信
号的传输时间不一致,导致网络的传输出现失步现象。
(2)传输质量异常告警:SDH的传输质量是指把原始信号转换为该网
络的Status Bits格式并在网络内传输时,信号的损耗、延时、差错率、
帧丢失率等参数;当这些参数超过允许的阈值时,就会产生传输质量异常
告警。
网优班华为2G及3G网管告警处理说明无线华为2G系统:目前,网优班华为2G系统包括M2000网管服务器一台(设备在省公司核心机房),华为BSC计5套,其中新区机房四楼有3套,分别为:YAC-HBSC-6000-01:,YAC-HBSC-6000-04:,第三机房楼有1套,YAC-HBSC-6900-05:,下挂基站约300个左右的基站。
华为2G基站退服的故障及告警全部统一在M2000网管客户端上进行查看,主要操作步骤如下:1、双击桌面上的“M2000客户端”图标,打开客户端。
2、在出现的登陆对话框中,输入用户名:yclidw,密码:YCHhuawei@1,检查服务器地址是否为:,确认无误后,按登陆进入系统。
3、进入M2000服务器后可以看到主界面,左上角为“盐城移动分公司2G华为网络管理系统“,分别有”主拓扑“等按钮,在主界面的右上角,分别显示紧急告警(红色)、重要告警(棕色)、次要告警(黄色)、及提示告警(灰色)等四类告警类型。
值班主要看紧急告警,包括了基站退服、BSC级的单板或其它紧急故障等。
4、双击红色告警,即可显示紧急告警的列表,如图显示,其中“OML故障告警“即为基站退服的告警,绿色标记的基站已恢复的告警。
白色标记的为基站仍在退服当中的,必须即时通知各县市代维进行处理。
频次表示的是该基站当天重复退服的次数。
对于绿色标记已恢复的基站,可按右键,点”确认“键,即可清除该告警。
该告警即不会在列表中显示出来了。
5、对于所有告警,可按右键,将告警列表另存为EXCLS表格,便于后期统计及处理。
无线华为3G(TD)系统:网优班华为3G系统与2G系统较相似,界面及操作方法基站一致,其中包括M2000网管服务器一台(设备在省公司核心机房),华为RNC计10套,其中RNC01-04在盐湾三楼机房,其它RNC05-10在黄山路第三机房楼内。
华为3G的所有告警在3G网管系统OMC920客户端上进行查询及处理。
告警分析及处理一、动环1、网管1)帐号登陆提示连接失败或鉴权失败:可分为两个原因,一是网络中断,无连接到服务器,二是服务器程序未运行,需要联系网管人员进行程序启动。
提示用户被锁定:因用户多次密码输入错误,导致用户被锁定,需要联系系统管理员进行帐号解锁设臵。
2)网络连接网络连接故障:本地连接断开,检查电脑网口网线是否连接正常,检查交换机端网口网线连接是否正常,其次检查电脑网卡是否存在故障。
3)基站中断基站中断分三个方面:一是模拟站或者干节点站的站点全部中断,导致原因应该是模拟站的前臵台或者干节点的前臵台程序未运行或者连接中断;二是模拟站的多个站点同时中断,这种现象一般是中断站点传输在同一传输设备ETN上,如果该ETN与交换机之间传输出现问题,就会出现这种故障,检查ETN与交换机之间网管连接情况;三是个别站点出现监控中断,导致原因可分两方面:一是该基站传输出现故障,二是底端EISU设备出现故障或者基站为EISU提供48V电源出现故障。
2、基站1)动力设备A、开关电源监控中断:分为四方面,一是从施工一直未正常监控的,为电源监控模块故障,需要更换电源监控模块;二是检查是否因为更换电源模块后所致,是否更换了电源监控模块型号,或者更换监控模块后,电源监控模块后的RS232通信口的连接线是否连接正常。
三是开关电源监控模块故障,需要更换电源监控模块;四是电源其它告警(欠压、防雷故障之类的),检查现场电源监控模块内告警内容,如果也存在相应告警,则是电源实际告警,如果不一致请联系厂家进行数据处理。
B、空调空调控制:因基站都做有相应的空调节能系统,网管进行控制后不能产生效果。
空调电流及空调状态:如果空调电流出现值无效之类的告警,一般为基站空调电流监测设备出现接线错误,检查该基站是否更换空调,而导致电流监测设备被拆除,如果设备正常,请检查设备接线情况。
C、蓄电池监控原理:对两组蓄电池的总电压进行测量,测点一般设在开头电源柜内的电极排上,如果出现电压数值不付或者故障,检查现场电极排上测点之间电压是否正常,接线是否正常;电流监测在蓄电池电源线上有个直流电流互感器进行监测,如果出现电流数据为-45,一般为直流电流互感器接线故障,检查接线是否有松动。
常见(重要)告警说明一.常见(重要)告警列表:目录索引:1.1 PROCESSOR[33] ACCESS-FAIL[3] (3)1.2 BSC-ADAPT[73]EQUIPMENT-FAULT[128]: (4)1.3 BSC-CLOCK[52] LOSS-OF-SYSTEM-CLK-A[3]: (5)1.4 BSC-CLOCK[52] LOSS-OF-SYSTEM-CLK-B[4]: (5)1.5 BSC-CLOCK[52] BSC-RUN-ON-LOCAL-CLK[6]: (6)2.1 PROCESSOR[33] RESTART[0]: (7)2.2 PROCESSOR[33] RESET[1]: (7)2.3 PROCESSOR[33] SDCCH-OVRL-BSC[9]: (8)2.4 PROCESSOR[33] TAKEOVER[7]: (8)2.5 PROCESSOR[33] RELC-OV[4]: (9)2.6 GOLBAL-BSC[47] SCCP-NOT-A V AIL[1]: (10)3.1 N7[35] LNK-REP[0]: (11)3.2 TSC-TRUNK [66] TWO-MB-MISSING[50]: (11)3.3 TSC-TRUNK [66] AIS-2-MB[66]: (11)3.4 TSC-TRUNK [66] FRAME-ALIGNMENT[81]: (11)3.5 TSC-TRUNK [66] BER-10E-3[99]: (12)3.6 TSC-TRUNK [66] BER-10E-4[100]: (12)3.7 TSC-TRUNK [66] BER-10E-6[102]: (12)3.8 TSC-TRUNK [66] FAR-END-ALARM[176]: (12)4.1 BSS BVCSig is broken on: (13)4.2 BSS GSL is broken on(GSL out): (14)5.1 CELL[43] LOSS-OF-BCCH[0]: (16)5.2 CELL[43] LOSS-OF-ALL-CHAN[3]: (17)6.1 CELL[43] LOSS-OF-TCH[2]: (18)7.1 RTCH_fail_rate (18)8.1 BTS-EXTERNAL[9] bts-external-2[2] (19)8.2 BTS-EXTERNAL[9] bts-external-2[2]mbo (19)8.3 ENVIR[5] MAINS-AL[20] (19)9.1 BTS-EXTERNAL[9] bts-external-3[3] (19)9.2 BTS-EXTERNAL[9] bts-external-3[3]mbo (19)10.1 At least one temperature sensor has detected a T > 65C: (20)10.2 CNVR: disjunction due to output voltage problem on converter: (20)10.3 2.1V: no more redondancy of GPU boards: (21)二.常见(重要)告警祥解: BSC设备方面的常见告警:1.1 PROCESSOR[33] ACCESS-FAIL[3]1.2 BSC-ADAPT[73]EQUIPMENT-FAULT[128]:1.3 BSC-CLOCK[52] LOSS-OF-SYSTEM-CLK-A[3]:1.4 BSC-CLOCK[52] LOSS-OF-SYSTEM-CLK-B[4]:1.5 BSC-CLOCK[52] BSC-RUN-ON-LOCAL-CLK[6]:BSC负荷方面的常见告警:2.1 PROCESSOR[33] RESTART[0]:2.2 PROCESSOR[33] RESET[1]:2.3 PROCESSOR[33] SDCCH-OVRL-BSC[9]:2.4 PROCESSOR[33] TAKEOVER[7]:2.5 PROCESSOR[33] RELC-OV[4]:2.6 GOLBAL-BSC[47] SCCP-NOT-A V AIL[1]:BSC传输方面的常见告警:3.1 N7[35] LNK-REP[0]:3.2 TSC-TRUNK [66] TWO-MB-MISSING[50]:3.3 TSC-TRUNK [66] AIS-2-MB[66]:3.4 TSC-TRUNK [66] FRAME-ALIGNMENT[81]:3.5 TSC-TRUNK [66] BER-10E-3[99]:3.6 TSC-TRUNK [66] BER-10E-4[100]:3.7 TSC-TRUNK [66] BER-10E-6[102]:3.8 TSC-TRUNK [66] FAR-END-ALARM[176]:GRPS方面的常见告警:4.1 BSS BVCSig is broken on:4.2 BSS GSL is broken on(GSL out):4.3 LapDLink disabled:小区退服的关键告警:5.1 CELL[43] LOSS-OF-BCCH[0]:5.2 CELL[43] LOSS-OF-ALL-CHAN[3]:基站载频退服关键告警:6.1 CELL[43] LOSS-OF-TCH[2]:小区分配失败7.1 RTCH_fail_rate基站交流断电外部告警:8.1 BTS-EXTERNAL[9] bts-external-2[2] 8.2 BTS-EXTERNAL[9] bts-external-2[2]mbo 8.3 ENVIR[5] MAINS-AL[20]基站直流低电压外部告警:9.1 BTS-EXTERNAL[9] bts-external-3[3] 9.2 BTS-EXTERNAL[9] bts-external-3[3]mboMFS重要外部告警10.1 At least one temperature sensor has detected a T > 65C:10.2 CNVR: disjunction due to output voltage problem on converter:10.3 2.1V: no more redondancy of GPU boards:。
常见(重要)告警说明一.常见(重要)告警列表:目录索引:1.1 PROCESSOR[33] ACCESS-FAIL[3] (3)1.2 BSC-ADAPT[73]EQUIPMENT-FAULT[128]: (4)1.3 BSC-CLOCK[52] LOSS-OF-SYSTEM-CLK-A[3]: (5)1.4 BSC-CLOCK[52] LOSS-OF-SYSTEM-CLK-B[4]: (5)1.5 BSC-CLOCK[52] BSC-RUN-ON-LOCAL-CLK[6]: (6)2.1 PROCESSOR[33] RESTART[0]: (7)2.2 PROCESSOR[33] RESET[1]: (7)2.3 PROCESSOR[33] SDCCH-OVRL-BSC[9]: (8)2.4 PROCESSOR[33] TAKEOVER[7]: (8)2.5 PROCESSOR[33] RELC-OV[4]: (9)2.6 GOLBAL-BSC[47] SCCP-NOT-A V AIL[1]: (10)3.1 N7[35] LNK-REP[0]: (11)3.2 TSC-TRUNK [66] TWO-MB-MISSING[50]: (11)3.3 TSC-TRUNK [66] AIS-2-MB[66]: (11)3.4 TSC-TRUNK [66] FRAME-ALIGNMENT[81]: (11)3.5 TSC-TRUNK [66] BER-10E-3[99]: (12)3.6 TSC-TRUNK [66] BER-10E-4[100]: (12)3.7 TSC-TRUNK [66] BER-10E-6[102]: (12)3.8 TSC-TRUNK [66] FAR-END-ALARM[176]: (12)4.1 BSS BVCSig is broken on: (13)4.2 BSS GSL is broken on(GSL out): (14)5.1 CELL[43] LOSS-OF-BCCH[0]: (16)5.2 CELL[43] LOSS-OF-ALL-CHAN[3]: (17)6.1 CELL[43] LOSS-OF-TCH[2]: (18)7.1 RTCH_fail_rate (18)8.1 BTS-EXTERNAL[9] bts-external-2[2] (19)8.2 BTS-EXTERNAL[9] bts-external-2[2]mbo (19)8.3 ENVIR[5] MAINS-AL[20] (19)9.1 BTS-EXTERNAL[9] bts-external-3[3] (19)9.2 BTS-EXTERNAL[9] bts-external-3[3]mbo (19)10.1 At least one temperature sensor has detected a T > 65C: (20)10.2 CNVR: disjunction due to output voltage problem on converter: (20)10.3 2.1V: no more redondancy of GPU boards: (21)二.常见(重要)告警祥解:BSC设备方面的常见告警:1.1 PROCESSOR[33] ACCESS-FAIL[3]1.2 BSC-ADAPT[73]EQUIPMENT-FAULT[128]:1.3 BSC-CLOCK[52] LOSS-OF-SYSTEM-CLK-A[3]:1.4 BSC-CLOCK[52] LOSS-OF-SYSTEM-CLK-B[4]:1.5 BSC-CLOCK[52] BSC-RUN-ON-LOCAL-CLK[6]:BSC负荷方面的常见告警:2.1 PROCESSOR[33] RESTART[0]:2.2 PROCESSOR[33] RESET[1]:2.3 PROCESSOR[33] SDCCH-OVRL-BSC[9]:2.4 PROCESSOR[33] TAKEOVER[7]:2.5 PROCESSOR[33] RELC-OV[4]:2.6 GOLBAL-BSC[47] SCCP-NOT-A V AIL[1]:BSC传输方面的常见告警:3.1 N7[35] LNK-REP[0]:3.2 TSC-TRUNK [66] TWO-MB-MISSING[50]:3.3 TSC-TRUNK [66] AIS-2-MB[66]:3.4 TSC-TRUNK [66] FRAME-ALIGNMENT[81]:3.5 TSC-TRUNK [66] BER-10E-3[99]:3.6 TSC-TRUNK [66] BER-10E-4[100]:3.7 TSC-TRUNK [66] BER-10E-6[102]:3.8 TSC-TRUNK [66] FAR-END-ALARM[176]:GRPS方面的常见告警:4.1 BSS BVCSig is broken on:4.2 BSS GSL is broken on(GSL out):4.3 LapDLink disabled:小区退服的关键告警:5.1 CELL[43] LOSS-OF-BCCH[0]:5.2 CELL[43] LOSS-OF-ALL-CHAN[3]:基站载频退服关键告警:6.1 CELL[43] LOSS-OF-TCH[2]:小区分配失败7.1 RTCH_fail_rate基站交流断电外部告警:8.1 BTS-EXTERNAL[9] bts-external-2[2] 8.2 BTS-EXTERNAL[9] bts-external-2[2]mbo 8.3 ENVIR[5] MAINS-AL[20]基站直流低电压外部告警:9.1 BTS-EXTERNAL[9] bts-external-3[3] 9.2 BTS-EXTERNAL[9] bts-external-3[3]mboMFS重要外部告警10.1 At least one temperature sensor has detected a T > 65C:10.2 CNVR: disjunction due to output voltage problem on converter:10.3 2.1V: no more redondancy of GPU boards:。
4G常见告警解析及常用操作第一篇:4G常见告警解析及常用操作4G重要告警解析一、影响小区发射的告警1.ReachabilityProblem(基站退服或脱管)λAlarm Code:ReachabilityProblem λ告警影响:eNode B 设备监控失去λ告警原因分析:导致该告警的原因主要体现在三个方面:电源、传输、主控卡(C板)故障: 1)电源:交流停电等,此时应该有相关环境告警上传; 2)传输:传输断3)主控卡故障:主控卡出现掉死、无法正常启动、不断重启等故障;λ告警解决方法:电源或传输问题,请相关人员解决;如果是主控卡故障,需要维护人员上站解决;更换主控卡后,需要先问网管人员要一个Yang WO文件重新下软件并导入WO文件激活。
2.CB INIT FAILURE(C板初始化失败)λAlarm Code:IK4004001 λ告警影响:整站退服,设备可监控;λ告警原因分析:C板故障或者高温导致λ告警解决方法:需上站下电重启设备,或热插拔C板,若故障依旧需要更换C板,更换流程请参考ReachabilityProblem(基站退服或脱管)3.NO CONTACT TO BOARD(B板退服)λAlarm Code:IK4009041 λ告警影响:整站退服,小区不发射;λ告警原因分析:若基站无C板或者GPS告警的话,则是B板故障λ告警解决方法:网管重启基站不管用的话,需要上站更换,更换B板会自动下软件,基站侧不需要做任何操作,大概需要10分钟左右4.LTECellAdminDown(小区退服)λAlarm Code:LTECellAdminDown λ告警影响:相应小区退服;λ告警原因分析:一般都是由于基站硬件告警或者小区被lock所致λ告警解决方法:首先排除小区或基站是否被locked,其次查看是否有导致小区退服的硬件告警5.NO CONTACT TO BOARD(RRH脱离)λAlarm Code:IK4009138 λ告警影响:某个RRH对应的小区不发射λ告警原因分析:造成此告警的原因可能是电源,光纤及RRH故障λ告警解决方法:需下站查看电源及RRH和C板连接的光纤衰耗,如果两种情况都正常的话,就要考虑RRH本身的问题了,最好的方法是塔上和别的正常小区做对调来排查6.CB LOS LOF CPRIPORT *(某个小区RRH脱离)λ Alarm Code:IK4004030 λ告警影响:对应小区不发射λ告警原因分析:造成此告警的原因可能是电源,光纤及RRH故障λ告警解决方法:需下站查看电源及RRH和C板连接的光纤衰耗,如果两种情况都正常的话,就要考虑RRH本身的问题了,最好的方法是塔上和别的正常小区做对调来排查7.CB ALL CPRIPORTS FAILED(所有小区不RRH脱离)λAlarm Code:IK4004061 λ告警影响:所有小区不发射λ告警原因分析:造成此告警的原因可能是电源,光纤及RRH故障λ告警解决方法:需下站查看电源及RRH和C板连接的光纤衰耗,如果两种情况都正常的话,就要考虑RRH本身的问题了,最好的方法是塔上和别的正常小区做对调来排查8.CB TRANS RX LOS CPRIPORT *(某个RRH脱离)λ Alarm Code:IK4004042 λ告警影响:造成此告警的原因可能是电源,光纤及RRH 故障λ告警原因分析:RRH掉电、不加电,RRH掉死,光纤故障,CCM板卡故障等原因都会出现RRH脱离告警;λ告警解决方法:需下站查看电源及RRH和C板连接的光纤衰耗,如果两种情况都正常的话,就要考虑RRH本身的问题了,最好的方法是塔上和别的正常小区做对调来排查;9.CB GPS ANTλ Alarm Code:IK4004082 λ告警影响:GPS时钟不同步,长期告警会造成整站退服λ告警原因分析:GPS天线安装问题或者接头等问题λ告警解决方法:检查GPS天线及各个接头,告警同时会伴随产生以下告警IK4004012,IK4004014,IK4004157(GPS锁卫星失败)10.ANTENNA_PORT TX VSWR THRESH2(2级驻波)λ Alarm Code:IK4011011 λ告警影响:小区不发射λ告警原因分析:天馈接口问题λ告警解决方法:下站基站馈线头是否松动或者进水等等11.ANTENNA_PORT GAIN CONTROL TX(天线口传输主分支增益已经超出范围)λ Alarm Code:IK4011005 λ告警影响:小区不发射λ告警原因分析: RRH硬件故障λ告警解决方法:step1:SAM侧重启该RRH。
应急通信保障方案要点:①、首先确定应急保障区域的大概人数(市场部提供)。
②、按照人数预测产生话务量为每观众话务量(爱尔兰)0.03erl*人数。
③、统计目前应急保障区域覆盖小区(现场测试)。
④、根据现场测试统计覆盖小区的信道配置及最大能承载的话务(参照之前话务最忙时的话务情况)⑤、若现网配置不能满足应急保障区域产生的话务量则尽可能的扩容载频。
⑥、扩容后还是不能满足活动区域产生的话务量则建议增派应急通信车。
⑦、根据话务情况增派应急通信车信道配置,目前应急通信车最大配置为12+12+12,一般分两层UL/OL,OL配置4个GSM900载频、UL配置8个GSM1800载频。
⑧、时时监控话务,若有拥塞小区作话务分担。
道路质量①、勘查道路涉及的基站,路测数据采集、分析。
形成道路覆盖情况图。
②、对信号强度较高而有质差的路段,查看测试LOGFILE,C/I值较低的建议重新规划频点,对于占用某小区信号很强而持续的6、7级干扰,则有可能载频故障或天馈线问题。
③、弱信号质差,则查看周围是否有基站覆盖或是掉站引起,若有基站覆盖则可以调整天线下倾角、增加基站发射功率等增强信号,若现网无法调整解决的则可以建议增加基站覆盖(主要是农村)。
④、弱信号覆盖较多的质差区域则可以通过小区参数、天线调整,确定主覆盖小区,优化道路信号覆盖,理顺切换关系,提高道路通话质量。
差小区处理差小区比例指忙时话音信道掉话率高于3%的小区总数占所有小区总数的比例。
其中小区总数指每信道话务量>0.1爱尔兰的小区处理方法如下:1、首先检查硬件,TCH信道完好率是否100%,若不是100%,则建议基站代维检查硬件。
2、若无硬件故障,则根据STS统计,查看掉话类型,质差掉话多可能是频点干扰或外部干扰,可以通过FAS修改频点或通过RLCRP查看上行干扰情况;弱信号掉话则查看小区附近基站分布情况,检查是否有漏定义切换关系的现象;突然掉话则检查是否有传输误码、天馈线告警、TRA设备故障;3、另外可以通过TS统计查看掉话是否集中某一块载频,排除载频软件故障。
爱立信LTE无线专业常见告警目录Heartbeat Failure (2)ServiceUnavailable (2)ServiceDegraded (2)Gigabit Ethernet Link Fault (3)Remote IP Address Unreachable (3)Loss of Tracking (4)Network Synch Time from GPS Missing (6)System Clock Quality Degradation (6)PowerFailure (6)LinkFailure (7)LinkStability (7)VswrOverThreshold (8)CalibrationFailure (8)Plug-In Unit HW Failure (9)Plug-In Unit General Problem (9)GeneralHwError (10)HwFault (10)GeneralSwError (10)License Key File Fault (11)LicenseKeyMissing (11)Heartbeat Failure(基站退服或断站) 告警解释:此告警表示基站心跳告警,即基站脱管。
可能原因:(1)DU掉电(2)传输故障(3)DU故障(4)OSS原因(网管)处理步骤:(1)检查电源状态。
(2)检查DU电源接头是否松动,如有松动重做接头。
(3)检查基站传输连接,如有虚接或者尾纤破损则进行重接或者更换。
(4)通知传输检查传输状态。
(5)DU下电重启.(6)更换DU。
(7)配置原因,检查数据原因,回落到割接之前的地址,更换IP ServiceUnavailable告警解释:此告警表示小区服务质量不可用,即小区退服。
该告警为伴生告警,其提示作用。
能够触发该告警的常见子告警为:●PowerFailure(电源故障)●LinkFailure(光路告警)●HwFault(RRU硬件故障)●TemperatureExceptionalTakenOutOfService(RRU高温告警)可能原因:由于该告警为伴生告警,可能原因请参见其伴生的子告警。