2.3、传输常见告警分析及处理
- 格式:pptx
- 大小:634.71 KB
- 文档页数:76
阿尔卡特SDH常见告警及处理方法阿尔卡特SDH故障2.1 RUP, RUM, ICP类告警处理告警名称或故障现象:Replaceable Unit Problem机盘故障; Replaceable Unit Missed机盘不在位; Internal Communication Problem 内部通信(控制信号)故障,相应的故障机盘报故障。
告警产生原因:1.原因1 RUM还可能是网管配置了板,但实际配插板2.原因2 机盘硬件故障3.原因3 ICP有可能是其它盘引起,如1660的矩阵、主控;1662的SYNTH16;1642的MB板告警处理方法:1.原因1 对于RUM首先核实是否现场每插板,如没插板可在网管去配置(对于有配置电路或作为时钟源的,需先删除这些配置),当然现场每插板,由配置了电路或时钟源需仔细核实是否是垃圾数据在删。
2.原因2 替换相应的故障盘3.对于ICP告警如替换故障盘后仍不消失,则需考虑可能是其它的矩阵、主控、SYNTH16、MB盘等引起。
可先对这些怀疑的板做插拔(注意对业务和监控的影响,一般主控盘插拔只影响监控;矩阵和SYNTH16均有保护,如无异常状态或第二处故障,插拔备用也不影响业务(要插拔当前的主用矩阵需先切换成备用角色再插拔,切换后等15分钟让它同步完再操作)),定位到故障板后替换故障板。
2.2 TD, URU, TF告警告警名称或故障现象:设备光口或端口报TD(Transmitter Degraded), URU (Underlying Resource Unavailable), TF (Transmitter Failure)告警。
告警产生原因:1.原因1 如有光模块的机盘,则可能是故障2.原因2 机盘故障告警处理方法:1.原因1 替换光模块2.原因2 替换机盘2.3 LOS, LOF告警处理告警名称或故障现象:LOS(Loss of signal;LOF(Loss Of Frame);MS-AIS;MS-RDI告警告警产生原因:1.原因1 光缆故障2.原因2 对端设备停电或吊死(主要是接入设备)3.原因3 显现硬件故障,相应光板报RUP、RUM、ICP、URU、TD、TF等告警4.原因4 隐性硬件故障5.原因5 光模块吊死告警处理方法:1.原因1 对光及OTDR测试等排查光路故障,清除光缆故障(具体见光缆故障处理)2.原因2 现场开电或环MB板3.原因3 显现硬件故障请替换相应的故障板4.原因4 当光路对光正常,无明显的硬件故障后,则可能是隐性硬件故障。
浅谈SDH传输常见故障分析及处理[摘要]铁路通信传输系统是铁路系统从指挥调度到具体现场运行检修及维护的信息重要获取通道,一旦通信传输系统系统出现故障,则会造成影响运输的重大事故,为此在通信传输系统的日常维护工作中要求我们对各类故障进行定位并及时排除。
[关键词]基本原则 sdh 故障处理方法中图分类号:td327.3 文献标识码:a 文章编号:1009-914x (2013)05-0299-01一、传输故障定位的基本原则传输故障定位一般应遵循“先抢通后修复、先外部后传输、先单站后单板,先线路后支路、先高级后低级”的原则。
1.1先抢通后修复在出现故障时,系统维护者要首先抢通业务然后进行故障修复。
如果存在影响业务情况下的传输网络告警故障,如在2mbit/s业务通道出现los(信号丢失)告警,因外线原因导致的收无光告警,单元盘故障产生的unitfailure(单元失效)告警等情况下产生的故障,必须首先抢通业务。
1.2先外部后传输在处理故障时应先排除外部的可能因素,如断纤、终端设备故障、电源或机房环境配套故障等,而后进行传输系统原因查找。
当可能存在外界因素影响而产生传输网络告警故障时,如设备温度告警、光路告警、网元失效告警,也需照此原则处理。
1.3先单站后单板一般设备故障时,不会只是一个站点出现告警,而是在很多站点同时上报告警。
这时就需要通过分析和判断缩小范围,快速、准确地定位是哪个单站的问题,而后尽可能准确地将故障定位到单站后再具体定位到单板。
1.4先线路后支路在处理故障时,如果支路出现了大量ais告警,这时需要先排除线路板故障再查看支路板故障。
由于传输系统线路板的故障常常会引起支路板的异常告警,在处理告警时,应按“先线路后支路”的顺序,排除网管告警;如支路出现大量als则首先查看线路板是否出现los告警或其他异常告警,再查看支路板告警。
1.5先高级后低级在进行告警分析时,先分析高级别告警再分析低级别告警。
告警分析及处理一、动环1、网管1)帐号登陆提示连接失败或鉴权失败:可分为两个原因,一是网络中断,无连接到服务器,二是服务器程序未运行,需要联系网管人员进行程序启动。
提示用户被锁定:因用户多次密码输入错误,导致用户被锁定,需要联系系统管理员进行帐号解锁设臵。
2)网络连接网络连接故障:本地连接断开,检查电脑网口网线是否连接正常,检查交换机端网口网线连接是否正常,其次检查电脑网卡是否存在故障。
3)基站中断基站中断分三个方面:一是模拟站或者干节点站的站点全部中断,导致原因应该是模拟站的前臵台或者干节点的前臵台程序未运行或者连接中断;二是模拟站的多个站点同时中断,这种现象一般是中断站点传输在同一传输设备ETN上,如果该ETN与交换机之间传输出现问题,就会出现这种故障,检查ETN与交换机之间网管连接情况;三是个别站点出现监控中断,导致原因可分两方面:一是该基站传输出现故障,二是底端EISU设备出现故障或者基站为EISU提供48V电源出现故障。
2、基站1)动力设备A、开关电源监控中断:分为四方面,一是从施工一直未正常监控的,为电源监控模块故障,需要更换电源监控模块;二是检查是否因为更换电源模块后所致,是否更换了电源监控模块型号,或者更换监控模块后,电源监控模块后的RS232通信口的连接线是否连接正常。
三是开关电源监控模块故障,需要更换电源监控模块;四是电源其它告警(欠压、防雷故障之类的),检查现场电源监控模块内告警内容,如果也存在相应告警,则是电源实际告警,如果不一致请联系厂家进行数据处理。
B、空调空调控制:因基站都做有相应的空调节能系统,网管进行控制后不能产生效果。
空调电流及空调状态:如果空调电流出现值无效之类的告警,一般为基站空调电流监测设备出现接线错误,检查该基站是否更换空调,而导致电流监测设备被拆除,如果设备正常,请检查设备接线情况。
C、蓄电池监控原理:对两组蓄电池的总电压进行测量,测点一般设在开头电源柜内的电极排上,如果出现电压数值不付或者故障,检查现场电极排上测点之间电压是否正常,接线是否正常;电流监测在蓄电池电源线上有个直流电流互感器进行监测,如果出现电流数据为-45,一般为直流电流互感器接线故障,检查接线是否有松动。
中兴传输设备告警解析1. 板类型失配。
可能原因:该槽位的单板类型错、单板上报不成功、若为交叉板,可能是时分交叉配置出错。
解决方法:检查单板类型、更换单板槽位、更换单板、检查CS的时分交叉配置。
2. 电源板故障。
可能原因:主备份时,有一块电源板未开,或有一块已烧坏。
解决方法:检查告警单板电源开关是否打开,更换电源板。
3. AU通道告警指示(AU-AIS)。
可能原因:远端AU4通道发出AIS,邻站时隙未配置。
解决方法:检查时隙配置,通过环回一级一级排除故障。
4. AU指针丢失(AU-LOP)。
可能原因:光板与时钟板配合不好。
一般某站点出现这种告警,实际告警产生源是它的邻站(与告警光口相连)。
解决办法:更换光板、时钟板,更换光板槽位。
5. TU通道告警指示(TU-AIS)。
可能原因:同AU-AIS。
解决方法:检查时隙配置,检查该通道远端是否正常,利用各级环回确定故障位置。
6. TU指针丢失(TU-LOP)。
可能原因:远端时隙未配置,尤其与其他厂家光口对接时,会经常出现这种现象。
解决方法:检查时隙配置,若是不同设备的混合组网,要注意时隙转换。
7. 光口信号劣化。
可能原因:光功率过弱或过强,光板坏(本站或对端)。
解决办法:检查接受光功率,测试本站光口接受灵敏度(可以得出是否光板内部的接头处未接好),清洗光接头,或加衰减器,更换光板,如果是因为不可改变的线路造成的原因,可以考虑更换光模块(传输距离的能力依次为:短距、1310nm长距、1550nm长距),或增加光放大器。
8. 光口接收信号丢失。
可能原因:光功率过强或过弱,如果接收的光功率正常时,但仍出现LOS ,则可能是法兰盘处接触不好,或光器件引出的光纤头有污渍,或光接收模块坏。
解决方法:调整接收光功率,重新安装光接头和清洗光接头,更换光模块,更换光板。
9. 指针调整较大。
此处一般指光口的指针调整较大时,可能原因是相邻光板的基准时钟不一致,使得两处频率有偏差,设备只好不断产生指针调整以消除频率不一致。
关于传输告警问题的故障原因初步分析报告目录来自:一、故障描述及影响范围 (2)二、故障处理过程 (2)三、故障原因初步分析 (6)四、后续改进措施 (6)一、故障描述及影响范围1、故障描述:近期由于联通总部对台州联通巡检将至,对于基站(nodeb)出现大量反复的传输告警(PCM,TClink与RFI_IMA告警)。
在7670上检测的告警则是missconnect,faut,LIF等告警,文档将会对这些告警的含义与解决办法予以讨论。
2、故障影响范围:对于这些传输告警来说(PCM告警)对起基站业务速率产生影响,如果严重则会引起掉话。
TN_LINK告警如果大量出现则会引起小区降级甚至导致小区吊死的。
RFI_IMA告警大部分产生在基站传输的第一路主要是由于静电或者头子没有插好引起。
二、故障处理具体过程对于传输告警我们主要关注的是NODEB上的告警,因为NODEB才是我们处理的重点。
但传输告警的反馈会在7670上显示的比较全面一点,因此下面我门就NODEB与7670的告警分别来讨论。
第一:基站(nodeb)的告警1:基站(NODEB)PCM告警处理:1)查看7670上是不是有Physical Fault告警 2)查询中兴SDH上是不是有2M的los告警如果满足以上2点的话就可以确定是由于基站侧故障引起,我可以通过派单安排督导或者代维进行处理。
例如:对于椒江方元商务大厦TZSFW5701的告警显示PCM/4 PCM FAULT Specific Problem。
满足以上2点通过江主任与基站督导上站确认发现中兴SDH(S200的光端机)到DDF架有一根收发连线故障已经通知工程队整改。
2:基站(nodeb)TC_LINK告警的处理:1)如果基站出现TC_LINK告警,可以看出TN上显示如红色的部分4个PCM都是OK的,但VCC是没有激活的。
[a:] TN2:1-8 Cri:Alrm:1241 31MAY2011 09:06wcdma-admin[RW]> configure[c:] TN2:1-8 Cri:Alrm:1239 31MAY2011 09:06wcdma-admin[RW]> group ima 1-13-1-4-l11# Type Status Name1-13-1-4-L11 Cell Relay Ok TZW1457IfIndex : 286082544 (0x110D45F0)Link-Range : 1-1-1..3-7-3CAC_Links (C) : 4 ActTimeout : 2000 msMinNumLinks (P): 1 DeActTimeout : 1000 msTxSynchro : CTC DiffDelayMax : 27 msDynamic CAC : n/aIMA Version : 1.1Reference Point: UNI (User-Network Interface)Payload scrambling: ENABLEDCell Relay Links:1: 2-7-1 Ok 5: -2: 2-7-2 Ok 6: -3: 2-7-3 Ok 7: -4: 3-1-1 Ok 8: -[c:group ima 1-13-1-4-l11] TN2:1-8 Cri:Alrm:1240 31MAY2011 09:06wcdma-admin[RW]> connect show-group atm ima 1-13-1-4-l11Type Creator Endpoint 1 Endpoint 2 Pk1->2 Pk2->1---- -------- ------------------------- ------------------------- ------ ------P2P CLI PVC *1-13-1-4-L11;0/50 *1-3-1-3;71/50 0kbs 0kbsP2P CLI PVC *1-13-1-4-L11;0/51 *1-3-1-3;71/51 0kbs 0kbsP2P CLI PVC *1-13-1-4-L11;0/52 *1-3-1-3;71/52 0kbs 0kbsP2P CLI PVC *1-13-1-4-L11;0/53 *1-3-1-3;71/53 0kbs 0kbsP2P CLI PVC *1-13-1-4-L11;0/100 *1-3-1-3;71/100 1.9Mbs 1.9MbsP2P CLI PVC *1-13-1-4-L11;0/101 *1-3-1-3;71/101 1.9Mbs 1.9MbsP2P CLI PVC 1-13-1-4-L11;0/102 *1-3-1-3;71/102 1.9Mbs 1.9MbsP2P CLI PVC 1-13-1-4-L11;0/103 *1-3-1-3;71/103 1.9Mbs 1.9MbsP2P CLI PVC *1-13-1-4-L11;0/108 *1-3-1-3;71/108 1.9Mbs 1.9MbsP2P CLI PVC *1-13-1-4-L11;0/109 *1-3-1-3;71/109 1.9Mbs 1.9MbsP2P CLI PVC 1-13-1-4-L11;0/110 *1-3-1-3;71/110 1.9Mbs 1.9MbsP2P CLI PVC 1-13-1-4-L11;0/111 *1-3-1-3;71/111 1.9Mbs 1.9MbsP2P CLI PVC *1-13-1-4-L11;0/115 *1-3-1-3;71/115 0kbs 0kbs 2)在网管上表现为:以TZW1457路桥美多机车为例可以看出AAL2Bearer前面有告警而PCM则无告警产生。
常见告警、性能及处理在我们日常使用各种设备和系统的过程中,经常会遇到各种各样的告警信息和性能问题。
这些问题如果不及时处理,可能会影响到我们的工作效率、甚至导致严重的后果。
下面,让我们来了解一些常见的告警、性能问题以及相应的处理方法。
首先,来说说网络方面的常见告警和性能问题。
网络连接中断是一个让人十分头疼的问题。
当我们突然无法访问网页、无法收发邮件或者与他人的在线交流中断时,很可能就是网络连接出现了故障。
这时候,我们首先要检查自己的网络设备,比如路由器、交换机等,看看指示灯是否正常。
如果指示灯显示异常,可能是设备出现了硬件故障,需要进行维修或更换。
另外,网络延迟过高也是常见的问题。
当我们在玩网络游戏或者进行视频通话时,如果出现卡顿、画面不流畅的情况,很可能就是网络延迟导致的。
造成网络延迟的原因可能是网络拥堵、服务器负载过高或者本地网络设置问题。
解决这个问题,可以尝试关闭其他占用网络带宽的程序,或者更换网络连接方式,比如从无线网络切换到有线网络。
还有一种常见的网络告警是 IP 冲突。
当多个设备被分配了相同的IP 地址时,就会出现这种情况。
这会导致网络连接不稳定,甚至无法正常上网。
解决方法是手动为每个设备设置不同的静态 IP 地址,或者通过路由器的 DHCP 功能自动分配 IP 地址。
接下来,我们谈谈计算机系统方面的常见告警和性能问题。
系统死机是很多人都遇到过的情况。
电脑突然停止响应,鼠标和键盘都无法操作,这可能是由于系统资源耗尽、软件冲突或者硬件故障引起的。
如果是系统资源耗尽,可以尝试关闭一些占用大量内存和 CPU 资源的程序。
如果是软件冲突,可以卸载最近安装的可疑软件。
如果是硬件故障,可能需要检查硬件设备是否正常工作,或者寻求专业的维修服务。
系统运行缓慢也是一个常见的问题。
当我们打开一个程序需要很长时间,或者在操作过程中经常出现卡顿,这可能是由于系统垃圾文件过多、硬盘空间不足、病毒感染等原因造成的。
SDH传输设备的告警分析及故障排除□王新辉(台州市黄岩广播电视局,浙江台州318020)中图分类号:TN943.6 文献标识码:A 文章编号:1007-7022(2003)06-0103-02 SDH光传输设备在日常工作中承担着越来越繁忙的工作,技术维护人员几乎每天都会面对告警的发生,因此正确理解SDH的告警,将有助于对故障的正确分析和判断,及时地定位及解决。
下面给出几个故障事例,通过对这些故障的分析,有益于加深对故障处理的认识。
1 光路发生阻断后,设备告警信号的分析及处理如图1所示,光缆发生阻断时,在网管上会发出OOF,LOF,RS-LOS等光路通道上的告警。
如果是单纤断,B网元收到OOF,LOF,RS-LOS 等告警,A网元则有MS-RDI类似的告警(此时告警的产生是由于K2字节的b6b7b8=110所造成的)。
图1 此时维护人员应该根据告警,并使用光功率计对收方向的光纤进行测量,若收到光信号,则可能是本端光接头或入端的光尾纤或光盘的问题;若收不到光信号,则是光缆阻断或是对端站的问题,由此来对故障进行分段查找,用O TDR再进一步定位故障点。
同时,当收端无时钟信号输入时,也会产生R-LOS告警,此时需根据网管上显示的告警进一步判断。
2 误码告警的分析及处理施,防止高频头进水;冬季下雪后要及时清扫天线的积雪,以保证信号质量。
另外,我们定期检查卫星天线接地线是否接地良好,这项检查很重要,接地良好可以防止雷击损坏卫星接收设备及机房设备。
3 播出机房设备的维护检测为了保证有线电视的安全优质播出,我们制定了一套维护管理制度,对机房设备进行周检、月检、季检和年检等定期检修和日常维护。
我们每周都对调制器的图像载波电平、伴音载波电平及音量进行调整,并做好记录,若发现某个频道电平变化较大,则尽快查找原因。
坚持对录像机进行月检,进行内部除尘,清洗磁头,对卫星接收机、视频分配器等输出的视频信号幅度每月进行一次调整。
SDH常见告警及处理方法华为SDH故障1.1 R_LOS告警名称或故障现象:R_LOS告警表示接收线路侧信号丢失(Receive loss of signal),为紧急告警。
告警产生原因:1、断纤;2、线路衰耗过大;3、本板接收方向故障;4、对端站发送部分故障,线路发送失效;5、对端站交叉时钟板故障或不在位。
告警处理方法:1、现场用光功率计检测告警单板的接收光功率是否正常。
如果接收光功率正常,请转至步骤8。
2、检查光缆是否有故障,排除光缆故障后,查看告警是否排除。
3、清洁本站尾纤接头和线路板接收光口,查看告警是否排除。
4、检查本站的法兰盘和光衰减器是否连接正确,光衰减器的衰减值是否过大。
正确使用法兰盘和光衰减器后,查看告警是否排除。
5、用光功率计检查对端站的发射光功率是否正常,如果发射光功率不正常,更换线路板。
6、如果发射光功率正常,清洁对端站的尾纤接头,查看告警是否排除。
7、检查对端站的法兰盘和光衰减器是否连接正确,光衰减器的衰减值是否过大。
正确使用法兰盘和光衰减器后,查看告警是否排除。
8、更换本站上报告警的线路板,查看告警是否排除。
9、更换对端站的线路板,查看告警是否排除。
1.2 R_LOF、R_OOF告警名称或故障现象:R_LOF告警表示接收线路侧帧丢失(Receive loss of frame),为紧急告警。
告警产生原因:1、接收信号衰减过大;2、对端站发送信号无帧结构;3、本板接收方向故障。
告警处理方法:1、在网管上查看是否有高级别的R_LOS告警,优先处理这些高级别告警后,查看告警是否排除。
2、检测告警单板的接收光功率是否正常。
如果接收光功率正常,请转至步骤9。
如果收光不正常,让现场定位衰耗点在机房内还是在线路上,如果在线路上,转至步骤8。
3、清洁本站尾纤接头和线路板接收光口,查看告警是否排除。
4、检查本站的法兰盘和光衰减器是否连接正确,光衰减器的衰减值是否过大。
正确使用法兰盘和光衰减器后,查看告警是否排除。
华为 SDH 传输网两种常见业务常见告警分析【摘要】华为SDH传输网是一种多业务传送平台,承载的常见有通道业务和以太网业务。
在业务的开通和维护过程中,华为SDH传输网网管系统会上报一些常见告警,这些告警信息反映了通道业务的运行情况。
【关键词】SDH;E1业务;以太网业务;告警;故障处理方法0 引言华为SDH传输网络能够支持多业务接入,满足大带宽传输,提供了可靠的通信环境。
SDH传输网丰富的维护字节信息,使其具有良好的自愈能力。
加上华为强大的网管系统,一般的业务故障,通过华为U2000网管系统的告警信息,就可快速定位故障,组织开展消缺。
1 华为SDH传输网通道业务类型本文所述业务是指SDH传输网络运行的常见且主要业务——E1业务和以太网业务。
1.1E1业务SDH传输网络上的E1业务是指由E1业务接口板或者处理板承载网的通道业务。
早些年,SDH传输网络承载的业务大部分都是E1业务,1×2M或2×2M的E1业务足以满足客户的使用,最大的时候也仅为5×2M。
1.2以太网业务在SDH传输网上,以太网业务是指有以太网板承载的业务,业务带宽比较自由,可根据客户的需求具体确定,从2M到千兆均可。
2 常见告警常见告警是指SDH传输网U2000网管系统上常见的,出现频率比较高的与E1业务和以太网业务相关的告警,且这些告警是由某些造成业务中断的故障而引发上报的。
2.1 E1业务主要告警分析与E1业务相关的,影响客户使用的常见告警主要有:T_ALOS、UP_E1_AIS、DOWN_E1_AIS。
2.1.1 T_ALOS告警T_ALOS告警是指E1接口信号丢失。
最常见的原因是E1接口输出端口脱落或松动。
其他可能的原因有:未接入E1业务或者对端站未发送E1业务、对端站设备出现故障、电缆等故障。
当出现多条E1业务同时产生T_ALOS告警时,通常原因为接口板发生故障或单板故障。
2.1.2 UP_E1_AIS告警UP_E1_AIS告警是E1上行信号告警指示。