常见告警处理方法
- 格式:ppt
- 大小:384.80 KB
- 文档页数:25
2G一)OML链路故障告警(E1TI故障告警):即断站1 、与传输网管核对,光端机运行是否正常(即是否能监控到本基站光端机),如果可以监控到,则说明是基站侧问题,需上站处理。
如果不能,则可判定传输光缆中断或者传输设备断电,上站核实。
(仅限于华为光端机)2 、上站核查是否断电,掉电则上电即可,如果没断电则检查基站2M质量并环回。
设备对应的传输2M环回,与传输网管核实该端口状态,如果正常则再向BSC网管核实。
如果传输网管看到该端口正常而BSC网管看到不通,则需传输网管与BSC网管进行核实,并找机房相关人员处理。
如果基站环回没问题,则可判定是基站侧问题。
3、检查设备2M头质量。
(自环或者万用表测)GSM可以自环,观察LIU0-4指示灯,WCDMA早期部分基站也有此功能。
4、是否为设备单板故障。
主控板GSM(GTMU),WCDMA(WMPT)5、由于室分安装场景比较复杂,而且有的相当恶劣。
检查是否有进水迹象或者高温等。
观察设备外观,及主控板RUN指示灯运行状态(绿色慢闪)。
风扇(BBU的FAN 模块)运行状态。
6、室分传输比较多样。
华为可由网管监控,但格林威尔传输及PDH等网管看不到,需相应厂家配合。
二)CPRI链路异常告警、射频单元维护链路异常告警、光接口性能恶化、光模块收发异常告警。
此类告警通俗点说即:BBU与RRU之间通讯不正常。
1、首先核实设备全部上电。
同时检查基站尾纤与光模块是否匹配(室分基站全部为单模尾纤,对应单模光模块1.125G-1310nm-10KM)。
2、观察主控板及RRU的CPRI接口指示灯。
正常为绿色。
有时指示灯正常,但依然有光接口性能恶化告警,说明光衰较大。
这时需用光功率计测各个光路,光衰不能大于-15db。
3、尾纤拔插,酒精清洗接头,更换法兰盘等。
法兰盘对接要插入凹槽内松紧适度4、正常状态下BBU及RRU的CPRI接口灯为绿色常亮。
RUN慢闪,ACT常亮,具体各指示灯含义见下表1,RRU指示灯见表2注:2G一些设备在后台数据去激活状态下主控板GTMU的CPRI接口指示灯不会亮,需要后台把数据激活才能看到光口亮灯,但是未激活状态下BBU与RRU之间如果光路正常则RRU的CPRI指示灯可以看到绿色。
阿尔卡特SDH常见告警及处理方法阿尔卡特SDH故障2.1 RUP, RUM, ICP类告警处理告警名称或故障现象:Replaceable Unit Problem机盘故障; Replaceable Unit Missed机盘不在位; Internal Communication Problem 内部通信(控制信号)故障,相应的故障机盘报故障。
告警产生原因:1.原因1 RUM还可能是网管配置了板,但实际配插板2.原因2 机盘硬件故障3.原因3 ICP有可能是其它盘引起,如1660的矩阵、主控;1662的SYNTH16;1642的MB板告警处理方法:1.原因1 对于RUM首先核实是否现场每插板,如没插板可在网管去配置(对于有配置电路或作为时钟源的,需先删除这些配置),当然现场每插板,由配置了电路或时钟源需仔细核实是否是垃圾数据在删。
2.原因2 替换相应的故障盘3.对于ICP告警如替换故障盘后仍不消失,则需考虑可能是其它的矩阵、主控、SYNTH16、MB盘等引起。
可先对这些怀疑的板做插拔(注意对业务和监控的影响,一般主控盘插拔只影响监控;矩阵和SYNTH16均有保护,如无异常状态或第二处故障,插拔备用也不影响业务(要插拔当前的主用矩阵需先切换成备用角色再插拔,切换后等15分钟让它同步完再操作)),定位到故障板后替换故障板。
2.2 TD, URU, TF告警告警名称或故障现象:设备光口或端口报TD(Transmitter Degraded), URU (Underlying Resource Unavailable), TF (Transmitter Failure)告警。
告警产生原因:1.原因1 如有光模块的机盘,则可能是故障2.原因2 机盘故障告警处理方法:1.原因1 替换光模块2.原因2 替换机盘2.3 LOS, LOF告警处理告警名称或故障现象:LOS(Loss of signal;LOF(Loss Of Frame);MS-AIS;MS-RDI告警告警产生原因:1.原因1 光缆故障2.原因2 对端设备停电或吊死(主要是接入设备)3.原因3 显现硬件故障,相应光板报RUP、RUM、ICP、URU、TD、TF等告警4.原因4 隐性硬件故障5.原因5 光模块吊死告警处理方法:1.原因1 对光及OTDR测试等排查光路故障,清除光缆故障(具体见光缆故障处理)2.原因2 现场开电或环MB板3.原因3 显现硬件故障请替换相应的故障板4.原因4 当光路对光正常,无明显的硬件故障后,则可能是隐性硬件故障。
SDH常见告警及处理方法
一、SDH常见告警
1、AIS(Alarm Indication Signal):系统发生严重故障,但故障定位困难时发出的报警信号,其特征是所有光纤信道的信号都变为8kHz的正弦波。
2、RDI 告警:Remote Defect Indication,用来标识由网络其中一端的故障引起的报警信号,其特征是只有发送方端口发出的信号变为
8kHz 正弦波,接收端口不发生改变。
3、LOS(Loss of Signal): 信号丢失告警,当根据多模解调器的输出结果发现收发光纤的质量有问题时,就发出此类报警。
4、LOF (Loss Of Frame):帧丢失告警,当多模解调器未能正确解调出SDH/SONET信号帧,只能解调出时隙时,就发出此类报警。
5、LOFL(Loss Of Frame Lock):解调锁定丢失告警,当多模解调器未能正确解调SDH/SONET信号帧,会给发出此类报警。
6、TIM(Trace Identify Mismatch):诊断路径标识错误报警,当多模解调器识别进入端口的信号的诊断路径标识,与设置的诊断路径标识不一致时,就发出此报警。
7、STU(Signal Fail):发射信号失效报警,当多模解调器发射板信号失效时,就发出此报警。
二、SDH常见告警的处理原则
1、首先仔细考察AIS信号,是否处纤芯断纤等原因导致的。
2、考察RDI信号,区分是单向报警还是双向报警,以及是否真的是本段线路出现问题还是根据RDI反向传输到下一个站点的问题。
TN-1X的常见告警处理方法如下,首先命令行方式登陆TN-1X网元,然后按下面方法清除告警。
1.PPI-LOS产生原因:2M端口打开,但未加业务。
处理方法:对该端口的监控状态设为Standy,设置方法:假定该端口为S11-1, 使用UI登陆网元,键入/ c r s s11-12.PPI-AIS产生原因:2M端口硬件环回,端口监控状态为“auto”处理方法:※拆除2M端口硬件环回,后将端口状态设置为“standy”(方法同上)※或者不拆除硬件环回,而通过将2M端口的PPI-AIS告警屏蔽清除。
屏蔽方法:键入/ c a m p a o s11-1。
屏蔽后PPI-AIS将不再上报。
3.PPI-Unexpected Signal产生原因:2M端口监控状态为“Standy”,但有业务信号接入处理方法:修改2M端口的监控状态为“auto”即可,设置方法:/ c r t s11-14.PPI-DEG/EXC & INT_LP_IP_Buffer产生原因:一般为DDF架上2M端子松动处理方法:插紧相应的2M端子,或者更换2M端子5.TU-AIS产生原因:一般为通道交叉连接不完整,或者Payload Manager故障引起。
处理方法:检查2M通道交叉连接的完整性,或有无远端线路AIS,有则先处理之。
或者将Payload Manager主备倒换,如告警清除时,则需更换Payload盘。
注意:Payload Manager主备倒换时业务会瞬间的中断,慎用。
6.INT-TU-AIS产生原因:可能是Payload Manager故障或者是支路板故障处理方法:倒换主备用Payload Manager,或者更换支路板7.SYNC-Src_Not_Primary & INT-SYNC-Trib_Line_Fail产生原因:TN-1X时钟分三级,第一级为提取线路时钟,第二级为外接时钟,第三级时钟为内部自由振荡,正常应提取线路时钟。
华为SDH故障1.1 R_LOS告警名称或故障现象:R_LOS告警表示接收线路侧信号丢失(Receive loss of signal),为紧急告警。
告警产生原因:1、断纤;2、线路衰耗过大;3、本板接收方向故障;4、对端站发送部分故障,线路发送失效;5、对端站交叉时钟板故障或不在位。
告警处理方法:1、现场用光功率计检测告警单板的接收光功率是否正常。
如果接收光功率正常,请转至步骤8。
2、检查光缆是否有故障,排除光缆故障后,查看告警是否排除。
3、清洁本站尾纤接头和线路板接收光口,查看告警是否排除。
4、检查本站的法兰盘和光衰减器是否连接正确,光衰减器的衰减值是否过大。
正确使用法兰盘和光衰减器后,查看告警是否排除。
5、用光功率计检查对端站的发射光功率是否正常,如果发射光功率不正常,更换线路板。
6、如果发射光功率正常,清洁对端站的尾纤接头,查看告警是否排除。
7、检查对端站的法兰盘和光衰减器是否连接正确,光衰减器的衰减值是否过大。
正确使用法兰盘和光衰减器后,查看告警是否排除。
8、更换本站上报告警的线路板,查看告警是否排除。
9、更换对端站的线路板,查看告警是否排除。
1.2 R_LOF、R_OOF告警名称或故障现象:R_LOF告警表示接收线路侧帧丢失(Receive loss of frame),为紧急告警。
告警产生原因:1、接收信号衰减过大;2、对端站发送信号无帧结构;3、本板接收方向故障。
告警处理方法:1、在网管上查看是否有高级别的R_LOS告警,优先处理这些高级别告警后,查看告警是否排除。
2、检测告警单板的接收光功率是否正常。
如果接收光功率正常,请转至步骤9。
如果收光不正常,让现场定位衰耗点在机房内还是在线路上,如果在线路上,转至步骤8。
3、清洁本站尾纤接头和线路板接收光口,查看告警是否排除。
4、检查本站的法兰盘和光衰减器是否连接正确,光衰减器的衰减值是否过大。
正确使用法兰盘和光衰减器后,查看告警是否排除。
常见告警、性能及处理在我们日常使用各种设备和系统的过程中,经常会遇到各种各样的告警信息和性能问题。
这些问题如果不及时处理,可能会影响到我们的工作效率、甚至导致严重的后果。
下面,让我们来了解一些常见的告警、性能问题以及相应的处理方法。
首先,来说说网络方面的常见告警和性能问题。
网络连接中断是一个让人十分头疼的问题。
当我们突然无法访问网页、无法收发邮件或者与他人的在线交流中断时,很可能就是网络连接出现了故障。
这时候,我们首先要检查自己的网络设备,比如路由器、交换机等,看看指示灯是否正常。
如果指示灯显示异常,可能是设备出现了硬件故障,需要进行维修或更换。
另外,网络延迟过高也是常见的问题。
当我们在玩网络游戏或者进行视频通话时,如果出现卡顿、画面不流畅的情况,很可能就是网络延迟导致的。
造成网络延迟的原因可能是网络拥堵、服务器负载过高或者本地网络设置问题。
解决这个问题,可以尝试关闭其他占用网络带宽的程序,或者更换网络连接方式,比如从无线网络切换到有线网络。
还有一种常见的网络告警是 IP 冲突。
当多个设备被分配了相同的IP 地址时,就会出现这种情况。
这会导致网络连接不稳定,甚至无法正常上网。
解决方法是手动为每个设备设置不同的静态 IP 地址,或者通过路由器的 DHCP 功能自动分配 IP 地址。
接下来,我们谈谈计算机系统方面的常见告警和性能问题。
系统死机是很多人都遇到过的情况。
电脑突然停止响应,鼠标和键盘都无法操作,这可能是由于系统资源耗尽、软件冲突或者硬件故障引起的。
如果是系统资源耗尽,可以尝试关闭一些占用大量内存和 CPU 资源的程序。
如果是软件冲突,可以卸载最近安装的可疑软件。
如果是硬件故障,可能需要检查硬件设备是否正常工作,或者寻求专业的维修服务。
系统运行缓慢也是一个常见的问题。
当我们打开一个程序需要很长时间,或者在操作过程中经常出现卡顿,这可能是由于系统垃圾文件过多、硬盘空间不足、病毒感染等原因造成的。
linux系统内存告警处理方法【导语】Linux系统作为服务器和开发环境的主流操作系统,其稳定性和性能至关重要。
内存告警是系统管理中常见的问题,它可能会影响系统的正常运行。
下面将详细介绍几种处理Linux系统内存告警的方法。
### Linux系统内存告警处理方法#### 1.分析内存使用情况首先,您需要分析系统内存的使用情况,找出内存使用过高的原因。
- 使用`free -m`命令查看内存使用情况。
- 使用`top`命令查看内存占用最多的进程。
#### 2.关闭不必要的服务和进程检查是否有不必要的后台服务和进程在运行,关闭它们以释放内存。
- 使用`systemctl status`查看服务状态。
- 使用`kill`命令或`pkill`命令结束占用内存过高的进程。
#### 3.调整虚拟内存如果物理内存不足,可以尝试调整虚拟内存。
- 使用`vmstat`命令查看虚拟内存状态。
- 修改`/etc/sysctl.conf`文件,增加`vm.swappiness`的值,允许系统使用更多的交换空间。
#### 4.增加交换空间如果条件允许,增加交换空间(swap space)是解决内存不足的有效方法。
- 创建新的交换文件或分区。
- 使用`mkswap`和`swapon`命令启用新的交换空间。
#### 5.优化系统配置调整系统配置,优化内存使用。
- 修改`/etc/sysctl.conf`,调整内核参数,如`net.ipv4.tcp_fin_timeout`和`net.ipv4.tcp_max_tw_buckets`等。
- 更新内核,以获得更好的内存管理性能。
#### 6.定期清理缓存和临时文件定期清理系统缓存和临时文件。
- 使用`clear`命令清理缓存。
- 删除`/tmp`目录下的临时文件。
#### 7.监控和告警建立系统监控和告警机制,以便及时发现内存告警并处理。
- 使用如Nagios、Zabbix等监控工具。
传输设备常见告警解释及处理建议LianLv一、 LOS 告警:信号丢失1、正常情况下两个网元之间要通信,中间的信号流必须是畅通的,如下图;2、从上图可以看书信号从MSC 发出2M 信号,经过SDH 设备复用后传递给下一个设备,最后末端SDH 设备解复用出2M 信号给另一端的MSC 。
也就是说,产生信号源的设备是发出信号的设备,当相邻的设备收不到对端发出的信号时就会上报LOS 告警,即信号丢失;A 、上图中由于SDH2发出的光信号SDH1收不到所以SDH1的收光口会上报LOS 告警;B 、上图中MSC2发出的2M 信号由于2M 线中断导致SDH2的2M接口收不到信号,所以SDH2的2M 接口会上报LOS 告警;C 、 上图是MSC1收不到信号的情况;说明:在通信标准中信号丢失的告警名都为LOS,但是不同厂家在编写网管软件时其有所不同,比如:华为公司传输设备,光口收不到信号上报告警为R-LOS ,支路口(2M 口)收不到信号时报T-ALOS;二、 LOF 告警:帧丢失1、当收到的信号功率太大或太小时都会上报OOF 告警;2、是指可以收到信号,但是检测不到信号的开始位置。
一般在波分和SDH 相连时,由于中继段线路中断,造成SDH 设备收到的信号为非调制光。
四、 AIS 告警:全1指示告警举例:SDH2收不到BTS 发来的2M 信号,SDH2会上报LOS 告警,并下插“1”码,当BSC1收到的2M 信号为全要“1”的时候就会上报AIS 告警。
这个故障我们日常维护中经常碰到,如果基站发送处理的2M 信号在中间传输环节中中断,BSC 的dip 端口都会上报AIS 告警。
五、 RDI 告警:远端告警指示举例:当BTS 收到的2M 信号在传输途中中断,但是BSC 可以收到BTS 发送的信号,那么BTS 就会发送AIS 信号给BSC ,当BSC 收到AIS 信号时就会上报RDI ,即远端告警指示说明故障点在BTS 端。
B.1 常见告警信息及处理表B.1–1至表 B.1–88为常见告警的原因及处理方法,供用户在维护工作中参考。
表 B.1–1 2.5G光接收信号丢失表 B.1–2 622M光接收信号丢失表 B.1–3 155M光接收信号丢失表 B.1–4 45M电信号丢失表 B.1–5 34M电信号丢失表 B.1–6 2M电信号丢失表 B.1–7 1.5M电信号丢失表 B.1–8 CV性能超值表 B.1–9 接收光功率越限表 B.1–10 帧丢失表 B.1–11 不可用时间开始(再生段)表 B.1–12 B1 UAS性能超值表 B.1–13 帧失步表 B.1–14 OFS性能超值(OFS:帧失步秒)表 B.1–15 再生段信号劣化表 B.1–16 B1 SES性能超值表 B.1–17 B1 ES性能超值表 B.1–18 B1 BBE性能超值表 B.1–19 复用段告警指示信号表 B.1–20 不可用时间开始(复用段)表 B.1–21 复用段远端缺陷指示表 B.1–22 B2 UAS性能超值表 B.1–23 B2 FEUAS性能超值表 B.1–24 复用段信号劣化表 B.1–25 B2误码过限表 B.1–26 B2 SES性能超值表 B.1–27 B2 FESES性能超值表 B.1–28 B2 ES性能超值表 B.1–29 B2 FEES性能超值表 B.1–30 B2 BBE性能超值表 B.1–31 B2 FEBBE性能超值表 B.1–32 复用段保护倒换事件表 B.1–33 AU4通道告警指示信号、不可用时间开始表 B.1–34 AU4指针丢失表 B.1–35远端缺陷指示(高阶VC4通道虚容器)表 B.1–36 B3 UAS性能超值(高阶VC4通道虚容器)表 B.1–37B3 FEUAS性能超值(高阶VC4通道虚容器)表 B.1–38 复帧丢失(高阶VC4通道虚容器)表 B.1–39 VC4高阶通道信号劣化表 B.1–40 B3 SES性能超值(高阶VC4通道虚容器)表 B.1–41 B3 FESES性能超值(高阶VC4通道虚容器)表 B.1–42 B3 ES性能超值(高阶VC4通道虚容器)表 B.1–43 B3 FEES性能超值(高阶VC4通道虚容器)表 B.1–44 B3 BBE性能超值(高阶VC4通道虚容器)表 B.1–45 B3 FEBBE性能超值(高阶VC4通道虚容器)表 B.1–46 VC4高阶通道未装载表 B.1–47 VC4高阶通道跟踪标识失配表 B.1–48 VC4信号标识失配表 B.1–49 AU4 PJE+性能超值、AU4 PJE-性能超值表 B.1–50 AU4保护倒换事件。