网络管理中心IT室网络网元故障处理流程
- 格式:pptx
- 大小:300.98 KB
- 文档页数:2
SDH网元脱管故障处理基本方法摘要:SDH网元脱管故障是通信网络运维过程当中常见的故障,虽然网元脱管不会造成业务中断,但网元脱管需要及时处理,以免出现其它故障无法及时发现处理。
本文介绍了网元脱管常见三种现象的处理基本方法,该方法经实践验证,基本能够处理常见网元脱管故障,处理方法供广大通信网络运维人员参考。
关键词:网元;脱管;故障处理引言在日常通信网络运维当中经常会遭遇网元与网管之间的通信中断,造成网元脱管。
下面就单个网元脱管、子网中所有网元脱管、网元频繁脱管三种网元脱管情形来分析处理网元脱管故障时可以采用的基本方法和措施。
1单个网元脱管1.1故障现象及原因单个网元脱管故障现象为网管上单个网元脱管,同站点其他网元正常。
造成单个网元脱管的可能原因主要是以下5种原因[1]:1、硬件故障。
2、网元IP/ID配置错误。
3、光纤故障。
4、光口DCC关闭导致脱管。
5、主机软件故障。
1.2故障处理方法1.2.1硬件故障,导致网元脱管。
1)检查外部供电设备是否工作正常。
如外部供电有故障,解决外部供电设备故障。
2)检查电源单板是否工作正常。
如电源单板不能正常工作,更换故障单板。
3)通过华为网管系统U2000?LCT登录网元。
如U2000?LCT不能登录网元,说明网元的主控板或交叉主控板合一板故障,需要更换故障单板。
如U2000?LCT能正常登录网元,则考虑故障由其他原因引起。
1.2.2网元IP/ID配置错误,导致网元脱管[2]。
通过U2000?LCT登录网元,根据记录恢复网元原来的IP/ID,查看网元是否恢复正常。
若未恢复,则考虑故障由其他原因引起。
1.2.3光纤故障,导致网元脱管。
使用光功率计在两站端对光,以确定中间线路是否存在断纤现象。
或使用OTDR仪表测量光纤,通过分析仪表显示的线路衰减曲线判断是否存在断纤。
若线路无断纤现象,则考虑故障由其他原因引起。
1.2.4光口DCC关闭导致脱管[3]。
在U2000上查询光口DCC的使能状态。
1、NE_NOT_LOGIN告警解释NE_NOT_LOGIN表示网元未登录对系统的影响无法从网元侧查询该告警的配置数据无法在网管上管理该网元可能原因原因1:网元与网管通讯中断解决网元与网管通讯中断方法,参见NE COMMU BREAK原因2:用户退出登陆或者登陆网元失败以其他正确的网元用户登陆网元查看告警是否结束,若未结束,请进行下一步如果故障依然存在,请联系华为工程师MPLS_TUNNEL_LOCV告警解释MPLS_TUNNEL_LOCV 为TUNNEL连通性丢失告警。
连续3个周期内没有收到希望的CV/FFD报文时出现此告警。
对系统的影响该告警产生时,会触发MPLS APS倒换,将业务倒换到保护TUNNELMPLS_TUNNEL_FDI告警将抑制MPLS_TUNNEL_LOCV告警的上报。
可能原因告警MPLS_TUNNEL_LOCV产生的可能原因如下:原因1:TUNNEL的INGRESS节点停止CV/FFD原因2:物理链路故障原因3:INGRESS节点的单板正在复位原因4:业务借口配置错误原因5;网络出现严重拥塞原因6:CPU占用饱和,无法处理ARP协议报文处理步骤:原因1:原因1:TUNNEL的INGRESS节点停止CV/FFD1、在网管上分别进入上报告警的TUNNEL的INGRESS节点和EGRESS节点的“网元管理器”,在功能树中选择“配置》MPLS 管理》单播TUNNEL管理”。
选择“OAM参数”选项卡。
2、查看两端的“检测方式”和“检测报文类型”参数是否一致如果两端的参数。
则。
不一致修改任一节点的参数配置使两端一致后,单击“应用”。
一致继续下一步3、查看INGRESS节点的“CV/FFD状态”参数如果是。
则。
停止右键单击该条TUNNEL,在弹出的菜单中单击‘启动CV/FFD”.查看告警是否清除启动排查下一原因原因2:物理链路故障1、在网管上查看EGRESS节点是否存在HARDBAD、ETH_LOS、或者ETH LINK DOWN告警,具体操作请参见在U2000上查询当前告警。
酒吧网络部故障处理标准流程一、网络故障处理原则故障处理基本原则是先抢通后修复,先本端后对端,先核心后边缘,先网内后网外。
当两个以上的故障同时发生时,对重大故障、影响重要部门的故障等予以优先处理。
二、网络故障处理时限故障处理时限是指故障修复完毕的时间,业务抢通时限是指业务恢复的时间。
1、重大故障(S1),故障处理时限≤8小时,业务抢通时限≤60分钟;2、严重故障(S2),故障处理时限≤5小时,业务抢通时限≤30分钟;3、一般故障(S3),故障处理时限≤1小时,业务抢通时限≤15分钟。
三、网络故障处理流程图四、网络故障处理具体流程第一条:对于各部门反应问题,通过维修报告单,或者突发问题打电话处理的要弄清以下方面问题,以做好基本应对措施。
1、事件当事人,地点,电话2、故障现象描述3、弄清故障出现的环境4、其它。
第二条:赶赴现场弄清问题所在,包括:1、技术问题2、软件问题3、硬件原因4、网络环境原因5、使用不当6、非预料故障第三条:准备物品有了解决方案之后,要准备必要的物品和工具,包括1、相关软件光盘,系统光盘2、需要用到的工具(如测线仪等)3、技术手册4、故障处理表单5、其它第四条:通过工具仪器检测包括以下几点:1、查看故障具体现象2、检察故障产生环境3、确认解决方案的合理性4、根据情况进行故障排除5、讲述注意事项6、对处理情况和技术疑点进行记录第五条:解决方案在弄清以上问题之后,根据当事人反应的基本情况做出判断,尽快提出解决方案。
方案应包括以下几条基本内容:1、解决问题的具体要求2、解决问题的技术保障3、解决问题的方法途径5、其它第六条:对于一些无法立即解决的问题,应及时联系当日总职反应情况,以做好相应的应对措施。
第七条:确认责任方弄清问题后,要确认责任何在,包括:1、操作方面2、软件方面3、硬件方面3、其它4、对方认可,确认责任方后,以书面的情况反应,并仔细讲解导致问题出现的原因,以免下次发生。
第七条:对于处理后仍然存在的一些问题,应做好交接班,由下一班联系相应公司做出处理,后期进行跟进。
iManager M2000移动网网元管理系统操作手册第1章操作手册概述1.1 本手册定位1.1.1 概述M2000成套资料中有两本手册介绍常见的操作任务,其中之一是本手册——《iManager M2000移动网网元管理系统操作手册》,另一本是《iManagerM2000移动网网元管理系统管理员指南》。
此外,M2000的客户端软件还提供了详细的联机帮助。
1.1.2 内容简介各手册和联机帮助的主要内容如下:●《iManager M2000移动网网元管理系统管理员指南》供系统管理员使用,给出了系统管理任务的相关概念和详细的操作步骤。
该手册重点介绍如何管理M2000系统自身,包括服务器状态监控、数据库管理、磁盘空间管理、用户管理、系统备份恢复、常见故障处理等,使M2000可以安全、稳定的运行。
●《iManager M2000移动网网元管理系统操作手册》供M2000操作员使用,给出了操作任务的相关概念和详细的操作步骤。
该手册重点介绍如何使用M2000系统来操作维护移动网络,包括网络的性能监控、告警查询、网元的配置、网元软件升级、全网数据备份等。
●联机帮助联机帮助提供了客户端每个界面的参数介绍和操作指导,此外还提供了所辖网元的MML命令、告警和性能指标的帮助。
1.1.3 相互关系联机帮助关注于指导用户如何完成一个具体的操作步骤,而《iManager M2000移动网网元管理系统管理员指南》和《iManager M2000移动网网元管理系统操作手册》关注于指导用户如何通过一系列的操作,完成一个操作维护任务。
联机帮助是《iManager M2000移动网网元管理系统管理员指南》和《iManager M2000移动网网元管理系统操作手册》的基础,为两本手册提供客户端操作细节介绍。
《iManager M2000移动网网元管理系统管理员指南》和《iManager M2000移动网网元管理系统操作手册》在介绍操作任务时不再详细描述如何执行每个操作步骤。