OLT排障思路三板斧
- 格式:docx
- 大小:17.36 KB
- 文档页数:2
中小企业如何进行网络排障
网络排障并不仅仅只是停留在某一个小小命令的使用上,而是一套系统的方法,并且需要把这些技能熟练的运用到实际应用当中。
网络排障的必备条件
了解中小型企业网络的基本架构
一般情况下,中小型企业网络的基本架构都是这样的:网络出口--核心层--汇聚层--接入层--用户。
针对用户PC的排障和针对数据中心的网络排障基本是类似的。
不管网络环境多么复杂,其实简化下来都是差不多的方法。
1.注意使用常用的网络排障命令
2.牢记网络排障的一个重要原则和思路:关注数据的走向
网络排障,顾名思义就是要判断网络哪里出了问题,所以你就必须要知道数据的走向。
网络排障思路其实就是通过追踪故障中的数据走向进一步缩小并确定网络故障点。
3.网络排障实际应用中的步骤
根据所发生的故障,首先是依据该企业的网络拓扑图确定发生故障的范围。
如果是全部的直接进入机房找核心路由处检查,是某一片的就是根据汇聚的范围进行设备定位,如果是终端PC的就直接去现场解决。
整体排障方法基本类似:先确定电源正常,设备运行正常(注意检查告警灯),接口指示灯正常(此处就是连接线路检查)。
在终端检查排障,需要注意排查以下几点:
(1)检查物理链路是否有问题
(2)查看本机IP地址、子网掩码、网关、DNS的设置是否正确
(3)测试网关和路由器的通畅情况,并查看时延。
顺序为:先测网关,然后再
测路由器,一级一级地进行测试
(4)测试DNS的通畅情况,可以直接ping网站地址。
GPON OLT 故障处理流程及要求一、现象:GPON网管无法和OLT SNMP PING通;华为GPON网管上报“网管与设备通信失败“,中兴GPON网管上报”网元链路断(1014) “。
二、故障发现及处理:步骤一、网管监控值班人员7*24小时监控GPON网管或故障管理系统,在发生故障30分钟内进行故障验证和故障通知工作: (1)中兴网管:查看拓扑—鼠标右击告警OLT网元—常用工具—SNMP PING,若PING通后故障告警立即解除则为误告警,若PING不通则为真实故障。
(2)华为网管:视图—主拓扑—鼠标右击告警OLT网元—工具—PING,若PING通后故障告警后立即解除则为误告警,若PING 不通则为真实故障。
(3)测试结果为误告警时通知OLT维护人员处理误告警问题,结果为真实告警时同时通知城域网维护人员和OLT维护人员。
步骤二、城域网维护人员收到OLT告警通知30分钟内完成城域网S9312至GPON网管交换机数据传送情况判断和处理工作,若不通则由城域网负责调通管理通道,若通则查看S9312下联OLT端口状态,状态不正常时通知传输设备或传输线路人员配合处理,同时通知OLT维护人员相关情况。
.步骤三、传输专业收到告警通知后2小时内完成传输设备和传输线路故障排查和处理。
全流程掌控:OLT网管维护人员负责故障通报,通知相关领导和相关专业有关OLT故障产生、进展、完成等情况。
OLT现场故障处理人员(目前未配置)收到城域网维护人员通知后立即前往现场排查设备硬件故障,和传输维护人员同时进行各自故障处理。
【下载本文档,可以自由复制内容或自由编辑修改内容,更多精彩文章,期待你的好评和关注,我将一如既往为您服务】word文档交流 2。
摘 要:随着FTTH用户规模覆盖,每个月宽带用户申告量居高不下,10000号话务量和农村装维服务压力不断增大。
本文紧紧围绕如何先于客户发现宽带障碍,降低用户申告,探索以ONU断电、断纤原理为基础,依托PON网管、ITMS平台、资源系统进行大数据分析建模,实现全网自动轮询、自动判障、自动派单,全程闭环管控,提升用户感知。
关键词:ONU 大数据 ITMS平台 PON网管周庆华 熊振斌 陈浩 中国电信股份有限公司江西分公司网络运行维护部 南昌市 3300460 背景随着“宽带中国”、“全光城市”等战略的实施,江西电信光宽带用户规模不断扩大,全省网管管理ONU数量接近650万,每个月10000号的宽带用户申告量居高不下,希望通过运维手段来降低宽带用户申告,减轻10000号座席话务压力。
同时随着农村宽带用户的规模发展,大量农村宽带用户出现故障,第一报障渠道不是拨打10000号申告,而是找装维工程师报障,导致大量故障工单循环在系统之外,障碍处理时限和质量无法得到管控,较大影响用户感知,因此急01图1 用户故障精准诊断全流程示意图需一种先于客户发现宽带障碍的新方法来解决以上问题,提升用户感知。
1 总体架构1.1 诊断流程通过PON网管系统轮巡ONU状态,自动识别出掉电、断纤状态,并自动过滤掉由于OLT、板卡、PON口或者一二级分光器故障引起的ONU故障,精准定位出故障点。
(2)针对OLT故障、OLT pon板卡故障、PON口故障,找出符合条件的ONU;(3)针对GIS系统的ODN数据进行ODN分析,过滤一、二级分光故障;(4)在派单前进行批量端到端(PON网管部分)诊断测试,找到外线故障ONU;(5)针对ODN进行分析,排除二级OBD断纤故障告警(有3个以上的ONU断纤);(6)通过Webservice接口派单给10000号、装维工程师。
1.2 关键技术(1)全网FTTH ONU状态轮询采集FTTH ONU状态轮询采集模块独立封装、部署及运行,高频度状态轮询,确保ONU状态采集实时性及准确性。
5gc常见排障思路5G通信技术是一种新型的移动通信技术,由于其高速、低延迟、大容量等特点,被广泛应用于各个领域。
然而,在实际应用中,由于各种原因,5G网络也会出现一些故障。
为了保证网络的稳定运行,需要及时排除故障。
本文将介绍5G网络常见的排障思路。
一、硬件故障排查1.检查设备是否正常供电在排查5G网络故障时,首先需要检查设备是否正常供电。
如果设备没有正常供电,则可能会导致设备无法正常工作。
2.检查设备连接线路在排查5G网络故障时,还需要检查设备连接线路是否正常。
如果连接线路出现问题,则可能会导致设备无法正常工作。
3.检查设备硬件在排查5G网络故障时,还需要检查设备硬件是否正常。
如果硬件出现问题,则可能会导致设备无法正常工作。
二、软件故障排查1.检查系统配置文件在排除软件故障时,首先需要检查系统配置文件是否正确。
如果配置文件出现问题,则可能会导致系统无法正常启动。
2.检查系统日志文件在排除软件故障时,还需要检查系统日志文件。
通过查看日志文件,可以了解系统运行过程中的错误信息。
3.检查应用程序在排除软件故障时,还需要检查应用程序是否正常。
如果应用程序出现问题,则可能会导致系统无法正常工作。
三、网络故障排查1.检查网络连接状态在排查5G网络故障时,首先需要检查网络连接状态。
如果网络连接出现问题,则可能会导致5G网络无法正常工作。
2.检查路由器和交换机配置在排除5G网络故障时,还需要检查路由器和交换机的配置。
如果配置出现问题,则可能会导致5G网络无法正常工作。
3.检查防火墙设置在排除5G网络故障时,还需要检查防火墙的设置。
如果设置不正确,则可能会导致5G网络无法正常工作。
四、信号干扰排查1.检测信号强度在排除信号干扰时,首先需要检测信号强度是否足够。
如果信号强度不足,则可能会导致通信质量下降。
2.调整天线方向和位置在排除信号干扰时,还需要调整天线方向和位置。
通过调整天线方向和位置,可以改善信号质量。
3.检测干扰源在排除信号干扰时,还需要检测干扰源。
LTE相关故障定位指导书一、常用维测手段1)基本原则硬件问题原则:通过下电复位、拔插单板操作,解决的问题,不用更换单板,不需返板分析,可以继续使用。
1、基带板问题三板斧:1、使用下电、上电命令(OPR BRDPWR)复位单板;2、复位主控板(RST BRD);3、拔插单板及换板。
2、主控板问题三板斧:1、复位主控板;2、拔插主控板;3、更换主控板3、RRU问题三板斧:1、光功率仪测试RRU端收发光功率;2、下电、再上电;3、更换RRU 4、光模块问题三板斧:1、同好的光模块(带光纤)交叉验证;2、更换光模块或光纤;3、复位两端设备及更换设备。
2)指示灯状态与含义UMPTb3/UMPTb4单板指示灯说明指示灯 RUN 绿色颜色常亮常灭状态有电源输入 ? ? 1s亮,1s灭 0.125s亮,0.125s灭无电源输入单板处于故障状态说明单板运行正常 ? 单板正在加载软件或数据配置 ? 单板未开工 ALM 红色常灭常亮无故障告警状态,表明单板存在故障指示灯颜色状态 1s亮,1s灭说明告警状态,单板故障或外部接口故障 ACT 绿色常亮 ? ? 主用状态单板处于激活状态,正在提供服务常灭 ? ? 非主用状态单板没有激活或没有提供服务 0.125s亮,0.125s灭OML(Operation and Maintenance Link)断链 1s亮,1s灭 2s亮,2s灭测试状态业务未就绪状态(例如小区状态未就绪、业务链路未就绪等) 光口LINK 绿色常亮常灭光口ACT 橙色闪烁常灭连接状态正常连接状态不正常有数据传输无数据传输WMPT单板指示灯说明常亮 WMPT RUN (主控)绿色 1S亮,1S灭单板运行正常常灭有电源输入,单板有故障无电源输入,单板有故障 0.125S亮,0125S灭单板处于加载状态常灭 ALM 红色常亮 1S亮,1S灭常亮 ACT 绿色常灭常亮绿色(LINK)常灭 FE1光口闪烁黄色(ACK) 常灭常亮绿色(LINK)常灭 FE0光口闪烁黄色(ACK) 常灭常亮绿色(LINK)常灭 ETH 闪烁黄色(ACK) 常灭无故障告警状态,运行中有故障单板故障,外部接口故障主用备用连接成功无连接有数据收发无数据收发连接成功无连接有数据收发无数据收发连接成功无连接有数据收发无数据收发基带板指示灯说明常亮 UBBP(3光口) UBBPbc(6光口)(基带接口处理) ACT 绿色常灭备用 0.125S亮,0125S灭中常亮主用 RUN 绿色常灭 1S亮,1S灭无电源输入,单板有故障单板运行正常单板处于加载状态,未开关,安全版本有电源输入,单板有故障常灭 ALM 红色常亮 1S亮,1S灭红灯常亮红灯1S亮,1S灭 CPRI 红色/绿色红灯0.125S亮,0125S无故障告警状态,换单板单板故障,外部接口故障光模块故障,光纤故障。
中国电信XXX分公司OLT脱网分析及应对措施案例分享OLT属于网络接入层设备,是用户接入的第一个环节。
由于线路成本原因,绝大多数的用户只接入到一台OLT,OLT 设备的稳定性关乎用户的使用体验。
此文通过分析OLT脱网情况,试图找出影响OLT设备脱网的因素,提出针对性的改进措施。
一、2018年1月至8月OLT脱网设备数量总体情况如下:从上图可以看出XXX分公司OLT设备脱网数量在逐月下降。
二、XXX分公司OLT设备脱网原因分析XXX分公司2018年1月份OLT设备脱网原因分析XXX分公司OLT设备脱网主要原因分为三大类:设备掉电、光缆中断及设备退网线路割接等工程原因。
工程原因中断的OLT设备一般能提前屏蔽,不计入考核范围,在此不做分析,主要分析设备掉电和光缆中断类。
三、OLT设备脱网应对措施(一)措施一:针对设备掉电类,由县局实地勘察设备所在机房的电源情况,对有故障的电源数量进行统计,统计结果汇总上报市公司,由市公司统一采购电源模块等所需材料,县局维护人员对有问题的电源设备逐一更换。
此次检查的机房主要为C类机房,对C类机房电源的全面检查,对于超期服役的电源和蓄电池进行更换,不仅保障了机房内OLT设备的供电,也保证了机房内其他设备的供电,包括传输设备和交换类设备。
降低OLT设备脱网率的同时也减少了因掉电原因引起的其他障碍数量。
(二)措施二:针对光缆故障类,结合IPRAN成环,统筹规划,对光缆质量特别差已不能用的光缆段和缺少纤芯的线路段由县局进行实地勘察记录并将结果上报到市公司接入中心和建设部。
接入中心组织建设部、网运部和县局对需要新布放的光缆段统一进行会审,并在会后将实际所需光缆总长度上报建设部统一采购。
县局按照会审结果领料并布放光缆。
传输光缆使用年限过长,导致部分线路段传输障碍频发,光缆接续次数过多,线路质量严重下降,此次光缆的布放部分改善了现网的传输网络质量。
传输光缆布放难度大,造价高,传输网络质量的提升是一个漫长的过程,我们只能逐步进行改善,按照实际需求根据紧急情况选择性的布放新光缆。
消防信号传输系统维护与排障技巧消防信号传输系统在保护人们生命和财产安全方面发挥着至关重要的作用。
为了确保消防信号传输系统的正常运行,维护与排障工作显得尤为重要。
本文将介绍一些常见的消防信号传输系统维护与排障技巧,以帮助保证系统的可靠性和稳定性。
一、定期巡检与保养定期巡检是确保消防信号传输系统正常运行的基础。
工作人员应定期检查系统的各个部件,包括连接线路、传感器、主控设备等,并及时修复或更换损坏的部件。
此外,检查系统的电源供应是否稳定,防止发生因电源不足而引发的故障。
同时,系统的保养也是维护系统稳定性的重要环节。
清洁传感器以确保其正常工作,定期检查探测器是否需要更换电池,保持系统的灵敏度。
二、故障排除在系统运行中,可能会出现各种故障,需要及时诊断和排除。
以下是一些常见的故障排除技巧:1. 检查连接线路 - 检查系统的连接线路是否完好无损。
有时候,故障可能是由于线路断开或接触不良引起的。
确保线路连接牢固,并修复损坏的线路。
2. 检查传感器 - 传感器是消防信号传输系统的核心组件,负责检测火灾状况。
如果传感器出现故障,可能导致系统无法正常工作。
检查传感器的电池电量是否充足,并确保传感器没有被遮挡或损坏。
3. 检查主控设备 - 主控设备是消防信号传输系统的核心,负责接收和发送报警信号。
检查主控设备的运行状态,确保其工作正常。
如果主控设备无法正常运行,可能需要重启或进行其他修复操作。
4. 检查网络连接 - 一些消防信号传输系统采用网络传输数据。
如果系统连接到网络,请检查网络连接是否正常,并排除网络故障。
5. 更新软件与固件 - 如果消防信号传输系统使用有关软件或固件,请确保软件和固件是最新的版本。
更新软件和固件可以解决一些潜在的故障问题,并提高系统的性能。
三、培训与备份为了确保消防信号传输系统的可靠性,相关人员需要接受相关培训,并了解系统的基本原理和维护方法。
培训可以提高工作人员的维护技能和故障排除能力,确保能够及时处理系统故障。
烽火OLT排障思路--三板斧
OLT作为局端设备,主要用于对终端业务的控制和承载,同时,在整个接入网络中,OLT也作为承上启下的“业务桥梁”,承担着故障处理“分水岭”的重要责任。
一旦OLT设备发生异常故障,就会给终端业务造成十分严重和广泛的影响。
那么作为接入技术人员,在日常维护工作中,如何根据故障类型和范围,来判断是否为OLT故障引起的原因呢?我们从故障类型着手,来分析和总结一下,如何快速判断和定位由OLT设备导致的故障。
第一关于ONU或HGU无法授权或者授权正常后出现掉注册问题的分析:
首先要检查是否为某个PON口下的单台终端无法注册,还是多板卡多PON口下都出现类似情况,如果是极个别情况,一般就跟OLT没有关系,需要具体查找ONU原因;要是发现大面积都是无法正常授权或注册的,则需要查找OLT原因。
具体的检查思路为:
检查PON口的认证模式是否跟局方要求的相符;
确认下挂终端设备是否为互通型,需要检查OLT上的互通开关是否打开;
ONU固件版本太低,或者OLT线卡版本和ONU版本相差太大;
如果下面终端设备出现流氓ONU,也会导致某PON口下大面积掉注册情况。
如果发现部分槽位或全部槽位的办法不能正常工作,需要检查OLT的供电电压和电流是否正常。
第二发生语音业务故障时如何分析和定位是否由OLT设备异常引起:
首先也是先确定故障范围,是某一个用户故障,还是整台OLT下都出现了类似问题。
通常情况,只有出现大面积的语音业务故障时,才需要把排障重点放到OLT设备上,具体的分析思路为:
检查OLT主控盘上的语音业务配置信息是否存在,并检查到MGC的注册是否正常;
检查OLT上联口能否学到上层交换设备送下来的语音VLAN和相应MAC地址信息;
联系软交换平台确认MGC业务和路由是否正常。
如果发现是PON内通话有问题,PON外是正常,此时需要检查OLT上的ARP语音代理功能是否正常。
第三发生宽带业务故障时如何分析和定位是否由OLT设备异常引起:
宽带业务异常常见的主要现象为:不能拨号上网,网速很慢,经常掉线等。
首先也是先确定具体的故障情况和故障范围,是某一个用户故障,还是整台OLT下都出现了类似问题。
通常情况,只有出现大面积的宽带业务故障时,才需要把排障重点放到OLT设备上,具体的分析思路为:
检查OLT主控盘上宽带业务配置信息是否存在,并检查到相关VLAN信息是否正常;
检查OLT上联口能否学到上层交换设备送下来的宽带VLAN和相应MAC地址信息;
如果发现大面积用户反映网速慢或经常掉线,需要检查板卡PON口和上联口的即时性能,是否出现流量瓶颈。
如果发现OLT下有MAC地址环回或者漂移现象,则需要在OLT上设置QOS规则进行过滤和丢弃。
如果出现VPN用户不能正常上网,就需要把PC设置成VPN的静态IP,然后挂到OLT的上联口进行测试,如果可以,就判断为PON内问题,如果同样不行,就是局方上层网络问题。
第四PON网管和OLT发生通信异常的情况,分为以下几种:
部分OLT出现间歇性脱管,但可以ping通,需要检查网管跟OLT之间的路由;
如果是单个OLT出现脱管,但可以ping通,需要检查这个OLT的CPU和内存利用率,MTU
值,OLT的任务运行情况,SNMP参数配置,ACL访问控制列表等配置是否异常。
如果单个OLT出现脱管,也不能ping通,则需要到设备现场进行观察板卡告警灯状态,一般需要检查供电和主控盘是否正常。
第五TL1工单执行落地问题原因分析:
出现单个OLT下工单落地情况,需要检查OLT的CPU和内存利用率,OLT的任务运行情况,SNMP参数配置,内存是否溢出等情况。
出现多个OLT工单落地情况,需要检查OLT上行到网管的路由是否正常。
前期开通测试时,出现某个工单执行失败,需要把此工单指令通过人工方式,在网管上直接录入查看返回结果,来判断是工单指令本身错误还是设备有异常。
第六当OLT上的板卡出现挂死或者脱管情况分析:
如果是全部业务板卡出现脱管,私网不通,重启也不好时,需要检查供电是否正常,主控盘是否损坏,有备用主控的话一定要切换到备板;
如果单个线卡盘出现挂死或脱管,首先要确认私网能否ping通,检查线卡的软硬件版本是否统一,检查线卡盘的内存利用率是否异常,如果重启还是不能恢复,则需要考虑硬件故障,尝试更换解决。