EPON故障处理经验
- 格式:doc
- 大小:38.00 KB
- 文档页数:4
EPON网络组播问题处理
1、故障现象收集
现场维护人员反应:
东岭AN5516下带ONU(DSL型)很多出现ITV卡,
2、现场测试情况:
现场搭建测试环境测试,观察直播节目(组播频道)3到5分钟后,机顶盒出现节目加载中,部分型号机顶盒出现等待信号。
切换频道后又正常,再观看3到5分钟又复现。
点播VOD及回看正常。
3、故障处理过程
1、其他节点未出现同样的问题,组播全网应是正常的。
2、根据处理经验,去使能ONU上行口上的广播报、多播包及未知包的抑制,改为在OLT上单PON口对所有包抑制为1500包/秒,没有明显的改善。
3、单播并未发现有异常,应该可以判断是组播的问题,请支撑人员改为单播测试,也没有得到改善,后发现ITV承载网上的原有用来还原的单播地址段已经在平台上被修改为组播地址。
再次修改为单播测试。
终于正常可用。
可以确定是组播配置引起。
4、既然组播部署后经过长时间运行为发生问题,证明设备可以正常开通组播业务。
回归,使用命令行比对比较隐蔽的组播参数的配置,发现有一个参数设备不一样,通过命令行直接修改,经过测试后正常。
使用命令行全部显示出配置跟正常的OLT进行比对,
OLT上行端口上对组播包进行抑制,如果整台OLT的组播包超过1500包/秒,全部被丢弃。
故障总结:
设备的图形化界面设计表面上直观,易于入门,操作便捷。
但多层次的嵌套,造成在故障处理时,很难找到相应的配置菜单,而且往往对于关键参数的配置,容易被忽略。
无法在同一个维度进行比对。
配网 EPON系统 ONU设备异常处理典型经验类型:通信运维关键字:配网 ONU设备异常处理1、引言镇江句容供电公司配网自动化项目2016年开始施工,其中“三遥”牵涉9座变电站,通信ADSS光缆铺设600多公里,ONU设备300多台。
项目建设完成后,信通运检班负责对EPON系统的运行与维护,ONU(Optical Network Unit,光网络单元)设备在线率,是其中的一项重要指标的考核指标。
故障现象接运维检修部配网自动化人员报,10kV二0二线11603号柱上开关ONU设备运行异常,时常掉线,又自动恢复,且持续几天。
故障分析1.查看链路图,故障点属于双链路拓扑结构,在主用光纤断芯情况下,业务可以从相反路径的备用光纤传输,不对业务产生影响。
双链路拓扑结构:2.怀疑设备故障,有设备本身故障、电源故障和光模块故障等,查找设备参数,以便到现场判断故障点。
ONU设备使用型号是华为MA5621(DC),无风扇,自然散热,长期: -40 ℃ ~ + 85 ℃,电源可适应DC输入 9V~60V。
工业级的设计,可靠。
3.准备仪器仪表和常用备件到现场检查。
按下表指示灯情况做初步判断。
ONU设备指示灯状态表:指示灯名称状态指示灯含义及处理方法4.现场只有POWER灯长亮,显示正常,LINK和REG灯熄灭,设备没有注册成功,判断问题出在光路上。
5.根据句容配网通信设计,EPON在一根光纤上采用单纤双向传输机制传送收发信号,使用到的技术是WDM(Wavelength pision Multiplexing,波分复用)技术,用不同波长(下行1490nm,上行1310nm)实现上下行数据传输,实现在一根光纤上同时传输上下行数据流而相互不影响,下行方向,OLT发出的信号以广播式发给所有的用户,上行方向,各ONU采用时分复用TDMA(Time pision Multiple Access)技术。
下行采用针对不同用户加密广播传输的方式共享带宽。
目录设备问题.................................................... 错误!未定义书签。
一、呼叫转移故障处理技术案例............................ 错误!未定义书签。
二、未知包引起语音断断续续故障处理...................... 错误!未定义书签。
三、关于07型ONU出现的误摘挂机的情况说明............... 错误!未定义书签。
四、关于北京清河局OLT2_4003外层VLAN用户拨号676错误报告错误!未定义书签。
五、同一个PON口下15型ONU上联EUP2盘引起其它15ONU传真的问题错误!未定义书签。
六、modem掉线问题的处理................................ 错误!未定义书签。
七、07ONU下接MSAN设备上网时延大处理................... 错误!未定义书签。
八、打包间隔不一致导致传真问题的处理方法................ 错误!未定义书签。
九、传真机模式错误导致传真失败问题处理.................. 错误!未定义书签。
十、高科iad的payload值影响传真处理案例................ 错误!未定义书签。
十一、5006-07杂音问题处理案例.......................... 错误!未定义书签。
十二、5116-02的AC16语音代理问题处理................... 错误!未定义书签。
十三、AN5006-03/04/09AONU下挂wlan等设备未知包问题处理案例错误!未定义书签。
十四、07B-ONU传真问题.................................. 错误!未定义书签。
十五、AN5116-02下挂07ONU催挂音超时处理问题............ 错误!未定义书签。
EPON网络故障原因分析及处理EPON网络的构成EPON 网络一般包括OLT ( Opt Line Term 光纤线路终端)、ONU ( Optical Network Unit 光纤网络单元)、无源光分路器( Splitter)和局端到用户端的光纤链路。
OLT 位于EPON 系统的局端一侧,负责EPON 系统语音、数据及视频业务与终端用户的连接,汇聚外部业务,协调远端ONU,除了这些基本功能,高等级的OLT 还具备数据路由、交换和语音网关等功能,ONU 负责用户的接入、业务的覆盖。
EPON 网络传输下行方向(由OLT 到ONU )采用广播方式,每一个ONU 将接收到所有下行信息,根据其MAC地址提取有用信号。
上行方向(由ONU 到OLT)采用时分方式共享系统。
为了避免数据碰撞和公平的信道共享,采用OLT分配静态或者动态带宽的方式,给每个ONU 分配一个时间没有重叠、时隙可变的传输窗口,用于ONU 数据的传递。
2EPON传输指标EPON 系统的设计要满足OLT 和ONU 的光传输特性。
OLT 的发射、接收光功率范围因PON 模块型号而异,10 km 模块的发射光功率范围为2~ - 3 dBm,接收光功率范围为- 1~ - 24 dBm; 20 km模块的发射光功率范围为7~ 2 dBm,接收光功率范围为- 6~- 27 dBm。
ONU的发射光功率范围为4 ~ - 1 dBm,接收光功率范围为- 3~ - 24 dBm。
EPON 在上行方向为突发模式,普通的光功率计无法测量,在实施时只能测试下行OLT 的发送光功率和ONU 的接收光功率,测量的波长为1 490 nm,如果在1 550 nm 波长测量,根据经验有1~ 2 dB 的偏差。
目前通常采用的OLT 发送光功率一般在+ 7~+ 2 dBm之间,而ONU 光接口输入端光功率要求大于- 27~ - 24 dBm,因此在工程中可以采取多级分路器结构进行传输,既可保证ONU 输入光功率,也可节约资源,增加用户数。
EPON设备故障处理常见方法目前各个数据通信设备生产厂家都推出了自己的EPON设备,如华为、中兴、烽火等,以便适应市场发展的需求。
不过,在使用各种厂家的EPON产品的时候,自然涉及到EPON设备故障处理的问题,下面将结合自己的经历和相关参考资料,以华为EPON设备为例,总结一下EPON故障处理常见方法,主要包含:告警分析、性能分析、分段处理、仪表测试、对比分析、互换分析、数据配置分析、协议分析等。
分别如下:1、告警分析这是数据通信设备故障处理的重要依据,华为EPON设备也不例外,通过告警分析可进行故障分析和定位,一般告警信息包含一下内容:告警描述、发生位置、告警原因及告警修复等。
当然告警信息太多,有很多是不需关注的。
2、性能分析通过华为EPON设备提供的性能分析工具,对发生的故障进行分析,以便定位故障原因。
例如,在以太网端口模式下,可使用display port statistics命令查看端口统计信息,如发现CRC错误包数量增长较快,说明设备链接存在异常、端口协商不正确或端口损坏;如发现大量的数据帧被丢弃,说明对接设备送过来的流量超过了端口的接受能力。
3、分段分析这是常见故障定位方法之一,处理华为EPON设备故障也不例外,当然,维护人员需要对EPON设备,如MA5680T、MA5606T及ONT等,要有全面深入的了解。
且对可能导致业务故障所涉及的相关设备及环节有所认识。
例如,MA5680T下挂用户组播业务常出现中断,通过分段分析,故障产生的原因可能为:组播路由器配置有误、组播服务器故障、机顶盒问题,线路质量问题等。
4、仪表测试这也是故障定位和处理的常见方法之一,使用各种仪器对设备各种实际性能参数进行直观地量化,从而直接反映EPON设备地运行状态。
如利用光功率计测试光路状态;使用万用表测量电压、电阻和电流强度,从而判断其相关状态是否正常。
5、对比分析如某台MA5680T下挂地ONT不能上线,此时可更换ONT来判断是否为ONT问题,还可查看同一PON下的其它ONT状态是否正常,如不正常,说明为PON口或分光器问题,如正常,说明是个别现象,还需进一步定位和处理。
大家好!时间过得真快,转眼间大家来深EPON培训已经过去快一个月了!但是大家极高的学习热情与专业素质使我非常难忘。
由于时间关系,培训过程中我们一起探讨的PON维护案例有限。
最近我搜集了一些PON维护案例,现在同大家一起探讨下,希望能对大家的工作有所帮助。
同时,也希望大家能够踊跃提供新的案例,这样我们便能一同学习提高,谢谢!1. 某地用户上网慢问题故障现象:某地C200设备PON口1下挂26套(实际使用23套)F820设备,开通部分宽带业务,用户反映在上网高峰时段会出现上网慢及丢包问题。
处理方法:在高峰时段,F820侧上网丢包时,在C200设备侧拨号测试,网速正常;从C200设备上拼F820设备管理IP,丢包严重。
根据以上测试,可基本判断故障原因在EPON设备侧。
查询C200设备数据配置,发现广东路C200设备上启用了QINQ功能,由于启用QINQ后需要关闭洪泛(如不关闭洪泛抑制,启用QINQ后在上网高峰时段会对宽带业务造成影响),登陆C200设备,在全局模式下执行关闭洪泛抑制命令:ZXAN(config)#no eth-switch unknowncast-limit关闭洪泛后,高峰时段宽带业务使用正常。
2. 某站点中兴C220设备故障故障现象:某站点中兴C220设备故障,影响下挂ONU业务。
处理方法:通过现场检查,定位故障原因为C220设备内部MAC地址转发功能异常引起,洪泛流量超限,内部MAC地址转发资源被大量占用,无法及时释放,导致正常业务受阻。
检查配置数据发现,C220设备内部QINQ规则配置条目过多、上联口配置了大量无用透传VLAN及未使用的保留VLAN。
如醉香居C220设备gei_0/6/1上联口:配置的透传VLAN 97-1000 保留VLAN 4000-4093,其中有效VLAN只有97-101,4000-4008。
OLT设备启用QINQ功能后,配置过多无效VLAN会大量占用设备内部转发资源,对正常MAC地址转发造成影响。
EPON常见故障处理一.版本升级不成功1.下载所有版本文件都失败1)启动网管前,应预先关闭电脑上其它的FTP软件,停止操作系统自带的FTP服务,防止和网管内置的FTP服务冲突2)检查填写的FTP用户名密码是否和网管配置中心的FTP配置一致;IP地址填写是否正确;版本是否已经拷贝到FTP默认的目录下3)输入文件名时,文件后缀(.bin)不能少,否则会提示“连接FTP服务器出错”。
2.下载EPFC板的verEPFCONU.bin文件失败升级到U3T4版本时,如果主控板版本还是U2T4,传送verEPFCONU.bin到主控板时会显示“写FLASH失败”。
因此需要传完主控板版本后,重启让主控板用U3T4版本运行起来后,再传该文件就没问题了。
二.无法搜索到ONU1)用人机命令查看ZTE#card pon mcu A1 en(A1为槽位号,根据实际情况选取)(A1) EPONC#show onu unreg 1 //查看未注册的ONU的MAC地址.2)在局端PON口直接连ONU,看能否搜索到;注意如果PON口直接连ONU时,可能光功率过强,可以将光纤略为拔出一点;3)接到其它槽位或PON口上,看是否能搜索到;4)更换ONU,看是否ONU的问题;5)检查C200和ONU版本是否太老,升级到最新版本;6)检查EPFC板管理的ONU类型是否设置正确(A1) EPONC# config system supported-onu standard说明:Supported onu参数可以为:legacy|standard|both。
当ONU类型为非互通型时,参数应该为legacy;当ONU类型为互通型时,参数应该为standard;参数both目前暂不建议使用。
7)清空数据重做;三.网管安装不成功1.电脑配置是否太低,至少要512M内存;2.SQL SERVER 2000数据库是否打上了SP3补丁;3.网管配置中心数据库项目内设置sa的用户密码,默认是netnumen,请设置成和SQL数据库内一致;4.仔细查看出错信息,在错误文件中发现错误原因。
1、EPON C200 (主控板)主备上联问题C200 在B1、B2槽位EC4GM主备两块主控板,但上下两个电口不对称连接在同一HUB上(例如:分别为3口和8口),通过另外的电口(例如4口)下联计算机,无法ping通C200和上联的网口IP。
当C200使用主备两块的主控板时,备板在主板工作时是不做任何工作的,在设备配置上也无需任何配置。
所以,主备板的上联口(无论是光纤还是网线)必须上下一致。
否则会导致整个网元不通。
注:当使用主备两块办时,可以看作一块主控板设置2、EPON在串口CI里面配置的数据可以在网管上面显示,现在介绍一下版本匹配EPON在串口CI里面配置的数据可以在网管上面显示,和网管之间的匹配关系已经做了同步CI里面的数据的了,但是要看网管版本。
我们的C200现在最新的版本是I版本,主控板子的版本时间是2006年3月13号,如果我们用这个版本,我们网管的版本用的是ZXNMO1,我们在CI里面做的所有的配置,在网管都可以看见,原来这个功能没有,但是如果你现在主控板子的版本升级到了I版本,但是你的网管还是老的ZXNMO1 42,网管可以用,但是CI里面配置的数据还是看不到,但是如果你是G版本,网管升级到了ZXNMO1 87这时候的网管不能用,打开都是显示网元返回信息错误,这时候一定要升级网管的版本。
3、武汉EPON设备无法升级武汉由于发货的版本太低是g版本,为了和网管匹配,所以办事处要求升级主控板的版本,但是他们3天都没升级上去,在下载版本的时候报的是FTP服务器连接失败,跟本不能升版本,打电话也咨询过我们测试部的,但是都觉得很奇怪的故障,所以我一到就要求我马上去机房升级设备。
开始分析我认为应该是电脑的问题?但是换了几台机器都是这个报错,是不是防火墙的原因???是不是网管的版本太高了,我试了ZXNOMI 87的版本,也是一样的报错,又试了ZXNOMI 42的版本,也是一样的报错,但是所里觉得还是我们版本和网管之间匹配的问题,由于不能在网管升级EC4G板子,所以我在串口下升级完了,又试了ZXNOMI 87的版本,也是一样的报错,网管还是提示连接FTP服务器失败,和研发联系了,都说不可能出现这种问题,以为是端口被闭,防火墙都关了,换了好几台电脑都不行。
把抓的包也发给他们,也没发现有什么异常的包,但是我觉得不能盲目的觉得版本了,因为在广州,广西我都从g版本升级过从来没有这种问题,我找局方要了数据规划,这时候我看着板子突然发现我们TG的网段也是192.168.1.1是网关的IP,恰好我们设备他们规划的时候是192.168.0.2,我服务器的IP为192.168.0.100,这是他们开局就是这么设置的,我觉得问题肯定就在这,有点头绪了,我打电话给TG产家的人,晕,他们掩码用了255.255.0.0,由于我们的IAD是IPOE的,所以用了192.168.1.100,给我们IAD分配的,掩码是255.255.0.0,问题肯定是IP设置规划的原因,因为办事处一直说是设备的问题,这个时候自己也知道了是最初规划的原因,用串口把我们的带外地址改好后换成了172.168.1.2下载版本,没有任何问题,觉得开局前的数据规划很重要,否则给后期维护造成了很大的麻烦。
4、EPON开局,没有串口线,如何更改C200的ip地址和子网号、网元号等信息?我们知道,C200的默认带外ip地址为10.62.31.1,将调试计算机的ip地址设成同样的网段,用网线连接C200的Q口和计算机,然后telnet上去,用户名/密码为root/root,登进去之后,就会发现这个界面和串口的界面是一模一样的,里面的命令什么都是一样。
这个时候就可以更改了,用和串口同样的方法。
5、Epon下的电话机切不断拨号音故障及D500的语音增益问题山西电信的epon开好之后,多次出现电话机切不断拨号音的故障,导致无法拨打电话。
1)检查出现故障的话机,发现它们都是同一个牌子的,而且比较老,换了新的话机之后,则没有这种故障了。
所以就以为是这一种话机的问题,只要更换掉就可以了。
可是过了一段时间后,又有用户反映切不断拨号音了,而这时候的话机不是老话机了。
2)感觉这故障应该是电话机与终端之间的通信有问题,登陆到D500的web界面上,发现出故障的时候2个语音端口都是In Service 的;语音增益D-A及A-D 都是1,这个增益值是我们开局的时候设的(开局时候默认值为-3),增益为1应该算是比较大了。
试着修改语音增益D-A和A-D均为默认值,发现这个时候电话就没问题了,用那种出故障的老的话机去试,也没有问题。
3)既然这个故障跟语音增益有关,那么是哪种增益导致的呢?是A-D,还是D-A?接下来我们就查找这个原因,在多次的试验当中,我们发现只有同时将增益调成-3才可以。
并且,在试验中,我们还发现了D500的另一个问题:修改语音增益之后应该要重新启动终端才能生效,可是有的时候却不管用,重启之后增益值又回到原来的了;另外,A-D增益和D-A增益是反的,它们应该调换过来才对。
4)找出这个问题后,将出问题的终端的增益全都改成-3,并通过研发修改程序,调换两个增益,彻底解决了问题。
6、EPON设备总有几个用户ONU掉线,网管显示的是上下行的带宽都看不见,为0 广州电信的EPON设备总有几个用户ONU掉线,网管显示的是上下行的带宽都看不见,为0,过去把版本升级成G版本,问题还是,而且是不定期的不定用户会自己掉线,说明肯定不是光路问题,把我们下行也设置成了TAG,问题依旧,登陆到每块板子上面,一查看DBA算法,是ENABLE,EPON设备由于软硬件的问题,现在还不支持打开外部算法,打开后有bug就是会有几个用户断线,所以现在出去还是让外部算法DISABLE,然后把在网管上面把带宽加大,最好最小带宽大于12M,肯定不会出现上述问题,而且我们的多用户下载导致D400死掉的问题也会解决.7、EPON上网管总有告警不管怎么样把板位图添加好,总是有告警,说线板不在位, 实际已经把板子都添加好了,板子也是正常工作。
如果c200有EIG板子的时候,添加板位图的时候一定要把网管EIG板子删掉,这个版本就是这样,要把告警删掉,就只能这样,添加到CLI里面加,目前就用这种方法8、广州EPONC200的EIG上联数据端口和思科交换机对接有时候端口总是DOWN掉广州EPONC200的EIG上联数据端口和思科交换机对接有时候端口总是DOWN 掉,时间很不确定,我们一直不知道什么原因,因为时间太不确定,解决的方法,只有打电话给数据据机房的人,在网管上面ENABLE一下,这边端口就UP了,后来和测试主备倒换后,9号上联口down,对方enable端口后正常。
主控板软复位后,9号上联口down,对方enable端口后正常。
这个问题是因为上联cisco 的路由器具有端口安全的功能,会自动关闭端口。
目前发现的自动关断的原因是收到STP协议包。
所以在使用时要不关掉STP,要不建议局方将上联口的端口安全关掉。
9、EPON设备PPPOE很难拨上去EPON设备PPPOE很难拨上去,即使上去了,速度还是很慢,不容易打开网页。
开始以为是设备的问题 , 以为是设备配置有问题,检查了vlan,show uni all 地址也学习到了,说明我们设备的通道已经是好了,进入网管看了一下后来检查了所有配置最后发现我们brust有问题,开的太小了,我们开了1000,我们打了180000后问题解决。
10、四川c200设备不能打电话我们把我们的C200 交换板直接4口直接出来 , 配了静态VLAN,没有经过我们设备了,但是还是有问题,打不通电话,说明不是我们的设备的问题,是IAD数据配置有问,因为IAD不是我们的,要是vlan或者是服务器的ip错了,电话就不能通,打电话把港湾的人叫来,他们登陆到他们设备上,确定没有把vlan配置上,我把我们的数据规划告诉他,添加后,电话可以打通,问题解决,局方也知道不是我们设备的问题。
11、广州EPON能上网不能打电话在广州开EPON实验局,不能打电话但是能上网因为我们上网和电话走不同的端口,上网的数据业务走的是1端口 VOIP走的是4端口,直接接上洋科技的TG 到老交换机不属于NGN业务。
不是由我们自己的SS10 控制它是普通电话开始怎么都打不通电话,但是能上网,所以我们一直以为是链路的问题。
我们自环 tg 设备灯也亮没忙音和拨号音,最后我们才知道是我们的IAD里面的SERVER 服务器设成了SS10的IP,们这边的VOIP是应该是受TG控制所以TG是我们的服务器。
12、广州C200与局方的交换机(6509)无法对接的原因我们的C200与局方的数据机房的6509对接,发现6509交换机对应的端口亮橙色灯。
后将C200上联口至数据机房的的光纤自环后发现C200上联板上对应光口的灯亮。
而将对方交换机出来的光纤自环后对方交换机对应端口的灯也亮。
局方人员到城域网机房进行配合,检查了6509的交换机对应的端口的配置,确定已经设定成了千兆,将我方上联口设成千兆后还是没有效果。
将C200数据上联口的光纤进行收发交换还是没有效果。
将上联口的发光纤拔掉后,对方的灯熄灭;将发端口插回去,收端口拔掉后,对方的灯亮。
代理方怀疑有可能是光功率不匹配或者是光模块不匹配导致。
我们从局方借来了放在数据机房的用的思科交换机到我们C200的机房进行数据业务上联口的调测,与接入机房和C200对接,思科交换机启动后再重启C200,则C200端口显示UP状态。
但用计算机分别接C200的电口和思科交换机的电口后对ping无法ping通。
很快灯又不正常了。
直接用其中的一块交换板的光口(拔掉另一块交换板和上联板)和放在我们机房的思科交换机对联后,两边对应端口的灯都亮,在交换机的端口和C200交换板的电口分别接上计算机后相互可以ping通。
pon口接D400,D400在接计算机后,该计算机和接在交换机上的计算机相互也可以ping通。
而用另一块交换板启动(拔掉另一块交换板和上联板),则启动后3、4电口虽然接上计算机,但是端口状态还是down,将交换板上的一个光口和思科交换机对接后两边光口都不亮,对ping也不能通。
将两块交换板和上联板都插上,启调通数据业务上联口。
不能ping通,灯也不正常。
得出结论前几天对接调不通的原因是一块交换板有问题所致。
同事以后出去时候要对接不成功时候,可以考虑一下是否是单板问题。
13、C200的后台网管与设备通信中断。
我们的EPON设备通过三层路由器,连接到internet网,维护终端通过internet 网与设备通信,但连接中断,无法进行正常的通信,命令无法下发。
首先我们查网络,发现没有问题,用我自己的电脑连接,前后台通信正常,人机命令下发正常。