朗讯传输设备时钟盘故障处理实例
- 格式:doc
- 大小:15.00 KB
- 文档页数:3
阿朗SDH时钟问题处理方法
1、阿朗SDH设备同步时钟在网管列表中的表述形式
凡是以/
2、阿朗SDH设备同步时钟处理步骤
1、发现/timingGenerator、-T0SyncPu结尾的告警,首先要查看光路是否有LOS、DS等告警,特别要注意的是要通过J0字节追踪确认相邻的光口是否被自环起来了,曾经发现两个对接的光口被分别自环起来后,表面看光路及光口都正常的,就是不断闪报Server Signal Failure告警。
下图就是因为12155网元2光口有LOS告警,引起了该网元2光口的时钟告警。
现网的1642时钟告警多属于这类原因引起的。
2 、有的网元在告警列表里面有时钟告警,但进设备里面去看又没时钟告警,这是因为告警没同步引起的。
告警没同步的网元面板如下图,特征是CRI、MAJ等告警栏的字母像虚线般。
处理方法:
在网络拓扑图上找到该我一定图标,停止监控(stop),再恢复监控(Align
告警同步后网元的面板图:
3、将时钟配置删除重配的步骤:
1、在设备面板上,Views-Synchronization
2、出现如下界面:
3、将原来配的时钟删除,删除前要记下该时钟是主用还是备用,1代表主用,2代表备用:
4、重新配时钟。
Synchronization-Time Source Configuration
5、搜索光口
6、选择时钟源来源及级别,光口提取选Extracted,主用选1,备用选2。
OK后就赔好了。
如果是1660、1662、1678设备有时钟告警,有可能交叉板原因引起,建议找厂家配合处理。
随着我国改革开放的不断深入,我国通信网规模容量、技术层次和服务质量都有了质的飞跃。
电信网的装备目前也达到国际先进水平,大量的新业务不断投入使用。
在这种情况下,对电信工作的技术人员和管理人员的相应要求也在不断变化和提高。
为了提高传输网的运行质量,要求传输维护人员能及时地定位故障,根据故障的现象和测试结果,判断故障原因、位置,在最短的时间内消除故障。
以下是在日常传输维护中,常见的几种故障定位方法以及处理故障的一些技巧。
首先,让我们了解一下传输系统的基本结构。
传输系统是由传输设备和线路构成,传输设备有复用设备分MUX(电复用设备)和OMUX (光电转换设备)。
用户送入传输系统中的端口一般为低次群电端口,经过高次群MUX设备后复用成高次群电路,再经过OMUX后把电信号变换成光信号,送至远端局。
设备的端口在机房中有专门的地方放置,分别为DDF(数字配线架)和ODF(光配线架),电接口放在DDF架,光接口放在ODF架,便于电路开放、调度和测试,如图(1)所示。
一、故障定位对传输系统故障定位的基本方法是分段测试,逐一排除非故障段。
下面我们以长途传输系统的2M故障为例作具体的说明(操作流程图见附图)。
对照图(2)的槽路连接图,当本端局发现一条2M电路中断,第一步,在2M电口的DDF 架分别作本端自环和环给远端,用在线监测表分别测本端信号和远端信号,可判断是本端至用户端不好还是本端传输至远端用户端不好。
第二步,如果是本端不好,则在用户端口配线架(如程控配线架)环给用户,如果用户端信号是好的,则是用户配线架至传输配线架之间的跳线或接头有问题,若用户端信号不好,则是用户配线架至用户设备段有问题,可配合用户处理。
第三步若远端信号不好,可叫对端局维护人员在对端局传输2M DDF架向本端局环路,用在线监测,如果信号是好的,则一般认为对端局2M DDF架至对端用户设备之间有问题,可由对端局与对端用户配合处理;如果信号不好,可再用环路测试判断,有转接局则再分段环路测试,最终定位故障段,判断是设备故障还是线路故障,若一时无法消除故障,则要将此电路调至备用路由上。
ADM16/1设备介绍一.机盘类型1. SC-系统控制盘系统控制盘通过双份的LAN总线控制盒配置所有单元盘,也控制用户面板(位于SC单元盘前面板上),提供外部操作接口,系统控制盘还提供包括数据包交换功能块(DPS),DPS功能块为网元间网管信息的通信提供了通道。
机盘告警指示灯(红灯)电源指示灯(绿灯)机架紧急告警(红灯)机架延迟告警(黄灯)机架信息告警(黄灯)机架不正常告警(黄灯)抑制告警按钮抑制指示灯(黄色)断开连接开关断开连接指示灯(黄色)人机接口2. CC-交叉连接盘交叉连接盘是WaveStar ADM16/1系统的核心。
在线路接口和支路接口之间提供交叉连接功能。
交叉连接功能由两个部分组成,高阶连接和低阶连接,两部分通过16或32个双向的VC4内部交叉连接总线实现互相连接。
高阶处理VC4等级的信号,低阶处理VC12等级的信号。
线路和线路,线路和支路,支路和支路之间都可以自由灵活地进行交叉连接。
为了增加可靠性,交叉连接盘实行1+1保护。
3. LS-线路接口盘WaveStar ADM16/1可以配置几种STM-16线路接口盘,包括1310,1550nm(长途,高性能,特高性能)等,所有光盘都支持激光器自动关闭功能(ALS),并支持标准的FC/PC接头。
4. TP-支路接口盘支路接口盘提供SDH/PDH支路接口,目前有4种支路盘:∙PI-EI/63,PDH支路盘,63个2M接口;∙SI-1/4,SDH支路盘,4个STM-1电接口盘。
可以不使用背板(paddle board);∙SA-1/4,SDH支路盘,4个STM-1光接口盘,支持AU3和AU4映射。
使用光接口盘时,必须使用背板(paddle board),完成光电转换和电压转换。
∙SAI-1/4,SDH支路盘,4个STM-1光电合一盘,可以根据要求配置成光口和电口形式。
其功能同以上两种155M光口盘和电口盘。
5. PT-电源时钟盘电源时钟盘完成滤波功能,使电源达到ETSI的要求,为保证在PT盘发生故障后系统仍可以正常工作,采用1+1保护。
GSM-R基站子系统故障处理手册目录目录第5章时钟类故障分析与处理...............................................................................................5-15.1 概述...................................................................................................................................5-15.1.1 常见的BSC时钟系统故障现象...............................................................................5-15.1.2 BTS时钟系统常见故障现象和原因.........................................................................5-15.2 背景知识............................................................................................................................5-35.2.1 BSC时钟背景知识..................................................................................................5-35.2.2 BTS时钟背景知识.................................................................................................5-125.2.3 基站时钟系统的的相关规定..................................................................................5-165.3 BSC分类故障定位...........................................................................................................5-165.3.1 参考源类故障........................................................................................................5-165.3.2 时钟框类故障........................................................................................................5-185.3.3 连线类故障............................................................................................................5-185.4 BTS分类故障定位...........................................................................................................5-195.4.1 参考源类故障........................................................................................................5-195.4.2 现场操作类故障....................................................................................................5-205.4.3 配线类故障............................................................................................................5-215.4.4 坏板类故障............................................................................................................5-215.5 BSC时钟类典型案例.......................................................................................................5-235.5.1 MCB到FIO的配线问题引起时钟故障..................................................................5-235.5.2 E1时隙整合器不能同步传送时钟引起基站失锁问题.............................................5-235.5.3 8k1参考源电平太低引起参考源不可用.................................................................5-245.5.4 CKB拨码开关拨错所引起故障..............................................................................5-245.5.5 时钟线及母板接触问题引起时钟问题....................................................................5-245.6 BTS时钟类典型案例........................................................................................................5-255.6.1 TMU 13MHz时钟老化引起无法锁定外时钟..........................................................5-255.6.2 时钟故障引起TRX无法正常启动.........................................................................5-265.6.3 误操作引起时钟故障案例......................................................................................5-275.6.4 TMU坏板引起TRX连续复位................................................................................5-27第5章时钟类故障分析与处理5.1 概述5.1.1 常见的BSC时钟系统故障现象表5-1BSC时钟系统常见故障现象及故障原因故障原因故障现象描述时钟框参考源异常BSC告警台有“DDS控制数据异常”、“时钟晶振越界”等告警,GCKS MOD 灯慢闪,大部分基站处于失锁。
朗讯SDH设备倒换故障处理实例作者:李宏杰来源:《移动通信》2010年第12期【摘要】文章介绍了SDH传输网的保护倒换原理,针对朗讯传输设备在倒换过程中出现的问题,在分析相关告警的基础上,在广州机房进行了故障重现实验,找到了故障原因所在,解决了2.5G SDH设备共享保护环倒换失效的问题。
【关键词】SDH 保护倒换 MS-SPRING APS1 引言SDH传输网中所采用的网络结构有多种,其中环状结构才具有真正意义上的自愈,故称为自愈环[1]。
即网络在无需人为干预的情况下,就能在极短时间内(ITU-T建议小于50ms)从失效状态自动恢复所携带的业务,使用户感觉不到网络已出现了故障。
其基本原理就是使网络具有备用路由,并重新确立通信能力。
2 传输保护原理为了保证高质量的业务传输,系统提供了保护功能。
在设备故障或者传输故障时,系统能自动进行切换,不影响业务信号的传输。
保护按照对象可以分为设备保护和传输业务保护:2.1 设备保护倒换(1)1+1保护1+1保护是指网元为一些重要单元盘配置了一份备份单元盘,两块盘完全相同,其中一块是工作盘,一块是保护盘。
如果工作盘故障,系统自动切换到保护盘上,这种自动切换是不可恢复的,此过程不会产生误码。
(2)1:N保护1:N保护是指网元为几块相同类型的盘配置了备份单元盘,该单元盘在正常情况下不工作,当工作单元盘故障时,系统自动倒换到备份盘上,这种倒换是可恢复的。
用正常盘替换故障盘后,系统将业务倒换到工作单元盘上,保证备份单元盘空闲状态。
2.2 传输保护倒换传输保护提供传输通道上的保护,当工作通道发生故障时,系统自动切换到备份通道上工作,从而不影响业务信号的传输。
传输保护倒换[2]可分为:复用段保护(MSP)、复用段-共享环保护(MS-SPRING)、子网连接保护(SNC)、双节点环互连保护(DNI)等。
(1)复用段保护(MSP)复用段保护用于点到点连接的网络拓扑。
在MSP倒换中,两个复用器之间的完整物理传输通道是双份的,即用不同的光接口分别连接复用器之间的工作段和保护段。
传输时钟交叉板应急处理首先,当传输时钟交叉板出现故障时,需要迅速排查故障原因。
可能的故障原因包括电源故障、时钟输入信号异常、主控芯片故障等。
可以通过检查电源、检测时钟输入信号以及检查主控芯片的工作状态来确定故障原因。
针对电源故障,可以先检查电源线是否接触良好,电源是否正常供电。
如果电源故障导致传输时钟交叉板无法正常工作,可以尝试更换电源或者修复电源故障。
如果时钟输入信号异常,可以检查输入信号线路是否接触良好,时钟源是否正常工作。
可以通过检测输入信号的频率和幅度来判断输入信号是否正常。
如果输入信号异常,可以尝试更换时钟源或者修复信号线路故障。
另外,为了保证通信系统的连续运行,还可以采取一些临时措施来应对传输时钟交叉板故障。
例如,可以暂时将时钟信号手动分配给各个模块,或者通过其他可以提供时钟信号的设备来代替传输时钟交叉板的功能。
这些临时措施可以确保通信系统的基本功能不受到影响,同时争取更多时间进行故障排查和修复。
在进行应急处理过程中,需要注意以下几点:1.着重保护通信系统的核心环节,确保核心业务的正常运行。
2.尽快组织专业人员进行故障排查和修复,避免故障的进一步扩大和影响。
3.做好故障记录和故障原因分析,为后续的系统维护和优化提供有效参考。
4.在恢复正常运行后,要及时对传输时钟交叉板进行全面检测和维护,以防止类似故障再次发生。
通过以上的应急处理措施,可以有效应对传输时钟交叉板的故障,并确保通信系统的正常运行。
然而,为了减少传输时钟交叉板出现故障的可能性,还需要做好设备的定期维护和检查,及时清洁和更换设备的关键部件,保持设备的正常工作状态。
此外,也需要对传输时钟交叉板进行备份和冗余配置,以保证系统的高可用性和容错性。
课程 SS005301 SDH故障处理与案例分析ISSUE4.1Huawei Technologies目录课程说明 (1)课程介绍 (1)课程目标 (1)相关资料 (1)第1章 SDH的告警消息与性能事件 (2)1.1 什么是SDH告警消息 (2)1.1.1 概念 (2)1.1.2 特点 (2)1.2 告警分类 (3)1.2.1 输入信号丢失(LOS) (3)1.2.2 帧定位丢失告警(LOF) (3)1.2.3 上游故障告警(AIS) (4)1.2.4 指针丢失(LOP) (4)1.2.5 过误码(EXC BER) (5)1.2.6 B1、B2、B3误码(B1、B2、B3 Error) (5)1.2.7 远端误码指示(REI) (5)1.2.8 远端缺陷指示(RDI) (6)1.2.9 通道接入点标识不匹配(TIM) (6)1.2.10 负荷标签不匹配(PLM) (6)1.3 什么是SDH性能数据 (7)1.4 常见的性能事件 (7)1.4.1 帧失步(OOF) (7)1.4.2 指针调整统计(PJC) (7)1.4.3 误码秒(ES) (8)1.4.4 严重误码秒(SES) (8)1.4.5 不可用秒(UAS) (9)1.4.6 背景块误码(BBE) (9)1.4.7 保护倒换(PS) (9)1.5 性能和告警的关系 (9)第2章常见故障的分析与处理 (11)2.1 故障定位的基本思路及方法 (11)2.1.1 故障定位的关键 (11)2.1.2 故障定位的原则 (11)2.1.3 故障定位的常用方法 (12)2.1.4 故障定位的基本思路 (15)2.2 常见故障的分析与处理 (16)2.2.1 业务中断 (16)2.2.2 传输误码 (17)2.2.3 业务丢失 (18)2.2.4 公务电话故障 (18)2.2.5 大量指针调整 (19)2.2.6 网关网元登录不上 (20)2.2.7 非网关网元登录不上 (20)第3章案例分析 (22)案例一、光纤损坏导致系统上报RLOS告警信息 (22)案例二、155H时钟配置错误导致接入网用户摘机无音 (22)案例三、业务配置错误导致站点上报TU-AIS告警信息 (23)案例四、B75 板倒装导致 2M 业务调配不通 (23)案例五、PD1板故障导致业务不通 (24)案例六、SS41SCB单板故障导致业务不能正确下发 (24)案例七、多网管操作导致配置业务丢失 (25)案例八、数据未备份导致业务中断 (25)案例九、光纤脏导致业务有误码 (26)案例十、时钟互锁导致误码 (26)案例十一、交叉点故障引发系统产生误码 (27)案例十二、链形组网所有站都有误码告警 (27)案例十三、计算机的IP地址配置和本地站的IP地址相同 (28)案例十四、由于网线错误造成155A通信不上 (28)案例十五、ID号重复导致新扩站点登录不上 (29)案例十六、非网关网元登录不上 (29)案例十七、单板故障网管无告警 (30)小结 (31)学习指导 (32)理论部分 (32)附录A:告警类别 (33)附录B:性能事件类别 (37)课程说明课程介绍本课程主要介绍了如何通过网管系统的告警信息和性能信息来处理一般的常见故障,并列出了一些常见故障的可能原因及处理方法,此部分内容对于成为一名合格的维护人员很有帮助,内容包括:●告警信息介绍●性能事件介绍●常见故障分类及原因分析●常见故障举例课程目标完成本课程学习,学员能够掌握:●熟悉各种告警及性能事件●常见故障的原因分析●故障定位的基本思路和方法相关资料无第1章 SDH的告警消息与性能事件SDH产品作为实际运行的设备,随着使用时间的推移,会因为设备老化或外界因素而引发障碍。
通信传输设备故障汇报处理流程一、华为传输设备(一)当TMS中发现根告警所属系统为华为SDH传输系统时,根据告警原始原因分为以下几种处理情况:1、R_LOS(接收线路侧信号丢失告警)(1)TMS告警定位查看流程:当告警原始原因为R_LOS时,查看告警对象为XX站点XX设备X槽XX网元号XX框XX槽XX板XX端口,右键此条告警选择告警定位后进入传输拓扑图,若能直接定位到网元可直接双击进入设备面板图查看告警,若无法定位,点击分层加载图标将所有网元加载完毕后,在搜索一栏输入站点名称,选择告警对象中的网元型号进行定位,选择网元双击直接进入设备面板图,双击告警对象中的槽位进入板卡试图,选择告警对象中的端口查看对端站点设备槽位及端口。
(2)R_LOS告警描述及原因:告警描述:R_LOS告警表示线路接收侧信号丢失(Receive loss of signal)。
该告警产生后,业务中断,并向下游下插AIS信号。
产生该告警后,系统会自动向上游站点回告MS_RDI,上游站点会产生MS_RDI 告警。
告警原因:①断纤(干线光缆故障或局间光缆故障引起);②连接件故障(与该单板相连的波分系统的连接件,连纤);③线路衰耗过大或光功率过载;④对端站发送部分故障,线路发送失效;⑤对端站交叉板故障或不在位;⑥对端站时钟板故障;⑦本站接收部分故障(本端SDH设备的连接件,连纤,单板)⑧对端站设备停电。
(3)告警通知流程:①当告警对象站点设备与对端站点设备为同一管辖围,调度值班员通知相关管辖运维分部生产值班员核查告警原因,并告知在45分钟之反馈告警原因及影响的重要业务(保护、稳控、自动化、调度数据网、视频会议、广域网)。
②当告警对象站点设备与对端站点设备不在同一管辖围时,调度值班员应查看告警对象站点设备和对端站点设备是否同时发生R_LOS告警,若同时发生R_LOS告警,调度值班员通知两个站点相关管辖运维分部生产值班员核查告警原因,并告知在45分钟之反馈告警原因及影响的重要业务;若对端站点设备未发生R_LOS告警,调度值班员通知告警对象设备管辖运维分部生产值班员核查告警原因,并告知在45分钟之反馈告警原因及影响的重要业务。
福建宁德地区时钟失锁问题处理分析报告东方通信工程服务部技术支持中心2000.3.4一、故障描述:2000/2/22东方通信ECSC收到福建宁德移动反映,当地GSM网络中有大量的基站出现时钟失锁的告警。
此问题的出现时间较早,曾经于1999年8月份大面积做过基站的时钟校准,发现有失锁的现象,在1999年的12月份对BSC1下的基站进行时钟的校准,但仍然出现大部分的基站时钟失锁(有相应的报告)。
ECSC在了解此问题后,在2/22和2/24日远程登录到宁德的系统,查看、并做了一定的操作。
发现以下情况:BSC01:9个基站GCLK Failed Phase Lock2个基站GCLK Phase Locked1个基站GCLK Phase LockingBSC02:15个基站GCLK Failed Phase Lock1个基站GCLK Phase Locked3个基站GCLK Phase Locking1个基站GCLK in Set Freq. ModeBSC03:15个基站GCLK Failed Phase Lock2个基站GCLK in Set Freq. ModeBSC04:10个基站GCLK Failed Phase Lock15个基站GCLK Phase LockedBSC05:12个基站GCLK Failed Phase Lock20个基站GCLK Phase Locked1个基站GCLK in Set Freq. ModeBSC06:13个基站GCLK Failed Phase Lock9个基站GCLK Phase Locked1个基站GCLK in Set Freq. ModeBSC07:21个基站GCLK Failed Phase Lock4个基站GCLK Phase Locked2个基站GCLK in Set Freq. Mode7个BSC和RXCDR的时钟都处于锁定的状态。
该问题引起了我公司的高度重视。
朗讯CDMA指标排障经验及案例 朗讯CDMA指标排障经验及案例朗讯科技全球服务部Nov. 5, 2005Lucent Technologies - Proprietary Use pursuant to Company instructions第一层次分析:1、起呼率差:Established call rate for origination>X% or 当天是连续多天平均的N倍 2、被叫差:Established call rate for termination>X% or当天是连续多天平均的N倍 3、掉话率差:Drop call Rate>Y% or当天是连续多天平均的N倍 4、历史话务起伏大:Total seizures和Total assignments突然变化很大(变大或变小)8/26/04Lucent Technologies - Proprietary Use pursuant to Company instructions第二层次分析(起呼率差):1、当时或历史上有没有进入ACOC状态,查找ROP文件ACOC文字 grep ACOC 051105.APX 2、查找其他如TFU, OM, CCU, CBR hardware HEH记录 cgrep +-w# “HEH” 051105.APX 3、如果Origination Blocking Rate>X%或和起呼率相同变化趋势(在SPAT的Analysis-Trend 的图形界面中看两条曲线起伏情况),怀疑是Blocking的问题,进入第三层次分析 (BLOCKING问题) 4、如果RF origination fail rate>X%或和起呼率相同变化趋势,并且在ROP文件中发现大量 的TCCF告警,则怀疑是硬件或RF问题,进入第三层次分析(硬件或RF问题)8/26/04Lucent Technologies - Proprietary Use pursuant to Company instructions第三层次分析(BLOCKING问题):是否资源不足: 1、如果RF Blocking Due to CE overflow,可能是CCU不足或未正常工作 2、如果RF Blocking Due to PP overflow,可能是PP不足或工作不稳定; 3、如果RF Blocking Due to Fwd/Rev Power imbalance,可能是前反向覆盖不平衡或可能 前向功率/驻波比不正常 是否真正话务量较高: 4、察看单个扇区Total Seizures and Total Erlangs (Day/BH) ,如果Total Seizures> 10000,Total Erlangs>18.4,认为已经是高话务的扇区,可能会造成部分时间段的 阻塞现象 5、看AOC统计的内容:Number of Users at Fwd Link Peak Power8/26/04Lucent Technologies - Proprietary Use pursuant to Company instructions第三层次分析(硬件或RF问题):1、硬件问题: a. 从Control&Display里查看附近有没有基站工作不正常; b. 且如果 (Attempt=0) or (Paf75=0) or (RF origination fail rate>30%)怀疑CBR问题; c. 如果起呼失败90%以上出现在同一块CCU,怀疑是CCU出现问题; d. 若周围一圈站切换较差掉话较多,则可能有OM/TFU/GPS时钟方面的硬件问题; e. 其他硬件问题可以查找ROP的HEH字段发现 2、天馈: a. 检查天馈部分螺丝有无松动;空分天线的两根天线是否方向一致;有否接反;然 后判断两根天线有否Diversity Imbalance情况;是否用了合适天线 b. 功率校验及驻波比校验是否通过; c. 天线方位角/倾角数据库及时更新 3、是否基站工作环境原因:如高温工作/有灰层/插槽针弯;是否有较多Low Voltage低 压告警 4、看2G与3G的Total Seizures和Total Assignments,并对应此站为2G/3G硬件情况;是否 为2G或3G1X手机终端问题(看ROP记录起呼失败是否集中在个别MIN) 5、直放站:参数是否修改及修改是否过大,过小(11,13,106,15,3)(12,13, 131,18,3)(13,14,184,20,3);参数修改有否重起基站;直放站上下行增益是 否平衡(MRX+MTX=80~85dbm/有否使主站噪声基底抬高(参见6的方法) 6、有干扰:察看RFER>10%;ROP中TCCF-2告警占所有TCCF告警30%以上;Peak RSSI和Average RSSI值接近且Average RSSI>10%,IROC统计中Low traffic时也较多落于 II区;使用Dump:PLM10命令或登陆AP得到实时背景噪声(以上统计可一单小时得到以 确定干扰发生的时间规律);使用泰克设备到基站扇区J5口上抓取干扰波形,使用定向 天线进行干扰源位置查找;8/26/04Lucent Technologies - Proprietary Use pursuant to Company instructions第三层次分析(硬件或RF问题,Cont…):7、由于缺少邻小区而未能正常Idle-handoff,察看邻区问题 A、UNL Rate和UNL data analysis B、HOMAX进行优先级调整 C、三个扇区馈线有无接反导致邻小区混乱,通过路侧打扇区覆盖范围印三 或用UNL数据分析确认 D、1-WAY,2-WAY分析(影响掉话,不影响起呼) E、当心是否有可能是远处来的PN改变造成PN Confusion 8、是否是跨载频起呼产生失败:看两个载频各自的Total Seizure和Total Assignment 9、是否是覆盖盲区或深度覆盖不足的区域(Debug mode: MRX<-90dbm);是否基站 发射功率不足(足够话务时可以参考Fwd Peak Pwr和Dump:PLM9的情况加以判断) 10、是否导频污染区域,Idle情况下PN改变频繁(Debug mode: Ec/Io<-13db, PN number>3) 11、检查Form的参数设置,以及可以适当调整Access参数8/26/04Lucent Technologies - Proprietary Use pursuant to Company instructions第二层次分析(被叫差):1、当时或历史上有没有进入ACOC状态,查找一个月内的ROP文件 2、如果Termination Blocking Rate>X%或和被叫失败率相同变化趋势,怀疑是Blocking的 问题,进入第三层次分析(BLOCKING问题,见前述) 3、如果RF Termination fail rate>X%或和起呼率相同变化趋势,并且在ROP文件中发现大 量的TCCF告警,则怀疑是硬件或RF问题,进入第三层次分析(硬件或RF问题,见前述 ) 4、是否寻呼失败问题:边界上登记与寻呼配合是否有问题; 5、是否手机终端存在缺陷:比如不支持分载频寻呼/快速寻呼而系统已经打开此功能8/26/04Lucent Technologies - Proprietary Use pursuant to Company instructions第二层次分析( 掉话率差):1、分析RF Lost Call Rate占DROP CALL RATE的大多数及在ROP文件中可以发现LOST CALL的告警特别多,则进入第三层次分析(无线上的掉话问题) 2、分析Call Shutdown Rate占DROP CALL RATE比重很大,则怀疑是传输不稳定或PP不 稳定或其他方面出现问题8/26/04Lucent Technologies - Proprietary Use pursuant to Company instructions第三层次分析( 无线上的掉话问题):1、参照第三层次分析(硬件或RF问题)中的所有项 2、查看历史Secondary Erlangs/(Primary Erlangs+Secondary Erlangs)的起伏情况,看是否 有变孤岛现象或太多切换比例(说明覆盖与其他扇区过多重叠,能否控制信号范围,尽 量控制过覆盖现象) 3、路测看能否通过调整天线参数来得到MRX与Ec/Io与超过门限的导频个数的最佳结果 (解决弱导频,深度覆盖及导频污染问题) 4、查看Intra-MSC Soft handoff Fail Rate,如果过高,查看原因,检查邻区表中各扇区的 Blocking Rate,看是否是因为BLOCKING难于切换到邻区 5、是否载频边界:查看是不是载频边界扇区,在第二载频上掉话率高,优化载频间切 换邻区表及控制第二载频覆盖范围与第一载频大致一致。
常见光传输设备故障原因及处理流程排除光传输设备的故障,最关键的一步是根据网管和设备架、板告警的具体情况,将光传输设备的故障点准确地定位到单站,这是维护人员在现场维护工作中必须牢固树立的观念。
我们都知道,光传输设备的故障定位的一般原则是“先外部,后传输;先单站,后单板;先线路,后支路;先高级,后低级”。
如何在实践中根据光传输设备的网管告警及利用仪表等,在最短时间内落实并处理故障,是每一位维护人员应该具备的业务素质。
1 从功能块告警流程图分析判断光传输设备的告警及原因(1)对于相邻两个网元,在网管上都有R-LOS、R-LOF告警,而没有MS-RDI、MS REI,说明光缆很可能中断,因为远端劣化指示和远端误码指示无法回传.(2)如果相邻两网元本端有R—LOS、R-LOF 告警,另一端有MS-RDI、MS REI,说明远端劣化指示和远端误码指示能够回传,可能是光纤单断或尾纤头脏、衰耗大,或本端收光板或对端发光板有故障.(3) 如果当前网元的东、西两个相邻网元都有相应的R-LOS和R-LOF,并且当前网元无法登陆,一般情况为当前网元掉电,造成两个方向光路不通。
2 单站中光传输设备的常见故障及原因2.1光传输设备的网元无法登录,ECC不通(1) 如果一个或部分网元无法登录,那么其原因可能是:(a)光路衰耗大,误码过量,导致ECC通路不通;(b)主控板故障;(c) SCC板ID拔码不正确;(d) 网元掉电、断纤。
(2)如果全部网元不能登录,则原因可能有:(a) 网管网元SCC主控板故障;(b) 网线、网卡故障;(c) 计算机IP地址和网关网元IP地址不正确. 2.2公务电话不通及其原因(1)如果在设备调测开通期间公务不通,原因可能有:(a)公务电话参数配置错误;(b)开销板配置不正确;(c) 光纤连接不正确。
(2)如果在运行中公务突然不通,原因可能有:(a)铃流板故障;(b) 公务电话损坏;(c)公务电话P/T和RING开关错误。
传输设备故障紧急处置预案1范围本预案规定了广东省粤泷发电有限责任公司发生传输设备故障紧急情况时应迅速采取的各种响应措施和步骤。
本预案适用于可能发生的传输设备故障紧急状态。
2规范性引用文件下列文件中的条款通过本预案的引用而构成为本预案的条款。
凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本预案,然而,鼓励根据本预案达成协议的各方研究是否可使用这些文件的最新版本。
凡是不注日期的引用文件,其最新版本适用于本预案。
中华人民共和国安全生产法电力生产安全工作规程Q/T9002-2006 生产经营单位安全生产事故应急预案编制导则国家电力监管委员会电力企业现场处置方案编制导则(试行)3 术语和定义传输设备:传送保护、通讯、电网自动化系统等数据信号的设备。
传输设备故障:由于传输设备电源、板卡、系统等问题造成的传输业务中断故障。
4 职责4.1 组织机构4.1.1 传输设备故障处理指挥机构。
传输设备故障应急处理指挥部,总指挥由生产副总经理担任;成员由生产经营部安生分部安全监察专责,生产经营部信息中心,维修部电气专责,电气班班长、电气班成员、运行部当值值长等部门人员组成。
4.2 职责4.2.1 生产副总经理职责生产副总经理是本公司安全生产直接责任人,应急预案的直接负责人,负以下职责:a)负责本公司事故现场的直接指挥,直接组织应急预案的实施;b)负责组织本公司应急预案、有关应急抢险技术方案、安全技术措施的制订和审核;c)负责督促检查、执行防灾抢险应急准备工作。
4.2.2 应急处理指挥机构具体职责具体有以下职责:a)负责组织、安排、协调各部门应急抢险工作;b)负责公司信息中心、电气班技术人员、物资及设备的组织调度,工作安排;c)负责现场的安全管理和技术支持;d)负责组织事故后恢复生产工作。
4.2.3 生产经营部安生分部安全监察专责职责生产经营部安生分部安全监察专责是本公司应急预案的安全监督管理人,负以下职责:a) 负责监督应急预案的制订和应急预案的修订;b) 负责组织应急预案的演练;c) 负责组织评估事故带来的灾情影响;d) 负责组织事故后的调查工作。
SDH 朗讯设备误码问题的分析与处理刘宝良中国联通唐山分公司运行维护部摘要:误码是维护工作中最常遇到的问题。
误码成因复杂,处理起来较困难。
在处理误码问题,首先根据误码分类及不同类误码间相互关系,在告警误码中分析确认最高阶误码,找到了最高阶误码,,通常就找到了解决问题钥匙。
然后我们在处理误码问题时,按照合理的流程、采用合适的处理方法,判断最高阶误码的成因,最后消除误码。
朗讯SDH 传输设备在河北联通干线传输网络中大量使用。
在对其维护过程中所遇到的各类误码问题是我们最常遇到问题。
不同的业务对误码的敏感度不同,如数据业务对误码的敏感性就强,而语音业务对误码的敏感性就弱。
当误码产生时,无论对各项业务是否产生影响,只要有传输误码出现,就说明传输系统可能已经发生性能劣化,需要进行分析,尽快处理,否则有可能演变成更严重的性能劣化,造成更大的通信故障。
现将同步传输中误码的分类及相互关系、误码产生的原因、误码问题的处理方法、误码处理的一般步骤及实例分别做以介绍,以便和大家共同探讨,共同提高维护朗讯设设备的技术水平。
一.误码的分类及相互关系1.误码分类。
光同步传输设备中,误码按分段分层的思想具体可分为:B1再生段误码、B2复用段误码、B3高阶通道误码、V5低阶通道误码。
其中B1、B2、B3是线路误码,由线路盘产生。
V5为支路误码,由支路盘产生。
2.误码之间的相互关系通常如果有高阶误码产生,则低阶误码会相随而生。
例如:如有B1误码,一般就会B2、B3、V5误码。
返之,如有低阶误码,不一定就有高阶误码。
如有B3误码,一般会有V5误码出现,但不一定有B1、B2误码。
其中误码由高阶向低阶排序为:B1、B2、B3、V5。
认清不同种误码间的相互关系,就可以在查找误码原因时直接对高阶误码产生的原因定位查找,从而减少查找环节,少走不必要的弯路。
例如当出现V5、B3两类误码时,应先定位查找B3误码产生的原因。
二.误码产生的原因误码产生的原因多种多样,错综复杂。
朗讯传输设备时钟盘故障处理实例
作者:李宏杰
来源:《电脑知识与技术》2010年第17期
摘要:在传输网络的维护中,时钟盘的故障会直接影响到网络的运行质量,该文以广州机房时钟盘故障为例,分析了故障产生的原因,提出了在以后维护工作中及时排查处理相关盘故障隐患的方法。
关键词:同步模式;时钟发生器;时钟频偏
中图分类号:TP393文献标识码:A文章编号:1009-3044(2010)17-4794-01
1 定时原理概述
WaveStar TDM10G系统使用一个时钟源同步上下电路和直通的传输信号。
定时源通常是锁定在一个外部参考信号之上,每个主机提供1+1不可恢复保护,主时钟发生器位于主机的框的低速部分,从时钟发生器位于主机框的高速部分,时钟发生器分配时钟信号,用于定时、帧同步和复帧同步。
在WaveStar TDM10G系统中的时钟同步有三种模式:自由震荡、保持模式、锁定模式。
自由震荡模式:在此模式下,当前时钟发生电路TMG/STRAT3没有锁定在外部定时参考源上、而备份的时钟发生电路仍然锁定在当前时钟发生电路上。
保持模式:如果所有定时参考失效,当前定时发生电路进入保持模式。
此模式下,当前定时发生电路记忆外部定时参考源最后的时钟频率并且保持在这个频率上运行,备份的时钟发生电路仍然锁定在当前时钟发生电路上。
如果定时参考源恢复,当前定时发生电路退出保持模式,恢复到原来正常的锁定模式。
锁定模式:TMG/START3时钟发生电路可以锁定在一个线路或一个支路时钟上,系统接受定时参考源的时钟用于同步传输单元盘。
TMG定时发生电路监视接收到的时钟信号是否有误码,如果发现时钟故障,则使用优先级较低的时钟,如果所有时钟参考都发生故障,则系统自动进入保持模式。
TMG时钟发生电路也可以锁定在一个外部网络时钟上,低速部分的当前时钟发生电路接收一个2.048MHZ的外部网络时钟输入。
时钟参考精度为Startum1等级,当前时钟发生电路将内部的Startum3等级时钟锁定在外部时钟参考信号上,高速部分的备份时钟发生电路和扩展机框中的时钟发生电路都具有Startum3等级的内部时钟,都同步于当前时钟发生电路。
然后时钟发生电路将时钟分配给机框里的各电路单元盘
2 故障现象描述
广州WaveStar TDM10G02网元系统脱管,现场用cit无法登陆,网元低速区(1-1子
框)TMG0,TMG1盘均红灯闪亮;
3 故障处理过程
从网管拷贝GZ10G02网元最新的数据库备份文件,带好两张备用的flash卡(数据库存储卡),抵达现场后,发现CIT不能登陆到设备,并且发现低速区的两块TMG盘告警灯均闪亮,该状态为系统未启动状态。
首先插拔低速区的CTL(主控)盘,重新启动系统;在系统启动过程中,CTL盘中flash卡不断在读卡,观察近30分钟,系统仍无法正常启动。
便利用CIT软件及数据库备份文件重新做flash卡,将新做flash卡插到CTL盘中,引导系统启动,15分钟后,系统启动正常,网元成功上联网管。
但网元上报1-1 TMG0 failure,1-1 TMG1 failure告警,即两块TMG盘同时失效,大量业务受到影响。
遂将10G01网元的备用的TMG1盘与10G02的TMG0做替换,10G02的TMG0盘启动成功后,业务恢复,10G01的TMG1盘仍上报failure告警,得出该盘存在故障。
4 故障原因分析
TDM10G设备共有四块TMG(系统时钟产生单元盘)盘。
其中低速区两块,一主一备,负责为系统提供振荡时钟;高速区两块,一主一备,负责为线路提供时钟。
当前R5.0.5版本软件中,当TMG输出给其它机盘的时钟频偏>15ppm时,TMG机盘将上报“TMG internal failure”。
在R3和R4等较早的软件中,实验室模拟测试显示TDM10G设备能够容忍的时钟频偏最大为50ppm。
通过历史告警查询,发现网元脱管前GZ10G02并无TMG机盘故障告警。
可以判断,TMG盘是在网元脱管后出现故障的,并且现场发现TMG红灯闪亮。
在网元脱管时,CTL状态异常,即使TMG时钟频偏>15ppm,也无法检测TMG盘故障,此时设备还可以正常工作,业务未受影响,推断此时TMG时钟处于逐步劣化中,但没有达到50ppm 。
当重新做卡引导系统正常启动后,系统检测到TMG时钟频偏>15ppm,上报“TMG internal failure”告警,导致业务中断。
根据长期的维护经验,CTL盘、FLASH卡故障通常是一个逐步劣化的过程,结合实际的网络维护情况,CTL盘、FLASH卡故障可以通过一些日常的维护提前发现,比如经常数据库备份,如果备份不成功,就可能是CTL或FLASH卡故障引起,就可以提前处理。
5 结束语
基于上述分析,为更好的保障网络安全,将风险降到最低,在配置有交叉、时钟或主控板等单板的主备保护时,需定期查看单板保护状态,检查当前的工作主板是否为当初设定的主板。
对于已经自动发生了主备倒换的单板,需要检查当前的备板工作是否正常。
无论是否有新的数据加载,定期必须对TDM10G网元数据库备份。
此操作可以提前发现CTL和FLASH卡的故障。
为降低此类故障对客户业务的影响,建议处理脱管故障安排在晚上进行。
保证FLASH卡备件充足,且可用。
参考文献:
[1] 李履信,沈建华.光纤通信系统[M].2版.北京:机械工业出版社,2007.
[2] 王延恒,贺家礼,徐刚.光纤通信技术及其在电力系统中的应用[M].北京:中国电力出版社,2006.。