动力环境监控系统及其故障分析与处理doucin
- 格式:doc
- 大小:53.50 KB
- 文档页数:7
监控系统故障的解决方法(一)在一个监控系统进入调试阶段、试运行阶段以及交付使用后,有可能出现这样那样的故障现象,如:不能正常运行、系统达不到设计要求的技术指标、整体性能和质量不理想,亦即一些“软毛病”。
这些问题对于一个监控工程项目来说,特别是对于一个复杂的、大型的监控工程项目来说,是在所难免的。
1. 电源的不正确引发的设备故障。
电源不正确大致有如下几种可能:供电线路或供电电压不正确、功率不够(或某一路供电线路的线径不够,降压过大等)、供电系统的传输线路出现短路、断路、瞬间过压等。
特别是因供电错误或瞬间过压导致设备损坏的情况进有发生。
因此,在系统调试中,供电之前,一定要认真严格地进行核对与检查,绝不应掉以轻心。
2. 由于某些设备(如带三可变镜头的摄像机及云台)的连结有很多条,若处理不好,特别是与设备相接的线路处理不好,就会出现断路、短路、线间绝缘不良、误接线等导致设备的损坏、性能下降的问题。
在这种情况下,应根据故障现象冷静地进行分析,判断在若干条线路上是由于哪些线路的连接有问题才产生那种故障现象。
这样就会把出现问题的范围缩小了。
特别值得指出的是,带云台的摄像机由于全方位的运动,时间长了,导致连线的脱落、挣断是常见的。
因此,要特别注意这种情况的设备与各种线路的连接应符合长时间运转的要求。
3. 设备或部件本身的质量问题。
从理论上说,各种设备和部件都有可能发生质量问题。
但从经验上看,纯属产品本身的质量问题,多发生在解码器、电动云台、传输部件等设备上。
值得指出的是,某些设备从整体上讲质量上可能没有出现不能使用的问题,但从某些技术指标上却达不到产品说明书上给出的指标。
因此必须对所选的产品进行必要的抽样检测。
当确属产品质量问题,最好的办法是更换该产品,而不应自行拆卸修理。
除此之外,最常见的由于对设备调整不当产生的问题。
比如摄像机后截距的调整是个要求非常细致和精确的工作,如不认真调整,就会出现聚焦不好或在三可变镜头的各种操作时发生散焦等问题。
动力源监控箱故障处理作者:段沄来源:《学校教育研究》2017年第22期【关键词】动力源开关电源【内容摘要】某晚接班时间,微波机房DUM-48/50B动力源系统红灯告警,监控箱上各按键均无反应,经检查确定为监控箱故障,对播出无影响。
随后我们对其进行了维修,发现系开关电源内部TL3845P芯片损坏引起,找到与其性能一致的TL3845P芯片替换后,系统恢复正常。
一、故障现象1月22日18时30分,微波机房DUM-48/50B动力源系统红灯告警,按动监控箱控制面板上各按键均无反应,显示屏黑屏,四个DZY-48/50B电源模块黄灯报警,但各路微波信号源传输正常。
二、处理过程经检测发现四个48V电源模块虽告警,但显示的输出电压、电流数据均正常,测量电池组输出总电压也正常。
在微波总站的指导下,通知各机房切换备用信号源后,我们重启了动力源系统,故障依旧存在。
随后我们切断了动力源系统电源,打开后柜门,取下控制箱,此时用48V蓄电池组对其供电,万用表测量控制箱开关电源输入数据,发现输入即为额定需要的直流48V,由此确定为监控箱故障。
由于临近重要播出时段,且微波信号未受影响,我们决定先断开监控箱,等总站寄来新监控箱,重要播出期后再更换。
此时重新开机,通知各机房切回主信号源,并要求值班员加强巡机,时刻注意四个49V电源整流显示的输出电压、电流数据。
2月14日,收到总站寄来的监控箱,我们利用周二停机检修的时间,取下监控箱,首先更换了监控箱的开关电源,安装完好后开机,监控箱显示的各项数据均正常,告警解除,系统恢复运转。
重要播出期结束后,我们将损坏的电源块安装到备用监控箱中,通以48V直流电,测量得监控箱内输入电压正常,+9V、+5V、+12V、-15V四路输出均无电压,初步断定故障出在电源公共部分。
用万用表顺着线路走向逐步检查,发现电路在芯片TL3845P后断开。
开关电源大致可分为两部分,即为开关变压器的初级部分和次级部分,集成块TL3845P属于初级部分,它本身有震荡、取样、稳压、比较等多种功能,因此我们怀疑为TL3845P集成块内部故障。
动环监控故障处理及要求1.设备本身故障:A.先在监控设备上的DC48接线端子上测有无DC48V,如无则检查直流线是否接好?是否有断路现象。
如还无电压则测量开关电源上的空开两端是否有电源,观察空开是否关闭;B.检查监控主板上的保险管(0.5A)是否熔断:直流电源线是否接反;主板线路有无被高压击断的痕迹。
C.若加不上保险则检查有无短路之处,若没有则应更换主板。
2.交流断电告警指三相交流电源断电,有以下原因造成:交流停电;交流传感器线断;交流传感器未给信号;设备不能上传信号。
排除方法:应检查交流传感器到告警箱的线是否接对或有没有断线,FSU至BTS的引线是否接对或是否断线;如以上都没问题,应更换主板。
3.开关电源设备故障指开关电源设备本身故障,有以下原因造成:开关电源设备本身故障;设备不能上传信号。
排除方法:应检查开关电源到告警箱的线是否接对或有没有断线或其模式是否选对,FSU到BTS的引线是否接对或是否断线;如以上都没问题,则应更换主板。
4.空调故障告警指空调本身故障,有以下原因造成:空调本身故障;设备不能上传信号;排除方法;应检查空调到告警箱的线是否接对或有内有断线或其模式是否选对,FSU到BTS的引线是否接对或是否断线;如以上都没问题,则应更换主板。
5.处理地水告警:先检查地水是否为误告警,主要有几点:首先看地上是否真的有水,再看水禁探头有无氧化或短路现象,若有就更换水禁探头;其次在看房子是否真的漏水。
若以上两种情况皆无,那就需更换主板。
完毕之后必须保证告警准确上传并与机房进行核对.否则扣除绩效5分。
6.处理烟雾告警:先检查烟雾是否有告警,若有先在监控主板上按下烟雾清除按钮,看烟雾能否正常消除。
若不能正常消除则要更换烟雾探头。
测试烟雾探头好坏可以这样做,点上一只烟对准烟雾探头吹烟,看烟雾探头上的红灯是否点亮,若亮则烟雾探头是好的,否则烟雾探头是坏的需更换。
烟雾探头的连接线必须认清正负极。
完毕之后必须保证告警准确上传并与机房进行核对.否则扣除绩效5分。
动力环境监控系统及其故障分析与处理d o u c i n标准化管理处编码[BBX968T-XBB8968-NNJ668-MM9N]动力环境监控系统及其故障分析与处理摘要本文首先对动力环境监控系统架构进行描述,着重阐述在实际运用中的组网传输方式,定义监控的对象;然后以实际的案例分析为基础,探讨如何运用不同的方法去解决故障问题。
关键词动力环境监控、故障案例分析、处理方法随着移动通信事业的飞速发展,对通信机房的电源动力和环境指标的要求不断完善,通信电源和空调的作用越来越重要,对通信机房动力环境集中监控系统的要求亦愈发严格。
良好的机房动力环境监控系统不仅可以及时上传代表机房动力指标和环境质量的各类数据,反映实时的告警信息,更可以方便维护人员进行后续故障排查处理并对特定的数据信息进行有效分析。
既可以达到对突发事件的及时响应,也能指导今后的实际工作。
通信机房在动力环境监控方面的根本需求和特点是需要首先掌握的,这是开展工作的前提条件。
而工作的目的则是及时解决问题并在今后的工作中作为理论依据加以分析研究。
1.监控对象从维护人员的视角出发,对监控对象的特性可以基本分为三类:按用途分类、按电特性分类、按性能分类。
按用途分类可以分为通信动力系统监控和通信环境系统监控。
其中通信动力系统包括高压配电、低压配电、开关电源、交流稳压器、UPS、整流器和蓄电池组等动力设备,通信环境系统包括机房用精密空调、门禁系统、温湿度、红外、烟雾、水浸、动态图像等环境量。
按电特性分类又可以分为两部分,除了按电量和非电量区分,也能按数字量和模拟量区分。
对于非电量,需要经过特定的传感器将非电物理量转换成适合采集设备的电信号,然后接入数据采集设备;对于电量,则通过变送器将其转换为适合采集设备输入范围的电信号。
而信号量与模拟量的区别在于,模拟量是随着时间轴连续变化的,数字量是时间和信号均为间断的,仅由“0”和“1”两种状态表示的。
按性能分类可以分为智能设备和非智能设备。
动力环境监控系统解决方案机房动力环境集中监控系统随着计算机的发展和普及,计算机系统数量与日俱增,其配套的环境设备也日益增多计算机房已成为各大单位的重要组成部分。
机房的环境设备(供配电、UPS、空调、消防、保安等)必须时时刻刻为计算机系统提供正常的运行环境。
因为,一旦机房环境设备出现故障,就会影响计算机系统运行,造成数据传输或存储故障,当严重事故时会造成机房内计算机设备报废,现场电脑长时间瘫痪,后果不堪设想。
机房环境监控系统就是通过分布在各机房内和设备中的传感器搜集数据。
对会影响系统运行的因素,包括各种设备,如:UPS电源、交流稳压电流、发电机组、机房专用空调机组等的工作是否正常,机房的环境(温度、湿度)、火警报警系统、机房内的水害和安全防卫措施(门禁系统、电视监控系统)纳入网络管理范围。
在监控网络中,操作者设定所需监测的温度、湿度、压力、电压、电流等监测数据的正常值,当某一部分某个参数的输入值超出设定的正常范围,监控系统就会发出报警信号,提醒操作者注意,使其及时采用相应的措施。
根据电脑部计算机房的实际情况,我们建议,其纳入环境监控系统管理范围的项目:UPS主机的运行状态;机房配电系统;机房恒温、恒湿专用空调的运行状态;机房内所有机柜内部的状态;机房主要工作区域内的温、湿度控制;SDE自动气体灭火系统;机房内水害报警。
极早期火灾预警系统;被监控设备类主要内容监控测点的选取本着经济实用、重点监控及测点不重复的原则,并参考用户实际需求。
部分设备参量的监控对用户的设备有要求,在用户的设备没有达到监控要求时,不予进行监测。
(一)APC智能UPS通过APC UPS提供的RS232智能接口,接入到PSMS监控系统,可读取UPS的所有信号,如输入电压、电流,输出电压、电流等等诸多信息;(二)智能空调通过Emerson精密空调提供的RS485智能接口,可读取空调协议提供的所有信号,并可通过协议控制空调的状态及各种运行参数;(三)机房环境主要用于监视机房内温湿度,本方案利用智能空调所带监测温湿度功能监视机房温湿度,但其范围有所限制(空调回风口处);若需要真正监视机房内的温湿度,建议选择工业标准的4-20mA型温湿度传感器,接入到IDU 采集器处理;对空调漏水进行检测,配置水浸传感器;(四)极早期火灾预警系统对重要机房(UPS间、设备间),安装主动式极早期火灾预警系统,主动抽取空气分析火灾隐患,提前2-14小时发现隐情,保障机房安全。
动力环境监控系统及其故障分析与处理摘要本文首先对动力环境监控系统架构进行描述,着重阐述在实际运用中的组网传输方式,定义监控的对象;然后以实际的案例分析为基础,探讨如何运用不同的方法去解决故障问题。
关键词动力环境监控、故障案例分析、处理方法随着移动通信事业的飞速发展,对通信机房的电源动力和环境指标的要求不断完善,通信电源和空调的作用越来越重要,对通信机房动力环境集中监控系统的要求亦愈发严格。
良好的机房动力环境监控系统不仅可以及时上传代表机房动力指标和环境质量的各类数据,反映实时的告警信息,更可以方便维护人员进行后续故障排查处理并对特定的数据信息进行有效分析。
既可以达到对突发事件的及时响应,也能指导今后的实际工作。
通信机房在动力环境监控方面的根本需求和特点是需要首先掌握的,这是开展工作的前提条件。
而工作的目的则是及时解决问题并在今后的工作中作为理论依据加以分析研究。
1.监控对象从维护人员的视角出发,对监控对象的特性可以基本分为三类:按用途分类、按电特性分类、按性能分类。
按用途分类可以分为通信动力系统监控和通信环境系统监控。
其中通信动力系统包括高压配电、低压配电、开关电源、交流稳压器、UPS、整流器和蓄电池组等动力设备,通信环境系统包括机房用精密空调、门禁系统、温湿度、红外、烟雾、水浸、动态图像等环境量。
按电特性分类又可以分为两部分,除了按电量和非电量区分,也能按数字量和模拟量区分。
对于非电量,需要经过特定的传感器将非电物理量转换成适合采集设备的电信号,然后接入数据采集设备;对于电量,则通过变送器将其转换为适合采集设备输入范围的电信号。
而信号量与模拟量的区别在于,模拟量是随着时间轴连续变化的,数字量是时间和信号均为间断的,仅由“0”和“1”两种状态表示的。
按性能分类可以分为智能设备和非智能设备。
非智能设备没有数据采集和处理的能力,需要通过采集器采集数据再接入监控系统。
智能设备本身具有一定数量的传感器和变送器,可以进行数据采集和处理,通过其智能设备协议规范,由智能接口直接与监控系统进行通信。
一般在实际应用中,选择以下四种性质的参数进行监控:遥测量(AI)、遥调量(AO)、遥信量(DI)、遥控量(DO)。
对于监控系统,AI/AO代表模拟信号的输入/输出,DI/DO代表数字信号的输入/输出。
在通信机房里,动力环境监控的实体对象有:高/低压配电、交流配电屏、整流屏、直流配电屏、蓄电池组、逆变器、UPS、精密空调、环境指标、门禁系统、动态图像等。
2.传输方式动力环境监控系统的传输资源比较丰富,可以根据实际情况采用不同的传输介质和组网方法。
在实际应用中,主要使用了2M资源和数字公务通道。
2M资源又称为E1线路,是基于公司现有传输设备,诸如SDH提供。
2M线路将一个2048kbps的比特流分成32个64kbps的通道,每个通道就是1个时隙,由0到31编号,其中的0时隙作为交换机之间同步用,其余的时隙则用来承载其他业务。
利用时隙分接复用设备可以将2M(E1)线路按照不同的时隙分成若干通道提供给多个设备使用,这大大提高了数据传输的能力。
数字公务通道提供V.11接口/标准的RS232接口/RS422接口,可以直接使用。
3.组网方式动环监控系统采用E1接入设备的2M组网方式,由图1所示。
图1 监控组网方式这种方式的主要优点在于传输可靠,若有监控动态图像传输的话,其传输实时图像的效果比较好(实时图像对带宽的要求比较高,模拟图像数字化后大约有100M,经过压缩可以达到384K~2M之间)。
在端局,我们使用了前置机下挂不同总线,进而在每条总线下连接MISU,EISU,BMU,HVBMU等,对机房的动力环境进行全面监控。
前置机系统作为网管系统数据采集的核心,集中管理采集模块,前置机的工作方式是以总线为单位扫描数据,每条数据扫描总线可以并行独立地工作。
根据端局的物理位置,可以进行优化处理,比如一台前置机可以接入一个较大的区域里所有的采集分析设备。
通过SDH/PDH线路进行传输,将端局的监控参数体现在业务台并存储于数据库服务器内。
通过业务台,工作人员就可以方便查询到整个系统的详细情况。
监控系统的及时数据上传,告警准确反映,报表查询统计,动态图像管理等都可以在监控业务台直观地展现。
4.故障处理及案例分析客观地说,设备在运行过程中出现故障和告警是难以避免的,尤其是突发性的故障。
维护人员除了需要规范完成日常和周期性的例行维护之外,还必须掌握对于突发性故障和告警的维护处理办法。
这就要求在业务技能方面和操作规范方面都有较强的能力,这样就可以做到尽快消除故障和隐患,以便用最短的时间恢复设备的稳定运行,保障机房动力环境指标。
故障处理的基本方法是将造成故障可能的原因汇总,在一个大集合内分解成若干小的子集,把复杂问题一步一步简单化,排查定位后采取适当的方法解决故障,流程如图2所示。
图2 故障处理流程遵循以上的故障处理流程,根据不同的问题采用具体的方案,就可以快速准确地判断故障原因,找出故障点,最后解决故障问题。
下面根据不同案例的分析,进行初步的探讨。
4.1逐步排除法故障产生的原因十分复杂,但是,在统计学上分析,各种因素同时作用并导致设备发生故障的概率是很小的,而设备故障成因在某一具体时刻具有单一性。
因此,在处理实际故障告警时,利用逐步排除法可以大大缩小故障范围,加快故障定位。
案例1:动环监控显示某汇接机房出现B相电压欠压告警。
工作人员赶到现场后,发现HC6000表所示B相电压为200V。
由于机房其他设备均运行正常,并且实测三相供电电压正常,所以怀疑是HC6000表出现故障。
现场使用万用表测量表内端点的电压情况,实测数据显示B相电压为200V,与监控系统数据一致,故排除是由HC6000表故障造成。
用万用表测量为HC6000表供电端三相电压,显示正常。
排除总闸到一次侧之间线路有问题。
继续测量二次端,发现B相电压为200V,则断定故障点在二次侧。
再仔细观察,发现二次侧的线路被进线管压迫,可能造成线路端子虚接。
将端子紧固之后,HC6000表B 相电压恢复正常,故障处理完毕。
4.2替换法在监控系统中,不管采取什么样的组网方式和使用多么复杂的设备,我们都可以将各个组成部分单独处理。
当设备出现故障或告警的时候,模块化的组织结构可以让工作人员很便利地更换故障部件,快速解决故障问题。
只要有多余的正常备件,工作人员就可以用之替换怀疑有故障的模块,如果问题得以解决,则说明是模块确实产生故障。
案例2:动环监控显示某汇接机房门禁无法正确上传开关门数据。
工作人员现场测试,发现开关门和门禁电源均正常,怀疑门禁控制器上传数据出现故障。
现场更换一套新的门禁控制器,所有监控量恢复正常。
案例3:动环监控显示某通信枢纽交换机房MISU数据无法正常上传。
工作人员到达现场后,测试出MISU-S板件电源模块故障。
更换一套新的MISU-S集成电路板,检查核对地址拨码,连接各走线后上电运行。
将PC连接MISU-P板读数据正常,电源模块温度正常,MISU恢复正常运行。
4.3对比法在整个监控系统中,受控设备的种类很多,但是每一种类的设备数量也是很多的,所以可将故障设备与正常设备之间做全面的对比,从数据配置到实际安装进行比较,然后分析解决故障。
案例4:动环监控显示某通信枢纽电力机房1#温湿度传感器高温告警。
工作人员到达现场,用温湿度测量仪进行测量,机房温湿度指标合格,说明故障原因是1#温湿度传感器造成。
查看数据配置,对比机房内同样类型的2#温湿度传感器配置,发现这两个温湿度传感器均为电流型,但是1#在配置选项上设置为电压型,更改后温度显示正常。
4.4解析法监控系统中,主控设备与受控设备之间的信息传递依靠两者之间透明的通信协议,在有些情况下,机房设备制造商的协议无法准确区分不同的告警量,所以工作人员必须在故障发生的时候通过经验和搜集到的信息做出合理的判断,将一个混合的信息解析为一个单一的信息,准确定位故障点和故障原因。
案例5:动环监控显示某通信枢纽IT机房3#精密空调2#压缩机高压告警。
工作人员现场检查该精密空调2#压缩机两侧吸排气压力,发现压力值并不高,反而出现压力值偏低,首先可以排除真正的高压告警。
进一步测试压缩机温度,确定吸气温度过高。
联系厂家工程师后,确认在该品牌精密空调,压力信号和温度信号是串联的,统称为高压告警,所以实际上这是一个温度过高告警。
那这是为什么造成的呢?因为在精密空调制冷过程中,如果制冷剂偏少,可能会造成压力降低,这时在压缩机吸气口的温度就会相应上升,所以会产生此处的高温告警。
工作人员仔细检查精密空调制冷环路,发现在回气口处针阀形变产生制冷剂泄漏。
更换新的针阀后充入适量的制冷剂,系统重新恢复正常,设备运行稳定。
4.5理论指导法在监控系统的安装调试过程中,由于系统纷繁复杂,难免会出现小的疏漏,并可能导致在工作中出现各种不准确的监控数据,严重的甚至产生误告警。
如果出现这样的情况,工作人员应当及时记录案例,寻求合理的解决方案,在理论上建立正确的体系,便于指导以后的工作。
案例6:动环监控系统显示某通信枢纽IDC机房1#温度数据与其他温度数据相差过大,不具有代表性。
现场勘察后,发现1#温湿度传感器安装位置不合理,处于设备散热出风口正对位置,更换合理的安装点后数据能正确代表机房环境量。
通过理论分析得知,温湿度传感器的安装应当尽量避免设备出风口,精密空调出风口和风路死角等位置,这样才能获得一个稳定的具有代表性的温湿度数据。
同样的道理,机房水浸传感器应当避免处于布线沟道的最下方而受到潮气的干扰产生告警。
在集中监控系统中,在数据库的支持下,工作人员可以方便地对设备运行情况进行汇总和统计,在报表业务台上可以得到清晰的周期报表和曲线图。
这使得我们可以在宏观上随时掌握整个系统的运行状况,因而在查询周期内发生的变化也可以得到直观的反映,甚至可以在故障和告警发生之前就及时发现问题,防范险情于未然。
5.总结在环境能源问题十分突出的今天,中国移动天津公司积极响应国家号召,在各个方面采取措施节能减排,采用动力环境集中化监控的根本目的是为了提高设备的维护管理质量,降低系统设备维护成本,提高整体工作效率,实现节约人力成本和能源消耗。
我们需要深入监控系统的系统架构,在宏观的组网与分配和微观的设备信号采集点都要有足够的理解,依靠所掌握的大量信息分析故障告警,优化监控中存在的各种问题。
实际工作中遇到的问题千变万化,只有不断丰富知识,积累经验,总结教训,才能在维护中合理解决故障告警,保障通信设备和环境指标正常稳定。