当前位置:文档之家› 服务器维修故障诊断思路大全

服务器维修故障诊断思路大全

服务器维修故障诊断思路大全
服务器维修故障诊断思路大全

前言:

相对PC机而言服务器出故障的机率是小多了,但是它的故障给企业也带来了一些影响。作为服务器工程师除要有服务器基础知识以外,还需要具备服务器故障的诊断思路,这样才能最快速的解决问题也可以减少故障停机时间。

本文并不是针对某个厂家服务器故障完全手册,而是根据个人经验总结出来的一些经验思路还有一些总结案例。按照下面思路和方法基本上能够解决目前服务器更换式维修的大多数问题。而且里面的一些操作风险性也不是很大,因为服务器本身就是坏的,最坏的情况下就是它一点都不能工作了呗,(主要确认是否有数据,数据无价啊)而且现在很多厂商都有自己的客服电话关于产品问题打个电话也很方便,所以安心做啦

当然如果服务器在保修期内就打电话让售后工程师上门服务,毕竟顾客就是上帝嘛,但是如果上帝比较着急使用,一般小故障自己解决一下就好了,因为一般报修最快都是第二天(大客户如银行等除外,一般当天还得是晚上才能停机解决)

目录:

一、服务器常见故障分类

二、服务器常见故障现象及其对应排错方法

三、服务器排错基本原则

四、服务器故障需要收集哪些信息

五、服务器硬件故障排错实例

六、服务器软件故障排错实例

七、服务器常见内存故障现象

一、服务器常见故障类型分类:

A. 开机无显示

B. 加电BIOS自检阶段故障

C. 系统和软件安装阶段故障和现象

D. 操作系统启动失败

E. 系统运行阶段故障

二、服务器常见故障现象及其对应的排除方法

A.服务器开机无显示(加电无显示和不加电无显示)

1. 检查供电环境

2. 检查电源和故障指示灯(故障指示灯状态,目前很多厂商的服务器都有故障指示灯,或故障诊断卡等。)

3. 按下电源开关时,键盘指示灯是否亮、风扇是否全部转动

4. 是否更换过显示器,尝试更换另外一台显示器

5. 插拔内存,用橡皮擦擦拭一下金手指,如果在故障之前有增加内存,去掉增加的内存尝试

6. 是否添加了CPU,如果有增加CPU尝试去掉

7. 去掉增加的第三方I/O卡包括Raid卡等

8. ClearCMOS (记得使用跳线来清除,尽量不要直接拔电池,每款服务器清除跳线位置不一致,具体找不到电话联系一下厂商客服)

9. 尝试更换主板、内存等主要部件

10.清除静电,将电源线等外插在服务器上的线缆全部拔掉,然后轻按开机键几下

B.加电BIOS自检报错

1. 根据BIOS自检报错信息提示

2. 查看是否外插了第三方的卡或者添加部件,如果有还原基本配置重启

3. 做最小化测试

4. 尝试清除CMOS

5. 看能否正常进入BIOS

C. 系统安装阶段故障和现象

1.查看服务器支持操作系统的兼容版本(从厂商能查到兼容性列表)

2.系统安装蓝屏(对蓝屏故障代码诊断)

3.安装在分区格式化的时候找不到硬盘

(阵列驱动没有安装或者没有配置阵列,可以尝试适应引导光盘安装)

4.大于2T的硬盘式应该如何分区(必须使用阵列卡才能实现或者有外插识别卡)

(使用阵列卡配置阵列分成一个小于2T的空间,一个大于2T的空间,然后将系统安装在小于2T的上面,安装好系统后在使用GPT方式分区即可)

5.安装过程是死机

(检查兼容性列表---查看硬盘接口选择是否正确---阵列驱动安装是否正确---尝

试最小化配置安装检查是否为内存和CPU等问题)

6.引导光盘安装失败

(使用引导光盘安装失败,查看引导光盘版本是否匹配,尝试手动安装系统,如有阵列重新配置阵列引导安装)

D. 操作系统启动失败

1.在系统启动自检过程中有报错(具体查看启动报错信息在定方案)

2.启动系统蓝屏(查看蓝屏代码核对)

3.进入登陆界面死机(查看进入单用户或者安全模式是否正常,进入BIOS是否正常、是否会死机,进入磁盘阵列查看阵列状态是否正常,检查测试硬盘是否有坏道,最小化配置启动)

4.忘记密码 (windows 使用PE 破解,linux 进入单用户破解)

E. 系统运行阶段故障

1.安装数据库等应用软件报错(对系统版本和软件版本是否兼容,查看报错信息是否缺少插件)

2.系统运行速度变慢(查杀病毒,检测阵列状态,测试硬盘有无坏道,重新安装系统或者修复)

3.运行蓝屏(查看蓝屏代码目录)

4.运行死机(检查进入BIOS是否死机,进入系统后测试部件温度是否正常,windows系统查看dump文件)

5.硬盘拷贝数据文件速度变慢 (测试硬盘是否有坏道,如果有阵列检查阵列状态,检查改变条带大小,与软件应用要求测试对比)

三.服务器故障排错的基本原则:

1. 尽量恢复系统出厂配置

a:硬件配置:去除第三方厂商备件和非标配备件

b:资源配置:清除CMOS、恢复资源初始配置

c: BIOS、F/W、驱动程序:升级最新的BIOS、F/W和相关驱动程序

d: TPL:扩展的第三方的I/O卡是否属于该机型的硬件兼容列表(TPL)

2. 从基本到复杂

a:系统上从个体到网络:首先将存在故障的服务器独立运行,待测试正常后再接入网络运行,观察故障现象变化并处理。

b:硬件上从最小系统到现实系统:指从可以运行的硬件开始逐步到现实系统为止。

c: 软件上从基本系统到现实系统:指从基本操作系统开始逐步到现实系统为止。

3. 部件交换对比测试

a:在最大可能相同的条件下,交换操作简单效果明显的部件

b:交换NOS载体,既交换软件环境

c:交换硬件,既交换硬件环境

d:交换整机,既交换整体环境

总结:

在服务器的维修中,线索都会显得扑朔迷离,有的甚至按起葫芦翘起瓢。一般来说不可能一次就可以准确地判断出问题的所在。这样就要求工程师要有信心和耐心。出现错误一般的方法都是根据经验优先使用最简单排错方法测试,如果没有解决问题再找其它因素进行测试。总之,服务器出错后必须一步一步解决,没有捷径可言。

四、服务器故障排除需要收集哪些信息

1.服务器信息:

①. 机器型号: 什么厂家的机器、什么型号如:DELL R720服务器

②. 机器序列号或主机编号(如:主机编号为NC00755666)

③. 是否增加其它设备,如网卡、Raid 卡、内存、CPU等

④. 硬盘配置,如是否做磁盘阵列, 阵列级别

⑤. 安装什么操作系统及版本(win2003、Redhat等)

⑥. 在故障前有没有做过操作、或者运行了什么软件

⑦. BIOS 版本

2.故障信息:

①. 在POST自检时,屏幕显示的异常信息

②. 服务器本身指示灯的状态

③. 报警声和BEEP CODES

④. 系统的事件记录文件

⑤. Sel 日志

五、服务器硬件故障处理实际案例(因厂家机型不同,在实际问题中如果遇到相似现象,也需要具体问题具体分析,请不要盲目套用)硬件故障是指服务器硬件出现异常而导致的各类错误,由于服务器构成比较复杂,因此在检查的时候必须认真、仔细。

实例一:

有一台XXX型号服务器,配有256M内存,使用一个PIIIXEON 500带2M高速缓存的处理器。

开机后没有任何显示,但系统日志上提示了一条CPU电压为0伏的信息,系统指示灯三灯不停在闪烁(指示灯三灯闪烁是服务器的另一种报警方式,我会在文后说明)。这种错误一般是处理器电压调节模块(VRM)出错或CPU出错或CPU与CPU板块接触不良,但也可能是CPU 板块出错,这时情况就比较复杂了,必须经过认真慎重的思考。

因为CPU板块在整个服务器中,占有举足轻重的地位,如果它出错服务器是会报致命错误的,并且在系统日志中会提示致命错误,但报CPU电压报错的情况也有5%左右。我们立刻把CPU调换在另一CPU插槽中,开机后依然是刚才的那种故障。所以在初步判断中,可以排除是CPU板块坏。这时取出CPU仔细擦拭金手指,以及CPU板块中与CPU接触的地方后,开机依然无显示。相对处理器坏的情况来说处理器电压模块(VRM)出现故障的情况比较大。于是立即在另一台同型号服务器中取下一个处理器电压模块,安装在此服务器中。开机后,服务器依然没有任何显示,系统日志上依然提示CPU电压为0伏的信息,系统指示灯三灯依然不停在闪烁。这时的情况就比较明显了。于是立即从另一台同类型服务器中取下一个CPU 安装后,开机正常。

实例二:

有一台XXX型号服务器不显示,发现开机时系统日志没有任何信息,且系统指示灯不亮。初步判断是电源方面出现了错误。经过仔细检查,发现服务器的电源是正常的,因此最大的可能就是服务器的电源管理板出现故障。更换电源管理板后,开机显示正常。但这时,新的问题来了:自检时,用CTRL+M不能检测到硬盘。

硬盘在别的服务器上是正常的,因此立即清除此服务器的CMOS,但依然不正常。立刻上网找到此服务器的最新BIOS,升级BIOS后也不能解决问题。又检查硬盘笼子和服务器里的数据线及电源线后依然出错。这时,一般情况会怀疑是服务器的I/O板(输入输出板块)有问题。但就在这个时候,工程师发现在I/O板上有一个非XXX型号服务器标配的旧式网卡,立即去除此网卡后服务器就一切正常。

硬件故障并不单单指硬件有问题,它也指硬件之间不兼容。因为服务器的正常运作需要各部件之间的大力协调。建议大家在采购各元件时,都采用同一品牌原装的,并且要采用能发挥服务器性能的元件(上例中的旧式网卡即使正常也会严重影响服务器性能),这样才不会发生莫明其妙的故障。

实例三:

用户需要把他的XXX型号服务器升级到双网卡,我建议他购买原装网卡,但当他看到XXX型号服务器的网卡是采用的INTEL 82559芯片后,断然决定不使用原装网卡而采用另一品牌也采用INTEL 82559的网卡。过了几天,他打电话给我说,他的新网卡不能使用网络冗余及数据校验,并怀疑服务器有问题。工程师带了一个INTEL 82559网卡到用户那里,仔细检查了服务器的环境完全正常后,把INTEL 82559网卡安装到机器上后一切正常。这个例子更加说明了,要发挥服务器的最大性能及功能,必须使用原品牌原装的配件。非原品牌非原装的配件,不能支持服务器的某些功能,严重的会影响到服务器的正常使用。

要避免硬件故障发生频率,服务器管理人员必须注意服务器的使用环境完全正常。比较重要的服务器必须在恒温、恒湿的环境;电压也要符合,不仅要采用UPS,还必须接地线,必须是左零线、右火线,零地电压在1~3伏。在开、关服务器上必须符合正常的流程。工作人员必须严格执行操作流程。

实例四:

服务器故障现象:

一台XXX型号服务器,近期频繁出现几次蓝屏幕死机故障。趁死机关闭的机会,

将内存由原来的128M升级到512M(普通内存),并且在系统CMOS设置中选择装入(Load)最优参数设置,对内存每个单元进行检测。怪异服务器故障出现了,当我开机后,内存检测正常,但是屏幕提示须重新SETUP,按指定的[F2]键后却死机。我装个内存条招谁惹谁了,怎么会死机?而且内存检测正常啊?

服务器故障处理:

服务器出了故障就要解决,哪怕是怪异服务器故障。按照缩小故障源的思路,换回原来的内存条,逐步去掉各个部分(软驱、硬盘、光驱等),可是这个怪异服务器故障依然存在。分析可能与系统SETUP设置有关,特别是关于对内存每个单元进行检测的设置。于是,拔出电池,对电池插脚短接放电,没有奏效。看来,这个怪异服务器故障还真是顽固。后来,找到主板清除CMOS跳线设置,将插脚线由1-2改到2-3一会儿,然后恢复原位,开机正常(提示:不要轻易拔出电池,而是要找CMOS清除跳线)。再次将内存升级,调整CMOS SETUP 设置,特别注意到对内存的检测,设置为检测到每兆,至此系统完全恢复正常。

服务器故障经验

这个怪异服务器故障发生的根本原因是服务器的内存缺省设置为ECC(带校验),由于使用普通不带校验的内存,而系统中设置每个单元都进行检测,所以导致了上面的故障。排除的方法是清除CMOS设置,调整有关参数设置。另外CMOSSETUP装入最优参数设置通常有2种:一种是BIOS优化参数,这种参数稳定性最好;另一种是SETUP优化参数,优化整个系统,但是需要系统支持,其稳定性不能保证最好。所以,当系统出现故障时,不妨先将稳定性最好的参数装入,解决问题后再行

实例五:

一台XXX型号服务器使用8708E的raid 卡在读取某个文件或运行某个软件时经常出错,或者要经过很长时间才能成功,其间硬盘不断读盘并发出刺耳的杂音,这种现象意味着硬盘上载有数据的某些扇区已坏。

一旦硬盘有比较刺耳的杂音可以尝试使用HD软件来测试硬盘时候有坏道,进入ctrl+H 配置界面进行查看,阵列是否降级

六、服务器常见软故障解决思路与实例

服务器软件故障是在服务器故障中占有比例最高的部份,约占70%,解决的过程必须更加深思熟虑。导致服务器出现软件故障的原因有很多,最常见的是服务器BIOS版本太低、服务器的管理软件或服务器的驱动程序有BUG、应用程序有冲突及人为造成的软件故障。

下面分别举例说明各类软件故障的维修方法。

实例一:

有一台XXX型号服务器,配置为双PIII500带521K高速缓存的CPU、512M内存。开机后,系统日志报电压调节模块异常(VRM)的错误,报错的信息是:“Voltage Regulator Module (VRM) over/under-voltage 2.88V/0V”。从表面来看,极有可能是服务器的电压调节模块或其它硬件出现故障,极容易导致维护人员认为是硬件故障。维护人员立刻使用其它同类型服务器的硬件来测试,发现即使使用新的配件,此服务器依然报VRM错。就在一筹莫展的时候,维修工程师带来了最新的CPU管理板(CPU Management Control)的固件(FIRMWARE),于是升级了CPU管理板块的FIRMWARE后,服务器恢复立即正常。

FIRMWARE升级方法是每个厂家的服务器都有专门的firmware升级方法和软件,以联想为例,一般需要使用PE或dos环境下使用专门的升级软件来使用,任何一款服务器的FIRMWARE

及BIOS都会有不同的BUG,因为BUG在所难免,所以我们不能错误地认为服务器的BIOS程

序就很完善,最新的不是一定是最好的最稳定的才是最好的,在升级之前应该小心谨慎,升级了错误的版本和使用错误的步骤会导致机器彻底的黑屏和瘫痪。

目前流行的中高档服务器都拥有强大的管理程序,为客户提供了方便的管理途径;服务器也拥有各种操作系统下的驱动程序,方便了客户在各种操作系统中的使用。但是,世上任何一款程序都会有一些BUG,这些BUG将影响用户使用。但是服务器厂商总是会在第一时间内开发出新的程序,客户只需要及时更新这些程序就可以避免这类故障。

当服务器的软件故障为此类时,表现的现象也不尽相同。一般来说,管理程序BUG会导致系统速度变慢,CPU占用率变高,无法正常使用某些功能等;驱动程序的BUG会导致死机、与某些软件有冲突,磁盘工作不稳定等。查看管理程序是否出错的最好的办法就是在系统中首先禁止此类管理工具,再观察服务器是否还是异常。由于管理工具是随着系统启动而启动的,所以应首先避免它的启动。以WINDOWS NT4为例,就首先在管理工具服务中禁用某些服务器软件服务,再修改注册表中的启动项即可。如果是驱动程序有问题的话,就以安全模式进入系统,看是否正常。但是需要注意的是,在安全模式中,系统速度变慢是正常的(特别是磁盘I/O方面)。

服务器的维护人员就应该经常在服务器网站上下载最新的管理工具程序及驱动程序。这样会减少很大一部份软件故障的发生。相比之下,软件冲突造成的故障判断比较困难,需要管理人员有比较丰富的经验以及敏锐的观察力。

实例二:

一位用户说,他有一台XXX型号服务器无法安装SQL SERVER 2000,已经重装N次NT 了,排除是系统故障。而这唯一的服务器又将作为非常重要数据库服务器,因此非常着急。于是维修工程师去了他的公司查看。这台服务器所在的机房是非常标准、完善的机房,检查了这台服务器的情况,发现并没有硬件上的故障,于是排除了光驱读盘力差的可能。

但是,用户刻的SQL SERVER 2000光盘引起了工程师的怀疑,工程师让他拿出了正版的SQL SERVER安装,结果还是不行。在安装的过程中,没有出现丝毫错误,可就是在运行的时候会自动退出,没有任何提示。但是,我在管理工具中的事件查看器的系统日志中却发现了一条信息:windata.exe导致一个无效的数据溢出。Windata是用户自己编写的一个程序,而且是随操作系统启动而启动的程序。立即结束掉这个进程后,再运行SQL一切正常。

对于此类软件故障,操作员最好先查看有关的日志,看看系统中是否有可疑的进程。目前的服务器无论是高端还是低端,对于SQL等标准程序的支持是相当可靠的,所以排除的重点就是结束可疑进程。

还有一种软件故障是人为因素造成的,它一般是人为误操作(包括没按操作流程的操作)、意外关机(包括电源突然不供电)或非正常关闭应用程序造成的。

人为误操作因素只要加强管理都可以避免此类故障发生。在这里就详细说明意外关机或非正常关闭程序造成故障的方法。正常关闭系统程序非常重要,尤其是WEB服务器,一个用户就是因为没有正常关闭系统程序而经历了一次数据损坏甚至丢失的经历。

七、服务器常见内存故障现象实例

服务器常用部件除了硬盘以外就是内存了,内存为服务器主要部件以个人经验来讲它一旦出现问题不是很好来判定,因为服务器一般来讲都会由阵列功能的,一旦硬盘故障硬盘前面板会有指示灯,没有指示灯的在阵列的配置界面里面也会看到有降级或者硬盘离线的报错信息的。实在不行我们还有很多像HD等硬盘检测工具来给我们现场使用。但是内存不是很好来观察只能通过一些经验现象来判定。下面列出一些内存常见问题现象供大家参考。

常见故障一:开机无显示

内存条原因出现此类故障一般是因为内存条与主板内存插槽接触不良造成,只要用橡皮擦来回擦试其金手指部位即可解决问题(不要用酒精等清洗),还有就是内存损坏或主板内存槽有问题也会造成此类故障。由于内存条原因造成开机无显示故障,主机扬声器一般都会长时间蜂鸣(针对Award Bios而言)。

常见故障二:Windows注册表经常无故损坏,提示要求用户恢复

此类故障一般都是因为内存条质量不佳引起,很难予以修复,唯有更换一途。

常见故障三:Windows经常自动进入安全模式

此类故障一般是由于主板与内存条不兼容或内存条质量不佳引起,常见于高频率的内存用于某些不支持此频率内存条的主板上,可以尝试在CMOS设置内降低内存读取速度看能否解决问题,如若不行,那就只有更换内存条了

常见故障四:随机性死机

此类故障一般是由于采用了几种不同芯片的内存条,由于各内存条速度不同产生一个时间差从而导致死机,对此可以在CMOS设置内降低内存速度予以解决,否则,唯有使用同型号内存。还有一种可能就是内存条与主板不兼容,此类现象一般少见,另外也有可能是内存条与主板接触不良引起电脑随机性死机。

常见故障五:内存加大后系统资源反而降低

此类现象一般是由于主板与内存不兼容引起,常见于高频率的内存内存条用于某些不支持此频率的内存条的主板上,当出现这样的故障后你可以试着在COMS中将内存的速度设置得低一点试试。

常见故障六:运行某些软件时经常出现内存不足的提示

此现象一般是由于系统盘剩余空间不足造成,可以删除一些无用文件,多留一些空间即可,一般保持在300M左右为宜

常见故障七:从硬盘引导安装Windows进行到检测磁盘空间时,系统提示内存不足此类故障一般是由于用户在config.sys文件中加入了emm386.exe文件,只要将其屏蔽掉即可解决问题

故障诊断方法与应用

课程名称:故障诊断方法与应用报告题目:内圈故障诊断实验报告学生班级;研152 学生姓名: 任课教师: 学位类别:

设备故障诊断技术是一种了解和掌握设备在使用过程中的状态,确定其整体或局部是正常或异常,早期发现故障及其原因,并能预报故障发展趋势的技术。安装合适的传感器可以获得故障的特征信号,通过信号反映故障产生原因。滚动轴承是机械中的易损元件,据统计旋转机械的故障有30%是由轴承引起的,它的好坏对机器的工作状态影响极大。轴承的缺陷会导致机器剧烈振动和产生噪声,甚至会引起设备的损坏。滚动轴承的振动可由于外部的振源引起,也可由于轴承本身的结构特点及缺陷引起。而随着科学技术不断发展和工业化程度的不断提高,机械设备精密程度、复杂程度及自动化程度不断提高,凭个人的感观经验对机械设备进行诊断己经远远不够,因此轴承的状态检测和故障诊断是十分必要的,已经成为机械设备故障诊断技术的重要内容。滚动轴承故障监测诊断方法有很多种,它们各具特点,其中振动信号法应用最广泛。本次实验就是采用振动信号法对滚动轴承故障实验平台的滚动轴承的故障信号进行分析。

1 绪论 (1) 2 轴承内圈故障特征频率 (2) 3 时域无量纲参数分析 (2) 3.1 时域波形 (2) 3.2 傅里叶变换运算分析故障 (3) 4通过自相关、互相关、功率谱运算分析故障 (4) 4.1 自相关分析 (4) 4.2 互相关运算分析故障 (5) 4.3功率谱密度 (6) 5 Haar小波分析 (7) 5.1小波分解 (7) 5.2 小波降噪 (9)

1 绪论 随着对滚动轴承的运动学、动力学的深入研究,对于轴承振动信号中的频率成分和轴承零件的几何尺寸及缺陷类型的关系有了比较清楚的了解,加之快速傅里叶变换技术的发展。开创了用频域分析方法来检测和诊断轴承故障的新领域。其中最具代表性的有对钢球共振频率的研究,对轴承圈自由共振频率的研究。本文主要着重于对滚动轴承内圈磨损的故障研究,主要研究方法为傅里叶变换,功率谱,自相关以及互相关,小波理论。 滚动轴承在运行过程中可能会因为各种原因出现故障,如安装不当、异物入侵、润滑不良、腐蚀和剥落等都会导致轴承出现故障。安装不当会导致轴承不对中,使得轴承在运行中,产生一种附加弯矩,给轴承增加附加载荷,形成附加激励,引起几组强烈振动,严重时会导致转子严重磨损、轴弯曲、联轴器和轴承断裂等严重后果。即使轴承安装正确,在长期的运行中,由于异物的入侵或则负荷的作用下,接触面会出现不同程度的金属剥落、裂痕等现象,进而导致旋转部件与故障区域接触时产生强烈振动。本次实验主要针对潜在危害很大的裂痕故障信号进行分析研究。滚动轴承在出现裂痕故障后,随着轴承的旋转,由于旋转部件与裂痕周期性的碰撞会产生周期性的冲击信号,且周期可以通过轴承结构计算得出。图1.1所示为滚动轴承基本结构。 图1.1 滚动轴承基本结构 d:滚动体直径 D:轴承节径(滚动体所在圆的直径) R:内圈直径 i R:外圈直径 o :接触角(滚动体受力方向与轴承径向平面的夹角) Z:滚动体个数

电脑硬件常见的故障检测及处理方法

电脑硬件常见的故障检测及处理方法 互联网06-03 14:29:15 作者:佚名我要评论 掌握一些电脑维修的基本检测方法,是解决电脑故障的必备基础知识。本文总结了电脑使用者在日常的工作、生活中有可能遇到的几种代表性的电脑硬件故障以及处理方法,在遇到电脑故障时,快速判断并处理一些有规律可循的常见故障。 我们在日常生活、工作中肯定会遇到电脑硬件引起的一些故障,这个时候,如果你不懂如何检测及处理硬件故障,则会对我们的生活、工作造成很大的不便;本文就针对我们在使用电脑中常遇到的几种硬件故障,总结了几种代表性的电脑故障及处理方法,希望对大家有一定的帮助; 一、什么是电脑硬件故障 电脑硬件故障是由硬件引起的故障,涉及各种板卡、存储器、显示器、电源等。常见的硬故障有如下一些表现。 ①电源故障,导致系统和部件没有供电或只有部分供电。 ②部件工作故障,计算机中的主要部件如显示器、键盘、磁盘驱动器、鼠标等硬件产生的故障,造成系统工作不正常。 ③元器件或芯片松动、接触不良、脱落,或者因温度过热而不能正常运行。 ④计算机外部和内部的各部件间的连接电缆或连接插头(座)松动,甚至松脱或者错误连接。 ⑤系统与各个部件上及印制电路的跳线连接脱落、连接错误,或开关设置错误,而构成非正常的系统配置。 ⑥系统硬件搭配故障,各种电脑芯片不能相互配合,在工作速度、频率方面不具有一致性等。 二、硬件故障的常用检测方法 目前,计算机硬件故障的常用检测方法主要有以下几种。 1.清洁法 对于使用环境较差或使用较长时间的计算机,应首先进行清洁。可用毛刷轻轻刷去主板、外设上的灰尘。如果灰尘已清洁掉或无灰尘,就进行下一步检查。另外,由于板卡上一些插卡或芯片采用插脚形式,所以,震动、灰尘等其他原因常会造成引脚氧化,接触不良。可用橡皮擦去表面氧化层,重新插接好后,开机检查故障是否已被排除。 2.直接观察法

笔记本电脑供电电路故障的诊断方法

笔记本电脑供电电路故障的诊断方法 笔记本电脑的主板供电电路是笔记本电脑不可或缺的一部分,其出现问题通常会导致不能开机、自动重启以及死机等种种故障现象的产生。 学习笔记本电脑主板供电电路故障的诊断与排除,首先应掌握其基本工作原理,其次要对主板供电电路出现问题后导致的常见故障现象进行了解,最后要不断总结和学习主板供电电路的检修经验和方法。 1 笔记本电脑主板供电电路基本知识 笔记本电脑主板的供电方式有两种,一种是笔记本电脑采用的专用可充电电池供电,另一种是能够将220V市电转换为十几伏或二十几伏供电的电源适配器供电。笔记本电脑的专用可充电池提供的供电电压通常要低于电源适配器的输入供电电压。 无论是笔记本电脑的专用可充电电池还是电源适配器,其输入笔记本电脑主板上的供电并不能被所有芯片、电路以及硬件设备等直接采用,这是因为笔记本电脑主板上的各部分功能模块和硬件设备对电流和电压的要求不同,其必须经过相应的供电转换后才能被采用。所以,笔记本电脑主板上的各种供电转换电路,成为了笔记本电脑不可或缺的一部分。同时,笔记本电脑的主板供电电路出现问题后,就会导致不能开机、自动重启以及死机等种种故障现象的产生。 学习笔记本电脑主板供电电路故障的诊断与排除方法,必须首先掌握其工作原理和常见故障现象,这样才能够在笔记本电脑的检修过程中做到故障分析合理、故障排除迅速且准确。 1.1笔记本电脑主板供电机制 笔记本电脑主板上的供电转换电路主要采用开关稳压电源和线性稳压电源两种。 开关稳压电源是笔记本电脑主板中应用最为广泛的一种供电转换电路。笔记本电脑主板上的系统供电电路、CPU供电电路、芯片组供电电路以及内存和显卡供电电路中,都广泛采用了开关稳压电源。 开关稳压电源利用现代电子技术,通过电源控制芯片发送控制信号控制电子开关器件(如场效应管)的“导通”和“截止”,对输入供电进行脉冲调制,从而实现供电转换以及自动稳压和输出可调电压的功能。 笔记本电脑主板上应用的开关稳压电源电路通常由电源控制芯片、场效应管、滤波电容器、储能电感器以及电阻器等电子元器件组成。

贫血的诊断思路及鉴别诊断

贫血是常见的症状。贫血可原发于造血器官疾病,也可能是某些系统疾病的表现。 病史询问要点: 1贫血发生是时间、病程及贫血的症状 2是否有急性、慢性失血史,如消化道溃疡、溃疡性结肠炎或其他病因引起的慢性消化道出血史常提示缺铁性贫血。对于女性患者,尤其是育龄期,月经过多、多次妊娠、或子宫出血均可引起缺铁性贫血。 3营养状况及有无偏食情况 4有无化学药物毒物接触史,如苯,铅,染料,解热镇痛类药物等。 5是否有黄疸?临床上出现黄疸应考虑溶血性贫血,但轻度黄疸也可见于恶性贫血。慢性肝病患者也常伴有叶酸缺乏性贫血或铁粒幼细胞性贫血。 6有无肝肾疾病、结核、慢性炎症及肿瘤病史,有无寄生虫病。 查体: 1皮肤巩膜黄染见于溶血性疾病、肝病。 2舌乳头萎缩见于叶酸或维生素B12缺乏,口角干裂、指甲扁平或凹陷见于缺铁性贫血。 3应特别注意有无胸骨压痛和全身表浅淋巴结及肝脾大。脾大见于慢性白血病,溶血性贫血及脾功能亢进。肝大见于肝病。 4下肢溃疡常见于溶血性贫血,尤其是镰状细胞贫血。 5神经系统体征如感觉异常、振动觉减退、共济失调等提示维生素B12缺乏的可能。 6肛门和妇科检查亦不能忽略,痔出血或该部位的肿瘤是贫血常见的原因。 相关检查: 1血常规及外周血涂片检查: a如为小细胞低色素贫血应进一步检测血清铁蛋白、血清铁、总铁结合力及红细胞游离原卟啉等,以确定是否为缺铁性贫血,并进一步查找病因。如为非缺铁性低色素性贫血,则应检测血红蛋白电泳及碱变性实验,以证实是否为珠蛋白生成障碍性贫血,或做骨髓穿刺进行铁染色,以确定是否为铁粒幼细胞贫血。 b如系大细胞贫血,应做骨髓检查及测定叶酸维生素B12水平,以确定是否有叶酸或B12缺乏,并进一步查找病因。如果不是巨幼细胞贫血,要考虑是否有骨髓增生异常综合征,或是肝病或内分泌疾患引起贫血。 c如系正常细胞性贫血,若伴网织红细胞增多,则有溶血性贫血的可能,需进一步测定血清胆红素水平,结合珠蛋白等,coombs,ham试验等溶血相关试验检查,以明确是否有溶血的存在。如网织红细胞不多,且伴有全血细胞减少者,应做骨髓涂片及活检,确定是否有再障的可能。 d周围血涂片还可以发现异形细胞,如靶形红细胞常见于珠蛋白生成障碍性贫血,泪滴样红细胞可见于骨髓纤维化,缗钱状红细胞见于多发性骨髓瘤,如见到各种异形红细胞或红细胞碎片,常提示微血管病性溶血性贫血的可能。 2网织红细胞计数:溶血性贫血是往往增高,贫血患者治疗有效时网织红也增高。网织红计数减低时要注意是否有再障的发生。 3骨髓检查:增生极度活跃见于白血病,尤其是慢性粒细胞白血病;增生明显活跃,见于白血病、增生性贫血;增生活跃见于正常骨髓或某些贫血;增生减低见于造血功能低下;增生极度减低见于造血功能明显低下,如再障。骨髓中原始细胞数量增多可见于各种白血病。骨髓活组织检查对于再生障碍性贫血、骨髓增生异常综合征、骨髓纤维化、骨髓硬化症、恶性肿瘤的骨髓转移等的诊断有较大帮助。 4贫血的病因检查:包括尿常规,肾功能、大便隐血、大便虫卵、胃肠道内镜检查,以及有关的生化、免疫学、组织病理、核素检查等。

故障诊断分析方法-结课论文

故障诊断分析方法比较 摘要:小波变换作为信号处理的手段,逐渐被越来越多领域的理论工作者和工 程技术人员重视和应用。在机械系统和电气系统中,故障时常发生,为了诊断 系统是否故障,小波分析是很好的方法。小波分析的方法很多,小波的选择也 很多类,为了研究哪种小波分析方法更加适合于故障检测。论文将通过一个例 子来分别采用功率谱、多分辨小波分析和小波包三种方法进行突发性故障诊断,来研究各自的分析特点。并总结在故障发生时,一个更加好的分析方法。 关键词:故障功率谱多分辨分析小波包分析 正文: 在对机械设备进行故障检测时,通常采用对振动信号进行频谱分析找出奇 异点的方法来实现设备监测。傅里叶变换是频谱分析的主要工具,其方法是研 究函数在傅里叶变换后的衰减以推断函数是否具有奇异性及奇异性的大小,但 傅里叶分析只能确定一个函数奇异性的整体性质而难以确定奇异点空间的位置 分布情况,这一局限性导致了频谱分析不能精确的确定信号的奇异性特点,给 进一步分析信号的规律带来了一定的障碍。 而在傅里叶基础上发展而来的功率谱可以识别不同信号的故障信号。将正 常信号的功率谱与运行过程中不断连续收集的信号功率谱进行对比,功率谱异 常就表示机械系统有故障,不同类型的故障会有不同类型的频谱特征,从故障 信号的功率谱中可以识别故障的类型。 然而利用传统的频谱分析方法只能从频谱图上了解故障信号的所包含的频 率成分,而无法确定具体的频率成分的震动形式。无法对具体的频率成分进行 分析,难以直接描述机械的状态。小波分析是近十年发展起来的一门适用于时 变信号分析的新兴工具,它可以把时域信号变换到时间—尺度域中,在不同尺 度下观察不同的局部化特性。在信号突变时,其小波变换后的系数具有模量极 大值,可通过对模的极大值点的检测来确定故障发生的时间点。在从小波基础 上发展的小波包,对各个子小波空间做出更加细致的分解,其对应的频带被进 一步分解,这使得时—频分析能聚焦于任意的细节,在故障诊断时,可从细节 上分析故障。 很多工作系统正常工作时,工作输出点的采样信号是蠕变信号,当由于多 种原因系统系统故障时,输出信号将产生一突变信号(主要表现在幅度和频率 的变化),信号的突变时刻被称为信号的奇异点。这些奇异点数值包含有重要 的故障信息,因此,对突变信号进行检测和处理,是故障诊断的关键。 因此,本文从功率谱、多分辨分析分析和小波包三种方法进行蠕变信号突发性 故障诊断,并比较总结它们的特点。 实例:由于日常机械中很多振动信号都是由不通频率的正弦余弦波组成的,于 是这里选择的原始信号采用的是单一频率正弦波的形式。为了研究上述三种分 析方法,并且由于还未在先研究阶段中未得到研究机械的信号,为了简化分析

装备故障诊断方法

价值工程 0引言 随着武器装备复杂性不断增加,对武器装备维护和故 障诊断提出了更高的要求。近年来, 一些逐渐兴起的智能故障诊断方法,比传统方法能够更加快速,有效的诊断装备故障。 目前,人工智能技术的发展,特别是基于知识的专家系统技术在故障诊断中的应用,使得设备故障诊断技术进入了一个新的智能公发展阶段。传统的故障诊断专家系统虽然在某些领域取得了成功,但这种系统在实际应用中存在着一定的局限性,而人工神经网络技术为解决传统的专家系统中的知识获取,知识学习等问题提供了一条崭新的途径[1][2][3]。 1神经网络模型原理 人工神经网络简称神经网络(Neural Network ),具备并行性、 自学习、自组织性、容错性和联想记忆功能等信息处理特点而广泛用于故障诊断领域,它通过对故障实例及诊断经验的训练和学习,用分布在神经网络中的连接权值来表达所学习的故障诊断知识,具有对故障联想记忆、模糊匹配和相似归纳等能力。人工神经网络在故障诊断中的应用研究主要有三个方面:一是从预测角度应用神经网络作为动态预测模型进行故障预测;二是从模式识别角度应用神经网络作为分类器进行故障诊断;三是从知识处理角 度建立基于神经网络的专家系统[4][5] 。 1.1神经网络基本模型基于神经细胞的这种理论知识,在1943年McCulloch 和Pitts 提出的第一个人工神经元模型以来,人们相继提出了多种人工神经元模型,其中被人们广泛接受并普遍应用的是图1所示的模型[6]。 图1中的x 0,x 1,…,x n-1为实连续变量,是神经元的输入,θ称为阈值(也称为门限),w 0,w 1,…,w n-1是本神经元与上级神经元的连接权值。 神经元对输入信号的处理包括两个过程:第一个过程 是对输入信号求加权和,然后减去阈值变量θ, 得到神经元的净输入net ,即 net=n-1 i =0Σw i x i -θ 从上式可以看出,连接权大于0的输入对求和起着增强的作用,因而这种连接又称为兴奋连接,相反连接权小于0的连接称为抑制连接。 下一步是对净输入net 进行函数运算,得出神经元的输出y ,即y=f (net ) f 通常被称为变换函数(或特征函数),简单的变换函 数有线性函数、 阈值函数、Sigmiod 函数和双曲正切函数。根据本文的研究特点,变换函数f 取为Sigmoid 函数,即f (x )=11+e (-x ) 1.2神经网络知识表示传统的知识表示都可以看作是知识的一种显示表示,而在ANN 中知识的表示可看作是一种隐式表示。在ANN 中知识并不像传统方法那样表示为一系列规则等形式,而是将某一问题的若干知识在同一网络中表示,表示为网络的权值分布。如下所示阈值型BP 网络表示了四条“异或”逻辑产生式规则[7]: IF x 1=0AND x 2=0THEN y=0IF x 1=0AND x 2=1THEN y=1IF x 1=1AND x 2=0THEN y=1IF x 1=1AND x 2=1THEN y=0基于这种网络知识表示结构,其BP 网络结构如图2所示。 网络通常由输入层、隐层和输出层组成。网络第一层为输入层,由信号源节点组成,传递信号到隐层;第二层为隐层,隐层节点的变换函数是中心点对称且衰减的非负线性函数;第三层为输出层,一般是简单的线性函数,对输入模式做出响应。理论上已证实,在网络隐 —————————————————————— —作者简介:李洪刚(1981-),男,河北石家庄人,硕士,控制工程专 业;郭日红(1982-),男,山西大同人,硕士,测试专业。 装备故障诊断方法研究 Analysis of Fault Diagnosis for Equipment Based on Neural Network System 李洪刚①②LI Hong-gang ;郭日红②GUO Ri-hong (①军械工程学院,石家庄050003;②中国人民解放军66440部队,石家庄050081) (①Ordnance Engineering College ,Shijiazhuang 050003,China ;②No.66440Unit of PLA ,Shijiazhuang 050081,China ) 摘要:分析了神经网络故障诊断的特点,构建了神经网络的装备故障诊断模型,克服了传统故障诊断的缺点,并用某型装备故障 的数据进行了验证,结果表明了神经网络诊断故障是一种有效的诊断方法。 Abstract:Characteristics of the neural network and expert system are analyzed.Fault diagnosis for equipment base on neural network is constructed.A weak of the traditional method of fault diagnose is overcome.And availability of the method based on neutral network system is verified by experimental results of one equipment fault. 关键词:神经网络;故障诊断;装备Key words:neural network ;fault diagnose ;equipment 中图分类号:E911文献标识码:A 文章编号:1006-4311(2012)32-0316-02 ·316·

电脑故障诊断解决方法

电脑故障诊断解决方法 平时常见的微机故障现象中,有很多并不是真正的硬件故障,而是由于某些设置或系统特性不为人知而造成的假故障现象。认识下面的微机假故障现象有利于快速地确认故障原因,避免不必要的故障检索工作。 1、电源插座、开关很多外围设备都是独立供电的,运行微机时只打开计算机主机电源是不够的。例如:显示器电源开关未打开,会造成“黑屏”和“死机”的假象;外置式MODEM 电源开关未打开或电源插头未插好则不能拨号、上网、传送文件,甚至连MODEM都不能被识别。打印机、扫描仪等都是独立供电设备,碰到独立供电的外设故障现象时,首先应检查设备电源是否正常、电源插头/插座是否接触良好、电源开关是否打开。 2、连线问题外设跟计算机之间是通过数据线连接的,数据线脱落、接触不良均会导致该外设工作异常。如:显示器接头松动会导致屏幕偏色、无显示等故障;又如:打印机放在计算机旁并不意味着打印机连接到了计算机上,应亲自检查各设备间的线缆连接是否正确。 3、设置问题例如:显示器无显示很可能是行频调乱、宽度被压缩,甚至只是亮度被调至最暗;音箱放不出声音也许只是音量开关被关掉;硬盘不被识别也许只是主、从盘跳线位置不对……。详细了解该外设的设置情况,并动手试一下,有助于发现一些原本以为非更换零件才能解决的问题。 4、系统新特性很多“故障”现象其实是硬件设备或操作系统的新特性。如:带节能功能的主机,在间隔一段时间无人使用计算机或无程序运行后会自动关闭显示器、硬盘的电源,在你敲一下键盘后就能恢复正常。如果你不知道这一特征,就可能会认为显示器、硬盘出了毛病。再如Windows、NC的屏幕保护程序常让人误以为病毒发作…… 多了解微机、外设、应用软件的新特性、多向专家请教,有助于增加知识、减少无谓的恐慌。 \[] 5、其它易疏忽的地方 CD-ROM的读盘错误也许只是你无意中将光盘正、反面放倒了;软盘不能写入也许只是写保护滑到了“只读”的位置。发生了故障,首先应先判断自身操作是否有疏忽之处,而不要盲目断言某设备出了问题。 微机故障常见的检测方法 1、清洁法对于机房使用环境较差,或使用较长时间的机器,应首先进行清洁。可用毛刷轻轻刷去主板、外设上的灰尘,如果灰尘已清扫掉,或无灰尘,就进行下一步的检查。另外,由于板卡上一些插卡或芯片采用插脚形式,震动、灰尘等其他原因,常会造成引脚氧化,接触不良。可用橡皮擦擦去表面氧化层,重新插接好后开机检查故障是否排除。 2、直接观察法即“看、听、闻、摸”。“看”即观察系统板卡的插头、插座是否歪斜,电阻、电容引脚是否相碰,表面是否烧焦,芯片表面是否开裂,主板上的铜箔是否烧断。还要查看是否有异物掉进主板的元器件之间(造成短路),也可以看看板上是否有烧焦变色的地方,印刷电路板上的走线(铜箔)是否断裂等等。“听”即监听电源风扇、软/硬盘电机或寻道机构、显示器变压器等设备的工作声音是否正常。另外,系统发生短路故障时常常伴随着异常声响。监听可以及时发现一些事故隐患和帮助在事故发生时即时采取措施。“闻”即

常用简易的设备故障诊断方法

常用简易的设备故障诊 断方法 Document number:PBGCG-0857-BTDO-0089-PTT1998

常用简易的设备故障诊断方法 常用的简易状态监测方法主要有听诊法、触测法和观察法等。 1、听诊法 设备正常运转时,伴随发生的声响总是具有一定的音律和节奏。只要熟悉和掌握这些正常的音律和节奏,通过人的听觉功能就能对比出设备是否出现了重、杂、怪、乱的异常噪声,判断设备内部出现的松动、撞击、不平衡等隐患。用手锤敲打零件,听其是否发生破裂杂声,可判断有无裂纹产生,用听诊法对滚动轴承工作状态进行监测的常用工具是木柄螺丝刀,也可以使用外径为φ20mm左右的硬塑料管。 (1)滚动轴承正常工作状态的声响特点 滚动轴承处于正常工作状态时,运转平稳、轻快、无停滞现象,发出的声响和谐而无杂音,可听到均匀而连续的“哗哗”声,或者较低的“轰轰”声。噪声的强度不大。异常声响所反映的轴承故障锥入度大一点的新润滑脂。 (2)轴承在连续的“哗哗”声中发出均匀的周期性的“嗬罗”声。这种声音是由于滚动体和内外圈滚道出现伤痕、沟槽、锈蚀斑而引起的。声响的周期与轴承的转速成正比。应对轴承进行更换。 (3)轴承发出不连续的“梗梗”声。这种声音是由于保持架或者内外圈破裂而引起的。必须立即停机更换轴承。 (4)轴承发出不规律、不均匀“嚓嚓”声。这种声音是由于轴承内落入铁屑、砂粒等杂质而引起的。声响强度较小,与转速没有联系。应对轴承进行清洗,重新加脂或换油。

(5)轴承发出连续而不规则的“沙沙”声。这种声音一般与轴承的内圈与轴配合过松或者外圈与轴承孔配合过松有关系,声响强度较大。应对轴承的配合关系进行检查,发现问题及时修理。 (6)轴承发出连续刺耳啸叫声。这种声音是由于轴承润滑不良,缺油造成了干摩擦,或者滚动体局部接触过紧,如内外圈滚道偏斜,轴承内外圈配合过紧等情况而引起的。应及时对轴承进行检查找出问题,对症处理。 电子听诊器是一种振动加速度传感器。它将设备振动状况转换成电信号并进行放大,工人用耳机监听运行设备的振动声响,以实现对声音的定性测量。通过测量同一测点、不同时期、相同转速、相同工况下的信号,并进行对比,来判断设备是否存在故障。当耳机出现清脆尖细的噪声时,说明振动频率较高,一般是尺寸相对较小的、强度相对较高的零件发生局部缺陷或微小裂纹。当耳机传出混浊低沉的噪声时,说明振动频率较低,一般是尺寸相对较大的、强度相对较低的零件发生较大的裂纹或缺陷。当耳机传出的噪声比平时增强时,说明故障正在发展,声音越大,故障越严重。当耳机传出的噪声是杂乱无规律地间歇出现时,说明有零件或部件发生了松动。 2、触测法 用人手的触觉可以监测设备的温度、振动及间隙的变化情况。人手上的神经纤维对温度比较敏感,可以比较准确地分辨出80℃以内的温度。当机件温度在0℃左右时,手感冰凉,若触摸时间较长会产生刺骨痛感。10℃左右时,手感较凉,但一般能忍受。20℃左右时,手感稍凉,随着接触时间延长,手感渐温。30℃左右时,手感微温,有舒适感。40℃左右时,手感较热,有微烫感觉。50℃左右时,手感较烫,若用掌心按的时间较长,会有汗感。60℃左右

故障诊断理论方法综述

故障诊断理论方法综述 故障诊断的主要任务有:故障检测、故障类型判断、故障定位及故障恢复等。其中:故障检测是指与系统建立连接后,周期性地向下位机发送检测信号,通过接收的响应数据帧,判断系统是否产生故障;故障类型判断就是系统在检测出故障之后,通过分析原因,判断出系统故障的类型;故障定位是在前两部的基础之上,细化故障种类,诊断出系统具体故障部位和故障原因,为故障恢复做准备;故障恢复是整个故障诊断过程中最后也是最重要的一个环节,需要根据故障原因,采取不同的措施,对系统故障进行恢复一、基于解析模型的方法 基于解析模型的故障诊断方法主要是通过构造观测器估计系统输出,然后将它与输出的测量值作比较从中取得故障信息。它还可进一步分为基于状态估计的方法和基于参数估计的方法,前者从真实系统的输出与状态观测器或者卡尔曼滤波器的输出比较形成残差,然后从残差中提取故障特征进而实行故障诊断;后者由机理分析确定系统的模型参数和物理元器件之间的关系方程,由实时辨识求得系统的实际模型参数,然后求解实际的物理元器件参数,与标称值比较而确定系统是否发生故障及故障的程度。基于解析模型的故障诊断方法都要求建立系统精确的数学模型,但随着现代设备的不断大型化、复杂化和非线性化,往往很难或者无法建立系统精确的数学模型,从而大大限制了基于解析模型的故障诊断方法的推广和应用。 二、基于信号处理的方法 当可以得到被控测对象的输入输出信号,但很难建立被控对象的解析数学模型时,可采用基于信号处理的方法。基于信号处理的方法是一种传统的故障诊断技术,通常利用信号模型,如相关函数、频谱、自回归滑动平均、小波变换等,直接分析可测信号,提取诸如方差、幅值、频率等特征值,识别和评价机械设备所处的状态。基于信号处理的方法又分为基于可测值或其变化趋势值检查的方法和基于可测信号处理的故障诊断方法等。基于可测值或其变化趋势值检查的方法根据系统的直接可测的输入输出信号及其变化趋势来进行故障诊断,当系统的输入输出信号或者变化超出允许的范围时,即认为系统发生了故障,根据异常的信号来判定故障的性质和发生的部位。基于可测信号处理的故障诊断方法利用系统的输出信号状态与一定故障源之间的相关性来判定和定位故障,具体有频谱分析方法等。 三、基于知识的方法 在解决实际的故障诊断问题时,经验丰富的专家进行故障诊断并不都是采用严格的数学算法从一串串计算结果中来查找问题。对于一个结构复杂的系统,当其运行过程发生故障时,人们容易获得的往往是一些涉及故障征兆的描述性知识以及各故障源与故障征兆之间关联性的知识。尽管这些知识大多是定性的而非定量的,但对准确分析故障能起到重要的作用。经验丰富的专家就是使用长期积累起来的这类经验知识,快速直接实现对系统故障的诊断。利用知识,通过符号推理的方法进行故障诊断,这是故障诊断技术的又一个分支——基于知识的故障诊断。基于知识的故障诊断是目前研究和应用的热点,国内外学者提出了很多方法。由于领域专家在基于知识的故障诊断中扮演重要角色,因此基于知识的故障诊断系统又称为故障诊断专家系统。如图1.1

服务器维修故障诊断思路大全

前言: 相对PC机而言服务器出故障的机率是小多了,但是它的故障给企业也带来了一些影响。作为服务器工程师除要有服务器基础知识以外,还需要具备服务器故障的诊断思路,这样才能最快速的解决问题也可以减少故障停机时间。 本文并不是针对某个厂家服务器故障完全手册,而是根据个人经验总结出来的一些经验思路还有一些总结案例。按照下面思路和方法基本上能够解决目前服务器更换式维修的大多数问题。而且里面的一些操作风险性也不是很大,因为服务器本身就是坏的,最坏的情况下就是它一点都不能工作了呗,(主要确认是否有数据,数据无价啊)而且现在很多厂商都有自己的客服电话关于产品问题打个电话也很方便,所以安心做啦 当然如果服务器在保修期内就打电话让售后工程师上门服务,毕竟顾客就是上帝嘛,但是如果上帝比较着急使用,一般小故障自己解决一下就好了,因为一般报修最快都是第二天(大客户如银行等除外,一般当天还得是晚上才能停机解决) 目录: 一、服务器常见故障分类 二、服务器常见故障现象及其对应排错方法 三、服务器排错基本原则 四、服务器故障需要收集哪些信息 五、服务器硬件故障排错实例 六、服务器软件故障排错实例 七、服务器常见内存故障现象 一、服务器常见故障类型分类: A. 开机无显示 B. 加电BIOS自检阶段故障 C. 系统和软件安装阶段故障和现象 D. 操作系统启动失败 E. 系统运行阶段故障 二、服务器常见故障现象及其对应的排除方法

A.服务器开机无显示(加电无显示和不加电无显示) 1. 检查供电环境 2. 检查电源和故障指示灯(故障指示灯状态,目前很多厂商的服务器都有故障指示灯,或故障诊断卡等。) 3. 按下电源开关时,键盘指示灯是否亮、风扇是否全部转动 4. 是否更换过显示器,尝试更换另外一台显示器 5. 插拔内存,用橡皮擦擦拭一下金手指,如果在故障之前有增加内存,去掉增加的内存尝试 6. 是否添加了CPU,如果有增加CPU尝试去掉 7. 去掉增加的第三方I/O卡包括Raid卡等 8. ClearCMOS (记得使用跳线来清除,尽量不要直接拔电池,每款服务器清除跳线位置不一致,具体找不到电话联系一下厂商客服) 9. 尝试更换主板、内存等主要部件 10.清除静电,将电源线等外插在服务器上的线缆全部拔掉,然后轻按开机键几下 B.加电BIOS自检报错 1. 根据BIOS自检报错信息提示 2. 查看是否外插了第三方的卡或者添加部件,如果有还原基本配置重启 3. 做最小化测试 4. 尝试清除CMOS 5. 看能否正常进入BIOS C. 系统安装阶段故障和现象 1.查看服务器支持操作系统的兼容版本(从厂商能查到兼容性列表) 2.系统安装蓝屏(对蓝屏故障代码诊断) 3.安装在分区格式化的时候找不到硬盘 (阵列驱动没有安装或者没有配置阵列,可以尝试适应引导光盘安装) 4.大于2T的硬盘式应该如何分区(必须使用阵列卡才能实现或者有外插识别卡) (使用阵列卡配置阵列分成一个小于2T的空间,一个大于2T的空间,然后将系统安装在小于2T的上面,安装好系统后在使用GPT方式分区即可) 5.安装过程是死机 (检查兼容性列表---查看硬盘接口选择是否正确---阵列驱动安装是否正确---尝试最小化配置安装检查是否为内存和CPU等问题) 6.引导光盘安装失败

电脑故障诊断卡的详细使用方法介绍

电脑故障诊断卡的详细使用方法介绍(图文教程) 诊断卡使用方法 一、用户必读; 二、智能型笔记本电脑诊断卡使用方法; 三、智能型四位诊断卡使用方法; 四、智能型并口诊断卡L50使用方法. 一、用户必读: ⑴. 诊断卡也叫PC Analyzer或POST (Power On Self Test )卡,其工作原理是利用主板中BIOS 内部自检程序的检测结果,通过代码一一显示出来,结合本书的代码含义速查表就能很快地知道电脑故障所在。尤其在PC机不能引导操作系统、黑屏、喇叭不叫时,使用本卡更能体现其便利,使您事半功倍。BIOS 在每次开机时,对系统的电路、存储器、键盘、视频部分、硬盘、软驱等各个组件进行严格测试,并分析系统配置,对已配置的基本I/O设置进行初始化,一切正常后,再引导操作系统。其显著特点是以是否出现光标为分界线,先对关键性部件进行测试。关键性部件发生故障强制机器转入停机,显示器无光标,则屏幕无任何反应。然后,对非关键性部件进行测试,如有故障机器也继续运行,同时显示器显示出错信息,当机器出现故障,尤其是出现关键性故障,屏幕上无显示时,将本卡插入扩弃槽内。根据卡上显示的代码,表示的故障原因和部位,就可清楚地知道故障所在。 ⑵. 注意分辨“故障代码”与“起始码;起始码是无意义的,只有故障代码才能准确指出故障所在。 ⑶. 故障代码含义速查表是按代码值从小到大排序,卡中出码顺序由主板BIOS 确定。 ⑷. 未定义的代码表中未能列出。 ⑸对于不同BIOS (常用的AMI 、Award 、Phoenix )同一代码所代表的意义不同,因此应弄清您所检测的电脑是属于哪一种类型的BIOS, 您可查阅您的电脑使用手册,或从主板上的BIOS 芯片上直接查看,也可以在启动的屏幕中直接看到。 ⑹.有少数主板的PCI 槽只有一部分代码出现,但ISA 槽则有完整自检代码输出。且目前已发现有极个别原装机主板的ISA 槽无代码输出,而PCI 槽则有完整代码输出,故建议您在查看代码不成功时,将本双槽卡换到另一种插槽试一下。另外,同一块主板的不同PCI 槽,有的槽有完整代码送出,如DELL810 主板只有靠近CPU 的一个PCI槽有完整代码显示,一直变化到“00 ”或“FF ”,而其它PCI 槽走到“38 ”后则不继续变化。 ⑺. 复位信号所需时间ISA 与PCI 不一定同步,故有可能ISA 开始出代码,但PCI 的复位灯还未熄,故PCI 代码停在起始代码上。 ⑻. 由于主板品种和结构的多样性及BIOS POST 代码不断更新,令紧接在代码后面的查找故障部件和范围的准确性受到影响,故《代码含义速查表》中说明的故障部件和范围只能作为参考。 ⑼. 根据经验:两位代码的卡用在P Ⅱ300 以下的主板中可信,而用在P Ⅱ300 以上的板中会死机、不走码或出假码,故建议您购买PI0050A智能型四位代码诊断卡,该卡到目前为止,还没有收到过用户的不良反映。 ⑽十六进制字符表:

故障诊断技术发展历史(最新版)

故障诊断技术发展历史 故障诊断(FD)始于(机械)设备故障诊断,其全名是状态监测与故障诊断(CMFD)。它包含两方面内容:一是对设备的运行状态进行监测;二是在发现异常情况后对设备的故障进行分析、诊断。设备故障诊断是随设备管理和设备维修发展起来的。欧洲各国在欧洲维修团体联盟(FENMS)推动下,主要以英国倡导的设备综合工程学为指导;美国以后勤学(Logistics)为指导;日本吸收二者特点,提出了全员生产维修(TPM)的观点。美国自1961年开始执行阿波罗计划后,出现一系列因设备故障造成的事故,导致1967年在美国宇航局(NASA)倡导下,由美国海军研究室(ONR)主持成立了美国机械故障预防小组(MFPG),并积极从事技术诊断的开发。 美国诊断技术在航空、航天、军事、核能等尖端部门仍处于世界领先地位。英国在60~70年代,以Collacott为首的英国机器保健和状态监测协会(MHMG & CMA)最先开始研究故障诊断技术。英国在摩擦磨损、汽车和飞机发电机监测和诊断方面具领先地位。日本的新日铁自1971年开发诊断技术,1976年达到实用化。日本诊断技术在钢铁、化工和铁路等部门处领先地位。我国在故障诊断技术方面起步较晚,1979年才初步接触设备诊断技术。目前我国诊断技术在化工、冶金、电力等行业应用较好。故障诊断技术经过30多年的研究与发展,已应用于飞机自动驾驶、人造卫星、航天飞机、核反应堆、汽轮发电机组、大型电网系统、石油化工过程和设备、飞机和船舶发动机、汽车、冶金设备、矿山设备和机床等领域。 故障诊断的主要理论和方法 故障诊断技术已有30多年的发展历史,但作为一门综合性新学科——故障诊断学——还是近些年发展起来的。从不同的角度出发有多种故障诊断分类方法,这些方法各有特点。从学科整体可归纳以下理论和方法。 (1)基于机理研究的诊断理论和方法从动力学角度出发研究故障原因及其状态效应。针对不同机械设备进行的故障敏感参数及特征提取是重点。 (2)基于信号处理及特征提取的故障诊断方法主要有时域特征参数及波形特征诊断法、时差域特征法、幅值域特征法、信息特征法、频谱分析及频谱特征再分析法、时间序列特征提取法、滤波及自适应除噪法等。今后应注重实时性、自动化性、故障凝聚性、相位信息和引入人工智能方法,并相互结合。 (3)模糊诊断理论和方法模糊诊断是根据模糊集合论征兆空间与故障状态空间的某种映射关系,由征兆来诊断故障。由于模糊集合论尚未成熟,诸如模糊集合论中元素隶属度的确定和两模糊集合之间的映射关系规律的确定都还没有统一的方法可循,通常只能凭经验和大量试验来确定。另外因系统本身不确定的和模糊的信息(如相关性大且复杂),以及要对每一个征兆和特征参数确定其上下限和合适的隶属度函数,而使其应用有局限性。但随着模糊集合论的完善,相信该方法有较光明的前景。 (4)振动信号诊断方法该方法研究较早,理论和方法较多且比较完善。它是依据设备运行或激振时的振动信息,通过某种信息处理和特征提取方法来进行故障诊断。在这方面应注重引入非线性理论、新的信息处理理论和方法。

基于噪声分析的机械故障诊断方法研究

基于噪声分析的机械故障诊断方法研究 摘要 基于噪声分析的机械故障诊断方法可以非接触地获得机械信号,适用于众多不便于使用振动传感器的场合,如某些高温、高腐蚀环境,是一种常用而有效地故障诊断方法。但在实际应用中,由于不相干噪声和环境噪声的影响,我们需要的待测信号往往被淹没在这些混合噪声中,信号的信噪比较低。 盲源分离作为数字信号处理领域的新兴技术,能利用观测信号恢复或提取独立的各个机械信号,在通讯、雷达信号处理、图像处理等众多领域具有重要的实用价值及发展前景,已经成为神经网络学界和信号处理学界的热点研究课题之一。 本文分析总结了盲源分离技术的相关研究现状,对盲源分离的原理、算法、相关应用作了探讨和研究。并就汽轮机噪声问题运用了盲源分离技术进行机械故障诊断,试验表明,该方法能将我们需要的故障信号从混合信号中分离出来,成功实现汽轮机部件的故障诊断。 关键词:声信号,机械故障诊断,独立分量分析 Investigation of Mechanical Fault Diagnosis Based on Noise Analysis Abstract You can obtain a non-contact method of mechanical fault diagnosis based on noise analysis of mechanical signals , not suitable for many occasions to facilitate the use of vibration sensors , such as certain high temperature , highly corrosive environment , is a common and effective fault diagnosis method . However, in practice , the effects of noise and extraneous ambient noise , the signal under test often need to be submerged in the mixed noise , lower signal to noise ratio . Blind source separation as an emerging field of digital signal processing technology to take advantage of the observed signal recovery or extraction of various mechanical signals independently in many communications, radar signal processing , image processing has important practical value and development prospects , has become a neural network one of the hot research topic in academic circles and signal processing . In this paper summarizes the research status of blind source separation techniques , the principles of blind source separation algorithms, related applications and research were discussed . Turbine noise problems and to use the blind source separation techniques for mechanical fault diagnosis, tests showed that the method we need fault signal can be separated from the mixed signal , fault diagnosis of steam turbine components successfully . Key Words:Mechanical Fault Diagnosis,Independent Component Analysis

人工智能方法故障诊断

人工智能方法故障诊断。 2基于人工智能的故障诊断方法的应用现状 基于人工智能的故障诊断方法不需要知道被控对象的精确模型,能很好的应对不确定性和模糊性的随机故障。目前基于人工智能的故障诊断方法主要有以下几个方向:基于模糊的方法、基于神经网络的方法、专家系统故障诊断方法、基于遗传算法、支持向量机的方法、基于数据挖掘的方法、基于图论的模型推理方法等,以下是对几种故障诊断方法的具体论述。 2.1基于模糊的故障诊断方法 在模糊诊断中,各种故障征兆和故障成因之间都存在不同程度的因果关系,但表现在故障与征兆之间并非存在一一对应的关系,故障征兆信息的随机性、模糊性加上某些信息的不确定性,造成了故障形式复杂多样性。这种模糊性和随机性往往不能用精确的数学公式来描述,然而用模糊逻辑、模糊诊断矩阵等模糊理论来分析其故障与现象之间的不确定性关系是可行的,从模糊数学的角度看,故障诊断是一个模糊推理问题。因而基于模糊的诊断方法得到了长足的发展[2-4]。 故障诊断通常是基于一定的征兆,做出可能引起这些征兆的故障判别,而模糊逻辑系统是应用模糊理论解决问题的重要形式。研究表明,通过建立模糊逻辑系统,采用模糊推理的方法能够实现故障诊断。不过,成熟地应用基于模糊逻辑系统的故障诊断方法,需要解决好如何建立模糊诊断规则库等关键问题。 常用的模糊逻辑诊断方法一般步骤是检测信号经过模糊化单元处理后,输入到模糊推理规则库中进行分析,其输出即为故障信息的模糊输出,经过解模糊单元处理后即可得出故障原因。 另外一种基于模糊理论的诊断方法是用模糊诊断矩阵来描述故障原因和故障征兆之间关系的方法。其模糊关系矩阵的数学模型为[3]: T T Y RX = 12(,,...,) n y y y Y μμμ= 12(,,...,) m x x x X μμμ= 1112112 2221 2 ......()............... m m ij n xm n n n m r r r r r r R r r r r ?? ??? ? ==?? ?????? 式中:Y 为诊断矩阵, i y μ为对象具有故障 i y 的 隶属度(1,2,,)i n = ;X 为起因矩阵,j x μ 为对象 具有症状 j x 的隶属度(1,2,,)j m = ;R 为征兆矩 阵,描述了故障征兆与故障原因之间的关系。 1 1 m ij i r ==∑(01;1;1) ij r i n j m ≤≤≤≤≤≤。 基于模糊的故障诊断方法的优点在于:可将人类的语言化的知识嵌入系统;可模拟人类的近似推理能力,且通用性好,只要针对不同的故障类型对推理规则进行修改就可以应当不同的故障诊断。 但与传统的故障诊断理论和方法相比,仍有不成熟之处:基于模糊逻辑的故障诊断方法缺少在线学习能力,不适应被控对象变化的需要;模糊隶属函数和模糊推理规则无法保证任何情况下都为最优;尚未建立起有效的方法来分析和设计模糊系统,主要还是依赖专家经验和试凑。 2.2基于人工神经网络的故障诊断方法 从故障诊断的过程来讲,故障诊断实质上也是一类模式分类问题,而人工神经网络(ANN)作为一种自适应的模式识别技术,非常适合用于建立大型复杂系统的智能化故障诊断系统。神经网络通过输入层、隐含层和输出层来建立故障类型和故障原因之间复杂的映射关系。 基于神经网络的故障诊断方法具有强大的自学习和数据处理能力,其分类方式通过网络学习来确定系统参数和结构来完成训练过程。将样本库的知识以网络的形式存储在神经网络的连接权中是神经网络的独特之处。待检测故障信息经已训练好的网络处理后可自动对被识别对象进行分类。故障诊断中神经网络所采用的模型大多为BP 网络,这主要由于对BP 模型的研究比 较成熟[5-6]。神经网络故障诊断技术被广泛应用于

相关主题
文本预览
相关文档 最新文档