平均故障间隔时间MTBF.pptx
- 格式:pptx
- 大小:733.16 KB
- 文档页数:38
平均故障间隔时间(MTBF)目录一、MTBF的定义二、指标计算一、MTBF的定义今天我们来讲和MTTR相关的另一个概念,同样是维修领域常见的关键绩效指标(KPI),叫做平均故障间隔时间,英文是Mean TimeBetween Failure (MTBF)。
还有一个类似的KPI,叫做 Mean Time ToFailure (MTTF),中文翻译的时候很多也翻译成平均故障间隔时间。
但是这两个有一点差别,MTBF一般用于可以修复的设备考量,而MTTF一般用于不可修复的设备考量,比如灯泡之类的。
平均故障间隔时间是指设备在两次故障之间的运行时间。
这个数值的不断提高,体现了设备可靠性的提升。
二、指标计算:MTBF = 总共运行时间(小时)/故障次数计算时要先指定评估时间段,我们还是用上次讲MTTR的那个图表来说明如何计算MTBF。
但要注意总共运行时间是在这个评估时间段内所有时间的总和,包含了运转,维修的所有时间,不是狭义地指设备运转完好的时间。
评估时间段:1000小时总共运行时间:1000小时故障次数:10次MTBF=1000小时/10次=100小时那么如果上述设备是不可修复设备,我们来计算一下MTTF。
由于设备不可修复,上图中10个设备到达故障的时间分别是100,152,192,297,433,548,689,757,823和951小时。
那么最终:MTTF=(100+152+192+297+433+485+689+757+823+951) / 10 = 487.9小时另外,值得再说明一下的是,在SMRP的标准里是将MTBF的倒数作为故障率来使用的。
但是在IEC标准里是将MTTF的倒数作为故障率来使用的。
主要是由于侧重的设备类别不一样,大家根据可以不可以修复来区分的话,应该不会混淆和互相干扰。
MTBFMTBF,即平均无故障时间,英文全称是“Mean Time Between Failure”。
是衡量一个产品(尤其是电器产品)的可靠性指标。
单位为“小时”。
它反映了产品的时间质量,是体现产品在规定时间内保持功能的一种能力。
具体来说,是指相邻两次故障之间的平均工作时间,也称为平均故障间隔。
它仅适用于可维修产品。
同时也规定产品在总的使用阶段累计工作时间与故障次数的比值为MTBF。
磁盘阵列产品一般MTBF不能低于50000小时。
随着伺服器的广泛应用,对伺服器的可靠性提出了更高的要求。
所谓“可靠性”,就是产品在规定条件下和规定时间内完成规定功能的能力;反之,产品或其一部分不能或将不能完成规定的功能是出故障。
概括地说,产品故障少的就是可靠性高,产品的故障总数与寿命单位总数之比叫“故障率”(Failure rate),常用λ表示。
例如正在运行中的100只硬碟,一年之内出了2次故障,则每个硬碟的故障率为0.02次/年。
当产品的寿命服从指数分布时,其故障率的倒数就叫做平均故障间隔时间(Mean Time Between Failures),简称MTBF。
即:MTBF=1/λ笔者最近看到一款可用于伺服器的WD Caviar RE2 7200 RPM 硬碟,MTBF 高达120万小时,保修5年。
120万小时约为137年,并不是说该种硬碟每只均能工作137年不出故障。
由MTBF=1/λ可知λ=1/MTBF=1/137年,即该硬碟的平均年故障率约为0.7%,一年内,平均1000只硬碟有7只会出故障。
上图所示为著名的“浴盆”曲线,左边斜线部分为早期故障率,其故障率一般较高且随着时间推移很快下降。
曲线中部为使用寿命期,其故障率一般很低且基本固定。
最右部为耗损期,失效率急速升高。
电子产品制造商一般通过测试、老炼、筛选等手段将早期故障尽量剔除,然后提供给客户使用。
当使用寿命期将尽,产品也即将进入故障高发期,需要报废或更新换代了。
平均故障间隔时间: 说明和标准版本 1作者 Wendy Torell 和 Victor Avelar简介2什么是故障?什么是假设? 2定义的可靠性、可用性、MTBF 和MTTR3预测和估计MTBF 的方法 5结论 8资源 9点击内容即可跳转至具体章节目录第78号白皮书白皮书现收录于施耐德电气白皮书资料库平均故障间隔时间 (MTBF) 已经作为一种决策依据使用了60多年。
随着时间的推移,已经出现了20多种预测生命周期的方法和程序。
因此,MTBF 一直是一个争论不休的话题,这也就不足为奇了。
有一个领域这种情况尤为明显,那就是设计放置IT 和电信设备的任务关键设施。
如果短时间的停机也可能会对业务的市场价值产生负面影响,那么,支持这个网络环境的物理基础设施就一定要可靠。
如果没有透彻地了解MTBF ,可能就无法实现业务可靠性目标。
本白皮书通篇使用示例来说明MTBF 的方方面面,旨在化繁为简、澄清误解。
在评估任何MTBF 值时,都应首先问这两个问题。
如果不回答这两个问题,讨论将毫无意义。
人们在提到MTBF 时经常不提供对故障的定义。
这种做法不仅仅会误导,而且是毫无意义的。
这就有点像人们在宣传汽车的节油性时使用“每箱油行驶的英里数”这个指标,但同时却不提供油箱的容积(公升或加仑)。
为了消除这种不确定性,应该表明故障有两种基本定义:1. 产品整体失效,无法实现其所应实现的功能。
12. 个别组件失效,无法实现其应实现的功能,但不是产品整体失效,无法实现该产品应实现的功能。
2以下两个示例说明产品中的特定故障模式也许属于故障,也许不属于故障,具体将取决于所选的故障定义。
示例1:如果RAID 阵列中的某个冗余磁盘出现故障,该故障不会妨碍RAID 阵列实现其应实现的功能,即随时提供关键数据。
不过,该磁盘故障会妨碍磁盘阵列中的某个组件实现其应实现的功能,即提供存储容量。
因此,根据定义1,这种情况不属于故障,但是根据定义2,这种情况属于故障。
MTBF平均无故障时间介绍MTBF(Mean Time Between Failures)即平均无故障时间,是一个重要的可靠性参数,用于衡量设备或系统在正常工作条件下平均无故障运行的时间。
MTBF是衡量设备稳定性和可靠性的关键指标,对于保证生产过程的连续性和提供高质量服务至关重要。
本文将介绍MTBF的概念、计算方法和应用领域,并探讨如何提高MTBF值。
首先,MTBF是指在没有维修或更换的情况下,设备或系统能够连续正常运行的平均时间。
通常以小时(h)为单位进行度量。
MTBF表示的是设备或系统在正常工作条件下的平均寿命,即在此期间内无故障发生的时间。
为了计算MTBF,首先需要收集设备或系统的故障数据。
这些数据包括设备故障的发生时间以及故障修复的时间。
然后,将所有故障修复时间累加起来,再除以故障发生的次数,即可得到平均无故障时间。
例如,如果在一个设备上有10次故障发生,累计故障修复时间为100个小时,那么MTBF就是100小时/10次=10小时。
MTBF的应用领域广泛,包括电子设备、通信网络、制造业等。
在这些领域中,设备的稳定性和可靠性对于保证正常运营至关重要。
通过计算MTBF可以评估设备的可靠性水平,并进行故障预测和维护计划。
例如,在制造业中,MTBF可以用来评估设备的稳定性,优化生产效率和减少停机时间。
在通信网络中,MTBF可以用来评估网络设备的可靠性,提高网络的稳定性和可靠性。
为了提高MTBF值,可以采取一系列措施。
首先,选择高质量的设备和零部件是提高MTBF的关键步骤。
优质的设备和零部件通常具有更长的平均无故障时间。
其次,进行定期的维护和保养工作,可以减少设备故障的发生。
定期的维护能够提早发现潜在问题并进行修复,从而减少设备停机的风险。
此外,技术支持和培训也可以帮助提高MTBF。
员工接受培训后,能够更好地理解设备运行和维护的要点,及时处理设备故障。
总结一下,MTBF是设备或系统在正常工作条件下平均无故障运行的时间。
可靠承载重托:关注产品的MTBF平均无故障时间(上)对MTBF的理解偶尔会有朋友咨询:产品的MTBF是80000小时,我用这个产品,能确保80000小时内不会出故障吗?这是个有点类似于一米的长度和一斤的重量哪个大的问题,好纠结。
MTBF(Mean Time Between Failure):即平均故障间隔时间,是衡量一个产品(尤其是电器产品)的可靠性指标,单位为“小时”。
产品的故障总数与寿命单位总数之比为“故障率”,用λ表示,故障率的倒数就是MTBF,即:MTBF=1/λ。
以硬盘为例,查询希捷一款型号为“ST2000NX0263”2TB的硬盘规格书,MTBF指标为140万小时。
140万小时,约为160年,并不是说这种硬盘能用160年不出故障,由MTBF=1/λ可知,λ=1/ MTBF=1/160年,即这个型号硬盘的平均年故障率约为0.6%,一年内,平均1000只硬盘有6只会出故障。
产品质量的浴盆曲线前人已通过实践证明,大多数设备的故障率是时间的函数,典型故障曲线称之为浴盆曲线(Bathtub curve,失效率曲线) ,如下图。
曲线的形状呈两头高,中间低,具有明显的阶段性,可划分为三个阶段:早期的失效故障(随时间推移快速下降),使用寿命期的故障(故障率较低,且比较稳定),寿命后期的故障(接近产品的使用寿命,故障率剧增)。
由浴盆曲线可知,在早期失效期,产品在开始使用时,失效率很高,但随着产品工作时间的增加,失效率迅速降低,这一阶段失效的原因大多是由于设计、原材料或制造过程中的缺陷造成的。
因此,提高MTBF见效较快、投入较低,同时也是很多厂商在做的方法就是:产品在出厂前,先进行老炼筛选测试,以便及早发现、排除故障,或剔除不合格品,以保证产品的供货质量。
例如:拿电源来说,根据产品的不同,出厂前都需做适当的高温老炼,老炼完毕再测试包装入库。
图4 电源高温老化车图5 电源老化负载板。
手把手教你计算MTBF(平均故障间隔时间),有实例!1、一般常用单位计算在单位时间内(一般以年为单位),产品的故障总数与运行的产品总量之比叫“故障率”(Failurerate),常用λ表示。
例如网上运行了100台某设备,一年之内出了2次故障,则该设备的故障率为0.02次/年。
当产品的寿命服从指数分布时,其故障率的倒数就叫做平均故障间隔时间(MeanTime Between Failures),简称MTBF。
即:MTBF=1/λ。
标准故障率的曲线可以用众所周知的“浴盆曲线”来描述。
所有元件和系统的曲线形状都近似相同-只是时间轴方向上的延伸率不同。
它可以分为三个区域:早期故障期(I),有效工作期(II),生命终期(III)。
MTTF(见下文)包含了区域I和II,而MTBF只包含了区域(II)。
例如,某型号YY产品的MTBF时间高达16万小时。
16万小时约为18年,并不是说YY产品每台均能工作18年不出故障。
由MTBF=1/λ可知,λ=1/MTBF=1/18年(假如YY产品的寿命服从指数分布),即YY产品平均年故障率约为5.5%,一年内,平均1000台设备有55台会出故障。
整机可靠性指标用平均故障间隔时间表示:MTBF=(T1+T2+…Tn)/ rn式中:MTBF——整机的平均故障间隔时间,h;Ti——第i台被试整机的累计工作时间,h;rn——被试整机在试验期间内出现的故障总数。
2、串并联部件所导致的MTBF不同λ=1/MTBF(h)如果两个部件串联工作,其中一个发生失效,整个功能就失效了,串联结构的:λ总=λ1+λ2或MTBF总=1/(λ1+λ2)对于并联或冗余的结构,虽然一个部件失效,但仍然维持功能的完整性(100%);1/λ总=(1/λ1)+(1/λ2)+(1/(λ1+λ2))或MTBF总=(λ21 + λ1λ2 +λ22)/(λ21λ2 +λ1λ22)3、一般产品的MTBF计算平均失效(故障)前时间(MTTF)设N0个不可修复的产品在同样条件下进行试验,测得其全部失效时间为T1,T2,……TN0。
设备平均故障间隔时间统计标准
1目的
为规范设备管理程序,提高设备利用率和使用寿命,监控设备运行情况特制定以下设备运行参数管理办法。
2 范围
适用于公司所有设备的控制
3计算公式
平均故障间隔时间(MTBF)=每月正常运作时间加总÷每月故障次数
4统计方法
4.1确定要分析的特定产品抽样总体。
4.2确定从抽样总体中采集故障数据的样本时间范围。
4.3定义故障必须准确定义故障,确保评估过程的一致性后,才能开始统计故障。
4.4接收、诊断和修理产品样本期间结束时间和AFR计算时间之间必须有足够的时间间隔,以允许一定的时间来接收、诊断和修理报告为有故障的产品。
4.5计算年故障率计算年故障率是用来说明某个特定产品在一个日历年度内的预期故障数。
编制:审核:批准:日期:。
14.5平均无故障时间(MTBF)计算1.EPS的可靠性以平均无故障工作时间MTBF来衡量,我公司产品的MTBF最低可接受水平m1应不小于200000h 。
2. 产品的可靠性模型符号及说明:λa: 整流电路失效率λd:AC-DC电路失效率λn:INV逆变电路失效率λc:开关失效率产品的可靠性数学模型:λ总=λa+λd+λn+λc=Σλi 公式1产品的平均无故障工作时间表示为:MTBF = 1÷[(1+r) Σλi] 公式2其中: r 为计算λ时用于补偿未统计进的元器件的失效率,一般取0.05-0.23.产品的可靠性分析与设计产品的可靠性主要要求:产品应具有较长的平均无故障工作时间MTBF (不小于200000h)4.产品的可靠性预测及分配对于EPS而言,可靠性模型属于串联系统,预测计算方法可用简单的串联模式“失效代数和”,即用公式1和公式2计算(1)30KW以下EPS主要元器件可靠性预测根据公式1、2计算λ总=4.499×10-6/hMTBF = 1÷[(1+r) λ总]=1÷[(1+0.1)4.499×10-6/h]=202065 h (2)30KW~55KWEPS主要元器件可靠性预测根据公式1、2计算λ总=4.459×10-6/hMTBF = 1÷[(1+r) λ总]=1÷[(1+0.1)4.459×10-6/h]=203877 h14.6平均修复时间(MTTR)计算平均修复时间:MTTR=ΣFi/n其中:Fi——故障发生时刻开始,到解决故障为止的时间。
n——次数我方从接到报修通知到赶到现场的时间最短时间是0.6小时,最长时间是1小时。
按n=10,则我方响应时间不低于:F1=0.6小时;F2=0.6小时;F3=0.6小时;F4=0.8小时;F5=0.8小时;F6=0.8小时;F7=1小时;F8=1小时;F9=1小时;F10=1小时;MTTR= (F1+F2+F3+F4+F5+F6+F7+F8+F9+F10)/n= (0.6+0.6+0.6+0.8+0.8+0.8+0.8+1+1+1)/10= 0.8小时。
2-2-5 可靠性分析报告1.)设备的可靠性设备可靠性通常由设备的平均无故障工作时间MTBF来描述,它定义为利用数学统计方法计算出的设备在发生两次故障之间的运行时间。
对设备来讲,MTBF为两次停机(输出断电)故障之间十佳的统计平均值。
设备的MTBF越大,则可靠性越高。
为了叙述问题方便,又定义了设备的平均故障率λ:λ= 1/MTBF (1/h)公式1即设备在单位时间段内出现故障的概率。
当取时间段为1年时,λ表示设备的年平均故障率。
受元器件制造工艺及整机制造工艺的限制,目前同类产品的MTBF最高只能达到500kh,即年平均故障率为24h×365/500kh=1.8%。
一般产品的MTBF通常在50~500kh之间。
我方提供的设备单机的MTBF大于300kh。
设备的可靠性还要考虑设备的平均修复时间MTTR,它是设备发生故障后通过维修而重新投入使用所需的平均时间。
提高系统可靠性的方法主要有两个:一是提高工艺方面的因素;二是采用冗余技术。
2. )多机并联冗余技术对于如下图所示的由四台相同的单机设备并联冗余系统来讲,其整个系统的可靠性可表述为:四台相同EPS双机并联冗余系统的可靠性λSystem= 2λ4UPS +λcom 公式23λUPS +µUPS式中,λSystem为整个系统的平均故障率λUPS为单机的平均故障率λcom为公共环节的平均故障率µUPS为的平均维修率由公式2中可以看出,提高µUPS ,减小λUPS和λcom可以减少λSystem,一般情况下,MTBF>>MTTR,即µUPS >>λUPS,则公式2又可近似为:λSystem= 2λ4UPS+λcomµUPS= 2λUPS ·λUPS+λcomµUPS通常情况下,公共环节的设计原则是少而精,所及平均故障率极低。
若忽略λcom,则有λSystem≈ 2λUPS ·λUPSµUPS又因2λUPS << µUPS,即 2λUPS<<1,µUPS故有λSystem<<λUPS即整个并机冗余系统的平均故障率比单机大大地降低了。