第 9 章 可靠性数据检验与分 布参数 估 计
- 格式:ppt
- 大小:477.00 KB
- 文档页数:50
可靠性概念理解:可靠性是部件、元件、产品、或系统的完整性的最佳数量的度量。
可靠性是指部件、元件、产品或系统在规定的环境下、规定的时间内、规定条件下无故障的完成其规定功能的概率。
从广义上讲,可靠性”是指使用者对产品的满意程度或对企业的信赖程度。
可靠性的技术是建立在多门学科的基础上的,例如:概率论和数理统计,材料、结构物性学,故障物理,基础试验技术,环境技术等。
可靠性技术在生产过程可以分为:可靠性设计、可靠性试验、制造阶段可靠性、使用阶段可靠性、可靠性管理。
我们做的可靠性评估应该就属于使用阶段的可靠性。
机床的可靠性评定总则在GB/T23567中有详细的介绍,对故障判定、抽样原则、试验方式、试验条件、试验方法、故障检测、数据的采集、可靠性的评定指标以及结果的判定都有规范的方法。
对机床的可靠性评估时,可以在此基础上加上自己即时的方法,做出准确的评估和数据的收集。
可靠性研究的方法大致可以分为以下几种:1)产品历史经验数据的积累;2)通过失效分析(Failure Analyze)方法寻找产品失效的机理;3)建立典型的失效模式;4)通过可靠性环境和加速试验建立试验数据和真实寿命之间的对应关系;5)用可靠性环境和加速试验标准代替产品的寿命认证;6)建立数学模型描述产品寿命的变化规律;7)通过软件仿真在设计阶段预测产品的寿命;大致可把可靠性评估分为三个阶段:准备阶段、前提工作、重点工作。
准备阶段:数据的采集(《数控机床可靠性试验数据抽样方法研究》北京科技大学张宏斌)用于收集可靠性数据,并对其量化的方法是概率数学和统计学。
在可靠性工程中要涉及到不确定性问题。
我们关心的是分布的极尾部状态和可能未必有的载荷和强度的组合,在这种情形下,经常难以对变异性进行量化,而且数据很昂贵。
因此,把统计学理论应用于可靠性工程会更困难。
当前,对于数控机床可靠性研究数据的收集方法却很少有人提及,甚至可以说是一片空白。
目前,可靠性数据的收集基本上是以简单随机抽样为主,甚至在某些情况下只采用了某一个厂家在某一个时间段内生产的机床进行统计分析。
可靠性工程师模拟题及答案21.关于环境适应性与可靠性关系的说法,正确的是()。
两者都与装备所遇到的环境密切相关,而环境条件不仅指寿命期遇到的极端环境条件,还包括整个寿命周期中可能遇到的各种环境条件。
2.关于平均修复时间的说法,正确的是()。
修复时间不是一个确定量,而是受到多种因素的影响,因此一般只作为使用参数参考。
维修总时间与被修复产品的故障总数之比可以用来评估维修效率,而维修级别也会影响修复时间。
3.关于可靠性强化试验中高/低温试验剖面的说法,正确的是()。
每步保持时间应包括产品完全热/冷透的时间和产品检测所需时间。
步长通常为10℃,但在某些情况下可以增加到20℃或减小到5℃。
起始点温度一般在室温或接近室温的条件下开始,而步长在高/低温工作极限后调整为15℃或更长。
4.关于可靠性增长试验(RGT)的说法,错误的是()。
RGT是产品工程研发阶段中的一个可靠性工作项目,但受试产品必须经过环境应力筛选才能进行试验。
RGT一般安排在工程研发基本完成之后和可靠性鉴定(确认)试验之前,其目的是通过近似于工作环境条件下的试验来暴露设备的故障。
5.下列不属于“通用质量特性”的是()。
舒适性不属于通用质量特性,而可靠性、维修性和安全性都是通用质量特性。
6.可靠性鉴定试验和寿命试验是为了验证产品是否达到了规定的可靠性或寿命要求的。
而可靠性增长试验是通过暴露设备的故障来逐步提高其可靠性。
7.制定综合保障计划的是订购方,其目的是确保装备在整个使用寿命周期中得到有效的支持和维护。
8.制定综合保障工作计划的是承制方,其目的是根据综合保障计划制定具体的保障措施和工作计划。
9.纠正措施报告中必需包含截止日期、责任部门和故障证据,而故障费用不是必需的。
10.关于分布参数点估计解析法的说法,错误的是()。
最小二乘法和极大似然法并不适用于所有情况,而矩法只适用于完全样本情况。
最好线性无偏和最好线性不变估计法只适用于定数截尾情况,而极大似然法适用于定数截尾情况,并且求解方法相对简单。
第26卷Vol126 第3期No13西华师范大学学报(自然科学版)Journal of China W est Nor mal University(Natural Sciences)2005年9月Sep12005文章编号:100128220(2005)0320334204可靠性统计与数据挖掘①张德然(西华师范大学数学与信息学院,四川南充637002)摘 要:讨论了可靠性统计与数据挖掘之间的关系.指出了用统计的理论与方法去进行数据挖掘在目前情况下仍不失是一种重要的方法.关键词:可靠性统计;异常数据;数据挖掘中图分类号:O21312 文献标识码:B1 前 言可靠性是产品寿命指标的总称,故产品的寿命指标又称为产品的可靠性指标.它反映了一个产品在规定时间内和规定条件下完成规定功能的能力.小到一个电子元件,大到一个系统,由于其寿命均是一个随机变量,所以确定可靠性指标最后都归结为一个统计推断问题.半个多世纪以来,可靠性的理论和方法经历了20世纪50年代的起步阶段,60年代的发展阶段,70年代的成熟阶段,80年代的更深更广的发展及90年代以来进入的综合化、自动化、智能化和实用发展的阶段,目前伴随着科学技术的发展,一些来自各行各业的新的问题的不断提出及不断地得以研究解决,可靠性统计已逐渐成熟,其特点可概括为:内容丰富,发展迅速,应用广泛.2 可靠性统计可靠性统计是基于数据(一般统称为寿命数据)的,其数学基础是概率论与数理统计.许多统计专家指出:数据的可信性一直是困扰统计工作者的一个首要问题.因为谁都知道,从虚假的数据出发很难作出正确的决策,“歪打正着”在复杂的决策中能够奏效的可能性几乎不存在.19世纪美国人亚特姆斯・沃德(A rte2 mus ward)说过的一句话,一针见血地指出了虚假资料的危害:“办事不利非因无知实因误知.”(It isn’t the things we don’t kno w that gets us in tr ouble.It’s the things we know that aren’t s o).3 数据挖掘正是基于上述,数据的收集、整理、分析以及在不同获取数据方式之下对几种常用寿命分布中的参数估计及相关检验是近年来可靠性统计研究的热点,并不断有新的突破和进展,而其中工作的重中之重则是从我们所拥有的大量的数据中找出有用信息,这就是数据挖掘(Data M ining).数据挖掘可定义为从大规模数据中找出隐藏其中的有意义、重要的信息或模式的探索过程.在可靠性统计中,不论是对完全寿命试验,还是截尾寿命试验,乃至近年来新发展起来的有效的缩短试验时间的加速寿命试验,其有用信息的获取总是通过构造样本的函数,即数据挖掘是通过构造适当的统计量来实现的.众所周知,数据的质量问题本质上是误差问题,即提供的数据与客观实际的数量之间的差距问题.如果数据中混进了异常值,就会使相应统计分析误差增大,小则出差错,大则发生事故,甚至导致宏观决策上的失①收稿日期:2005-04-20基金项目:全国统计科学研究立项资助项目(LX03-Y23);安徽省教育厅自然科学研究资助项目(2004KJ306).作者简介:张德然(1953-),男,安徽阜阳人,西华师范大学数学与信息学院副教授,主要从事概率论与数理统计的教学及研究工作. 第26卷第3期张德然:可靠性统计与数据挖掘335 误.因此,从已有数据中剔除异常值无疑是数据挖掘一个重要组成部分.基于此,长期以来,国内外一些专家针对具体的寿命分布进行了相关异常值检验的研究.象马逢时等将D ixon型统计量rij =x(n)-x(n-i)x(n)-x(j+1),i=1,2;j=0,1,2,作为剔除特大异常值的检验用到极值分布,导出其在假设H0下的分布函数,并给出了分位点表,但这只能用来做“Consecutive”检验(即依顺序一个一个地检验),而不能用在“B l ock”检验(即最大的或最小的几个数据同时得到检验).Barnett and le wis给出了T1=x(1)∑xj似然比检验统计量,用来检验指数样本x1,x2,…,xn 中的单个下异常值x(1).对于多个下异常值的非一致性检验,传统的方法用检验单个下异常值的方法逐步进行,即为Consecutive-test.例如用Tk =x(k)x(K)+…+x(n)来检验第k个下异常值x(k),而把x(k),…,x(n)仅简单地认为来自顺序统计量y1,y2,…,y n-k的样本,它没有充分利用样本信息,功效不高,而且T k的临界值t k(α)是从T1的临界值表中近似得到的.王蓉华、费鹤良、徐晓岭1998年提出了一种适用多种分布(单参数指数分布,两参数weibull分布,两参数对数正态分布)的异常值检验的统一的新方法———均值比检验,它一次能检验出多个异常数据.如此等等,一些文献讨论的异常数据的检验方法其给出的检验统计量经常遇到Masking效应和S wanp ing效应.同时其给出的检验统计量一般只适用于数据中仅有异常大数据或仅有异常小数据,不适用于两者都存在的情形.2001年,王炳兴从由于异常数据在样本中只是极少数,因此有序样本的中间部分应都是正常数据这一思考出发,针对指数分布场合,利用参数θ的BLUE之比构造出一个近似的F-统计量,由中间正常数据出发,分别向左或向右添加一个相邻数据,用所构造的检验统计量重复进行检验,直至找出最小的异常大值及最大的异常小值为止.2003年,张德然、茆诗松针对指数分布场合同对存在异常大和异常小值的情况给出了“取中逐步推移检验法”.由于每一检验步骤中除了添加数据可能是异常值外,不包含其它异常数据,因此能克服Masking效应和S wa mp ing效应,它不但适合异常大及异常小值同时存在的检验,而且也适用于仅含异常大或异常小值的检验.同时,国家标准局也分别针对正态样本,I型极值分布样本及指数样本等给出了异常值的判断和处理方法.如此等等,概括起来说,文献中异常数据的检验方法不外乎二类:(1)从整体样本出发,利用某个检验统计量逐步排除异常值;(2)利用某种方法,如根据某个准则找出可疑的数据集,然后用合适的检验统计量检验这个数据集是否异常.例如,在张德然、茆诗松针对指数分布场合同对x(1),…,x(n)中存在异常大和异常小值的情况给出了“取中逐步推移检验法”中,从整体样本出发,根据^uk+1/^u k的差异大小这个准则找出可疑的数据集,然后用F检验统计量检验这个数据集是否异常.^uk =1k∑ki=1x(j)+(n-k)x(k).4 应用实例例1 对单参数指数分布我们取n=10,k=6,其中x(1),…,x(6)来自标准指数分布,x(7),…,x(10)来自参数θ为5的指数分布,用Monte carl o模拟的方法产生这10个随机数如下:010799,011363,012793,014231,016179,019212,418216,518336,815491,131559.利用uk =1k∑ki=1x(i)+(n-k)x(k),分别计算统计量^u k+1/^u k(1≤k≤9)得各点的跳跃度如下: 018174,112504,110582,110704,111064,310343,019972,110837,110342.比较上述数据可知,对右侧而言,在k=6处跳跃度最大,x(7),…,x(10)极大可能为异常大值,取1-α=0195,f0195(2,12)=3189,u0195=f0195(2,12)+67=114129.显然有^u k+1/^u k=310343>^u0195=114129.所以x(7)=418216为异常大值.且针对样本数据010799,011363,012793,014231,016179,019212而言,u0195=f0195(2,12)+66+1=3189+67=114129而^u6/^u5=111064<^u0195=114129,故x(6)=019212不是异常值. 西华师范大学学报(自然科学版) 2005年336所以x=418216是最小的异常大值,从而418216,518336,815491,1310559均为异常大值.(7)单一的统计,单一的常用数据挖掘技术可能将某些异常值漏除或者将真值剔除,这是数据挖掘要尽量避免的.这里提供一种解决方案就是,综合用几种方法进行检验,这样可以较好的避免该类错误的发生.例如在解决上例时,用张德然、茆诗松针对指数分布场合同对存在异常大和异常小值的情况给出了“取中逐步推移检验法”后,再用王蓉华、费鹤良、徐晓岭1998年提出均值比检验,检验后,该例的异常值仍为418216, 518336,815491,1310559因此,该我们可以确定该组数据:010799,011363,012793,014231,016179, 019212,418216,518336,815491,131559的异常值为4.8216,5.8336,8.5491,13.0559.可见,通过构造样本函数是可靠性统计中实施数据挖掘的一种很重要的方法.同时利用一些数据的可视化工具,如直方图、散点图等以及聚类分析、要因分析等一些探索数据的解析方法进行数据挖掘也同样在可靠性统计的某些特定背景下充当着重要角色.这些都足以表明,高效地对数据进行视觉化及理性化处理,是保证可靠性统计中推断质量的充要条件.5 结束语面向21世纪的信息社会,理学性质的理论和实践应用与方法的研究齐头并进.特别是随着信息科学的进步,可靠性统计应用的范围越来越广.虽然统计数据的计算变得简单了,但根据研究对象的不同,统计分析方法也相对复杂化、专业化,数据处理及数据采集挖掘的方法必然会呈现出多样化.就拿异常值的检验而言,那些理论上被剔除的异常值是相对一定精度而言的,毕竟它们和其它数据一样也来自同一总体,因此或多或少的会带来一些总体的信息.何况检验本身也会犯错误.所以从某种意义上讲,这种剔除也可能会使一部分信息丢失,如何能在数据挖掘过程中不丢失或极大可能的少丢失有用的信息,这仍是今后需要研究的课题.事实上,可靠性统计与数据挖掘既各自有自己的特色内容但在很多背景下密切相关.概括起来讲,没有数据挖掘,就没有可靠性统计的理论与方法,可靠性统计的理论与方法不断发展又激励着数据挖掘技术的不断创只给出分布的具体函数形式,而其中含有未知参数,为了保新与完善.譬如在χ2-拟合优度检验中,假设Ho证数据信息的可靠性,我们首先抽取一样本数据来估计未知参数,之后再随机抽取一样本,从中挖掘有用的信息来检验H.在数据的挖掘的过程中可靠性统计的理论和方法又发挥着支撑作用.在前面已阐述的异常o值的检验问题已足以说明了这一点.陈希孺院士在《数理统计学:世纪末的回顾与展望》中指出:“统计学和其他学科结合发展是一个正确的方向,也极可能成为未来发展的主流之一”.近年来,统计方法在各领域的广泛应用及所获得的成功,已使它的地位与作用发生了重大变化.运用各种统计方法与相应的软件工具对数据进行挖掘,从不同视角、不同层面进行分析比较,其内容极为丰富.信息科学的进步为可靠性统计的发展提供了广阔的空间,数据挖掘同样需要可靠性统计及计算机科学等学科的融通协作.如何发挥各学科的优势,最大程度地避免人为因素的干扰,有效地从数据中挖掘出有意义的信息仍是一个值得进一步深入研究的问题.但就可靠性统计而言,用统计的理论与方法去进行数据挖掘至少在目前情况下仍不失是一种重要方法.参考文献:[1] 张德然,茆诗松.指数分布场合下同时存在异常大和异常小值的检验[J].应用数学,2004,17(1):55-60.[2] 张德然.统计数据中异常值的检验方法[J].统计研究,2003(5):53-55.[3] BEST D J,J C W.Test of Fit f or the Geometric D istributi on,Communicati on in Statistics Theory and M ethods[J].2003,32(5):913-928.[4] 孙薇斌.数据挖掘中统计方法的作用和问题点[J].数理统计与管理,2004,23(5):78-80.[5] 张尧庭.数据的统计处理和解释[M].北京:中国标准出版社,1997.[6] 陈希儒.高等数理统计学[M].合肥:中国科学技术大学出版社,1999.[7] 张志华.加速寿命试验及其统计分析[M].北京:北京工业大学出版社,2002.[8] 王容华.异常数据检验的均值比方法[J].数理统计与应用概率,1998,13(1):63-70.[9] 王炳兴.指数分布场合异常数据的检验[J].应用概率统计,2001,17(3):255-259. 第26卷第3期张德然:可靠性统计与数据挖掘337Reli a bility St atisti cs&Dat a M i n i n gZHANG De2ran(College of Math and I nf or mati on.China W est Nor mal University,Nanchong637002,China)Abstract:I n this paper,we have discussed the relati ons bet w een data m ining and reliability statistics.W e have pointed out that no w it is an i m portant method t o take data m ining by statistics theory and method.Key words:reliability statistics;outlier value;data m ining(上接第320页)D iscussi on About Ther mal Spri n gs andThei r Develop ment Strategi es i n Chongqi n gHU Zhi2yi(College of T ouris m,Chongqing Nor mal University,Chongqing400047,China)Abstract:Ther mal s p ring t ouris m has beco me a hot t op ic in the field of t ouris m research in recent years.I n this pa2 per,the four maj or characteristics of ther mal s p rings in Chongqing have been generalized firstly,including the a2 bundance of ther mal s p rings res ources,the l ong hist ory f or devel opment and using,l ocating in a high density in a comparatively narr ow area and combining with other vari ous natural and cultural t ouris m res ources t ogether.Fur2 ther,based on the current p r oblem s in the p r ocess of ther mal s p rings devel opment in Chongqing,the author has put for ward suggesti ons in five as pects as foll o ws:(1)p racticing diversified devel opment pattern such as sanitarium pat2 tern,holiday res ort pattern;(2)strengthening the devel opment of access orial establishment;(3)reinf orcing the effectiveness of t ouris m marketing;(4)paying more attenti on t o the marketing i m age designing and p r omoting;(5)and never ignoring the p r otecti on of ther mal s p rings.Key words:ther mal s p rings;characteristics;devel opment strategy;Chongqing。