可靠性系列讲座-18
- 格式:pdf
- 大小:1.30 MB
- 文档页数:7
第一章绪论一、可靠性研究的意义可靠性(reliability)是部件、元件、产品或系统完整性的最佳数量的一种度量。
指部件、元件、产品或系统在规定的环境下、规定的时间内、规定的条件下无故障地完成规定功能的概率。
可靠性这门学科,从其问题的提出到目前得到广泛应用,已有约60 年历史。
随着产品功能的完善,容量和参数的增大及向机、电一体化方向发展,致使产品的结构日趋复杂,使用条件日趋苛刻。
于是产品发生故障和失效的潜在可能性越来越大,可靠性问题日渐突出。
现代社会生活中不乏由于产品失效或发生故障而造成重大事故的实例,使企业乃至国家的形象受到影响;反之,也有很多因重视产品质量和可靠性,而获得巨大效益和良好声誉的典型。
正因为如此,世界各工业发达国家对其产品还规定了可靠性指标。
指标值的高低决定着产品的价格和销路的好坏,因而成为市场竞争的重要内容。
可靠性研究是建立在数理统计的假设检验基础上,到目前为止已经应用于很多工业场合。
可靠性研究对于产品质量控制有着重要的意义。
例如,可靠性可以应用于工艺过程中,使工艺性和可靠性达到最优的匹配。
根据可靠性的定义,某机床加工工序的可靠度是指机床在该工序规定的条件和规定的时间内加工零件合格的可靠程度,而工艺过程的可靠性是被加工零件合格的可靠程度;因此在生产中,要提高加工合格零件的数目,就要提高工艺过程的可靠性,也就是在工艺过程的设计中,选用加工工序可靠高的机床。
通常讲的可靠性包括可靠性技术和可靠性管理两个方面。
为了适应市场经济和科学技术的发展,提高产品质量,企业必须要加强可靠性管理和可靠性技术。
可靠性管理是从产品或系统的规划、设计、投入使用直至报废分析为止的一系列提高和保证可靠性实施的管理活动。
可靠性管理的宗旨是为了最大可能地实现产品或系统的功能。
产品质量是指产品满足社会和用户要求的程度,它包括外观、性能、可靠性、寿命、经济性、安全性和维修性等。
质量管理是为了保证和提高产品质量,运用一整套质量管理体系、手段和方法所进行的系统管理活动。
丁展鹏老师课程具世界500强企业多年工作经验的生产及品质管理实战型专家信赖性(可靠性)工程研究【课程背景】你是否遇到这样的状况,已经交货到客户手里的产品,却遭到客户投诉产品在使用的时候出了问题,而在出厂时明明经过了全检啊!你去家电市场买的电视,在保修期内却频频出现故障。
在购买时明明调试OK啊!这类出厂时保证品质良好还不够,而是还要保证在顾客使用的保修期内品质还依然良好,才能赢得顾客的信赖。
这种物品在既定条件、规定期间内发挥了所要求性能的性质就是信赖性研究的范畴。
一件产品通常有自己的固有特性,这是产品的性能指标;而保证性能指标的能力就是信赖性指标。
通过信赖性研究可以确保产品不出故障,引申到就算出了故障也很容易修理,从而使自己的产品赢得顾客的信赖,创造大量的忠诚顾客,使公司的产品在激烈的市场竞争中立于不败之地。
【培训收益】:通过学习本课程,您将能够:1)掌握信赖性的分析方法,使自己的产品赢得顾客的信赖2)合理设计产品寿命,提高产品竞争力。
3)把错误消除在萌芽状态,缩短产品设计周期,降低设计成本。
4)掌握产品的维护维修保障方法,提高客户满意度。
【课程结构及特色】最前沿的理论讲解加500强企业大量管理案例分析,实战性强。
真正做到学以致用。
【培训对象】:企业质量及生产管理人员【培训时间】:1天第一章节:信赖性基本知识介绍◆信赖性定义◆性能指标和信赖性指标◆信赖性研究的目的和意义◆信赖性的起源与发展◆狭义信赖性及广义信赖性研究◆信赖性四大要素详解耐久性环境性:保存温湿度、保存温湿度、耐落下、耐振动、耐水/耐盐水/耐粉尘/耐光、有害物质(Pb、Cd等)(环境性测试视频)保全性信赖性设计(防呆设计)◆信赖性与质量管理第二章节:信赖性实验◆对象确定方法◆性能故障的定义方法◆信赖性时间的确定◆信赖性规定的使用条件确定方法第三章节:信赖性研究的重要指标◆信赖度R(t)◆不可信赖度F(t)◆平均故障间隔时间MTBF◆平均故障前时间MTTF◆总运转时间◆故障率λ(t)◆故障密度函数f(t)◆故障率与MTBF 及 MTTF的关系◆失效率曲线研究(浴盆曲线)◆失效率曲线的三阶段研究早期故障期偶发故障期磨耗故障期第四章节:信赖性研究数据解析◆产品寿命分布曲线分析◆产品发生故障情况与威布尔分布分析◆威布尔分布公司故障概率函数累计分布函数(Ft)期望值标准偏差故障率◆威布尔分布的理论参数研究m:形状参数η:尺度参数t :时间γ:位置参数◆偶发故障期信赖性研究(m=1、γ=0)◆威布尔分布概率纸信赖性研究(安全数据)推测m值推测平均寿命推测标准偏差推测任意时刻的信赖度推测产品寿命终止时间◆随机终止数据信赖性研究定时终止信赖性研究定数终止信赖性研究随机终止信赖性研究累计Hazard概率纸的运用(案例分析)◆定时终止和定数终止寿命估计估计的定义寿命的点估计寿命的区间估计第五章节经典信赖性设计方法◆简化设计法◆耐环境设计法(局部改善环境)◆加速试验法◆设计评审法◆低速运转法◆冗长设计法◆事故树分析法◆FMEA◆面向维修性的设计DFMt防错设计人体工程设计◆面向售后服务的设计售后保障资源的方案设计免费保修的期限和保修范围维修网络的规模备件的需求量及供应产品的报废处理◆售后保障资源的设计随机装箱的保障资源维修站的资源配备状况◆质量可靠性信息收集系统的建立客户抱怨、意见等信息的收集、传递、统计、分析系统◆面向环境的设计环境保护设计环境适应性设计第六章信赖性研究案例演示视频实际案例主讲:丁展鹏老师历任:东莞太阳诱电有限公司(日本企业50强)生产制造课部长;家乐福(世界500强法资公司)质量部经理、销售经理爱普生(中国)有限公司高级培训师、中国区培训负责人、公司现场质量改善(小集团活动)推进负责人、中国区TQC推进负责人,班组长伴随成长计划负责人.中国质量协会国家级顾问师、诊断师西北工业大学深圳研究院特聘讲师香港生产力促进局/香港工业协会顾问生产一线管理者技能培训专家、现场改善专家、品质管理实战型专家,在大型日资、法资等企业任职多年,主管过生产环节中的以下部门:人力资源、生产部门、品质部门、销售部门、技术开发部等,带队并作为评委参加过日本现场改善发表大会,在日本参观过多家工场的现场改善案、熟悉多种类型的生产制造管理,了解企业在各个阶段的发展需求,并有实际解决经验(为大冶有色、EPSON等多家公司实施过精益生产项目)培训特色:深谙成人学习方式,讲课风趣幽默,寓教于乐,将国外跨国公司先进的管理理论和国内企业的现状有机结合,总结出既有理论底蕴又有实用价值的管理方法,将“复杂的知识简单化,枯燥的说教幽默化、空洞的理论案例化”,深受学员欢迎。
可靠性基础知识第一节可靠性定义一、可靠性定义产品的可靠性是指:产品在规定的条件下、在规定的时间内完成规定的功能的能力。
从定义本身来说,它是产品的一种能力,这是一个很抽象的概念;我们可以用个例子(100个学生即将参加考试)来理解这个定义,可靠性就是指:100个学生的考分的平均是多少?对这个平均分的准确性有多大把握?分数越高、把握越大,可靠性就越高。
我国的可靠性工作起步较晚,20世纪70年代才开始在电子工业和航空工业中初步形成可靠性研究体系,并将其应用于军工产品。
其他行业可靠性工作起步更晚,差距更大,与先进国家差距20~30年,虽然国家已制订可靠性标准,但尚未引起所有企业的足够重视。
对产品而言,可靠性越高就越好。
可靠性高的产品,可以长时间正常工作(这正是所有消费者需要得到的);从专业术语上来说,就是产品的可靠性越高,产品可以无故障工作的时间就越长。
二、可靠性的重要性调查结果显示(如某公司市场部2001年调查记录):“对可靠性的重视度,与地区的经济发达程度成正比”。
例如,英国电讯(BT)关于可靠性管理/指标要求有产品寿命、MTBF报告、可靠性框图、失效树分析(FTA)、可靠性测试计划和测试报告等;泰国只有MTBF和MTTF的要求;而厄瓜多尔则未提到,只是提出环境适应性和安全性的要求。
产品的可靠性很重要,它不仅影响生产公司的前途,而且影响到使用者的安全(前苏联的“联盟11号”宇宙飞船返回时,因压力阀门提前打开而造成三名宇航员全部死亡)。
可靠性好的产品,不但可以减少公司的维修费用,而且可以很快就打出品牌,大幅度提升公司形象,增加公司收入。
随着市场经济的发展,竞争日趋激烈,人们不仅要求产品物美价廉,而且十分重视产品的可靠性和安全性。
日本的汽车、家用电器等产品,虽然在性能、价格方面与我国彼此相仿,却能占领美国以及国际市场。
主要的原因就是日本的产品可靠性胜过我国一筹。
美国的康明斯、卡勃彼特柴油机,大修期为12000小时,而我国柴油机不过1000小时,有的甚至几十小时、几百小时就出现故障。
此报告之依据为两方面(或称两大组)标准,即:(1) 与CISPR 16系列标准对应的5项基础国标:《GB6113.101-2008无线电骚扰和抗扰度测量设备测量设备》《GB6113.102-2008无线电骚扰和抗扰度测量设备辅助设备传导骚扰》《GB6113.103-2008无线电骚扰和抗扰度测量设备辅助设备骚扰功率》《GB6113.104-2008无线电骚扰和抗扰度测量设备辅助设备辐射骚扰》《GB6113.105-2008无线电骚扰和抗扰度测量设备30MHz~1000MHz 天线校准用试验场地》。
(2) IEC测试产品常用的16项标准,见表1。
表1常用的16项EMC测试标准对应的国标IEC标准对应的国标中文名称CISPR11 GB4824 工业、科学和医疗(ISM)射频设备电磁骚扰特性限值和测量方法CISPR14 GB4343.1 电磁兼容家用电器、电动工具和类似器具的要求CISPR15 GB17743 电气照明和类似设备的无线电骚扰特性的限值和测量方法CISPR22 GB9254 信息技术设备的无线电骚扰限值和测量方法IEC61000-3-2 GB17625.1 电磁兼容第3部分:限值第2章:谐波电流发射限值(设备每相输入电流16≤A)IEC61000-3-3 GB17625.2 电磁兼容限值对每相额定电流16≤A且无条件接入的设备在公用低压供电系统中产生的电压变化、电压波动和闪烁的限制IEC61000-4-2 GB17626.2 电磁兼容试验和测量技术静电放电抗扰度试验IEC61000-4-4 GB17626.4 电磁兼容试验和测量技术电快速瞬变脉冲群抗扰度试验IEC61000-4-5 GB17626.5 电磁兼容试验和测量技术浪涌(冲击)抗扰度试验IEC61000-4-12 GB17626.12 电磁兼容试验和测量技术振荡波抗扰度试验IEC61000-4-6 GB17626.6 电磁兼容试验和测量技术射频场感应的传导骚扰抗扰度IEC61000-4-3 GB17626.3 电磁兼容试验和测量技术射频电磁场辐射抗扰度试验IEC61000-4-9 GB17626.9 电磁兼容试验和测量技术脉冲磁场抗扰度试验IEC61000-4-10 GB17626.10 电磁兼容试验和测量技术阻尼振荡磁场抗扰度试验IEC61000-4-8 GB17626.8 电磁兼容试验和测量技术工频磁场抗扰度试验IEC61000-4-11 GB17626.11 电磁兼容试验和测量技术电压暂降、短时中断和电压变化抗扰度试验对于上述两组共21项标准,下面逐一针对各项标准中涉及“测试设备”的部分进行摘录和整理。
2安全控制技术【摘 要】【关键词】Abstract: In safety instrumented systems, the common cause failures which occur between redundant parts within each layer between safety layers or between safety layers and the BPCS may make the potential degrade of the effective protection higher and then affect the safety and the reliability of a system. The paper describes the de fi nition, causes, analytical approach and the quantitative methods given in the standard, and also discusses how to reduce probability of common cause failure.Key words: SIS Common Cause Failure Redundancy在安全仪表系统中,保护层的冗余部分之间、保护层之间、保护层和BPCS之间的共同原因失效(亦称共因失效)都会引起有效保护潜在的降低,从而影响系统的安全性与可靠性。
本文阐述了共因失效的定义、产生原因、分析方法、标准中的量化方法以及降低其概率的措施。
安全仪表系统 共因失效 冗余[编者按] 本刊在2007~2008的两年间,在“安全控制技术”栏目共安排了12讲功能安全技术讲座,系统介绍了功能安全的基本概念、方法与技术,并针对读者关心的一些问题进行了分析,得到广大读者的广泛关注与积极回应。
2009年,该讲座还将继续进行,主题将集中在安全相关子系统的功能安全评估与认证技术上。
本讲主讲人是刘瑶工程师。
第十八讲 安全仪表系统中的共因失效Chapter 18: The Common Cause Failure in the Safety Instrumented System刘瑶(机械工业仪器仪表综合技术经济研究所,北京市 100055)Liu Yao(Instrumentation Technology & Economy Institute, P.R.China, Beijing 100055)主讲人简介:刘瑶,女,工学学士,机械工业仪器仪表综合技术经济研究所功能安全技术研发中心工程师,参与功能安全标准I E C 61508(G B/T 20438)及I E C 61511(G B/T 21109)技术与应用研究、宣传和推广,功能安全HAZOP+SIL工程项目技术辅助与支持。
安全仪表系统(SIS)是指用来实现一个或几个仪表安全功能的仪表系统,它包括从传感器到最终元件的所有部件和子系统。
目前SIS正广泛应用于石油、化工、电力等过程工业领域,用以监测生产过程中的安全参量,以便在出现危险时及时采取有效措施从而防止人身伤害、经济损失及环境影响。
根据GB 21109(IEC 61511),SIS的其中一项设计要求就是识别和考虑共因失效。
在给保护层分配安全功能时,Control Tech of Safety & Security生地震,结果两元件都失效了。
导致此次共因失效的客观原因就是环境因素——地震,内部原因则是元件本身的抗震性能不够。
例二,某输油站场中,出站处高压报警、高压泄压、压力高高连锁保护停泵等保护措施共用一个压力变送器。
一旦压力变送器发生故障,上述三层保护会同时失效,这就产生了共因失效,如果此时管内石油压力过高则是相当危险的。
其根本原因就是保护层之间不独立,取压点未分开单独设立。
例三,为确保阀门关断时能切断管内流质,在管道中串联安装了两个阀门。
设计时这两个阀门均为带电跳闸。
若此设备附近发生火灾,则安全监控系统一旦检测到这一情况后即给两个阀门上电,但是由于两个阀门的电缆都铺设在同样的电缆槽上,而这个电缆槽恰恰就在火灾区域,其后果是电缆被毁坏,两个阀门都不能关闭。
造成此次共因失效的根本原因是冗余电缆的物理位置相同,外部因素是火灾,内部因素则是设计缺陷。
例四,检修人员打开控制机柜门检查工作状态,此时,对讲机传来另一处需要紧急检修的信息,他回应“马上到”。
由于机柜中容错系统的两个处理器安装在同一机架中,这时它们受到同样的电磁干扰因而发生故障。
这两个处理器是安全仪表系统的一部分,这就导致一个主要的过程单元立刻停止工作。
究其产生原因就是机柜门打开、对讲机传来的无线电信息产生电磁干扰。
上面的几则示例分别从环境因素、设计缺陷、电磁干扰等方面说明了共因失效的产生原因。
3 共因失效的分析方法根据GB20438(IEC 61508),共因失效的分析方法是:通用的质量控制;设计复审;由一个独立小组进行的验证和测试;根据类似系统反馈的经验分析实际的意外事故。
然而此分析范围超出了硬件范围。
即使在一个冗余系统的各通道中使用软件多样化,还是有可能在软件方法中存在一些共性,他们将引起共因失效,例如共用的规范中的错误。
当共因失效不是严格地在同一时间内发生时,可以借助多通道之间的比较方法采取预防措施。
采用这种比较方法可以在失效成为所有通道共有失效之前检测出来。
一般情况下,实际分析过程中,共因失效分析可分以下四个步骤进行:1 )建立系统逻辑模型要求对系统有一个基本的认识。
需要考虑故障模式、边界条件和逻辑模型等。
2 )识别共因事件组共因失效、共同模式失效和相关失效也是需要考虑的内容。
下面将详细介绍共因失效。
1 共因失效的定义共同原因失效(common cause failure)是指由一个或多个事件引起一个多通道系统中的两个或多个分离通道失效,从而导致系统失效的一种失效。
它是一种相关失效。
相对应的,在GB 21109(IEC 61511)中,还有一个词即共同模式失效(common modefailure)与它相似但不完全相同,共同模式失效是指两个或多个通道以同样的方式引起相同的误差结果的失效。
在此特别提请注意的是,共因失效是指多个通道失效的原因(即引发事件)相同,但它们造成的误差结果未必相同;而共模失效是说多个通道失效的方式相同,而且引起的结果亦相同。
各个通道失效与共因失效的关系见图1所示。
图1 各个通道失效与共因失效的关系2 共因失效的产生由定义可看出,共因失效发生在多通道系统中,如冗余、多数表决。
不同的设备、模块、组件都可能产生共因失效。
增加冗余可以提高系统的故障裕度,避免随机硬件失效,因此它是降低系统失效可能性的一种有效方法,但是人们常常发现冗余系统的一些可靠性指标如PFD、MTTF却比理论值低,经研究发现这是由共因失效导致的[4],它削弱了冗余的作用。
共因失效产生的原因可能是环境因素,如火、水、地震、电磁干扰、撞击等。
同时,系统也可能受与操作和维护有关的意外事故的影响,如运行期间的组态错误或错误指令、人为的误开/关行为,维护期间的升级错误和安装错误、维修程序错误、校准错误以及更换设备错误等,它们都可能对冗余系统内的多个部件造成影响。
通常,冗余系统的所有部分都使用同一个程序,这就存在发生共因失效的潜在可能性。
对此最根本的解决办法是,为操作和维护编写严格合理的规程并使相关人员得到良好的培训。
内部影响也是共因失效的一个主要原因,例如相同部件以及它们的接口的设计缺陷,或者部分部件的老化。
事实上,很多共因失效都是内外部因素共同作用的结果。
以下是几个共因失效的示例:例一,某个冗余系统中,为保证可靠性使用了两个元件使它们同时起作用,但系统所处环境忽然发安全控制技术对所有可能发生共因失效的系统单元进行检查。
考察外部因素与内部影响,进一步确定共因失效建模的先后次序。
3 )共因建模和数据分析利用经验数据选择所要使用的共因失效模型、最小割集和参数估计等。
4 )系统量化和结果的进一步解释确定系统失效的可能性和共因失效对最终结果的影响。
主要包括敏感性分析和备选后续措施的选择等。
4 共因失效的量化方法。
在GB 20438(IEC 61508)中介绍了一种在E/E/ PE系统中量化共因失效的方法。
在两个或多个系统并行操作时,采用一个共因失效因子β根据其中一个系统的随即硬件失效估算共因失效率。
此方法的应用范围局限于硬件的共因失效。
方法如下:考虑在多通道系统中的每一个通道中执行诊断测试时,共因失效对该系统的效应。
在应用β系数模型时,危险的共因失效的概率为λDβ。
其中λD为各通道随机硬件危险失效的概率,β为无诊断测试时的β系数,也就是影响所有通道的单一通道的失效分数。
假设共因失效影响所有通道,并且与连续共因失效的时间间隔相比,第一个通道被影响到所有通道被影响之间的时间间隔较小。
假设每一个通道中均执行诊断测试来检测和揭露一部分失效,则可将所有失效分为两大类:一类是在诊断测试覆盖范围之外的(不可能被检测到的),另一类是在诊断测试覆盖范围之内的(总可以被检测到的)。
则危险共因失效引起的总失效概率为:λDUβ+λDDβD式中:λDU—单一通道中未检测到的失效概率,即诊断测试覆盖范围之外的失效概率。
β—不可能检测到的危险故障的共因失效系数,它等于在没有诊断测试时应用的总β系数。
λDD—检测到单一通道的失效概率,即在诊断测试范围内单一通道的失效概率;此时,如果诊断测试的重复率高,则有一部分失效将被揭露出来,从而导致β即βD减小。
βD—可检测到危险故障的共因失效系数。
当诊断测试的重复率提高时,βD的值越来越小,并下降到 β之下。
β、βD均可从表4中获得:β计算公式为S=X+Y; βD计算公式为 S D=X(Z+1)+Y。
X、Y的确定方法如下:用户需确定系统中为避免共因失效应使用哪些措施,然后根据表1分别求出每个逻辑子系统的XLS之和、YLS之和,以及传感器和最终元件的XSF之和、YSF之和,求出它们的总和就可分别得出X、Y。
Z的值由表2、表3获得。
5 如何降低共因失效概率降低共因失效的方法主要有以下三类:a)减少随机硬件失效和系统失效的总数(即减少图1中两圆重合的部分)。
表1 可编程电子或传感器和最终元件的评分[1]项目逻辑子系统传感器和最终元件X LS YLSXSFYSF分离/隔开在所有位置,各通道的全部信号电缆布线是否都已分隔开? 1.5 1.5 1.0 2.0逻辑子系统的所有通道的印刷电路板是否是单独的? 3.0 1.0逻辑子系统通道是否在各自的框架中? 2.50.5如果传感器/最终元件拥有专用的控制电子电路,那么每个通道的电子电路是否分别位于各自的印刷电路板上?2.5 1.5如果传感器/最终元件拥有专用的控制电子电路,那么每个通道的电子电路是否分别位于室内各自的控制台内?2.50.5多样性与冗余各通道是否使用不同的电子技术?例如使用一个电子电路、可编程电子及其他继电器。