当前位置:文档之家› 硬件系统的可靠性设计

硬件系统的可靠性设计

硬件系统的可靠性设计
硬件系统的可靠性设计

硬件系统的可靠性设计

目录

1 可靠性概念 (4)

1.1 失效率 (4)

1.2 可靠度 (5)

1.3 不可靠度 (6)

1.4 平均无故障时间 (6)

1.5 可靠性指标间的关系 (6)

2 可靠性模型 (7)

2.1 串联系统 (7)

2.2 并联系统 (9)

2.3 混合系统 (11)

2.4 提高可靠性的方法 (12)

3 可靠性设计方法 (12)

3.1 元器件 (12)

3.2 降额设计 (13)

3.3 冗余设计 (14)

3.4 电磁兼容设计 (15)

3.5 故障自动检测与诊断 (15)

3.6 软件可靠性技术 (15)

3.7 失效保险技术 (15)

3.8 热设计 (16)

3.9 EMC设计 (16)

3.10 可靠性指标分配原则 (17)

4 常用器件的可靠性及选择 (19)

4.1 元器件失效特性 (19)

4.2 元器件失效机理 (21)

4.3 元器件选择 (23)

4.4 电阻 (23)

4.5 电容 (26)

4.6 二极管 (30)

4.7 光耦合器 (31)

4.8 集成电路 (32)

5 电路设计 (38)

5.1 电流倒灌 (38)

5.2 热插拔设计 (40)

5.3 过流保护 (41)

5.4 反射波干扰 (42)

5.5 电源干扰 (49)

5.6 静电干扰 (51)

5.7 上电复位 (52)

5.8 时钟信号的驱动 (53)

5.9 时钟信号的匹配方法 (55)

6 PCB设计 (60)

6.1 布线 (60)

6.2 去耦电容 (62)

7 系统可靠性测试 (62)

7.1 环境适应性测试 (62)

7.2 EMC测试 (63)

7.3 其它测试 (63)

8 参考资料 (64)

9 附录 (64)

1可靠性概念

系统的可靠性是由多种因素决定的,影响系统可靠、安全运行的主要因素来自于系统内部和外部的各种电气干扰,以及系统结构设计、元器件选择、安装、制造工艺和外部环境条件等。可靠性的高低涉及产品活动的方方面面,包括元器件采购、检验、设备设计、生产、工程安装、维护等各个环节。

在电子产品中,影响产品可靠性的一个很重要的因素是干扰问题,所以提高系统的抗干扰能力是产品设计过程中考虑的重要课题。

干扰对系统造成的后果主要表现在以下几方面:

数据采集错误

控制状态改变

程序运行失常

系统运行不稳定

可靠性是描述系统长期稳定、正常运行能力的一个通用概念,也是产品质量在时间方面的特征表示。可靠性又是一个统计的概念,表示在某一时间内产品或系统稳定正常完成预定功能指标的概率。

可靠性的定义是指产品或系统在规定条件下和规定时间内完成规定功能的能力。例如,一台计算机在室内有空调的条件下,使用3000小时不出故障的可能性为70%,即意味着在3000小时内无故障的概率为70%。可靠性最集中反映了某产品或系统的质量指标。

描述可靠性的定量指标有可靠度、失效率、平均无故障时间等。

1.1 失效率

失效率又称为故障率,指工作到某一时刻尚未失效的产品或系统在该时刻后单位时间内发生失效的概率。

数字电路以及其它电子产品,在其有效寿命期间内,如果它的失效率是由电子元器件、集成电路芯片的故障所引起,则失效率为常数。这是因为经过老化筛

选后的电子元器件、集成电路芯片已进入偶发故障期。在这一时期内,它们的故障是随机均匀分布的,故故障率为一常数。由电子元器件、集成电路芯片构成的整机总是比电子元器件、集成电路芯片先进入损耗故障期。

1.2 可靠度

可靠度是指产品或系统在规定条件下和规定时间内完成规定功能的概率。规定的条件包括运行的环境条件、使用条件、维修条件和操作水平等。可靠度一般记为R。它是时间的函数,故也记为R(t),称为可靠度函数。

如果用随机变量T表示产品从开始工作到发生失效或故障的时间,其概率密度为f(t)如上图所示,若用t表示某一指定时刻,则该产品在该时刻的可靠度

对于不可修复的产品,可靠度的观测值是指直到规定的时间区间终了为止,能完成规定功能的产品数与在该区间开始时投入工作产品数之比,即

式中:N——开始投入工作产品数

(t)——到t时刻完成规定功能产品数,即残存数

N

a

(t)——到t时刻未完成规定功能产品数,即失效数。

N

f

1.3 不可靠度

不可靠度也称为累积失效概率:是产品在规定条件下和规定时间内未完成规定功能(即发生失效)的概率,。一般记为F或F(t)。

因为完成规定功能与未完成规定功能是对立事件,按概率互补定理可得

F(t)=1-R(t)

对于不可修复产品和可修复产品累积失效概率的观测值都可按概率互补定理,取

1.4 平均无故障时间

产品的平均无故障时间又称为平均寿命,是产品寿命的平均值。对于可修复的产品,指“产品在其使用寿命期内某个观察期间累积工作时间与故障次数之比”。对于不可修复的产品,指“当所有试验样品都观测到寿命终了的实际值时,平均寿命是它们的算数平均值;当不是所有试验样品都观测到寿命终了的截尾试验时,平均寿命是试验样品累积试验时间与失效数之比”。

1.5 可靠性指标间的关系

可靠性特征量中可靠度R(t),累积失效率(也叫不可靠度)F(t)、概率密度f(t)和失效率λ(t)是四个基本函数,只要知道其中一个,则所有变量均可求得.基本函数间的关系见下表。

关于MTBF计算的例子见附录文件SLCA V320MTBF.pdf

2可靠性模型

一个复杂的系统总是由许多基本元件、部件组成,如何在保证完成功能的前提下组成一个高可靠性的系统对产品设计是很有意义的。一方面需要知道组成系统的基本元器件或部件在相应使用条件下的可靠性,另一方面还要知道这些基本元器件、部件的可靠性和由其构成的系统的可靠性的关系。

描述基本元器件、部件的可靠性的基本数据可由生产厂家提供、或通过试验获得、或通过实际观察的统计数据或经验得到。基本元器件、部件的可靠性对系统的影响,可以通过几种可靠性模型获得。

构造系统的可靠性模型时,首先应该明确的是系统的可靠性框图与系统的功能性框图有所不同。系统的功能性框图是根据系统的工作原理进行连接,各部分之间的关系是确定的,其位置不能变动,而系统的可靠性框图是根据各组成部分的故障对系统的影响来构成的,其位置在何处是没有关系的。

2.1 串联系统

串联结构的系统是由几个功能器件(部件)组成,其中任何一个器件(部件)失效,都将引起整个系统失效。

图xxx 和图xxx 中的a 表示系统的功能框图,而b 表示系统的可靠性框图,可以看出,两者有时是不相同的。

在图xxx 中,虽然是LC 并联谐振电路,但其可靠性结构框图却是串联的,因为任何一个环节发生故障,则整个电路将不发生谐振。

对于串联结构模型的系统,系统的失效率为各功能器件(部件)失效率的代数和。若系统中的每一个部件又由几种元件组成,每种元件都有一定的数量,如果部件中的每个元件的失效率都将组成部件的失效,那么这个部件就成为由一系列元件组成的串联结构。这个部件的失效率为各元件失效率的代数和。

串联结构是一种无冗余结构,特点是构造简单。

图 xxxx

a

b

图 xxx 串联结构模型

a

b

串联系统的可靠度为:

上图所示为n个具有相同可靠度的单元构成的系统的可靠度与每个单元的可靠度间的关系曲线,由此可知,随着串联单元数的增加,系统的可靠度随之减小。

2.2 并联系统

并联形式的可靠性结构是有冗余的,它是指系统由几个部件构成,只要其中至少有一个部件工作正常,系统就能正常工作。按组成系统的部件的数量可分为双重、三重或多重系统。

例如,为SP30交换机机框中各电路板提供电源的二次电源系统,两个电源模块的工作形式为输出并联方式,其中任何一个电源模块都有为整个机框提供所需电流的能力,其电源的可靠性模型即为并联结构。

图xxx 并联结构模型

若系统中有n个部件,构成并联结构,则系统的可靠度为:

i=1,2,…,n

系统的平均无故障时间为:

下图是n个相同单元并联构成的系统的可靠度与每个单元的可靠度间的关系曲线,由此可知,随着并联单元数的增加,系统的可靠度随之增大。

2.3 混合系统

混联结构是由若干并联和串联结构组合的混合系统,这种系统在实际应用中用的较多。例如估算如下图所示系统的可靠度,通常先将并联部分估算好,然后再对整个系统按串联模型进行计算。

而估算如下图所示系统的可靠度,则先将串联部分估算好,然后再对整个系统按并联模型进行计算。

图xxxx 混联结构模型

图xxxx 混联结构模型

2.4 提高可靠性的方法

提高系统可靠性的途径有两个:错误避免和容错设计。

错误避免即通过使用更高质量、更高可靠性的元器件、部件来提高系统的可靠性,其实现成本比容错设计低。

容错设计主要是通过部件的冗余来实现,即通过增加设计的复杂性,增加冗余单元,同时也就增加成本的方法达到提高系统的可靠性。

3可靠性设计方法

3.1 元器件

元件、器件是构成系统的基本部件,元器件的性能与可靠性是系统整体性能与可靠性的基础。降低电子元器件的故障率是由其生产厂家来保证的。作为设计与使用者,主要是保证所选用的元器件的质量或可靠性指标满足设计的要求。

把握元器件的选型、购买、运输、储存

元器件的质量主要由生产厂家的技术、工艺以及质量管理体系保证。应选用有质量信誉的厂家的产品,一旦选定,不应轻易更换,尽量避免在同一台设备中使用不同厂家的同一型号的元器件。

元器件的运输、储存要按相关要求进行,对于存放时间较长的元器件,在使用前需要仔细检测。

老化、筛选、测试

元器件的老化测试一般在生产前进行,在此阶段淘汰那些质量不佳的产品。老化处理的时间长短与所用元件量、型号、可靠性要求有关,一般为24小时或48小时。老化时所施加的电气应力(电压或电流等)应等于或略高于额定值,常选取额定值的110%~120%。老化后淘汰那些功耗偏大、性能指标明显变化或不稳定的元器件。

3.2 降额设计

降额设计是使电子元器件的工作应力适当低于其规定的额定值,从而达到降低基本故障率,保证系统可靠性的目的。降额设计是电子产品可靠性设计中的最常用的方法。

不同的电子元器件所要考虑的应力因素是不一样的,有的是电压,有的是电流,有的是温度,有的是频率,有的是振动等等。

对电容的耐压及频率特性,电阻的功率,电感的电流及频率特性,二极管、三极管、可控硅、运放、驱动器、门电路等器件的结电流、结温或扇出系数,电源的开关和主供电源线缆的耐电压/电流和耐温性能,信号线缆的频率特性,还有散热器、接插件、模块电源等器件的使用要求进行降额设计。通常,根据降额幅度的大小可分为一、二、三级降额,一级降额((实际承受应力)/(器件额定应力) < 50%的降额)在技术设计上最容易实现,降额的效果也最好,但存在成本过高的问题;二级降额(70%左右的降额)在技术设计上也比较容易实现,降额的效果也很好,并且成本适中;三级降额在技术实现上要仔细推敲,必要时要通过系统设计采取一些补偿措施,才能保证降额效果的实现,有一定难度,但三级降额的成本最低。一般说来,建议使用二级降额设计方法,在保证降额设计取得良好效果的同时,技术实现难度和成本都适中。对于涉及到频率特性的器件的降额要谨慎处理。

3.3 冗余设计

冗余技术也称为容错技术或故障掩盖技术,它是通过增加完成同一功能地并联或备用单元(包括硬件单元或软件单元)数目来提高系统可靠性地一种设计方法。如在电路设计中,对那些容易产生短路故障的单元,以串联形式复制;对那些容易产生开路故障的单元,以并联形式复制。

冗余设计并非适用于所有的场合,一般在低层次和关键环节的情况下使用可获得较好的效果。同时,还需注意,某些冗余技术的采用需增加若干故障检测和冗余通道切换装置,它们的失效率在远低于受控部分的失效率时,才能发挥冗余技术的优越性。

冗余设计的主要任务是:

1)确定冗余等级;

2)选定冗余类型;

3)确定冗余配置方案;

4)确定冗余管理方案。

冗余技术主要包括硬件冗余、软件冗余、信息冗余、时间冗余等。

?硬件冗余

硬件冗余是采用增加硬件的方式来实现,当系统发生故障时,将备份的硬件顶替上去,使系统仍然能够正常工作。在电路级、功能单元级、部件级和系统级都可以采用硬件冗余结构。如交换机系统中的处理机系统、时钟系统等就是采用的硬件冗余结构。

?软件冗余

实现软件冗余的主要方法有:指令冗余技术、软件陷阱技术和软件看门狗技术等。

?信息冗余

对于重要的文件或数据复制一份或多份,并存储于不同的空间,当某一区间或某一备份被破坏后,自动从其它部分重新复制,使文件或数据得以恢复。

?时间冗余

重复执行某一操作或某一程序,并将执行结果与前一次的结果进行比较

来确认系统工作是否正常。这种方法是以时间为代价换取可靠性,称为时间冗余技术或重复检测技术。在实际应用中可以采用三中取二或五中取三等方式。

3.4 电磁兼容设计

电磁兼容性是指系统在电磁环境中运行的适应性,即在电磁环境下能保持完成规定功能的能力。电磁兼容性设计的目的是使系统既不受外部电磁干扰的影响,也不对其它电子设备产生电磁干扰。

抗电磁干扰的硬件措施主要有滤波技术、去耦电路、屏蔽技术、接地技术等;软件措施主要有数字滤波、软件冗余、程序运行监视及故障自动恢复技术等。

3.5 故障自动检测与诊断

为了判定系统是否工作正常或某项功能是否正常、及时指出故障部位,缩短维修时间,可以有计划地对系统进行在线测试和诊断,以便及时排除故障,缩小故障带来的影响。

3.6 软件可靠性技术

为了提高软件的可靠性,应尽量将软件规范化、标准化、模块化,尽可能把复杂的问题化成若干较为简单明确的小任务。把一个大程序分成若干独立的小模块,有助于及时发现设计中的不合理部分,而且检查和测试几个小模块要比检查和测试大程序方便的多。

3.7 失效保险技术

有些重要的系统,一旦发生故障,希望整个系统处于安全或保险状态。

如交换机系统的各功能电路板的电源设计,当某块电路板由于某种原因过流时,希望不影响同一机框内其它电路板的使用,通常在功能电路板内采取过流保护措施,使其电源与机框脱离。

3.8 热设计

确定产品的运行环境温度指标,确定设备内部及关键元器件的温升限值。一般说来,元器件工作时的温度上升与环境温度没有关系,而民用级别的元器件的允许工作温度大多在70~85℃,为了保证在极限最高环境温度(50℃左右)下元器件的工作温度还在其允许温度范围内并有相当的冗余度,设备内部及元器件的温升设计指标定在15℃左右比较合适。在硬件单板设计时,首先应该明确区分易发热器件和温度敏感器件(即随着温度的变化器件容易发生特性漂移、变形、流液、老化等),布PCB板时要对易发热器件采取散热措施,温度敏感器件要与易发热器件和散热器隔开合适的距离,必要时要从系统的角度考虑采取补偿措施。系统或子系统通过自然散热(通风、对流等)措施不能保证设备内部及关键元器件温升限值指标得到保证时,需要采取强迫制冷措施。

3.9 EMC设计

电磁兼容(EMC)包括电磁干扰(EMI)和电磁敏感度(EMS)两个方面。电磁兼容是指设备或系统在其电磁环境中能正常工作且不对该环境中任何事物构成不能承受的电磁骚扰的能力。

要提升这种能力,有许多应用课题要解决,如:电磁波的散射、透射、传输、孔缝耦合,各种干扰源的机理和特性,各种干扰参数的计算和测试,各种结构的屏蔽效果,各种防护方法、测试方法、标准等等。对应设计的方法也有多种,如:防静电设计、防雷设计、防地电位升设计等等;一般从以下方面考虑,以保证产品的EMC特性:

1、静电放电的防护。首先要阻止电流直接进入电子线路,最普通的办法就是建立完善的屏蔽结构(必要时在外壳与电路之间增加第二层屏蔽层),

屏蔽层接到电路的公共接地点上。对内部的电路来说,如果需要与金属外壳相连时,必须采用单点接地的方式,防止放电电流流过这个电路,造成伤害。

2、屏蔽。采用屏蔽的目的有两个:一是限制内部的辐射电磁能越过某

一区域;二是防止外来的辐射进入某一区域。主要对电场、电磁场、磁场进行屏蔽(现实对磁场的屏蔽更难)。

3、接地。接地的目的一是防电击,一是去除干扰。接地可分为两大类,

即安全接地与信号接地。接地时应该注意:接地线愈短愈好、接地面应具有高传导性、切忌双股电缆分开安装、低频宜采用单点接地系统、高频应采用多点接地系统、去除接地环路;

4、滤波。实际工作中,无法完全做好接地与屏蔽的工作。因此,会采

用滤波(将不需要的信号去除)的方式来弥补不足,主要通过滤波电路来实现。在实际使用中,由于设备所产生的杂讯中共模和差模的成分不一样,所采用的滤波电路也有变化,可适当增加或减少滤波元件。具体电路的调整一般要经过EMI测试后才能有满意的结果。

3.10 可靠性指标分配原则

通常分配可靠性指标应考虑下列原则:

技术水平

对技术成熟的单元,能够保证实现较高的可靠性,或预期投入使用时可靠性可有把握地增长到较高水平,则可分配给较高的可靠度。

复杂程度

对较简单的单元,组成该单元零部件数量少,组装容易保证质量或故障后易于修复,则可分配给较高的可靠度。

重要程度

对重要的单元,该单元失效将产生严重的后果,或该单元失效常会导致全系统失效,则应分配给较高的可靠度。

任务情况

对整个任务时间内均需连续工作以及工作条件严酷,难以保证很高可靠性

单元,则应分配给较低的可靠度。

此外,一般还要受费用、重量、尺寸等条件的约束。总之,最终都是力求以

最小的代价来达到系统可靠性的要求。

可靠性指标分配方法有:等分配法、再分配法、比例分配法、综合评分分配法、动态规划分配法等。

例如:某公司采用如下的综合评分分配法为其产品分配可靠性指标:由于缺乏产品的可靠性数据,所以请熟悉产品、有工程实际经验的专家,按照影响产品可靠性的几种主要因素(如:复杂度、技术成熟度、重要度及环境条件)进行评分(每一种因素的分值在1~10之间,难度越高评分越高),然后根据评分的结果给各分系统或部件分配可靠性指标。

系统要求的MTBF为500h,由A/B/C/D四个部件组成,各部件评分如下表:

说明:(1)对四个部件(A/B/C/D)按四种因素评分后,填入上表(兰色字迹部份);

(2)对A部份而言,最后评分为8*9*6*8=3456;B的评分为5*7*6*8=1680;同理C的评分为900、D的评分为1440;最后四部分总分为:

7476;紫红色字迹部份。

(3)对A部份而言,评分系数为3456/7476=0.46;B的评分系数为1680/7476=0.22;C的评分系数为0.12;D的评分系数为0.19;浅紫色部份。

(4)对整个系统而言,失效率为1/500=0.002;

所以分配给A的失效率为:0.46*0.002=0.0009,对应的MTBF为

1081.6H;

同理得B/C/D的失效率和MTBF,红色字迹部份。

4常用器件的可靠性及选择

元件的可靠性主要包括以下几个方面:失效特征、失效机理、抗干扰特性、元件的选用方法、安装工艺以及环境对元件性能的影响等方面。

4.1 元器件失效特性

失效率

失效率是工作到某时刻尚未失效的产品,在该时刻后单位时间内发生失效的概率。一般记为λ,它也是时间t的函数,故也记为λ(t),称为失效率函数,有时也称为故障率函数或风险函数.

按上述定义,失效率是在时刻t尚未失效产品在t+△t的单位时间内发生失效的条件概率.即

它反映t时刻失效的速率,也称为瞬时失效率.

失效率的观测值是在某时刻后单位时间内失效的产品数与工作到该时刻尚未失效的产品数之比,即

失效规律

产品的失效规律如下图所示,其失效率随时间变化可分为三段时期,即早期失效期、稳定工作期和衰老期。

早期失效期:失效率曲线为递减型。产品投入使用的前期,失效率较高其失效率曲线下降很快。失效原因主要是由于设计、制造、贮存、运输等形成的缺陷,

以及调试、焊接、安装不当等人为因素所造成的。当这些所谓先天不良的失效结束后运转也逐渐正常,则失效率就趋于稳定,到t0时失效率曲线已开始变平。t0以前称为早期失效期。针对早期失效期的失效原因,应该对元件进行筛选、严格安装工艺、设备老化处理后再投入运行,争取失效率低且t0短。

稳定工作期也称正常工作寿命期。失效率曲线在这一时期几乎为恒定值,即t0到t i间的失效率近似为常数。失效原因主要是由非预期的过载、误操作、意外的天灾以及一些尚不清楚的偶然因素所造成。由于失效原因多属偶然,故又称为偶然失效期。偶然失效期是能有效工作的时期,这段时间称为有效寿命。为降低偶然失效期的失效率而增长有效寿命,应注意提高产品的质量,精心使用维护。

衰老期也称为损耗期。失效率曲线是递增型,在t1以后失效率上升较快,这是由于产品已经老化、疲劳、磨损、蠕变、腐蚀等所谓有耗损的原因所引起的,针对耗损失效的原因,应该注意检查、监控、预测耗损开始的时间,提前维修,使失效率仍不上升。

失效形式

元件的失效形式可分为:突然失效、退化失效、局部失效以及全局失效。

?突然失效:元件参数急剧变化,或因元件制造工艺不良,环境条件变化

导致断路或开路所造成。如器件因压焊不牢造成开路,或因灰尘微粒使

器件管脚短路,电容器因电解质击穿造成短路等。

?退化失效:由于元件制造公差、温度系数变化、材料变质、电源电压波

动、工艺不良等因素使元件参数逐渐变差,性能逐渐降低形成。

?局部失效:退化失效常使系统局部功能失效,称为局部失效。

?全局失效:突然失效会使整个系统失效,称为全局失效。

硬件系统的可靠性设计

硬件系统的可靠性设计

目录 1 可靠性概念 (4) 1.1 失效率 (4) 1.2 可靠度 (5) 1.3 不可靠度 (6) 1.4 平均无故障时间 (6) 1.5 可靠性指标间的关系 (6) 2 可靠性模型 (7) 2.1 串联系统 (7) 2.2 并联系统 (9) 2.3 混合系统 (11) 2.4 提高可靠性的方法 (12) 3 可靠性设计方法 (12) 3.1 元器件 (12) 3.2 降额设计 (13) 3.3 冗余设计 (14) 3.4 电磁兼容设计 (15) 3.5 故障自动检测与诊断 (15) 3.6 软件可靠性技术 (15) 3.7 失效保险技术 (15) 3.8 热设计 (16) 3.9 EMC设计 (16) 3.10 可靠性指标分配原则 (17) 4 常用器件的可靠性及选择 (19) 4.1 元器件失效特性 (19) 4.2 元器件失效机理 (21) 4.3 元器件选择 (23) 4.4 电阻 (23) 4.5 电容 (26) 4.6 二极管 (30) 4.7 光耦合器 (31) 4.8 集成电路 (32) 5 电路设计 (38) 5.1 电流倒灌 (38) 5.2 热插拔设计 (40) 5.3 过流保护 (41) 5.4 反射波干扰 (42) 5.5 电源干扰 (49) 5.6 静电干扰 (51) 5.7 上电复位 (52) 5.8 时钟信号的驱动 (53) 5.9 时钟信号的匹配方法 (55) 6 PCB设计 (60)

6.1 布线 (60) 6.2 去耦电容 (62) 7 系统可靠性测试 (62) 7.1 环境适应性测试 (62) 7.2 EMC测试 (63) 7.3 其它测试 (63) 8 参考资料 (64) 9 附录 (64)

可靠性设计的主要内容

可靠性设计的主要内容 1、研究产品的故障物理和故障模型 搜集、分析与掌握该类产品在使用过程中零件材料的老化、损伤和故障失效等(均为受许多复杂随机因素影响的随机过程)的有关数据及材料的初始性能(强度、冲击韧性等)对其平均值的偏离数据,揭示影响老化、损伤这一复杂物理化学过程最本质的因素,追寻故障的真正原因。研究以时间函数形式表达的材料老化、损伤的规律,从而较确切的估计产品在使用条件下的状态和寿命。用统计分析的方法使故障(失效)机理模型化,建立计算用的可靠度模型或故障模型,为可靠性设计奠定物理数学基础,故障模型的建立,往往以可靠性试验结果为依据。 2、确定产品的可靠性指标及其等级 选取何种可靠性指标取决于产品的类型、设计要求以及习惯和方便性等。而产品可靠性指标的等级或量值,则应依据设计要求或已有的试验,使用和修理的统计数据、设计经验、产品的重要程度、技术发展趋势及市场需求等来确定。例如,对于汽车,可选用可靠度、首次故障里程、平局故障间隔里程等作为可靠性指标,对于工程机械则常采用有效度。 3、合理分配产品的可靠性指标值

将确定的产品可靠性指标的量值合理分配给零部件,以确定每个零部件的可靠性指标值,后者与该零部件的功能、重要性、复杂程度、体积、重量、设计要求与经验、已有的可靠性数据及费用等有关,这些构成对可靠性指标值的约束条件。采用优化设计方法将产品(系统、设备)的可靠性指标值分配给各个零部件,以求得最大经济效益下的各零部件可靠性指标值最合理的匹配。 4、以规定的可靠性指标值为依据对零件进行可靠性设计 即把规定的可靠性指标值直接设计到零件中去,使它们能够保证可靠性指标值的实现。

系统可靠性设计与分析

可靠性设计与分析作业 学号:071130123 姓名:向正平一、指数分布的概率密度函数、分布函数、可靠度函数曲线 (1)程序语言 t=(0:0.01:20); Array m=[0.3,0.6,0.9]; linecolor=['r','b','y']; for i=1:length(m); f=m(i)*exp(-m(i)*t); F=1-exp(-m(i)*t); R=exp(-m(i)*t); color=linecolor(i); subplot(3,1,1); title('指数函数概率密度函数曲线'); plot(t,f,color); hold on subplot(3,1,2); title('指数函数分布函数函数曲线'); plot(t,F,color); hold on subplot(3,1,3); title('指数指数分布可靠度函数曲线 plot(t,R,color); hold on end (3)指数分布的分析 在可靠性理论中,指数分布是最基本、最常用的分布,适合于失效率为常数 的情况。指数分布不但在电子元器件偶然失效期普遍使用,而且在复杂系统和整 机方面以及机械技术的可靠性领域也得到使用。 有图像可以看出失效率函数密度f(t)随着时间的增加不断下降,而失效率随 着时间的增加在不断的上升,可靠度也在随着时间的增加不断地下降,从图线的 颜色可以看出,随着m的增加失效率密度函数下降越快,而可靠度的随m的增加 而不断的增加,则失效率随m的增加减小越快。 在工程运用中,如果某零件符合指数分布,那么可以适当增加m的值,使零 件的可靠度会提升,增加可靠性。 二、正态分布的概率密度函数、分布函数、可靠性函数、失效率函数曲线 (1)程序语言 t=-10:0.01:10; m=[3,6,9]; n=[1,2,3]; linecolor=['r','b','y'];

通用的可靠性设计分析方法

通用的可靠性设计分析方法 1.识别任务剖面、寿命剖面和环境剖面 在明确产品的可靠性定性定量要求以前,首先要识别产品的任务剖面、寿命剖面和环境剖面。 (1)任务剖面“剖面”一词是英语profile的直译,其含义是对所发生的事件、过程、状态、功能及所处环境的描述。显然,事件、状态、功能及所处环境都与时间有关,因此,这种描述事实上是一种时序的描述。 任务剖面的定义为:产品在完成规定任务这段时间内所经历的事件和环境的时序描述。它包括任务成功或致命故障的判断准则。 对于完成一种或多种任务的产品,均应制定一种或多种任务剖面。任务剖面一般应包括:1)产品的工作状态; 2)维修方案; 3)产品工作的时间与程序; 4)产品所处环境(外加有诱发的)时间与程序。 任务剖面在产品指标论证时就应提出,它是设计人员能设计出满足使用要求的产品的最基本的信息。任务剖面必须建立在有效的数据的基础上。 图1表示了一个典型的任务剖面。 (2)寿命剖面寿命剖面的定义为:产品从制造到寿命终结或退出使用这段时间内所经历的全部事件和环境的时序描述。寿命剖面包括任务剖面。 寿命剖面说明产品在整个寿命期经历的事件,如:装卸、运输、储存、检修、维修、任务剖面等以及每个事件的持续时间、顺序、环境和工作方式。 寿命剖面同样是建立产品技术要求不可缺少的信息。 图2表示了寿命剖面所经历的事件。

(3)环境剖面环境剖面是任务剖面的一个组成部分。它是对产品的使用或生存有影响的环境特性,如温度、湿度、压力、盐雾、辐射、砂尘以及振动冲击、噪声、电磁干扰等及其强度的时序说明。 产品的工作时间与程序所对应的环境时间与程序不尽相同。环境剖面也是寿命剖面和任务剖面的一个组成部分。 2.明确可靠性定性定量要求 明确产品的可靠性要求是新产品开发过程中首先要做的一件事。产品的可靠性要求是进行可靠性设计分析的最重要的依据。 可靠性要求可以分为两大类:第一类是定性要求,即用一种非量化的形式来设计、分析以评估和保证产品的可靠性;第二类是定量要求,即规定产品的可靠性指标和相应的验证方法。 可靠性定性要求通常以要求开展的一系列定性设计分析工作项目表达。常用的可靠性定性设计工作项目见表1。

硬件系统可靠性设计规范

硬件系统可靠性设计规范 一、概论 可靠性的定义:产品或系统在规定条件下和规定时间内完成规定功能的能力 可靠性及抗干扰设计是硬件设计必不可少的一部分,它包括芯片、器件选择、去耦滤波、印刷电路板布线、通道隔离等。有完善的抗干扰措施,是保证系统精度、工作正常和不产生错误的必要条件。设备可靠性设计规范的一个核心思想是监控过程,而不是监控结果。 二、可靠性设计方法 1、元器件:构成系统的基本部件,作为设计与使用者,主要是保证所选用的元器件的质量或可靠性指标满足设计的要求 2、降额设计:使电子元器件的工作应力适当低于其规定的额定值,从而达到降低基本故障率,保证系统可靠性的目的。幅度的大小可分为一、二、三级降额,一级降额((实际承受应力)/(器件额定应力) < 50%的降额),建议使用二级降额设计方法,一级降额<70% 3、冗余设计:也称为容错技术或故障掩盖技术,它是通过增加完成同一功能的并联或备用单元(包括硬件单元或软件单元)数目来提高系统可靠性的一种设计方法,实现方法主要包括:硬件冗余;软件冗余;信息冗余;时间冗余等 4、电磁兼容设计:系统在电磁环境中运行的适应性,即在电磁环境下能保持完成规定功能的能力。电磁兼容性设计的目的是使系统既不受外部电磁干扰的影响,也不对其它电子设备产生电磁干扰。硬件措施主要有滤波技术、去耦电路、屏蔽技术、接地技术等;软件措施主要有数字滤波、软件冗余、程序运行监视及故障自动恢复技术等 5、故障自动检测及诊断 6、软件可靠性设计:为了提高软件的可靠性,应尽量将软件规范化、标准化、模块化 7、失效保险技术 8、热设计 9、EMC设计:电磁兼容(EMC)包括电磁干扰(EMI)和电磁敏感度(EMS)两个方面 三、可靠性设计准则

浅谈软件系统可靠性

浅谈软件系统可靠性 1 概述 近年来,随着计算机在军用与民用产品上的应用日益增多,软件缺陷所引发的产品故障,甚至灾难性事故也越来越严重,软件故障已成为高新技术产品发展的瓶颈。在这种情况下,一旦计算机系统发生故障,则其效益就会大幅度地消减,甚至完全丧失,从而使社会生产和经济活动陷入不可收拾的混乱状态。因此可以说,计算机系统的高可靠性是实现信息化社会的关键。 计算机系统硬件可靠性方面已有六十余年的发展历史,冗余技术、差错控制、故障自动检测、容错技术和避错技术等可靠性设计技术已经成熟。相比之下,软件可靠性的研究只有三十几年的发展历史,加上软件生产基本上仍处于作坊式的手工制作,其提高软件可靠性的技术与管理措施还处于十分不完善的状况。20 世纪70 年代末至80 年代初,软件可靠性的研究集中于对软件可靠性模型进行比较和选择。90 年代以来,软件可靠性研究工作进展较快,主要集中在软件可靠性设计、软件可靠性测试与管理以及软件可靠性数据的收集这三个方面。 2 软件可靠性的基本概念 2.1 软件可靠性的定义 1983年,美国IEEE计算机学会软件工程技术委员会对软件可靠性的定义如下: a)在规定的条件下,在规定的时间内,软件不引起系统失效的概率,该概率是系统输入和系统使用的函数,也是软件中存在的错误的函数;系统输入将确定是否会遇到已存在的错误。 b)在规定的时间周期内,在所述条件下程序执行所要求的功能的能力。 软件可靠性定义中提到的“规定的条件”和“规定的时间”,在工程中有重要的意义。 定义中的“时间”有3种度量。第一种是日历时间,指日常生活中使用的日、周、月和年等计时单元;第二种是时钟时间,指从程序运行开始到运行结束所用的时、分、秒;第三种是执行时间,指计算机在执行程序时实际占用的CPU 时间。 定义中所指的“条件”,是指环境条件,包括了与程序存储、运行有关的计算机及其操作系统。 2.2 影响软件可靠性的主要因素 软件可靠性表明了一个程序按照用户的需求和设计的目标,执行其功能的正确程度。这要求一个可靠的程序应是正确的、完整的、一致的和健壮的。软件可靠性的决定因素是与输入数据有关的软件差错,正是因为软件中的差错引起了软件故障,使软件不能满足需求。影响软件可靠性的因素主要包括: 1、软件开发的支持环境; 2、软件的开发方法;

软件可靠性技术发展与趋势分析

软件可靠性技术发展及趋势分析 1引言 1)概念 软件可靠性指软件在规定的条件下、规定的时间内完成规定的功能的能力。 安全性是指避免危险条件发生,保证己方人员、设施、财产、环境等免于遭受灾难事故或重大损失。安全性指的是系统安全性。一个单独的软件本身并不存在安全性问题。只有当软件与硬件相互作用可能导致人员的生命危险、或系统崩溃、或造成不可接受的资源损失时,才涉及到软件安全性问题。由于操作人员的错误、硬件故障、接口问题、软件错误或系统设计缺陷等很多原因都可能影响系统整体功能的执行,导致系统进入危险的状态,故系统安全性工作自顶至下涉及到系统的各个层次和各个环节,而软件安全性工作是系统安全性工作中的关键环节之一。 因此,软件可靠性技术解决的是如何减少软件失效的问题,而软件安全性解决的是如何避免或减少与软件相关的危险条件的发生。二者涉及的范畴有交又,但不完全相同。软件产生失效的前提是软件存在设计缺陷,但只有外部输入导致软件执行到有缺陷的路径时才会产生失效。因此,软件可靠性关注全部与软件失效相关的设计缺陷,以及导致缺陷发生的外部条件。由于只有部分软件失效可能导致系统进

入危险状态,故软件安全性只关注可能导致危险条件发生的失效。以及与该类失效相关的设计缺陷和外部输入条件。 硬件的失效,操作人员的错误等也可能影响软件的正常运行,从而导致系统进入危险的状态,因此软件安全性设计时必须对这种危险情况进行分析,井在设计时加以考虑。而软件可靠性仅针对系统要求和约束进行设计,考虑常规的容错需求,井不需要进行专门的危险分析。在复杂的系统运行条件下,有时软件、硬件均未失效,但软硬件的交互 作用在某种特殊条件下仍会导致系统进入危险的状态,这种情况是软件安全性设计考虑的重点之一,但软件可靠性并不考虑这类情况。2)技术发展背景 计算机应用范围快速扩展导致研制系统的复杂性越来越高。软硬件密切耦合,且软件的规模,复杂度及其在整个系统中的功能比重急剧上升,由最初的20%左右激增到80%以上。伴随着硬件可靠性的提高,软件的可靠性与安全性问题日益突出。 在军事、航空航天、医疗等领域,核心控制软件的失效可能造成巨大的损失甚至威胁人的生命。1985年6月至1987年1月,Therac-25治疗机发生6起超大剂量辐射事故,其中3起导致病人死亡。1991年海湾战争。爱国者导弹在拦截飞毛腿导弹中几次拦截失败,其直接原因为软件系统未能及时消除计时累计误差。1996年阿里亚娜5型运载火箭由于控制软件数据转换溢出起飞40秒后爆炸,造成经济损

软件可靠性和安全性设计指南

软件可靠性和安全性设计指南 (仅供内部使用) 文档作者:_______________ 日期:___/___/___ 开发/测试经理:_______________ 日期:___/___/___ 产品经理: _______________ 日期:___/___/___ 管理办:_______________ 日期:___/___/___ 请在这里输入公司名称 版权所有不得复制

软件可靠性和安全性设计指南 1 范围 1 .1主题内容 [此处加入主题内容] 1 .2适用范围 [此处加入适用范围] 2 引用标准 GBxxxx 信息处理——数据流程图、程序流程图、系统流程图、程序网络图和系统资源图的文件编制符号及约定。 GB/Txxx 软件工程术语 GB/Txxxxxx 计算机软件质量保证计划规范 GB/T xxxxx 计算机软件配置管理计划规范 GB/T xxxxx 信息处理——程序构造及其表示的约定 GJBxxxx 系统安全性通用大纲 GJBxxxxx 系统电磁兼容性要求 GBxxxx 电能质量标准大纲 GBxxxxx 电能质量标准术语 3 定义 [此处加入定义] 3 .1失效容限 [此处加入失效容限] 3 .2扇入 [此处加入扇入] 3 .3扇出 [此处加入扇出] 3 .4安全关键信息 [此处加入安全关键信息] 3 .5安全关键功能 [此处加入安全关键功能]

3 .6软件安全性 [此处加入软件安全性] 4 设计准则和要求 4 .1对计算机应用系统设计的有关要求 4 .1.1 硬件软件功能的分配原则 [此处加入硬件软件功能的分配原则] 4 .1.2 硬件软件可靠性指标的分配原则[此处加入硬件软件可靠性指标的分配原则] 4 .1.3 容错设计 [此处加入容错设计] 4 .1.4 安全关键功能的人工确认 [此处加入安全关键功能的人工确认] 4 .1. 5 设计安全性内核 [此处加入设计安全性内核] 4 .1.6 记录系统故障 [此处加入记录系统故障] 4 .1.7 禁止回避检测出的不安全状态[此处加入禁止回避检测出的不安全状态] 4 .1.8 安全性关键软件的标识原则 [此处加入安全性关键软件的标识原则] 4 .1.9 分离安全关键功能 [此处加入分离安全关键功能] 4 .2对硬件设计的有关要求 [此处加入对硬件设计的有关要求] 4 .3软件需求分析 4 .3.1 一般要求 [此处加入一般要求] 4 .3.2 功能需求 [此处加入功能需求] 4.3.2.1输入 [此处加入输入] 4.3.2.2处理 [此处加入处理] 4.3.2.3输出 [此处加入输出]

硬件可靠性及提高

硬件可靠性及提高 一般来说,系统总是由多个子系统组成,而子系统又是由更小的子系统组成,直到细分到电阻器、电容器、电感、晶体管、集成电路、机械零件等小元件的复杂组合,其中任何一个元件发生故障都会成为系统出现故障的原因。因此,硬件可靠性设计在保证元器件可靠性的基础上,既要考虑单一控制单元的可靠性设计,更要考虑整个控制系统的可靠性设计。 1.影响硬件可靠性的因素 (1)元件失效。元件失效有三种:一是元件本身的缺陷,如硅裂、漏气等;二是加工过程、环境条件的变化加速了元件、组件的失效;三是工艺问题,如焊接不牢、筛选不严等。 (2)设计不当。在计算机控制系统中,许多元器件发生的故障并不是元件本身的问题,而是系统设计不合理或元器件使用不当所造成。 在设计过程中,如何正确使用各种型号的元器件或集成电路,是提高硬件可靠性不可忽视的重要因素。 (1)电气性能:元器件的电气性能是指元器件所能承受的电压、电流、电容、功率等的能力,在使用时要注意元器件的电气性能,不能超限使用。(2)环境条件:计算机控制系统的工作环境有时相当恶劣,由于环境因素的影响,不少系统的实验室试验情况虽然良好,但安装到现场并长期运行就频出故障。其原因是多方面的,包括温度、干扰、电源、现场空气等对硬件的影响。因此,设计系统时,应考虑环境条件对硬件参数的影响,元件设备须经老化试验处理。 (3)组装工艺:在硬件设计中,组装工艺直接影响硬件系统的可靠性。由于工艺原因引起的故障很难定位排除,一个焊点的虚焊或似接非接很可能导致整个系统在工作过程中不时地出现工作不正常现象。另外,设计印制电路板时应考虑元器件的布局、引线的走向、引线的分类排序等。

嵌入式软件可靠性设计规范checklist

嵌入式软件可靠性设计规范汇总

43.高级报警显示:红色,1.4Hz~ 2.8Hz,信占比率20%~60%开 44.中级报警显示:黄色,0.4Hz~0.8Hz,信占比率20%~60%开 45.低级报警显示:蓝绿色或者黄色,常开,信占比率100% 46. 高优先级和中优先级的报警上、下限设置值,一旦超出可能引起较严重后果的非合理报警数值区域时,均需加单独的对话弹出框予以提醒操作者 47. 默认的报警预置不允许修改,并提供让用户能恢复到出厂默认报警设置的操作途径 48.做报警日志记录,为以后的故障分析、维修检查或商业纠纷提供依据 与硬件接口的软件49. 数据传输接口的硬件性能限制了数据传输速率的提高,在确定波特率前,要确认硬件所能承受的最高传输率,光耦、485、232、CAN、传输线上有防护 器件(TVS或压敏电阻)的端口 50.硬件端口读进来的数据必须加值域范围的判断 51.硬件端口读取数据,必须加可控时间或次数的有限次限制 52.A/D的位数比前端放大电路的精度要求略高即可,并通过数学计算验证 53. 对运动部件的控制,正向运动突然转向反向运动时,必须控制先正向减速到0,然后再反向加速的控制方式 54. 运动部件停机后、再快速启动的工作控制方式是不允许的。须停机、开机、delay延时、再启动执行机构,以确保执行机构先释放原来运动状态的惯性,然后再从静态下启动 55. 运动部件都有过渡过程特性,软件驱动时的上升沿和下降沿的过渡特性会 直接影响到硬件的安全和执行效果 56. 板卡启动时,先initMCU、然后Delay、然后initIO,以确保各芯片的上电 电源都已经稳定下来再启动工作 57. 对采集自有可能受到干扰的模拟端口输入的数字量数据,一定要加上、下 限、Δ/Δt、规律性干扰的滤波措施三个方面的容错性机制 58. 对数字端口传输数据可以连续传输两遍,以防范随机性偶发干扰,实时性要求较高的,可以连续传三遍,2:1判定 59. 模块之间的数据通信联络,用周期性读取的方式、或请求-应答的方式传送 数据,一旦超出周期性时间要求,或未应答,则判定硬件失效,需有软件的

嵌入式系统最小系统硬件设计

引言 嵌入式系统是以应用为中心,软件硬件可裁剪,适应应用系统对功能、可靠性、成本、体积、功耗等综合性严格要求的专用计算机系统。本文主要研究了基于S3C2410的嵌入式最小系统,围绕其设计出相应的存储器、总电源电路、复位电路等一系列电路模块。 嵌入式最小系统 嵌入式最小系统即是在尽可能减少上层应用的情况下,能够使系统运行的最小化模块配置。以ARM内核嵌入式微处理器为中心,具有完全相配接的Flash电路、SDRAM电路、JTAG电路、电源电路、晶振电路、复位信号电路和系统总线扩展等,保证嵌入式微处理器正常运行的系统,可称为嵌入式最小系统。对于一个典型的嵌入式最小系统,以ARM处理器为例,其构成模块及其各部分功能如图1所示,其中ARM微处理器、FLASH和SDRAM模块是嵌入式最小系统的核心部分。

微处理器——采用了S3C2410A ; 电源模块——本电源运用5V 的直流电源通过两个三端稳压器转换成我们所设计的最小系统所需要的两个电压,分别是3.3V 和1.8V ,3.3V 的给VDDMOP ,VDDIO,VDDADC 等供电,而1.8V 的给VDDi 和RTC 供电。 时钟模块(晶振)——通常经ARM 内部锁相环进行相应的倍频,以提供系统各模块运行所需的时钟频率输入。32.768kHz 给RTC 和Reset 模块,产生计数时钟,10MHz 作为主时钟源; Flash 存储模块——存放嵌入式操作系统、用户应用程序或者其他在系统掉电后需要保存的用户数据等; SDRAM 模块——为系统运行提供动态存储空间,是系统代码运行的主要区域; 复位模块——实现对系统的复位; 1.8V 电源LDD 稳压 SDARM 32MB (use JTAG 接口 REST 电路256字 节E2PROM E2PROM UART 串口功能扩展 32768Hz 晶振RTC 时钟源 S3C2410A-20 (ARM920T) (16KB I-Cache,16KB D-Cache) SDARM 32MB (use NOR FLASH 2MB (use

浅析计算机软件可靠性设计

浅析计算机软件可靠性设计 摘要:本文介绍了软件可靠性设计的基本概念,软件故障产生的机理,软件质量的可靠性参数,并且着重介绍了软件可靠性设计方法。 随着科学技术的不断进步,软件可靠性成为我们关注的一个问题,软件系统规模越做越大越复杂,其可靠性越来越难保证。应用本身对系统运行的可靠性要求越来越高,在一些关键的应用领域,如航空、航天等,其可靠性要求尤为重要,在银行等服务性行业,其软件系统的可靠性也直接关系到自身的声誉和生存发展竞争能力。特别是软件可靠性比硬件可靠性更难保证,会严重影响整个系统的可靠性。在许多项目开发过程中,对可靠性没有提出明确的要求,开发商(部门)也不在可靠性方面花更多的精力,往往只注重速度、结果的正确性和用户界面的友好性等,而忽略了可靠性。在投入使用后才发现大量可靠性问题,增加了维护困难和工作量,严重时只有束之高阁,无法投入实际使用。本文仅就软件可靠性工程在软件开发过程中的应用谈谈自己的认识。 1.软件可靠性设计的基本概念 1.1 软件及软件故障。软件(也称程序)本质上是一种把一组离散输入变成一组离散输出的工具,它由一组编码语句组成,这些语句的功能基本上是以下功能之一:(1)计算一个表达式并将其结果

存储在单元里;(2)决定下一步要执行哪个语句;(3)进行输入/输出控制。 的整个寿命周期的。软件的寿命周期,是指从软件任务的提出一直到它完成使命,因陈旧而被废弃为止的整个时间历程,这个寿命周 期包括了提出要求/规格说明、设计、实现、检验、维护等五个阶段,前四个阶段为开发期,维护阶段为使用期。 1.2 软件可靠性。关于软件可靠性的定义是什么。较多的人认为软件的可靠性与“概率统计的可靠性”的概念密切相关,软件的可靠性是软件在规定的条件下、规定的时间周期内执行所要求功能的能力。软件的可靠度是软件在规定的条件下、规定的时间内不引起系统故障的概率,该概率是系统输入与系统使用的函数。 2.软件质量的可靠性参数 2.1 系统平均不工作间隔时间(mtbsd或mtbd)。设d为软件正常工作总时间,d为系统由于软件故障而停止工作的次数,则定义tbsd=tv/(d+1)。式中,tbsd—mtbsd;tv—软件正常工作总时间(h);d—系统由于软件故障而停止工作的次数。mtbsd反映了系统的稳定性。 2.2 系统不工作次数(一定时期内)。由于软件故障而停止工作,必须由操作者介入再启动才能继续工作的次数。 2.3 可用度a。设tv为软件正常工作总时间,td为由于软件故

可靠性试验分析及设计

ji 第四章(44) 可靠性试验与设计 四、最小二乘法 用图估法在概率纸上描出[],()i i t F t 点后,凭目视作分布检验判别所作的回归直线往往因人而异,因此最好再通过数值计算求出精确的分布检验结论和求出数学拟合的回归直线。通常用相关系数作分布检验,用最小二乘法求回归直线。 相关系数由下式求得: ()() n i i X X Y Y γ--= ∑ 其中X,Y 是回归直线的横坐标和纵坐标,它随分布的不同而不同。下表是不同分布的 坐标转换 只有相关系数γ 大于临界值0γ时,才能判定所假设的分布成立。0γ临界系数可查相应的临界相关系数表,如给定显著水平0.05α=,n=10,可查表得00.576γ=。若计算的0γγ,则假设的分布成 立。 如果回归的线性方程为 Y mX B =- 则由最小二乘法得到系数为

1 1 111 221 1??1?1 ()n n i i i i n n n i i i i i i i n n i i i i Y m X B N X Y X Y N m X X N =======-+=-=-∑∑∑∑∑∑∑ 代入上表中的不同的分布,就可以得到相应分布的参数估计值。 五、最好线性无偏估计与简单线性无偏估计 1、无偏估计 不同子样有不同的参数估计值?q ,希望?q 在真值q 附近徘徊。若?()E q q =,则?q 为q 的无偏估计。如平均寿命的估计为?i t n q =? ,是否为无偏估计? Q 1 [] ?()[]n i i i i t E t E E n n n q q q === = =? 邋 \ ?q 为q 的无偏估计 2、最好无偏估计定义 若?k q 的方差比其它无偏估计量的方差都小,即?()min ()k k D D q q =,则?k q 为最好无偏估计。 3、线性估计定义 若估计量?q 是子样的一个线性函数,即1 ?n i i i a q ==C ? ,则称?q 为线性估计。 4、最好线性无偏估计 当子样数25n £时,通过变换具有()F m s C -形式的寿命分布函数,其,m s 的最好线性无偏估计为: 1 ?(,,)r j i D n r j X m ==? ?(,,)j C n r j X s =? 其中(,,),(,,)D n r j C n r j 分别为,m s 的无偏估计,有了,,n r j 后,可有专门表格查无偏系数(,,),(,,)D n r j C n r j 。

嵌入式软件可靠性设计

嵌入式软件可靠性设计培训 嵌入式软件既是电子系统的核心,也是硬件系统的有效补充,需要具备防错、判错、纠错、容错的功能,具备了这些功能,就能保证系统可靠性要求在软件分系统设计中的实现。但是软件可靠性又不同于硬件电路,它不会随时间的推移而降低,并且其可靠性保障全部在设计过程中实现。因此软件工程的工作也是软件可靠性所要关注的内容。 为此,我协会决定组织召开《嵌入式软件可靠性设计》讲座,本讲座主要从嵌入式软件的系统设计、需求分析、接口、模块、变量控制、软件测试、安全性分析、硬件匹配设计等设计规范进行总结和分析,深层次探讨嵌入式软件的可靠性设计技巧。现具体事宜通知如下: 【主办单位】中国电子标准协会培训中心 【协办单位】深圳市威硕企业管理咨询有限公司 课程提纲:课程大纲以根据学员要求,上课时会有所调整,具体以报到时的讲义为准。 1.概述和定义 2.计算机系统设计准则:2.1、一般要求;2.2、硬件与软件功能的分配原则;2.3、硬件与软件可靠性指标的分配原则;2.4、安全关键功能的人工确认;2.5、安全性内核;2.6、自动记录系统故障;2.7、禁止回避检测出的不安全状态;2.8、保密性设计;2.9、容错设计

3.硬件设计:3.1、硬件选用;3.2、总线检测;3.3、加电检测;3.4、电源失效的安全措施;3.5、主控计算机失效的安全措施;3.6、反馈回路传感器失效的防护措施3.7、电磁干扰的防护措施;3.8、维修互锁措施 4.软件需求分析 5.软件危险分析 6.安全关键功能设计 7.冗余设计准则:7.1、指令冗余设计;7.2、软件陷阱与软件拦截技术;7.3、软件冗余 8.接口设计准则:8.1、硬件接口要求;8.2、硬件接口的软件设计;8.3、人机界面设计;8.4、报警设计;8.5、软件接口设计 9.软件健壮性设计准则:9.1、电源失效防护;9.2、加电检测;9.3、电磁干扰; 9.4、系统不稳定;9.5、接口故障9.6、干扰信号9.7、错误操作;9.8、监控定时器的设计9.9、异常保护设计 10. 简化设计准则:10.1、单入和单出;10.2、模块的独立性;10.3、模块的扇入扇出;10.4、模块耦合方式;10.5、模块内聚顺方式;10.6、其他特殊考虑 11.余量设计:11.1、资源分配及余量要求11.2、时序安排的余量要求 12. 数据要求:12.1、数据需求;12.2、属性控制;12.3、数值运算范围控制;12.4、合理性检查 13. 防错程序设计准则:13.1、参数化;13.2、公用数据和公共变量;13.3、标志;13.4、文件;13.5、非授权存取的限制13.6、无意指令跳转的处理;13.7、程序检测点的设置13.8、寻址模式的选用;13.9、数据区隔离;13.10、安全关键信息的要求;13.11、信息存储要求;13.12、算法选择要求 14. 编程要求:14.1、语言要求;14.2、汇编语言编程限制14.3、高级语言的编程限制;14.4、圈复杂度指数(McCabe)14.5、软件单元的规模;14.6、命名要

人机系统可靠性设计基本原则(设备改善遵循的原则)

人机系统可靠性设计基本原则 1.系统的整体可靠性原则 从人机系统的整体可靠性出发,合理确定人与机器的功能分配,从而设计出经济可靠的人机系统。 一般情况下,机器的可靠性高于人的可靠性,实现生产的机械化和自动化,就可将人从机器的危险点和危险环境中解脱出来,从根本上提高了人机系统可靠性。 2.高可靠性组成单元要素原则 系统要采用经过检验的、高可靠性单元要素来进行设计。 3.具有安全系数的设计原则 由于负荷条件和环境因素随时间而变化,所以可靠性也是随时间变化的函数,并且随时间的增加,可靠性在降低。因此,设计的可靠性和有关参数应具有一定的安全系数。 4.高可靠性方式原则 为提高可靠性,宜采用冗余设计、故障安全装置、自动保险装置等高可靠度结构组合方式。 (1)、系统“自动保险”装置。自动保险,就是即使是外行不懂业务的人或不熟练的人进行操作,也能保证安全,不受伤害或不出故障。 这是机器设备设计和装置设计的根本性指导思想,是本质安全化追求的目标。要通过不断完善结构,尽可能地接近这个目标。 (2)、系统“故障安全”结构。故障安全,就是即使个别零部件

发生故障或失效,系统性能不变,仍能可靠工作。 系统安全常常是以正常的准确的完成规定功能为前提。可是,由于组成零件产生故障而引起误动作,常常导致重大事故发生。为达到功能准确性,采用保险结构方法可保证系统的可靠性。 从系统控制的功能方面来看,故障安全结构有以下几种: ①消极被动式。组成单元发生故障时,机器变为停止状态。 ②积极主动式。组成单元发生故障时,机器一面报警,一面还能短时运转。 ③运行操作式。即使组成单元发生故障,机器也能运行到下次的定期检查。 通常在产业系统中,大多为消极被动式结构。 5.标准化原则 为减少故障环节,应尽可能简化结构,尽可能采用标准化结构和方式。 6.高维修度原则 为便于检修故障,且在发生故障时易于快速修复,同时为考虑经济性和备用方便,应采用零件标准化、部件通用化、设备系列化的产品。 7.事先进行试验和进行评价的原则 对于缺乏实践考验和实用经验的材料和方法,必须事先进行试验和科学评价,然后再根据其可靠性和安全性而选用。

给水管网系统建模及其可靠性分析报告

给水管网系统建模及其可靠性分析 摘要 给水管网系统是一个拓扑结构复杂、规模庞大、用水变化随机性强、运行控制为多目标的网络系统。管网建模是仿真给水管网系统动态工况的最有效的方法,是为模拟管网系统建立数学模型的过程。模拟容主要是图形模拟、状态模拟和参数模拟。而建立模型并不是一蹴而就的,要不断的开发、更新和完善。在管网优化设计的四个方面中,保证给水系统可靠性是给水设计的主要容之一。随着现代科学技术的快速发展,可靠性工程理论日益受到广泛重视。 关键词:给水管网系统建模;管网优化设计:管网系统可靠性 一、引言 我国各城市的市政公用输配系统(供水、供气)是城市重要的基础设施之一,也是城市建设和可持续性发展的制约因素,这些工程网络在系统规划上有许多方面存在着共性。 对给水管网系统进行建模,一方面对于大量复杂、繁琐的问题能够取得快速、准确的计算结果,大大提高了工作效率,使得以前很少或者不可能进行的大型工程量计算问题和多方案比较问题得以顺利解决。另一方面,可以对输配系统的工作状态(水力、水质)进行比较准确的模拟仿真,尤其当系统中有较完善的设施时,更可以对系统的实时工况进行在线模拟,这样不仅可为系统的优化运行、调度提供很好的基础条件,为系统的改扩建提供可靠的依据,也为给水管网水质预测和安全输配提供支持。 对给水管网系统建模完成后应注意管网的优化设计,包括四个方面:水压、水量的保证性;水质的安全性;可靠性和经济性。随着现代科学技术的快速发展,作为系统工程之一的可靠性工程理论日益受到广泛重视。在近代,各种工程系统、构筑物设计时,已经开始应用可靠性的数学理论。可靠性和其他技术经济指标一样,成为评价系统优劣的主要指标。可靠性问题之所以得到重视,是因为系统、构筑物、设备相互有关,任一部分损坏可能导致整个系统的故障,而整个系统的故障,例如给水系统发生故障,将对社会和人民生活带来损害。而故障的发生多数为随机事件,一般无法预料和预防,因此给水系统可靠性具有概率的性质。在生活节奏日益加快的今天,确保给水管网系统的正常运行具有十分重要的意义。

需求分析与软件可靠性保证

需求分析与软件可靠性保证 摘要:通过对软件测试过程中产生的数据进行分析,对照软件设计过程中需求分析中的错误或缺陷,对有关可靠性指标进行反复度量,明确软件错误的分布以减少其对软件需求分析可靠性的影响,进而对相关的错误或缺陷进行控制。 关键词:需求分析;测试;可靠性评估;模型 requirements analysis and software reliability assurance pang hongbiao (information central of china north industries group corp,beijing100089,china) abstract:the data generated by the software testing process analysis,control errors or defects in the software design process needs analysis,repeated measure of the reliability index of explicit software error distribution in order to reduce the reliability of the software requirements analysis impact,and thus control the errors or defects. keywords:needs analysis;test;reliability;model 需求分析是使用技术手段分析识别软件面向客户的实际需要,并且通过特性的系统描述待开发软件需要实现的功能和解决的问题,以此定义软件所有的操作指令和特征,并最终形成软件的使用说明。因此需求分析在软件设计计划的基础之上,从最先客户的原始

软件可靠性设计与分析

软件可靠性分析与设计 软件可靠性分析与设计 软件可靠性分析与设计的原因?软件在使用中发生失效(不可靠会导致任务的失败,甚至导致灾难性的后果。因此,应在软件设计过程中,对可能发生的失效进行分析,采取必要的措施避免将引起失效的缺陷引入软件,为失效纠正措施的制定提供依据,同时为避免类似问题的发生提供借鉴。 ?这些工作将会大大提高使用中软件的可靠 性,减少由于软件失效带来的各种损失。 Myers 设计原则 Myers 专家提出了在可靠性设计中必须遵循的两个原则: ?控制程序的复杂程度

–使系统中的各个模块具有最大的独立性 –使程序具有合理的层次结构 –当模块或单元之间的相互作用无法避免时,务必使其联系尽量简单, 以防止在模块和单元之间产生未知的边际效应 ?是与用户保持紧密联系 软件可靠性设计 ?软件可靠性设计的实质是在常规的软件设计中,应用各种必须的 方法和技术,使程序设计在兼顾用户的各种需求时, 全面满足软件的可靠性要求。 ?软件的可靠性设计应和软件的常规设计紧密地结合,贯穿于常规 设计过程的始终。?这里所指的设计是广义的设计, 它包括了从需求分析开始, 直至实现的全过程。 软件可靠性设计的四种类型

软件避错设计 ?避错设计是使软件产品在设计过程中,不发生错误或少发生错误的一种设计方法。的设计原则是控制和减少程序的复杂性。 ?体现了以预防为主的思想,软件可靠性设计的首要方法 ?各个阶段都要进行避错 ?从开发方法、工具等多处着手 –避免需求错误 ?深入研究用户的需求(用户申明的和未申明的 ?用户早期介入, 如采用原型技术 –选择好的开发方法

?结构化方法:包括分析、设计、实现 ?面向对象的方法:包括分析、设计、实现 ?基于部件的开发方法(COMPONENT BASED ?快速原型法 软件避错设计准则 ? (1模块化与模块独立 –假设函数C(X定义了问题X 的复杂性, 函数E(X定义了求解问题X 需要花费的工作量(按时间计,对于问题P1和问题P2, 如果C(P1>C(P2,则有 E(P1> E(P2。 –人类求解问题的实践同时又揭示了另一个有趣的性质:(P1+P2>C(P1 +C(P2 –由上面三个式子可得:E(P1+ P2> E(P1+E(P2?这个结论导致所谓的“分治法” ----将一个复杂问题分割成若干个可管理的小问题后更易于求解,模块化正是以此为据。 ?模块的独立程序可以由两个定性标准度量,这两个标准分别称为内聚和耦合。耦合衡量不同模块彼此间互相依赖的紧密程度。内聚衡量一个模块内部各个元素彼此结合的紧密程度。 软件避错设计准则 ? (2抽象和逐步求精 –抽象是抽出事物的本质特性而暂时不考虑它们的细节 ?举例

企业网络安全风险分析及可靠性设计与实现研究

企业网络安全风险分析及可靠性设计 与实现研究 摘 要:现今,伴随信息、通信技术的完善,网络攻击技术的革新,网络安全问题日益显现。网络安全的管控,可以从侧面反映网络的安全状态,确保企业的网络安全。网络的安全性,关系企业的长远发展问题,同时也会间接影响社会的发展,作为企业的管理者我们应确保企业网络的安全,进而提高企业的经济效益。因此,本文就从网络安全风险分析、网络可靠性设计、企业网络安全的实现几方面进行一定的探讨,期望可以为企业的正常运行提供一定的帮助。 关键词:企业;网络风险分析;可靠性设计与实现现今,伴随信息、通信技术的完善,计算机网络中信息与数据的汇聚,都给人们的生活带来了极大的便捷性。经由网络系统,不仅提高了企业信息保存、传输的速度;提高了市场的反映速度;还带动了企业业务的新发展。企业内部中的网络信息,在现实运用中都实现了资源共享[1]。但是,在资源共享的前提下,就存在企业内部机密的安全性问题,尤其是现今的网络安全问题频发,我们更应提高对于企业的网络安全问题的关注度。因此,本文就对企业网络安全进行一定的探讨,期望可以对企业的正常运行提供有效帮助。 1网络安全风险分析 1.1安全威胁的分类 网络安全威胁,具体就是指潜在的、会对企业资产形成损失的安全问题。导致安全威胁的因素诸多,具体分类为:恶意攻击;系统软件问题;自然灾害;人为因素等[2]。

1.2网络系统安全影响因素[3] 1.2.1缺乏完善的管理体系 完善的网络管理体系,不单需要投入大量的网络设备,同时也要求有技术的支持。网络安全建设,其主要因素还应建立规范的网络安全管理机制。在任何企业,为了有效的保证网络的安全性,都应注重管理与技术的结合。在企业中,应注重员工的安全教育,同时管理者应依据现实状况,不断的完善企业的管理制度。 1.2.2缺乏网络安全知识 企业中的员工,其安全防范意识欠缺,对于网络安全知识认识较少,常会因个人信息的丢失,导致公司机密文件的泄漏。企业的网络安全,关系到企业的长远发展策略,因此公司应增强员工的安全知识教育,从根本上确保公司的网络安全。首先,企业员工在获取资源时,应该警惕病毒的侵入,防患于未然。其次,企业员工应该对于网络程序的安全性,有自己的初步判断能力,同时安装防病毒软件,并定时进行更新。第三,企业员工中对于文件的管理,应该注重文件的安全问题,应由员工自己管理文件,并设置权限。 1.2.3网络拥塞 网络拥塞,具体讲就是指当用户对网络资源的需求量,超过了网络固有容量的时候,出现的一种网络过载的状况[4]。企业员工的访问时间;交换机与路由器的端口传输速率等,都是造成网络拥塞的原因。当企业中出现网络拥塞的情况,就会出现数据不能进行转发,进而影响正常的网络运转工作,因此,企业在网络管理中,应依据这一情况制定合理的规划。 1.2.4系统漏洞的问题 现今,多数企业都是应用TCP/IP

单片机系统可靠性设计

单片机系统可靠性设计 单片机是典型的嵌入式微控制器,由运算器,控制器,存储器,输入输出设备等构成,相当于一个微型的计算机。下面是小编为你带来的单片机系统可靠性设计,欢迎阅读。 在单片机系统的设计中,为了提升系通过运行的安全性与可靠性,需要针对其硬件系统和软件系统实施可靠性设计,这样才能满足使用需求。本文将针对单片机系统,分别从软件和硬件两个方面来阐述可靠性设计,具有一定的借鉴意义。 单片机系统可靠性设计 随着科学技术的不断进步,人们对于单片机系统的设计也更加关注,不断研究出新的技术,来提升单片机系统运行的可靠性。但是其可靠性与用户需求依然存在着一定的差距,亟需对其进行完善,提升可靠性。 正确设计软件 1.认真设计 对于单片机系统每部分的硬件地址,要清楚明确,对于汇编语言指令以及机器状态影响要了解和掌握,对于CPU内部的RAM功能要划分正确,仔细认真编写单片机系统软件。同时,在编写中,应用软件工程做法,保证程序的透明易懂,提升可维护性和可读性。 2.合理安排中断 按照系统的具体特点,对于工段优先级和中断功能进行

合理的安排,保护和恢复中断现场,防止发生中断冲突。 3.模块化结构 按照系统功能,可以将软件划分为多个模块,保证变成具有清楚的思路,便于调试和阅读,不易出错。 提升可靠性具体措施 1.设计合理的软件陷阱 在运行软件的过程中,有可能会出现失控的情况,例如,受到干扰,或者程序飞逸到非程序区。所以,在重要程序段、程序断裂点、非程序区以及向量区,可以埋设陷阱,从而及时捕捉飞逸程序。 2.指令冗余技术的应用 在不对实时性造成影响的情况下,反复执行同一指令,应用三选二方式实施判定,可以消除一些偶然的干扰,从而提升可靠性。 指令的应用 在进行单片机的地面测井仪的研制时,在对编好程序进行仿真运行时能够通过,但是写入指令时却无法运行,这是就可以将发生问题的字节用NOP代替,从而正常运行。 4.软件消抖方式 在按键操作中经常会发生意外的抖动,为了有效消抖,在处理程序内,可以通过延时再判,保证人机对话运行的可靠性。

相关主题
文本预览
相关文档 最新文档