当前位置:文档之家› 多态系统可靠性

多态系统可靠性

多态系统可靠性
多态系统可靠性

多态系统可靠性改善中的多态元件的关键性分析

摘要

本文用多态元件(MSMC)为多态系统评估并实施了复合重要措施(CIM)。重要措施常常被作为一种手段用来对系统内单个元件的影响和临界重要度进行评估和排名,然而很少被用作为系统可靠性改进方法的优先次序排序的导向。对于多态系统,先前开发的措施有时并不恰当,他们不能满足所有用户的需求。本研究有两个相关联的目标:第一,要区分两种类型的重要措施,他们就多态系统的可靠性可用MSMC评估部件的临界重要度;第二,基于CIM,发展一个分配启发式的组件来最大限度地改善系统可靠性。这种启发式用蒙特卡罗模拟的算法和最大流最小切割算法作为手段计算组件CIM。这些措施就变成了一个基于成本的复合权值,引导分配多余的元素融入现行体制中。不同的复杂系统的实验结果表明了这些新CIM就多态系统的可靠性能有效地估计组件的临界重要度。同样,这些结果表明,该基于启发式的CIM可以作为一种快速、有效的技术来引导系统可靠性的改进。

关键词:重要措施;多态系统;可靠性改进

Abstract

This paper evaluates and implements composite importance measures (CIM) for multi-state systems with multi-state components (MSMC).Importance measures are frequently used as a means to evaluate and rank the impact and criticality of individual components within a system yet they are less often used as a guide to prioritize system reliability improvements. For multi-state systems, previously developed measures sometimes are not appropriate and they do not meet all user needs. This study has two inter-related goals: first, to distinguish between two types of importance measures that can be used for evaluating the criticality of components in MSMC with respect to multi-state system reliability, and second, based on the CIM, to develop a component allocation heuristic to maximize system reliability improvements. The heuristic uses Monte-Carlo simulation together with the max-flow min-cut algorithm as a means to compute component CIM. These measures are then transformed into a cost-based composite metric that guides the allocation of redundant elements into the existing system. Experimental results for different system complexities show that these new CIM can effectively estimate the criticality of components with respect to multi-state system reliability. Similarly, these results show that the CIM-based heuristic can be used as a fast and effective technique to guide system reliability improvements.

Keywords: Importance measures; Multi-state systems; Reliability improvement

1介绍

一个系统设计中的特殊的组件的临界重要度是依据重要措施进行量化的。对于系统展示二进制功能行为(例如,系统和系统部件要么完全功能要么完全失败),Vasseur和Llory回顾了可靠性的成就(RAW)、可靠性降低(RRW),Fussell-Veseley价值(FV)和黄宗玉最有价值和

常用的重要措施。这些系统重要措施,可以就整体系统的可靠性,帮助确定最重要的部分,可作为一个工具,用于识别系统的弱点和优先考虑改进活动中可靠性。

因此,降低系统的能力,以满足给定要求,下文可以证明了进行二进制状态的可靠性分析是不充分的。对于一些系统,如给水、电信、石油和天然气供应、生产、发电和传输系统,以可靠度分析的方法考虑构件的退化,通常可以提供有价值的洞察力[2]。就是说,这些系统中的组件可以经营一个堕落的状态使得系统要么继续提供可接受水平的服务,或着,部分的服务水平(取决于系统配置)。分析了这些系统的可靠性,理论研究和应用研究已经致力于多态网络可靠性分析[2、3]、仿真[4、5],近似方法[6、7]和优化[8、9]。

对于多态系统的多态元件(MSMC),研究主要集中在建模和可靠性分析上了。这些系统的重要措施(IM)研究被限制在经常使用二进制重要措施适应多态行为。这些方法的特征,对于其对系统可靠性的影响最重要的部分状态就是给定成分。然而,某些情况下,最关键的系统组件可能不符合国家最关键的系统组件[10]。

使用IM当作一个工具,用于MSMC可靠性改进和成分优先排序要求考虑所有前景状态以确定识别关键元素。Ramirez-Marquez和Coit[10] 讨论了下列情况,当一个系统通过选择现成的组件升级或者当一个设计师也许选择的组件被一个更可靠组件代替了。在这些情况下,基于他们如何影响多态系统的可靠性,在多态不同的组件中能够区分,能证明引导这些行动的工具是有价值的。

最近发展的重要措施MSMC[10、11]已经在复杂的情况下促进了对重要成分的直接决定或排序的能力。然而,使用这些信息来分配资源,和MSMC可靠性改进的优先考虑顺序,虽然经常在文献[12、13]提到,很大程度上忽视了。因此,本文介绍了复合重要措施(CIM),多态部件作为一个整体,对MSMC可靠性影响行为进行确认和排序。此外,补充的分析, 从这些CIM中得到的信息开发启发式算法,提出了一个现有的MSMC的客观可靠性提高的假设现有的元件可用于提供冗余度。

文章组织如下:第二章介绍了应用在MSMC系统的可靠性分析的概念,并讨论了目前最先进的多态系统可靠性。第三章呈现和论述了提出的CIM,而第四章给出了一种为 MSMC改进可靠性的基于CIM启发式算法。第五部分提出了用CIM的相关的结果和启发式的研究,最后,第六部分是结论。

假定:

组件状态是独立统计的;

结构函数O(x)是一致的。也就是组件状态的改进不能破坏系统;

成分组件和它们相关的概率是已知的。

字母符号:

CIM:复合重要措施

FV :Fussell-Vesely重要性

MAD:绝对偏差

MMCV:多态最小切向量

MRd:多态可靠性的水平d

MSMC:多态系统与多态组件

RAW:可靠性增加价值

RRW:可靠性减少价值

SAD:绝对偏差之和

MC:蒙特卡罗仿真

BMCV:二进制最小切向量

1.1多态可靠性

对于MSMC,可靠性可以定义为当系统部件和要求遵循一个多态行为时系统容量可以满足要求的的概率。A=i1≤i≤A代表套一个随机生产系统各元件的集合。组件i的当前的状态(能力)的被定义为xi从向量bi得到的值,

。其中等于i组件的最大能力,等于状态的数目。就是说,向量bi代表组件i的能力范围。向量

代表确定的概率系统状态向量表示所有网络组件状态。表示多状态结构功能。它映射到一个系统状态系统的状

态向量。就是,是在系统状态向量x下得系统容量。

一般来说,MSMC需要提供一个需求。对于一个系统,需求是常数,然后多态可靠性是通

过得到的,(---是在d水平下的多态可靠性)。对于系统需求的变化,丧失负荷概率(LOLP)指数,考虑到概率,系统不能提供给一个划分为为k的时间间隔的操作期给定的需求负载。如果向量和向量被定义为w间隔的持续时间和需求水平。然后可以被理解为在总时间间隔的概率, 通过多态元件的具体实现,该系统容量能够满足需求。因此:

其中:

整个系统容量的概率就大于或等于通过给定的特殊需求水平。

2多状态可靠性的重要性措施和分析

首先研究在多态系统中IM与部件和系统的可靠性行为之间有关的根本关系。在这方面,EL -Neweihi[14]和巴洛和吴[15]都分析了,一个特定的组件的状态如何影响一个特定的系统状态。多状态系统的性能的概念形式化的是由于格里菲斯[16]认为,通过组件的改善如何影响整个系统的可靠性行为,定义为每个系统组件,导致可靠性的重要性载体的研究一般定义为伯恩鲍姆的重要性措施。

对于二进制能的组件的多态系统(组件只有两种状态,在某些预定的性能水平工作或失败),考虑到多状态系统的可靠性是如何受组件扰动和随机系统的需求影响的,列维京和Lisnianski[12]提出了敏感性措施,。对于MSMC,ZIO和Podofillini[13]形成了RAW、RRW、FV的研究扩展,伯恩鲍姆对各个组件的状态水平的重要性进行了量化。列维京等人[17]通过提供了一个经由普遍的生成函数方法的更快的评价方法来延长这项工作。

拉米雷斯马尔克斯和Coit[10]开发的直接扩展伯恩鲍姆,RAW和FV。同样,拉米雷斯马尔克斯等人【11】研究的措施提供了组件对不满足需求,系统故障,冗余分配的贡献的见解。艾文和Ostebo[18]提出的IM对组件退化如何防止需求的满足和如何增加组件的能力来影响系统的可靠性进行量化研究。吴和生[19]通过定义一个效用函数去区别哪些组件MSMC可靠性的影响最强烈扩展了格里菲斯的[16]的重要性量化矢量。

IM的计算高度依赖用于确定MRD的方法。在这方面,林[20]和叶[21]研发了减少隐式枚举的方法去寻找多态的最小割向量(MMCVs)即,相当于多态的最小割集。这些方法依赖于系统最小割集的先验知识和MSMC有连续状态组件的假设。拉米雷斯-马尔克斯等人[22]通过开发一个信息共享的方法扩展这些方法,选择一些称为后代削减的MMCV的继承信息从称为父削减的MMCV的信息中,从而减少隐枚举。

基于先验最小路径的系统集的知识,林[23]开发了一个不平等的集合,解决时,提供的MMPV,相当于多态的平等最小路集。这种方法只限于有连续状态的组件的MSMC。这些限制

已经在拉米雷斯 -马尔克斯等[3]的方法中放宽了,方法中反复分析系统组件的接班人和分解网络通过继承那些保证系统成功的潜在的组件状态。

由Rocco和Muselli开发[7]的模拟方法产生决策规则。这些研究人员所采用分类技术去产生可靠性表达的估计,它提供了可靠性的合理的精确值和MMCV。最近,拉米雷斯-马尔克斯和埃菲尔中[6]展示了如何基于分类树为MSMC可靠性构建近似边界。

最后,对于二进制能组件的多态系统,列维京等[8]提出了基于普遍的生成函数的程序来计算。这需要相对较小的计算时间也不需要关于MMCV或MMPV可以得到的信息。列维京和Lisnianski[24]解释了生成函数的方法。

3.综合重要性措施

目前对于MSM中CIM的研究都集中在开发IM,IM是量化一个特定的状态或特定组件的状态集如何影响多态系统可靠性的。这些措施,被称为IM的2型式是非常有用的在这些情况下,当强调的是效果磨损的辨识和组件系统的可靠性的某种状态的逐渐退化。然而,当重点是识别对多态系统可靠性的整体影响的系统的组成部分时,包括所有状态,那么2型措施不直接适用。例如,当系统通过现成的新的组件进行升级时,或当一个设计师可能会选择一个更可靠组件代替时。

本文的第一个重点是要说明1型重要性措施,所谓的CIM,它可以协助确定多状态的组件,包括其所有状态如何影响系统的可靠性。在这方面,已经提出了以下的CIM的两个设置。

3.1 CIM的设置1

这最初的CIM的设置包含一个概括或使用最频繁的四个二进制的重要性的措施的延伸,主要由Vasseur和Llory[1]审查的。同时,CIM在此设置中包含相当于ZIO、 Podofillini[13]和列维京等[17]定义的除了这些新的措施量化组件作为一个整体对MSMC可靠性的影响。这些措施的前两个分别由拉米雷斯 -马尔克斯和Coit提出[10]的。

伯恩鲍姆给定组件的重要性被定义为的概率,即这些组件对该系统的运作是至关重要的[25]。在二进制的情况下,IM可视为一个多态问题的特殊情况,就和,因此,数学表达式为:

对的概括可以表示如下,对于满足需求

对于不同需求

这里组件i的状态数目。

RAW措施量化由一个特定组件生成的系统可靠性的最大增长百分比。从二进制的角度,就,定义为:

可以扩展到多态的情况如下:

对于满足需求

对于不同需求:

列维京等人[17]定义为RRW为由一个特定组件对系统造成的潜在损害的测量指标。RRW二进制表达式为:

对的概括可以表示如下,对于满足需求

对于不同需求:

这里对于所有。

福塞尔- 维斯利的重要性(FV)的措施,量化由特定的组件引起系统可靠性最大递减。二进制表示如下:

对的概括可以表示如下:

3.2.CIM的设置2

提出CIM的另外一个设置的目的是根据需要将状态概率合并到多状态可靠性重要度的计算中。在第一个设置中CIM的建立重点放在的一个组件的可能的状态水平,但没有考虑到对于这样的组件在该状态的概率。例如,伯恩鲍姆的CIM认为某个特定组件对整体系统的可靠性造成的绝对偏差。然而,概率偏差的发生是不考虑的。类似的观点可以为设置1中其余

的CIM形成。

考虑到CIM内的状态概率,两个与伯恩鲍姆密切相关的措施已形成。这些CIM,用于量化一个特定的组件状态从变化的偏差。此设置的起初的CIM,称为平均绝对偏差(MAD),测量由特定组件的不同性能水平和相关的概率造成的MSMC的可靠性预期绝对差。第二个替代的CIM由侧重于第二个时刻获得)。这些CIM数学表达式由下列公式给出,对于满足需求

对于不同需求:

4.基于CIM的启发式MSMC可靠性的改进

使用重要性措施作为一种对系统可靠性改进的优先排序的的工具是经常在可靠性文献[1、10、13、17、18]提到。然而,在一般情况下,提供的IM的研究(在二进制和多态的情况下)没有充分解释这些措施作为一个整体方法的一部分,进行这样的改善。作为本节的一部分,启发式方法考虑从获得的信息CIM是提出改善的目标现有MSMC的可靠性。

在这项研究中, MSMC的分析被认为是可操作的有需要作为升级需求的一部分,以改善

系统的可靠性或作为需要提高可靠性。作为一个例子,考虑电力分配系统。这些系统都由于需求增加需要不断升级,或作为减少不需要需求的手段。但是,系统的改进通常是受预算限制的。因此,可靠性和经济性都要考虑。

这个问题可以被视为MSMC的一个可靠性分配问题,指出系统改进可以考虑给系统增加冗余组件,以提高可靠性或满足新需求。也就是说,在MSMC使用冗余组件有一个可分配预算,其中已知这些组件的每个状态,相关的状态占用的概率和成本。然后,问题是以一个给定的多态系统可靠性需求的最大化的这样一种方式在MSMC中分配冗余组件。

问题P1给出了问题的提法:

问题P1:

这里x是最初的设计向量,是额外的冗余组件向量

是第j个可用组件的数量,用于为系统提供冗余组件i。

4.1启发式的描述

这是第一冗余分配为基础的方法提高MSMC可靠性。以前的办法已开发了二进制能组件的多态系统的案例[8、9]。这些方法 [8,9]对多态系统文献作出了重要贡献,但在正考虑的问题上,他们并不直接适用。

提出的启发式算法使用蒙特卡洛(MC)模拟和最大流最小割算法[26]来计算CIM的组件。这些措施然后转化成以成本为基础的综合度量指导多余的元素分配到现有的系统。每个组件分配后,重新启动进程直到初步预算耗尽。启发式的三个步骤与MC模拟方法的详细描述如下。

启发式的第一步通过分析一个特定组件的选择对当前预算的影响。然后,功能1就是将选择的CIM中单位成本价值增加近似。这个增加被定义为,并用它来决定算法的下一步。当启发式进入第2步时,可用于以最大的值提供给系统组件i冗余的组件j型,在系统设计时作为一个增加的冗余元素。此外,每个二进制的最小割向量(BMCV)更新,以反映新的系统配置。这是重要信息,BMCV不重新计算但更新。这一步结束时通过更新目前的预算返回到步骤1。第3步提供两个停止规则:(1)如果在启发式算法初始循环时,由于预算

约束没有可以添加的组件,启发式算法停止,或(2)在预算限制内,最后冗余之前没有可以添加的组件,必须的选择修订,以获得在CIM选择内提供最高增长的组件。

启发式算法符号:

第个MSMC的二进制割集

第个最小二进制割集向量,

冗余级别向量;

用于提供给余系统组件i的组件j型的数目;

用于提供给余系统组件i的组件j型的成本;

以提供给目前系统设计的冗余的可用预算;

CIM的组件i,当用于提供给余系统组件i的组件j型的数目增加了1;

启发式改进的可靠性(MRIH)。

初始化:

根据优先改进顺序选择一个合适的CIM见4.2节)。一般MRAW可以视为一个默认的CIM,但其他的CIM可能会更适合某些情况下。

得到所有最小二进制向量,定义设计向量,

确定所有的让表示的二进制分析下的割集。就是说,在C中的失败元素,导致系统发生故障。二进制最小割割集由产生的是通过设置(的的第i个元素)如下:

第一步:

根据所有的计算:

在时对每个用公式1计算:

如果进入第三步/不能满足预算限制;

否则,,进入第二步。

第二步:

根据成本最高的复合度量选择用于提供给余系统组件i的组件j。

计算:

用于提供给余系统组件i的组件j的数目进行更新,每次迭代中只有一个进行更新BMCV的更新是通过增加一个额外的进入现有BMCV中,所以,如果BMCV的数目是n,那么就变成。

更新设计向量:

对于更新最小二进制割集:

更新预算:,进入第一步。

第三步:

如果,停止。就目前预算没有可靠性改进。

否则,

计算:用公式1计算:

更新设计向量:

停止,提供了改进设计的解决方案。

被称为功能1,蒙特卡罗模拟(MC)是用来产生系统状态向量x的具体数量,是基于一

个状态相关的状态空间矢量和状态占用的概率模拟每一个组件的每个状态。然后对于每个随机生成的状态向量,功能1根据最大流最小割定理[26]和同目前BMCV的设计去分析系统状态(成功或失败)。这些失败计数变量Q,一旦最初生成的向量分析le MSMC的可靠性,可以用估计。需要注意,当计算不同CIM的值时,这个函数将被反复更新通过将的相关值变为1。

功能1:

随机生成H系统的状态向量x及每个:

4.2对CIM选择的评论

CIM的选择对MSMC的最后设计的影响是很重要的。如本文前面所述,启发式算法的目标是最大限度地提高系统的可靠性,因此,MRAW可认为是CIM及其实施的的最好选择。然而,某些情况下,可以找到感兴趣,是随着组件状态的改变为满足特定系统的需求概率的系统设计。同样,这样情况下其中一个是主要兴趣在获取系统配置元件的选择是基于减少由于组件退化造成的系统潜在损害。综上所述,虽然最大化已用于开发模式,启发式算法允许对基于配合CIM相关的不同的观点现有的设计系统作出了“改善”(这可能不一定是直接或完全相关制度可靠性最大化)。

5示例和结果

本节中的三个例子来说明开发工作。第一个例子主要是用来说明不同的CIM如何可以有效地协助获得复杂的MSMC多状态元件的临界可靠性。其余系统是用来说明采用启发式算法如何指导MSMC可靠性改善优先顺序工作的。

5.1示例1

图1显示了一个庞大的网络图,有可能会发现,网络的容量概率从源节点S到最后节点t是大于或等于5个单位。所有的弧有相同的三个状态,即(0,3,5)。表1给出了,假设不同的组件状态概率的问题的数据和假设一个特定的组件的给定的的状态的多态系统的可靠性的条件。

图1MSMC系统1

表2列出了根据CIM 1的不同类型的组件的排名。正如期望的那样,他们都确定组件17是最关键的组件。然而,是要注意的是,在一般情况下,不同的CIM的排名的往往不同,是因为他们的观测标准不同。例如,对于MRAW和MAD就是从不同的观点测量组件可靠性的

影响。因此,这些措施在他们充分理解的情况下是有用的。这些CIM根据它们如何影响多状态系统的可靠性,呈现了一致的分析的方式来确定和排名重要组件。

表1 示例1的组件数据

组件状态状态概率组件状态状态概率

表2组件的重要性降序排名

5.2示例2

分析在图2中了列维京等人[17]对系统的描述,组件可靠性数据如表3所示。在他们的研究中,他们考虑了不同的需求层次,图形化的分析了组件类型2的重要性措施。

对于目前的分析,该系统是用于说明启发式算法的可靠性改进饿为获得假设5个

单位的需求。对于这个系统,20个成本单位的预算是可以改善在图2中所描述的MSMC的可

靠性的。组件可以包括冗余的组件的相关状态、成本和占用率在表4中列出了。最后,表5

说明了通过使用提出的启发式算法如何进行系统改进的。

表5中描述了根据MAD获得的解决方案的过程。该解决方案表明三个新的组件被添加到

现有的系统中,即组件4,选择组件7选择1个,组件1选择1个。这些分配组件有19个

单位的成本,并生成系统可靠性等于到0.9830。该方法以MRAW为基础已被实施产生了相同

的解决方案。

图2现有的MSMC系统

表3 MSMC系统数据

组件状态状态概率

表4可用的组件选择

组件选择概率成本选择概率成本

表5解决结构框架

5.3 示例3

最后一个例子,图3描绘了两个终端网络。认为如果等于6个单位的需求,可以认为从源代码节点到最后节点认为MSMC是有效的。构成网络的组件的相关数据在表6中描述了。这个初始结构的可靠性系统是0.9760。为了提高网络的可靠性,表7中所描述了在余下的20个成本预算下的提供冗余组件。

表8和9分别说明了启发式算法在MAD和MRAW中的应用的解决方案的过程。在这方面,在MAD的指挥下获得的解决方案就是首选的冗余组件被添加到现有系统组件2,6和9中。总成本为20个单位时,分配这些组件可以将系统的可靠性提高到0.9981。得到了解决方案就是应用启发式算法MRAW提供了不同的解决方案,分配了首选的一个冗余组件给系统组件2,3和7和分配两个冗余组件给系统组件5。在19个单位的成下,这些选择提供给系统可靠性为0.9977。必须认识到的是用于提供冗余的组件的不同类型要结合与MAD和MRAW的观点。也就是说,就MAD的一个选择就是从偏离系统可靠性最少的组件中选择最经济的。或者就MRAW是基于提高系统的可靠性最经济的方法来选择元件。

图3多态两个终端网络

表6 MSMC系统数据

组件状态概率组件状态概率

表7可用的组件选择

组件选择概率成本选择概率成本

表8在MAD下的解决结构框架

表9在MRAW下的解决结构框架

6结论

本文介绍MSMC的IM,及提出的启发式分配可以用作引导组件优先改善系统的可靠性。这是第一次,受到成本约束用以提高MSMC可靠性得组件分配的方法已得到实施。启发式将提出的CIM转换成一个以成本为基础的复合度量,即与实施的最大流最小割定理一起,用于

选择组件分配。实验结果针对不同的系统复杂性说明了这些系统的CIM和启发式算法如何可以有效地用于优先级策略的。

参考文献

【1】Vasseur D, Llory M A.优异数字的国际调查:可靠性工程系统安全杂志1999;66:261–74.

【2】Natvig B, S?rmo S, Holen A, H?ga? sen G.多态可靠性理论--案例研究.前沿报1986;18:921–32.

【3】Ramirez-Marquez JE, Coit D, Tortorella M.广义多态两个多态终端可靠性的路径矢量方法.工程运输2005;38(6):477–88.

【4】Ramirez-Marquez JE, Coit D.逼近多态的两个终端的可靠性的蒙特卡罗模拟方法.可靠性工程系统安全杂志2004;85(3):253.

【5】Billinton R, Zhang W.状态在复合发电系统评估中的应用.中国电机工程学报2000;15(1):427–32.

【6】Ramirez-Marquez JE, Assefa B.基于分类树的方法的最小割和径集向量网络的发展.史蒂文斯理工学院工作组05-002, 2006.

【7】Rocco C, Muselli M.使用新的机器学习技术的多状可靠性近似表达式.可靠性工程系统安全杂志2005;89(3):261.

【8】Levitin G, Lisnianski A, Ben-Haim H, Elmakis D.串并联的多态系统的冗余优化.中国机电传输可靠性学报1998;47(2):165–72.

【9】Ramirez-Marquez JE, Coit D.为解决冗余问题的多态串并联系统的启发式分配法.可靠性工程系统安全杂志2004;83(3):341–9.

【10】Ramirez-Marquez JE, Coit D.复合材料的重要性措施与多态组件多态系统.中国机电传输可靠性学报2005;54(3):517–29.

【11】Ramirez-Marquez JE, Rocco C, Assefa B, Coit D, Tortorella M.多态组件的关键性和重要性的新见解.可靠性工程系统安全杂志2005;91(8):894–904.

【12 Levitin G, Lisnianski A.使用的通用生成函数的多状系统的重要性和敏感性.可靠性工程系统安全杂志1999;65:271–82.

【13】Zio E, Podofillini L.蒙特卡洛模拟在不同的系统的性能水平上多态的重要性组件影响分析.可靠性工程系统安全杂志2003;82:63–73.

【14】El-Neweihi E, Proschan F, Sethuraman J.多状态相关系统.可靠性工程系统安全杂志1978;15:675–88.

【15】Barlow W, Wu .多态组件的相关系统.数学选择可靠报1978;3(4):275–81.

【16】Griffith W.多态可靠性模型,1980;17:735–44.

【17】Levitin G, Podofillini L, Zio E.基于性能水平的限制多态元素重要性措施.可靠性工程系统安全杂志2003;82:287–98.

【18】Aven T, ?steb? R.网络流系统的两个新措施.可靠性工程系统安全杂志1986;14:75.

【19】Wu S, Chan L.多态系统的实用性能分析.中国机电传输可靠性学报2003;52(1):14.

【20】Lin Y.使用最小割集以评估随机流网络节点和弧系统的可靠性.可靠性工程系统安全杂志22002;75:41–6.

【21】Yeh W.对随机流网络不可靠的节点可靠性评价的简单的基于MC算法.可靠性工程系统安全杂志2004;83(1):47.

【22】Ramirez-Marquez JE, Coit D, Tortorella M.多态的两个终端可靠性广义割集的方法. 可靠性工程系统安全杂志03-135, 2003.

【23】Lin Y.评价随机流的可靠性网络节点故障的简单算法.计算操作系统2001;28:1277–85.

【24】Levitin G, Lisnianski A.多状态系统的可靠性.系列质量、可靠性和工程统计.第一卷新加坡:世界科技报2003.

【25】Elsayed E..可靠性工程.伦敦出版社;1996.

【26】Ford L, Fulkerson D.网络流.新泽西州,普林斯顿:普林斯顿大学出版社;1962.

..

可靠性工程每章基本概念及复习要点知识讲解

复习要点: ?可靠性 ?广义可靠性 ?失效率 ?MTTF(平均寿命) ?MTBF(平均事故间隔) ?维修性 ?有效性 ?修复度 ?最小路集及求解 ?最小割集及求解 ?可靠寿命 ?中位寿命 ?特征寿命 ?研究可靠性的意义 ?可靠性定义中各要素的实际含义 ?浴盆曲线 ?可靠性中常见的分布 ?简述串联系统特性 ?简述并联系统特性 ?简述旁联系统特性 ?简述r/n系统的优势 ?并-串联系统与串-并联系统的可靠性关系 ?马尔可夫过程 ?可靠性设计的重要性 ?建立可靠性模型的一般步骤 ?降额设计的基本原理 ?冗余(余度)设计的基本原理 ?故障树分析优缺点 广义可靠性:包括可靠性、维修性、耐久性、安全性。可靠性:产品在规定时期内规定条件规定的时间完成规定功能能力。耐久性:产品在规定的使用和维修条件下,达到某种技术或经济指标极限时,完成规定功能能力。安全性:产品在一定的功能、时间、成本等制约条件下,使人员和设备蒙受伤害和损失最小的能力 可靠度R(t):产品在规定条件下和规定时间内完成规定功能的概率 累积失效概率F(t):也称不可靠度,产品在规定条件下和规定时间内失效的概率 失效概率密度f(t):产品在包含t的单位时间内发生失效的概率 失效率λ(t):工作到t时刻尚未失效的产品,在该时刻t后的单位时间内发生失效的概率。基本:实验室条件下。应用:考虑到环境,利用,降额和其它因素的实际使用环境条件下。任务:元器件在执行任务期间,即工作条件下的基本 不可修产品平均寿命MTTF:指产品失效前的平均工作时间可修MTBF:指相邻两次故障间的平均工作时间,称为平均无故障工作时间或平均故障间隔时间维修性:在规定的条件下使用的可维修产品,在规定的时间内,按规定的程序和法进行维修时,保持或恢复到能完成规定功能的能力 维修度M(t):是指在规定的条件下使用的产品发生故障后,在规定的时间(0,t)内完成修复的概率。修复率μ(t):修理时间已达到某一时刻但尚未修复的产品在该时刻后的单位时间内完成修理的概率。平均修复时间MTTR:可修复的产品的平均修理时间,其估计值为修复

存储系统那些事

存储系统从其与生俱来的使命来说,就难以摆脱复杂系统的魔咒。无论是从单机时代的文件系统,还是后来C/S或B/S结构下数据库这样的存储中间件兴起,还是如今炙手可热的云存储服务来说,存储都很复杂,而且是越来越复杂。 存储为什么会复杂,要从什么是存储谈起。存储这个词非常平凡,存储+ 计算(操作)就构成了一个朴素的计算机模型。简单来说,存储就是负责维持计算系统的状态的单元。从维持状态的角度,我们会有最朴素的可靠性要求。比如单机时代的文件系统,机器断电、程序故障、系统重启等常规的异常,文件系统必须可以正确地应对,甚至对于磁盘扇区损坏,文件系统也需要考虑尽量将损失降到最低。对于大部分的业务程序而言,你只需要重点关注业务的正常分支流程就行,对于出乎意料的情况,通常只需抛出一个错误,告诉用户你不该这么玩。但是对于存储系统,你需要花费绝大部分精力在各种异常情况的处理上,甚至你应该认为,这些庞杂的、多样的错误分支处理,才是存储系统的“正常业务逻辑”。 到了互联网时代,有了C/S或B/S结构,存储系统又有了新指标:可用性。为了保证服务质量,那些用户看不见的服务器程序必须时时保持在线,最好做到逻辑上是不宕机的(可用性100%)。服务器程序怎么才能做到高可用性?答案是存储中间件。没有存储中间件,意味着所有的业务程序,都必须考虑每做一步就对状态进行持久化,以便自己挂掉后另一台服务器(或者自己重启后),知道之前工作到哪里了,接下去应该做些什么。但是对状态进行持久化(也就是存储)会非常繁琐,如果每个业务都自己实现,负担无疑非常沉重。但如果有了高可用的存储中间件,服务器端的业务程序就只需操作存储中间件来更新状态,通过同时启动多份业务程序的实例做互备和负载均衡,很容易实现业务逻辑上不宕机。 所以,数据库这样的存储中间件出现基本上是历史必然。尽管数据库很通用,但它决不会是唯一的存储中间件。比如业务中用到的富媒体(图片、音视频、Office文档等),我们很少会去存储到数据库中,更多的时候我们会把它们放在文件系统里。但是单机时代诞生的文件系统,真的是最适合存储这些富媒体数据的么?不,文件系统需要改变,因为: 1. 伸缩性。单机文件系统的第一个问题是单机容量有限,在存储规模超过一台机器可管理的 时候,应该怎么办。 2. 性能瓶颈。通常,单机文件系统在文件数目达到临界点后,性能会快速下降。在4TB的大 容量磁盘越来越普及的今天,这个临界点相当容易到达。 3. 可靠性要求。单机文件系统通常只是单副本的方案,但是今天单副本的存储早已无法满足 业务的可靠性要求。数据需要有冗余(比较经典的做法是3副本),并且在磁盘损坏时及早修复丢失的数据,以避免所有的副本损坏造成数据丢失。 4. 可用性要求。单机文件系统通常只是单副本的方案,在该机器宕机后,数据就不可读取, 也不可写入。 在分布式存储系统出现前,有一些基于单机文件系统的改良版本被一些应用采纳。比如在单机文件系统上加RAID5 做数据冗余,来解决单机文件系统的可靠性问题。假设RAID5 的数据修复时间是1天(实际上往往做不到,尤其是业务系统本身压力比较大的情况下,留给RAID 修复用的磁盘读写带宽很有限),这种方案单机的可靠性大概是100年丢失一次数据(即可靠性是2个9)。看起来尚可?但是你得小心两种情况。一种是你的集群规模变大,你仍然沿用这个土方法,比如你现在有100 台这样的机器,那么就会变成1年就丢失一次数据。另一种情况是如果实际数据修复时间是3 天,那么单机的可靠性就直降至4年丢失一次数据,100台就会是15天丢失一次数据。这个数字显然无法让人接受。

可靠性系统工程设计应用练习题

可靠性工程设计与应用练习题目录 1 可靠性工程设计与验证 2 系统可靠性评价 3 可靠性分配预计验证检查内容和方法 4 可靠性试验 5 FMEA 6 维修性设计与验证 7 软件可靠性 8 元器件选择与应用 9 元器件失效分析

1可靠性工程设计验证练习题 一、填空题(每空1分,共15分) 1 2 习惯称平均无故障工作时间,用Mean Time Between Failures )的缩写。 3,设有一个由按n 个单元组成的系统,其中任意r 个(r ≤n )正常工作系统就能正常工作,称为 4 5,GJB 使用阶段可靠性及其工作项目的确定、可靠性管理、可靠性设计与分析、可靠性试验与评价、使用可靠性评价与改进等5系列31项工作项目的通用要求 。 6 7,一批产品有100200小时后,有80个能正常工作,则这批产品在200小时时其可靠度的观测值是 8,设系统下属组件的可靠度分别为r1、r2……rn ,若这n 个系统组成串联系统,则系统的 可靠度为rn= 9,用、MIL-HDBK-217F 和MIL-HDBK-217E 进行预计时,假定元器件的失效 10,在下图的储备系统中,若单元的可靠性度为0.3,则两种( a&b (填有效或无效)。若单元的可靠性度为0.7,则a 、b a b 11会导致系统失效或操作失误。 二、判断题(每题1.5分,共 15分) (判断下列叙述是否正确,正确打“√”,错误打“×”) 1 ,在电子系统中,电位器必须谨慎使用。一般应尽量少用或不用。因其失效率大都是固定电阻器的10至100倍。 2 3,为了使气流畅通,流道应当骤然扩张或收缩。 4 5,在冷却流道设计中应使转变半径最大。 6,电子管灯丝电压和继电器线包吸合电流是不能减额的。 7距太近。 8 9,不是专门为负载转换设计的继电器不应当用来作负载转换。

人机系统可靠性计算(标准版)

人机系统可靠性计算(标准版) Security technology is an industry that uses security technology to provide security services to society. Systematic design, service and management. ( 安全管理 ) 单位:______________________ 姓名:______________________ 日期:______________________ 编号:AQ-SN-0772

人机系统可靠性计算(标准版) (一)、系统中人的可靠度计算 由于人机系统中人的可靠性的因素众多且随机变化,因此人的可靠性是不稳定的。人的可靠度计算(定量计算)、也是很困难的。 1.人的基本可靠度 系统不因人体差错发生功能降低和故障时人的成功概率,称为人的基本可靠度,用r表示。人在进行作业操作时的基本可靠度可用下式表示: r=a1a2a3(4—13)、 式中a1——输入可靠度,考虑感知信号及其意义,时有失误; a2——判断可靠度,考虑进行判断时失误; a3——输出可靠度,考虑输出信息时运动器官执行失误,如按错开关。

上式是外部环境在理想状态下的可靠度值。a1,a2,a3,各值如表4—5所示。 人的作业方式可分为两种情况,一种是在工作时间内连续性作业,另一种是间歇性作业。下面分别说明这两种作业人的可靠度的确定方法。 (1)、连续作业。在作业时间内连续进行监视和操纵的作业称为连续作业,例如控制人员连续观察仪表并连续调节流量;汽车司机连续观察线路并连续操纵方向盘等。连续操作的人的基本可靠度可以用时间函数表示如下: 式中r(t)、——连续性操作人的基本可靠度; t——连续工作时间; l(t)、——t时间内人的差错率。 (2)、间歇性作业。在作业时间内不连续地观察和作业,称为间歇性作业,例如,汽车司机观察汽车上的仪表,换挡、制动等。对间歇性作业一般采用失败动作的次数来描述可靠度,其计算公式为:r=l一p(n/N)、(4—15)、式中N失败动作次数;

毕业设计_网络存储的可靠性论文

计算机系统结构课程论文题目网络存储的可靠性 学院物电学院 专业计算机软件与理论

摘要 随着信息技术的不断发展,数据日益成为人们口常生活中重要资源。爆炸式增长的数据必然带来存储设备的持续增加。为了减少本地存储压力,云储存正成为时尚。目前,海量数据存储环境下的现代数据中心的存储节点规模少则几万多则几十万,但在规模巨大的存储环境系统中,磁盘损毁或者存储节点失效己成为一种常态行为;与此同时,因网络连接设备或者存储节点其它元器件造成的数据不可访问或者丢失现象也时有发生。为了满足口益扩展的数据存储需求,人们对数据存储的可靠性提出了更高的要求,如何实现海量数据在网络存储中低冗余度高可靠性存储己经成为业界面临的一个巨大挑战。 因而,本文网络存储中低冗余度高可靠性海量数据存储系统的关键问题,在总结了当今数据可靠性增强理论和海量数据存储系统基本架构的基础上,对基于纠删码的数据分布策略研究进行一定介绍。在存储系统中,提出了基于纠删码的数据冗余分布模型,研究了涉及到的数据读写,恢复算法等关键技术。通过理论分析得出了这种冗余方案对提高系统可靠性更有优势:要使数据达到相同的可用性,基于纠删码方案只需要较低的冗余度;同样在相同的冗余度情况下,基于纠删码冗余方案的数据有更高的可用性。 关键字: 可靠性;网络存储;海量数据;纠删码

一、绪论 近年来,随着云计算、物联网、社交网络等新兴技术的迅猛发展,无所不在的移动设备、无线射频识别标签、无线传感器等每分每秒都在产生感知世界的信息。数以亿计用户的互联网服务时时刻刻都在产生新的数据,同时记录人们生活的历史信息也呈现爆炸式增长。数据的快速增长必然带来存储设备的持续增加。同时,为了满足口益扩展的数据存储需求,数据存储系统的体系结构也在不断发展与变化,从传统的集中式存储到分布式存储,近几年还出现了云存储等新型海量数据存储模式。 2008年2月,几千个构建在亚马逊EC2和S3上的小型网站因数据中心宕机而受到影响;次年三月,谷歌公司的Docs出现系统故障,随后,联邦商务委员会被请求调查此事,以确定谷歌的云计算服务对客户的隐私与安全可能带来的隐患。可见,数据的丢失或失效,会给人们带来不可估量的损失。 进入20世纪以后,随着网络技术的持续发展、各种信息服务形式的不断出现、所需存储的数据呈现爆炸式增长,有研究者开始利用普通的PC机来构建大规模的存储系统,最为典型的是Google的GFS,例如,2004年Google的集群中的PC机节点达到18000台,每台PC越挂载两个磁盘。该技术的出现,使得人们对存储系统多了一种选择。现在,很多研究者和大型企业开始构建利用普通计算机硬件搭建的数据存储平台,如Apache Hadoop开源项目 , Facebook的Cassandra系统、淘宝的TFS ( Tao file system)。在存储系统中,特别是大规模数据存储系统中,系统会因为这样或那样的问题出现数据的暂时不可用或者丢失损毁现象。从数据存储系统的组成上看,不论是DAS, NAS, SAN构建的小型存储系统,还是大规模分布式集群系统乃至超大规模数据中心,其基本存储运算单元都可以分为三个部分:首先是由磁盘搭建的基础存储设备,它是数据存储的物质基础;其次是系统中心网络,它是连接存储资源和计算资源的神经中枢。最后是计算设备和系统管理软件,它负责计算任务的完成和系统节点的管理和监测。 一方面是存储数据量的爆炸式增长对基础存储设备规模上的需求,一方面是大规模海量数据存储系统频繁的失效行为,另一方面是数据的丢失给数据拥有者和使用者带来的巨大损失,这一切使得数据存储系统的可靠性成为海量数据存储面临的一个函待解决的重要挑战。当然,系统的可靠性问题可以通过单纯增加硬件冗余的方式加以解决,但这样带来的硬件成本太高,本文则从数据管理与组织的角度探讨应对海量数据存储系统中数据的可靠性问题。 二、存储系统的可靠性

电力系统可靠性评估指标

电力系统可靠性评估指标 1.1 大电网可靠性的测度指标 1. (电力系统的)缺电概率 LOLP loss of load probability 给定时间区间内系统不能满足负荷需求的概率,即 ∑∈=s i i P LOLP 式中:i P 为系统处于状态i 的概率;S 为给定时间区间内不能满足负荷需求的系统状态全集。 2. 缺电时间期望 LOLE loss of load expectation 给定时间区间内系统不能满足负荷需求的小时或天数的期望值。即 ∑∈=s i i T P LOLE 式中:i P 、S 含义同上; T 为给定的时间区间的小时数或天数。缺电时间期望LOLE 通常用h/a 或d/a 表示。 3. 缺电频率 LOLF loss of load frequency 给定时间区间内系统不能满足负荷需求的次数,其近似计算公式为 ∑∈=S i i F LOLF 式中:i F 为系统处于状态i 的频率;S 含义同上。LOLF 通常用次/年表示。 4. 缺电持续时间 LOLD loss of load duration 给定时间区间内系统不能满足负荷需求的平均每次持续时间,即 LOLF LOLE LOLD = LOLD 通常用小时/次表示。 5. 期望缺供电力 EDNS expected demand not supplied 系统在给定时间区间内因发电容量短缺或电网约束造成负荷需求电力削减的期望数。即 ∑∈=S i i i P C EDNS 式中:i P 为系统处于状态i 的概率;i C 为状态i 条件下削减的负荷功率;S 含义同上。期望缺供电力EDNS 通常用MW 表示。

可靠性理论与方法报告

可靠性理论与方法报告 报告名称:复杂系统的可靠性分析姓名:杨天元 学号:u200910106 班级:统计0902班

摘要 在本文中,先后对串联系统稳定性、并联系统稳定性以及复杂系统稳定性进行了较为详细的理论分析。并利用matlab进行相应的仿真,以验证理论计算的结果,同时还对三类系统进行了相应的灵敏度分析。 在串联系统中,系统的可靠性等于各部件可靠性之积。在串联系统可靠性灵敏性分析中发现,串联系统稳定性对可靠性最低的部件最为敏感。在并联系统中,系统的失效率等于各部件均失效的概率,并联系统中的关键部件是可靠性最高的部件。在复杂系统中,系统可靠性可由串联系统、并联系统可靠性的计算方法组合而得到,在灵敏度分析中发现,复杂系统可靠性对那些较为“薄弱”的部件的依赖性较大,具体来说,在串联系统中的薄弱部件是可靠性较低的部件,在并联系统中的薄弱部件是可靠性较高的部件。 关键字:串联系统,并联系统,复杂系统,可靠性,灵敏性分析

目录 摘要 .................................................................................................................................................. I I 1 序言 . (1) 可靠性数学 (1) 可靠性物理 (1) 可靠性工程 (2) 可靠性教育和管理 (2) 2 串联系统可靠性分析 (3) 串联系统 (3) 仿真 (3) 串联系统性能灵敏性分析 (6) 3 并联系统可靠性分析 (9) 并联系统 (9) 仿真 (9) 并联系统灵敏性分析 (12) 4 复杂系统可靠性分析 (15) 复杂系统 (15) 仿真 (16) 复杂系统灵敏性分析 (19) 总结与展望 (21)

可靠性计算公式大全

计算机系统的可靠性是制从它开始运行(t=0)到某时刻t这段时间内能正常运行的概率,用R(t)表示. 所谓失效率是指单位时间内失效的元件数与元件总数的比例,以λ表示,当λ为常数时,可靠性与 失效率的关系为: R(λ)=e-λu(λu为次方) 两次故障之间系统能够正常工作的时间的平均值称为平均为故障时间(MTBF) 如:同一型号的1000台计算机,在规定的条件下工作1000小时,其中有10台出现故障 ,计算机失效率:λ=10/(1000*1000)=1*10-5(5为次方) 千小时的可靠性:R(t)=e-λt=e(-10-5*10^3(3次方)=0.99 平均故障间隔时间MTBF=1/λ=1/10-5=10-5小时. 1)表决系统可靠性 表决系统可靠性:表决系统是组成系统的n个单元中,不失效的单元不少于k(k介于1和n之间),系统就不会失效的系统,又称为k/n系统。图12.8-1为表决系统的可靠性框图。通常n个单元的可靠度相同,均为R,则可靠性数学模形为: 这是一个更一般的可靠性模型,如果k=1,即为n个相同单元的并联系统,如果k=n,即为n个相同单元的串联系统。 2)冷储备系统可靠性 冷储备系统可靠性(相同部件情况):n个完全相同部件的冷贮备系统,(待机贮备系统),转换开关s为理想开关Rs=1,只要一个部件正常,则系统正常。所以系统的可靠度: 图12.8.2 待机贮备系统

3)串联系统可靠性 串联系统可靠性:串联系统是组成系统的所有单元中任一单元失效就会导致整流器个系统失效的系统。下图为串联系统的可靠性框图。假定各单元是统计独立的,则其可靠性数学模型为 式中,Ra——系统可靠度;Ri——第i单元可靠度 多数机械系统都是串联系统。串联系统的可靠度随着单元可靠度的减小及单元数的增多而迅速下降。图12.8.4表示各单元可靠度相同时Ri和nRs的关系。显然,Rs≤min(Ri),因此为提高串联系统的可靠性,单元数宜少,而且应重视串联系统的可靠性,单元数宜少,而且应重视改善最薄弱的单元的可靠性。 4)并联系统可靠性 并联系统可靠性:并联系统是组成系统的所有单元都失效时才失效的失效的系统。图12.8.5为并联轴系统的可靠性框图。假定各单元是统计独立的,则其可靠性数学模型为 式中 Ra——系统可靠度 Fi——第i单元不可靠度

可靠性指标

第五章 指标的统计与分析 可靠性主要指标依据《供电系统用户供电可靠性评价规程》选择了经常用于分析的六个关键指标分类,包括供电可靠率、用户平均停电时间、用户平均停电次数、平均停电用户数、停电持续时间。要掌握这些指标的定义和计算。 第一节 可靠性主要指标 1、用户平均停电时间 供电用户在统计期间内的平均停电小时数,是反映供电系统对用户停电时间的长短指标,记为AIHC-1, h /∑?=每次停电每次停电持续时间用户数用户平均停电时间(户) 总用户数 若不计外部影响时,则记为AIHC-2, 若不计系统电源不足限电时,则记作AIHC-3。 结合用户平均停电时间示意图讲解 2、供电可靠率 供电可靠率指在统计期间内,对用户有效供电时间总小时数与统计期间小时数的比值,是反映的供电系统对用户供电的可靠度的指标,记作RS 1, 1100%??=-? ??? 用户平均停电时间供电可靠率统计期间时间 若不计外部影响时,则记作RS 2; 若不计系统电源不足限电时,则记作RS 3。 结合可靠率指标计算中各类时间关系示意图讲解 3、用户平均停电次数

供电用户在统计期间内的平均停电次数,是反映供电系统对用户停电频率的指标, /∑=(每次停电用户数)用户平均停电次数(次户)总用户数 4、平均停电用户数 在统计期间内,平均每次停电的用户数,是反映平均停电范围大小的指标,其公式如下 /∑=(每次停电用户数)平均停电用户数(户次)停电次数 5、预安排停电平均持续时间 在统计期间内,预安排停电的每次平均停电小时数。本指标统计的是统计期间内平均每次预安排工作的持续停电时间,主要反映了总体预安排工作的合理性, h /∑=(预安排停电时间)预安排停电平均持续时间(次)预安排停电次数 6、故障停电平均持续时间 在统计期间内,故障停电的每次平均停电小时数。本指标统计的是统计期间内平均每次故障停电的持续停电时间,主要反映了平均每次对故障停电恢复能力的水平, h /∑=(故障停电时间)故障停电平均持续时间(次)故障停电次数

浅谈软件可靠性工程的应用(一)

浅谈软件可靠性工程的应用(一) 摘要:本文就武器装备软件开发的现状和中存在的问题,介绍了软件可靠性工程的发展及其研究的内容,对软件可靠性工程如何在软件开发中应用进行了重点说明,并提供了成功应用软件可靠性工程的典型案例,指出软件可靠性工程研究的必要性。 关键词:软件可靠性工程随着科学技术的不断进步,计算机技术被越来越多地应用到武器系统中。计算机软件的复杂程度随着功能的增强,因而系统的可靠性也越来越与软件直接相关。例如AFTI/F-16飞机首航因软件问题推迟一年,事先设计的先进程序无法使用;海湾战争中F/A–18飞机飞行控制系统计算机500次故障中,软件故障次数超过硬件。软件可靠性成为我们关注的一个问题,本文仅就软件可靠性工程在软件开发过程中的应用谈谈自己的认识。 1、软件可靠性工程的基本概念及发展 1.1什么是软件可靠性工程 软件可靠性工程简单地说就是对基于软件产品的可靠性进行预测、建模、估计、度量及管理,软件可靠性工程贯穿于软件开发的整个过程。 1.2软件可靠性工程的发展历程 软件可靠性问题获得重视是二十世纪60年代末期,那时软件危机被广泛讨论,软件不可靠是造成软件危机的重要原因之一。1972年正式提出Jelinski—Moranda模型,标志着软件可靠性系统研究的开始。在70年代.软件可靠性的理论研究获得很大发展,一方面提出了数十种软件可靠性模型,另一方面是软件容错的研究。在80年代,软件可靠性从研究阶段逐渐迈向工程化。进入90年代后,软件可靠性逐渐成为软件开发考虑的主要因素之一,软件可靠性工程在软件工程领域逐渐取得相对独立的地位,成为一个生机勃勃的分支。 1.3软件可靠性工程研究的基本问题 软件可靠性工程的主要目标是保证和提高软件可靠性。为达到这一目标,首先要弄清软件为什么会出现故障或失效。只有这样,才有可能在软件开发过程中减少导致软件故障或失效的隐患,且一旦出现软件故障或失效,有可能采取有效措施加以清除。但是软件是开发出来的,满足可靠性要求的软件也是开发出来的,因此,软件可靠性工程的核心问题是如何开发可靠的软件。而有了软件,又该如何检验其是否满足可靠性要求?这是软件可靠性工程的又一个问题。 2、软件可靠性工程在软件开发中的应用 2.1项目开发计划及需求分析阶段 在项目开发计划阶段需根据产品具体要求作出软件项目开发计划,明确项目的目的、条件、运行环境、软件产品要求、人员分工和职责及进度,并估计产品的可靠性。需求分析阶段要根据项目开发计划阶段确定软件开发的主要任务、次要任务和其它任务,并设计软件程序的基本流程、软件结构、模块的定义和输入输出数据、接口和数据结构等同时应对项目开发计划阶段作出的可靠性预计进一步细化形成可靠性需求,建立具体的可靠性指标。这个阶段的可靠性工作一般应如下安排: ⑴确定功能概图 所谓功能概图就是产品的各种功能及其在不同环境条件下使用的概率。为确立功能概图必须定义产品的功能,功能定义不但包括要完成的任务,还包括影响处理的环境因素。 ⑵对失效进行定义和分类 这里应从用户的角度来定义产品失效,将软件和硬件失效及操作程序上的失效区分开,并将其按严重程度进行分类。 ⑶确定用户的可靠性要求 在这个阶段应由系统设计师、软件设计师、可靠性师、测试人员及用户方代表可靠性评估小组共同根据用户提出的系统可靠性来确定软件的可靠性。

人机系统可靠性计算示范文本

文件编号:RHD-QB-K8474 (安全管理范本系列) 编辑:XXXXXX 查核:XXXXXX 时间:XXXXXX 人机系统可靠性计算示 范文本

人机系统可靠性计算示范文本 操作指导:该安全管理文件为日常单位或公司为保证的工作、生产能够安全稳定地有效运转而制定的,并由相关人员在办理业务或操作时进行更好的判断与管理。,其中条款可根据自己现实基础上调整,请仔细浏览后进行编辑与保存。 (一)、系统中人的可靠度计算 由于人机系统中人的可靠性的因素众多且随机变化,因此人的可靠性是不稳定的。人的可靠度计算(定量计算)、也是很困难的。 1.人的基本可靠度 系统不因人体差错发生功能降低和故障时人的成功概率,称为人的基本可靠度,用r表示。人在进行作业操作时的基本可靠度可用下式表示: r=a1a2a3 (4—13)、 式中a1——输入可靠度,考虑感知信号及其意义,时有失误;

a2——判断可靠度,考虑进行判断时失误; a3——输出可靠度,考虑输出信息时运动器官执行失误,如按错开关。 上式是外部环境在理想状态下的可靠度值。 a1,a2,a3,各值如表4—5所示。 人的作业方式可分为两种情况,一种是在工作时间内连续性作业,另一种是间歇性作业。下面分别说明这两种作业人的可靠度的确定方法。 (1)、连续作业。在作业时间内连续进行监视和操纵的作业称为连续作业,例如控制人员连续观察仪表并连续调节流量;汽车司机连续观察线路并连续操纵方向盘等。连续操作的人的基本可靠度可以用时间函数表示如下: 式中r(t)、——连续性操作人的基本可靠度; t——连续工作时间;

l(t)、——t时间内人的差错率。 (2)、间歇性作业。在作业时间内不连续地观察和作业,称为间歇性作业,例如,汽车司机观察汽车上的仪表,换挡、制动等。对间歇性作业一般采用失败动作的次数来描述可靠度,其计算公式为:r=l一p(n/N)、(4—15)、式中N 失败动作次数; n——失败动作次数; p——概率符号。 2.人的作业可靠度 考虑了外部环境因素的人的可靠度RH为: RH=1-bl·b2·b3·b4·bs(1—r)、(4一16)、 式中b1——作业时间系数; b2——作业操作频率系数; b3——作业危险度系数;

天然气管网系统可靠性评价指标研究

天然气管网系统可靠性评价指标研究 发表时间:2019-09-22T01:20:04.140Z 来源:《基层建设》2019年第19期作者:刘亮[导读] 摘要:科技的进步,促进人们对能源需求的增多。贵州乌江新能源开发有限责任公司贵州省贵阳市 550002摘要:科技的进步,促进人们对能源需求的增多。天然气作为清洁的化石能源已经广泛应用于现代化建设当中,其需求量迅猛增长。天然气管网作为连接上游气源和下游市场的生命线,在国民经济和能源安全领域具有重要作用和意义。因此,确保供气管网系统安全可靠至关重要。本文就天然气管网系统可靠性评价指标展开探讨。 关键词:天然气管网系统;可靠性指标;供气可靠性 1可靠性指标天然气管网系统可靠性指标是开展天然气管网系统可靠性评价的前提,也是后期实行可靠性管理的基础。可靠性指标体系的应用对象分为系统和单元两方面,其中系统包括管网、管道、站场3个层级,单元则包括管段、压缩机组、阀门、工艺管道、储气库、LNG接收站、资源及市场等各级系统的主要组成要素。结合天然气管道生产实际,管网系统的可靠性指标应至少包含以下3类:狭义的可靠性类,反映系统在规定条件下和规定时间内完成规定功能的能力;健壮性类,反映系统抗干扰能力;维修性类,反映系统发生故障后通过修复,从而恢复正常工作能力。可靠性指标体系的不同应用对象由于各自不同特点,可能适用上述3类指标中的2种或3种,如管网系统只涉及可靠性及健壮性两类指标,管道、站场系统以及一般设备单元泽可适用全部类别指标。(图1) 图1 天然气管网系统可靠性指标分类示意图对每个对象的广义各类可靠性指标而言,考虑到其多项指标间的逻辑计算关系及管理的需要,需将每类指标划分为基本指标、中间指标、综合指标3个层次(图2)。其中,基本指标为可在现场直接测量或能够利用基本参数简单计算而获得的指标;中间指标是能够反映对象某项特定性能,并能利用若干基本指标计算而获得的指标;综合指标则是狭义的可靠性类/维修性类/健壮性类的综合性能指标。一般而言,基本指标和中间指标数量不限,而综合指标数量较少,一般为1。此外,根据天然气管道管理需要,某些对象还可设置附属指标,其虽然不参与基本指标、中间指标及综合指标的计算,但可以从不同角度反映对象可靠性(狭义)、维修性及健壮性方面的能力,属于常用管理指标。在确立天然气管网系统可靠性具体指标时,要遵循以下3个原则:①能够准确反映出对象的性能,指标具体含义精准、无异议;②尽量不使用需要现场打分或专家咨询等主观手段获取分值的指标;③确保指标计算所需基础数据能够通过统计或现场检测的方法获取,否则该指标不能有效使用。 图2 天然气管网系统可靠性(广义)指标分层示意图 2管网系统水力可靠性评价指标天然气管网水力可靠性是指系统在规定时间和条件下,完成规定的供气任务的能力,用于对系统的供气能力进行评价。采用输出可用度AT、载流可用度Ao以及时刻t水平c的可用度Ac(t)等指标对油气生产运输系统的水力可靠性进行评价。 3供气可靠度供气可靠度指管网系统在规定条件和时间内,完成规定供气任务的概率。系统平均供气不足时间SAIDI指在给定时间和规定条件下,管网系统因各类原因导致的不能满足供气任务的时间均值。系统平均供气不足频率SAIFI指在给定时间和规定条件下,管网系统因各类原因造成下游用户缺气的平均次数。具体表达式为: 4天然气管道行业的可靠性评价方法天然气管道的可靠性是指在规定时间内,系统按照规定运行条件完成规定输送任务的能力。考虑到天然气管道的任务输量及最大承压等因素,相对原油管道,天然气管道系统的冗余度较小,且用户需求多样,管道的局部失效就可能引发大面积连锁事故的发生。限于此,天然气管道系统对管体结构安全性和供气保障能力都有较高的要求。中国工程院院士黄维和率先提出了天然气管道系统可靠性的概念,并对系统可靠性的评价方法和管理框架进行了初步设计。对于单条天然气管道系统的可靠性分析,重点在于管体结构可靠,在统计学方法的基础上明确各管道之间的逻辑关系,为天然气管网系统的可靠性分析奠定基础。而对于天然气管网系统的可靠性管理,需综合系统工程理论和现代物流理论的研究方法,统筹规划各子系统的可靠性历史结果,运用统计和概率的方法反映管网系统的可靠程度。天然气管道系统可靠的基本要求为保障运行安全,因而对于可靠性的研究也应以满足需求侧的供应要求作为评价标准,在保障管体结构安全的前提下实现自身功能。目前,可将天然气管道可靠性评价方法分为结构可靠性和供气可靠性两类,以实现“全方位、全生命周期”的科学管理,保障管道系统安全高效地运行。结语

可靠性理论模拟题

《可靠性理论》模拟题(补) 一.名词解释 1.可靠性:产品在规定的条件下和规定的时间内完成规定功能的能力。 2. 可靠性设计:系统可靠性设计是指在遵循系统工程规范的基础上,在系统设计过程中,采用一些专门技术,将可靠性“设计”到系统中去,以满足系统可靠性的要求。 3. 最小割集和最小径集:最小割集就是引起顶上事件发生所必需的最低限度的割集。最小径集就是顶上事件不发生所需的最低限度的径集。 4. 网络:连接不同点之间的路线系统或通道系统。 5.广义可靠性:广义可靠性是指产品在其整个寿命期限内完成规定功能的能力,它包括可靠性(即狭义可靠性)与维修性。 6.可靠性指标分配:指根据系统设计任务书中规定的可靠性指标(经过论证和确定的可靠性指标),按照一定的分配原则和分配方法,合理的分配给组成该系统的各分系统、设备、单元和元器件,并将它们写入相应的设计任务书或经济技术合同中。 7. 降额设计:使元器件或设备工作时所承受的工作应力(电应力或温度应力),适当低于元器件或设备规定的额定值,从而达到降低基本故障率、提高使用可靠性的目的。 8. 人机系统:指人与其所控制的机器相互配合,相互制约,并以人为主导而完成规定功能的工作系统。 二.填空题 1.可靠性的定义包含有五个方面的内容,它们是:对象、使用条件、使用期限、规定的功能、概率等。 2.由三种失效率曲线所反应,表现产品在其全部工作过程中的三个不同时期分别是:早期失效期、偶然失效期、耗损失效期。 3.对于可修复的产品,其平均无故障工作时间或平均故障间隔称为平均寿命。 4.失效率函数为常数λ时,可靠度函数表达式可写为: t e t Rλ- = )(。 5.系统进行可靠度分配时,若已知各元件的预计失效率,而进行分配的方法称为阿林斯分配法。 6.简单求解网络可靠度的常用方法有状态枚举法、全概率分解法、最小割集法、最小径集法、不交布尔代数运算规则。 7.割集和径集中反应导致顶上事件发生所必需的最低限度的是最小割集;反应顶上事件不发生所需的最低限度的是最小径集。 8.常用的可靠性特征量有:可靠度、失效率、平均寿命、可靠寿命等。 9.产品失效率曲线一般可分为:递减型失效率曲线、恒定型失效率曲线、递增型失效率曲线。

人机系统可靠性计算

编订:__________________ 审核:__________________ 单位:__________________ 人机系统可靠性计算 Deploy The Objectives, Requirements And Methods To Make The Personnel In The Organization Operate According To The Established Standards And Reach The Expected Level. Word格式 / 完整 / 可编辑

文件编号:KG-AO-3138-34 人机系统可靠性计算 使用备注:本文档可用在日常工作场景,通过对目的、要求、方式、方法、进度等进行 具体的部署,从而使得组织内人员按照既定标准、规范的要求进行操作,使日常工作或 活动达到预期的水平。下载后就可自由编辑。 (一)、系统中人的可靠度计算 由于人机系统中人的可靠性的因素众多且随机变化,因此人的可靠性是不稳定的。人的可靠度计算(定量计算)、也是很困难的。 1.人的基本可靠度 系统不因人体差错发生功能降低和故障时人的成功概率,称为人的基本可靠度,用r表示。人在进行作业操作时的基本可靠度可用下式表示: r=a1a2a3 (4—13)、 式中a1——输入可靠度,考虑感知信号及其意义,时有失误; a2——判断可靠度,考虑进行判断时失误; a3——输出可靠度,考虑输出信息时运动器官执行失误,如按错开关。

上式是外部环境在理想状态下的可靠度值。a1,a2,a3,各值如表4—5所示。 人的作业方式可分为两种情况,一种是在工作时间内连续性作业,另一种是间歇性作业。下面分别说明这两种作业人的可靠度的确定方法。 (1)、连续作业。在作业时间内连续进行监视和操纵的作业称为连续作业,例如控制人员连续观察仪表并连续调节流量;汽车司机连续观察线路并连续操纵方向盘等。连续操作的人的基本可靠度可以用时间函数表示如下: 式中 r(t)、——连续性操作人的基本可靠度; t——连续工作时间; l(t)、——t时间内人的差错率。 (2)、间歇性作业。在作业时间内不连续地观察和作业,称为间歇性作业,例如,汽车司机观察汽车上的仪表,换挡、制动等。对间歇性作业一般采用失败动作的次数来描述可靠度,其计算公式为: r=l一p(n/N)、 (4—15)、式中 N 失败动作次

RAID系统的可靠性分析

RAID系统的可靠性分析 一个存储系统要达到一定的可靠性,则各单独的部分都需要达到一定的可靠度要求。在RAID系统中,系统的可靠性可分配到每个硬盘中,但是整个系统的可靠性并不是它们的总和。不同的阵列级别都有不同的分配模式,故有不同的性能和冗余。 1 1、不同的RAID级别可靠性模型 本文提供了在RAID中硬盘间关系的数学模型。使用这些模型,对不同的RAID类型对整个磁盘阵列的可靠性的影响进行了评估。虽然一个磁盘阵列中可以包含不同级别的RAID和不同容量的磁盘,但本文是以8个硬盘在同一阵列中并采用同一RAID级别为例。并假定使用的硬盘为100%使用率,并在3年以内的时间内可靠性为90%(本文以后的计算数据均为这3年内的可靠性)。 2 A、RAID0:数据条带 RAID0即条带:将数据分为同等大小的数据块并分别放到不同的磁盘上。例如:一个150K 的文件可被条带化为10个15K的数据块。一组条带化的磁盘对操作系统来说就是一个独立的逻辑盘。 条带提供了一个低成本提高磁盘I/O性能的方法。但是RAID0不提供任何数据冗余,如果任何一个磁盘失效,所有的数据都会丢失。 假设一个有6个硬盘的RAID0阵列,其可靠性的逻辑图如下图所示: í?1 RAID0的可靠性框图 所有的硬盘为串行,则其可靠性的数学模型为: n R RAIDSET=R HDDi i=1 如果每个硬盘在三年内的可靠性为90%,则8个硬盘的RAID0系统在三年类的可靠性为: 8 R RAIDSET=0.9=0.4305 i=1 即数据不会丢失的概率为43.05%。而且随着硬盘数量的增加,系统的可靠性急剧下降。 3 B、RAID1和RAID10:磁盘镜像和复制 RAID1为磁盘镜像,即写到某个磁盘的数据都会被复制到另一个磁盘中。RAID1要求至少有两个硬盘组成一组,成为一个阵列组。例如:在有三个硬盘的阵列中,可以用第一和第二个硬盘数据镜像,而第三个硬盘做为热冗余(Hotspare)硬盘;有四个硬盘就可以分别创建两个RAID1... 镜像可以提供数据冗余,并且可以改进读性能。在RAID1配置中,一个硬盘失效不会造成数据丢失。然而,如果在一个RAID1组中的两个硬盘都失效,则数据会丢失。 其可靠性的逻辑图如下图所示: í?1 RAID10的可靠性框图 则其可靠性的数学模型为: RAID组数目 R array=[(1-(1-R HDD1)(1-R HDD2)] i=1 如有8个硬盘则: 4 R array=[(1-(1-0.9)(1-0.9)]=0.9606

人机系统可靠性计算

人机系统可靠性计算 (一)系统中人的可靠度计算 由于人机系统中人的可靠性的因素众多且随机变化,因此人的可靠性是不稳定的。人的可靠度计算(定量计算)也是很困难的。 1.人的基本可靠度 系统不因人体差错发生功能降低和故障时人的成功概率,称为人的基本可靠度,用r表示。人在进行作业操作时的基本可靠度可用下式表示: r=a1a2a3 (1—26) 式中a1——输入可靠度,考虑感知信号及其意义,时有失误; a2——判断可靠度,考虑进行判断时失误; a3——输出可靠度,考虑输出信息时运动器官执行失误,如按错开关。 上式是外部环境在理想状态下的可靠度值。a1,a2,a3,各值如表1—11所示。 表1--11可靠度计算 作业类别内容a1~a3 a2 简单一般复杂变量在6个以下,已考虑人机工程学原则 变量在10个以下 变量在10个以上,考虑人机工程学不充分 0.9995~0.9999 0.9990~0.9995 0.990~0.999 0.999 0.995 0.990 人的作业方式可分为两种情况,一种是在工作时间内连续性作业,另一种是间歇性作业。下面分别说明这两种作业人的可靠度的确定方法。 (1)连续作业。在作业时间内连续进行监视和操纵的作业称为连续作业,例如控制人员连续观察仪表并连续调节流量;汽车司机连续观察线路并连续操纵方向盘等。 连续操作的人的基本可靠度可以用时间函数表示如下: r(t)=exp[∫0+∞l(t)dt] (1—27) 式中r(t)——连续性操作人的基本可靠度; t——连续工作时间; l(t)——t时间内人的差错率。 (2)间歇性作业。在作业时间内不连续地观察和作业,称为间歇性作业,例如,汽车司机观察汽车上的仪表,换挡、制动等。对间歇性作业一般采用失败动作的次数来描述可靠度,其计算公式为: r=l一p(n/N) (1—28) 式中N——总动作次数;

北航考研复试班-北京航空航天大学可靠性与系统工程学院安全科学与工程考研复试经验分享

北航考研复试班-北京航空航天大学可靠性与系统工程学院安全科学 与工程考研复试经验分享 北京航空航天大学(Beihang University)简称北航,是中华人民共和国工业和信息化部直属、中央直管副部级建制的全国重点大学,世界一流大学建设高校,211工程、985工程重点建设高校,入选珠峰计划、2011计划、111计划、卓越工程师教育培养计划、中国政府奖学金来华留学生接收院校、国家建设高水平大学公派研究生项目、国家级新工科研究与实践项目、国家级大学生创新创业训练计划、国家大学生创新性实验计划、全国深化创新创业教育改革示范高校,为国际宇航联合会、中欧精英大学联盟、中国西班牙大学联盟、中俄工科大学联盟成员,是全国第一批16所重点高校之一、80年代恢复学位制度后全国第一批设立研究生院的22所高校之一,也是新中国第一所航空航天高等学府。 北京航空航天大学创建于1952年,时名北京航空学院,由当时的清华大学、北洋大学、厦门大学、四川大学等八所院校的航空系合并组建,1988年4月改名为北京航空航天大学,1989年成为国家八五期间全国14所重点建设的高校之一,首批进入“211工程”,2001年进入“985工程”,2017年入选国家“双一流”建设名单。 启道考研复试班根据历年辅导经验,编辑整理以下关于考研复试相关内容,希望能对广大复试学子有所帮助,提前预祝大家复试金榜题名! 专业介绍 安全工程专业注重培养能从事安全技术及工程、安全科学与研究、安全监察与管理、安全健康环境检测与监测、安全设计与生产、安全教育与培训等方面复合型的高级工程技术人才,是一个涉及面极广的综合交叉学科。2004年,我国开办安全工程本科专业并在教育部备案的高校有68所,其中大多数高校的安全工程专业是新开办的,近4年申办安全工程专业的高校有40所,比2000年以前的总和都多,其增长速度极快 招生人数与考试科目 ①101 思想政治理论②201 英语一③301 数学一④841 概率统计与可靠性工程基础或931 自动控制原理综合或 951 力学基础 复试时间地点 1、资格审查时间:3月19日上午8:30-9:30,地点:主M401教室。专业英语笔试时间:3月19日上午10:00-11:00,地点:主M401教室。

相关主题
文本预览
相关文档 最新文档