系统可靠性模型综述_温小云
- 格式:pdf
- 大小:398.60 KB
- 文档页数:6
在现代科技领域中,系统可靠性设计是一个至关重要的课题。
无论是航空航天、汽车制造、电子产品还是工业自动化,系统的可靠性都是其核心竞争力之一。
而可靠性建模作为评估和改进系统可靠性的重要手段,对于各个领域的工程师们来说至关重要。
本文将通过几个实际案例分享系统可靠性设计中的可靠性建模应用,希望对读者有所启发和帮助。
案例一:航空发动机可靠性建模航空发动机作为飞机的动力源,其稳定可靠的性能直接关系到航空安全。
在航空发动机的可靠性建模中,经常会采用基于失效模式的可靠性分析方法。
首先,工程师们会对发动机的结构和工作原理进行深入理解,分析各种可能的失效模式及其可能导致的后果。
然后,通过统计学方法和可靠性理论,建立发动机失效模式的概率模型,进而评估发动机在特定工况下的可靠性水平,并提出相应的改进方案。
案例二:汽车ABS系统可靠性建模汽车ABS(防抱死制动系统)作为一项关乎车辆行驶安全的重要技术,其可靠性问题一直备受关注。
在对ABS系统的可靠性建模中,工程师们通常会采用故障树分析(FTA)的方法。
他们会对ABS系统的各个组成部分进行细致的分解,找出各个部分之间的逻辑关系,分析可能的故障模式及其概率。
通过故障树分析,工程师们能够清晰地了解ABS系统的可靠性瓶颈,有针对性地进行改进和优化。
案例三:电子产品可靠性建模随着电子产品在日常生活中的广泛应用,其可靠性问题也备受关注。
在电子产品的可靠性建模中,工程师们通常会采用加速寿命试验和可靠性增长模型等方法。
通过对电子产品的寿命特性进行全面的实验分析,建立起其失效概率随时间的变化规律。
同时,还可以通过对电子产品的工作环境和使用条件进行分析,建立相应的可靠性增长模型,预测产品在实际使用中的可靠性表现。
综上所述,系统可靠性设计中的可靠性建模是一个复杂而又关键的问题。
不同领域的工程师们在建模过程中会采用不同的方法和工具,但其核心目标都是希望通过建模分析,找出系统可能存在的风险和瓶颈,并提出相应的改进方案。
系统可靠性设计中的可靠性建模方法可靠性是系统工程中一个非常重要的概念,它指的是系统在规定条件下,在规定时间内,能够正常工作的能力。
在实际的工程设计中,如何对系统的可靠性进行建模是一个非常复杂的问题。
本文将探讨系统可靠性设计中的可靠性建模方法。
一、可靠性的定义首先,我们需要明确可靠性的定义。
在系统工程中,可靠性是指系统在规定条件下,在规定时间内能够正常工作的概率。
在实际工程中,可靠性通常用指数分布、威布尔分布、韦伯分布等概率分布来描述。
这些分布都是可靠性建模中常用的数学模型。
二、故障树分析在可靠性建模中,故障树分析是一个常用的方法。
故障树分析是一种通过逻辑关系来描述系统故障发生的方法。
它将系统的各种故障模式以及它们之间的逻辑关系用树形图的形式表示出来,通过对故障树的分析,可以找出系统的主要故障模式,从而针对性地进行可靠性改进设计。
三、可靠性增长模型可靠性增长模型是一种通过故障数据来估计系统可靠性的方法。
它通过对系统的故障数据进行统计分析,来估计系统的可靠性指标。
常用的可靠性增长模型包括指数增长模型、对数线性模型等。
通过这些模型,可以对系统的可靠性进行合理的预测和估计。
四、失效模式与影响分析失效模式与影响分析(FMEA)是一种通过对系统的失效模式以及失效影响进行分析,来评估系统可靠性的方法。
FMEA可以帮助工程师找出系统的潜在故障模式,从而对系统进行合理的可靠性设计。
五、可靠性增强设计在实际工程设计中,可靠性增强设计是一个非常重要的环节。
可靠性增强设计通过采用冗余设计、容错设计、多样设计等方法来增强系统的可靠性。
在可靠性建模中,需要考虑这些设计措施对系统可靠性的影响。
六、可靠性验证与测试最后,对于可靠性建模的方法,还需要进行可靠性验证与测试。
通过对系统的可靠性进行验证与测试,可以验证可靠性建模的有效性,从而保证系统的可靠性满足设计要求。
总之,在系统可靠性设计中,可靠性建模是一个非常重要的环节。
通过合理的可靠性建模方法,可以有效地评估系统的可靠性,为系统的可靠性设计提供科学依据。
系统可靠性设计中的可靠性增长模型实际应用引言在现代科技发展的浪潮中,各种系统的可靠性设计显得尤为重要。
无论是电子产品、机械设备还是软件系统,它们的可靠性直接影响到用户的体验和生产效率。
因此,如何设计一种可靠性增长模型,以保证系统在运行过程中的可靠性,成为了工程技术领域中一个备受关注的问题。
本文将着重探讨系统可靠性设计中的可靠性增长模型实际应用。
可靠性增长模型的基本原理可靠性增长模型是一种统计学方法,用来预测系统在运行过程中的可靠性增长趋势。
它基于系统故障数据,通过不断积累和分析数据,来估计系统在未来的可靠性表现。
在实际应用中,可靠性增长模型通常基于一定的数学模型,比如指数分布、Weibull分布等,来描述系统的可靠性增长规律。
通过对这些模型进行参数估计和验证,就可以得到一种相对准确的可靠性增长模型。
可靠性增长模型的实际应用在实际工程项目中,可靠性增长模型通常被用来指导系统的维护和改进。
以某软件系统为例,通过收集和分析用户反馈数据,可以得到系统的故障信息。
然后,可以利用可靠性增长模型来预测未来一段时间内系统的可靠性表现。
基于这些预测结果,工程师可以有针对性地进行系统的维护和改进,以提高系统的可靠性。
比如,可以针对系统中频繁出现的故障点进行技术改进,或者增加系统的冗余设计,来提高系统的可靠性。
除了软件系统,可靠性增长模型也被广泛应用于电子产品和机械设备的设计中。
通过对系统的故障数据进行统计分析,可以建立相应的可靠性增长模型,从而指导产品的设计和生产。
比如,某电子产品经常出现电池故障问题,工程师可以通过可靠性增长模型来预测电池的寿命,并据此进行电池的选型和使用说明书的编写。
这样一来,就可以有效地提高产品的可靠性,从而提升用户的满意度。
在工程设计中,可靠性增长模型也被用来进行风险评估和决策支持。
通过对系统的可靠性增长趋势进行分析,可以为工程师提供重要的决策依据。
比如,在某海洋平台设计中,通过对平台结构的可靠性增长模型进行分析,工程师可以评估平台在不同环境条件下的可靠性表现,并据此进行结构设计和材料选择。
系统可靠性设计中的可靠性建模案例分享在工程设计领域中,系统可靠性是一项至关重要的考量因素。
无论是航空航天、汽车制造、电子产品还是工业设备,都需要保证系统的可靠性,以确保其在运行中不会发生故障或失效。
为了提高系统的可靠性,工程师们通常会采用可靠性建模的方法来进行分析和设计。
本文将分享一些系统可靠性设计中的可靠性建模案例,以便读者更好地了解这一重要领域。
1. 可靠性建模的基本概念在介绍具体的案例之前,我们先来了解一下可靠性建模的基本概念。
可靠性建模是指通过对系统的各种组成部分、环境条件、使用方式等进行分析,来评估系统在一定时间内不发生故障的概率。
这种分析可以采用数学统计的方法,例如概率论、可靠性理论和生存分析等,来对系统的可靠性进行量化和预测。
2. 电子产品的可靠性建模在电子产品设计中,可靠性建模通常是一个很重要的环节。
例如,一家电子产品制造公司在设计新款智能手机时,需要对手机的各个组成部分进行可靠性建模分析,以确保手机在正常使用情况下不会发生故障。
在这个案例中,工程师们可以利用故障树分析(FTA)来对各个组成部分的故障概率进行评估,从而得出整个手机系统的可靠性指标。
同时,他们还可以采用可靠性增长模型(RGM)来预测手机在使用过程中的可靠性变化趋势,以便及时进行维护和改进。
3. 航空航天领域的可靠性建模在航空航天领域,系统的可靠性更是至关重要。
一家航空航天制造公司在设计新型飞机时,需要对飞机的结构、发动机、航电系统等进行可靠性建模分析,以确保飞机在飞行过程中不会发生故障或失效。
在这个案例中,工程师们可以采用可靠性负载分析(RLA)方法,对飞机各个关键部件的寿命和故障概率进行评估,从而得出整个飞机系统的可靠性指标。
同时,他们还可以采用故障模式影响与关联分析(FMECA)来对系统的故障模式和影响进行分析,以便提前预防和应对可能的故障情况。
4. 工业设备的可靠性建模在工业生产领域,各种工业设备的可靠性也是非常重要的。
系统可靠性设计中的可靠性建模实战经验分享在现代工程技术中,系统的可靠性设计是一个至关重要的环节。
无论是航空航天、汽车工业还是电子产品领域,都需要确保产品的可靠性和稳定性。
而可靠性建模作为系统可靠性设计的重要工具,对于预测和评估系统的可靠性起着至关重要的作用。
在实际工程中,如何进行可靠性建模,如何选择合适的建模方法和工具,以及如何解决建模过程中的难点和问题,都是工程师们需要面对和解决的挑战。
本文将结合个人的实战经验,分享系统可靠性设计中的可靠性建模实践经验。
可靠性建模是系统可靠性设计的重要环节。
在进行可靠性建模时,首先需要明确系统的结构和功能,以及系统中各组件之间的关联和作用。
其次,需要收集系统历史数据和相关信息,包括故障率、维修时间、维修频次等数据。
然后,根据系统的特点和需求,选择合适的可靠性建模方法和工具进行建模分析。
最后,通过建模分析结果,评估系统的可靠性水平,发现系统潜在的故障隐患,为系统的优化和改进提供依据。
在实际工程项目中,我曾经参与了一款电子产品的可靠性设计工作。
在进行可靠性建模时,我们首先对该产品的功能和结构进行了详细的分析和了解,明确了该产品的关键部件和功能模块。
然后,我们进行了大量的数据收集和整理工作,包括历史故障数据、维修记录以及相关技术资料。
接着,我们选择了适合该产品特点的可靠性建模方法和工具,进行了建模分析和评估。
通过可靠性建模分析,我们成功地发现了该产品在高温环境下的故障率较高的问题,并采取了相应的改进措施,提高了产品的可靠性和稳定性。
在可靠性建模实践中,我还遇到了一些困难和挑战。
比如,在进行建模分析时,由于系统结构复杂、数据不完整等原因,导致了模型的不确定性和不精确性。
针对这些问题,我们采取了一些有效的方法和措施,比如引入模糊逻辑和概率统计的方法,对不确定性因素进行量化和分析。
同时,我们也加强了与产品设计和生产部门的沟通和协作,充分利用他们的专业知识和经验,共同解决了建模过程中的难题。
山东科学SHANDONGSCIENCE第37卷第2期2024年4月出版Vol.37No.2Apr.2024收稿日期:2024 ̄02 ̄01基金项目:国家自然科学基金(72225012ꎬ72288101ꎬ71822101)ꎻ民航安全能力建设基金项目(ASSA2023/19)作者简介:刘一萌(1994 )ꎬ女ꎬ博士研究生ꎬ研究方向为复杂网络可靠性ꎮE ̄mail:liuyimeng@buaa.edu.cn∗通信作者ꎬ张小可ꎬ男ꎬ副研究员ꎬ研究方向为复杂系统ꎮTel:189****9787ꎬE ̄mail:zhangxiaoke2013@hotmail.com复杂系统可靠性刘一萌1ꎬ白铭阳1ꎬ张小可2∗ꎬ李大庆1(1.北京航空航天大学可靠性与系统工程学院ꎬ北京100191ꎻ2.复杂系统仿真国家重点实验室ꎬ北京100101)摘要:随着科学技术的发展ꎬ社会技术系统的体系化㊁网络化㊁智能化程度逐渐加深ꎬ形成系统的复杂性ꎮ这些复杂系统的 故障 ꎬ诸如交通拥堵㊁谣言传播㊁金融崩溃ꎬ可以看作是一种 1+1<2 的系统能力负向涌现ꎬ难以直接通过系统单元的还原解析来理解ꎬ这对原有可靠性理论提出了挑战ꎮ现有复杂系统可靠性的研究主要从故障规律展开ꎬ从两个角度出发进行ꎬ一是考虑故障传播的系统脆弱性研究ꎻ二是考虑故障恢复的系统适应性研究ꎮ系统脆弱性研究的重点在于挖掘系统崩溃的内在机理ꎬ即故障的传播机理ꎮ系统适应性研究的重点关注于系统适应恢复能力ꎬ包括系统故障恢复机理ꎮ在此基础上ꎬ本文介绍了相关的可靠性方法研究ꎮ关键词:复杂系统ꎻ可靠性ꎻ脆弱性ꎻ适应性中图分类号:N945㊀㊀㊀文献标志码:A㊀㊀㊀文章编号:1002 ̄4026(2024)02 ̄0074 ̄11开放科学(资源服务)标志码(OSID):ComplexsystemreliabilityLIUYimeng1ꎬBAIMingyang1ꎬZHANGXiaoke2∗ꎬLIDaqing1(1.SchoolofReliabilityandSystmesEngineeringꎬBeihangUniversityꎬBeijing100191ꎬChinaꎻ2.NationalKeyLaboratoryforComplexSystemsSimulationꎬBeijing100101ꎬChina)AbstractʒWiththedevelopmentofscienceandtechnologyꎬthesystematizationꎬnetworkingandintelligentizationofthesocialtechnologysystemgraduallydeepenꎬformingthecomplexityofthesystem.Thefailuresofthesecomplexsystemsꎬsuchastrafficjamsꎬrumorspreadingꎬandfinancialcollapseꎬcanberegardedasakindof"1+1<2"negativeemergenceofsystemcapabilityꎬwhichisdifficulttounderstanddirectlythroughthereductionanalysisofsystemcomponents.Itchallengestheclassicalreliabilitytheory.Researchonthecomplexsystemsreliabilitymainlyfocusesonfailureslawsꎬwhichincludestwoperspectives.Oneisthestudyofsystemvulnerabilityconsideringfailurepropagation.Theotheristhestudyofsystemadaptabilityconsideringfailurerecovery.Systemvulnerabilitystudiesfocusonexploringtheinternalmechanismofsystemcollapseꎬnamelythefailurepropagationmechanism.Systemadaptabilitystudiesfocusonthecapacitytoadaptandrecoverꎬincludingthesystemfailurerecoverymechanism.Basedonthisꎬthearticleintroducesrelevantresearchonreliabilitymethod.Keywordsʒcomplexsystemꎻreliabilityꎻvulnerabilityꎻadaptability㊀㊀复杂系统具有涌现性ꎬ难以简单地由单元的规律推理得到整体的规律[1 ̄2]ꎮ系统工程为构建复杂社会技术系统提供指导ꎬ并被广泛应用于各个工业部门中ꎮ在钱学森等老一辈领军学者带领下ꎬ我国的系统科学和工程取得较大发展ꎬ从工程系统走向社会系统ꎬ提出开放的复杂巨系统方法论[3]及其实践形式[4]ꎮ近年来ꎬ系统学内涵得到不断深化并形成丰富理论成果[5 ̄12]ꎬ在社会管理[13]㊁应急救援[14]㊁农业[15 ̄16]㊁交通运输[17 ̄18]等各领域均做出积极贡献ꎮ在系统工程方法论与技术上ꎬ我国学者提出的WSR(物理-事理-人理)方法论[19]㊁灰色系统方法[20]㊁TEI@I方法论[21]等都在国内外产生了一定影响ꎮ基于火箭及计算机的工程实践ꎬLusser㊁冯 诺伊曼等人指出随着系统越来越复杂ꎬ可靠性成为了决定社会技术系统能否成功运行的关键问题[22 ̄23]ꎬ可靠性学科随之迅速发展ꎮ20世纪90年代ꎬ可靠性系统工程理论被提出[24]ꎬ进而学者们又进一步细化了可靠性系统工程理论并提出其技术框架[25]ꎮ近几年ꎬ系统复杂性随着信息技术和智能技术的进步而不断提高ꎮ一方面ꎬ这种复杂性给系统带来了脆弱性挑战ꎬ系统出现了不同于简单系统的故障模式ꎬ形成了 1+1<2 的负向涌现ꎮ例如复杂系统内单元之间存在故障耦合ꎬ这使得少量单元的故障可能引发级联失效ꎬ导致整个系统崩溃ꎮ另一方面ꎬ复杂性也可能带来系统的适应性ꎬ可使系统具备从扰动中恢复和适应的能力ꎮ例如生态系统中物种多样性[26]㊁内稳态机制[27]㊁共生网络的嵌套性[28]等在增加了系统复杂度的同时ꎬ也使得种群和个体能在各种各样的风险挑战和环境变化下幸存ꎮ传统可靠性方法是在元件数相对较少㊁元件间关系较为简单的系统上发展起来的ꎬ难以适用于分析复杂系统的可靠性ꎮ为此想要解决这些复杂系统的可靠性问题ꎬ必须借助系统科学研究和发展新理论㊁新方法应对新挑战ꎮ可靠性系统工程的实质是与故障做斗争ꎬ通过研究有关故障的规律ꎬ从而基于故障规律对故障进行事前预防和事后修理[24]ꎮ对复杂系统可靠性的研究也需要围绕其特有故障机理展开ꎮ系统可能因故障扩散而全面崩溃ꎬ也可能因故障恢复而稳定维持自身性能ꎮ因此可将复杂系统可靠性研究分为考虑故障传播的系统脆弱性研究和考虑故障恢复的系统适应性研究两类ꎮ1㊀考虑故障传播的系统脆弱性研究系统脆弱性是指系统被干扰后容易发生全局性崩溃的性质ꎬ一些具有罕见性㊁突发性等特点的重大事件往往是引发系统崩溃的原因之一ꎮ这类事件通常危害性高且迅速发生ꎬ后果严重并且难以预测ꎮ最为常见的导致系统发生全局性崩溃的原因是故障在系统中的传播ꎮ识别故障传播的机制和途径ꎬ有助于减少系统故障ꎬ降低系统脆弱性并提高可靠性ꎮ1.1㊀复杂网络渗流理论对故障传播的研究可以基于复杂网络渗流理论ꎮ渗流属于几何相变现象[29]ꎬ统计物理中的渗流理论[30]定量地刻画了网络整体层面的连通性丧失ꎮ在渗流过程中ꎬ网络的节点/连边被逐步移除ꎬ导致最大连通子团规模(其度量了网络连通性)降低ꎮ网络节点/连边移除的方法包括逐步随机移除节点/连边ꎬ或给定某属性的阈值ꎬ通过提高阈值来逐步移除属性低于阈值的节点/连边等ꎮ渗流过程中存在临界点ꎬ称为渗流阈值ꎬ在临界点附近ꎬ最大连通子团统计上变为0ꎮ以交通网络为例[31](如图1所示)ꎬ该研究对每条连边(道路)计算了当前道路车速与最大限速的比例(r)ꎮ对于给定的阈值qꎬ每条道路可以被分为功能正常的道路(r>q)和故障的道路(r<q)ꎮ对于任何给定的qꎬ根据原始路网的交通状态可构建功能性交通网络ꎮ如图1所示ꎬ分别以q为0.19㊁0.38和0.69表示低速㊁中速和高速阈值状态ꎮ随着q值的增加ꎬ交通网络变得更加稀疏(如图1(a)~1(c)所示)ꎮ图中只绘制了最大的三个连通子团ꎬ分别用绿色(最大连通子团G)㊁蓝色(第二大连通子团SG)和粉色(第三大连通子团)来标记ꎮ在渗流阈值处(q=0.38)ꎬ第二大连通子团大小会达到最大值(如图1(d)所示)ꎮ系统故障传播是发生在系统单元上的故障在各单元间扩散的过程ꎮ复杂网络渗流理论可以展现一个复杂网络通过移除网络节点/连边使网络碎片化的过程ꎬ能够对复杂系统脆弱性的内因进行分析描述ꎬ适用于对故障传播的研究ꎮ图1㊀交通网络中的渗流[31]Fig.1㊀Percolationintrafficnetwork[31]1.2㊀故障传播机理利用渗流理论对系统故障传播机理进行研究主要关注系统的扰动模式以及故障传播方式ꎮ系统的扰动模式是指故障出现的方式ꎬ主要包括随机扰动和蓄意攻击两类ꎮ故障传播方式主要指故障的扩散方式ꎬ包括传染病故障模型和级联失效模型等ꎮ下面主要介绍以上两种扰动模式和两种传播方式ꎮ1.2.1㊀系统的扰动模式随机扰动是指节点/连边的故障在复杂网络中随机产生ꎮ研究发现随机扰动下的无标度网络具有优于随机网络的鲁棒性[32]ꎮ无标度网络是一种度分布(即对复杂网络中节点度数的总体描述)服从或者接近幂律分布P(k)~k-α的复杂网络[33]ꎮ理论推导和数值仿真表明幂律分布的参数α<3的无标度网络在随机攻击下难以解体[34]ꎮ此外研究还发现ꎬ像互联网这种度分布近似为幂律分布的复杂网络ꎬ虽然对于随机删除节点这种攻击具有高度鲁棒性ꎬ但是针对蓄意攻击却相对脆弱ꎮ蓄意攻击是指挑选复杂网络中具有度数高㊁介数高等特征的重要节点ꎬ或权重高㊁重要度高的重要连边进行攻击使其故障的扰动方式ꎮ在蓄意攻击下ꎬ如果按照度的大小顺序来移除节点ꎬ无标度网络只要删除极少数的中心节点就会崩溃ꎬ比随机网络更加脆弱[32]ꎮ这也表明了无标度网络的高度异质性ꎬ即大部分连边集中于中心节点处ꎮ除了基于节点度数的攻击策略外ꎬ许多研究也基于其他原则的攻击策略分析故障传播ꎬ例如介数或基于其他不同中心性的攻击策略[35]ꎮ1.2.2㊀系统的故障传播方式常见的系统故障传播模型主要有传染病模型和级联失效模型ꎮ传染病模型是一种引入复杂网络理论来对流行病传染现象进行分析的方法ꎮ传染病模型框架主要基于两个假设:可划分性和均匀混合性ꎮ可划分性是指传染病模型按照个体所处阶段对其进行分类ꎬ并且个体可以在不同阶段之间转化ꎮ均匀混合性是指可以认为任何人都可以感染其他任何人[36]ꎬ而不需要确切地知道疾病传播所依赖的接触网ꎮ传染病模型可以应用于不同学科领域的场景ꎬ分析不同类型系统的故障传播特征ꎬ对系统的脆弱性进行研究[37]ꎮ通过传染病模型研究发现ꎬ在故障动态传播过程中ꎬ网络的拓扑结构是很大的影响因素ꎮ例如在疾病传播过程中ꎬ个体主动与已感染个体彻底断开联系[38 ̄39]ꎬ网络拓扑结构因此变化ꎬ进而会产生磁滞等丰富的动力学现象ꎮ级联失效是指初始一小部分单元的故障有可能引发其他单元故障ꎬ进而产生连锁反应ꎬ最终导致网络无法履行正常功能[40]ꎮ因此级联失效模型可用于研究少数单元的故障是否会触发整个系统的故障等问题ꎮ级联失效模型大致可分为基于负载重新分配㊁基于节点相互依赖关系和基于邻居生存数量等三大类[41]ꎮ在基于负载重新分配的级联失效模型中ꎬ每个单元有相应的容量并承担一定的负载ꎮ当某单元故障时ꎬ其所承担的负载会重新分配给其他单元ꎮ重新分配后ꎬ其他单元节点的负载可能超出容量ꎬ然后出现新的故障ꎬ从而引起故障传播ꎮ最直接的一类假设是ꎬ故障节点的负载会传播给邻居节点ꎬ如纤维束模型(fiberbundlemodel)[42]㊁沙堆模型[43 ̄44]等ꎮ研究者围绕这些模型分析了网络的脆弱度如何随网络结构异质性等因素而改变ꎮ此外ꎬ在输送物质㊁能量㊁信息的基础设施网络中ꎬ流量重配策略并不只是简单地分配给邻居[45]ꎮ2002年Motter等[46]提出的级联失效模型则假定每对节点之间的流量(如因特网中的数据流量㊁交通系统中的车辆流量)按照最短路径分配ꎬ每个节点的负载是该节点的介数(通过该节点的最短路径数量)ꎬ容量是初始负载的1+α倍ꎬ其中α为大于0的容忍(tolerance)参数ꎮ该模型表明ꎬ对于该类流量为负载的异质网络ꎬ级联失效机制也会引发类似于只攻击关键节点而造成整个系统崩溃的现象ꎮ在基于节点相互依赖关系的级联失效模型中ꎬ节点与节点之间存在依赖关系ꎬ某个节点故障会引发依赖于该节点的相关节点发生故障ꎮ例如ꎬ互联网依赖于电力网络供电ꎬ电力网络依赖于互联网进行控制ꎬ电力网与互联网形成了相互耦合的网络ꎮ电力网络中的节点失效ꎬ将会导致依赖该节点的互联网中的节点失效ꎬ进而引发依赖于这些互联网节点的电力网络节点失效ꎬ故障不断传播导致系统崩溃ꎮ对该耦合网络模型[47]的研究发现ꎬ耦合关系较强时会产生不连续的渗流相变ꎬ即最大连通子团规模随着删去节点比例的增加而不连续地跳变为0ꎮ这对于系统风险的预测㊁管理是十分不利的ꎮParshani等[48]提出了一个分析框架ꎬ用于研究同时包括连接关系连边和依赖关系连边的网络的稳健性ꎮ研究表明连接关系连边的故障和依赖关系连边之间存在协同作用ꎬ并引发了级联故障的迭代过程ꎬ对网络稳健性产生破坏性影响ꎮLi等[49]建立了空间嵌入的相互依赖网络模型ꎬ并发现首次故障的范围超过阈值半径时就可能导致全局崩溃ꎮ上述负载重新分配的级联失效模型也可以建模为节点间相互依赖关系[50]ꎮ在基于邻居存活数量的级联失效模型中ꎬ当节点邻居存活数量小于给定阈值时节点故障ꎮ这一类模型包括阈值模型(thresholdmodel)[51]㊁k ̄core渗流[52]以及Bootstrap渗流[53]等模型ꎮ阈值模型中ꎬ每个节点故障当且仅当邻居故障的比例超过该节点的阈值ꎬ从而初始故障节点可能触发整个系统的崩溃ꎮk ̄core渗流过程中ꎬ度小于k的节点会被移除ꎬ移除节点可能带来其他节点的度也小于kꎬ从而引发级联失效的现象ꎮk ̄core渗流能够区分出核心节点与边缘节点ꎬ可用于分析网络结构㊁识别脆弱节点[54]ꎮBootstrap渗流模型中ꎬ初始激活f比例的节点ꎬ其他节点若有k个邻居激活则也会被激活ꎬ从而产生级联现象ꎮ此外ꎬ除了基于故障传播模型之外ꎬ随着人工智能的发展ꎬ神经网络㊁图学习等方法也逐渐用于研究故障传播[55]ꎮ1.3㊀基于故障传播模型的可靠性研究上述故障机理揭示了复杂系统故障的传播规律ꎬ为分析和降低系统脆弱性提供有力的理论支持ꎮ目前研究者们基于故障传播模型展开了对系统可靠性方法的研究ꎬ包括对复杂系统的可靠性设计㊁可靠性评估㊁关键节点识别等ꎮ在复杂系统可靠性设计方面ꎬAdilson等[56]提出了一种基于在初始攻击后选择性地进一步移除部分节点和连边的无成本防御策略ꎬ通过移除部分单元阻断了故障级联传播ꎬ提高系统的可靠性ꎮYingrui等[57]研究了相互依赖网络的负载重分配策略ꎮ相互依赖网络中ꎬ故障连边的一部分负载会通过耦合关系转移给相互依赖的另一个网络上ꎮ该研究提出了通过恰当选择网络耦合强度(一个网络中分配给其他网络的负载比例)可以增加两个网络生存的可能性ꎮChristian等[58]提出了通过正确选择一小部分节点进行自治(独立于网络其他部分)可以显著提高鲁棒性ꎮ研究发现介数和度是选择此类节点的关键参数ꎬ通过保护介数最高的少数节点可显著降低系统崩溃的可能性ꎮSchäfer等[59]提出了在故障发生时重新分配负载的策略ꎮ该策略中基于最短流路径的策略能够将之前的异构负载分布的网络节点和链路变为更加均匀的负载分布ꎮ这些流路径的使用能够增加网络的鲁棒性ꎬ同时减少网络容量布局的投入成本ꎮPastor ̄Satorras等[60]提出了依赖于网络特定无标度结构的最佳免疫策略ꎬ为避免故障传播并提高系统鲁棒性提供了理论分析ꎮ在复杂系统可靠性评估方面ꎬLi等[31]对交通流网络进行渗流分析ꎬ发现在渗流阈值附近交通系统的连通状态会从全局连通变为局部连通ꎬ为控制系统拥堵提供了有效帮助ꎮ此外ꎬLi等[50]发现因局部故障引发的故障呈现辐射状以近似常速进行传播ꎬ通过理论分析给出故障传播速度则随着单元对故障的容忍程度的升高而降低ꎬ并在大量网络中得到了验证ꎮZeng等[61]基于渗流理论对故障模式进行研究ꎬ提出了涵盖交通拥堵从出现㊁演化到消散整个生命周期的健康管理框架ꎬ为未来交通的智能管理提供了理论支撑ꎮ在识别关键节点方面ꎬYang等[62]提出了一个动态级联失效模型ꎬ模拟了电网系统中的级联故障ꎮ研究基于该模型识别出了电网的关键脆弱节点并发现给定电网中的相同扰动会在不同条件下导致不同的结果ꎬ即从没有损坏到大规模级联ꎮNesti等[63]构建了故障传播模型ꎬ对电网的故障模式进行识别ꎬ根据故障的可能性对线路故障模式进行排序ꎬ并确定了此类电网最可能的故障发生方式和故障传播方式ꎮLiu等[64]利用小世界网络理论分析了系统的拓扑结构统计特性ꎬ提出了基于小世界聚类的故障传播模型ꎬ并利用Dijkstra算法找到了具有高扩散能力的故障传播路径和相关关键节点ꎬ验证了该方法能够有效地发现系统的薄弱点ꎬ为设计改进和故障预防提供重要依据ꎮ2㊀考虑故障恢复的系统适应性研究适应性是指系统在不断变化的环境中仍然保持自身性能的能力ꎮ系统适应性使系统能从压力中恢复[65]ꎬ反映系统适应性的两个关键因素分别是系统降级程度和系统性能恢复时间[66]ꎮ图2展示了系统性能在扰动前后的变化[67]ꎮte时刻系统受到扰动ꎬtd时刻系统受扰结束ꎬ系统性能水平由F(t0)降至F(td)ꎮts时刻系统开始恢复性能ꎬtf时刻系统到达最终平衡状态ꎬ系统性能水平恢复至F(tf)ꎮ图2㊀系统性能指标特征在扰动不同阶段下的变化[67]Fig.2㊀Changesofsystemperformanceindicatorcharacteristicsunderdifferentdisturbancestages[67]2.1㊀复杂系统适应性的景观理论复杂系统对扰动的适应过程可用动力系统理论进行建模ꎮ动力系统理论中ꎬ系统由一组状态变量所刻画ꎬ系统状态变量的各个分量联合定义了系统是否健康可靠ꎮ一个处在健康状态的复杂系统ꎬ在扰动下可能会突然进入故障状态ꎬ例如生态系统的物种灭绝[65]㊁热带雨林的沙地化[68]㊁金融危机[69]等等ꎮ系统状态变量的演化规律由微分方程或随机微分方程所描述ꎬ系统的稳定状态就是微分方程的吸引子[70]ꎬ系统内可能存在多个吸引子ꎮ外界对一个复杂系统的状态变量x或者系统参数θ进行扰动ꎬ系统因适应性不会直接脱离现有吸引子状态ꎬ依旧维持稳定ꎮ但当扰动足够大ꎬ超过系统恢复能力的临界点ꎬ使系统无法适应该变化时ꎬ系统可能脱离原有的吸引子状态ꎬ被其他吸引子吸引ꎮ由于微分方程或随机微分方程常常可由能量景观所表示ꎬ复杂系统扰动前后的适应过程可以用景观进行直观描述[71](如图3所示)ꎮ系统可以看作景观曲面上运动的小球ꎬ景观高度表示系统的能量(Lyapunov函数值)ꎬ小球倾向于往系统能量低的状态运动ꎬ即小球会倾向于向谷底运动ꎮ如图3(a)所示该景观有两个 谷底 ꎬ每个 谷底 表示一个吸引子ꎮ对处于健康态的系统施加扰动ꎬ系统状态发生改变ꎬ对应于图中实心小球的移动ꎮ小扰动下系统状态不会脱离健康态吸引子ꎮ大扰动下系统则会脱离健康态吸引子ꎬ进入故障态ꎮ对系统参数θ的扰动ꎬ对应于图中三维景观形状的改变(如图3(b)所示)ꎮ当系统参数改变到临界点时ꎬ健康态失稳ꎬ系统发生故障ꎮ而当系统健康态对应的吸引域越大㊁越深时ꎬ系统越容易在扰动后保持在健康态ꎮ图3㊀系统的三维景观示意图Fig.3㊀Schematicdiagramofthesystemthree ̄dimensionallandscape在处理由少数变量描述的低维系统时ꎬ只需沿用经典的动力系统理论即可ꎮ但当处理由高维状态变量描述的系统时ꎬ例如大量基因组成的调控网络或由大量物种组成的生态系统ꎬ就会面临状态空间指数爆炸㊁系统参数多等困难ꎮ对于此类高维系统ꎬ可结合统计物理中的粗粒化㊁平均场近似等技术来克服局限性[72 ̄73]ꎮ近年来ꎬ自旋玻璃理论被引入用于分析生态系统的稳态性质[74]ꎮ例如Altieri等[75]使用自旋玻璃中的Replica方法对广义L ̄V方程进行求解ꎬ发现了低噪音下存在玻璃相ꎬ系统吸引子的个数正比于变量数的指数倍ꎮGao等[76]对包括基因㊁化学反应等多种类型网络动力学进行粗粒化得到了系统崩溃的临界点ꎮ2.2㊀基于景观理论的系统适应性分析景观理论能够衡量系统是否即将发生故障或者崩溃ꎬ并揭示复杂系统崩溃的根源ꎬ为分析系统适应性提供支持ꎬ被广泛应用于不同领域ꎮ例如在生物领域ꎬHuang等[77]发现了癌症等疾病可以理解为基因调控网络动力学中的吸引子ꎮ这种吸引子可能是正常细胞中本就具备的ꎬ也可能是基因突变后产生的ꎮ在生态领域ꎬHoegh ̄Guldberg等[78]分析了珊瑚礁的恢复能力ꎬ识别了珊瑚生长速率(系统参数)的临界点ꎮ当珊瑚生长速率下降到临界点ꎬ原本由珊瑚主导的生态环境将突变为水藻主导的生态环境ꎮ在社会科学领域ꎬ极端思想的传播在互联网属于一种故障态对应的吸引子ꎮJohnson等[79]建立了网络极端思想的模型ꎬ指出了由于极端思想网络的适应性ꎬ单个平台大幅度封杀并不足以使极端思想在互联网上灭绝ꎬ反而可能加剧极端思想的发展ꎮ将复杂系统的崩溃或者故障建模为健康状态吸引子的失稳ꎬ也可以指导不同领域复杂系统可靠性设计和诊断ꎮ在复杂系统可靠性设计方面ꎬ研究发现元素间存在强耦合的系统容易存在临界点ꎬ减少耦合可避免系统发生突变[40]ꎮ随着复杂系统单元之间的交互变强ꎬ系统单元的行为可能会严重改变或损害其他单元的功能或操作ꎮ因为强耦合系统的动态变化往往很快ꎬ可能超过人类反应的速度ꎮ金融危机就是强耦合导致系统崩溃的事例ꎮ因此为了使系统具有更高的可靠性ꎬ需要适当降低系统中的耦合强度ꎮ在可靠性诊断方面ꎬ有研究利用临界点附近存在临界慢化[80]以及闪烁(flickerling)[81]等现象实现对系统状态(是否达到临界点)的预测[82]ꎮ例如ꎬVeraart等[83]构建了蓝藻微观世界来测试临界慢化现象ꎬ蓝藻微观世界受到扰动的实验表明ꎬ临界慢化确实发生ꎬ恢复速度可用于衡量复杂系统的恢复能力ꎬ预测系统到临界状态的距离ꎬ从而判断系统是否即将崩溃ꎮ3㊀讨论与结论可靠性学科是一门与故障做斗争的学科ꎬ复杂系统可靠性的研究主要围绕故障展开ꎮ故障有两种演化方向:故障扩散与故障恢复ꎮ研究从这两个角度出发ꎬ一是考虑故障传播的系统脆弱性研究ꎻ二是考虑故障恢复的系统适应性研究ꎮ系统脆弱性研究的重点在于挖掘系统崩溃的内在机理ꎬ即故障的传播机理ꎮ系统适应性研究的重点在于基于动力系统与景观理论挖掘系统故障恢复机理ꎬ包括分析系统故障恢复的临界点ꎮ基于故障传播[31ꎬ50]和故障恢复机理[84 ̄86]ꎬ提出了一系列复杂系统可靠性技术ꎬ从而实现对复杂系统的评估㊁诊断㊁调控[87 ̄89]ꎮ伴随着全球化以及信息技术的发展ꎬ交通系统㊁电力系统㊁金融系统等系统必将越发复杂ꎬ系统内单元数量以及关联程度都将大大增加ꎮ单元间的相互依赖可能使少数单元的故障引发整个系统的级联失效ꎬ单元间的复杂相互作用也可能产生未知的故障态吸引子ꎬ产生负向涌现ꎮ因此ꎬ构建㊁维护复杂系统必将面临可靠性的挑战ꎮ在过度耦合带来风险的同时ꎬ也可以利用系统的复杂性来增强系统的可靠性ꎮ如何通过在系统内恰当地引入复杂性(单元之间恰当的组织形式)以赋予系统自我恢复能力ꎬ将是未来构建高可靠复杂系统的关键[90]ꎮ参考文献:[1]于景元.钱学森系统科学思想和系统科学体系[J].科学决策ꎬ2014(12):1 ̄22.DOI:10.3773/j.issn.1006 ̄4885.2014.12.002. [2]GALLAGHERRꎬAPPENZELLERT.Beyondreductionism[J].Scienceꎬ1999ꎬ284(5411):79.DOI:10.1126/science.284.5411.79.[3]钱学森ꎬ于景元ꎬ戴汝为.一个科学新领域:开放的复杂巨系统及其方法论[J].自然杂志ꎬ1990ꎬ12(1):3 ̄10. [4]钱学森.创建系统学[M].太原:山西科学技术出版社ꎬ2001:11.[5]郭雷.系统科学进展[M].北京:科学出版社ꎬ2017.[6]方福康.神经系统中的复杂性研究[J].上海理工大学学报ꎬ2011ꎬ33(2):103 ̄110.DOI:10.13255/j.cnki.jusst.2011.02.006.[7]方福康ꎬ袁强.经济增长的复杂性与 J 结构[J].系统工程理论与实践ꎬ2002ꎬ22(10):12 ̄20.DOI:10.3321/j.issn:1000 ̄6788.2002.10.003.[8]王众托.知识系统工程与现代科学技术体系[J].上海理工大学学报ꎬ2011ꎬ33(6):613 ̄630.DOI:10.13255/j.cnki.jusst.2011.06.007.[9]彭张林ꎬ张强ꎬ杨善林.综合评价理论与方法研究综述[J].中国管理科学ꎬ2015ꎬ23(S1):245 ̄256.[10]陈光亚.向量优化问题某些基础理论及其发展[J].重庆师范大学学报(自然科学版)ꎬ2005ꎬ22(3):6 ̄9.DOI:10.3969/j.issn.1672 ̄6693.2005.03.002.[11]狄增如.探索复杂性是发展系统学的重要途径[J].系统工程理论与实践ꎬ2011ꎬ31(S1):37 ̄42.[12]吴俊ꎬ邓宏钟ꎬ谭跃进.基于自然连通度的随机网络抗毁性研究[C]//第五届全国复杂网络学术会议论文(摘要)汇集.青岛:中国工业与应用数学学会ꎬ2009:100.。