故障树分析法(FTA)
1.故障树分析法概述
故障树分析法(Fault Tree Analysis)是由美国贝尔电话研究所
的沃森(Watson)和默恩斯(Mearns)与于1961年首次提出并应用
于分析民兵式导弹发射控制系统的。其后,波音公司的哈斯尔
(Hasse)、舒劳德(Schroder)、杰克逊(Jackson)等人研制出故
障树分析法计算程序,标志着故障树分析法进入了以波音公司为中
心的宇航领域。1974年,美国原子能委员会发表了以麻省理工学院
(MIT)拉斯穆森(Rasmussen)为首的安全组所写的“商用轻水
反堆核电站事故危险性评价”的报告,该报告采用了美国国家航空
和管理部于60年代发展起来的事件树(ET:Event Tree)和故障树
分析方法。这一报告的发表引起了各方面的很大反响,并推动了故
障树分析法从宇航、化工和机械等工业领域。
所谓故障树分析,就是首先选定某一影响最大的系统故障作
为顶事件,然后将造成系统故障的原因逐级分解为中间事件,直
至把不能或不需要分解的基本事件作为底事件为止,这样就得到
了一张树状逻辑图,称为故障树。如图1-1所示就是一简单的故障
树。这一简单故障树表明:作为顶事件的系统故障是由部件A的故
障或部件B的故障引起的,而部件A的故障可能由元件1引起,也可
能由元件2引起,部件B的故障则由元件3和元件4同时发生故障时
引起,这样,就将引起系统故障的基本原因及影响途径表达得一
清二楚。
更一般地说,故障树分析就是以故障树为基础,分析影响顶
事件发生的底事件种类及其相对影响程度。故障树分析包括以下
几个主要步骤:建立故障树、故障树的定性分析和故障树的定量
分析。
图1-1 简单的故障树
2.故障树的建立
故障树的建立有人工建树和计算机建树两类方法,它们的思路
相同,都是首先确定顶事件,建立边界条件,通过逐级分解得到的
原始故障树,然后将原始故障树进行简化,得到最终的故障树,供
后续的分析计算用。
(1)确定顶事件
在故障诊断中,顶事件本身就是诊断对象的系统级(总体的)
故障部件。而在系统的可靠性分析中,顶事件有若干的选择余地,
选择得当可以使系统内部许多典型故障(做为中间事件和底事件)
合乎逻辑地联系起来,便于分析。所选的顶事件应该满足:
①要有明确的定义;
②要能进行分解,使之便于分析顶事件和底事件之间的关系;
③要能度量以便于定量分析。
选择顶事件,首先要明确系统正常和故障状态的定义;其次要
对系统的故障作为初步分析,找出系统组成部分(元件、组件、部
件)可能存在的缺陷,设想可能发生的各种的人为因素,推出这些
底事件导致系统故障发生的各种可能途径(因果链),在各种可能
的系统故障中选出最不希望发生的事件作为顶事件。
对于复杂的系统,顶事件不是唯一的,必要时还可以把大型复杂的
系统分解为若干个相关的子系统,以典型中间事件当作故障树的顶
事件进行建树分析,最后加以综合,这样可使任务简化并可同时组
织多人分工合作参与建树工作。
①不允许出现的事件;
②不可能发生的事件,实际中常把小概率事件当作不可能事件;
③必然事件;
④某些事件发生的概率;
⑤初始状态。当系统中的部件有数种工作状态时,应指明与顶事件
发生有关的部件的工作状态。
(2)建立边界条件
建立边界条件的目的是为了简化建树工作,所谓边界条件是
指:
建立边界条件和建树时应该注意的是:
①小概率事件不等同于小部件的故障和小故障事件;
②有的故障发生概率虽小,但一旦发生则后果严重,为安全起见,
这种小概率故障就不能忽略;
③故障定义必须明确,避免多义性,以免使故障树逻辑混乱;
④先抓主要矛盾,开始建树时应先考虑主要的、可能性很大的以
及关键性的故障事件,然后再逐步细化分解过程中再考虑次要的、
不经常发生的以及后果不严重的次要故障事件;
⑤强调严密的逻辑性和系统中事件的逻辑关系,条件必须清楚,
不可紊乱和自相矛盾。
(3)建树符号
建树符号包括故障事件符号、逻辑门符号和转移符号等,如
表1-1所示。
表1-1 建树符号
下面以减速器的故障为例,来说明说明建树过程。
显然,在本例中,减速器的故障就是顶事件。假定减速器故障
仅包括漏油、振动噪声和减速器不能工作三种形式,它们可作为故
障树的第二级。而减速器的振动噪声可能来自齿轮箱,也可能来自
基座、电机或工作中的不平稳外载荷,它们可作为故障树的第三级。
齿轮箱由转轴组件和轴承系统组成,它们构成故障树的第四级。转
轴组件又包括齿轮和转轴,称为故障树的第五级,这样层层分解,
最后可能建立如图1-2所示的故障树。需要说明的是,图1-2所示的
减速器故障树与某一实际的减速器故障情形可能并不完全相符,此
处所列只是为说明故障树的建立方法。由此可以看出,一张实际的
故障树可能非常复杂,这取决于考虑问题的角度和出发点。
图1-2 减速器故障树
3.故障树的简化
在分析系统故障时,最初建立的故障树往往并不能最简的,
可以对它进行简化。最经常采用的简化方法是借助逻辑代数的逻
辑法则进行简化,为此,先来介绍几个基本的逻辑关系和逻辑运
算法则、故障树的结构函数,最后以一个实例来说明简化方法。
(1)基本逻辑关系 两个变量的基本逻辑关系如表1-2所示,逻辑
运算的真值表如表1-3所示。
表1-2 两个变量的基本逻辑关系
表1-3 两个变量逻辑运算的真值表
表1-4 两个变量逻辑运算的真值表
(2)逻辑运算的基本法则,为简便起见,现将逻辑运算的基本法
则列于表1-4。
(3)故障树的结构函数 由图1-1所示的简单故障树可以看出,由
于故障树是由构成它的全部底事件的“或”和“与”的逻辑关系
联结而成,因此可用结构函数这一数学工具给出故障树的数学表
达式,以便于对故障树作定性分析和定量计算。
系统故障称为故障树的顶事件,以符号T表示,系统各部件
的故障称为底事件,如对系统和部件均只考虑故障和正常两种状
态,则底事件可定义为:
(1-2)
系统顶事件的状态如用φ来表示,则必然是底事件状态Xi(i=1
,2,…,n)的函数。
同时
定义为故障树的结构函数。
显然,图1-3所示的与门故障树的结构函数为
(1-3)
(1-4)
(1-5)
图1-4所示的或门故障树的结构函数为
图1-3 与门故障树 图1-4 或门故障树
也可写为
(1-6)
(1-7)
(4)简化实例 下面以两个简单的例子来说明故障树的简化过程。
对图1-5(a),故障树的简化过程如下
对图1-5(b),故障树的简化过程如下
图1-5 故障树简化实例
4.故障树的定性分析
对故障树作定性分析的主要目的是为了弄清系统(或设备)。
出现某种故障(顶事件)可能性有多少,亦即分析有哪些因素会引
发系统的某种故障。定性分析首先必须确定系统的最小割集。
⑴割集和最小割集 割集是引起系统故障发生的几个故障底事
件的集合,即一个割集代表了系统发生故障的一种可能性或一种故
障模式。
如一故障树的底事件集合为 ,当有一子集
当 ,
当满足条件 时,使 ,亦即该子集所含
之全部底事件均发生时,顶事件必然发生,则该子集就是割集,其
割集数为K。
(1-8)
割集的对偶式路集,路集是系统不发生故障的底事件的集合,
即一个路集代表了一个系统正常的可能性或模式。
最小割集是指包含有最少数量而又最必须的底事件的割集,
全部最小割集的完整集合代表了给定的全部故障,因此,最小割
集的意义就是在于它给出了处于故障状态的系统中所必须要修理
的故障模式。
⑵ 最小割集的求取 目前,对最小割集的研究较多,在此介绍
较常用的两种方法,即赛迈特里斯算法和富赛尔算法。
①赛迈特里斯算法(上行法) 由赛迈特里斯(Semanderes)
研制(1972年)的最小割集算法,其基本原理是:对给定的故障树
从最下一级中间事件开始,如中间事件是以逻辑与门把底事件联系
在一起,可用与门结构函数式(式1-5);如中间事件是逻辑或门
与底事件相联,则用或门结构函数式(1-6);依次往上,直至顶
事件,运算才终了。在所得计算结果中,如有相同的底事件出现,
就应用布尔代数加以简化。
对图1-6所示的故障树,显然可以写出:
(1-9)
由此得到8个割集。
可用逻辑代数对上式进行简化得到最小割集为
即该故障树有4个最小割集,为 ,同时可
得其等价故障树如图1-7所示。
(1-
10)
图1-7 图1-6的等价故障树图1-6 故障树举例
②富赛尔(Fussell)算法(下行法) 求故障树最小割集的另
一种算法是富赛尔(Fussell)根据范斯莱(Vesely)编制的计算机
程序MOCUS(获得割集的方法)于1972年提出的一种手工算法。
它根据故障树中逻辑或门会增大割集容量的性质,从故障树的顶事
件开始,由上到下,顺次把上一级事件置换为下一级事件,遇到与
门将输入 横向并列写出,遇到或门则将输入事件竖向串列写出,
直至把全部逻辑门都置换为底事件为止,由此可得该故障树的全部
割集。
需要说明的是,由于图1-7所示的故障树已经过最小割集处理,
故富赛尔推算得到的结果均为最小割集,而对于一般地故障树,则
仍须用布尔代数对富赛尔推算结果进行简化,才能求得最小割集。
5.故障树的定量分析
所谓故障树的定量分析,就是以故障树为基础,分析系统故障
的发生概率以及各底事件的重要程度,包括结构重要度、概率重要
度和关键性重要度等三个不同含义的定量指标。
(1)概率计算的基本公式 设事件 的发生概率分别
为 ,
①当 为相互独立的事件时,有
和的概率 (1-11)
积的概率 (1-12)
②当 为相斥事件时,有
和的概率 (1-
13)
积的概率 (1-
14) ③当 为相容事件时,有
和的概率
(1-
15)
积的概率
(1-
16)
实际计算时,当 时,相容事件近似独立事件;
当 时,相容事件近似于相斥事件。
值得注意的是,在应用上述公式计算系统故障的概率时,当故
障树中包含两个以上同一底事件时,则必须应用逻辑代数整理简化
后,才能使用以上概率计算公式,否则会得出错误的结论。因此,
在计算概率之前,必须将故障树化为结构最简,即与最小割集对应。
(2)顶事件的发生概率 求顶事件的发生概率有多种方法,这
里介绍由最小割集结构函数求顶事件的故障概率的算法。该算法的
基础思路是:将故障树的结构函数表示成最小割集和的形式,然后
应用概率计算的基本公式求出系统故障发生的概率。即将系统的最
小割集结构函数表达为
(1-
17)
式中 k—最小割集数;
—某一最小割集,其定义为
(1-18)
系统顶事件发生的概率,即是使 的概率,为
(1-19)
对图1-7所示的故障树数,令底事件求顶事件 的发
生概率分别为 ,各最小割集
间看做相斥事件,于是又系统(顶事件)故障发生的概率为:
(3)事件的重要度计算 故障树的各个底事件(或各最小割集)
对顶事件发生的影响称为底事件(或最小割集)的重要度。研究事
件对改善系统设计、提高系统的可靠性或确定故障监测的部位、制
定系统故障诊断方案、减小排除故障的时间等具有重要意义。
一个故障树往往包含有多个底事件,为了比较它们在故障树中
的重要程度,在故障树的定量分析中常作结构重要度、概率重要度
和关键重要度等计算。
①结构重要 某个底事件的结构重要度,是在不考虑其发生概
率值得情况下,观察故障树的结果,以决定该事件的位置重要程度。
由于底事件 的状态取0或1,当 处于某一状态时,
其余n-1个底事件组合系统状态为 。因此,第i个底事件 的结
构重要度定义为:
式中 ,即第i个底事件为1;
,即第i个底事件为0;
n—底事件个数。
该定义中, 表示底事件 和顶事件同时发生的状态组合数
目,即 表示底事件 不发生而顶事件
发生的状态组合数目,即 。两者相减则代表了底事
件 发生则顶事件发生、且底事件 不发生顶事件也不发生的情况,
这些状态组合与顶事件发生与否密切相关因此可以利用其数目与系
统总状态数之比来表示底事件 的结构重要度。
(1-20)
仍以图1-7所示的故障树为例来说明事件结构重要度的计算方
法。为此,先列出底事件状态与顶事件状态表,如表1-3所示。
表1-3 底事件状态与顶事件状态
对底事件1来说,首先找出底事件1和顶事件同时发生的集合
即 ,有(1001)、(1010)、(1011)、(1101)、
(1110)、(1111)共6个,再找出底事件1不发生而顶事件发生的
集合,即 有(0011)、(0101)、(0111)共3个,于是
可得底事件1的结构重要度为
同时可得
即在此例中,底事件4的结构重要度最高:
②概率重要度 底事件 发生概率的变化引起顶事件发生概率
的变化程度定义为该底事件的概率重要度,记作 其数学表达
式为
(1-21)
由于在一般情况下,有
(1-22)
式中 —顶事件发生的概率
—顶事件 发生的概率
因此,底事件 的概率重要度为
(1-23)
式中 —底事件发生时顶事件发生的概率;
—底事件 发生的概率。
由式(1-21)可得顶事件发生概率 的变化量 与底事件发
生概率的变化量 间的近似关系为
图1-7所示故障树种各底事件的概率重要度(假定 ,
可 , , )可如下求得:
对于底事件1而言,在表1-3中找出只有右边的 (此时
)而左边的 (此时 )的事件组合,即只有底事件1发生顶
事件才发生的事件组合,为(1001)、(1010)和(1110),把各
底事件看成相互独立、各事件组合看成相斥,应用式(1-23)可得
(1-24)
同理可得
即
③关键重要度 底事件 发生概率的变化率的改变引起顶事件发
生概率变化率的改变程度定义为该底事件的关键重要度,记作
,其数学表达式为
即关键性重要度是顶事件发生概率与某事件概率变化率之比,
式中 为顶事件发生的概率。
关键性重要度 与概率重要度的关系为
(1-25)
(1-26)
仍以图1-7所示的故障树为例,前已求得顶事件发生的概率为
, 于 于是可得底事件
的关键性重要度分别为
即 。
由以上讨论可以看出,对于不同的重要度定义,各底事件间的
相对重要程度是不同的。