可靠性工程师培训讲义
索引
可靠性基本概念
可靠性模型
可靠性设计
可靠性分配
FMEA/FTA
可靠性设计准则
电路容差分析
元器件降容设计
热设计
冗余容错设计
安全性设计与分析
机械可靠性概述
软件可靠性
环境应力筛选
可靠性鉴定验证试验
一、可靠性基本概念
(含维修性、测试性、可用性、保障性)
1.可靠性
可靠性定义:
产品在规定的条件下和规定的时间内,完成规定功能的能力。可靠性的概率度量亦称可靠度。
产品指的是新版ISO9000中定义的硬件和流程性材料等有形产品以及软件等无形产品。
“规定时间”和产品可靠性关系也极为密切。
“规定的功能”指的是产品规格书中给出的正常工作的性能指标。
产品的可靠性一般可分为固有可靠性和使用可靠性。
产品固有可靠性是产品在设计、制造中赋予的,是产品的一种固有特性,也是产品的开发者可以控制的。而产品使用可靠性则是产品在实际使用过程中表现出的一种性能的保持能力的特性,它除了考虑固有可靠性的影响因素之外,还要考虑产品安装、操作使用和维修保障等方面因素的影响。
产品可靠性还可分为基本可靠性和任务可靠性。
基本可靠性是产品在规定条件下无故障的持续时间或概率,它反映产品对维修人力的要求。因此在评定产品基本可靠性时应统计产品的所有寿命单位和所有故障,而不局限于发生在任务期间的故障,也不局限于是否危及任务成功的故障。
任务可靠性是产品在规定的任务剖面内完成规定功能的能力。评定产品任务可靠性时仅考虑在任务期间发生的影响完成任务的故障。
可靠度函数、累积故障分布函数
如前所述,产品可靠度是产品在规定条件下规定时间完成规定功能的概率,描述的是产品功能随时间保持的概率,即产品可靠度是时间的函数,一般用R(t)表示,产品的可靠度函数即:
R(t)=P(T >t)
式中:T——产品发生故障的时间;
t——规定的时间。
试验故障统计表
(×100h)
1 2 3 4 5 6 7 8 9 10
15
2
700-800
2
1
200-300
16
0
800-900
3
1
300-400
16
13
10
累积故障数(个)
0
3
6
故障数(个)
900-1000
4
1
400-500
600-700
1
1
100-200
500-600
0
0
0——100
时间(小时)
累积故障数(个)
故障数(个)
时间(小时)
故障及其分类
产品或产品的一部分不能或将不能完成预定功能的事件或状态称为故障。对于不可修的产品如电子元器件和弹药等也称失效。故障也可以简单地定义为丧失了规定的功能。故障的表现形式,如三极管的短路或开路、灯丝的烧断等称为故障模式。引起产品故障的物理、化学或生物等变化的内在原因称为故障机理。
按故障的规律可分为偶然故障和耗损故障。偶然故障是由于偶然因素引起的故障,其重复出现的风险可以忽略不计,只能通过概率或统计方法来预测。耗损故障是通过事前检测或监测可预测到的故障,是由于产品的规定性能随时间增加而逐渐衰退引起的。耗损故障可以通过预防维修,防止故障的发生,延长产品的使用寿命。
按故障引起的后果可分为致命性故障和非致命性故障。前者会使产品不能完成规定任务或可能导致人或物的重大损失、最终使任务失败,后者不影响任务完成,但会导致非计划的维修。按故障的统计特性又可分为独立故障和从属故障。前者是指不是由于另一个产品故障引起的故障,后者是由另一产品故障引起的故障。在评价产品可靠性时只统计独立故障。
可靠性常用度量参数
可靠度
产品在规定的条件下和规定的时间内,完成规定功能的概率称为可靠度,一般用 表示。若产品的总数为N0,,工作到t时刻产品发生的故障数为r(t) ,则产品在时刻的可靠度的观测值为:
故障率
工作到某时刻尚未发生故障的产品数,在该时刻后单位时间内发生故障的概率,称之为产品的故障率。故障率一般用 表示。
一般情况下, 可用下式进行工程计算:
平均故障前时间(MTTF)
设 个不可修复的产品在同样条件下进行试验,测得其全部故障时间为 … 。其平均故障前时间(MTTF)为:
当产品的寿命服从指数分布时,
平均故障间隔时间(MTBF)
一个可修产品在使用过程中发生了 次故障,每次故障修复后又重新投入使用,测得其每次工作持续时间为 … 。其平均故障间隔时间MTBF为:
贮存寿命
产品在规定条件下贮存时,仍能满足规定质量要求的时间长度。
产品出厂后,即使不工作,在规定的条件下贮存,产品也有一个非工作状态的偶然故障率,非工作的偶然故障率比工作故障率小得多,但贮存产品的可靠性也是在不断下降的。因此,贮存寿命是产品贮存可靠性的一种度量参数。
2.维修性
维修性定义:产品在拟定的条件下和规定的时间内,按规定的程序和方法进行维修时,保持或恢复到规定状态的能力。 概率表示为维修度M
关注焦点:维修简便、快速、经济
维修性是对可靠性的重要补充
维修性是产品固有属性、是设计出来的
维修是一种活动,产品故障后为恢复其性能的活动
维修的种类
预防化维修:通过系统维修检查、检测和消除产品的故障征兆,使其保持在规定状态进行的全部活动。包括预先维修,定时维修,视情维修和故障检查等
修复性维修:产品发生故障后,使其恢复到规定状态进行的全部活动。它可以包括下述一个或多个步骤:故障定位,故障隔离,分解、更换、组装、调校及检测等,也称修理。
维修性定性定管要求
定性要求:
良好可达性
高的标准化和互换性
完善的防差错措施及识别标识
良好的测试性
保障维修安全
符合维修的人—工程要求
定量要求
平均修复时间MTTR
最大维修时间M maxct 给定维修度的最大维修时间M一般
M maxct约等于2-3MTTR
修复时间中值~M ct
M(t)=的维修时间 又叫中位修复时间
3.可用性
可用性:产品在任意时刻需要和开始执行任务时,处于可工作或可使用的程度。概率度量为可用度
开则能动,召之即来
固有可用度Ai:仅与工作时间和修复性时间有关的一种可用性。是设计特性
MTBF
Ai=————————
MTBF+MTTR
可达可用性:仅与工作时间和修复性和预防化维修时间有关
MTBMA
Aa=______________
MTBMA+MMT
MMBMA-平均维修活动间隔时间
MMT-平均维修时间
使用可用性:与能工作时间和不能工作时间有关的一种可用性
MTBMA
Ao=___________________
MTBMA+MDT
MDT-平均停机时间
4.系统效能
系统效能:系统在规定条件和规定时间内满足一组特定任务要求和程度。
E= A D C
人的效能=健康可干(A)* 干而无病(D)* 能力(C)
系统效能=召之即来 * 来之能战 * 战之能胜
5.测试性
测试性:产品能及时并准确地确定其状态(可工作、不可工作或性能下降)并隔离其内部故障的能力。
故障检测率:产品在规定时间内,在规定的条件下,用规定的方法能够准确检测出的故障数(No)与所发生故障总数(Nt)之比:
rFD =No/Nt * 100 %
故障隔离率:
rFI :用规定的方法将检测到的故障正确隔离到不大于规定模糊度的故障数CNl与检测到故障总数Nd
rFI=--------* 100%
Nl
Nd
虚警率:在规定的时间内发生的虚警率数(NFA)与同一时期内故障总数NF之比
rFA=____________* 100%
NF + NFA
NFA
6.保障性
系统产品的设计特性和计划的保障资源满足平时和战时使用要求的能力称为保障性。保障性也是产品的一种重要的固有属性。它包含两方面含义,即与产品保障有关的设计特性和保障资源的充足和适用程度。
设计特性是指与保障有关的设计特性,如与可靠性和维修性有关的,以及保障资源要求产品所具有的设计特性。这些设计特性可以通过设计直接影响产品的硬件和软件。如使设计的产品便于操作、检测、维修、装卸、运输、消耗品(油、水、气、弹)补给等设计特性。从保障性角度看,良好的保障设计特性是使产品具有可保障特性或者说所设计的产品是可保障的。
保障资源是保证产品完成平时和战时使用的人力和物力。从保障性的角度看,充足的并与产品匹配完善的保障资源说明产品是能得到保障的。
产品具有可保障的特性和能保障的特性才是具有完整保障性的产品。
二、可靠性建模
、目的
--用于可靠性定量分配、预计和评价
、可靠性模型
可靠性框图模型
可靠性数字模型
串联系统可靠性模型
串联系统:系统的所有组成单元中任一单元的故障都会导致整个系统的故障.
可靠性框图:
可靠性数学模型:
若单元的寿命分布为指数分布,则:
1
n
2
串联系统可靠性模型
若每个单元工作时间与系统时间相同,且单元也服从指数分布,则
系统平均故障间隔时间MTBF
若由10个都等于的单元组成串联系统,则
Rs=
并联系统:组成系统的所有子系统都发生失效系统才发生故障.
框图:
可靠性数学模型
1
2
n
并联系统框图
当系统各单元的寿命分布为指数分布时,对n个相同单元的并联系统,有:
工程应用要点
系统越复杂,产品可靠性越底.因此简化设计是提高产品可靠性最有效的途径.
采用并联的系统,可靠性明显提高,尤其当n=2时,提高更明显,当并联过多,可靠度提高大为减慢.
并联系统提高的是任务可靠性,但并联会使产品变得复杂,而产品基本可靠性会降低,同时并联会使体积、重量、成本增加.因此,是否采用并联要综合权衡.一般在涉及安全性和关键任务可靠性要求时采用.
三、可靠性预计
目的
大致估计整机可能的可靠性
发现潜在薄弱环节
可靠性预计-方法1
方法1
元器件计数法
Ni─ 第 i 种元器件数量
λb ─ 第 i 种元器件基本失效率(1/h)
Q ─ 第 i 种元器件通用质量系数
n ─ 整机所用元器件的种类数
可靠性预计-方法2
应力分析法:如普通二极管工作失效率预计模型
p = b EQAC RS2
p -工作失效率
b -基本失效率
E -环境系数
Q -质量系数:考虑不同组件的质量水平
A -应用系数:考虑对电路功能影响
C -结构系数:考虑封装影响
R -额定功率或电流系数,与最大功率或电流额定值之比
S2 -电压应力系数
可靠性预计-方法3,4
方法3
相似产品预计法
方法4
专家评分法
可靠性预计-工程要点
预计的绝对值意义不大.不同方案间预计的相对值更有意义,可比较方案的可靠性好坏.
预计时,一定要找出值相对较高的组件,并对其采取措施加以预防.
预计值必须大于规定的可靠性要求
系统可靠性预计时要注意各单元的运行比影响.
任务可靠性模型只能用于任务可靠性预计,不能用于基本可靠性预计.
基本可靠性预计是基于全串联系统的可靠性预计.
预计应与功能设计同步进行,功能设计改变,必须再次进行预计.
四、可靠性分配
可靠性分配目的
将整机可靠性要求分配到各组成单元
明确设计时对各组成单元控制的重点
可靠性分配方法
评分分配法:由专家根据各组成单元影响可靠性
的各种因素的水平进行打分,通过计算加以分配.
因素1-复杂程度。 最复杂10分,最简单1分
因素2-技术成熟度。最不成熟10分,最成熟1分
因素3-工作时间。 最长10分,最短1分
因素4-环境条件。 最恶劣10分,最不恶劣1分
设整机可靠性指标MTBF,则整机故障率s为:
第i个单元的故障率为i,则:
i=Ci s
Ci=wi/w
w—整机评分数
wi—第i个单元评分数
rij —第i个单元第j个因素评分数
评分分配法步骤:
确定待分配的可靠性指标,确定评分因素
聘请尽可能多的熟悉产品的有经验的专家,至少5名义上
设计人员向专家介绍产品
个专家独立评分
经评分处理,给出各组成单元的指标
2912
总计
800
8
10
2
5
D
192
4
8
2
3
C
640
8
10
1
8
B
1280
4
10
4
8
A
分配的故障率
各单元评分系数Ci
各单元评分数ri5
环境因素ri4
工作时间ri3
技术水平ri2
复杂程度ri1
单元名称
可靠性分配工程应用要点
用于可靠性分配的整机可靠性指标应大于规定的值,留有余量,充分考虑没有列入考虑的因素和其它的系统组成单元
通过各单元的专家评分,如简化设计,促进技术的成熟,采取措施减轻环境的影响等.
对评分高的单元采取有针对性的控制措施
五、潜在故障模式影响分析(FMEA)和故障树分析(FTA)
FMEA可以描述为一组系统化的活动,其目的是:
(a)发现和评价产品/过程中的潜在的失效及其失效后果;
(b)找到能够避免或减少这些潜在失效发生的措施;
(c)将上述整个过程文件化。
FMEA是对设计过程的更完善化,以明确必须做什么样的设计和过程才能满足顾客的需要。所有的FMEA的重点在于设计,无论是用在设计产品或工艺制造过程。
适时性是成功实施FMEA的最重要因素之一,它是一个事发前的行为,而不是“后见之明”的行动。为了达到最佳效果。FMEA必须在设计或过程失效模式被无意纳入产品或过程之前进行。事前花时间适当完成FMEA能够更容易低成本地对产品/过程进行修改,从而减轻事后修改的危机。FMEA小组应有充分的沟通和整合。
FMEA是国际上公认的有效的可靠性设计分析技术,在工程实际中得到广泛应用。目前典型的FMEA方法有两种:一种是美国军标MIL-STD-1629和我国军标GJB1391/z《故障模式、影响与危害度分析》;另一种是美国QS-9000《潜在失效模式及影响分析》。前一种方法在全国质量专业技术人员职业资格考试用书(中级)已有介绍。下面仅对QS-9000的FMEA作简要说明,在QS-9000中,把FMEA分为设计的FMEA(简称DFMEA)和过程工艺的FMEA(简称PFMEA)。下面仅对设计的FMEA作介绍。
设计FMEA主要是负责设计的工程师/小组采用的一种分析技术,用于保证在可能范围内已充分考虑到,并指明各种潜在的失效模式及其相关的起因/机理。应评估最终产品以及每个与之相关的系统、子系统和零部件。FMEA以其严密的形式总结了设计一个零部件、子系统或系统时,一个工程师和设计小组的设计思想(包括:根据以往的经验和教训,对可能出现问题的分析)。这种系统化的方法体现工程师在任何设计过程中正常经历的思维过程,并使之规范化、文件化。
设计FMEA能够通过以下几个方面支持设计过程,以降低失效的风险。
(1)有助于对设计要求和设计方案进行客观评价;
(2)有助于制造、装配、服务和回收要求的最初设计;
(3)提高设计开发过程中,考虑潜在失效模式及其对产品可靠性影响;
(4)为全面、有效的设计实验和开发项目的策划,提供更多信息;
(5)根据潜在失效模式对“顾客”的影响程度进行分级,进而建立一套设计改进、开发和验证试验的优先控制程序;
(6)为建议和跟踪降低风险的措施,提供一个公开讨论形式;
(7)为将来分析研究售后市场关切情况,评价设计更改及展开更先进的设计提供参考。
FMEA应该是一个小组的活动,负责设计的工程师应直接地、主动地联系有关部门的代表,如装配、制造、设计、分析/实验、可靠性、材料、服务等。同时还应联系系统不同层次的设计部门代表。FMEA应成为促进相关部门间充分交换意见的催化剂,从而提高整个产品的工作水平。除非负责设计工程师是有FMEA和小组协调的经验,在活动中拥有一位有经验的FMEA专家以协助FMEA小组工作是有一定帮助的。
设计FMEA是一份动态文件,且应该在一个设计概念最终形成之时或之前就开始;在产品开发各阶段中,当设计有变更或获得信息增加时要及时不断修改;在最终产品加工图样完成之前全部完成。
设计FMEA不是靠过程控制来克服设计中潜在的缺陷,但的确要考虑制造/装配过程中技术的/物质的限制。例如表面处理的限制,装配空间,公差等
设计FMEA应该从系统、子系统或零部件的框图开始分析。
QS-9000给出了设计FMEA的专用表格如表1所示,表中给出了分析时必须填写的22项内容。表中还以车门内板下部腐蚀的失效模式为例,说明如何分析及填写这22项内容。
(表1续)
下面按照表中的序号对每一项内容分别简要说明:
(1)FMEA编号。填入FMEA文件编号,以便查询。
(2)系统、子系统或零部件名称及编号。系统FMEA重点是确保所有接口和互动都涵盖了整个由不同子系统所组成的系统;子系统的重点是确保所有接口和互动都涵盖了整个由不同零组件所组成的子系统;一个零组件FMEA一般重点是在于一子系统的子组件的FMEA。
(3)设计责任。填入整个产品的部门和小组。
(4)编制人。填入负责FMEA工作的工程师。
(5)车型年度/项目。填入将使用和/或被分析的设计影响的预期车型、年度/项目。
(6)关键日期。填入DFMEA初次预定完成的日期,该日期不应该超过计划的量产设计发布日期。
(7)FMEA时期。填入编制FMEA原始稿的完成日期及最新修订日期
(8)核心小组。列出被授权以确定和/或执行任务的责任人和部门名称。
(9)项目/功能。应尽可能简洁的文字说明清楚被分析项目要满足设计意图的功能,如该项目有多种功能,且有不同的失效模式,则要把所有功能都单独列出。
(10)潜在失效模式。所谓失效模式是指系统、子系统或零部件有可能未达到(8)中所描述设计意图的种类。潜在失效模式可能是更高一级子系统或系统的潜在失效模式的原因,也可能是比它低一级的零部件潜在失效模式的后果。汽车典型的失效模式如松动、泄漏、短裂、变形、无法传递扭力等。
(11)潜在失效后果。应根据顾客可能发现或经历的情况来描述失效的后果,顾客可能是内部也可能是外部产品最终的顾客。汽车典型的失效后果如噪音、外观不良、发热、不稳定等。
(12)严重度(S)。严重度是一个已假定失效模式的最严重影响的评价等级。要降低失效后果等级只能通过设计变更。汽车推荐的FMEA严重度评价准则见下表。
(13)分类。根据特性分类,如关键、重要、一般等
(14)潜在失效的起因/机理。失效起因是指一个设计弱点的迹象,其结果就是失效模式。典型的失效起因,如规定的材料不正确,流程规范错误、规定公差不当,润滑能力不足等。典型的失效机理,如屈服、疲劳、磨损等。
(15)频度(O)。频度指在设计的寿命中某一特定失效起因/机理发生的可能性。描述频度级别数是重在其含义,而不是具体数值。通过设计更改或设计过程更改(如设计查检表、设计评审)来预防或控制该失效模式的起因/机理是降低频度级别数的唯一途径。频度级数是在FME范围中的一个比较等级,其可能无法反映出真实发生的可能性。推荐的评价准则见表3。
(16)现行设计控制。现行设计控制指的是那些已经用于相同或相似设计的那些方法。FMEA小组应一再的把重点放在设计控制的改进上,设计控制有两种基本方法:一是预防,即预防失效起因/机理或失效模式的出现,或减少其出现的频度;二是探测,即在该项目投产之前,以任何解析的或物理的方法,查出失效。应优先应用预防控制措施。因此,在表中现行设计控制对应有两栏,这有助于FMEA小组对这两种控制能有清楚的辩识。在表中的示例里,现行预防控制一栏是空的,说明FMEA小组并未鉴别出任何预防控制,这可能是由于预防控制没有被用在相同或相似的设计上。
(17)探测度(D)。探测度是结合了列在设计控制中最佳的探测控制等级。探测度是在单独的FMEA范围中的一个比较的等级。为了取得较低的探测度数值,计划的过程控制需要不断地改进。推荐的探测度评价准则见表4。
(18)风险顺序数(RPN)。风险顺序数是产品失效影响严重度(S)、频度(O)和探测度(D)的乘积。
RPN=(S)×(O)×(D)
在FMEA分析时,RPN值(1至1000之间)可被用来对设计中关注的等级排序。
(19)建议措施。在实施中,不论RPN大小如何,当严重度为9或10的失效模式必须要赋予特别注意。在所有状况下,当一个已被鉴别的潜在失效模式的后果可能对最终使用者产生危害的时候,应该考虑预防/纠正措施,以排除、减轻或控制该起因,以避免失效模式的发生。在对9或10等级严重度特别的关注之后,FMEA小组应针对其他的失效模式,以满足减少严重度、频度、以及探测度的目的。建议的措施行动如,修改设计几何尺寸/或公差、修改材料规范等。
(20)对建议措施的责任。把负责对每一项建议措施执行的组织和个人名称,预计完成日期填入本栏。
(21)采取的措施。当实施某一项措施后,简要记录具体的措施和生效日期。
(22)措施执行后的RPN。当确定了预防/纠正措施后,估算并记录执行结果的严重度、频度和探测度级别。计算并记录纠正后的RPN结果。如没采取措施,将相关的等级栏位空白即可。
所有更改后的等级都应该被评审,而且如果有必要考虑进一步的措施,则应重复该分析过程。重点应该随时放在持续改进上。
跟踪行动。负责设计的工程师负责确保所有的建议措施己被实施或已妥善地落实。FMEA是一个动态文件,它不仅应该随时体现最新的设计版本,还应该体现最新的有关纠正措施,包括开始批量生产后发生的事件。
从上述对FMEA的说明中,有几点应特别注意:
(1)FMEA是负责设计工程师应该做的一件重要的分析工作,以便随时寻找或发现潜在失效并采取措施。
(2)FMEA应该由一个有各方面代表参加的小组工作,这样才能有效和全面地发现薄弱环节。
(3)加强针对潜在失效模式的改进设计才能降低RPN值,才能提高产品可靠性。
(4)一种失效模式很有可能是由多个失效起因/机理引起的,一定要把起因/机理找准、找全。如示例中的腐蚀就有5种起因,应逐一分析透。
(5)开展FMEA时的S、O、D的数值只有相对的意义,只能比较在一个具体的FMEA时不同失效模式的相对等级和关注等级。
故障树分析是通过对可能造成产品故障的硬件、软件、环境、人为因素进行分析,画出故障树,从而确定产品故障原因的各种可能组合方式和(或)其发生概率的一种分析技术。其目的是帮助设计师判断潜在的故障,以便采取相应的改进设计措施,也可指导故障诊断,制定维修方案,同时FTA 还能计算复杂产品发生故障的概率。
故障树的建立是FTA 的关键,因为故障树的完善程度将直接影响定性分析和定量计算的结果。现以一种演绎法建树为例,作简要介绍。
首先写出顶事件(即产品不希望发生的故障事件)表示符号作为第一行,在其下面并列写出导致顶事件发生的直接原因(如硬件,软件,环境,人为因素影响)作为第二行。把这些原因因素用相应的符号表示出来,并用适合逻辑门与顶事件相连。再将导致第二行的那些故障事件(称为中间事件)发生的直接原因作为第三行,并用适合的逻辑门与相应的中间事件相连。按照这个线索自上而下步步深入。一直追溯到引起产品发生故障的全部最基本的原因(称为底事件)为止。这样就形成一棵以顶事件为“根”,中间事件为“节”,底事件为“叶”的倒立的故障树。故障树常用事件的符号见表5。
故障树中最常用的逻辑门是逻辑“与门”和逻辑“或门”。其它逻辑门在某种程度上都可以简化为“与门”和 “或门”。常用的逻辑门及符号见表6。
下面以某电机控制电路为例,说明建树过程。
某电机控制电路如图1所示,交流电源通过线路和开关控制电机的运转。
故障树分析的顶事件选择为“开关合上后电机不转”,具体的建树过程如下所述,对应的故障树如图2所示。
(1)将顶事件“开关合上后电机不转”作为输出事件,对其原因进行分析,可能的直接原因包括“电机故障”和“开关合上后无电流”,将其作为输入事件,并确定它们之间的逻辑关系为“或”,利用或门建立的故障树如图2(a)所示。其中“电机故障”作为底事件,不再展开。
故障树的建立
(2)将“开关合上后无电流”作为输出事件,对其原因进行分析,可能的直接原因包括“电源故障”和“线路故障”,将其作为输入事件,并确定之间的逻辑关系为“或”,利用或门建立的故障树如图2(b)所示。其中“电源故障”和“线路故障”作为底事件,不再展开。
(3)对事件建立定义和表达符号,如表7所示。利用符号替换文字,得到故障树的规范表达如图2(c)所示。
故障树定性分析就是寻找导致顶事件发生的原因和原因组合,即找出全部最小割集。最小割集是指一些底事件的组合。它们都发生时顶事件必然发生,而这些底事件缺一个就不会导致顶事件发生的底事件集合。求最小割集的方法有上行法和下形法两种。
在最小割集全部求出后,当可靠性数据不足时,可对最小割集和底事件进行定性分析,首先根据每个最小割集所含底事件的数目(称阶数)排列,在各个底事件发生概率较小,且相互差别不大的条件下,可以按下列原则对最小割集和底事件进行比较:
(1) 阶数越小的最小割集越重要;
(2) 在低阶最小割集中出现的底事件比高阶最小割集中的底事件重要。
(3) 在最小割集阶数相同的条件下,在不同最小割集中重复出现的次数越多的底事件越重要。
故障树定量分析是根据底事件发生概率按故障树的逻辑门关系,计算出顶事件发生的概率,以判断是否满足规定的安全性和可靠性要求。定量分析的另一个重要任务是计算底事件的重要度(即它们对顶事件发生的影响程度),从而确定改进的重点。
总之,建立故障树,定性分析,定量分析是故障树分析的三步曲。 建树是关键,建树过程中,要化简故障树,就要运用布尔代数的运算规则,对于特殊门进行等效变换以及去除明显复杂事件和明显复杂门。故障树分析,特别是复杂产品的故障树分析,建树和分析的工作是都很复杂,一般都要使用专门的故障树分析软件。
六、可靠性设计准则的
制定与贯彻
目的
通过制定并贯彻产品可靠性设计准则,把有助于保证、提高产品可靠性的一系列设计要求设计到产品中去。
依据
GJB450A-2004《产品可靠性工作通用要求》
适用对象与适用时机
产品详细设计阶段
可靠性设计准则的基本内容与特点
可靠性设计准则的基本内容
概述
目的
适用范围
依据
可靠性设计准则
(1)可靠性设计准则是进行可靠性定性设计的重要依据
(2)贯彻可靠性设计准则可以提高产品的固有可靠性
(3)贯彻可靠性设计准则是实现与产品性能设计同步的有效方法
(4)可靠性设计准则是研制经验的总结与升华
(5)可靠性设计准则对产品的适用性和针对性强
可靠性设计准则的制定
制定可靠性设计准则的依据
新产品研制开发任务书规定的可靠性设计要求;
国内外有关规范、标准和手册中所提出的可靠性设计准则等相关内容;
相似产品中制定贯彻的可靠性设计准则中的有关条款;
通过调研,了解使用人员在使用中对产品的可靠性方面需求,整理转化为可靠性设计准则;
研制单位所积累的可靠性设计经验和失败所取得的教训。
制定程序
产品可靠性设计准则的制定程序见下页图
明确产品可靠性设计准则的适用范围
制定产品产品可靠性设计准则初稿,形成产品可靠性设计准则评审稿
形成产品可靠性设计准则正式稿
可靠性设计准则的贯彻
可靠性设计准则是产品技术规范的重要组成部分,必须予以认真贯彻。
可靠性设计准则的贯彻实施流程如下图
汇总分析
开始
总师系统批准
问题处理与纠正措施
编写可靠性设计准则符合性
报告
结束
总体设计单位将产品可
靠性设计准则分发给有
关研制单位
各研制单位制定细化可靠性
设计准则,下发到设计部门
设计人员从可靠性设计准则
中选择具体设计相关条款
逐条分析准则条款确定设计
技术措施
落实设计技术措施
符合性报告评审
备注
影响
原因、意见
不符合
采取的设计措施
符合
准则条款内容
产品可靠性设计准则符合性检查报告
对于每一条设计准则,如果在设计中采用,则在“符合”栏打“√”,并在“采取的设计措施”栏填写具体的设计措施。如果未被采用,则在“不符合”栏打“√”,在“原因、意见”栏填写准则条款未被采用的原因,以及准则条款调整的建议等,在“影响”栏填写不符合该条准则造成何影响,以判断是否要进行设计更改。
按技术分类的通用可靠性设计准则
.简化设计
(a)应对产品功能进行分析权衡,合并相同或相似功能,消除不必要的功能。
(b)应在满足规定功能要求的条件下,使其设计简单,尽可能减少产品层次和组成单元的数量。
(c)尽量减少执行同一或相近功能的零部件、元器件数量。
(d)应优先选用标准化程度高的零部件、紧固件与连接件、管线、缆线等。
(e)最大限度地采用通用的组件、零部件、元器件,并尽量减少其品种。
(f)必须使故障率高、容易损坏、关键性的单元具有良好的互换性和通用性。
(g)采用不同工厂生产的相同产品成品件必须能安装互换和功能互换。
(h)产品的修改,不应改变其安装和联接方式以及有关部位的尺寸,使新旧产品可以互换安装。
.冗余设计
(a)当简化设计、降额设计及选用的高可靠性的零部件、元器件仍然不能满足任务可靠性要求时,则应采用冗余设计。
(b)在重量、体积、成本允许的条件下,选用冗余设计比其它可靠性设计方法更能满足任务可靠性要求。
(c)影响任务成功的关键部件如果具有单点故障模式,则应考虑采用冗余设计技术。
(d)硬件的冗余设计一般在较低层次(设备、部件)使用,功能冗余设计一般在较高层次进行(分系统、系统)。
(e)冗余设计中应重视冗余转换的设计。在进行切换冗余设计时,必须考虑切换系统的故障概率对系统的影响,尽量选择高可靠的转换器件。
(f)冗余设计应考虑对共模/共因故障的影响。
.热设计
(1)热设计的主要设计方法
(a)传导散热设计。如:选用导热系数大的材料,加大与导热零件的接触面积,尽量缩短热传导的路径,在传导路径中不应有绝热或隔热件等。
(b)对流散热设计。如:加大温差,即降低周围对流介质的温度;加大流体与固体间的接触面积;加大周围介质的流动速度,使它带走更多的热量等。
(c)辐射散热设计。如:在发热体表面涂上散热的涂层以增加黑度系数;加大辐射体的表面面积等。
(d)耐热设计。如:接近高温区的所有操纵组件、电线、线束和其它附件均应采取防护措施并用耐高温材料制成;导线间应有足够的间隙,在特定高温源附近的导线要使用耐高温绝缘材料。
(2)详细热设计准则(不限于以下条款)
(a)保证热流通道尽可能短,横截面要尽量大。
(b)尽量利用金属机箱或底盘散热。
(c)力求使所有的接触面都能传热,必要时,加一层导热硅胶提高传热性能。尽量加大热传导面积和传导零件之间的接触面积,提高接触表面的加工精度、加大接触压力或垫入可展性导热材料。
(d)器件的方向及安装方式应保证最大热对流。
(e)将热敏部件装在热源下面,或将其隔离,或加上光滑的热屏蔽涂层。
(f)安装零件时,应充分考虑到周围零件辐射出的热,以使每一器件的温度都不超过其最大工作温度。
(g)尽量确保热源具有较好的散热性能。
(h)玻璃环氧树脂线路板是不良散热器,不能全靠自然冷却。若它不能充分散发所产生的热量,则应考虑加设散热网络和金属印制电路板。
(i)选用导热系数大的材料制造热传导零件。例如:银、紫铜、铜、氧化铍陶瓷及铝等。
(j)尽可能不将通风孔及排气孔开在机箱顶部或面板上。
(k)尽量减低气流噪音与振动,包括风机与设备箱间的共振。
(l)尽量选用以无刷交流电动机驱动的风扇、风机和泵,或者适当屏蔽的直流电动机。
.环境防护设计
(1)防潮湿设计
(a)采取具有防水、防霉、防锈蚀的材料。
(b)提供排水疏流系统或除湿装置,消除湿气聚集物。
(c)采取干燥装置吸收湿气。
(d)应用保护涂层以防锈蚀。
(e)憎水处理,以降低产品的吸水性或改变其亲水性能。
(f)浸渍,用高强度和绝缘性能好的涂料来填充某些绝缘材料。
(2)防盐雾腐蚀设计
防止盐雾导致的电化学腐蚀、电偶腐蚀、应力腐蚀、晶间腐蚀等。
(3)防霉菌设计
(a)采用防霉剂处理零部件或设备。
(b)设备、部件密封,并且放进干燥剂,保持内部空气干燥。
(c)在密封前,材料用足够强度的紫外线辐照,防止和抑杀霉菌。
.抗冲击、振动和噪声设计
(1)抗冲击、振动和噪声设计的主要方法
(a)消源设计。如:液体火箭发动机的振动是导弹的一个主要的振源,通过消除发动机不稳定燃烧、改变推力室头部喷嘴的排列和流量,减小其振源,就能降低导弹振动的等级。
(b)隔离设计。如:采用主动隔离或者被动隔离方法将设备与振源隔离开来。
(c)减振设计。如:采用阻尼减振、动力减振、摩擦减振、冲击减振等方法消耗或者吸收振动能量。
(d)抗振设计。如:改变安装部位;提高零部件的安装刚性;安装紧固;采用约束阻尼处理技术;采用部件密封;防止共振等。
(2)具体设计准则(不限于以下条款)
(a)当激振频率很低时,应增强结构的刚性,提高设备、零部件及元器件的固有频率与激振频率的比值,以使设备和元器件的固有频率远离共振区。
(b)电子元器件的引线应尽量短,以提高固有频率。
(c)电子元器件应固定在底盘上或板上,以防止由于疲劳或振动而引起的断裂。
(d)焊接到同一端头的绞合导线必须加以固定,使其在受振动时,不致发生弯曲。
(e)接插头处尽可能有支撑物。
(f)在挠曲与振动环境条件下,尽量使用软导线而不宜用硬导线。
(g)避免悬臂式安装器件。如果采用,必须经过仔细计算,使其强度能在使用的设备最恶劣的环境条件下满足要求。
(h)模块和印刷电路板的自然频率应高于它们的支撑架的自然频率。
(i)继电器安装应使触点的动作方向同衔铁的吸合方向,尽量不要同振动方向一致。
(j)通过金属孔或靠近金属零件的导线必须另外套上防护套管
(k)对于小型电阻器、电容器尽可能卧装。在元器件与底板间用硅橡胶封装。对大电阻器、大电容器则需用附加紧固装置。
(l)对于印刷电路板,应加固和锁紧,以免在振动时产生接触不良和脱开振坏。
(m)对有减振要求的设备应具有减振装置,在安装时与系统周围结构应留有足够的间隙。
.稳定性设计
(a)电路设计时,要有一定功率裕量,通常应有20~30%的裕量,重要地方可用50~100%的裕量。要求稳定性、可靠性越高的地方裕量应越大。
(b)要避免电路的工作点处于临界状态。
(c)应对那些随温度变化其参数也随之变化的元器件进行温度补偿,使电路保持稳定。
(d)正确选用电参数稳定的元器件,避免电路产生漂移失效。
(e)应合理放宽对输入及输出信号临界值的要求。
(f)接插件、开关、继电器的触点要增加冗余接点,并联工作。
(g)每个接线板应有10%的接线柱或接线点作为备用。
(h)贮备设计应尽量采用功能冗余,当其中冗余部件失效时并不影响主要功能。
(i)信息传递不允许中断时,应采取工作贮备。
(j)使用反馈技术来补偿(或抑制)参数变化所带来的影响,保证电路性能稳定。例如,由阻容网络和集成运算放大器组成的各种反馈放大器,可以在因元器件由于老化等原因而使性能产生某些变化的情况下,仍然符合最低限度的性能要求。
(k)冗余系统和主系统的元件不能通过同一个连接器。
(l)主系统和冗余系统的电路不得通过同一条电源干线供电。
(m)与冗余系统有关的电线和设备在机械上、电气上应与主系统的电线和设备隔开,以使其他系统中发生的故障不会影响冗余系统,反之亦然。对于冗余系统线路应单独接地。
(n)在进行非电产品可靠性设计过程中,应该运用稳健性设计方法,减少产品质量特性波动、提高产品抗干扰能力。采用正交表安排试验方案,通过对各种试验方案的统计分析,找出抗干扰能力强、调整性好、性能稳定、可靠的设计方案。
安装设计
(a)各零部件、元器件、组件(特别是易损件和常拆件)的安装要简便,安装件周围要有足够的空间。
(b)系统、设备、组件的配置应根据其故障率高低、尺寸和重量以及安装特点等统筹安排。尽量做到在安装时不拆卸、不移动其它部分,在必须拆卸和移动其它部分时,要满足操作简便的要求。
(c)功能相同且对称安装的部、组、零件,应设计成可互换通用。修改设计时,应考虑同产品先后产品的替换性。
(d)安装人员的操作和工作应按逻辑和顺序安排。
(e)安装对象和安装设备应使安装人员经过适当培训即能适应安装工作。
(f)安装规程和方法应简单、明确、有效并尽量图解化,使安装人员易于理解和记忆。
(g)应避免或消除在安装操作时发生人为差错的可能,即使发生差错也能容易发觉。外形相近而功能不同或安装时容易发生差错的零、部件,应从结构上加以限制或有明显的识别标记。
(h)不允许倒装或不允许旋转某一部位安装的零件,应采用非对称安装结构。
(i)左、右(或上、下)及周向对称配置的零部件,应尽可能设计成能互换的;若功能上不互换,则应在结构、联接上采取措施,使之不会装错。
(j)在安装时可能发生危险事件的部位,须设危险警告标志。
(k)安装部位应提供自然或人工的适度照明条件。
(l)应采取措施,减少系统、设备、机件的振动,避免安装人员在超出有关规定标准的振动条件下工作。
(m)避免在两个刚性支承接头之间安装直导管。
(n)在两个允许有相对运动的接头之间不应采用铝导管。
(o)液压管路要远离人员所处的位置。
(p)液压管路必须远离排气管道、热总管、电气线路、无线电线路、氧气管道、各种设备和绝缘材料。在所有场合下,为防止导管泄漏引起着火,液压管路都要位于上述各种装置之下。
(q)不应将液压管路与其他易燃流体管路汇集在一起,以免各种不同系统相互接错。
(r)所有系统的压力管路和易着火区内的回油管路,应使用不锈钢管或钛合金管。
(s)铝合金回油和吸油管路不应布置在易着火区。
(t)管路安装应保证合适的支承间隔。
(u)导管和导管之间,导管和结构、运动部件之间,导管和其他系统之间应有合理的足够的间隙,以保证在最不利的制造公差,最严酷的环境条件,最严重变形条件下不产生相互接触和磨损。系统导管最小间隔是根据扳手(或连接相配导管的其他工具)和导管端头尺寸要求决定的。导管间的间隔应尽可能地大一些。
(v)应尽可能缩短管路长度。管路应尽可能避免通过易被损伤或环境不利于系统工作的通路。在易被损伤通路区段的导管,应采取有效的防护措施。
(w)管路不允许进入运动机构的运动区域内,并有足够的间隙。
(x)管路尽量不敷设在有较大结构变形的范围内,如在变形区内敷设管路,其间隙应予以重视。
(y)在导管用卡箍固定在结构或其他刚性零件上的地方,卡箍两边附近处导管与结构之间至少要留有6mm的间隙,而在卡箍处则至少要有3mm的间隙。在相邻零件有相对运动处,在最不利的情况下至少应有6mm的间隙。
(z)为了防止在工作中由于变形或运动而与零件的凸出部分、螺母、螺栓、卡箍或结构的锐棱相接触,与上述物体之间必须留有适当的间隙,在最不利的情况下应有不少于6mm的间隙。在卡箍间的设备与相邻结构之间一般留有至少13mm的间隙。在导管通过护孔圈的地方,应防止护孔圈偏斜,以免导管与结构接触或划伤护孔圈。
1)液压附件、导管及连接件与操纵系统的钢索和联动装置至少相距25mm;所有接头和连接点离开交叉点至少50mm。液压管路与电气线路至少相距50mm,且液压管路应装在电气线路的下方。要固定交叉的液压管路,并至少保持6mm的距离。
2)在两个刚性连接中间的软管可根据需要加上必要的支承,但不能用紧而硬的卡箍在外径上进行刚性固定。如两个刚性连接中间的软管必须做轴向移动,在中间只能采用如滑动尼龙块型卡箍那样型式的固定装置,这种装置不会使软管管套磨坏。
3)为减少接头数量,减轻重量,减少泄漏点,应使接头间的导管尽可能长一些。
4)直接头、弯接头、三通接头等零件一端或另一端的管路在150mm内应有支承。
5)旋转接头的设计应尽可能地考虑液压平衡,以减小接合处的磨损和消除端部载荷。
6)旋转接头的安装需特别的仔细,除保证在安装的过程中不损坏密封胶圈外,还需保证有良好的对中,并在设计的活动范围内转动自如。接头不承受非转动平面内的力,拐折可能会使密封处漏油而影响液压系统的正常工作。为了避免振动的不利影响,应尽可能对转动接头作刚性固定。
7)结构装配应合理确定装配顺序,以免使设计时按装配基准合理分配零件制造容差而确定的设计间隙及其位置改变,在新的位置形成间隙。
8)应根据间隙大小,零件的刚度和材料性能,采取恰当的工艺补偿措施排除或减小间隙,控制强装应力,以防止应力腐蚀开裂。
9)为防止应力腐蚀开裂,应控制强装应力不大于倍的应力腐蚀许用应力。在结构设计时,可采取较保守而简便控制办法:对于铝合金,不计其他残余应力值,也不分材料牌号,其纵向和长横向的强装应力均不得超过40MPa;或是依材料牌号,控制其纵向和长横向的强装应力,不得超过相应的许用临界应力的40%。但在短横向均不允许有强装应力。
原材料、零部件和元器件选用
(a)设计选材要满足武器产品在作战战场的使用要求,注重发挥轻质材料在结构设计中的作用,注重材料对各种严酷环境下产品可靠性的保证、注重材料改善人机环境的效能。
(b)材料选用不仅要考虑满足各零、部件的性能要求即满足整机的各分功能要求,还应考虑各零、部件对整机性能或者其它零(部)件分功能的影响。
(c)设计选材应遵循标准化、通用化和系列化。
(d)设计选材应首先择优选用已纳入国标、国军标的材料。
(e)对于设计中可能遇到的国外牌号材料,应首先在国内牌号中进行筛选,尽量作好国内牌号材料的替代。对于不能替代的国外牌号材料,在设计选材时也应注意材料标准的转化。
(f)工程设计应对材料的牌号、品种、规格进行综合分析,力求通用。
(g)应注意所选材料的制造加工性能,包括锻造性能、切削性能、热处理工艺性能等。
(h)考虑材料应用技术的成熟程度。
(i)在选用新材料时,设计评审中要重视新材料应用可行性评审,对重要新材料应用必须经过验证。
(j)结构材料在其预期的结构使用寿命期内对裂纹应具有高的耐受能力,并且在使用环境下,应耐受脆性裂纹扩展。
(k)选材时应考虑材料强度、塑性的合理配合。如,承受交变载荷零件上带有尖锐缺口造成高应力集中,有可能使原来整个结构承受的低应力高周疲劳,在缺口局部成为高应变塑性疲劳载荷。可采用局部复合强化方法,使缺口处的塑性应变减小以致消除,提高局部有效承载能力。
(l)根据零部件、元器件优选清单,选择成熟的零部件和元器件。
(m)对零部件进行必要的筛选、磨合。
(n)对元器件进行二次筛选。
(o)选用的零部件应满足使用环境(防盐雾、防酶菌等)要求。
(p)关键零部件应列出清单,严格控制公差精度。
(q)应采用陶瓷、金属、玻璃封装的器件,不允许采用塑料封装的器件。
(r)对关键件、重要件,若选用国产元器件,应选用符合国军标和《七专》管理办法生产的元器件。
(s)元器件的质量等级必须满足军品要求。
. 包装、贮存、装卸与运输设计
. 1包装设计
包装方式应与产品预定的运输方式和贮存方式相协调。
产品的包装应便于启封、清理和重封。
产品的包装应便于装卸、储运和管理,并且在正常的装卸、储运条件下,保证其自发货之日起,到预定储运期内,不因包装不善而致使产品产生锈蚀、霉变、失效、残损和失散等现象。
确定包装方式时,应考虑下列因素:
运输部门对产品(或包装件)的尺寸、重量、重心以及堆码等方面的限制;
产品的物理特性:宽度、高度、长度、重量和重心等;
产品所承受的应力特性:冲击应力、振动、挠度和表面负荷等;
产品的运输、保管和使用的环境条件:温度、湿度、压力、盐雾和清洁度等;
危险影响:人员安全、泄漏、辐射、静电、爆炸物和生物学因素等;
现有的包装储运条件。
防护包装和装箱等级应符合相关的规定。特殊情况下,应设计特殊防护程序,以保证产品在全寿命过程中始终处于良好状态,如;
飞行器在水运、空运或在特定场所贮存时的防护程序;
坦克及其他大型车辆在储备地点贮存时的防护程序;
舰船上的重要设备在船坞或在舰船上安装期间<含战备贮存期间)的防护程序;从舰船上卸至岸上作战备贮存的设备的防护程序。
贮存方式设计
(a)应按依据产品预期的使用和维修要求以及技术状态特性确定贮存方式。贮存方式包括库房、露天加覆盖物、露天不加覆盖物、特殊贮存等。
(b)贮存方式应与产品的包装防护等级相协调。
(c)确定采用特殊的贮存方式时,应充分考虑各种因素,并进行仔细权衡。例如航空导弹在舰上贮存时,应慎重考虑是否需要空调、隔离设施等情况。
(d)应进行贮存任务分析,确定各维修级别贮存设施的组成和样式及所需空间。
(e)应参照有关规定,并结合实际贮存环境条件,协调确定出贮存设施的贮存等级环境。
(f)贮存设施应具备相应的防潮、防霉、防盐雾、防冻、防火、防静电、防辐射、防爆、防震等防护措施。
(g)对长期贮存一次使用的产品应进行贮存设计(选择合适的材料和零部件、采用防腐的措施等)、控制贮存环境、改善封存条件等减少贮存环境的故障,以确保产品处于良好的待用状态。
.装卸方式设计
(a)要依据被装卸物品的重量、尺寸、易损性和安全要求和现场条件,进行适宜的机械装卸或人工装卸方式设计。
(b)被装卸物品上应有挂钩、起吊、限位,防止跌落、碰撞、压损等标记或有关文件、规范的规定,确保装卸安全可靠性,避免因装卸不当而造成的损失。
.运输方式设计
A)在保证任务要求的情况下,应进行符合运输要求的运输方式设计。产品的运输方式包括公路运输、铁路运输、航空运输和水路运输等。
B)对下列产品应进行运输装载加固设计:
(a)难运输产品;
(b)敞运产品(不论是否使用了包装容器);
(c)非箱装产品;
C)应考虑运输过程中适当的防护措施、安全措施及应急措施,如产品的防震、防火、弹药产品以及其它易燃、易爆、腐蚀性及放射性等产品运输过程中的安全措施和应急措施。
.电磁兼容设计
(a)在电气、电子设备及系统的设计中应满足系统电磁兼容性设计要求,电磁发射和敏感度要求按GJB 151A,电磁发射和敏感度测量按GJB 152A。
(b)应避免信号与电源电路共用地线,并应对信号提供有效屏蔽,避免电磁干扰的影响,或将其影响减到可以接受的程度。
(c)高电压、强辐射部位,应有明显的标志或说明,采取有效防护或屏蔽措施。
(d)禁止把电源线和信号线的端头接在连接器的相邻的插孔上。电路的输入输出不能相邻。
(e)应采取有效的保护措施,防止电路中瞬变现象及静电放电而造成部件或设备的损坏。
(f)布线尽量采用母线板或薄膜电缆,保证良好的重复性和一致性。
(g)尽量缩短导热通道的长度,以便减少电路的温度梯度,提高电路的电磁兼容性。
6,11 按产品结构分类的通用可靠性设计准则
6,.总体可靠性设计
(a)应将产品的可靠性要求转化为可考核验证的可靠性设计要求,作为可靠性设计依据。
(b) 总体应根据寿命剖面、任务剖面确定载荷谱、工作模式和环境条件,确定应力条件。
(c)应对性能、可靠性、维修性、安全性、经济性等指标进行综合权衡。
(d)对已投入使用的相似产品,应对其常见故障模式、薄弱环节及对可靠性有显著影响的因素等进行分析,确定提高当前研制产品可靠性的有效措施。
(e)应对可能危及安全的主要故障模式进行分析,提出消除不安全因素的措施。
(f)严重影响任务可靠性的主要装置应有完全独立的应急设施。
(g)对影响产品安全的关键系统应进行冗余设计。
(h)对于一旦发生故障易引起严重后果的零部件、不易接近检查的部件应进行高可靠性设计。
(i)应进行系列化设计。在原成熟产品上逐步扩展构成系列,优先选用经过充分验证、技术成熟的设计方案,提高产品设计的继承性,不能采用未经验证的新技术、新工艺、新材料。
(j)严格控制新技术采用比例,新技术系数一般情况不应高于20%。
(k)应制定元器件优选清单,严格控制元器件的选择。
(l)在满足技术性能要求的前提下,应使简化设计,减少零部件、元器件的规格、数量,并满足标准化、通用化要求。
(m)产品设计时应考虑生产工艺对产品可靠性的影响。
(n)零件应有合理的设计基准,并尽量与工艺基准一致。
(o)充分考虑人机工程学要求。产品的噪声、振动、照明、温度等条件,都应在人体的承受能力范围内。各种操纵装置的操纵力、操纵行程、机件的重量等都应在人力所能及的范围之内。
(p)当系统、分系统的重要工况参数超过正常范围时,应设有报警信号或显示装置。
(q)应考虑环境对产品可靠性的影响,进行环境防护设计,尤其是防盐雾、防腐蚀、防潮湿、防霉菌设计等。
(r)设计应使产品能满足在预期的极限环境中或产品诱发的极限环境中工作。
(s)总体设计应使人员不会接近高温、有毒性的物质和化学制剂、放射性物质以及处于其他有危害的环境。否则,应设防护与报警装置。
(t)尽量避免采用在工作时或在不利条件下可燃或产生可燃物的材料;必须采用时,应与热源、火源隔离。
(u)对可能发生火险的器件,应该用防火材料封装。容易起火的部位,应安装有效的报警器和灭火设备。
(v)通过高温区的所有管、线及其设施要具有耐高温措施或防护装置。
(w)应进行接口可靠性设计,保证接口局部故障不会引起故障的扩散。
(x)应考虑安装对产品可靠性的影响,避免由于安装设计不当而引起的定位困难、安装差错、相互之间干涉等。
(y)设计中应考虑功能测试、包装、贮存、装卸、运输、维修对可靠性的影响。
6,.电子产品可靠性设计
(a)尽量实施通用化、系列化、模块化设计;采用成熟的标准零部件、元器件、材料等。
(b)采用新技术、新工艺、新材料、新元器件时,必须经验证合格,提供论证、验证报告和通过评审或鉴定。
(c)应对电子、电气系统和设备进行电/热应力分析,并进行降额设计。电子元器件应遵照国军标GJB/Z 35元器件降额准则的要求进行降额使用。
(d)应根据产品元器件大纲和产品元器件优选目录的要求进行元器件的选择和控制。
(e)应选用军用等级并符合相应的国军标要求的元器件,如:
半导体分立器件应符合GJB33的要求。
微电路应符合GJB597 的要求。
(f)应当按最恶劣的气象条件和作战条件设计产品及其有关硬件,使之具有在严酷条件下正常工作的能力。
(g)为保证运输和储存期间的可靠性,产品在出厂时应按有关标准进行包装,做到防潮、防雨、防振、防霉菌等。
(h)产品内各单元之间的接口应密切协调,确保接口的可靠性。
(i)系统某一部件或设备的故障或损坏不应导致其它部件或设备的故障。
(j)硬件、软件都应尽量标准化。
(k)应进行简化设计,在简化设计过程中应考虑:所有的部件和电路对完成预定功能是否都是必要的;不会给其它部件施加更高的应力或者超常的性能要求;如果用一种规格的元器件来完成多个功能时,应对所有的功能进行验证,并且在验证合格后才能采用。
(l)应保证一个模块的故障只影响本模块的输出,以使备份功能不受其影响,同时可降低线路的复杂性,提高可靠性。
(m)当采用简化设计、降额设计、选用高可靠性的零部件、元器件及设备等措施仍然不能满足任务可靠性和安全性要求时,应在体积、重量、费用与可靠性等之间进行权衡,采用必要的冗余设计。
(n)元器件、接插件、印制板应有相应的编号,这些编号应便于识别。某些易装错的连接件和控制板应有机械的防错措施,如采用不同产品或不同形状的接插形式。具有安装方向要求的结构件也应有防差错措施。
(o)电线的接头和端头尽可能的少,电缆的插头(座)及地面检测插座的数量也应尽量少。
(p)应尽可能地使用固定式而不是可变式(或需要调整的)的元器件(例:电阻器、电容器、电感线圈等)。
(q)所有电气接头均应予以保护,以防产生电弧火花。
(r)对电气调节装置(导电刷与滑环),电动机件(微电机等)、指示器和传感器应尽量加以密封并充以惰性气体,以提高其工作可靠性与寿命。
(s)电路设计要考虑输入电源的极性保护措施,保证一旦电源极性接错时,即使电路不能正常工作,也不会损坏电路。
(t)根据需要电缆应该合理组合成束、或分路、或互相隔开,以便载有大电流的电缆发生故障时,对重要电路的损害能减至最低限度。
(u)应防止因与各种多余物接触造成短路。
(v)电路设计应考虑到各部件的击穿电压、功耗极限、电流密度极限、电压增益的限制、电流增益的限制等有关因素以确保电路工作的稳定性和减少电路故障。
(w)电子、电气设备应规定装配方法及程序,以防止在装配过程中损坏元器件。
(x)对重要结构件应进行损伤容限及耐久性设计。
(y)对轴承、电机、及其它各种结构等应选用足够的安全系数,以确保安全。
(z)线束的安装和支撑应当牢固,以防在使用期间绝缘材料被磨损,在强烈振动和结构有相对运动的区域中,要采用特殊的安装预防措施,包括排得很密的支撑卡箍来防止电线磨损,连接在运动件上的电线,要防止电线与运动件的相对运动。
6,. 机械产品可靠性设计
(a)在满足功能和性能要求的前提下,机械设计应尽可能考虑采用简单结构形式,减少不必要的环节,部组件之间的装配关系和传力路线应尽可能简化。
(b)关键设计变量应进行灵敏度分析,考虑外部条件的变化对设计的影响。
(c)构件设计时尽量减少应力集中,减少或避免附加弯矩,控制应力水平。
(d)机械结构应进行应力—强度优化设计,找出应力与强度的最佳匹配。
(e)承受动载的重要结构,应进行动力响应分析,模态分析,动强度校核,以及可靠性分析。
(f)应进行结构裕度设计,可通过提高平均强度、降低平均应力、减小应力变化和减小强度变化来实现。
(g)为防止某个构件失效引起的连锁失效,在设计时应采用:止裂措施;多路传力设计;多重元件设计等。
(h)大型复杂结构设计时,应进行结构刚度和可靠性设计,提高抗弯和抗扭刚度。结构必须能够承受限制的峰值载荷而不产生有害变形。
(i)应考虑公差配合和表面粗糙度对可靠性的影响。
(j)正确选择结构的表面处理方法,如正确选择金属镀层及化学处理方法,优选防腐漆、防霉剂等。
(k)严格控制结构的相对位置,考虑在静力、热力和动力下产生变形对可靠性的影响。
(l)相邻结构若有较大温差,设计时必须注意因热变形引起过应力而发生松脱、涨裂等故障。
(m)应进行环境防护设计,特别是暴露于恶劣环境的关键机械结构。
(n)为了提高抗振动、抗冲击的能力,应尽可能使产品小型化,使产品结构紧凑和惯性力小。
(o)紧固件建议采用系留式结构。
(p)机械防松结构可广泛采用防松性能好的紧固件,如错齿垫圈、尼龙圈螺母、钢丝螺套等。
(q)应保证受力较大的锻件关键部位流线方向与最大拉应力方向一致。如,航空零件中承受高应力部位上的金属流线,必须与主应力方向平行,不能有穿流和明显的涡流。
(r)焊接件应具有可焊性,焊缝的布置应有利于减小焊接应力及变形,便于采用自动、半自动焊。应合理确定焊接接头的形式、位置和尺寸。
(s)抗电磁干扰的结构设计所选用的材料和结构形式应对电磁发射和敏感性产生固有衰减,使得设备既能满足抗电磁干扰要求又不会降低其它机械要求。
(t)机构设计要有适宜的防磨损措施或采用安全裕量准则。
(u)对易磨损的部位,要选择耐磨损的材料,并要采用防磨损的结构设计。
(v)机构设计要有适宜的防卡滞措施。卡滞失效指机构在需要运动或起动时,被卡住或动作滞慢至不能接受的程度。
(w)机构设计要防运动终止产生过大冲击。为防止因终止运动过大的冲击载荷引起结构变形或破坏发生,对于终止阶段的速度变化应有一定的要求,在需要时配合一定的缓冲装置。
(x)连接解锁机构的高强度钢连接件的工艺选择须防止脆性断裂。
(y)真空低温情况下,运动副要有防冷焊设计措施;高低温交变情况下,运动副间隙及材料间膨胀系数应匹配。
(z)尽量继承成熟技术或成熟产品,并采取合理的冗余设计措施。
. 实施要点
(a)研制单位应该根据产品特点,制定相应的产品可靠性设计准则。
(b)可靠性设计准则应该充分吸收国内外相似产品设计的成熟经验和失败教训。
(c)应保证可靠性设计准则的贯彻实施与产品的性能设计同步。
(d)设计人员必须在产品设计过程中逐条对可靠性设计准则予以贯彻落实,并分阶段(初步设计阶段、详细设计阶段)写出设计准则符合性报告。
(e)当产品设计更改时,应该重新进行可靠性设计准则的符合性检查。
(f)当外购成品存在严重违反可靠性设计准则的情况时,应分析对系统的影响,并采取必要手段在系统设计中予以补偿。
(g)可靠性设计准则应该逐步完善,即根据产品研制情况增加有效的条款和去除无效的条款。
(h)可靠性设计准则的内容应该具有可操作性,便于设计人员贯彻。
七、电路容差分析
目的
分析电路的组成部分在规定的使用温度范围内其参数偏差和寄生参数对电路性能容差的影响,并根据分析结果提出相应的改进措施。
依据
GJB450A-2004《产品可靠性工作通用要求》
GJB/Z89-97《电路容差分析指南》
适用对象与适用时机
电路容差分析主要适用于系统内的关键电路。电路容差分析工作应在产品详细设计阶段已经具备了电路的详细设计资料后完成。
.电路性能参数发生变化的原因
电路性能参数发生变化的主要表现有性能不稳定、参数发生漂移、退化等,造成这种现象的原因有:
组成电路的元器件参数存在着公差
环境条件的变化产生参数漂移
退化效应
电路容差分析程序
电路容差分析的流程图,其主要步骤如下。
电路容差分析流程
(1)确定待分析电路
严重影响产品安全的电路;
严重影响任务完成的电路;
昂贵的电路;
采购或制作困难的电路;
需要特殊保护的电路。
(2)明确电路设计的有关基线:
被分析电路的功能和使用寿命;
电路性能参数及偏差要求;
电路使用的环境应力条件(或环境剖面);
元器件参数的标称值、偏差值和分布;
电源和信号源的额定值和偏差值;
电路接口参数。
(3)电路分析
对电路进行分析,得出在各种工作条件及工作方式下电路的性能参数、输入量和元器件参数之间的关系。
(4)容差分析
容差分析包括:
(a)适当选择一种具体分析方法;
(b)求出电路输出性能参数的偏差范围,找出对电路性能影响敏感度较大的参数并进行控制,使电路满足要求。
(5)分析结果判别
偏差范围与电路性能指标要求相比较,比较结果分两种情况:
(a)符合要求,则分析结束;
(b)若不符合要求,则需要修改设计,直到所求得的电路性能参数的偏差范围完全满足电路性能指标要求为止。
最坏情况分析法
最坏情况分析法是分析在电路组成部分参数最坏组合情况下的电路性能参数偏差的一种非概率统计方法。它利用已知元器件参数的变化极限来预计系统性能参数变化是否超过了允许范围。最坏情况分析法可以预测某个系统是否发生漂移故障,并提供改进的方向,但不能确定发生这种故障的概率。该法简便、直观,但分析的结果偏于保守。
(1)计算模型
应用最坏情况分析法的基础是建立数学模型,就是把电路性能参数 表示为设计参数 的函数,即:
(*)
为了便于分析,最坏情况分析法采用灵敏度来度量设计参数偏差对电路性能参数的影响。设计参数的灵敏度计算公式如下:
式中: ——性能特征值对设计参数的偏导数;
下标“0”——标称值。
灵敏度还可以表达为:
式中: ——电路性能参数的标称值;
——设计参数 的标称值;
——设计参数的偏差;
——电路性能参数的偏差。
在确定了灵敏度的基础上,计算性能参数最大偏差的方法包括线性展开法和直接代入法两种。
1)线性展开法
电路性能参数的偏差可以采用下式进行估算:
偏差的确定方法如下:在求电路性能参数偏差的正
极限值时,若 ,则 ;
若 ,则 。
在求偏差的负极限值时,若 ,则 ;
若 ,则 。
2)直接代入法
直接代入法是将设计参数的极限值按最坏情况组合直接
代入电路的函数表达式(*)中,求出性能参数的上限值和
下限值。
在求电路性能参数的上限值时,若 ,则参数
取 ,若 ,则参数 取 。在求电路性能参数的
下限值时,若 ,则参数 取 ,若 ,则参
数 取 。
(2)实施步骤
采用最坏情况分析法进行电路容差分析的实施步骤如下:
(a)确定电路设计参数的标称值和偏差(或者参数变化范围);
(b)推导出电路性能参数与设计参数之间的函数关系;
(c)计算各个设计参数的灵敏度;
(d)在容差分析精度要求不高时,采用线性展开法计算出电路性能参数的偏差;在容差分析精度要求较高时,采用直接代入法计算出电路性能参数的偏差。
(3)计算示例
某串联调谐电路在组成上包括:1个5010%H的电感器和1个305%pF的电容器。要求最大允许频移为,试采用最坏情况分析法进行容差分析,确定出谐振频率的偏差量,并判断是否满足要求。
(a)电路设计参数的标称值和偏差量如下所示:
5%
30pF
C
电容量值
2
10%
50H
L
电感量值
1
偏差范围
标称值
参数标识
参数名称
序号
(b)建立电路的函数关系。谐振频率与电感L和电容C之间的函数关系如下所示:
(c)计算各个设计参数的灵敏度,如下:
(d)采用直接代入法计算电路性能参数偏差。
将L=50H和C=30pF代入计算公式,得到谐振频率标称值:
将L=45H和C=代入计算公式,得到谐振频率的上限值:
将L=55H和C=代入计算公式,得到谐振频率的下限值:
因此,谐振频率的偏差值为:
由于计算出的偏差值大于允许要求,因此该设计方案不能满足容差要求。
仿真方法
目前很多EDA(电子设计自动化)软件都具有仿真计算和容差分析功能。
为了进行计算机仿真,必须首先建立待分析电路的仿真模型,即利用软件提供的工具,建立待分析电路的原理图,并进行初步的电路功能仿真,验证建立的原理图与待分析电路的一致性。然后可以根据需要选择进行最坏情况分析、蒙特卡罗分析,或者环境温度影响分析。
各种方法的适用性
下表给出各种容差分析方法的优缺点和适用范围。应根据电路的特点、复杂程度、经费以及已有的条件,按下表来选择容差分析方法。
模拟电路
计算过程
费时
可以检验
电路的温
度适应性
不同温度下
的电路性能
参数值
√
环境温度
影响分析
法
模拟电路
计算过程
费时
最接近实际
情况
电路性能参
数的分布特
性
√
蒙特卡罗
分析法
模拟电路
分析结果偏
于保守
可以得到
灵敏度数
值
电路性能参
数偏差
√
√
最坏情况
分析法
模拟电路
计算过程复杂
计算原理
简单
电路性能参
数均值、方
差
√
阶矩法
软件仿真
手工计算
适用范围
缺点
优点
分析结果
应用方式
方法
八、元器件降额设计
.目的
通过设计有意识地降低元器件工作时实际承受的应力,以降低元器件的失效率,提高产品可靠性。
.依据
GJB/Z3593《元器件降额准则》
.元器件降额设计的一般要求
a)确定产品用的元器件应采用的降额等级、降额参数和降额因子(系数)。
b)降额量值允许做适量调整。但对关键元器件应保证规定的降额量值。
c)降额有一定的限度,通常标准(包括本手册)给出的降额范围是最佳的,过度的降额会使效益下降,产品的重量、体积和成本增加,有时还会使某些元器件工作不正常。不应采用过度的降额来弥补选用低于要求质量等级的元器件;同样,也不能由于采用了高质量等级的元器件,而不进行降额设计。
d)国产元器件降额设计可按国产元器件降额要求(摘自GJB/Z35)进行,适用降额的元器件见表1。国外(美国)元器件降额设计可按国外(美国)元器件降额要求(摘自美国国防部可靠性分析中心)进行,适用降额的元器件见表2。
CA
钽电解质
大规模
集成电路
CD
铝电解质
HE
(薄膜)
CZ、CL
纸/塑料薄膜
HHW
混合电路
(厚膜)
CC、CT
瓷介
HC
(MOS型)
CY
云母
IS
数字电路
(双极型)
CO
玻璃釉
电
容
器
CM
(模拟开关)
WT、WX
线绕
JW
(电压调整器)
WDJ、WJ
非线绕
电位器
FX、JJ
(比较器)
MF、MZ
热敏
电阻器
JF
模拟电路
(放大器)
集
成
电
路
产品
元器件类型
元器件种类
产品
元器件类型
元器件种类
表1 国产适用降额的元器件一览表
KX
旋转式
BT、GH
光电器件
KNE、MJK
钮子、拨动式
开
关
3CT、KK
可控硅
(晶闸管)
JGC
舌簧式
固体式
2CW、2DW
基准二极管
JRC、JRW
衔铁式
继电器
WH、WY
微波二极管
RC
变压器
2CZ、2CK
普通二极管
LG
线圈
电感元件
CA 、 WD
微波晶体管
CWB、CCW
微调
电容器
3CA、3CK
晶体管
半
导
体
分
立
器
件
续表1 国产适用降额的元器件一览表
行波管
SMA、BMA
同轴式
阴极射线管
电真空器件
PDS
印制线路板用
CR、JA
ZPB、ZWC
晶体谐振器
晶体振荡器
晶体滤波器
晶体
P、XK
普通型
电连接器
RX
线绕
RN、BW
电阻网络
RJ
薄膜
AN、KAL
KW、WWK
按钮式
微动式(敏感)
开关
RH
合成
固
定
电
阻
器
续表1 国产适用降额的元器件一览表
光纤连接器
计时器
光纤/光缆
分解器
光纤探测器
自整角机
光纤光源
纤维光学器件
ZD、SJD
电机
旋转电器
SBP、UE
声表面波器件
导线
速调管
多股电缆
磁控管
电真空器件
同轴电缆
导线与电缆
续表1 国产适用降额的元器件一览表
续表1 国产适用降额的元器件一览表
电流限制
快动作(特种)
惯性
难熔
GB
NB
TB
正常
保险丝
热补偿型
*表中仅列入1~2个产品。
白炽灯
灯泡
表2 美国适用降额的元器件一览表
RER
RWR
功率线绕
单片微波电路
RBR
精密线绕
(双极型)
RTH
热敏
微处理器
(MOS型)
RJR
可变
(双极型)
RNR
RLR
薄膜
存储器
(MOS型)
RCR
合成
电
阻
器
MIL-I-38510
(双极型)
1 N
(整流)
MIL-I-38510
数字电路
(MOS型)
1 N
(肖特基/PIN)
MIL-I-38535
(双极型)
1 N
(光电管)
MIL-I-38535
线性电路
(MOS型)
集
成
电
路
产品或标准
元器件类型
元器件种类
产品或标准
元器件类型
元器件种类
MIL-C-39010
线圈
TF、TP
脉冲变压器
电感元件
1N
(微波)
CV
可变瓷介
1N
(瞬态抑制型)
PC
可变柱塞
1N
(基准型)
CSR
CWR
固体钽
1N
(电压调整型)
CLR
CRL
非固体钽
MIL-S-19500
1N
二极管
(信号/开关)
CE
CUR
铝电介质
2 N
微波晶体管
(硅双极型)
CDR
CCR
瓷介
2 N
(J型场效应管)
CHR
CMR
CYR
薄膜
云母
玻璃釉
电
容
器
2 N
(金属氧化物场效应管)
RZ
电阻网络
(厚/薄膜)
MIL-S-19500
2 N
晶体管
(硅双极型)
半
导
体
分
立
器
件
续表2 美国适用降额的元器件一览表
续表2 美国适用降额的元器件一览表
MIL-I-6363
白炽灯
氖灯
灯泡
电机
自整角机
计时器
旋转器件
电缆
光导纤维
MIL-C-38999
MIL-C-83513
电连接器
电连接器
MIL-S-24317
MIL-S-93731
开关
开关
MIL-R-6106
MIL-R-39016
MIL-R-28750
继电器
继电器
产品或标准
元器件类型
元器件种类
MIL-F-15733
电子滤波器
MIL-C-3098
石英晶体
MIL-F-5372
MIL-F-23419
保险丝
MIL-C-39019
电路断路器
其他
1 N
注入式激光二极管
1 N
光电二极管
1 N
雪崩光电二极管
2 N
光电晶体管
半导体光电器件
声表面波器件
电真空器件
续表2 美国适用降额的元器件一览表
. 推荐的降额等级
(1)降额等级的划分
降额等级表示产品中元器件降额的程度。
最佳降额范围内划分了三个降额等级,具体划分情况见下表。
三个降额等级的划分情况
较低
中等
略高
降额增加费用
容易
一般
较难
降额设计的实现
5.设备内部的结构紧凑,散热条件差
4.故障设备的维修费用较高
4.故障设备无法或不宜维修
3.故障设备可迅速、经济地加以修复
3.采用某些专门设计
3.采用新技术、新工艺设计
2.采用成熟的标准设计
2.对设备有较高可靠性要求
2.对设备有高可靠性要求
1.设备故障不会造成人员和设备的伤亡和破坏
1.设备故障引起产品与保障设备损坏
1.设备故障导致人员伤亡或产品与保障设备的严重破坏
适用情况
较小
适中
最大
元器件使用可靠性改善
最小
中等
最大
降额程度
III级
II级
I级
降额等级
情况
(2)推荐应用的降额等级
A) 我国标准GJB/Z35-93对不同类型产品推荐应用的降额等级见下表。
I
II
III
III
III
III
III
I
I
I
I
I
I
II
航天器与运载火箭
战略导弹
战术导弹系统
飞机与舰船系统
通信电子系统
武器与车辆系统
地面保障设备
最 低
最 高
降 额 等 级
应 用 范 围
不同类型产品应用的降额等级
B) 美国罗姆空军发展中心(RADC)对不同应用范围推荐的降额等级见下表。
III
II
I
I
地 面
飞 行
空 间
导弹发射
降 额 等 级
环 境
RADC推荐的降额等级
(3)产品降额等级的确定
为了使降额等级的确定更为合理,美国国防部RAC提出降额等级确定的考虑因素及其计分情况见表6及表7。
1
2
3
·采用标准的元器件能完成的设计
·有高可靠性要求需进行专门的设计
·采用新概念、新工艺的设计
可靠性
分 数
情 况
因 素
表6 元器件降额等级确定的考虑因素及计分
续表6 元器件降额等级确定的考虑因素及计分
1
2
3
·修理费用低,通常备件费用也不高
·修理费用可能高或备件费用高
·对各系统要求备有全部的替换产品
寿命周期内
修理的费用
1
2
3
·通常没有对设计者特殊的限制
·进行专门的设计并对满足设备尺寸、重量要求有一定有困难
·要求设计紧凑
尺寸、重量
1
2
3
·通常对安全不会有影响
·为了安全系统或设备可能要较高的成本
·可能危及人员生命
安全
1
2
3
·能很容易、很快和经济地对系统进行维修
·系统维修费用高,对维修有一定限制,要求高的维修技术以及只允许很短的维修时间
·对不可能进行维修的设备系统或者难以承受的维修费用
系统维修
6或6以下
III
7—10
II
11—15
I
总 计 分 数
降 额 等 级
表7 降额等级与计分的关系
图中
TA——环境温度, TC——晶体管壳温。
(4)某型晶体管降额等级确定示例
图1 某晶体管失效率变化与降额系数关系曲线
电源电压、输入电压、输出电流、功率、最高结温☆
电源电压、输入电压、输入输出电压差、输出电流功率、最高结温☆
放大器
比较器
模拟开关
电压调整器
模
拟
电
路
主要降额参数和关键降额参数
元器件类型
.元器件的降额参数
(1)元器件主要降额参数和关键降额参数见表。
电压(不包含稳压管)、电流、功率、最高结温☆
最高结温☆
普通
微波、基准
二极管
反向电压、电流、功率、最高结温☆、功率管安全工作区的电压和电流
最高结温☆
普通
微波
晶体管
最高结温☆
大规模集成电路
频率、输出电流、扇出、最高结温☆、电源电压
双极型
MOS型
微处
理器
频率、输出电流、最高结温☆、电源电压
双极型
MOS型
存储器
厚、薄膜功率密度、最高结温☆
混合集成电路
频率、输出电流、最高结温☆、电源电压
电源电压、输出电流、频率、最高结温☆、电源电压
双极型
MOS型
数字电路
直流工作电压☆、环境温度
热点温度☆、电流、瞬态电压/电流、介质耐压、扼流圈电压
触点电流☆、触点功率、温度、振动、工作寿命
触点电流☆、触点电压、功率
工作电压、工作电流☆、接插件最高温度
电压、电流☆
工作温度☆、负载、低温极限
工作电压☆、工作电流☆
电流☆、环境温度
电流☆
最低温度、最高温度☆
电容器
电感元件
继电器
开 关
电连接器
导线与电缆
旋转电器
灯 泡
电路断路器
保险丝
晶 体
电压、功率☆、环境温度
功率☆、环境温度
电压、功率☆、环境温度
电阻器
热敏电阻器
电位器
电压、电流、最高结温☆
半导体光电器件
电压、电流、最高结温☆
可控硅
环境温度☆
光纤连接器
环境温度☆、张力、弯曲半径
光纤与光缆
反向压降☆、结温
探测器
输出功率、电流☆、结温
光源
纤维光学
器件
输入功率☆
声表面波器件
温度☆
温度、输出功率☆、反射功率、占空比
阴极射线管
微波管
电
真
空
器
件
注:☆为关键降额参数
. 元器件的降额因子及应用
降额因子(降额系数)是指元器件工作应力与额定应力之比,一般用符号S来表示。
. 元器件生产厂对元器件参数额定值的变更
有些元器件其生产厂规定了在不同的使用条件下,对原先规定的额定值要作变更的内容,
如:
(1) 半导体分立器件
一些二极管、晶体管和可控硅等器件在不同使用条件下要变更其额定值。例如:硅外延平面大电流开关二极管,虽规定工作环境温度为-55~125℃,但其正向平均电流IF在环境温度TA超过75℃后,其额定值要降低,见图2。
IF/A
1
其他如晶体管和可控硅等器件,也有类似要求(见图5、图9)。因此降额设计时应注意变更额定值的要求。
75 125 175 TA/℃
图2 开关二极管IF-TA关系曲线
(2) 电阻器和电位器
电阻器和电位器生产厂对在不同环境温度下使用的额定值进行了变更。例如:表9、表10中所列的两种金属膜电阻器的额定功率变化。
125℃
100℃
70℃
在不同环境温度下的额定功率(W)
RE3/4
RE1/2
RE1/4
RE1/6
RE1/8
型 号
表9 RE型金属膜电阻器的额定功率
70℃
125℃
额定功率
(W)
RJK56
RJK55
RJK54
RJK53
RJK52
产品
表10 RJK型金属膜电阻器的额定功率(不同环境温度下)
生产厂除了列表给出额定功率变更外,还画出了额定功率与环境温度的关系曲线(即负荷特性曲线)。
(3) 电容器
一般电容器生产厂没有对不同环境温度下使用的额定值进行变更,但对各种钽电解电容器(不含钽箔电容器)超过某一温度(85℃),其直流工作电压应按类别电压施加,这里的类别电压指环境温度超过85℃时,允许使用的电压。因此超过85℃的钽电容器应按类别电压进行降额设计。国外钽电容器也可按此进行。例如:CAK型固体电解质钽电容器直流额定电压的变化。
40
25
20
16
10
4
类别电压V
63
4
32
25
16
10
额定电压V
CAK型钽电容器直流额定电压及类别电压(超过85℃)
(4) 电连接器
电连接器生产厂按一些电连接器实际通电的接插件数,对接插件工作电流允许值进行了规定,随连接器中通电接插件数增多,接插件允许的工作电流要变更(降低)。因此应按实际通电接插件数的允许电流值再进行降额设计。例如:XK型园形快速连接电连接器的接插件允许电流,见表12。
设计者选用元器件时,应考虑元器件有关标准和产品说明书对在不同条件下额定值变更的要求。
160
5~6
48
5~6
32
5~6
180
3~4
54
3~4
36
3~4
200
1~2
60
1~2
40
1~2
允许电流
实际通电针孔数
允许电流
实际通电针孔数
允许电流
实际通电针孔数
额定电流
A
ф8
ф4
ф3
针孔规格
7
21~26
41~61
8
17~20
4
30~40
18
6~10
9
11~16
16~29
20
1~5
10
1~10
5
1~15
允许电流
实际通电针孔数
允许电流
实际通电针孔数
允许电流
实际通电针孔数1)
额定电流
A
ф2
ф
ф1
针孔规格
表12 XK型电连接器接插件的允许工作电流
注:1)针孔数即接插件数。
九、电子产品的热设计
、目的
控制电子产品内部所有电子元器件的温度,使其在产品所处的工作环境条件下不超过规定的最高允许温度,从而保证电子产品正常、可靠的工作。
GJB450A-2004 《产品可靠性工作通用要求》
GJB/Z 27-1992 《电子设备可靠性热设计手册》
GJB/Z 299B-1998《电子设备可靠性预计手册》
GB/T 15428-1995 《电子设备用冷板设计导则》
GB/-1987 半导体器件散热器 型材散热器
GB/-1987 半导体器件散热器 叉指形散热器
、相关标准
热环境包括产品或元器件周围流体的种类、温度、压力及速度,表面温度、外形及黑度,每个元器件周围的传热通路等。
热流密度:单位面积的热流量。
体积功率密度:单位体积的热流量。
热阻: 热量在热流路径上遇到的阻力。
热阻网络:热阻的串联、并联或混联形成的热流路径图。
冷板:利用单相流体强迫流动带走热量的一种换热器。
热沉:是一个无限大的热容器,其温度不随传递到它的热能大小而变化。它可能是大地、大气、大体积的水或宇宙等。又称热地。
基本概念
应通过控制散热量的大小来控制温升;
选择合理的热传递方式(传导、对流、辐射);传导冷却可以解决许多热设计问题,对于中等发热的产品,采用对流冷却往往合适,辐射传热是空间电子设备的主要传热方式;
尽量减小各种热阻,控制元器件的温度;电子产品热设计中可能遇到三种热阻:内热阻、外热阻和系统热阻。内热阻是指产生热量的点或区域与器件表面指定点(安装表面)之间的热阻;外热阻是指器件上任意参考点(安装表面)与换热器间,或与产品、冷却流体和环境交界面之间的热阻;系统热阻是指产品外表面与周围空气间或冷却流体间的热阻;
热设计的基本原则
采用的冷却系统应该简单经济,并适用于电子产品所在的环境条件的要求;
应考虑尺寸和重量、耗热量、经济性、与失效率对应的元器件最高允许温度、电路布局、产品的复杂程度等因素;
应与电气及机械设计同时进行;
不得有损于产品的电性能;
最佳热设计与最佳电路设计有矛盾时,应采用折中的解决方法;
应尽量减小热设计中的误差。
电子产品热设计主要包括冷却方法的选择、元器件的安装与布局、印制电路板散热结构的设计和机箱散热结构的设计。常见的热设计流程。
见下图:
热设计的方法
通常采用元器件经降额设计后允许的最高温值做为热设计目标。
热设计目标的确定
(1) 常用的冷却方法
电子产品的冷却方法包括自然冷却、强迫空气
冷却、强迫液体冷却、蒸发冷却、热电致冷(半导体
致冷)、热管传热和其它冷却方法(如导热模块-
TCM技术、冷板技术,静电致冷等)。其中自然冷
却、强迫空气冷却、强迫液体冷却和蒸发冷却是常
用的冷却方法。
常用冷却方法的选择及设计要求
(2)冷却方法的
选择
冷却方法确定的程序
见右图所示,在所有的
冷却方法中应优先考虑
自然冷却,因为这种冷
却无需外加动力源,故
其可靠性在所有冷却方
法中属最佳,且成本
低。
常用冷却方法的热流密度和体积功率密度
见下图。
常用冷却方法的热流密度
常用冷却方法的体积功率密度
常用冷却方法的优选顺序:自然冷却、强迫风冷冷却、液体冷却、蒸发冷却。
(3) 冷却方法的选择示例
功耗为300W的电子组件,拟将其安装在一248mm
×381mm×432mm的机柜里,放在正常室温的空
气中,是否需要对此机柜进行特殊的冷却措施?是
否可以把此机柜设计得再小一些?
首先计算该机柜的体积功率密度和热流密度:
体积功率密度:
热流密度:
式中: ——体积功率密度;
——热流密度;
——功耗;
——设备体积;
——设备表面积。
由于 很小,而 值与图中自然空气冷却的最大热流密度比较接近,所以不需要采取特殊的冷却方法,而依靠空气自然对流冷却就足够了。
若采用强迫风冷冷却,热流密度大约可达
(4) 常用冷却方法的设计要求
保证沸腾过程处于核态沸腾;
冷却剂的沸点温度低于设备中发热元器件的最低允许工作温度;
直接蒸发冷却时,电子元器件的安装应保证有足够的空间,以利于气泡的形成和运动;
冷却液应粘度小、密度高、体积膨胀系数大、导热性能好,且具有足够的绝缘性能;
封闭式蒸发冷却系统应有冷凝器,其二次冷却可用风冷或液冷;
冷却系统应易于维修。
蒸
发
冷
却
冷却剂优先选用蒸馏水,对有特殊要求的应选用去离子水;
确保冷却剂在最高工作温度时不沸腾,在最低工作温度时不结冰;
应考虑冷却剂的热膨胀,机箱应能承受一定的压力;直接液体冷却的冷却剂与电子元器件应相容;
应配置温度、压力(或流量)控制保护装置,并装有冷却剂过滤装置;
为提高对流换热程度,可在设备的适当位置装紊流器。
强
迫
液
体
冷
却
用于冷却设备内部元器件的空气必须经过过滤;强迫空气流动方向与自然对流空气流动方向应一致;
入口空气温度与出口空气温度之温差一般不超过14℃;冷却空气入口与出口位置应远离;
通风孔尽量不开在机箱的顶部;
工作在湿热环境的风冷电子设备,应避免潮湿空气与元器件直接接触,可采用空芯印制电路板或采用风冷冷板冷却的机箱;
尽量减小气流噪声和通风机的噪声;大型机柜强迫风冷时,应尽量避免机柜缝隙漏风;
设计机载电子设备强迫空气冷却系统时,应考虑飞行高度对空气密度的影响;
舰船电子设备冷却空气的温度不应低于露点温度。
强
迫
空
气
冷
却
最大限度的利用导热、自然对流和辐射散热;缩短传热路径,增大换热或导热面积;
减小安装时的接触热阻,元器件的排列有利于流体的对流换热;采用散热印制电路板,热阻小的边缘导轨;
印制板组装件之间的距离控制在19-21mm;增大机箱表面黑度,增强辐射换热。
自
然
冷
却
设计要求
冷却方法
功率器件的热设计
功率器件发热量大,靠自身散热难以满足要求,一般需安装散热器来辅助散热。功率晶体管大
都具有较大且平整的安装表面,并具有螺钉或导热
螺栓将其安装在散热器上,管壳与集电极有电连接
时,安装设计必须保证电绝缘。对某一特定的晶体
管而言,内热阻是固定的。为减小管壳与散热器之
间的界面热阻,应选用导热性能好的绝缘衬垫(如
导热硅橡胶片、聚四氟乙烯、氧化铍陶瓷片、云母
片等等)和导热绝缘胶,并且应增大接触压力。
(1)热阻网络
功率器件装上散热器后,其热阻网络如图a所示。器件内热阻RTj(℃/W)保持不变,Pc(W)为器件功耗,Ta(℃)为环境温度,Tj(℃)为器件结温,Tf(℃)为散热器表面温度,器件的热量一方面通过外壳直接向周围传递,外热阻RTp(℃/W),另一方面器件将热量传给散热器,它们之间的热阻为接触热阻RTc(℃/W),然后再由散热器把热量发散到周围空间,其热阻为散热器热阻RTf(℃/W)。通常器件外壳直接散到周围环境的热量远比经散热器散到周围空间的热量少,则外壳到周围环境的散热可忽略不计,而认为热量都经散热器散到周围环境空间, 即RTp 》(RTc+ RTf),图a简化成图b。
图a、安装散热器的热阻网络图
图b、热阻网络简化图
根据热电模拟法,将功耗模拟为电流,温
差模拟为电压,热阻模拟为电阻,可以计算
出热阻网络中各个热阻值:
式中:RT——系统总热阻(℃/W)。
由上式可知,要提高功率器件经过散热
器耗散的热量,应尽量降低各个热阻值。而
功率器件内热阻RTj由功率器件的工艺决定
的,其值固定不变,因而应主要考虑如何采
取有效措施减小功率器件与散热器之间的接
触热阻和散热器热阻。接触热阻RTc是器件与
散热器之间的接触应力产生的热阻,影响因
素较多。散热器的热阻RTf是选择散热器的主
要依据。
(2) 散热器的选择与使用
散热器的种类
散热器的品种很多,如平板式、柱式、扇顶式、
辐射肋片式、型材散热器和叉指形散热器等,下表
列出了几种常用散热器的特点。
体积小,重量轻,散热效果好。
叉指形散热器
可根据需要截取长度,其热阻并不直接随长度的增加而减小。
型材散热器
管壳与散热器有良好的热接触,散热效果较好,
适用于小功率晶体管的散热。耗散功率范围为 ~2W。
扇顶型散热器
特点
散热器种类
(3) 散热器的选择和使用原则
根据功率器件的功耗、环境温度及允许的最大结温(Tjmax),并保证工作结温Tj≤(~)Tjmax的原则下,选择合适的散热器;
散热器与功率器件的接触平面应保持平直光洁,散热器上的安装孔应去毛刺;
在功率器件、散热器和绝缘片之间的所有接触面处应涂导热膏或加导热绝缘硅橡胶片;
型材散热器应使肋片沿其长度方向垂直安装,以便于自然对流;
散热器应进行表面处理,以增强辐射换热;
应考虑体积、重量及成本的限制和要求。
(4) 散热器选择示例
已知某电子线路使用3DD157A型功率晶体管,其功率Pc为20W,环境温度Ta为30℃,管壳与散热器直接接触,接触热阻RTc为℃/W,试选用合适的散热器。 由晶体管手册查得3DD157A的有关参数为:最高允许结温Tjmax175℃;内热阻℃/W。由于是选取散热器,因此考虑最坏情况,即Tj等于Tjmax。
从结至环境的总热阻RT:
RT=(Tj-Ta)/P=(175-30)/20=(℃/W)
计算散热器的热阻RTf:
RTf=RT-RTj-RTc==(℃/W)
因此,只要选择的散热器热阻低于℃/W,就能保证功率管的结温小于175℃。为使设备体积小、
重量轻,可采用叉指形散热器。由查得
SRZ106型散热器能满足散热要求。
元器件的安装位置应保证元器件工作在允许的工作温度范围内;
元器件的安装位置应得到最佳的自然对流;
元器件应牢靠地安装在底座、底板上,以保证得到最佳的传导散热;
热源应接近机架安装,与机架有良好的热传导;
元器件、部件的引线腿的横截面应大,长度应短。
温度敏感元件应放置在低温处。若邻近有发热量大的元件,则需对温度敏感元件进行热防护,可在发热元件与温度敏感元件之间放置较为光泽的金属片来实现;
元器件的安装板应垂直放置,利于散热。
元器件的安装与布局
(1)元器件的安装与布局的原则
(2)元器件的安装方法
常用元器件的安装方法见下表所示。
与发热元器件间采用热屏蔽和热隔离措施。具体有:
(a)尽可能将热通路直接连接至热沉;
(b)加热屏蔽板形成热区和冷区。
温度敏感元器件
置于温度最低的区域,一般是靠近与散热器之间热阻最低的部分。
不发热元器件
最好将元器件分别装在独立的导热构件上,如果将其装在一个共同的散热金属导体上,可能
会出现明显的热的相互作用。
传导冷却的元器件
电源变压器是重要的热源,当铁芯器件的温度比较高时,应特别注意其热安装,应使其安装
位置最大限度地减小与其它元器件间的相互作用,最好将它安装在外壳的单独一角或安装在
一个单独的外壳中。
变压器和电感器
小功率晶体管、二极管及集成电路的安装位置应尽量减少从大热源及金属导热通路的发热部
分吸收热量,可以采用隔热屏蔽板。对功率等于或大于1W,且带有扩展对流表面散热器的元
器件,应采用自然对流冷却效果最佳的安装方法与取向。
半导体器件
大功率电阻器发热量大,不仅要注意自身的的冷却,而且还应考虑减少对附近元器件的热辐
射。长度超过100mm的电阻器要水平安装,如果元器件与功率电阻器之间的距离小于50mm,则
需要在大功率电阻器与热敏元件之间加热屏蔽板。
电阻器
安装方法
元器件种类
(3)印制板上元器件安装与布局要求
安装在印制电路板上的元器件的冷却,主要依靠导热提供一条从
元器件到印制板及机箱侧壁的低热阻路径。
(a) 为降低从元器件壳体至印制板的热阻,可用导热绝缘胶直接将元器件粘到印制板或导热条(板)上,若不用粘接时,应尽量减小元器件与印制板或导热条(板)间的间隙。
(b) 大功率元器件安装时,若要用绝缘片,应采用具有足够抗压能力和高绝缘强度及导热性能的绝缘片,如导热硅橡胶片。为了减小界面热阻,还应在界面涂一层薄的导热膏。
(c) 同一块印制板上的元器件,应按其发热量的大小及耐热程度分区排列,耐热性差的元器件放在冷却气流的最上游(入口处),耐热性能好的元器件放在最下游(出口处)。
(d) 有大、小规模集成电路混合安装的情况下,应尽量把大规模集成电路放在冷却气流的上游,小规模集成电路块放在下游,以使印制板上的温升趋于均匀;
(e) 因电子设备工作范围较宽,元器件引线和印制板热膨胀系数不一致,在温度循环变化及高温条件下,应注意采取减小热应变的一些结构措施。
(4)减少元器件热应变的安装方法
对于搭焊或浸焊的具有轴向引线的圆柱形元件,如电阻器、电容器和二极管,应提供最小的应变量为,如图(a)所示。大型矩形元件,如变压器和扼流圈,需要有较大的应变量,故采用图(b)、(c)的安装方法。
常把各种元器件紧密地安装在较密集的结构中,因此用于引线应变的有效释放的空间较小。通常把引线弯成环形,
可以得到较大的应变量。
晶体管的常用安装方法见图所示。其中图(a)是把晶体管直接安装在印制板上,由于引线的热应变量不够和底部散热性能差,易使焊点在印制电路热膨胀冷缩时产生断裂。其它几种热安装方法散热较好,但应注意图(e)的安装方法不适合于工作在振动环境中的元器件。
双列直插式(DIP)集成电路的安装。功率较大的集成电路,可在其壳体下部与印制板之间设有金属导热条,厚度满足散热要求,为了减少接触热阻,在接触面之间采用粘结剂。如图9(a)、(b)所示。功率较小的集成电路,可不用粘结剂或导热条,在集成电路与印制板之间留有间隙即可,如图(c)、(d)、(e)所示。
印制电路板的热设计
印制电路板热设计的目的是实现印制电路板良好的散热,
以保证印制电路板上元器件和功能电路正常工作,从而保证
系统的可靠性。
(1)常用的印制电路板
常用的覆铜箔层压板及其主要适用的工作温度和特性如表
介质损耗小,介电常数低,价格昂贵,适用于
制作国防尖端产品和高频微波设备中的印制
板。
可在200℃以下长期工作
覆铜箔聚四氟乙烯玻璃布层压板
透明程度好,适用于制作电子、电器设备中的
印制板。
可达130℃
覆铜箔环氧玻璃布层压板
适用于制作工作频率较高的电子/电器设备中的
印制板。
小于100℃
覆铜箔环氧酚醛玻璃布层压板
特点
工作温度范围
类型
(2)印制电路板的散热设计
目前采用的环氧玻璃板,导热性能差,为了提高其导热能力,通常在其上敷设导热系数大的金属(铜、铝)条或(铜、铝)板,而成为散热印制电路板,常用的散热印制电路板如图-10所示。图(a)为在印制电路板上敷有导热金属条的导热条式散热印制板,图(b)为在印制电路板上敷有导热金属板的导热板式散热印制板;图(c)为导热板安装于印制电路板的上方,与元器件紧密接触。
(a) (b) (c)
(3)印制电路板导轨的热设计
插入式印制电路板往往需要导轨,使印制电路板能对准插座。导轨的主要作用是导向和导热。作为导热时,应保证导轨与印制板之间有足够的接触压力和接触面积,并应保证导轨与机箱壁有良好的热接触,导轨的热阻是选择导轨的主要依据,导轨的热阻越,且随高度的变化越小,导轨的性能越好。
有许多不同形式的电路板边缘导轨,常见的几种导热性能较好的导轨如图。它们的热阻值在不同海拔高度时的典型值如表。其中以楔型导轨的热阻最小,楔型导轨在军用加固设备中得到了广泛的应用。
机箱的热设计
机箱热设计的任务是在保证产品承受外界各种环境和机械应力的前提下,采用各种必要的散热手段,最大限度的把产品产生的热量散发出,满足产品内电子元器件规定的温度要求。常用机箱的形式主要有密封机箱、通风机箱和强迫风冷机箱,强迫风冷机箱又可分为箱内强迫通风和冷板式强迫风冷两种。四种机箱的特性及适用范围如表所示。
热设计实施要点
最大限度的利用导热、自然对流和辐射等简单、可靠的冷却技术,并尽可能的缩短传热路径,增大换热(或导热)面积。
(1)冷却方法的选择实施要点
根据电子产品的功耗计算热流密度或体积功率密度;
根据设计条件和热流密度或体积功率密度选择合适的冷却方法;
冷却方法的选择顺序为:自然冷却、强迫风冷、液体冷却、蒸发冷却等。
(2)元器件的安装与布局实施要点
尽量减小元器件安装界面的热阻。元器件的排列与安装应有利于流体的对流;
元器件安装时,应充分考虑周围元器件的辐射换热的影响,对靠近热源的热敏感的元器件应采取热屏蔽措施;
A)半导体器件
通过采用大面积的光滑接触表面以及按要求指定导热衬垫或添加剂,尽量减小器件与其安装座之间的接触热阻;
置于远离高温元器件的地方;
在空气或冷却剂流动的方向采用垂直安置散热片的散热器。采用喷涂或涂覆的表面以改善辐射特性。
B) 电容器
置于远离热源的地方;
对其它热源采取绝热措施。
C) 电阻器
置于对流良好的位置;
使用机械的夹紧或封装材料以改善向散热器的热传递;
尽可能采用短引线。
D)变压器和电感器
为将这些器件的热传递出去,提供导热路;
置于对流冷却良好的位置;
适当处设置散热片。
(3)印制电路板的散热设计实施要点
印制板组装件应有适当的导热措施,如采用导热印制板(导热条、导热板、金属夹芯等)。
印制板导轨应采用热阻小的导轨,如U形导轨或楔形导轨等;
应控制印制板组装件之间的间距,一般应控制在19至21mm之间。
(4)机箱的散热设计实施要点
(a) 充分利用机箱结构作为散热体,通过传导、对流和辐射把机箱内部电子模块及电子元件产生的热量有效散发出去。
(b) 增大自然对流机箱表面的黑度,以增强辐射换热能力。
(c) 所有传导热量的接触面要求平整光滑,有较高的表面光洁度;
(d) 采用导热系数高的金属材料,考虑到材料的比重因素,推荐首先选用铝合金;
(e) 增加需要散热元件和模块的导热接触面面积;
(f) 对高低不平的导热面采用导热绝缘海绵橡胶板作为传热层;
(g) 缩短热传导的距离;
(h) 增大机箱的散热表面积;
(i) 增加导热接触面的压力;
(j) 非密封型机箱,在机箱上合理开通风口,加强对流、换热作用;
(k) 功耗较大时,考虑采用强迫风冷机箱或液体冷却机箱等。
.热分析
1.目的
热分析,又称热模拟,是利用数学手段,在电
子产品的设计阶段获得温度分布的方法,它可以使
电子产品设计人员和可靠性设计人员在设计初期就
能发现产品的热缺陷,从而改进其设计,为提高产
品设计的合理性及可靠性提供有力保障。
2.方法
热分析需建立电子产品温度场和流场的数学模型,并对
其求解,由于求解的复杂性,热分析大都采用软件来完
成。国外有很多公司已经开发了电产品热分析软件,并且
大多数已经商品化。应用软件进行热分析的基本步骤为:
(a)根据或设计要求建立热分析模型,确定边界条件;
(b)划分网格,进行计算,迭代直到收敛为止;
(c)后处理,以报表、图形或动画的形式观察温度场。
热分析软件虽能较准确的获得温度场的分布,但在应
用过程中可能存在建模不合理,输入参数的不准确等原因
而导致热分析误差较大,不能满足工程要求。
热性能评价
1.目的
确定热设计与冷却系统的合理性与有效性。
2.评价的内容
(a) 粗测或检查产品中的各种元器件、尤其是关键元器件的表面温度及温度分布;
(b) 分析热设计所采用的冷却方式是否为优选的方案;
(c) 冷却系统、元器件、电路板的热设计符合性检查;
(d) 开展热性能评价试验,对热设计的效果进行检验,对冷却系统的适用性和有效性进行评价。
3.热性能的粗测
对电子产品的热性能进行“快速而不精确”的测
量,称为粗测。主要包括以下内容:
(a) 仔细检查产品内是否有过热的现象,如电子元器件的变色、变黑、起泡、变形、漆起皱或变脏等;
(b) 在额定环境条件和设备所处的最大功耗的工况下,测量产品中关键元器件的表面温度;
(c) 与热设计目标进行比较,明确合格项目,不合格项目,分析原因,初步分析热设计是否满足要求。如不满足要求,提出改进热设计的建议。
4.检查项目
检查分为对冷却系统、电子元器件及印制电路板
的热性能检查。(1) 冷却系统的检查内容(见表)
(2) 电子元器件检查的内容
除在电路设计中检查元器件是否进行了降额设
计,对不同元器件还应按7节(2)条中的1)、2)、
3)、4)条的内容进行检查。
(3) 印制电路板检查的内容
(a) 是否将发热元器件与对热敏感的元器件进行热隔离?
(b) 对于多层印制电路板中采用金属芯的中间层,这些层与支承结构件或散热器之间是否有良好的导热通路?
(c) 是否采用保护性涂覆和封装,以降低印制电路板至散热器或结构件之间的热阻?
(d) 是否在必要的通路上采用较粗的导线?
. 热性能的测量
1、 目的
对热设计的效果进行检验,对冷却系统的适用性和有效性进行评价。
2、 项目
热性能测量的参数主要有温度及其分布,流量
(流速)和流体的压力损失。具体的测量项目有:
(a) 产品的输入功率;
(b) 产品的输出功率;
(c) 产品的外部环境温度;
(d) 产品内部的温度分布;
(e) 产品内部关键元器件和发热量较大元器件的温度;
(f) 温度敏感或可靠性要求高的元器件表面温度;
(g) 冷却剂入口的温度;
(h) 冷却剂出口的温度;
(i) 冷却剂入口处的静压(和动压);
(j) 冷却剂出口处的静压;
(k) 冷却剂的流速(或流量);
以上测试项目可根据产品任务书的要求进行裁
剪。
(3) 参数测量条件
(a) 产品在进行热性能测量时,应使产品处于规定的环境条件和最大稳态功耗下工作;
(b) 热性能测量时,应随时检查其电气工作性能并进行记录。
(4) 温度的测量
温度的测试可采用接触式测温或非接触式测温方
法,接触式测温方法是采用将温度传感器直接贴到
被测表面上的方法,可采用体积小、灵敏度高的传
感器,如热电阻传感器和热电偶传感器等,温度传
感器与被测表面之间要保证良好的接触,传感器的
敷设尽量不影响其温度场。接触式测温系统一般精
度较高,可较准确的获得被测点的温度值。非接触
式测温一般采用红外热像仪,可获得被测目标的温
度分布情况,但被测目标不能有遮挡,对于封闭机
壳内的电子元器件是无能为力的。
10.热设计报告
电子产品热设计之后,应提供热设计报
告,热设计报告应包括以下内容:
(a)热设计项目名称,工程编号;
(b)热设计的内容;
(c)热设计的方法;
(d)热设计主要技术资料、数据及其来源;
(e)热分析结果;
(f)热性能评价结果;
a) 粗检报告
b) 热性能检查报告
c) 热性能测量报告
(g)结论(热设计需要改进时,应给出改进措施及最终结果)。
十、冗余设计与容错设计
1.冗余与容错的概念
提高产品可靠性的措施大体上可以分为两类:第一类措施是尽可能避免和减少产品故障发生的避错”技术;第二类措施是当避错难以完全奏效时,通过增加适当的设计余量和替换工作方式等消除产品故障的影响,使产品在其组成部分发生有限的故障时,仍然能够正常工作的“容错”技术。而冗余是实现产品容错的一种重要手段。
“容错(fault tolerance)”定义 :系统或程序在出现特定的故障情况下,能继续正确运行的能力。“冗余(redundancy)”定义 :用多于一种的途径来完成一个规定功能。 “容错”反映了产品或系统在发生故障情况下的工作能力,而“冗余”是指产品通过多种途径完成规定功能的方法和手段。“容错”强调了技术实施的最终效果,而“冗余”强调完成规定功能所采用的不同方式和途径。严格地说,冗余属于容错设计范畴。
从原理上讲,冗余作为容错设计的重要手段,其实施流
程和原则也同样适用与其他容错设计活动。
2.冗余设计
.目的
冗余设计主要是通过在产品中针对规定任务增加更多的功能通道,以保证在有限数量的通道失效的情况下,产品仍然能够完成规定任务。
.应用对象
(a) 通过提高质量和基本可靠性等方法不能满足任务可靠性要求的功能通道或产品组成单元;
(b)由于采用新材料、新工艺或用于未知环境条件下,因而其任务可靠性难于准确估计、验证的功能通道或产品组成单元;
(c)影响任务成败的可靠性关键项目和薄弱环节;
(d)其故障可能造成人员伤亡、财产损失、设施毁坏、环境破坏等严重后果的安全性关键项目;
(e)其他在设计中需要采用冗余设计的功能通道或产品组成单元。
.适用时机
在设计/研制阶段的初期,与其他设计工作同步开展。
. 冗余设计方法
A)按照冗余使用的资源可划分为:
(a)硬件冗余:通过使用外加的元器件、电路、备份部件等对硬件进行冗余;
(b)数据/信息冗余:通过诸如检错及自动纠错的检校码、奇偶位等方式实现的数据和信息冗余;
(c)指令/执行冗余:通过诸如重复发送、执行某些指令或程序段实现的指令/执行冗余;
(d)软件冗余:通过诸如增加备用程序段、并列采用不同方式开发的程序等对软件进行冗余。
B)按照实施冗余的产品级别可划分为:部件冗余、系统冗余等。
C)按照冗余方法可划分为:
(a)静态冗余:只利用冗余的资源把故障的后果屏蔽掉,而不对原来的系统结构进行重新改变。此方法多用于电路或部件。
(b)动态冗余:在发现故障后,对有故障的部件或分系统进行切换或对系统进行重构或恢复。此方法多用于系统。
(c)混合冗余:上述两种冗余方法的组合。
D)按照冗余系统的工作方式和各个单元的工作状态,冗余也可划分为:
(a)主动冗余(热储备/热备份):冗余系统中的各个单元同时工作,以保证在有限个单元故障时,该冗余系统仍然能够完成预定任务。主动冗余又可划分为并行冗余和表决冗余两类。
(b)备用冗余(冷储备/冷备份、温储备/温备份):执行任务时,冗余系统中只有一个单元工作,当该单元发生故障时,切换至其他的冗余单元,直至所有冗余单元都失效,该冗余系统才失效。备用冗余可划分为冷备份和温备份。
上述冗余方式分类如图
冗余方式
备用冗余(冷储备/冷备份、温储备/温备份)
主动冗余
(热储备/热备份)
并行冗余
表决冗余
温储备/温备份
冷储备/冷备份
图1 冗余方式分类
.主动冗余
主动冗余(active redundancy)也称为工作冗余、热
储备或热备份,是指:执行规定功能的所有手段同时处于工作
状态的冗余。主动冗余包括并行冗余和表决冗余两种方式。
(1)并行冗余
并行冗余系统工作时,所有冗余单元均同时工作, 并
提供相同的输出,仅当所有冗余单元均失效时,该冗余系统才
失效。并行冗余系统中,在保证系统正常运行的前提下允许失
效的单元个数称为该冗余系统的冗余度。图2给出了一个二度冗
余系统的可靠性框图示意。
并行冗余(并联)系统的可靠性数学模型为:
(1)
式中:
n 为系统中单元数;
Rs 为系统可靠性;
Ri 为第i个单元的可靠性。
A1
A2
A3
图2 二度并行冗余系统的可靠性框图示意
(2)表决冗余
表决冗余即通常所说的表决系统或n中取k(kn)系统,记作k/n(G)。
在表决冗余中,只要系统中有k个或k个以上单元正常工作即可保证该冗余系统工作正常。当k取1时,表决冗余即等效为并行冗余(并联)。图3给出了表决冗余系统可靠性框图示意。
A1
A2
An
……
k/n(G)
图3 表决冗余系统可靠性框图示意
当采用相同冗余单元组成表决冗余系统时,表决器完全可靠,则其可靠性数学模型可表示为:
(2)
式中:
n 为系统中单元数;
Rs 为系统可靠性;
R 为单元可靠性。
当采用不同冗余单元组成表决冗余系统时,其可靠性数学模型不便用单一的通用公式描述。实际操作时可用全概率法计算系统的可靠性。例如对于2/3(G)的表决冗余系统,其可靠性可通过下式计算:
Rs=R1R2R3+(1-R1)R2R3+(1-R2)R1R3+(1-R3)R1R2
从其原理可以看出,在使用相同资源的条件下,并行冗余比表决冗余提供更多的冗余度;但对于某些具有准确度、精度等要求的功能而言,表决冗余设计能够通过比较、判断,筛选掉异常或错误的输出,因而更能满足功能要求。在主动冗余中,并行冗余通常用于保证一个功能通道的工作可靠性,而表决冗余通常用于保证多个功能通道。
.备用冗余
备用冗余(standby redundancy)包括冷储备、温储备或冷备份、
温备份,是指:执行规定功能的一部分手段处于工作状态,而其余部分
在需要之前处于不工作状态的冗余。
与主动冗余相比,备用冗余由于其备份的冗余单元在正常情况下处
于不工作状态,降低了其应力水平,因此可改善其备份单元的可靠性,
并为整个冗余系统提供寿命储备。但由于备用冗余通常需要配置启动或
切换环节,增加了系统的复杂性,而且这些环节失效往往成为该冗余系
统的单点失效,因此对其可靠性要求很高,一般要求它的不可靠度应小
于冗余单元不可靠度的50%,否则备用冗余的优点将大大受到限制。
带切换的备用冗余系统如图4 所示。A1A2An……切换环节
A1
A2
An
……
切换环节
图4 带切换的备用冗余系统
在备用冗余系统中,根据备份冗余单元的工作情况,又可分为冷备份和温备份。
执行任务时,冗余系统的不工作单元如果处于关闭状态(不加电状态),则称该冗余系统为冷备份系统;如果处于待机预热状态,则称该冗余系统为温备份系统。相对而言,温备份具有较快捷的启动或切换过程,切换过程对冗余系统工作的影响较小;冷备份中备份单元的工作应力更低,因此其不工作状态下的可靠性较高。
.不同冗余类型的特点
各种冗余形式具有不同的特点。在工程应用中,应根据产品特点和可靠性要求,并在成本、重量、体积、资源消耗等方面进行权衡,最终确定应采用的冗余方式。不同冗余类型的特点及适用性汇总见表1所示。
同冷备份
同样存在切换薄弱环节。相对冷备份,不工作冗余单元的能耗和应力较高
切换过程相对冷备份冗余快捷,并可储存冗余备份单元寿命
主份单元工作时,其余各冗余单元不工作但处于待机状态
温备份
有利于消除间歇故障,适用于允许输出间断或变化较大的功能
有切换过程,需要增加切换环节,切换过程可能对系统工作产生影响,切换环节可能构成薄弱环节
可储存冗余单元寿命
主份单元工作时,其余各冗余单元不工作且处于关闭状态
冷备份
备用冗余
设计相对复杂,有时需要增加比较、判断环节,适用于有准确度、精度等要求的功能以及需要提供多个功能通道的产品
各单元同时工作,冗余单元的寿命有所损失;表决过程可能影响系统工作速度,相同资源提供的冗余度较并行冗余少
无切换过程,可有效提高功能的正确性,减少错误输出
各冗余单元同时工作
表决冗余
设计相对简单,适用产品范围广。
适用于提供一个功能通道的产品
各单元同时工作,冗余单元的寿命有所损失
无切换过程,对系统工作影响较小。与表决冗余相比,相同资源可以提供更多冗余度
各冗余单元同时工作
并行冗余
主动冗余
适用对象
缺 点
优 点
单元工作状态
冗余类型
表1
.实施要点
进行冗余设计时,应注意以下几点:
(1)可以采用相同单元冗余,也可采用不同单元冗余
例如用两个螺栓连接一个法兰,如果有一个螺栓失效,法兰连接就不可靠。为了提高连接的可靠性,采用六个螺栓来连接这个法兰,即使有任何四个螺栓失效,这个法兰的连接还是可靠的。这是一个六中取二的表决冗余,即2/6(G)系统,这里有四个螺栓是冗余单元,均相同。
载人运载火箭在起飞至二级主机关机任务时段,具备自动逃逸功能;同时还可以接受地面遥控指令实施逃逸。这是不同功能单元冗余的例子。
(2)冗余虽然能提高任务可靠性,但降低了基本可靠性
例如一个系统由三个相同单元构成可靠性并联系统,设每个单元可靠性为,则并联系统的任务可靠性为;而该系统基本可靠性按串联模型计算为。比较可见,任务可靠性从提高至,但基本可靠性则从降至,任务可靠性提高了,但单元从一个变为三个,成本、重量、体积、功耗等大大增加了,且基本可靠性降低了,意味着维修工作量增大了,从而维修费用负担增加了。由此可见,是否要采用冗余,采用什么样的冗余,需要看获得的效益与付出的代价相比是否值得来定。冗余技术是一种优化技术,它是指在费用、重量、体积、功耗等因素限制条件下,如何配置冗余单元使系统任务可靠性达到最大;或者在达到可靠性指标要求下使耗用的资源最少。
(3)冗余必须全面考虑系统多重工作模式需要,适当选择冗余级别
例如,为防止二极管电路短路,在电路上串接二只二极管,只要有一只不短路,电路就不会短路,即对短路失效而言,二只二极管构成可靠性并联系统,提高了电路不短路可靠性。如图6所示。
图6 二极管电路可靠性框图
但是另一方面,该电路还要求不能开路,而上述串接的二极管电路,只要有一只开路就会使该电路开路,对开路失效而言,二只二极管又构成可靠性串联,这样就降低了电路不开路可靠性。为了解决这个问题,可采用二极管串并联方式。如图7所示。
(a) (b)
图7 二极管串并联方式
图(a)是系统冗余,(b)是单元冗余。可以证明,系统冗余的可靠性小于单元冗余的可靠性,即在系统中较低层次单元采用冗余的效果比层次高的地方好,因此在工程许可的条件下,单元冗余方式应用较多。
(4)冗余还应考虑共因或共模故障的影响
欧空局阿丽亚娜5型火箭首飞爆炸事故,就是由于自动导航系统中用于制导和姿态控制的主、备份计算机发生共因故障所致。
.应用实例
. 工程背景
为了确保航天员的安全,要求用于载人飞行的运载火箭比普通运载火箭有更高的可靠性和安全性。运载火箭飞行控制系统是关系运载火箭飞行成败的关键系统之一,其任务是控制运载火箭按预定弹道稳定飞行,控制发动机点火、关机以及助推器、级间、整流罩、船箭等的分离,将飞船送入预定的轨道。
飞行控制系统的工作原理、组成及功能见图8和表2所示。
图8 飞行控制系统工作原理示意
将全系统组成一个电磁兼容的系统整体,并
为全系统供、配需要的电源
由电池、配电器、二次电源和
电缆网等组成
电源配电
分系统
按要求的时序发出相应的控制指令,引爆
相应的火工品,实现发动机的启动及关机、
助推器的分离、整流罩的分离、火箭的级间
分离、船箭的分离、抛逃逸塔、实施逃逸时
关闭发动机等
由时序控制装置、时序输出装
置、中止飞行关机装置等组成
时序控制
分系统
进行导航计算和导引控制计算,并当运载
火箭飞行达到要求的终端条件时给出相应的
关闭发动机指令,将飞船送入预定的轨道
由火箭视加速度测量装置和箭载计算机及飞行控制软件组成
制导分系
统
控制运载火箭按预定的弹道稳定地飞行
由火箭姿态角及姿态角速率
测量装置、箭载计算机及姿态
控制软件、放大器及伺服机构
等组成
姿态控制
分系统
基本功能
组 成
分系统
表2 飞行控制系统的组成及功能
箭飞行时间比较短和需要迅速地进行故障判别、故障隔离及系统重构的特点,适当地将系统进行划分,采用部件级、单机级及分系统级冗余结构相结合的方法,实现全系统的冗余化设计,使各冗余结构在出现一个故障的情况下,仍能保障系统实现正常功能,即具有容许一度故障的冗余能力。为使系统设计简单和容易实现,将全系统综合划分为若干个部分进行设计。下面以直流电源配电部分和时序控制分系统的冗余设计为例进行简要说明。
.直流电源配电部分的冗余设计
直流电源配电部分包括电池、配电器和电缆网。
(1)电池
为适应不同负载的需要,飞行控制系统中使用了不同电压和输出功率的几种电池,这些电池自身都未采用冗余设计。根据输出功率和使用特点,在系统应用中可使用直接并联和参数余量两种冗余设计方法。
1)直接并联方法
利用电池开路时端电压及充电时端电压都比放电时的端电压高的特点,将两个电池直接并联起来供电,构成并联冗余结构。这种结构的关键问题是对电池短路故障的冗余能力。两个电池并联起来,若一个电池出现开路故障,另一个电池可正常供电。而对电池单体短路故障的冗余能力与电池串联的单体数有关。例如,一个由20个单体串联成的银-锌电池,荷电单体的开路电压按,放电时的电压按,则即使出现三个单体短路时,仍不会产生正常电池向故障电池充电,至少有允许3个单体出现短路故障的冗余能力;当允许有一定的充电电流时,可容许更多的故障单体。
2)参数余量方法
电池的每个单体内都是由多对电池极板并联,单体与单体之间有非常牢固的连接。因而在保证每个单体都加注了电解液后,电池开路的故障模式实际上可以不考虑,可只考虑电池单体短路、电量不够等类型的故障模式。这类故障模式的后果是导致电池提供的供电电压降低。系统设计时考虑到了这种情况,将电池的所有用电负载设计成在电池有一个单体出现上述故障模式时能提供的最低电压下,也能正常工作。虽然电池未增加,但具有容许一个单体故障的冗余能力。
设一个由20个单体串联成的电池,单个单体的可靠度为
R,无参数余量时整机的可靠度Rz 为:Rz=R20;若按有一
个单体冗余能力设计参数,即19/20(G)系统,则整机的可
靠度RR为:
RR为:RR=R20+20 x R19(1-R)=20R19-19 R20。
可用一组计算数据来说明这种参数余量设计方法对提高
可靠性的作用:
设R=,则有:
Rz=
RR=
采用这种设计方法时,应分析和试验单体内化学变化产
生的影响,确定电池能否满足供电电流和供电时间的要求;
不能满足要求的,应采用直接并联方法。
(2)配电器和电缆网
系统中有多个配电器,每个配电器中又有多个配电支路和控制电路。在配电器内部采用了元器件级的冗余设计。运载火箭配电的特点是火箭起飞前将电源接通,飞行中绝大多数时间要求一直可靠地供电而不断开,只有少数的配电负载要求飞行中有时断开有时接通。配电器多为继电器电路组成,对飞行中要求一直供电的电路,采用多个继电器和多个继电器接点并联的设计或多个环路供电的设计,保证整个飞行中能可靠的供电。对飞行中有时断开有时接通的配电支路和控制电路,一般采用继电器的并串联冗余结构。有的虽然要求飞行中有时通有时断,但其发生通失效和断失效的危害明显不同,发生断失效危害大的,应采用串联结构;发生通失效危害大的,应采用并联结构。
电缆网包括连接线路和接插件,要求可靠的导通,可采用双点双线、多点多线并联设计,供电线路也采用环形供电结构。
.时序控制分系统的冗余设计
时序控制分系统包括时序指令产生和时序指令输出两大
部分功能电路。火箭各级发动机的启动和关机、助推器的分
离、火箭各级之间的分离、抛逃逸塔及抛整流罩、船箭之间
的分离等,都是由时序控制分系统控制实现的;由于直接涉
及很多火工品的引爆,所以不仅直接关系到火箭飞行成败,
而且直接与安全性有关。时序指令产生部分由箭载计算机的
时序输出接口电路和时序控制装置组成,皆采用三重复单元
冗余设计,箭载计算机时序输出接口不进行故障判别,其三
重复时序输出接口与三重复的时序控制装置一一对应串联构
成表决式冗余结构,利用时序控制装置的2比1表决输出电路
进行故障判别和系统重构,以简化系统设计。时序输出装置
采用控制端为并联,输出为并串或串并联的开关电路冗余结
构。图9为时序控制分系统冗余结构原理图。
图9 时序控制分系统冗余结构原理图
火箭飞行中时序输出装置的工作,有接通也有断开状态,但绝大多数飞行中只接通断开一次,且接通的时间很短。由于火箭起飞前时序输出装置的所有时序输出皆为断开状态,并可对其进行检测确保其为断开状态,飞行中接通后若断不开,还有其他设计措施防止影响正常飞行,因此采用了上述的保证可靠的接通和防止误通的电路结构。
.小结
提高一个系统的可靠性需要有多方面的设计措施,元器件是系统的基础,首先必须选用高质量等级的元器件。对于像运载火箭飞行控制系统这样复杂的系统,只靠提高元器件的可靠性实现载人飞行要求的高可靠、高安全水平,会给元器件制造带来难以克服的困难或需要花费高昂的代价。在一定的可靠性水平的元器件基础上,采用冗余技术是提高系统任务可靠性,得到高可靠性系统的有效设计措施。采用冗余设计虽然增加系统的复杂性,但与因故障造成运载火箭飞行失败的损失相比是微不足道的。我国载人航天首飞圆满成功,进一步证明了火箭飞行控制系统“全冗余”化设计的正确性和有效性。设计师系统总结出飞行控制系统适应运载火箭简单、可靠、响应快和完全自主等特点的冗余设计的五个工程要素是:
(a)选择合理可行的冗余结构;
(b)确定正确有效的判别准则及门限;
(c)构建简单可靠的系统重构方法;
(d)完善的冗余可检测性设计;
(e)全面的无共因失效设计。
3.容错设计
相比冗余设计,容错设计包含的内容更为广泛,它通过
在产品设计中增加消除或控制故障(错误)影响的措施,实
现提高产品任务可靠性和安全性的目的。
在执行任务时,一个容错系统从产品出错到恢复通常
需要经过下列几个步骤:
(a)故障检测;
(b)程序重复执行;
(c)故障定位及诊断;
(d)故障屏蔽/隔离,限制故障后果的扩散,以避免影响系统的其他部分;
(e)系统重构/备份切换;
(f)系统恢复;
(g)重启动。
故障的检测与修复也可以分成在线(联机)或离线(停机)两种;也可以根据修复后的系统性能有无变化而分成性能降级及不降级两种容错系统。
作为可靠性设计的内容之一,容错设计的目
的、实施时机、流程和基本原则与冗余设计基本相
同。
十一、安全性设计
与分析
安全性 产品质量特性中非常重要的一种特性
安全 产品安全性表现的一种状态
GJB/Z 99-1997《系统安全工程手册》对安全的定义:不发生可能造成人员伤亡、职业病、设备损坏、财产损失或环境损害的状态
危险 可能导致事故的状态 GJB900
风险 用危险可能性和危险严重性表示发生事故的可能程度
事件链
从危险源的存在到最终发生事故是一个产品状态不断变化的过程,是一个个事件演变的过程,也是产品从安全的状态转变成不安全的过程。这样的过程便构成了一个事件链
安全性基本概念
危险分析
危险分析是对产品设计、使用以及环境有关的所有危险进行系统化分析
内容包括:
认识危险源,填写危险源清单
对危险风险进行评价
确定安全性关键项目
对不可接受危险项目提出改进措施和建议
确定残余危险项目
安全性基本概念
安全性与可靠性的关系
都是产品固有的质量特性,两者既有联系,又有区别
不失效或不发生故障
不发生意外事故
所有可能发生的故障或失效
所有可能威胁安全的危险源
可靠性
安全性
安全性分析方法
危险源检查单法
典型危险源检查单
危险能源检查单
任务关键功能检查单
使用、维修和保障活动危险检查单
危险检查单
危险检查单——机械危险检查单
地板表面是否具有良好的防滑特性?
一旦挂车与牵引车辆脱开后是否具有安全措施?
拉动式机柜导轨及抽屉是否设有限位挡块?
设备是否带有合适的把手?
把手在危险的场合下是否做成埋入式的而不是拉伸式的?
凡在可能的情况下,把手是否设在重心的上方?
重量的分布是否易于设备的搬运、装卸或定位?
操作及维修工作是否不需要大的劳动强度?
设备是否不存在可能伤人的尖锐或凸出的边缘或棱角?
当采用玻璃时,是否采用不耀眼的和不碎的玻璃?
各种安全阀、减压阀或其它的安全装置是否调整到其规定值?
危险检查单——电气危险检查单
从设备到接地是否有连续的永久性通路?
接地系统是否具有足够的机械强度以防偶然的接地中断?
地线与底板或机座的廉洁是否固定在点焊接线片上,或固定在底板或机座的接线柱上,或用螺钉、螺母和锁紧垫片固定到地线上的接线端?
接地系统所用的导线是否具有足够的载流能力,可安全地流过任何电流?
在靠近高压处使用的工具是否有良好的电绝缘?
内部操纵装置是否处在离开危险电压的安全距离?
电缆和导线在穿过金属隔板的地方是否有保护措施?
在更换、互换或安装设备中的一个组件或部件时,能否切断电源?
产品中是否存在某些物质因化学反应会造成对人眼睛的伤害?
对那些可能伤害人员的物质(或与其他物质组合)是否有告警标志?
是否有哪种物质与空气中的氧气反应会产生有毒的、有腐蚀性的、可燃的或自燃的物质?
是否有哪种物质在遇热或紫外线照射后其分子将分解以产生危险的生成物?
所用的液体或气体与其容器的材料是否相兼容?
环境噪声级对人员安全及工作效率是否是可接受的?
对操作人员的心理要求是否都已进行评定?
必要时是否备有各种护耳、护眼设备?
因高温暴露或穿防护服对人员产生热应力是否已进行评定?
是否有足够的预防措施来防止人员暴露在毒性气体、沙尘和烟雾等有呼吸危险的环境?
危险检查单——着火及爆炸解除检查单
在产品使用计划中是否已考虑材料的可燃性?
在设备的技术文件中是否包括灭火方法?
燃油箱是否位于当产品受撞击后不会受损坏而导致泄露的地方?
爆炸物及引爆装置是否有告警标志?
危险检查单——加速度危险检查单
产品或其任何部分是否处于运动中而随加速度或减速度的影响?
当整个产品将处于运动中时,是否有未固定的物体可能受加速度、减速度或离心力的影响而移动?
结构件能否随因突然撞击、停机或动态载荷而产生的过载?
起吊或牵引设备是否设计得可平稳起动及停止以防产生起动过载?
对因旋转设备故障而飞出的碎片,是否提供防护屏蔽?
危险检查单——冷热危险检查单
产品中是否存在使温度升高到足以产生燃烧的热源?
工作温度是否造成涂料和保护层损坏?
是否具有受低温影响易变脆和易破裂的材料?
温度变化是否将使零件产生不希望有的松动或粘连?
蒸气压力高的增压液体容器是否远离热源?
对必须在密闭空间工作的人员是否提供高环境温度保护?
危险检查单——压力危险检查单
压力容器的设计是否采用法定的安全系数?
压力容器是否进行耐压力及爆破压力试验?
各种软管及其接头和配件是否牢靠地固定以防发生故障时产生振动?
可能承受高压的压力容器及管道是否有减压阀、排泄口或破裂膜?
软管是否采取了防擦伤、扭转或基座损坏的措施?
如果系统中采用蓄压器,它是否具有对最大工作力的告警指示?
产品是否会产生高强度的紫外线,例如由炭弧产生?
是否向可能受影响的人员提供告警,需要戴护目镜以防伤害眼睛?
是否按照有关要求对激光器进行分类?
对已分类的激光器是否需要专门的防护设备?
产品中是否含有如果人员少量吸收、吞入或皮肤产生化学反应将造成伤害的毒性材料?
这种材料能否作为麻醉剂而影响神经系统,或引起癌变?
这种材料如果与其他物质混合是否会增大毒性?
产品中的材料能否与其他材料反应而产生毒性材料?
如果毒性材料是气体,是否已规定其门限值或其他额定值?
流体管道是否牢固地支承或紧固,以便在运行时不产生振动?
安全性关键的螺栓及其他紧固件是否已紧固以防止零件间的运动?
对产品是否进行噪声测量?
是否可采用吸音材料来减少噪音?
污染(杂质)是否对产品安全运行产生影响?
如果污染可能产生影响,产品中的关键件是否采取了密封或其它保护措施?
如果采用过滤器或过滤网,这些过滤装置是否容易拆卸清洗?它们是否有足够的过滤通过或是否需要经常清洗?
产品是否容易清洗而不造成损坏或者是否需要采用危险的清洗剂?
杂质是否会产生伤害草木及水生物的污染物?
对车辆之类的产品,在丧失了摩擦力的不利条件下是否具有止动(停车)的能力?
何种地面状态会使车辆行走失控?
如果遇到上述不利的状态,是否给驾驶员提供了有关采取措施的说明?
产品所用的材料是否具有难闻的特殊气味?
工程经验法
其它分析方法
典型危险源检查单
失效模式影响及危害性分析(FMECA)
故障树分析(FTA)
事件树分析(ETA)
潜在通路分析(SCA)
报警时间分析、警示与报警分析
区域安全性分析(ISA)
危险严重性分类
轻于Ⅲ类的人员伤害、轻于Ⅲ类的系统或环境破坏
Ⅳ
轻微的
人员轻度伤害(含轻度职业病)、系统或环境轻度破坏
Ⅲ
轻度的
人员严重伤害(含严重职业病)、系统或环境较严重破坏
Ⅱ
严重的
人员死亡、系统完全损失或报废、环境严重破坏
Ⅰ
灾难的
定义
等级
说明
危险可能性等级
不易发生,但有可能
不易发生,可认为不会发生
E
不可能
不易发生,但有理由预期可能发生
在寿命期内不易发生,但有可能
D
很少
发生若干次
在寿命期内可能偶尔发生
C
偶然
频繁发生
在寿命期内可能发生若干次
B
很可能
连续发生
可能经常发生
A
频繁
总体(总体大小由产品定义)
单个项目
等级
说明
危险可能性等级
4E
3E
2E
1E
E(不可能)
4D
3D
2D
1D
D(极少)
4C
3C
2C
1C
C(有时)
4B
3B
2B
1B
B(很可能)
4A
3A
2A
1A
A(频繁)
Ⅳ(轻微的)
Ⅲ(轻度的)
Ⅱ(严重的)
Ⅰ(灾难的)
危险可能性等级
危险的风险指数 建议的准则
1A,1B,1C,2A,2B,3A 不可接受
1D,2C,2D,3B,3C 不希望有的,需订购方决策
1E,2E,3D,3E,4A,4B 订购方评审后可接受
4C,4D,4E 不评审即可接受
安全性设计与控制方法
采用设计以消除或控制危险
采用防护性安全装置
采用报警装置
采用严格的操作使用规程和加强培训
安全性设计与控制方法
常用的消除或控制危险的方法
能量控制
内在安全设计
隔离
闭锁、锁定和联锁
故障-安全设计
故障最少化设计
安全系数
报警装置
标记
尽量减少和遏制伤害或损害
逃逸和营救;
薄弱环境
十二、机械产品可靠性设计概论
1、概述
机械设计的三个阶段
机械产品可靠性的定义
在规定的使用条件和规定时间内,机械产品完成规定功能的能力。
按应用对象分类
(1)结构可靠性
考虑结构疲劳、磨损、断裂等强度失效问题。
(2)机构可靠性
考虑机构在运动过程中,由于变形、磨损等引起的功能失效。
机械可靠性设计方法
(1)定性设计方法
成功的设计经验或失败的教训,有针对性地应用到设计中,避免故障或设计缺陷。
(2)定量设计方法
概率设计法以应力—强度干涉模型和功能失效极限状态函数理论为基础,将应力、强度视为随机变量,利用概率方法计算出给定设计条件下产品的失效概率或可靠度,以符合给定的可靠性要求。
2、机械产品可靠性的特点
不确定性/随机性
不可重复
真值不可测不可见
以传统学科知识为基础,考虑
不确定性
确定性
可重复
真值可测可见
应用传统学科知识
可靠性
性能
修复和更换相结合
维修主要以更换元器件为主
多是专用件,标准件少,环境影响严劣,失效率不是常数
失效率接近常数,有标准手册,可利用国军标GJB299-或MIL-HBK-217 预计
寿命和可靠性试验一般是小子样,试验时间较长 ,费用高
ESS剔除早期失效,经济合理有效的
失效通常是由于疲劳、老化、磨损、腐蚀等
失效主要是由偶然因素造成
失效模式比较复杂
失效模式比较简单
机械产品
电子产品
能得到较小的零件尺寸、体积和重量,在节省原材料和降低设计或加工工艺要求等方面带来效益
取过大的安全系数往往导致保守的设计
从控制参数均值和参数标准差两方面提高可靠性
从控制参数的均值方面入手提高可靠性
多种指标设计校核,可预测失效概率或可靠度
以安全系数进行设计校核
应力和强度为随机变量
应力和强度为常量,乘以各种系数
常规设计
概率设计
3、机械产品的主要失效模式
机械产品可靠性设计的根本任务是预防潜在故障及纠正故障
与具体产品相关
(6)其他类型
老化、变质、腐蚀、锈蚀、积碳等
(5)退化变质型
松动、脱落、漏油、漏水、漏气、堵塞等
(4)松脱漏堵型
断裂、破碎、裂纹、扭曲变形、点蚀、剥落等
(3)损坏损伤型
压力过高或过低、不到位、转速异常、功率不足等
(2)功能失常型
操纵失灵、不启动、不工作、卡死等
(1)功能失效型
说明
失效类型
GJB3554-《车辆系统质量与可靠性信息分类和编码要求》
3、机械产品的主要失效模式
强度是机械零件可靠性的最基本要求
强度不足产生的断裂往往引发重大安全事故。
疲劳、磨损、腐蚀
尽管机械产品种类繁多,不同机械产品的失效模式和失效机理也各异,但由于疲劳、磨损、腐蚀而导致的失效在整个机械产品失效中所占比例超过80%,因此机械可靠性定量设计也往往针对这三种失效机理进行分析计算。
4、机械产品可靠性的度量参数
机械产品一般可分为整机(或称系统)和零部件
度量产品可靠性的参数
■ 可靠度 ■ 失效率
■ 累积失效概率 ■ 平均寿命
■ 平均故障间隔时间 ■ 可靠寿命
■ 可靠寿命 ■ …
机械产品最常用的可靠性度量参数就是可靠度、寿命或可靠寿命以及MTBF
(1)可靠度:(Reliability)
用随机变量T表示产品从开始工作到发生失效或故障的寿命,概率密度函数为f(t)
用统计方法:若有N个相同的产品同时投入试验,经历时间t后有n(t)件产品失效。
失效概率为:
可靠度为:
机械产品可靠度与载荷、环境、失效机理等密切相关
<
基本无影响,可更换
影响较小
一般损失
损失重大
~1
造成重大后果
可靠度
失效影响
对故障引起不同后果的零部件和系统,应结合产品的设
计寿命选用不同的可靠度
关键零件可靠度取高值
(2) 失效率
若定义:
为平均失效率
则:
为失效率
例:100件产品,实验10小时2件失效。再观测1小时,发现有1件失效
若实验到50小时时共有10件失效。再观测1小时,也发现有1件失效,这时
显然有:
失效率曲线(也称浴盘曲线)
早期失效期
偶然失效期
耗损失效期
t
适于电产品
适于机械产品
通过维修来降低失效率
磨合期
有效寿命
——
——
——
——
基本函数
失效率为常数时,相当于寿命服从指数分布
机械产品的失效率不是常数
(3) 平均寿命
不可修产品为平均无故障时间MTTF (Mean Time To Failure)
可修产品为平均故障间隔时间MTBF(Mean Time Between Failure)
电子产品失效率基本为常数,相当于寿命服从指数分布,
则平均寿命的计算公式为
任何机械产品均有使用寿命问题,例如汽车的设计寿命一般为50万公里,飞机的设计寿命为60000飞行小时。
在现代设计中,机械产品一般采用等寿命设计方法,因此其寿命本质上取决于关键零部件的寿命。
对机械零部件而言,大多是不可修复的,如果出现失效,在维修时一般给予更换。所以设计机械零件,不但要确保其可靠度,更为重要的是使其设计寿命达到要求。
平均故障间隔时间/里程(MTBF)常用于机械产品整机或系统可靠性的度量
MTBF本质上是一种基于统计的可靠性度量参数,可以反映产品的可靠性水平
但对机械系统而言,由于各组成零部件的失效率非恒定,只能借助大量统计或试验数据才能确定
(4)可靠寿命
可靠度为给定值R时的工作寿命。例如轴承常采用可靠度为时的寿命作为可靠性度量参数(额定寿命)。
可靠寿命一般通过统计试验确定,其观测值是能完成规定功能的产品的比例恰好等于给定可靠度时所对应的时间。
例如,对100个产品进行寿命试验,指定可靠度R=,若当第10个产品发生失效时的时间为250小时,则可靠度为的可靠寿命约为250小时。
5、机械可靠性设计分析主要步骤主要分为九步
(1)明确可靠性要求
包括定性和定量的要求,如可靠度、寿命、平均故障间隔里程等。定性定量要求的提出必须根据机械产品的使用要求,包括寿命剖面、任务剖面、故障判别准则等。
(2)调查分析与所要设计的相似产品的使用情况
如常见故障模式、故障发生频率、故障发生的原因、成功的设计经验和失败的教训,制定可靠性设计准则。
(3)可靠性分配
产品的可靠性是依赖于产品的各组成单元,因此必须把产品整机的可靠性要求按一定的规则合理地依次分配到部件和零件。
(4) 进行FMEA和FTA分析
发现影响产品可靠性的薄弱环节,确定关键件、重要件。
(5) 一般零件的可靠性设计
可以借鉴以往的设计经验,用常规设计方法进行设计。
(6)关重件的可靠性设计
除借鉴经验进行定性设计之外,应开展可靠性定量设计。采用定量设计必须明确给定设计工况和可靠性要求,然后利用概率设计法进行可靠性定量设计分析。
(7)可靠性分析评价
通过分析与计算,估计所设计零部件的可靠性,并与分配的可靠性要求进行分析比较,如达到规定的要求,则设计结束,如未能达到规定的要求则须重新设计。
(8)设计评审
为了保证设计与分析结果的正确性,应组织同行专家进行认真的设计评审,对发现的设计缺陷进行改进设计。
(9)可靠性增长
设计完成的图纸,应严格按规定要求进行制造,制造出的产品必须进行充分的试验,以便进一步暴露设计缺陷,并采取措施加以改进。
可靠性从何入手?
故障/失效
预防
发现
验证
纠正
—— 从故障入手
十三、软件可靠性
1.软件可靠性定义
软件可靠性定义:在规定条件下,在规定的
时间内软件不引起系统失效的概率。该概率
是系统输入和系统使用的函数,也是软件中
存在的缺陷的函数。系统输入将确定是否会
遇到已存在的缺陷(如果有缺陷存在的话)。
规定的条件是指:
①软件运行的软、硬件环境:软件环境包括运行的操作系统、应用程序、编译系统、数据库系统等;硬件环境包括计算机的CPU、 CACHE、MEMORY、I/O等;
②软件操作剖面:通常是指软件运行的输入空间及其概率分布。
软件的输入空间是指软件所有可能的输入值构成的空间。按照欧空局标准的定义,软件的操作剖面是指“对系统使用条件的定义。即系统的输入值用其按时间的分布或按它们在可能输入范围内的出现概率的分布来定义”。
规定的时间一般可分为执行时间、日历时间和时钟时间。执行时间(execution time)是指执行一个程序所用的实际时间或中央处理器时间;或者是程序处于执行过程中的一段时间。日历时间(calendar time)指的是编年时间,包括计算机可能未运行的时间。时钟时间(clock time)是指从程序执行开始到程序执行完毕所经过的钟表时间,该时间包括了其他程序运行的时间。大多数的软件可靠性模型是针对执行时间建立的,因为真正激励软件发生失效的是CPU时间。
规定功能是指“为提供给定的服务,产品所必须具备的功能”。
2.软件可靠性相关的基本概念
.软件可靠性方面的基本术语和概念
(1) 软件中的失误、缺陷、故障和失效
软件可靠性文献中常用失误、缺陷、故障和
失效来描述故障的因果关系。软件作为一个
整体,其故障的因果关系见图1。
开发人员产生
在开发过程中
存在
在产品中
用户经历的
在运行时
失误
缺陷
失效
产品有
故障
在一定环境中
图 1 软件故障的因果关系
失误(mistake):可能产生非希望结果的人的行为。
缺陷(defect):代码中引起一个或一个以上故障
或失效的错误的编码,软件缺陷是程序固有的。
故障(fault):在软件执行过程中,缺陷在一定条件下导致软件出现的错误状态,这种错误的状态如果未被屏蔽,则会发生软件失效。
失效(failure):程序操作背离了程序需求
(2) 从系统的不同层次看软件缺陷、故障与失效
(3) 软件失效的原因
内在原因都是在软件开发过程中形成且未被排除的潜在缺陷,如有缺陷的、遗漏的或多余的指令或指令集,这些缺陷的来源可能是软件开发者的失误,也可能是恶意逻辑
外在原因都是软件外部给软件提供的各种非期望的条件,一种是客观存在于软件外部的系统中的环境异常,另一种是软件运行过程中人员造成的,可能是操作人员的失误,也可能是有人恶意的侵袭,见图3。
对于图3所示恶意逻辑和故意侵袭的防范
是软件保密性(security)工程的任务。其他软
件失效原因都是软件可靠性工程应予以考虑的,
特别是内在原因中的偶然失误。
(4) 软件失效的规律性
软件内部故障的出现时刻T是随机的。对于无容错的软件,出现故障就会失效,故障率即为失效率。如果软件内潜在N个缺陷,第i个缺陷引起的故障出现概率为,设各缺陷之间相互独立,则整个软件的可靠度,即在规定的条件下在规定的时间t内程序不出错地运行的概率为
整个非容错程序的失效率λ为诸 之和,
是第i个缺陷的失效率。
.软件可靠性工程方面的基本术语和概念
(1)软件可靠性工程
为了使系统中应用的软件产品满足系统可靠性要
求而进行的一系列软件工程活动。
软件可靠性工程涉及软件可靠性的分析、设计、
测评和管理等四方面活动和有关技术。实施软件可
靠性工程要解决三个问题,即①确定软件可靠性要
求,②保证实现软件可靠性要求,③验证软件产品
达到了可靠性要求。
(2)软件可靠性分析
指与软件可靠性有关的分析活动和技术。例
如:可靠性需求分析、可靠性指标分配、故
障树分析、失效模式和影响分析、软件开发
过程中有关软件可靠性的特性分析等。
(3)软件可靠性设计
为满足软件可靠性要求而采用的设计活动和
技术。例如:防错设计、容错设计、检错设
计、纠错设计、故障恢复设计等。
(4)软件可靠性测评
对软件产品及其相关过程进行的与可靠性相关的
测量、测试和评估活动。例如:软件可靠性测试、软
件可靠性估计、软件可靠性验证等。
软件可靠性测量主要目的是为控制和改进软件过
程、提供决策依据、保证实现软件产品可靠性要求服
务。因此,在软件生存期间要进行软件可靠性测量,
而且应由软件可靠性管理者负责。
软件可靠性测试是指为了实现和验证软件的可靠
性而对软件进行的测试活动。
软件可靠性评估也称软件可靠性估计。软件可靠
性估计是指应用统计技术处理在系统测试和运行期
间采集、观测到的失效数据,以评估软件的可靠
性。
(5)软件可靠性管理
为确定和满足软件可靠性要求所必须进行的一系
列组织、计划、协调和监督等工作。例如:制定和
监督实施软件可靠性计划,制定必要的设计和编程
准则,进行风险管理,改进费用效益关系,改进开
发过程,对采购或重用的软件进行可靠性管理。
3 .软件可靠性度量(参数)
GB/T 16260 《软件工程产品质量》给出了软件
可靠性的内部度量有11种、外部度量有18种和使用
度量有2种。此外,IEEE Std -1988 《用于开
发可靠软件的度量(法)词典使用指南》中推荐了39
种度量。
.一般的软件可靠性参数
(1) 可靠度
软件可靠度R是指软件在规定的条件下,规定的时
间段内完成预定的功能的概率。或者说是软件在规
定时间内无失效发生的概率。
设规定的时间段为 ,软件发生失效的时间为,则
R( )=P( > )
(2) 失效率
失效率是指在 t 时刻尚未发生失效的条件下,
在 t 时刻后单位时间内发生失效的概率。即:设
为 发生失效的时间,Z为失效率,则有
其中f(t)为失效概率密度函数。
如果在可靠性测试或使用中,对发生的失效不采取纠正活动,且使用是稳定的,即软件的操作剖面是不变的,则失效时间服从指数分布,即失效率为一常数。
失效率适用于要求失效发生频率比较低的系统,比如操作系统。
(3) 平均失效前时间MTTF/平均失效间隔时间MTBF
MTTF是指当前时间到下一次失效时间的均值。
在硬件可靠性中,MTTF用于不可修复产品,
MTBF用于可修复产品;对于软件则不能简单地用同
样的概念进行区分。软件不存在不可修复的失效,也
就是说软件失效是可修复的。但是,修复活动对失效
特性的影响和硬件存在着很大的不同。
对用户来说,一般关心的是从使用到发生失效的时间的特性,因此一般用MTTF更为适合。
对于投入稳定使用的、具有失效自恢复能力的软
件系统,可以选用MTBF参数。
4 .软件可靠性工程与产品系统可靠性工 程的关系
考虑系统可靠性时必须考虑其中的软件可
靠性,考虑软件可靠性时,要牢记软件是为
系统服务的,注意把软件放在系统之中,切
不可孤立起来单独考虑如何保证软件的可靠
性。
在实践中应遵守三条基本原则:
将软件可靠性工程纳入产品研制系统工
程,统一协调;
以软件工程为基础,注重软件开发过程;
在认真实施软件工程的基础上适当增加可
靠性工程必要的特殊措施。
.软件可靠性工程是系统可靠性工程的重要部分
仔细考虑软件与硬件的互补关系,选择最佳系统设计方案;
根据系统的可靠性指标或要求的分配明确软件可靠性要求;
估计实现软件可靠性要求所必需的软件研制周期和经费。这是成功实施软件可靠性工程的前提。
.系统可靠性工程必须充分考虑软件特点
软件是“通过承载媒体表达的信息所组成的一种知识产物”,其产品有如下特点:
a) 无形性:产品无一定形状;其制作过程的可视性也差;
b) 一致性:产品一旦形成,无论复制多少份均完全一致,无散差;
c) 不变性:产品形成后,无论存放多久,也无论使用多久,只要未经人为改动,就不会变化,不存在老化和耗损问题;
d) 易改动性:软件产品通常比硬件容易变更;
e) 复杂性:软件的运行路径通常很多,逻辑组合变化复杂,功能性也相对复杂。
.实施软件工程是实现系统可靠性工程与软件特点相结合的基本方法
(1) 认真实施软件工程
a) 解决过程不“透明”,不便于管理和控制;
b) 解决软件开发行为无规范,可能各个有关的单个产品都非常好,但无法将他们构成系统;
c) 人们以为软件开发就是编写程序,未理解到编程只是软件开发中较小的一部分(约占20%)工作,在编程之前和之后还有更大量的、且对于保证软件质量更为重要的工作。
(2) 在软件工程基础上增加可靠性特殊措施
据统计,通常如果认真实施软件工程,能保证软件失效率低达每单位时 。若要使软件可靠性更高,便需要采取一些特殊措施,例如采用防错和容错设计,规定设计和编程准则,采取特别严格的评审、加强测试和管理措施等
5. 软件可靠性工程和硬件可靠性工程的异同
软件可靠性工程与硬件可靠性工程的重要相似
点如表1所列,而其重要差别见表2.
表1 软件可靠性工程与硬件可靠性工程的相似点
必须采用系统工程的基本方法学
7
软件硬件互补的思想
6
FTA、FMEA、Petri网等方法的基本思想
5
冗余性容错设计的某些分析技术的原理
4
利用概率论和数理统计学研究产品可靠性
3
依靠设计与开发过程保证固有可靠性
2
产品设计越简单,越易保证其可靠性
1
技术方法上的类似点
序号
6. 软件可靠性工程与软件工程
. 软件工程是软件可靠性工程的基础
软件工程七条基本原理:
a) 按软件生存周期分阶段制定并实施计划;
b) 逐阶段进行确认;
c) 坚持严格的产品控制;
d) 使用现代程序设计技术;
e) 明确责任;
f) 用人少而精;
g) 不断改进开发过程。
.软件可靠性工程是软件工程的特殊分支
若要使软件失效率低于每单位时 ,便需要在认真实施软件工程的基础上,再采取一些特殊措施。但是这些增加的可靠性特殊措施一般需要很高的代价,例如,美国航天飞机飞行软件的开发费用比市售软件的成本高出百倍!因此如果没有特殊的可靠性需求,谁也不愿付出这种代价,更不会为这种特殊措施的基础技术准备进行相应的投入。
7.开发可靠软件的途径
.软件缺陷的形成
缺陷的形成与软件开发过程各阶段活动中的
许多因素相关,见表3。
.软件可靠性工程的实施途径
(1) 认真实施软件工程
实践中需注重做好以下六个方面的工作:
a) 系统地考虑软件生存周期全过程,决不能只重视编程工作。为此,首先需选择适当的软件开发方法学和相应的软件生存周期模型(或软件开发周期模型),作为软件开发和组织管理的共同的框架性依据,并进行全面策划;
b) 根据选定的软件生存周期模型(或软件开发周期模型),妥善定义软件开发过程,制定综合的软件开发计划,并认真实施,不随意改变;
c) 加强过程和产品控制,明确阶段转移准则,逐阶段验证,切实搞好配置管理;
d) 非常重视人的作用,及时配备适当人员,明确责任,注重培训和激励;
e) 重视软件过程规范化,切忌随意性,注意不断改进,提高软件过程能力;
f) 尽力采用先进而又适用的方法、技术和工具。
(2) 增加可靠性专门措施
假设实施软件工程时按照GJB 2786-96《武器系统
软件开发》的规定,将软件生存周期划分为如图4上
部所示的若干阶段,那么该图的中部和下部就概括
地表示应在不同阶段增加的技术方面和管理方面的
可靠性专门措施。
(3)各阶段增加的可靠性措施概述
(A)系统需求分析与设计阶段
需求分析与设计阶段,软件可靠性工程的基本任
务是确定软件可靠性要求:
(a)有时需在系统初步危险分析(PHA)的基础上确定软件安全关键等级;
(b)根据系统可靠性指标分配,拟订系统对软件可靠性的要求,明确软件失效的定义;
(c)对安全关键软件还应明确不期望的事件;
(d)权衡开发周期、投资和技术基础,确定软件可靠性指标要求和验收方法;
(e)在管理方面要保证软件具有必要的开发周期和投资,并提出软件可靠性工作项目要求;
(f)对这些要求的合理性和可行性应组织进行专家评审。
(B)软件需求分析阶段
(a) 确定软件的功能剖面和软件使用环境;
(b) 分析每种功能的关键程度,进行功能设计,分析不期望的事件,确定“关键功能”;
(c) 拟订软件需求规格说明时必须给出关于软件可靠性要求的具体规格说明,确定软件可靠性指标,明确软件可靠性的确认、验证方法;
(d) 制定软件开发计划时综合考虑软件可靠性工作项目要求,对可靠性有关的活动应作出明确的资源和进度安排;
(e) 组织制定必要的可靠性设计准则等;
(f) 阶段评审时应将关于可靠性的分析、规格说明、计划等列入重点内容;
(g) 确定软件可靠性数据采集要求和采集计划。
(C)软件设计阶段
(a) 可能时进行可靠性指标分配,将软件可靠性指标分配给软件部件;
(b) 按可靠性要求进行可靠性设计;
(c) 建立软件操作剖面;
(d) 进行可靠性有关的测量和分析;
(e) 收集并管理有关数据;
(f) 提出明确的可靠性相关的编程准则;
(g) 可能时进行可靠性预计和风险评估,并作出相应的管理决策;
(h) 确定对所采用的现成软件进行可靠性验证并纳入相应管理和控制的要求;
(i) 验证软件可靠性设计与需求的符合性,审查软件可靠性设计的合理性和实现的可行性。
(E)软件编码和单元测试阶段
(a) 遵守规定的编程准则;
(b) 进行严格的测试以减少软件内在缺陷,从而提高可靠性;
(c) 进行可靠性测量和分析;
(d) 对采用的现成软件进行可靠性验证和相应的管理;
(e) 收集并管理规定的可靠性数据。
(F)系统集成和测试阶段
(a) 继续软件可靠性测试,实现可靠性增长;
(b) 针对要求决不能发生差错的运行进行专门的(软件安全性)测试;
(c) 进行软件可靠性确认或验收测试;
(d) 必要时继续实现可靠性增长;
(e) 建立和实施软件的FRACAS;
(f) 确定软件使用阶段有关可靠性数据的采集要求和计划。
(G)运行维护阶段
(a) 制定并实施软件可靠性数据采集规程;
(b) 建立和实施软件的FRACAS;
(c) 测量可靠性,分析现场可靠性是否达到要求;
(d) 跟踪用户满意程度;
(e) 用可靠性测量数据指导产品和工程过程的改进。
十四、环境应力筛选
1.目的
环境应力筛选(ESS)是通过向电子产品施加合理的环境应力和电应力,将其内部的潜在缺陷加速成为故障,并通过检验发现和排除的过程,是一种工艺手段。环境应力筛选的目的是为了发现和排除不良元器件、制造工艺和其他原因引入的缺陷造成的早期故障。
2.依据
(a)GJB 450A-2004《产品可靠性工作通用要求》
(b)GJB 1032-90 《电子产品环境应力筛选方法》
(c)GJB/Z 34-93 《电子产品定量环境筛选指南》
3.适用对象与适用时机
环境应力筛选主要适用于电子产品,也可
用于电气、机电、光电和电化学产品。
在研制阶段,产品参加大型试验前或进
行可靠性增长试验或鉴定试验前,均须先通
过环境应力筛选。批生产阶段的环境应力筛
选在产品交付前完成。
4.环境应力筛选设计基本准则
(1)安全性准则
(2)可行性准则
(3)经济性准则
(4)任务关键性准则
5 .环境应力筛选的组装等级选择
为了保证消除早期故障,应在产品的不同
层次(组装等级)上进行环境应力筛选。对
任何一个组装等级的筛选不能代替高一级组
装等级的筛选。任何一个高一级的筛选,虽
然能部分代替低一级组件上的筛选,但筛选
效率将降低,且筛选成本大大提高。
图1为一个典型的制造过程。此图说明了
在各组装等级的制造过程中,由于使用了外
购线路板、组件、单元,并进行布线和装焊
操作,都有可能引入新的缺陷,证明了在各
组装等级都进行筛选的必要性。意味着在每
一组装等级都需要进行筛选,而是要从技术
效果,费用效果以及故障可测试性等方面进
行评估,作出决策。
图1 典型制造过程
6.典型环境应力类型
常用的应力及其强度、费用和筛选效果如下表所示。
常用的应力及其强度、费用和筛选效果
很好
很高
高
温度循环与随机振动
组(综)合
好
高
高
随机振动
不显著
适中
较低
扫频正弦
振动
较好
适中
较高
温度冲击
好
高
高
快速温变
不显著
较低
较高
慢速温变
温度
循环
对元器件较好
低
低
恒定高温
温度
筛选效果
费用
应力
强度
应力类型
环境应力
美国有关的统计数据表明,温度筛选出缺陷的比例约占80%,振动约占20%,见表3,可供参考。必须强调的是,产品(电子、机电、光电、电气)特性会对这些百分比产生重大影响。热应力在揭示有缺陷的元器件方面起主要作用,而随机振动在揭示工艺和组装缺陷方面起主要作用。
表3 各种产品中筛选出缺陷的分布情况(供参考)
21
79
平均值
45
12
13
7
29
23
13
13
27
26
55
88
87
93
71
77
87
87
78
74
单 元
单 元
单 元
单 元
单 元
单 元
单 元
模 块
单 元
模 块
飞机发电机
计算机电源
航空电子设备计算机
舰载计算机
接收处理机
惯导装置
接收系统
机载计算机
控制指示器
接受发射机
振 动
温 度
ESS用的应力筛选缺陷的百分比 %
ESS所在组装等级
硬件类型
7.环境应力筛选方法
除了元器件筛选采用高温老炼筛选方法之外,针
对电路板或者组(部)件级以上组装等级的产品,
通常采用常规筛选方法,国外已经应用定量筛选和高
加速筛选方法。
.推荐的初始筛选方法
初始筛选方法是根据多年来开展环境应力筛选的经验总结出的一个通用性较强的方法。它仅仅是在无法确定常规筛选和定量筛选方法之前,或在研制过程中无法获得产品任何有关信息时,可参考或借鉴的一种方法。
根据
推荐的初始筛选方法,结合产品特点和筛
选设备状况等设计该产品的筛选方法。
.常规筛选方法
常规筛选方法是以GJB 1032提供的方法为
依据,并借鉴了定量筛选(GJB/Z 34)和相
关参考资料中一些相关的内容。
常规筛选是指不要求筛选结果与产品可靠性
目标和成本阙值建立定量关系的筛选。筛选所用
的方法是凭经验确定的,仅以能筛选出早期故障
为目标。常规筛选的结果,如图所示。产品的
故障率可能到达F点( ),也可能到达其
它点,具体取决于所用筛选方法。
图10 筛选剔除寿命期浴盆曲线早期故障部分示意图
.常规筛选大纲
无论是研制阶段还是生产阶段,均应制定
切实可行的环境应力筛选大纲,作为备件和修理件
单独采购的低组装等级的产品也应制定相应的筛选
大纲。
常规筛选大纲至少应包括以下内容:
(a)目的
(b)依据标准和文件
(c)受筛产品的说明
包括受筛产品的工作原理、组装等级(电路板
级、组(部)件级、单元或产品级)、技术状态、
物理尺寸、重量,复杂程度等;
(d)筛选设备(温度箱,振动台等)的要求;
(e)检测仪器仪表及其精度说明;
(f)筛选方法;
• 使用的应力类型及应力参数
• 通/断电要求
• 检测要求
• 无故障要求
(g)性能检测(筛选前后和筛选期间)项目;
(h)筛选过程及故障记录;
(i)其它有关方面的要求。
.环境应力筛选大纲的设计程序
(1)研制阶段环境应力筛选大纲的设计程序
1)研制阶段筛选的目的
A)收集初始设计的产品中可能存在的缺陷 类型和数量方面的信息,这些信息为采取纠正措施,提高产品的固有可靠性提供依据,当筛选产品的结构、元器件供应质量水平及制造工艺与批生产相同时,这种信息更有价值。
B)通过对筛选出的故障信息的分析,确定对该产品最有效的筛选方法,为设计批生产筛选大纲作准备。
2)设计步骤
(A)收集信息
包括:
A)在结构设计、复杂程度、制造工艺和使用环境方面与其相类似的产品应用的筛选大纲及其效果;
B)可能提供用于进行筛选的设备(主要是温度和振动设备)及其能力;
C)可能进行环境应力筛选的场所;
D)产品耐环境设计极限(温度和振动);
E)环境鉴定试验应力量值(温度和振动);
F)产品的基本结构特点和复杂程度;
G)预期缺陷的主要类型。
(B)选择初始方法
如有相似设备的筛选方法,且具备使用此方法的筛选设备,则可将其作为此研制产品筛选用的初始方法;如没有,则可参考表-5中推荐的初始筛选方法。
(C)调整
根据筛选大纲的设计准则和已具备的上述信息,粗略调整初始方法中各有关内容,如温度循环的上限、下限温度,持续时间、循环次数、振动量值等等。
(D)编写环境应力筛选大纲
编写的大纲应力求详细明确,其内容和格式应符合附录的要求。
(2)批生产阶段筛选大纲的设计程序
1)批生产阶段筛选的目的
产品投入批生产时,其设计、结构和制造工艺已基本固定,使用的元器件和外购件的种类、数量及其质量水平也已明确,又具备研制阶段执行环境应力筛选取得的各种信息,因此,批生产阶段筛选的目的是用最经济、有效的方法发现、排除产品的早期故障。
2)设计步骤
(A)收集信息,包括:
A)研制阶段筛选中析出故障的信息,特别是故障类型分布和数量,以及故障所在的部位的信息。
B)研制阶段其他试验中析出故障的信息,这些试验包括性能试验、环境试验、可靠性试验等。
C)产品对温度和振动响应特性信息,包括产品中的热点、温度稳定时间、产品的共振点、产品中振动响应最大部位等等。
D)产品使用的元器件和其他外购件质量水平的信息。
E)产品从试生产转入批生产,生产条件改变方向的信息。
(B)分析评价
对以上信息进行分析研究并评价研制阶段应力筛选的优、缺点,确定要修改的关键环节。
(C)设计
A)以研制阶段筛选大纲为基础的设计。如果通过研制阶段筛选大纲和有关信息分析,认为该大纲基本可行,则可按规定的设计准则对此大纲作适当的调整,作为生产早期阶段的筛选大纲。
B)出现下述任何一种情况,则应按规定重新设计 生产阶段筛选大纲:
改换筛选用设备,所提供的应力与研制阶段大
纲规定的应力种类不同时,如从正弦振动台改用随
机振动台;
改变筛选所在组装等级,如原来是整机筛选,现
仅用组件筛选,从而必须改变温度循环的上、下温
度和变化速率。
3)筛选大纲的调整
投产时设计的环境应力筛选大纲,往往由于下述一些因素的影响,不可能是最佳的大纲。
(a)产品中还存在一些设计缺陷;
(b)对外购的元器件质量水平和稳定性了解不充分;
(c)对采用的新工艺引入缺陷的可能性了解不充分;
(d)对检测仪表和测试设备的检测能力了解不够;
(e)工人操作不熟练;
(f)对选择的应力的效果不够清楚;
(g)存在许多无法预估的引入缺陷的机会。
生产中应收集应力筛选期间及筛选以后使用中出现的所有故障信息,对这些故障信息进行分析并采取纠正措施,填写好故障记录表,并将其纳入FRACAS系统。
应在适当阶段,根据纳入FRACAS中的此大纲的筛
选效果及产品交付后现场使用早期故障信息情况,
对筛选大纲进行评价并作出必要的调整。即使是投
产时很有效的筛选,随着产品的成熟,引入缺陷机
会减少,也有必要根据实际情况进行调整,使筛选
更加经济有效。
如果筛出的故障很少,而现场使用中早期故障频
繁,则应提高应力水平或改变施加应力的类型;如
果筛选后对产品性能有影响则应降低应力强度。随
着产品日趋成熟,产品中潜在缺陷类型和比例发生
变化,也有必要重新评价筛选,改变筛选应力和筛
选所在组装等级。
.环境应力筛选大纲的实施
(1)一般要求
为了保证正确、顺利地实施环境应力筛选大纲,受筛选产品、设备和仪器、筛选过程操作等方面一般还应满足以下规定的要求:
(A)环境应力筛选对象
研制阶段和批生产初期的全部产品均应进行环境应力筛选;在批生产中、后期可根据产品批量及质量稳定情况进行抽样筛选。产品如改为抽样筛选需经订购方的同意。
(B)试验产品的要求
(a)所有试验产品应具有检验合格证明;
(b)所有试验产品应去除包装物及减振装置后再进行试验。
(2)试验室大气条件
试验室大气条件,见GJB1032中的节。
(3)环境应力条件允差
环境应力条件允差,见GJB1032中的节。
(4)筛选设备要求
筛选设备要求,见GJB1032中的节。
(5)检测仪表要求
所有检测仪表的精度至少应为被测变量容差的三分之一;
所有检测仪表能实时传输一切关键性能参数的数
据;
所有检测仪表应能提供全部环境应力条件的连续
的、永久性的记录;
所有检测仪表应有计量合格证明并定期进行检定。
(6)受筛产品要求
(a)提交筛选产品应处于交付状态,具有检验合格
证明;
(b)提交温度循环筛选的产品,应涂好使用中要涂
的保护漆,除去包装物或保护罩;
(c)提交振动的产品,不允许临时加固、加支撑,
且不带减振装置。
(7)筛选中修理和修理用备件要求
(a)筛选中故障修理时,应注意操作,避免碰伤
好的元器件,引入新的缺陷;
(b)筛选中出现故障进行修理中,换上的备用元
器件和备件应是经过按与被换元器件和备件
同样的条件筛选过的元器件和备件。任意使
用劣质元器件和备件将会使修理引入新的缺
陷。
(8)支架和夹具要求
1)支架要求
如果温度箱中没有搁架,应当预先准备受筛产品支架,支
架必须有足够高度,不阻碍箱内空气流动,又保证受筛产
品处于试验箱有效容积内。
2)夹具要求
(A)设计要求
(a)应当根据振动台面安装孔和受筛产品结构形状设计专
门夹具,并保证产品受激励方向是其敏感方向。要在几
个方向进行振动时,应便于轴向转换。
(b)设计的夹具要保证最轻而又有足够大的刚度一般采用
铝合金、镁合金,也可用钢或其他材料。
(c)设计的夹具在筛选频率范围内应避免产生共振或把共
振放大因子控制在允许范围内。
(B)检验要求
验证共振特性和传递特性可用正弦扫频或随机激励振
动系统进行,加速度为1~2(低频时可用定位移),
扫频速率一般不大于1倍频程/分钟。
控制用的加速度计可安装在振动台面与夹具的
连接点处,对于大型夹具可采用多点平均值控制方
式,以减少各连接点处量值的差别。用于测量夹具
响应点处传递性的加速度计要安装在受筛产品与夹
具的连接处,该处是夹具传递振动给受筛产品的地
方,代表夹具的动态特性。
检验结果应是夹具在筛选频率范围内无共振或
无过大的优势频率;保证其给受筛产品任何安装点
(与夹具连接)处在加振轴向上的振动输入,在规
定频率范围(20~2000Hz)内都能保持在规定输入
值的±3dB以内,横向振动不应超过规定输入量
值。在500~2000Hz范围内,偏离输入量不能超过
±6dB,累积带宽不超过300Hz。
(9)安装要求
1)产品安装要求
(A)温度箱内安装
受筛产品在箱内的安装,除必要的支点外,产品
应被空气包围,不能直接放在箱底,也不能放在实
心垫板上,以保证受筛产品四周都能直接与空气进
行热交换。
受筛产品体积不能大于温度箱的1/5(不发热产
品)或1/10(发热产品),受筛产品必须置于温度
箱的有效容积内。
一台产品进行筛选时,尽量置于试验箱中央,多
台产品同时进行筛选时,除了其总体积不能违反上
述规定外,各台产品之间应保持一定距离,以利于
箱内空气的流动,保持试验箱内温度均匀。如图
11所示
图11 应力筛选温度箱
(B)振动台上的安装
振动筛选时一律不带减振装置。
振动中受筛产品的固定安装要保证整个产品能
产生宽带响应。为了保证筛选的有效性和避免增加
筛选中可变性,一次筛选一个产品最为理想。如果
在同一夹具上安装多个受筛产品进行筛选,则应做
到:
用安装在应有位置上的所有产品进行振动调
查,以测量包括所有产品的总的响应;
用安装在应有位置上的所有产品(实际产品,
而不是模拟质量块)进行筛选;
筛选期间将每个受筛产品在夹具上的位置记录下来。
(C)检测系统线路连接
筛选中要检测性能时,无论是在温度箱还是振
动台上安装好后要连接好各种检测线路和测试仪
表,保证接触良好,严格避免施加振动应力或测试
中仪表移动后出现接触不良造成的虚假故障。
(D)性能测试要求
无论是在温度箱还是振动台上安装好后,均应
进行一次施加应力前的全面的性能测量,并作好记
录,以保证受筛产品性能完好,未因安装受损。
2)传感器安装要求
(A)温度箱中传感器安装
应当在受筛产品附近和热惯性大的表面等处安装
温度传感器,以监测空气温度变化速率和产品表面
等处的温度变化速率。若有关键元部件,还应监测
关键元部件的温度,避免其受过应力。
(B)振动传感器安装
应当在固定夹具和受筛产品连接处附近,安装一
个或多个传感器,用以控制振动输入,应当在受筛
产品适当或关键部件安装振动传感器,以监测该部
位的振动响应,避免受到过应力。传感器选择的位
置应能保证准确地测量到受筛产品的振动输入和响
应。
(10)性能检测和记录要求
1)筛选前
产品进入筛选前,安装在温度箱或振动台上后,
应进行全面的性能检测并作好记录,以确认用于筛
选的产品是否完好并提供用以比较的性能基准。进
行完筛选前测试后的受筛产品不能再进行如清洗、
保形涂覆等工艺处理。
2)筛选期间
筛选期间的性能检测的目的是为了发现故障,包
括只有在筛选应力作用下才出现的故障,以便能及
时修复更换,缩短筛选时间。筛选期间性能检测项
目可适当简化,但不能影响发现故障的能力。筛选
期间应详细记录故障出现时的应力、时间、故障行
为和修复情况。
3)筛选后
产品筛选后要进行全面的性能检测并作好记录,
以确定受筛产品性能是否完好。
(11)建立、运行故障报告、分析和纠正措施系统(FRACAS)
环境应力筛选工作从一开始就应纳入产品
FRACAS系统中。在筛选期间、筛选后、使用中所
记录的故障信息和修理情况,可对筛选效果进行评
价和作为筛选大纲调整的依据,也能为相似设备的
可靠性工作提供有益信息。
(12)安装后的试运行
1)温度箱安装后的试运行
受筛产品在温度箱中安装后,应按规定的循环参
数要求使温度箱试运行,观察试验箱能否按规定的
温度变化速率进行温度循环。试运行两个循环后,
如能满足要求,则可投入筛选,若达不到要求,则
应更换试验箱或筛选条件。
为了节省时间,可以在试运行期间按正常筛选要
求进行通、断电和性能检测。如果试运行中温度箱
能提供满意的温度循环参数且产品未出现故障,则
可将此两个循环作为正式试验循环计入试验循环
数。
2)振动台试振动和振动谱的最终调整
受筛产品安装在振动台上后,应采用低量值正弦
扫频或随机振动调查产品的振动输入特性,若发现
对受筛产品的振动输入有明显的共振高峰或低谷,
则应设法修改振动谱,使高峰频率处输入减少,低
谷频率处输入增加,直到正式振动时,受筛产品的
振动输入处在容差范围内或不超过合格鉴定的等效
值。
(13)筛选条件保证措施
1)定期检定无频谱反馈控制下的筛选频谱特性
推荐每一季度或使用200次(以频数多者为准)检定
一次筛选谱。可在夹具上安装惯性相当的质量块代替筛
选的正式产品。
2)标定
必须使振动设备和测量仪器处于适当的标定状态,以
保证筛选按预定量值进行,均方根值表、显示仪、分析
仪应按规定要求标定。
3)预防性维修
为保持夹具处于适当状态,需要对连接硬件、螺纹插
入件等进行鉴定。应根据使用情况制订一个定期更换所
有连接硬件的计划。这将消除不适当的安装、固定可能
引起的振动筛选的变化。像热交换器、过滤器等产品应
严格地实行预防性维修,以减少由筛选装置造成的停工
时间。
.环境应力筛选大纲的实施过程
本节以GJB 1032中规定的筛选程序为基础,说明
典型的环境应力筛选全过程,图12是GJB 1032中安
排的环境应力筛选应力筛选组成图。本节结合此图
说明常规环境应力筛选如何实施。
性能检测
尽最大可能监测性能
性能检测
最长不超过
(15min)
最长不超过20循环
(80h)
常
温
运
行
5min连续
无故障
10循环连续无故障
(40h)
10循环
(40h)
5min
常
温
运
行
检
查
随机振动
温度循环v
温度循环
随机振动
3-2B
3-2A
3-1B
3-1A
无故障运行
寻找排除故障
3-2
3-1
最
终
运
行
环境应力筛选应力施加
初
始
运
行
准
备
4
3
2
1
图12 环境应力筛选程序图
注:
①在最后4次温度循环和整个无故障检验随机振动时间内必须进行100%功能监测。
②环境应力筛选期间,若监测的参数足够充分,则最后性能检测一般不应算做无故障检验的一部分,但若最后性能检测发现故障需重新进行无故障检验。
(1)筛选前的准备工作
1)检查
筛选前应按上述一般要求中的规定,检查受
筛产品的技术状态、筛选用试验设备和检测
仪表、夹具等是否符合要求。
2)筛选前测试
受筛产品应按有关标准或技术文件进行外观、
机械及电气性能检测并记录。凡检测不合格者不
能继续进行环境应力筛选。
(2)寻找和排除故障阶段(3-1)
1)随机振动(3-1A)
(A)安装
将受筛产品安装在振动台上,不管实际使用中是否带减振
器,安装时不加减振器;固定好振动输入控制传感器和振动
响应传感器;连接好产品功能检测线路和传感器线路;检查
是否因安装损坏情况或连线不当之处,并测量性能。
(B)振动
施加振动,观察响应加速度计测得的响应特性,以调整谱
形(此工作最好在事先进行),当响应谱符合要求时,继续
施加振动,此时产品通电工作,并监测其功能,注意是否故
障。
(C)故障处理
振动期间出现故障,如可能,应任其发展。到5分钟结束
时,再进行修复。当不加振动无法确定故障部位时,可按
GJB1032中规定用低量值随机振动寻找故障部位,振动故障
修复后转入温度循环。
2)温度循环(3-1B)
(A)安装
将受筛产品安装于温度箱中,并布置好各种
温度传感器。连接好产品功能测试线路和传感器
线路。检查有否因安装损坏情况和接线不当之
处,并测量性能。
(B)试运行
若以前未进行受筛产品与试验箱之间的相容性
运行,则先应按一般要求进行试运行(此工作一
般应先进行)。
(C)进行温度循环
按大纲中规定的温度循环曲线进行温度循
环,产品通电工作并监测其功能,注意有无故障
出现。
(D)故障处理
温度循环期间受筛产品出现故障,而且出现
此故障后必须切断电源或会影响监测受筛产品性
能时,应立即中断循环,按GJB 1032中规定进
行故障调查并加以恢复,修复部分进行局部检验
合格后从该循环的开始点继续进行循环,出现故
障的循环无效;如果虽出现故障但仍可在升温、
保温阶段通电,则可将故障调查和修复过程推迟
到该循环结束时进行,此时该循环有效。
(3)无故障检验运行阶段(3-2)
1)温度循环(3-2A)
继续进行温度循环,温度循环参数不变,但应从
此刻记录无故障循环数。若从第11循环开始连续
10个循环不再出现故障,则认为完成无故障运
行,可转到下一步。若在第11~20循环间还出
故障,则尚允许修复,只要以后有10个循环能连
续无故障,仍可认为完成无故障运行,转入下
一步。若在第21个循环还出故障,则认为受筛产
品未通过筛选。
2)随机振动(3-2B)
只有通过了温度循环筛选的产品才能转入这一步。
(A)安装。
其要求同随机振动(3-1A)。
(B)振动
按规定的输入量值使产品振动,并使产品通电工
作,监测其性能,注意是否有故障。
(C)故障处理
若连续振动5分钟不出现故障,则可认为产品通过
了随机振动筛选,可转入下一步;若在振动后的累
积10分钟之内还出现故障,尚可修复,修复后有连
续5分钟不出故障,可认为产品通过振动筛选;若振
动10分钟后还出故障,则认为受筛产品未通过筛
选。
(4)最终运行和检查
只有通过了温度循环和振动筛选的产品才转入这
一步。未通过的产品应进行仔细分析,以决定是否
有价值或有必要继续进行筛选。
使通过无故障筛选的受筛产品在规定的标准环境
条件下运行并按受筛产品规范中的规定检测其性
能,记录结果,以验证受筛产品能否满意地工作。
将最终运行测量值与初始测量值进行比较,根据
受筛产品规定的极限验收值对筛选作出评价。
最终运行试验期间若出现故障,只要施加环境应
力期间性能测试项目足够,则可认为无故障筛选是
有效的,不必重新进行无故障筛选。如果认为施加
环境应力期间性能检测项目不足,不能发现全部故
障,则应重新进行无故障运行。
.应用效果示例
某飞机机载电子产品,在批生产过程中采用温度
循环和随机振动组合施加的方法,进行通电筛选。
选取该设备中各组件设计工作温度的最高的低温温
度(-55℃)作为筛选温度下限极值,温度稳定后
保持3小时;选取该设备中各组件设计工作温度的最
低的高温温度(+60℃)作为筛选温度上限极值,
温度稳定后保持5小时;温度变化速率选为
5℃/min;筛选选用GJB 1032和GJB/Z 34中推荐的
随机振动功率谱(
(10分钟);由于该电子设备仅有1200个元器件,
确定每
循环8小时,共进行了3个温度循环的筛选。筛
选中出现了三极管管脚断,电阻、电容引线
断,继电器引线断和电容击穿等故障。表6中
给出了故障件的有关信息。
表6 某产品筛选发现的缺陷
√
一腿断开
电阻(RJ-1-620Ω±5%)
√
一腿松动(虚焊)
电容(CA-40V-22μF)
√
两腿断开
电容(CA-40V-22μF)
√
瞬间导通,软击穿
电容(CA30-40V-47μF)
√
第7条引线断开
继电器
√
c、e极管脚断开
三极管(3DK4B)
随机
振动
温度
循环
环境应力
缺陷类型
早期故障件
十五、可靠性鉴定和验收试验
1.目的
可靠性鉴定试验与可靠性验收试验同属于统计试验。
可靠性鉴定试验的目的是在产品设计定型阶段验证产品的设计是否达到了规定的可靠性要求。
可靠性验收试验的目的是为了确定已通过可靠性鉴定试验而转入批生产的产品在规定的条件下是否达到规定的可靠性要求,验证产品的可靠性是否随批生产期间工艺、工装、工作流程、零部件质量等因素的变化而降低。
2. 依据
GJB450A《产品可靠性工作通用要求》
军定字[2002]第16号《军工产品定型工作条例》
GJB899《可靠性鉴定和验收试验》
《设备可靠性试验成功率的验证试验方案》
《数据的统计处理和解释二项分布可靠度单侧置信下限》
GJB150《军用设备环境试验方法》
3. 适用时机
可靠性鉴定试验适用于产品的设计定型阶段。可靠性验收试验则在批生产产品交付前进行。
4. 试验场所的确定原则
可靠性鉴定试验由具备可靠性鉴定试验资格的第三方单位进行。
5. 故障分类
. 故障判据
在试验过程中,出现下列任何一种事件即应判为故障:
(a)受试产品或产品的一部分丧失一个或几个功能;
(b)产品或产品的一部分性能参数超出产品技术条件中允许的范围;
(c)受试产品出现机械零部件、结构件或元器件的松动、断裂等损坏状态。
若订购方无其他规定,则可靠性试验期间出现所有故障应按GJB451A分为关联故障和非关联故障,责任故障和非责任故障。非关联故障是已经证实未按规定的条件使用而引起的故障;或已经证实仅属于某项将不采用的设计所引起的故障。否则为关联故障。非责任故障是指非关联故障或事先已经规定不属某个特定组织提供的产品的关联故障。否则为责任故障。
. 责任故障
受试产品出现以下事件并判明是由于设计、工艺、材料、元器件等原因所引起的则应判为责任故障,是判决受试产品合格与否的依据。
(a) 受试产品或其中一部分不能完成规定的功能的事件或状态;
(b) 受试产品的性能参数超出规定指标要求;
(c) 机械构件发生永久变形或损坏;
(d) 元器件、部件或整机随机失效;
(e) 电路烧毁;
(f) 操作人员按使用说明书规定方法操作时而引起的受试产品故障;
(g) 其它责任故障。
. 非责任故障
在试验期间,出现以下事件均判为非责任故障,非责任故障不应作为判决受试产品合格与否的依据。
(a) 由于试验设备故障而造成的受试产品故障;
(b) 超出产品技术规范规定的环境条件和工作条件引起的受试产品故障;
(c) 由于安装不当或意外事故引起的受试产品的故障;
(d) 由于人为错误(如误操作等)而引起的故障;
(e) 因检测仪器故障而造成的性能参数超差;
(f) 由某一独立故障而引起的相关从属故障;
(g) 在寻找故障、验证修理或调试过程中引起的故障。
(h) 由于BIT(自检测)软件设计不当引起的虚警可不计为责任故障,但必须进行充分分析、记录并及时反馈给总师系统,同时采取有效纠正措施,并在测试性验证过程中进行检验。
. 统计试验方案中的有关参数
以下可靠性统计试验参数构成了一个完整的可靠性统计试验方案,分别定义如下:
(a)检验下限(θ1或R1):拒收的MTBF值或不可接收的成功率,统计试验方案以高概率拒收其真值接近θ1或R1的产品;其值可取设计定型最低可接受值。
(b)检验上限(θ0或R0):可接收的MTBF值或可接收的成功率,统计试验方案以高概率接收其真值接近θ0或R0的产品。其值应小于等于预计值。
6. 统计试验方案
(c)鉴别比(d):指数分布统计试验方案的鉴别比(d)等于(θ0/θ1);二项分布统计试验方案的鉴别比(DR)等于(1- R1)/(1- R0)。
(d)生产方风险(α):产品在其可靠性真值已达到其检验上限θ0或R0,但在试验时却被拒收的概率,这个概率值表明采用该统计试验方案给生产方带来的风险。即将合格产品批判为不合格产品批而拒收,使生产方受损失,把犯这种错误的概率称为生产方风险。
(e)使用方风险(β):产品在其可靠性真值没有达到θ1或R1 ,但在试验时却被接收的概率,这个概率值表明采用该统计试验方案给使用方带来的风险。即将不合格产品批判为合格产品批而接收,使使用方受损失,把犯这种错误的概率称为使用方风险。
(f)抽样特性曲线(或称OC曲线):它表示对于给定的抽样方案,批接收概率与批质量水平的函数关系。从OC曲线可直观地看出抽样方式对检验产品质量的保证程度。
.统计试验方案类型及其适用范围
统计试验方案分类如图1。
图1 统计试验方案分类
各统计试验方案分类优缺点及适用范围如表 1。
不服从于指数分布、且不服从于二项分布的产品。比如某些耗损型产品、机械产品等。
-
-
其它统计试验方案如威布尔分布
服从二项分布的产品
-
-
二项分布试验方案
服从指数分布或二项分布的产品
可靠性验收试验
对受试产品的可靠性有充分的信心,能够较快地做出接受判决的产品的可靠性鉴定试验
失效数及试验时间、费用在试验前难于确定,不便管理
从试验时间和试验样本量,这两方面节省了试验成本,且能较快的作出接收或拒收的判决
序贯截尾统计试验方案
服从指数分布的所有产品
对于可靠性特差或特好的产品,做出判决所需的试验时间较序贯试验长
判决故障数及试验时间、费用在试验前已能确定,便于管理
定时截尾统计试验方案
服从指数分布或二项分布的产品
试验时间不可控,不利于试验的管理
统计结果精确
定数截尾统计试验方案
适用范围
缺点
优点
统计试验方案
A)指数分布统计试验方案适用于其可靠性指标可以用时间度量的电子产品、部分机电产品(如惯导等)、及复杂的功能系统。二项分布统计试验方案主要适用于其可靠性指标用可靠度或成功率度量的成败型产品(如导弹用设备等),但采用该试验方案需要足够多的受试样本。只有当指数分布统计试验方案和二项分布统计试验方案都不适用的情况下(如多数的机械产品)才考虑采用其它统计试验方案,如威布尔分布统计试验方案。
B)定时试验方案的优点是判决故障数及试验时间、费用在试验前已能确定,便于管理,是目前可靠性鉴定试验中用得最多的试验方案。其缺点是对于可靠性特差或特好的产品,做出判决所需的试验时间较序贯试验长。序贯截尾试验优点是对于可靠性特差或特好的产品能够较快地做出拒收或接收的判决,一般适用于可靠性验收试验,也适用于对受试产品的可靠性有充分的信心,能够较快地做出接受判决的产品的可靠性鉴定试验;其缺点是失效数及试验时间、费用在试验前难于确定,不便管理。定数试验方案适用于成败型产品。
. 指数分布统计试验方案
.定数截尾统计试验方案
从一批产品中,随机抽取n个样品,当试验到事先规定的截尾故障数r时,停止试验,r个故障的故障时间分别为:t1≤t2≤…≤tr,则抽验规则为:
当 ≥c 产品批合格,接收
当 <c 产品批不合格,拒收
其中c合格判定数,抽验方框图如图 2所示。
图 2 定数截尾一次抽验方案方框图
表 2给出部分抽验方案。
鉴别比
2
2
3
3
10
3
4
4
5
5
6
8
8
10
3
15
18
19
23
2
41
52
55
67
c/θ1
r
c/θ1
r
c/θ1
r
c/θ1
r
β=
α=
β=
α=
β=
α=
β=
α=
表 2定数截尾抽验方案表
例1某产品生产方风险与使用方风险相同,均取α=β=,并已确定θ1=200h,θ0=1000h,试确定一个定数截尾抽验方案。
解: 根据 ,α=β=,查表 2得:
r=3,c/θ1=
则 c=×200=367(h)。
得方案:截尾故障数r=3,合格判定数c=367(h)。即任取n个产品(无替换n>4) ,试验到r=3时,停止试验,计算,判断:
若 ≥367时,接收, <367时,拒收
. 定时截尾统计试验方案
随机抽取一组样本量为n的样本进行可靠性鉴定试验。试验进行到累积时间达到预定值T*时截止。设在试验过程中共出现r次故障。如果r≤Ac(接收数),认为批产品可靠性合格,可接收;如果r≥Rc(拒收数),认为批产品可靠性不合格,拒收。其方框图如图 3。
图3 定时截尾一次抽验方案方框图
GJB899-90《可靠性鉴定和验收试验》提出了标准型定时试验方案及短时高风险定时试验方案。标准方案采用正常的α、β值为10%~20%。短时高风险试验方案采用α、β值为30%,MTBF的可接收质量水平θ0与最低可接收值θ1之比,即鉴别比d=θ0/θ1取、、。由于方案中的接收数Ac=c、拒收数Rc=c+1都只可能是整数,因此,P(θ0)及P(θ1)只能尽量分别接近原定的1-α与β。原定的α、β值叫名义值,α、β的实际值α’、β’见相应表格。
例2 设θ1=500h,d=;α=β=20%。试为该产品设计一个寿命满足指数分布的可靠性定时试验方案。
解: 根据已知条件可得:θ0=dθ1=×500h=1000h,查方案表,相应的方案为方案14。查得相应的试验时间为θ1,即×500=3900h,Ac=5,Rc=6。因此,该方案为:
预定总试验时间T*=3900(台时),如当试验停止时出现的故障数r≤5,则认为该产品可靠性合格,接收;在试验累积时间未达T*,故障数r达Rc时,停止试验,认为该产品可靠性不合格,拒收。并根据试验结果用定时(接收时)或定数(拒收时)截尾公式作点估计及以规定的置信度C作区间估计。
对于常用的两类风险α、β及鉴别比d,GJB899-90《可靠性鉴定和验收试验》中已给出了标准型定时试验方案简表和短时高风险定时试验方案简表,见表 3和表4。表中试验时间即为总试验时间T,是以θ1的倍数给出的;判决故障数中的接收数即为合格判定数c,拒收数为c+1。该标准中还提供了一套更详细的定时截尾试验抽验方案,如表5~表7。如果认为选用这类试验方案比选用表 3~表4中的试验方案更为合适,则可以根据表5~表7中提供的方案来选择。
36
25
17
13
9
5
5
3
2
37
26
18
14
10
6
6
4
3
10
20
20
10
20
20
10
20
20
10
10
20
10
10
20
10
10
20
9
10
11
12
13
14
15
16
17
β′
α′
β
α
接收
(≤)
拒收(≥)
实际值
名义值
判决故障数
试验时间(θ1的倍数)
鉴别比
d=θ0/θ1
决策风险 %
方案号
表3 标准定时试验方案简表
6
2
0
7
3
1
30
30
30
30
30
30
19
20
21
β′
α′
β
α
接收
(≤)
拒收(≥)
实际值
名义值
判决故障数
试验时间(θ1的倍数)
鉴别比
d=θ0/θ1
决策风险 %
方案号
表4 短时高风险定时试验方案简表
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
10—1
10—2
10—3
10—4
10—5
10—6
10—7
10—8
10—9
10—10
10—11
10—12
10—13
10—14
10—15
10—16
10—17
10—18
10—19
10—20
α=10%
α=20%
α=30%
拒收
接收
鉴别比 d
MTBF的观测值 (θ1的倍数)
总试验时间
(θ1的倍数)
判决故障数
方案号
表5 使用方风险β=10%的定时试验方案
+
+
+
+
+
+
+
+
+
+ + + + + + + + + + +
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20—1
20—2
20—3
20—4
20—5
20—6
20—7
20—8
20—9
20—10
20—11
20—12
20—13
20—14
20—15
20—16
20—17
20—18
20—19
20—20
α=10%
α=20%
α=30%
拒收
接收
鉴别比 d
MTBF的观测值
(θ1的倍数)
总试验时间
(θ1的倍数)
判决故障数
方案号
表6 使用方风险β=20%的定时试验方案
+ + + + + + + + + + + + + + + + + + + +
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
30—1
30—2
30—3
30—4
30—5
30—6
30—7
30—8
30—9
30—10
30—11
30—12
30—13
30—14
30—15
30—16
30—17
30—18
30—19
30—20
α=10%
α=20%
α=30%
拒收
接收
鉴别比 d
MTBF的观测值
(θ1的倍数)
总试验时间
(θ1的倍数)
判决故障数
方案号
表7 使用方风险β=30%的定时试验方案
例3某产品已知MTBF最低可接收受值θ1=300h,d=3,α=β=20%,受试产品为2台,试设计一个定时截尾可靠性鉴定试验方案。
解: 查表3可知,满足d=3,α=β=20%的试验方案仅有方案17。
可得定时截尾可靠性鉴定试验方案为:
(a) 总试验时间T=θ1=×300=1290(台时)
(b) 接收责任故障数r≤2,拒收责任故障数r≥3。
(c) 平均每台产品的受试时间 t=T/2=1290/2=645(h)。并要求其中一台的受试时间不低于t/2,即(h)。
对上述表进行分析可知:
(a) 当α、β及θ1给定时,总试验时间T随着鉴别比d的减少而增加,若要缩短总试验时间T,应增大鉴别比d。
(b) 当θ1、d给定时,总试验时间T随着风险率的减少而增加。反之,为了减少生产方和使用方的风险就需要增加总试验时间T。
(c) 由于定时截尾试验可以预先知道总试验时间T,便于事先计划,给管理带来很大方便,因此在产品可靠性鉴定试验被广泛采用。
. 序贯截尾统计试验方案
每次从批产品中抽取一个或一组受试产品,检验后按某一确定规则作出接收该批产品或拒收该批或检验另一组产品的决定叫“序贯抽样检验”(Sequential sampling inspection)。
概率比序贯试验方案(PRST方案)简称序贯试验方案,分为标准型试验方案和短时高风险试验方案两种。当希望采用正常的生产方风险和使用方风险(10%~20%)时,应采用标准型序贯试验方案。在使用方风险、生产方风险和鉴别比相同的情况下,与定时试验方案相比,序贯试验方案通常能较快的对MTBF真值接近θ0、θ1的受试产品作出接收或拒收判决。对于MTBF的真值较大或较小的受试产品,序贯试验所需的总试验时间可能差别较大,因此在计划费用和时间应以序贯截尾的时间为根据。
GJB899提供了标准型序贯试验方案及短时高风险试验方案。由于Ac、Rc取整数,因此的实际值与名义值有一些不同。
一般来说,序贯试验要求至少三个产品投入试验。
序贯试验方案的程序如下:
a) 使用方及生产方协商确定 。 可取、、、中的一个, 可取10%、20%(短时高风险试验方案取30%)。
b) 查出相应的方案号及相应的序贯试验判决表。判决表中的时间以θ1为单位,使用时应将判决表中的时间乘以θ1得到实际的判决时间TAc及TRc (TAc为接收判决时间, TRc为拒收判决时间)。
c) 进行序贯可靠性试验,如为可靠性验收试验,每批产品至少应抽2台产品进行试验。样本量建议为批产品的10%,但最多不超过20台。进行试验时,将受试产品的实际总试验时间T(台时)及故障数r逐次和相应的判决值TA、TR进行比较:
如果T≥ TAc,判决接收,停止试验;
如果T≤ TRc,判决拒收,停止试验;
如果 TRc <T <TAc ,继续试验,到下一个判决值时再作比较,直到可以作出判决或满足试验截止原则,就停止试验。
注意也可以把序贯试验判决表画成序贯试验判决图(如图 4),图中标出合格判定线及不合格判定线,接收区及拒收区、继续试验区。将试验所得的点 (T, r)点在图上,当 (T, r)点达到或超出拒收线或接收线时,即作出拒收或接收判决,停止试验。若试验中(T, r)点一直滞留在继续试验区内,迟迟不能做出判断时,那么需要采取强迫停止试验的办法:取适当的截尾数r0以及数值sr0,则V(r)=sr0称为截尾合格判定线,如(T, r)点穿越该线就算进入接收,接收;而称为截尾不合格判定线,如(T, r)点穿越该线就算进入区,拒收。抽验方框图如图5所示。
图 4 序贯试验判决图
图 5 序贯试验抽样方框图
.二项分布统计试验方案
产品的失败概率(或次品率)保持不变,产品试验结果仅分为成功、失败(或正品、次品)的情况下,对于预定的试验次数、所得的成功(失败)次数或正品(或次品)个数服从二项分布。服从这种分布的产品进行的可靠性试验,称为成败型可靠性抽样试验。服从二项分布的成败型产品一般有两种试验方案可以选择:定数试验方案和序贯试验方案。
.定数试验方案
一般来说,典型的成败型试验方案的思路如下:
随机抽取一个样本量为n的样本进行试验,其中有r个失败。规定一个数c:
如果,r≤c,认为批产品可靠性合格,可接收,c叫做接收数;
如果,r≥c+1,认为批产品可靠性不合格,拒收,则拒收数就是c+1。其方框图如图6所示。
图6 成败型抽样方框图
例4.某产品的p1=,p0=,生产方与使用方承担的风险α=β=20%。试确定该成败型一次抽样方案中的样本量n和接收数c。
首先,根据公式(1)
(1)
2
使用方的n
生产方的n
拒绝数c
确定试验样本量,见表。
表8 某产品成败型一次抽样方案的确定
由表 8可看出c=是最优值,此时,满足方程组(1)中两个等式的n最接近。但在实际中c是整数,所以选取c=2。但此时两个样本量差距很大。需要固定故障判别数c=2,而n在26-29之间变化,寻求n的最优值。结果见表 9:
%
%
29
%
%
28
%
%
27
%
%
26
β
α
样本数n
表9 某产品最优样本量n的确定
综合考虑使用方和生产方的风险值,使它们相当,并都尽量达到最小,因此选择方案n=28,c=2。
应该指出,-85《设备可靠性试验成功率的验证试验方案》针对不同的鉴别比和生产方与使用方的风险,提供了可选择的试验方案。但该国标中的方案大多数只考虑满足使用方的风险值,而使得在试验过程中生产方承担的风险偏小。因此,应综合考虑使用方和生产方的风险,使它们相当,并都尽量达到最小,且考虑尽量减少样本量节省成本的原则确定试验方案。
. 序贯截尾试验方案
(1) 抽验方案
成败型序贯截尾试验方案如图7所示,-85《设备可靠性试验成功率的验证试验方案》提供了可供选用的成败型可靠性截尾序贯抽样方案表。该方案表中,鉴别比DR有4个值:, , ,,α、β有4组值:α=β=5%, 10%,20%,30%,R0有15个值。
由于截尾影响了α和β的真值(或称标称值),提供的截尾方案对于α=β的标称值为5%, 10%,20%,30%的情况,α、β实际值的最大值分别小于%,,%,%,%。
-85对各种给定的R0、DR、α和β给出了适用的试验方案,这些方案都必须应用在α=β情况。如试验需要用-85给出的试验方案以外的试验方案,可以用式1直接进行计算。
例5. 某产品计划进行成败型截尾序贯试验,若给定R0=、DR=3,α=β=10%,求截尾序贯试验方案。
解:查-85,对应R0=、DR=3所在行与α=β=10%和s所在列的交会格得:
h=,nt=482,mt=8,s=。
故:接收线L0为:
m=
n=nt=482
拒收线L1为:
m=+
m=mt=8
图7 成败型序贯截尾试验
. 统计试验参数的确定原则
统计试验参数量值应根据其验证时机、产品可靠性指标要求、产品可靠性的已知情况、产品的成熟程度、产品的重要程度和所需试验经费、试验进度等方面进行综合的权衡后确定。
(1)检验下限(θ1或R1)的确定
根据《产品可靠性维修性参数选择和指标确定要求 总则》中的定义,规定值是合同和研制任务书中规定的期望产品达到的合同指标,它是承制方进行可靠性维修性设计的依据。而最低可接受值是合同和研制任务书中规定的、产品必须达到的合同指标,它是进行考核的依据。为了验证产品的可靠性能否达到设计定型阶段的最低可接受值,应以产品设计定型阶段的最低可接受值作为统计试验方案中的检验下限。
(2)鉴别比d及检验上限(θ0或R0)的确定
在检验下限已经确定的情况下,鉴别比d与检验上限两个参数只要确定其中一个,另一个也将随之确定。其量值应在同时满足以下两条原则的情况下进行综合权衡后确定:
a) 检验上限不能超过产品可靠性预计值;
b) 鉴别比越大,所需总的试验时间越短,试验做出判决越快。但要求产品实际具有的可靠性量值也越大,才能使产品的可靠性试验得以高概率通过接收。
(3)使用方风险β的确定
一般情况下,使用方风险β由使用方提出,经生产方和使用方协商后确定,但有时使用方为保证接收设备的可靠性水平符合其特定要求,而单独提出固定的使用方风险β。在确定β时,应综合考虑下列因素:
a) 产品的重要程度:如果是关键设备,一旦故障,就会发生等级事故,则β值应尽可能取小些。反之,β值可适当放宽。
b) 对于成熟程度较高的产品可以选用较高风险的方案,反之,如果所要验证的产品是一项新研产品,且在研制过程中发生故障较多,对这种产品的可靠性验证一般应选用使用方风险低的方案。
c) 经费的限制:由于风险率β越小,试验时间越长,而试验时间又受经费的制约,因此,β取值大小还应考虑能承受的试验经费情况。
d) 进度要求:对于需要迅速交付的设备,或因进度紧迫,试验时间有限的设备,β取值可适当大些。
(4)生产方风险α的确定
生产方风险由生产方提出,主要考虑经费和进度要求来确定α值的大小。α取值越大,该试验方案的试验结果给生产方带来的风险就越大,但可以缩短总的试验时间,节省试验经费;反之亦然。
一般情况下,在选取试验方案时,应力求使方案的实际风险值接近于确定的风险值,并使使用方风险和生产方风险均等。
. 统计试验参数的确定方法
统计试验参数有两个确定方法,下面以指数分布定时试验为例进行说明:
方法一:α、β、θ1已确定,根据产品可靠性预计值θp≥θ0的要求,确定θ0,得d=θ0/θ1。
方法二:θ1已确定,根据所能安排的试验时间或能承受的试验经费来确定α、β、d,再检验θp≥θ1·d是否满足。
7.试验中故障的统计
试验过程中,只有责任故障才能作为判定受试产品合格与否的依据。责任故障应按下面的原则进行统计:
(a)可证实是由于同一原因引起的间歇故障只计为一次故障;
(b)当可证实多种故障模式由同一原因引起时,整个事件计为一次故障;
(c)有多个元器件在试验过程中同时失效时,当不能证明是一个元器件失效引起了另一些失效时,每个元器件的失效计为一次独立的故障;若可证明是一个元器件的失效引起的另一些失效时,则所有元器件的失效合计为一次故障;
(d)已经报告过的由同一原因引起的故障,由于未能真正排除而再次出现时,应和原来报告过的故障合计为一次故障;
(e)多次发生在相同部位、相同性质、相同原因的故障,若经分析确认采取纠正措施后将不再发生,则多次故障合计为一次故障;
(f)在故障检测和修理期间,若发现受试产品中还存在其它故障而不能确定为是由原有故障引起的,则应将其视为单独的责任故障进行统计。
8. 试验结果的判决
可靠性鉴定试验是根据抽样理论,运用所抽取的有限样本的试验结果来推断母体统计特性的过程,在正式试验前已经确定了统计试验方案。因此,无论是使用方、还是承制方首先关心的是根据事先确定的统计试验方案,试验结果是否达到规定的要求,如达到即被判为接收,否则被判为拒收。
当试验过程中的任一时刻出现的关联责任故障累计数超出统计试验方案规定的接收故障数时,即可做出拒收判决,经有关部门同意后,此次鉴定试验结束。
当累积试验时间达到试验方案中规定的试验时间,且受试产品发生的关联责任故障数小于试验方案规定的拒收故障数时,即可做出接收判决。对于多台产品试验,只要有一台产品的累计试验时间少于全部受试产品平均试验时间的一半则不应作出合格判决。
在接收状态下结束试验后,应按试验大纲的要求对产品进行性能检测,并将检测结果与试验前和试验期间的检测结果进行比较,以确定产品性能变化的趋势。
不同的统计试验方案和不同的试验结果(发生的故障数、接收或拒收等),将给出不同的可靠性估计结果。有关试验验证值的评估方法的介绍请见后面章节。
9. 试验后的有关工作
(1) 编写试验报告
试验结束后,应按GJB/Z23的要求编写受试产品可靠性试验报告,该报告的主要内容包括:
a) 试验内容和目的;
b) 试验依据;
c) 试验的日历时间和地点;
d) 试验的样本量、样机状态及累积试验时间;
e)试验中所使用的方案说明;
f)试验中所使用的环境条件说明;
g)试验中所使用的试验装置及测试仪表的说明;
h)应力施加方法说明;
i)试验中发生的故障次数、故障分类及故障处理情况;
j)可靠性评估方法及评估结果;
k)存在的问题和建议;
l)试验结论。
(2) 试验后评审
需要时,试验结束后应及时对试验结果进行评审,以评定试验结果是否符合合同、产品的规范及试验大纲的要求。主要应评审以下项目:
a)试验记录和报告的完整性及真实性,包括试验日志,试验设备测试记录、受试设备测试记录、故障汇总报告和分析报告,纠正措施报告、可靠性试验报告;
b)根据试验结果对产品可靠性的评估值,检查这些值与要求值的符合性;
c)试验过程中故障的处理方式和故障诊断是否正确,采取的措施是否有效;
d)试验结果分析的合理性;如果是提前结束试验,其依据是否充分;
e)尚未解决的问题和故障情况以及预计的改进措施;
f)根据前期评审结果指定的工作项目的完成情况;
g)FRACAS的运转情况。
(3) 试验后产品的处置
完成可靠性鉴定试验的电子产品,承制单位可按出厂验收条件对其进行检查和整修,使之恢复到规定的技术状态,并更换有故障的零部件以及性能虽未超出容限但已出现降级的零部件。经整修并通过有关的验收程序后产品可以继续交付使用。
对有使用寿命要求的非电子产品,一般不再交付使用。
10. 试验验证值的评估与判决
指数分布试验方案验证值的评估与判决
1) 点估计
对试验结果的评估方法一般有极大似然法、图估计法、最小二乘法等。常用的是极大似然法。
设总体的分布密度函数为f(t,θ),其中θ为待估参数,从总体中得到一组样本,其次序统计量的观测值为 ,取这组观测值的概率为:
让其概率达到最大,即当 时,就能得到θ的估计值
因此,寿命服从指数分布的产品,其概率密度是: 根据式2得到不同试验方案下产品验证值的评估结果。具体点估计公式见表10。
(2)
有替换定数截尾
无替换定数截尾
有替换定时截尾
无替换定时截尾
总试验时间
平均寿命的点估计
试验类型
表10 指数分布点估计公式
其中:n是投入试验的样本量;
r是试验中出现的总故障数;
t0是定时截尾试验的截尾时间;
tr是定数截尾试验中出现第r个故障的故障时间。
2) 区间估计
选择一个与待估参数有关的统计量H,寻找它的分布使得:
(3)
通过H与待估参数的关系,得到待估参数的置信区间,即
(4)
根据上述求区间估计的方法得到指数分布场合下各种试验方案的区间估计公式,见表11。
表11 指数分布区间估计公式
其中:α是上分位点(如图 8);
T为总试验时间。
图8 分布分位点示意图
例6 . 某产品规定进行定数截尾试验,且r=7。试验到820台时出现第7个责任故障,停止试验,若规定的置信度C=1-β=80%,试对该试验结果进行估计
解: A) TBF的观测值
B)TBF的验证区间
TBF的验证区间为
(,),(置信度C=80%)
说明TBF的真值落在这个区间里的概率至少为80%。或者说TBF的真值大于或等于的概率为90%,而TBF的真值小于或等于的概率亦为90%。
例7. 某产品按选定的标准型定时截尾试验方案17,总试验时间1290台时时达到接收判决,试验中出现2个责任故障,若规定的置信度C=1-2β=60%,试对该产品的TBF进行估计
解: A) TBF的观测值
B) TBF的验证区间
TBF的验证区间为
(,),(置信度C=60%)
说明TBF的其值落在这个区间里的概率至少为60%。或者说TBF的真值大于或等于的概率为80%,而TBF的真值小于或等于的概率亦为80%。
二项分布定数方案验证值的评估与判决
1) 成功率R的观测值(点估计)
由极大似然估计可得R的点估计
2) 成功率R的单侧置信下限(RL)估计
单侧置信下限是根据试验结果来求一个随机区间(RL,1),使下式成立
对于给定样本n,失败数F、置信度C、可靠度R的单侧置信区间按下式计算:
当F=0时,
当F>0时,
当F=n-1时,
当F=n时,
给定C,由试验结果(n,F)求解上述各式可得RL。-85提供了数表,可通过查表直接得到结果
对-85提供的数表中未给出的C,η,z 各参数,可靠度单侧置信下限RL可以按上述各式进行计算;当失败数F=1,2,3时,也可按对数伽玛近似公式计算。具体计算步骤如下:
(a)计算
(b)计算
(c)计算
(d)计算RL
例8. 某批产品从中随机抽取50个进行成败型试验,其中失败1个,若给定置信度C=,试对该产品的可靠度置信下限进行估计。
解: 根据n=50,F=1,C=计算得
查 表得:
例9. 某批产品从中随机抽取100只进行成败型试验,其中失败2只,若给定置信度C=,试求该批产品可靠性点估计与单侧置信下限。
解: (a)点估计
(b)单侧置位下限
查-85,对应C=,(n,F) =(100,2) 得
3) 成功率R的双侧置信区间(RL,RU)估计
双侧置信区间(RL,RU)由以下方程求得:
给定置信度C,由试验结果(n,F)求解上述联立方程即求得(RL,RU) 。但是求解上述联立方程比较繁,仍要利用查表法解决。-85提供了置信区间(RL,RU)数表。可将上式转化为以下形式:
给定置信度C,对应于,由(n,F)
查-85。
由于二项分布与F分布之间有 的关系,因此而向分布的置信区间还可以用以下公式计算:
置信下限:
其中:
置信上限:
其中:
例10 . 求例9中的产品可靠度置信区间(RL,RU),置信度为C=。
解: 对应于 ,(n,F)=(100,2),查表得
对应于 ,(n,F-1)=(100,1),查表得
故在置信度 C=情况下,双侧置信区间估计为(,)。