模块电源(BMP)因其高效、安全、可靠等特点,广泛的应用于工业自动化、继电保护、配网自动化、轨道交通、汽车电子、航空航天等高可靠性高性能的领域。尤其随着轨道交通行业的快速发展,对模块电源使用寿命和可靠性提出了更高的要求和挑战。
6 O+ S$ X* Q# B5 A0 W. J0 d y7 ]通常,电源制造商都会在其产品手册上提供产品的MTBF值,如100万小时,150万小时。MTBF,即平均故障间隔时间,英文全称是“Mean Time Between Failure”,就是从新的产品在规定的工作环境条件下开始工作到出现第一个故障的时间的平均值。MTBF越长表示可靠性越高,工作能力越强,单位为“小时”。它反映了产品的时间质量,是体现产品在规定时间内保持功能的一种能力。
6 ^% F2 G4 W4 M, D1 u& \
那么,MTBF的数值是如何得到的呢?假设DC/DC模块电源的MTBF为100万小时,是不是把这个DC/DC模块电源连续运行100万小时检测出来的呢?
' v- U# l8 `$ O3 L2 M9 \) [; C答案是否定的,如果那样做的话,那产品要用100多年的测试才能完成。电源制造商不可能等上100多年来测量产品的实际故障率和故障率的变化率,以获取足够的有效的数据来提高产品的可靠性。实际上,业界一般通用的方法是根据相关标准计算MTBF和可靠性分析预测。目前最通用的权威性标准是MIL-HDBK-217、和 Bellcore,分别用于军工产品和民用产品。其中,MIL-HDBK-217是由美国国防部可靠性中心及Rome实验室提出并成为行业标准,专门用于军工产品MTBF值计算;而Bellcore是由AT&T Bell实验室提出并成为商用电子产品MTBF值计算的行业标准。不过这些方法估计到的值和实际的平均故障间隔仍有相当的差距。
4 K- O; z& A5 \# q- H1 q
" c, A$ |5 U4 o |; ?
MTBF计算中主要考虑的是产品中每个器件的失效率。但由于器件在不同的环境、不同的使用条件下其失效率会有很大的区别,例如,同一产品在不同的环境下,其可靠性值是不同的;比如一个额定电压为80V的MOSFET在实际电压为40V和60V下的失效率肯定是不同的,同样一个DC/DC模块电源在25℃的环境温度下工作和在70℃的环境温度下工作,其失效了肯定也是不同的。所以,在计算可靠性指标时,必须考虑上述多种因素。
+ t: Z6 H7 W9 V5 ]$ v2 ^. L根据MIL-HDBK-217的标准,通常有两种预测可靠性的方法,部件应力分析(Part Stress Analysis/PSA)和部件数量分析(Parts Count Analysis/PCA)。PSA方法需要大量具体的信息,多用于产品设计的后期阶段,因为测量数据和初步的结果可以被用于可靠性模型中。而PCA方法只需要很少的信息比如零件数量,质量等级和应用环境。MIL-HDBK 217技术的最大优点是PCA方法可以仅仅基于材料清单(Bill of Materials/BOM)和预期的使用数量预测可靠性,因此一个尚未生产的产品的可靠性可以这样预测:
' b3 }4 }7 P7 q# \7 N8 i& qλP = (Σ NC λC) (1 + 0.2 πE) πF πQ πL
公式1 故障率计算公式
) J( p7 Q) i; ^: C( N7 A
这里:ΝC 元件数量(每种元件)
λC 每种元件的可靠性(基本值取自数据库)
πE 环境应力因数(由具体应用决定)
πF 混合功能应力(由元件之间的互相作用引起的附加应力)
πQ 筛选等级因数(根据元件公差的标准或预先筛选)
πL 成熟度因数(已知的并已经测试过的设计或者新的尝试)
通过计算可以得到每个元件的特性。总的可靠性可以将所有单个结果累加而得到。
! l% q2 v+ z" V# c7 m' M表1 PCA法计算DCDC模块电源的MTBF
# _# {5 Z! P- b ^- O" }
$ W& x/ @8 S1 }8 u6 D故障率 g: Z- E& h! G- w/ S2 e
故障率要么通过两次失效发生之间的时间来定义(单位:小时)平均失效间隔时间(Mean Time Between Failures/MTBF),要么通过第一次出现失效所需要的时间(Mean Time To Failure/MTTF)来定义。
q& `2 E0 Q; X- M% }! u1 f7 M标准故障率的曲线可以用众所周知的“浴盆曲线”来描述。曲线如图1,所有元件和系统的曲线形状都近似相同-只是时间轴方向上的延伸率不同。它可以分为三个区域:早期失效期(I),偶然失效期 (II),损耗失效期(III)。MTTF包含了区域I和II,而MTBF只包含了区域(II)。
. J5 b. b! n* N$ [ u
图1 故障率浴盆曲线
1 e- i7 x; P5 i' x u* l3 E7 ^
5 f: O; ^) o1 V4 Y4 S区域I是元件的早期失效期,这个阶段产品故障通常是由潜在的材料失效或者是在发货前的最终产品检测中没被发现的制造缺陷所造成的。早期故障通常持续的时间较短,根据经验统计,DC/DC模块电源大多数早期故障会在使用24小时之内发生。24小时对保质期为三年的DC/DC模块电源来说可能很短,但是从另外一个角度,以Density Power的典型DC/DC模块电源的工作频率为350KHz为例,MOSFET和变压器等在工作24小时期间就会被操作302.4亿次以上,根据实际的统计数据和经验,绝大部分的元器件缺陷在这段时间内会发生故障,因此,为了及早发现和排除早期的缺陷与失效,高可靠性要求的DC/DC模块电源在出厂前都会进行24小时的高温老化试验。
8 b( Z) M0 |+ ]0 w& t在有效工作寿命阶段的偶然失效期区域II,故障率持续稳定在较低的等级。第二个过渡时间(T2),从有效工作寿命阶段到产品的生命终期,受到许多因素的影响,比如设计以及所使用的元件的质量,生产时的组装质量以及应用的环境应力等。区域III表明了产品寿命周期的末期,其间由于磨损,材料的化学降解和突发故障导致产品性能下降。
N. Y; Z M; r
众所周知,工作温度对可靠性的影响很大,可靠性会随着温度的上升而降低。早在1898年,瑞典化学家Arrhenius证明了化学反应速率受温度影响,温度每升高10度,化学反应的速度加快一倍,元件老化的加速因子也将成倍增加。根据表2,我们可以看出当环境温度从25℃升到50℃时老化效应加速,其加速因数为6倍。如果温度继续上升从25℃到70℃时,老化效应会加快20多倍。因此,在选择高可靠性DC/DC模块电源是,不仅要关注产品手册上的MTBF数值,更要关注这个MTBF数值的实际计算时对应的温度条件。
2 X- F( [6 X; f9 W" U+ ^表2 不同环境温度下的加速因子
% A8 z5 K, ^2 }' T( X8 w
% u9 M; n5 N8 J* q2 g0 p
MTBF是针对可靠度只是衡量指标,这些计算实际上都还是第一步,更重要的是根据MTBF指标的计算过程,发现影响产品可靠性的关键部件、环节等,进一步改进产品的设计、生产,最终达到提高产品的可靠性的目的。
从MTBF的计算理论和方法可知,通过元器件的数量以及零件的故障率评估产品的无故障时间;这种方法假设了产品的器件都工作在预期的工作应力下,实际上由于不可预期的因素,产品可能会有瞬间的过应力。另外还有一种情况就是部分对产品寿命有影响的应力难以评估周全。另外,也没有充分考虑产品的同类器件不同供应商的品质和可靠性、产品生产工艺、人为因素等对产品可靠性的影响。
那么,有没有科学有效的试验方法来验证产品的MTBF呢?
5 _% X1 W- e& ^8 x W- z2 C
答案是肯定的。比如,一个DC/DC模块电源根据MIL-STD-217计算的MTBF结果为100万小时,那么事实上试验样品在试验过程中全部失效,所需的试验时间可能长达几十年,甚至是上百年。这种方法对应高可靠性长使用寿命的产品是不切实际的。实际上,根据可靠性原理和相关标准,DMTBF测试(也称 Accelerated Aging & Life Test加速老化寿命测试)是一种有效的可行的试验方法。在不影响可靠性测试可信度前提下,实际测试的时候通过增加AF(加速因子)、开关机次数等条件,达到缩短可靠性验证时间的目的。对应于MTBF为100万小时DC/DC模块电源,在环境温度为70℃条件下长时间工作,60台样品,连续工作38天没有任何失效的情况下,证明产品有0.9的置信度可达到100万小时的MTBF。
综上所述,对于高可靠性领域应用的DC/DC模块电源,尤其是轨道交通、汽车电子及电力操作系统等应用领域,除了MTBF计算、可靠性分析预测外,在产品验证试验阶段的DMTBF试验及生产过程中100%的老化试验对保证产品的长期可靠性和排除产品早期的缺陷与失效是非常重要和必要的。