|
|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
}& a6 _9 M- @8 S! b失效分布类型的检验
$ ~8 d- B9 T! k6 c5 J1 分布拟合流程' m# f# y- V) ^( o0 Y! x# d
由于客观条件的限制,在现场调查或可靠性试验时,一般不可能进行百分之百的全数试验,往往是从整批产品中随机地抽取一部分样品来进行试验观察,从失效观测值来推断母体的寿命分布的统计特性。在统计学中把试验研究对象的全体称为母体,抽取部分的样品称为子样。
" ^; O8 Z0 `1 \# D7 U# l$ C可靠性试验数据的统计分析就在于如何根据子样的观测值来确定产品的寿命分布类型及其分布参数。关于参数分布确定前面有关章节已做了介绍。这里着重分析如何确定产品寿命(或失效)分布类型的拟合试验方法。( R N7 o6 c9 b0 o) `8 C* O
最简单的方法是借助于图估法来对产品的寿命分布类型进行初步的判断,它将子样失效时间和累积失效概率在威布尔概率纸、正态概率纸或对数正态概率纸上描点,如果在概率纸上这些点能近似地排列在一条直线附近,就可以大致确定被试验样品的分布类型(属于排列成直线的那种概率纸的概率分布)。这种检验方式直观、简单,但其结果不够准确,而且也无法给出置信度,是一种不太严密的分析方法。
/ a2 z( E* V! `; k: z/ {7 H* _当要在一定置信度下确定产品分布类型时,可以采用χ2或K-S(柯尔莫哥洛夫斯米尔诺夫)拟合检验方法。
4 C5 C+ x( ?1 ?7 r4 [* l+ f由图估法知道,产品分布的理论值在概率纸上应该是一条非常理想的直线。而样品的实测值却往往在直线附近摆动,即子样的实测值分布在母体理论值的周围。因此,理论分析与试验分布之间的偏差又形成了一种新的分布。如果能够形成一个反映理论值和实测值之间的偏差值的统计量,并且确定这种统计量的分布类型,就可以根据这个
, W; f& ^5 N1 l/ r- t0 f1 G2 T/ S2 x& `$ U, [8 X( X
/ K1 `$ k9 ^- {7 c# ]
9 j; p9 D7 _$ f) @ }
9 F; c% r8 R+ o4 y分布拟合检验的流程统计量的分布类型所允许的范围来对实测值与理论值之间的偏差做出是否符合的判断。3 p; Q1 c1 V/ n) S/ K( A# w5 P
假定构成的统计量为u,并且已知u服从u分布。设uα为u分布的α分位点,α为显著性水平,且是一个比较小的数。. {; X7 [! O8 A
如果P(u≥uα)=α,称事件u≥uα为小概率事件。根据概率论可知,小概率事件在一次试验中几乎是不可能发生的,因为这一事件发生的最大可能性是α。也就是说,有1-α的把握出现事件u显然,问题的关键在于如何构造统计量。χ2和K-S检验法就是提供构成不同统计量方法的分布拟合检验方法。) ^+ t- t& T, G. U+ X/ G
; ]& k9 z! Y+ L5 V6 j& F3 x9 B \* u
9 ~% }8 U5 W5 Z. x5 `- C2 χ2检验法' @ R* r' V5 R) E1 z. W
χ2检验法(又称皮尔逊检验法)就是构成χ2统计量的方法。χ2代表一个随机变量,它服从自由度为f的χ2分布,其分布概率密度函数为P(χ2;f)=12f2Γf2(χ2)f2-1e-χ22式中,Γf2是以f2为变量的Γ函数值。
4 ^3 u6 W" e0 c# P* t: c4 \+ f }假设n个样品中存在出现K个失效的可能性,出现第i个失效的理论概率是Pi(i=1,2,3,…,K),则n个样品中第i个失效,即出现ri次(i=1,2,3,…,K)的概率服从于多项分布:P=n!r1!r2!…rK!Pr11Pr22…PrKK如果ri>5,则可用斯特令(stirling)公式对上式进行变换,并忽略高次小项,可得χ2=∑Ki=1(ri-nPi)2nPi式中,K为将数据进行统计的分组数,ri为落入每个子区内观测的失效频数;Pi为落入每个子区间内的理论频率;n为观测样品的总数。因而,nPi为落入个子区间内的理论频数。
% E% k" G7 B+ V% M: c显然,上式表示观测失效频数与理论频数之差的平方除以理论频数,将所得的商相加,则得χ2的统计量。从概率统计可以证明:理论统计学χ2是服从以K-1为自由度的χ2分布。因此,可根据(1-α)置信度和(K-1)=f自由度,查χ2分布的下侧分位数表,可得χ2f=K-1,1-α的理论统计量。
7 U8 W" Y, |6 T+ @* ^0 R将试验观测值按上式计算得到的χ2计统计量与理论统计量判别标准χ2f=K-1,1-α进行比较,如果χ2计<χ2f=K-1,1-α则分布假设正确。如果χ2计≥χ2f=K-1,1-α则分布假设不正确。必须重新进行假设,再按上述方法进行检测。
- t4 T- c2 S, ?' w" C l9 h' ^ x" W
- b Q* |5 c% \$ \
$ u: t5 ?- k* w* \1 g9 D
' }, o* t$ m# e3 `# ]; @由试验观测值计算得到χ2计=4.022 `4 n; @2 Y+ _5 V" Q% x& F
设定α=0.05,得χ2f=K-1,1-α=χ26,0.95=12.562因为χ2计<χ2f=K-1,1-α,所以,应接受原假设。也就是说,此产品仍服从正态分布N(170,1102),其置信度为95%。3 Q) Q" D# k& S
值得说明的是,此处的χ2值可通过查阅概率论方面工具书中的附录得到(左侧分位点卡方表,The Left-Tailed Chi-Square Table);也可以通过Excel中的公式CHIINV计算得到。
' ]: k, z# ?4 v' ]8 {# B, _6 P* m6 A3 E- T; F. y- [
) |# U1 f1 k) s' u
: D7 k0 g, f5 A! H. b* n# h, W' d
3 K-S检验法
+ c. F4 V" D' W' r7 \/ `/ {柯尔莫哥洛夫斯米尔诺夫(Kolmogorov-Smirnov,K-S)检验法是基于这样的考虑:当把数据描绘在能用直线表示出母体的失效分布的某种概率纸上时,如果子样试验数据是从这个失效分布函数的母体得来的,那么根据子样数据绘出的累积分布的点不会偏离母体累积分布函数所描述的直线太远。
C. q2 I5 O* y& Z: @: @7 m. L4 G# ^设F0(t)为随机变量T的理论分布,Fn(t)为实测数据的经验分布,可以构造一统计量Dn,使之为其理论分布与经验分布相应值之间偏差绝对值中最大的一个,即Dn=sup-∞Dn,α时,即Fn(t)不属于F0(t)分布。若给定置信度1-α,可以通过概率计算,得到满足P(Dn≥Dn,α)=α的K-S检验临界值Dn,α数表,可直接查得。显然,当满足P(Dnrin+1的值,列于下表中:
( n- |" A: ]1 c" V+ r; I2 w; ^4 N% q) a: _3 v6 m3 V9 ?' U
5 K2 I7 ~9 t& b: K
$ w7 J6 K& t+ N& b
/ M+ \( I/ Z) Y5 V1 q6 q* H) {/ Z3) 按公式Fn(ti)-F0(ti)计算理论值与实测值的绝对误差值,并找出最大值,得到Dn,显然Dn=sup-∞若选定α=0.2,而n=10,由附表查得D10,0.2=0.322 5) 比较Dn和Dn,α:
! w1 \' X" u: a8 ^1 h4 j" N因为Dn上述检验方法仅用于完全子样的情况。当个数n很大时,要采用上述检验方法是很困难的,我们可以找到Dn的极限分布表,作为其判别标准。但是,在寿命试验中常采用定数或定时截尾试验,因此,对于截尾子样还需要构造不同的统计量。
! x$ [; s+ ~/ G8 f4 R对于n≤30的定数截尾试验,检验的统计量为Tr=suptTn,α)=α的临界值Tn,α,可按照Tn,α=K/n进行计算。K值可根据n、失效数r和给定α确定,当Tr对于n≤30的定时截尾试验,检验的统计量为T0=suptTn,α)=α的临界值Tn,α,可根据公式Tn,α=K/n计算。K值可根据n、Rc=nF(tu)和给定1-α确定,当T0定时或定数截尾试验,当子样容量n>30时,可构成下列统计量:Dn,T=sup0当n→∞时,可以求得nDn,T的极限分布为limn→∞(nDn,T目前,用手工的方法获得K-S检验结果已经不现实了,通常可以借助计算机统计分析软件,如SAS(Statistical Analysis System)、SPSS(Statistical Product and Service Solutions)、R语言(统计分析软件,其源代码可免费下载),或通过Matlab自带工具kstest等方式快速得到检验。
* c8 k: L @# C1 h( V |
|