应用统计方法课件 4-2
- 格式:pps
- 大小:1.18 MB
- 文档页数:23
补充:某厂有三条生产线,从三条生产线生产的纤维中分别抽取了一些样品,测得纤维强度数据见表4-6,试考察它们生产的纤维在强度上是否有显著差异?表4-6自动生产线纤维强度甲乙丙7.0 7.4 6.1 6.5 7.55.56.77.2 5.86.77.28.2 7.3 7.5 6.9分析:由于从三条生产线中抽取的样品个数不同,即相当不同水平所做重复试验次数r不相等,因此需对例4-1中使用的公式进行适当的修正。
解:令1235,4,6r r r ===,由表4-6的数据可以算出:T ⋅⋅=∑∑==k i r j ijiy 11=103.5S 总2=22111ir kijki j ii Tyr⋅⋅===-∑∑∑2322111721.21103.57.0654615ir iji j T y ⋅⋅===-=-⨯=++∑∑T y j j 1115345⋅===∑. T y j j 2214252⋅===∑. ∑=⋅==61338.43j jy T22211ki ki iii T T Sr r⋅⋅⋅===-∑∑组间=++-=345525244386103515242222.....∑∑==-=k i r j i ijiy y S 1122)(误=S 总2-S 组间2=7.06-2.4=4.66F S k S n k =--组间误221/()/()=24246612..≈3.09将上述计算结果列入方差分析表方差分析表方差来源 平方和 自由度 平均平方和 F 值 因素(组间) 2.4 3-1 1.2 3.09 误差(组内) 4.66 15-3 0.3883 总 和 7.06 15-1对给定水平α=0.05,由P F {}.>=λ005查F ()212,分布表得λ=3.89。
显然F <λ,所以不能认为三条生产线生产的纤维在强度上有显著差异。
2§4.2 多因素方差分析Variance analysis of multiple factor 建立模型参数估计统计检验一.建立模型设A 、B 为两个因子,A 有k 个水平1A ,2A ,k A , ,B 有r 个水平r B B B ,,, 21,两个因子共有kr 个水平组合j i B A (k i ,,3,2,1 =;r j ,,3,2,1 =)。
设对每一个水平组合j i B A 做了n 次试验(这里只讨论每个水平组合所作试验次数相同的情形),试验结果为ijn ij ij y y y ,,,21 (k i ,,3,2,1 =;r j ,,3,2,1 =)。
假定对水平组合j i B A 试验结果的理论值为ij μ, 即ijl Ey =ij μ,则ijl y 可分解为modelingijl ij ijl y εμ+= k i ,,3,2,1 =;r j ,,3,2,1 =; n l ,,2,1 = (4-9)其中ijl ε为试验误差,它是一个随机变量。
ijl ε(k i ,,3,2,1 =;r j ,,3,2,1 =;n l ,,2,1 =)独立同分布)0(2σ,N 。
通常假定 为了反映因子A 、B 的水平变化对试验结果影响的大小,将ij μ再进行分解,记∑∑===ki rj ijkr 111μμ∑==rj ij i r 11μμ(k i ,,,21=) (4-10) ∑==ki ij j k v 11μ(r j ,,, 21=) (4-11)于是有=ij μ+μ+-)(μμi +-)(μj v )(μμμ+--j i ij v μ=ˆ++i α+j βijγ其中,i α=μμ-i ,j β=μ-j v ,ij γ=μμμ+--j i ij v ,不难验证:∑=k i i 1α=0, ∑==r j j 10β, ∑∑====k i rj ij ij 110γγ,两个因素方差分析的一般数学模型:⎪⎪⎩⎪⎪⎨⎧===⋅⋅==++++=∑∑∑∑====,,1,,1,,1),0( 0= 0= 0,2111r 1j n l r j k i dN i i y ijl k i k i r j ij ij j i ijl ij j i ijl ;;,,,,σεγγβαεγβαμ(4-12) 需要解决如下问题:(1)估计未知参数μ,i α,j β,ijγ(n l r j k i ,,1,,1,,1 ===;;);(2)考察因子A 和因子B 的水平变化对试验结果的影响有无显著差异,以及因子A 和因子B 有无交互作用,归结为下述三个假设检验:需要解决如下问题:(1)估计未知参数μ,i α,j β,ij γ(n l r j k i ,,1,,1,,1 ===;;);(2)考察因子A 和因子B 的水平变化对试验结果的影响有无显著差异,以及因子A 和因子B 有无交互作用,归结为下述三个假设检验: 02101====k H ααα :; 02110====r H βββ :;:11H ij γ=0,r j k i ,,1,,1 ==;。
二.参数估计记∑∑∑====k i r j ijlnl y nkr y 1111∑∑==⋅=r j ijlnl i y nr y 111∑∑==⋅=k i ijlnl j y nk y 111∑==nl ijlij y n y 11完全类似于单因素方差分析,得未知参数μ,i α,j β,ij γ的矩估计为y =μˆ,y y i i -=⋅αˆ,y y j j -=⋅βˆ y y y y j i ij ij +--=⋅⋅γˆ,r j k i ,,2,1,,2,1 ==; (4-13)易证它们分别是μ,i α,j β,ij γ的无偏估计。
Parameter estimate三.统计检验=2总S ∑∑∑===-k i r j ijl nl y y 1121)(∑∑∑==⋅⋅=+--+-=k i r j j i ij ij ijl nl y y y y y y 111)()[(2)]()(y y y y j i -+-+⋅⋅∑∑∑===+-=ki r j ij ijl nl y y 1121)(∑∑∑==⋅=-ki r j i nl y y 1121)(∑∑∑==⋅=+-+ki rj j nl y y 1121)(0)(1121++--∑∑∑==⋅⋅=ki r j j i ij nl y y y y 22ˆA S S +=误2BS +2ABS +(4-14)Statistical tests其中,交叉项全为零,例如∑∑∑==⋅=--k irjiijijlnlyyyy111))((∑∑∑===⋅--=kirjijijlnliyyyy111)()())((1=--=∑=⋅⋅⋅kiiiiynrynryy2误S=∑∑∑===-kirjijijlnlyy1121)((4-15)2AS=∑∑∑==⋅=-kirjinlyy1121)(=∑=⋅-kiiyyrn12)((4-16)2BS=∑∑∑==⋅=-kirjjnlyy1121)(=∑=⋅-rjjyykn12)((4-17)2ABS=∑∑∑==⋅⋅=+--kirjjiijnlyyyy1121)(2ABS =∑∑∑==⋅⋅=+--k i r j j i ij nl y y y y 1121)( =∑∑==⋅⋅+--k i rj j i ij y y y y n 112)( (4-18)类似于单因素方差分析,22A S S 、误2B S 、2AB S 、的相对大小分别反映了因子A 和因子B 的水平单独以及联合对试验结果的影响大小。
可以证明 当02101====k H ααα :成立时 ))1(1(~)1(/)1/(221----=n kr k F n kr S k S F A ,误 (4-19)当02110====r H βββ :成立时))1(1(~)1(/)1/(222----=n kr r F n kr S r S F B ,误 (4-20) 当:11H ij γ=0,r j k i ,,1,,1 ==;成立时 ))1()1)(1((~)1(/)1)(1/(223------=n kr r k F n kr S r k S F AB,误(4-21)因此可利用上述三个统计量对假设111001H H H 、、进行F 检验。
若以因子f 表示相应于2因子S 的因子的自由度,上述三个统计量可统一写成)1(//22-=n kr S f S F 误因子因子表4-7 方差分析表方差来源平方和 自由度 平均平方和 F 值因素A 2A S 1-k2A S /(1-k) )1(/)1/(221--=n kr S k S F A 误 因素B 2B S 1-r 2B S /(1-r) )1(/)1/(222--=n kr S r S F B 误 B A ⨯ 2AB S )1()1(-⨯-r k )1)(1(2--r k S ABF S k r S kr n AB 322111=---/()()/()误误差 2误S )1(-n kr 2误S /(1)kr n -总和 2总S 1-krn=2总S ∑∑∑===-k i r j ijl nl y y 1121)(∑∑∑==⋅⋅⋅=-=k i r j ijlnl krnT y 112212A S =∑∑∑==⋅=-k i r j i nl y y 1121)(=∑=⋅-ki i y y rn 12)(=krn T T rn k i i 2121⋅⋅⋅=⋅⋅-∑2B S =∑∑∑==⋅=-k i r j j n l y y 1121)(=∑=⋅-r j j y y kn 12)(=krn T T kn r j j 2121⋅⋅⋅=⋅⋅-∑2ABS ∑∑∑==⋅⋅=+--=k i r j j i ij nl y y y y 1121)(∑∑==⋅⋅⋅⋅---=ki rj B A ij S S krnT T n 1122221 2误S =∑∑∑===-ki r j ij ijl nl y y 1121)(=2总S 222AB BAS S S --- =⋅⋅⋅T ∑∑∑===k i r j ijl nl y 111,∑=⋅=nl ijlij y T 1∑∑==⋅⋅=nl ijlrj i y T 11∑∑==⋅⋅=k i ijlnl j y T 11rj k i ,,1,,1 ==;例4-2 考虑合成纤维弹性,影响因素为收缩率A和拉伸倍数B,BA、各有四个水平,每个水平分别作了两次试验,相应的试验结果见表4-8表4-8试验因子结果A A1A2A3A4因子B0 4 8 12 B460 71 73 73 75 76 73 75 731B520 72 73 76 74 79 77 73 72 2B580 75 73 78 77 74 75 70 71 3640 77 75 74 74 74 73 69 69 B4解:由题意知 ,,,244===n r k 又由表4-8得 =2总S ∑∑∑==⋅⋅⋅=-k i r j ijlnl krnT y 112212A S =krnT T rn k i i 2121⋅⋅⋅=⋅⋅-∑ 2B S =krnT T kn r j j 2121⋅⋅⋅=⋅⋅-∑ 2AB S =∑∑==⋅⋅⋅⋅---k i r j BA ij S S krnT T n 11222215891=⋅⋅T ,6012=⋅⋅T ,6013=⋅⋅T ,5724=⋅⋅T ,5891=⋅⋅T ,5962=⋅⋅T ,5933=⋅⋅T ,5854=⋅⋅T ,=⋅⋅⋅T 2363,⋅ij T 见表4-8中两数之和。