第五章 方差分析(上)
- 格式:ppt
- 大小:194.50 KB
- 文档页数:6
第五章方差分析•如果要检验两个总体的均值是否相等,我们可以用t检验。
当要检验多个总体的均值是否相等,则需要采用方差分析。
•方差分析是R.A.Fister发明的,它是通过对误差的分析研究来检验两个或多个正态总体均值间差异是否具有统计意义的一种方法。
•由于各种因素的影响,研究所得的数据呈现波动,造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果造成影响的可控因素,方差分析认为不同处理组的均值间的差异基本来源有两个:•组内差异:由随机误差造成的差异,用变量在各组的均值与该组内变量值之差平方和的总和表示,记作SSE。
•组间差异:由因素中的不同水平造成的差异,用变量在各组的均值与总均值之差平方和的总和表示,记作SSA。
•方差分析的基本思想是:通过分析研究中不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。
•方差分析的三个条件:•被检验的各总体均服从正态分布;•各总体的方差皆相等;•从每一个总体中所抽出的样本是随机且独立的;方差分析的基本步骤:建立原假设H0:两个或多个总体均值相等。
将各不同水平间的总离差分成两个部分:组间差异SSA组内差异SSE构造检验统计量: F= MSA / MSE判断:在零假设为真时,F~F[(k-l),(n-k)]的F分布。
若各样本平均数的差异很大,则分子组间差异会随之变大,而F值也随之变大,故F检验是右尾检验。
当检验统计量F大于临界值时则拒绝原假设;或者根据 p值来判断,若p<α,则拒绝原假设§5.1 单因素方差分析(One-Way ANOVA过程)One-Way ANOVA过程用于进行两组及多组样本均数的比较,即成组设计的方差分析,如果做了相应选择,还可进行随后的两两比较,甚至于在各组间精确设定哪几组和哪几组进行比较。
5.1.1 界面说明【Dependent List框】选入需要分析的变量,可选入多个结果变量(应变量)。
第五章 数值资料的统计推断(二)——方差分析5.1 方差分析的意义、应用条件及常见设计类型在一个分类变量(自变量)不同水平下或是在多个分类变量的水平组合下测量一个连续反应变量(因变量),这个反应变量的总变异可被解释为分类变量的效应(即主效应,如A ,B 分别表示由于分类变量A 和B 的不同水平引起的变异)或分类变量的组合产生的效应(即交互效应,如A*B 表示A 和B 的交互作用,或嵌套效应,如B(A)表示B 的效应嵌套在A 之下),余下的变异为随机误差;同时将总自由度ν分解为对应的各部分自由度之和。
例如在单因素完全随机设计方差分析中,方差分析的统计量为F 值,误差误差组间组间误差组间=νν=/SS /SS MS MS F ,F 值服从F 分布,在一定的显著水平下,如果F 大于F 界值,说明该分类变量有统计学意义,即对应的各水平间的总体均数的差别有显著性,这就是方差分析的基本思想。
方差分析有三个应用条件∶①各样本是相互独立的;② 各样本数据来自正态总体;③各处理组总体方差相等即方差齐性。
因此在作方差分析之前,要作正态性检验和方差齐性检验,如不满足上述要求,可考虑作变量变换,使其基本达到正态和方差齐性。
常用的变量变换方法有平方根变换(如Poisson 分布的计数资料)、平方根反正弦变换(如服从二项分布的率的资料)、对数变换(标准差与均数之间成正比关系,各组CV 值比较接近时的资料)及倒数变换(标准差与其均数的平方成正比关系时的资料)。
方差分析的常用设计类型有完全随机设计、随机区组设计、拉丁方设计、析因试验设计、正交设计、系统分组设计、裂区试验设计等。
5.2 多样本的正态性检验和方差齐性检验利用测得的三组大白鼠营养试验中每组测得12只大鼠的尿中氨氮的排出量x (mg/6天)建立SAS 数据集work .ex1,编写的SAS 程序如下:DATA EX1;DO GROUP=1 TO 3; DO I=1 TO 12; INPUT X@@; OUTPUT; END; END; CARDS;30 27 35 35 29 33 32 36 26 41 33 31 43 45 53 44 51 53 54 37 47 57 48 42 82 66 66 86 56 52 76 83 72 73 59 53 ; RUN;5.2.1 多样本的正态性检验例5.1对SAS数据集work.ex1中以group分组的三组数据x分别作正态性检验。
第五章方差分析方差分析是通过实验数据对影响产品的质量、产量的多个可控因素作统计分析,以分清因素的主次及水平组合形式,并求出最优组合形式,以提高产品质量、产量的一种数学分析方法。
1单因素方差分析,设影响指标的因素仅有一个,设为A 因素,该因素有a 个水平(状态)A 1,A 2^\A a ,在每个水平下,分别作 ni 次实验,i=1,2,|||a 其样本值X jj 〜N (7d 2), i =1,2,|||a ,2或 X j =斗• ;ij , ;ij 〜N (0,二)。
(1)方差分析主要解决: 1、检验A 因素对指标是否有影响及影响的程度,首先提出假设:H 。
「打=二川=4 (在各水平下的均值相等)H i : " i = " j j = j i, j,二 1 112 a (至少有一对不相等)其检验的思想方法是若组间(各水平间)平方和大,表明 A 因素对指标是有影响的,否则,组间平方和小,表明A 因素对指标没有影响。
又组内(随机误差)平方和小, 用F -检验法即F 值大可拒绝 H 0,表明 A 因素影响显著,否则接受 H 0,表明 A 因素影响不 显著。
2、计总体的均值和方差 7,「2川 叮二2。
(2)方差分析的方法:a1、样本值 X j ,i =1,2,1 Ha ,j =1,2^|n i ,n^n ,共有n个样本值,7a n i设X L = 7、Xij ,表所有样本值之和,总平均值1 j m又X x- X 表示第i 个的水平下样本值之和,i =1,2,1"a , X L =乙 X ijj 亠和=丄:X,表示第i 个的水平下样本均值,'m j± n '',且有:a门)a aa门) _1 1X L = ' n i X i_ =' X i X j = nX ,1 2 1 2X X L , X 2X_,nnyjm i¥i 1 i =1 j :in. ii' (Xj —X [)»X j —n i XT =n i 可—n 区=0, j 4 j 4 ~~ ~2、平方和:a n称S T(X j -X)2为总的离差平方和,其计算公式为i 2 j 二a na gS r =、、(X i j -X)X ij—X 二二(X j-X)i =1 j =1i = 1j 1a m x2ija n=E Z-X" 'X j -X(nX -nX)i4 'j = 1i= 1 = :1a n i =s zx 2ij—2- nXi 4 j 4a niX j-丄X[2i 4 j 4na m称S A■ (X^ -X)2为因素A 的组间平方和,其计算公式为:i二 j 二a m _ _ a ni _S A ' (X^ -X)X T - X! 1 (X T -X)i J j 1-i 4 j ±- ani ___ 2=、'' X i || i士 j 吕a2二、nX j|_i z !a _______ ,=、n X Li妊「丄xl i i 口a m _-X' '、■ X i -X(nX -nX) i 4 j 4 -a-X 二 r )i X ii =1—2—nX -X : n(X ; —- X j =丄人」,),n j 壬n iani称S E —' (X ij -XL 2为第i 个水平下的组内平方和,其计算公式为:i =i j =1a n i__ ______ _____由 S r 一 a a (X jj —X jL X j_ — X)2i :1 j :1…i2 a □ …•二二(X j —X iL )2+、、(瓦 _X )2 + 2'、(X j —X i"* —X)i A j Aa二 S ES A 2、 i丄二 S ES A即有:S^S T -S A ,3统计分析又由 E^) =E 2(n - a)匕 n -a ,有 E (--;「2, n —a 得方差二2的估计量为;「=旦。
第五章 方差分析课后习题参考答案5.1 下面给出了小白鼠在接种三种不同菌型伤寒杆菌后的存活日数:设小白鼠存活日数服从方差相等的正态分布,试问三种菌型的平均存活日数有无显著差异?(01.0=α)解:(1)手工计算解答过程 提出原假设:()3,2,10:0==i H i μ记167.2081211112=⎪⎪⎭⎫ ⎝⎛-=∑∑∑∑====r i n j ij ri n j ij T i iX n X S467.7011211211=⎪⎪⎭⎫ ⎝⎛-⎪⎪⎭⎫ ⎝⎛=∑∑∑∑====r i n j ij ri n j ij iA ii X n X n S7.137=-=A T e S S S当H成立时,()()()r n r F r n S r S F e A ----=,1~/1/本题中r=3经过计算,得方差分析表如下:查表得()()35.327,2,195.01==---F r n r F α且F=6.909>3.35,在95%的置信度下,拒绝原假设,认为不同菌型伤寒杆菌对小白鼠的存活日数有显著影响。
(2)软件计算解答过程组建效应检验Dependent Var iable: 存活日数a70.429235.215 6.903.004137.73727 5.101208.16729方差来源菌型误差总和平方和自由度均值F 值P 值R Squared = .338 (Adjusted R Squared = .289)a.从上表可以看出,菌种不同这个因素的检验统计量F 的观测值为6.903,对应的检验概率p 值为0.004,小于0.05,拒绝原假设,认为菌种之间的差异对小白鼠存活日数有显著影响。
5.2 现有某种型号的电池三批,他们分别是甲、乙、丙三个工厂生产的,为评论其质量,各随机抽取6只电池进行寿命试验,数据如下表所示:工厂 寿命(小时) 甲 40 48 38 42 45 乙 26 34 30 28 32 丙39 40 43 50 50试在显著水平0.05α=下,检验电池的平均寿命有无显著性差异?并求121323,μμμμμμ---及的95%置信区间。