单因素试验的方差分析共27页文档
- 格式:ppt
- 大小:2.62 MB
- 文档页数:27
第二节单因素试验资料的方差分析在方差分析中,根据所研究试验因素的多少,可分为单因素、两因素和多因素试验资料的方差分析。
单因素试验资料的方差分析是其中最简单的一种,目的在于正确判断该试验因素各水平的优劣。
根据各处理内重复数是否相等,单因素方差分析又分为重复数相等和重复数不等两种情况。
上节讨论的是重复数相等的情况。
当重复数不等时,各项平方和与自由度的计算,多重比较中标准误的计算略有不同。
本节各举一例予以说明。
一、各处理重复数相等的方差分析【例6.3】抽测5个不同品种的若干头母猪的窝产仔数,结果见表6-12,试检验不同品种母猪平均窝产仔数的差异是否显著。
表6-12五个不同品种母猪的窝产仔数这是一个单因素试验,k=5,n=5。
现对此试验结果进行方差分析如下:1、计算各项平方和与自由度2、列出方差分析表,进行F检验表6-13不同品种母猪的窝产仔数的方差分析表根据df1=df t=4,df2=df e=20查临界F值得:F0.05(4,20)=2.87,F0.05(4,20)=4.43,因为F>F0.01(4,20),即P<0.01,表明品种间产仔数的差异达到1%显著水平。
3、多重比较采用新复极差法,各处理平均数多重比较表见表6-14。
表6-14不同品种母猪的平均窝产仔数多重比较表(SSR法)-8.2 -9.6因为MS e=3.14,n=5,所以为:根据df e=20,秩次距k=2,3,4,5由附表6查出α=0.05和α=0.01的各临界SSR 值,乘以=0.7925,即得各最小显著极差,所得结果列于表6-15。
表6-15SSR值及LSR值将表6-14中的差数与表6-15中相应的最小显著极差比较并标记检验结果。
检验结果表明:5号品种母猪的平均窝产仔数极显著高于2号品种母猪,显著高于4号和1号品种,但与3号品种差异不显著;3号品种母猪的平均窝产仔数极显著高于2号品种,与1号和4号品种差异不显著;1号、4号、2号品种母猪的平均窝产仔数间差异均不显著。
单因素方差分析定义:单因素方差分析测试某一个控制变量的不同水平是否给观察变量造成了显著差异和变动。
例如,培训是否给学生成绩造成了显著影响;不同地区的考生成绩是否有显著的差异等。
前提:1总体正态分布。
当有证据表明总体分布不是正态分布时,可以将数据做正态转化。
2变异的相互独立性。
3各实验处理内的方差要一致。
进行方差分析时,各实验组内部的方差批次无显著差异,这是最重要的一个假定,为满足这个假定,在做方差分析前要对各组内方差作齐性检验。
一、单因素方差分析1选择分析方法本题要判断控制变量“组别”是否对观察变量“成绩”有显著性影响,而控制变量只有一个,即“组别”,所以本题采用单因素分析法,但需要进行正态检验和方差齐性检验。
2在控制变量为“组别”,3正态检验(P>0.05,服从正态分布)正态检验操作过程:“分析”→“描述统计”→“探索”,出现“探索”窗口,将因变量“成绩”放入“因变量列表”,将自变量“组别”放入“因子列表”,将“人名”放入“标注个案”;点击“绘制”,出现“探索:图”窗口,选中“直方图”和“带检验的正态图”,点击“继续”;点击“探索”窗口的“确定”,输出结果。
因变量是用户所研究的目标变量。
因子变量是影响因变量的因素,例如分组变量。
标注个案是区分每个观测量的变量。
带检验的正态图(Normality plots with test,复选框):选择此项,将进行正态性检验,并生成正态Q-Q概率图和无趋势正态Q-Q概率图。
正态检验结果分析:p值都大于0.05,因而我们不能拒绝零假设,也就是说没有证据表明各组的数据不服从正态分布(检验中的零假设是数据服从正态分布)。
即p值≥0.05,数据服从正态分布。
4单因素方差分析操作过程“分析”→“比较均值”→“单因素ANOVA”,出现“单因素方差分析”窗口,将因变量“成绩”放入“因变量列表”,将自变量“组别”放入“因子”列表;点击“选项”选择“方差同质性检验”和“描述性”,点击“继续”,回到主对话框;点击“两两比较”选择“LSD”和“S-N-K”、“Dunnett’s C”,点击“继续”,回到主对话框;点击“对比”,选择“多项式”,点击“继续”,回到主对话框;点击“单因素方差分析”窗口的“确定”,输出结果。
实例解析单因素的方差分析方法首先在单因素试验结果的基础上,求出总方差V 、组内方差vw、组间方差vB。
总方差 v=()2ijx x -∑组内方差 v w =()2ij x x i-∑ 组间方差 v B=b ()2ix x -∑从公式可以看出,总方差衡量的是所有观测值xij对总均值x 的偏离程度,反映了抽样随机误差的大小,组内方差衡量的是所有观测值xij对组均值x 的偏离程度,而组间方差则衡量的是组均值x i对总均值x 的偏离程度,反映系统的误差。
在此基础上,还可以得到组间均方差和组内均方差: 组间均方差2Bs ∧=1B-a v组内均方差 2ws∧=aab vw-在方差相等的假定下,要检验n 个总体的均值是否相等,须首先给定原假设和备择假设。
原假设 H 0:均值相等即μ1=μ2=…=μn备择假设H 1:均值不完全不相等则可以应用F 统计量进行方差检验:F=)()(b ab a vv w--1B =22∧∧ss WB该统计量服从分子自由度a-1,分母自由度为ab-a 的F 分布。
给定显著性水平a ,如果根据样本计算出的F 统计量的值小于等于临界值)(a ab 1a F --,α,则说明原假设H 0不成立,总体均值不完全相等,差异并非仅由随机因素引起。
下面通过举例说明如何在Excel 中实现单因素方差分析。
例1:单因素方差分析某化肥生产商需要检验三种新产品的效果,在同一地区选取3块同样大小的农田进行试验,甲农田中使用甲化肥,在乙农田使用乙化肥,在丙地使用丙化肥,得到6次试验的结果如表2所示,试在0.05的显著性水平下分析甲乙丙化肥的肥效是否存在差异。
表2 三块农田的产量要检验三种化肥的肥效是否存在显著差异,等同于检验三者产量的均值是否相等:给定原假设H 0:三者产量均值相等;备择假设H 1:三者的产量均不相等,对于影响产量的因素仅化肥种类一项,因此可以采用单因素方差分析进行多总体样本均值检验。
⑴新建工作表“例1”,分别单击B3:D8单元格,输入表2的产量数值。
单因素⽅差分析(one-wayANOVA)单因素⽅差分析(⼀)单因素⽅差分析概念是⽤来研究⼀个控制变量的不同⽔平是否对观测变量产⽣了显著影响。
这⾥,由于仅研究单个因素对观测变量的影响,因此称为单因素⽅差分析。
例如,分析不同施肥量是否给农作物产量带来显著影响,考察地区差异是否影响妇⼥的⽣育率,研究学历对⼯资收⼊的影响等。
这些问题都可以通过单因素⽅差分析得到答案。
(⼆)单因素⽅差分析步骤第⼀步是明确观测变量和控制变量。
例如,上述问题中的观测变量分别是农作物产量、妇⼥⽣育率、⼯资收⼊;控制变量分别为施肥量、地区、学历。
第⼆步是剖析观测变量的⽅差。
⽅差分析认为:观测变量值的变动会受控制变量和随机变量两⽅⾯的影响。
据此,单因素⽅差分析将观测变量总的离差平⽅和分解为组间离差平⽅和和组内离差平⽅和两部分,⽤数学形式表述为:SST=SSA+SSE。
第三步是通过⽐较观测变量总离差平⽅和各部分所占的⽐例,推断控制变量是否给观测变量带来了显著影响。
(三)单因素⽅差分析原理总结在观测变量总离差平⽅和中,如果组间离差平⽅和所占⽐例较⼤,则说明观测变量的变动主要是由控制变量引起的,可以主要由控制变量来解释,控制变量给观测变量带来了显著影响;反之,如果组间离差平⽅和所占⽐例⼩,则说明观测变量的变动不是主要由控制变量引起的,不可以主要由控制变量来解释,控制变量的不同⽔平没有给观测变量带来显著影响,观测变量值的变动是由随机变量因素引起的。
(四)单因素⽅差分析基本步骤1、提出原假设:H0——⽆差异;H1——有显著差异2、选择检验统计量:⽅差分析采⽤的检验统计量是F统计量,即F值检验。
3、计算检验统计量的观测值和概率P值:该步骤的⽬的就是计算检验统计量的观测值和相应的概率P值。
4、给定显著性⽔平,并作出决策(五)单因素⽅差分析的进⼀步分析在完成上述单因素⽅差分析的基本分析后,可得到关于控制变量是否对观测变量造成显著影响的结论,接下来还应做其他⼏个重要分析,主要包括⽅差齐性检验、多重⽐较检验。
第八章 方差分析与回归分析第一节 单因素实验的方差分析在科学实验、生产实践和社会生活中,阻碍一个事件的因素往往很多。
例如,在工业生产中,产品的质量往往受到原材料、设备、技术及员工素养等因素的阻碍;又如,在工作中,阻碍个人收入的因素也是多方面的,除学历、专业、工作时刻、性别等方面外,还受到个人能力、经历及机缘等偶然因素的阻碍. 尽管在这众多因素中,每一个因素的改变都可能阻碍最终的结果,但有些因素阻碍较大,有些因素阻碍较小. 故在实际问题中,就有必要找出对事件最终结果有显著阻碍的那些因素. 方差分析确实是依如实验的结果进行分析,通过成立数学模型,辨别各个因素阻碍效应的一种有效方式.散布图示★ 引言★ 大体概念 ★ 例1★ 例2★ 假设前提 ★ 方差分析的任务★ 误差平方和及其分解 ★ E S 和A S 的统计特性 ★ 查验方式★ 例3★ 例4★ 习题8-1内容要点一、大体概念在方差分析中,咱们将要考察的对象的某种特点称为实验指标. 阻碍实验指标的条件称为因素. 因素可分为两类,一类是人们能够操纵的(如上例的原材料、设备、学历、专业等因素);另一类人们无法操纵的(如上例中员工素养与机缘等因素).尔后,咱们所讨论的因素都是指可操纵因素。
因素所处的状态,称为该因素的水平. 若是在一项实验中只有一个因素在改变,那么称为单因素实验;若是多于一个因素在改变,那么称为多因素实验. 为方便起见,尔后用大写字母,,,C B A 等表示因素,用大写字母加下标表示该因素的水平,如 ,,21A A 等.二、假设前提设单因素A 具有r 个水平,别离记为,,,,21r A A A 在每一个水平),,2,1(r i A i =下,要考察的指标能够看成一个整体,故有r 个整体,并假设:(1) 每一个整体均服从正态散布; (2) 每一个整体的方差相同;(3) 从每一个整体中抽取的样本彼此独立.那么,要比较各个整体的均值是不是一致,确实是要查验各个整体的均值是不是相等,设第i 个整体的均值为i μ,那么假设查验为 .:210r H μμμ=== 备择假设为 .,,,:211不全相等r H μμμ 通常备择假设能够不写.在水平),,2,1(r i A i =下,进行i n 次独立实验,取得实验数据为,,,,21i in i i X X X 记数据的总个数为n =.1∑=ri i n由假设有 ~ij X ),(2σμi N (i μ和2σ未知),即有-ij X i μ~),,0(2σN 故-ij X i μ可视为随机误差.记-ij X i μ=ij ε,从而取得如下数学模型:⎩⎨⎧==+=未知和相互独立各个2i 2, ),,0(~,,2,1,,,2,1,σμεσεεμij ijiij i ij N n j r i X (1) 方差分析的任务:1) 查验该模型中r 个整体),(2σμi N ),,2,1(r i =的均值是不是相等; 2) 作出未知参数r μμμ,,,21 , 2σ的估量.为了更认真地描述数据,常在方差分析中引入总平均和效应的概念. 称各均值的加权平均,11∑==ri ii n nμμ为总平均. 其中n =.1∑=ri i n 再引入,μμδ-=i i ,,,2,1r i =i δ表示在水平i A 下整体的均值i μ与总平均μ的不同,称其为因子A 的第i 个水平i A 的效应.易见,效应间有如下关系式:,0)(11=-=∑∑==ri iir i ii n n μμδ利用上述记号,前述数学模型可改写为⎪⎪⎩⎪⎪⎨⎧===++=∑=未知和相互独立各个2i 21,),,0(~0,,2,1,,,2,1,σμεσεδεδμij ijr i i i r ij i ij N n n j r i X (2) 而前述查验假设那么等价于:.,,,:.:211210不全为零r r H H δδδδδδ ===三、误差平方和及其分解为了使造成各ij X 之间的不同的大小能定量表示出来,咱们先引入:记在水平i A 下数据和记为: ∑==in j ij i X X 1.,其样本均值为.i X =,11∑=in j ij iXn 因素A 下的所有水平的样本总均值为X =∑∑==ri n j ij iX n111=∑=ri i Xr 1.1,为了通过度析对照产生样本ij X , r i ,,2,1 =,k j ,,2,1 =之间不同性的缘故,从而确信因素A 的阻碍是不是显著,咱们引入误差平方和来气宇各个体间的不同程度:=T S ∑∑==-ri n j ij iX X 112)( (3)T S 能反映全数实验数据之间的不同,又称为总误差平方和.若是0H 成立,那么r 个整体间无显著不同,也确实是说因素A 对指标没有显著阻碍,所有的ij X 能够以为来自同一个整体),(2σμN ,各个ij X 间的不同只是由随机因素引发的。