第六讲 方差分析(下)
- 格式:ppt
- 大小:2.62 MB
- 文档页数:93
第六章方差分析第一节方差分析概述一.方差分析的定义[用途]定义:用途方差分析也称为变异数分析,是在教育与心理研究中最常用的变量分析方法,其主要功能在于分析测量或实验数据中不同来源的变异对总变异的贡献大小,从而确定测量或实验中因素对反应变量是否存在显著影响。
即用于置信度不变情况下的多组平均数之间的差异检验。
它既可以比较两个以上的样本平均数的差异检验,也可以应用于一个因素多种水平以及多个因素有多种水平的数据分析。
二.方差分析的作用方差分析主要应用于两种以上实验处理的数据分析,同时匕徽两个以上的样本平均数,推断多组资料的总体均数是否相同,也即检验多组数据之间的均数差异是否有统计意义。
在这个意义,也可以将其理解为平均数差异显著性检验的扩展。
当我们用多个t检验来完成这一过程时,相当于从t分布中随机抽取多个t值,这样落在临界范围之外的可能大大增加,从而增加了I型错误的概率,我们可以把方差分析看作t检验的增强版。
方差分析一次检验多组平均数的差异,降低了多次进行两组平均数检验所带来的误差。
在进行方差分析时,设定的假设是综合虚无假设,即假设样本所归属的所有总体的平均数都相等。
如果检验的结果是存在显著性差异,只能说明多组平均数之间存在显著性差异,但是无法确定究竟哪些组之间存在显著性差异,此时需要运用事后检验的方法来确定。
三.方差分析的相关概念一(一)数据的变异(1)变异:统计中的变异是普遍存在的7一般意义上的变异是指标志(包括品质标志和数量标志)在总体单位之间的不同表现。
可变标志的属性或数值表现在总体各单位之间存在的差异,统计上称之为变异,这是广义上的变异,即包括了品质标志和数量标志,有时仅指品质标志和在总体单位之间的不同表现。
注:随机性,即变异性。
(2)组间变异[组间差异]:组间变异表示处理间变异,主要指由于接受不同的实验处理(实验处理效应)而造成的各组之间的变异,可以用两个平均数之间的离差来表示,可将组间离差平方和记为SS AO组间差异可用组间方差来表征,用符号MS B表示。
第6章 方差分析6.1 从三个总体中各抽取容量不同的样本数据,得到如下资料。
检验3个总体的均值之间是否有显著差异?(0.01α=)样本1 样本2 样本3 158 148 161 154 169153 142 156 149169 158 180解:提出假设:01231123::,,H H μμμμμμ==不完全相等方差分析 差异源 SS df MS F P-value F crit 组间618.91672309.45834.65740.0408778.021517组内 598 9 66.44444总计1216.91711因F=4.6547<8.021517,故不拒绝原假设,表明三个总体均值之间没有显著差异。
因P-value=0.040877>0.01, 故不拒绝原假设,表明三个总体均值之间没有显著差异。
6.2某家电制造公司准备购进一批5#电池,现有A 、B 、C 三个电池生产企业愿意供货,为比较它们生产的电池质量,从每个企业各随机抽取5只电池,经试验得其寿命(小时)数据如下:试分析三个企业生产的电池的平均寿命之间有无显著差异?(0.05α=)如果有差异,用LSD 方法检验哪些企业之间有差异?解:01231123::,,H H μμμμμμ==不完全相等方差分析差异源 SS df MS F P-value F crit 组间 615.6 2 307.8 17.06839 0.00031 3.885294 组内 216.4 12 18.03333 总计 832 14因F=17.06839>3.885294,故拒绝原假设,表明三个总体均值之间存在显著差异。
因P-value=0.0031<0.05, 故拒绝原假设,表明三个总体均值之间存在显著差异。
由表中,红色标注可知相对应的P 值<0.05,故可知A 与B ,B 与C 企业之间存在显著差异。
6.3 某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了30名工人,并指定每个人使用其中的一种方法。
第六讲 多因素试验资料的方差分析M ULTIFACTOR ANALYSIS OF V ARIANCE多因素试验是指同时研究n 个因素对试验指标的作用,以及它们的共同作用。
多因素试验的最大优点首先在于除了一次试验可以同时明确多个因素的效应,还可以分析出因素间的相互作用(互作),便于选定最优处理组合。
其次,多因素试验可增加误差项的自由度,降低试验误差。
因此比单因素试验精确度更高。
最后,多因素实验所得的结论确切、具体、论据充足。
如单独进行品种对比试验,结果只能粗略地明确品种间的优劣,如果与饲料水平、饲喂方式结合进行三因素试验,可具体明确用一定的饲喂方式在特定的饲料水平下,哪个品种优于哪个品种。
论据、内容都比单因素试验结果丰富。
田间试验中也常要考察哪个品种在何时播种以及在何种密度下的产量表现,同时还可以采用区组设计来安排重复,以便控制系统误差,提高试验的准确性。
现以三因素试验的资料介绍其方差分析方法。
第一节 线性模型与期望均方一、线性数学模型设A 、B 、C 三个因素各含a 、b 、c 个水平,共abc 个处理组合,每个处理组合重复数为r 。
则其任一观察值的线性数学模型为:kl j i l ijk jk ik j i k j i kl j i e y +++++++++=ραβγβγαγαβγβαμ)()()()(其中kl j i l ijk jk ik j i k j i e ,,)(,)(,)(,)(,,,,ραβγβγαγαβγβαμ依次表示总体平均数、A 、B 、C 主效应, A ×B 、A ×B 、B ×C 、A ×B ×C 互作效应,重复(区组)效应和随机误差。
在样本资料中依次分别由),(,x x x A -)(x x B -,)(x x C -,)(x x x x B A AB +--,)(x x x x C A AC +--,)(x x x x C B BC +--,)(x x x x x x x x BC AC AB C B A ABC ----+++,)(x x R -,)(x x x x R ABC ijkl +--进行估计。