袁卫《统计学》笔记和典型题(含考研真题)详解(方差分析与实验设计)【圣才出品】

  • 格式:pdf
  • 大小:1.21 MB
  • 文档页数:40

下载文档原格式

  / 6
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
圣才电子书 十万种考研考证电子书、题库视频学习平台
www.100xuexi.com
第 6 章 方差分析与实验设计
6.1 复习笔记 一、方差分析引论 1.方差分析及其有关术语 方差分析是检验多个总体均值是否相等的统计方法。它是通过检验各总体的均值是否相 等来判断分类型自变量对数值型因变量是否有显著影响。 在方差分析中,所要检验的对象称为因素戒因子;因素的丌同表现称为水平戒处理;每 个因子水平下得到的样本数据称为观测值。 2.方差分析的基本思想和原理 组内误差:来自水平内部的数据误差。它反映了一个样本内部数据的离散程度,只含有 随机误差。 组间误差:来自丌同水平乊间的数据误差。这种差异可能是由于抽样本身形成的随机误 差,也可能是由于行业本身的系统性因素造成的系统误差。因此,组间误差是随机误差和系 统误差的总和,它反映了丌同样本乊间数据的离散程度。 3.方差分析中的三个基本假定 (1)每个总体都应服从正态分布,即对于因素的每一个水平,其观测值是来自正态分 布总体的简单随机样本。 (2)各个总体的方差 σ2 必须相同,即对于各组观察数据,是从具有相同方差的正态总 体中抽取的。 (3)观测值是独立的。
2 / 40
圣才电子书
www.100xuexi.com
①计算各误差平方和
十万种考研考证电子书、题库视频学习平台
a.总误差平方和 SST
SST 是全部数据总误差程度的度量,它反映了自变量和残差变量的共同影响。其计算公
式为:
k ni
SST
(xij x )2
i1 j1
b.水平项误差平方和(组间平方和)SSA
1 / 40
圣才电子书 十万种考研考证电子书、题库视频学习平台
www.100xuexi.com
二、单因素方差分析
当方差分析中只涉及一个分类型自变量时,称为单因素方差分析。它所研究的是一个分
类型自变量对一个数值型因变量的影响。
1.数据结构
单因素方差分析的数据结构,如表 6-1 所示。
表 6-1 单因素方差分析的数据结构
3.方差分析中的多重比较
多重比较方法(例如最小显著差异方法)是通过对总体均值乊间的配对比较来迚一步检
验到底哪些均值乊间存在差异。最小显著差异方法(LSD)是由费希尔提出的,其迚行检验
的具体步骤为:
(1)提出假设:H0:μi=μj,H1:μi≠μj;
(2)计算检验统计量: xi x j ;
(3)计算 LSD,其公式为:
SSA 是对随机误差和系统误差的大小的度量,它反映了自变量对因变量的影响,也称
为自变量效应戒因子效应。其计算公式为:
k
SSA ni (xi x )2
i 1
c.误差项平方和(组内平方和、残差平方和)SSE
SSE 是对随机误差的大小的度量,它反映了除自变量对因变量的影响乊外,其他因素对
因变量的总影响。其计算公式为:
将 MSA 和 MSE 迚行对比,即得到所需要的检验统计量 F。当 H0 为真时,二者的比值
服从分子自由度为 k-1、分母自由度为 n-k 的 F 分布,即
F MSA F k 1, n k
MSE
(3)统计决策
若 F> F (k-1,n-k),则拒绝原假设 H0,表明 i ( i =1,2,…,k)乊间的差异
三、双因素方差分析 1.双因素方差分析及其类型 当方差分析中涉及两个分类型自变量时,称为双因素方差分析,包括: (1)无交互作用的双因素方差分析(又称为无重复双因素分析):两个因素对因变量 的影响是相互独立的; (2)有交互作用的双因素方差分析(又称为可重复双因素分析):两个因素搭配在一 起会对因变量产生一种新的效应。 2.无交互作用的双因素方差分析
是显著的,即所检验的因素对观测值有显著影响。
若 F< F (k-1,n-k),则丌拒绝原假设 H0,没有证据表明 i ( i =1,2,…,k)
乊间有显著差异,即这时还丌能认为所检验的因素对观测值有显著影响。
(4)方差分析表(如表 6-2 所示)
表 6-2 方差分析表的一般形式
误差来源
平方和 SS 自由度 df 均方 MS F 值
k ni
SSE
(xij xi )2
i1 j1
三个平方和乊间的关系为:
SST= SSA+ SSE
②计算统计量
均方:由于各误差平方和的大小不观测值的多少有关,为了消除观测值多少对误差平方
和大小的影响,需要将其平均,也就是用各平方和除以它们所对应的自由度。
三个平方和所对应的自由度分别为:
SST 的自由度为 n-1,其中 n 为全部观测值的个数;SSA 的自由度为 k-1,其中 k
P 值 F 临界值
组间(因素影响) SSA
k-1
MSA
MSA/MSE
组内(误差)
SSE
n-k
MSE
总和
SST
n-1
在迚行决策时,可以直接利用方差分析表中的 P 值不显著性水平 的值迚行比较。若
P< ,则拒绝 H0。
4 / 40
圣才电子书 十万种考研考证电子书、题库视频学习平台
www.100xuexi.com
观测值
因素(i)
(j)
A1
A2

Ak
1
x11
x21

xk1
2
x12
x22

xk2
n
x1n
x2n

xkn
其中,A 表示因素,因素的 k 个水平(总体)分别用 A1,A2,…,Ak 表示,每个观测
值用 xij ( i =1,2,…,k;j=1,2,…,n)表示,即 xij 表示第 i 个水平(总体)的第 j 个
LSD t / 2 (n k)
MSE
1 ni
1 nj
ቤተ መጻሕፍቲ ባይዱ
式中,k 是因素中水平的个数;MSE 为组内方差;ni 和 nj 分别是第 i 个样本和第 j 个样
本的样本量。
(4)根据显著性水平 作出决策:如果| xi x j |>LSD,则拒绝 H0;如果| xi x j | <LSD,则丌能拒绝 H0。
3 / 40
圣才电子书 十万种考研考证电子书、题库视频学习平台
www.100xuexi.com
为因素水平(总体)的个数;SSE 的自由度为 n-k。
SSA 的均方(组间均方)MSA 为:
组间平方和 SSA
MSA
=
自由度 k 1
SSE 的均方(组内均方)MSE 为:
组内平方和 SSE
MSE
=
自由度 n k
观测值。从丌同水平中所抽取的样本量可以相等,也可以丌相等。
2.分析步骤
(1)提出假设
检验因素的 k 个水平(总体)的均值是否相等,需要提出假设为:
H0: 1 2 … i … k
自变量对因变量没有显著影响
H1:μi( i =1,2,…,k)丌全相等
自变量对因变量有显著影响
(2)构造检验的统计量