第八章方差分析与回归分析
- 格式:doc
- 大小:1.01 MB
- 文档页数:14
第八章 方差分析与回归分析
一、教材说明
本章内容包括:方差分析,多重比较,方差齐性检验,一元线性回归,一元非线性回归.主要讲述方差分析和一元线性回归两节内容.
1、教学目的与教学要求
(1)了解方差分析的统计模型,掌握平方和的分解,熟悉检验方法和参数估计,会解决简单的实际问题.
(2)了解效应差的置信区间的求法,了解多重比较问题,掌握重复数相等与不相等场合的方法,会解决简单的实际问题.
(3)熟练掌握Hartley 检验,Bartlett 检验以及修正的Bartlett 检验三种检验方法,会解决简单的实际问题.
(4)理解变量间的两类关系,认识一元线性和非线性回归模型,熟悉回归系数的估计方法,熟练掌握回归方程的显著性检验.能用R 软件来进行回归分析,会解决简单的实际问题.
2、本章的重点与难点
本章的重点是平方和的分解,检验方法和参数估计、重复数相等与不相等场合的方法、检验方法的掌握,回归系数的估计方法,回归方程的显著性检验,难点是检验方法和参数估计,重复数相等与不相等场合的方法. 实际问题的检验,回归方程的显著性检验.
二、教学内容
本章共分方差分析,多重比较,方差齐性检验,一元线性回归,一元非线性回归等5节来讲述本章的基本内容.
§8.1 方差分析
教学目的:了解方差分析的统计模型,掌握平方和的分解,熟悉检验方法和参数估计,会
解决简单的实际问题.
教学重点:平方和的分解,检验方法和参数估计 教学难点:检验方法和参数估计
教学内容:
本节包括方差分析问题的提出,单因子方差分析的统计模型,平方和分解,检验方法,参数估计,重复数不等情形.
8.1.1 问题的提出
在实际工作中经常会遇到多个总体均值的比较问题,处理这类问题通常采用方差分析方法.
例8.1.1
8.1.2 单因子方差分析的统计模型
在例8.1.1中,我们只考察一个因子,称为单因子试验.记因子为A ,设其有r 个水平,记为1r A ,
,A ,在每一水平下考察的指标可看做一个总体,故有r 个总体,假定
(1)每一总体均为正态总体,记为2
i i N(,)μσ,i 1,2,,r =;
(2)各总体方差相同,即22
2212r σσσσ==
==
(3)每一总体中抽取的样本相互独立,即诸数据ij y 都相互独立 在这三个基本假定下,要检验的假设是
012112::,,,r
r H H μμμμμμ===↔
⋯不全相等 (8.1.1)
如果0H 成立,因子A 的r 个水平均值相同,称因子A 的r 个水平间没有显著差异,简称因子A 不显著;反之,若0H 不成立,因子A 的r 个水平均值不全相同,称因子A 的r 个水平间有显著差异,简称因子A 显著.
在每一水平下各作m 次独立重复试验,若记第i 个水平下第j 次重复的实验结果为ij y ,得到r m ⨯个实验结果:ij y ,=1,2,
,=1,2,,.i r j m
在水平A i 下的实验结果ij y 与该水平下的均值i μ的差距ij ij =y -i εμ称为随机误差.于是有
ij ij y =+i εμ, (8.1.2)
该式称为实验结果ij y 的数据结构式.
把三个假定用于数据结构式就得到单因子方差分析的统计模型:
ij ij 2
ij y =+,=1,2,,=1,2,,;
(0,)i i r j m N εμεσ⎧⎪⎨⎪⎩诸相互独立,且都服从 (8.1.3) 称诸i μ的平均1=1
1
1=(+
+)=r
r i i r
r μμμμ∑为总均值,第i 水平下均值i μ与总均值的差
=-i i a μμ称为因子A 的第i 水平的主效应,简称为A i 的主效应.则有=1
=0,=+.r
i i i i a a μμ∑
统计模型(8.1.3)可改写为
ij ij =1
2ij
y =+a +,=1,2,,=1,2,,;=0;(0,)i r i i i r j m a N μεεσ⎧⎪⎪
⎨⎪⎪⎩∑诸相互独立,且都服从 假设(8.1.1)可改写为
012112:=0
:,,,0r r H a a a H a a a ===↔
⋯不全为.
8.1.3 平方和分解
一 实验数据
在单因子方差分析中可将实验数据列成如下表格形式
因子水平 试验数据 和 平均
1A 11y 12y 1m y 1T 1y 2A 21y 22y 2m y 2T 2
y
r A r1y r2y rm y r T y
r
合计 T y 二 组内偏差与组间偏差
ij ij y -=(y -)+(-)i i y y y y ,记=1i =1i =1=1111=,==m r r m
i i j i i j j j
m r n εεεεε∑∑∑∑,ij y -i y 称为组内偏
差,-i y y 称为组间偏差.
三 偏差平方和及其自由度 在统计学中,把k 个数据1,
,k y y 分别对其均值1=(++)/k y y y k 的偏差平方和
2=1
=(-)k
i i Q y y ∑称为k 个数据的偏差平方和,简称平方和.
由于
=1
(-)=0k
i
i y y ∑,说明在Q 中独立的偏差只有-1k 个,称为该平方和的自由度,记为
f ,=-1.Q f k
四 总平方和分解公式
各ij y 间总的差异大小可用总偏差平方和T S 表示为
211
(),=-1r m
T ij T i j S y y f n ===-∑∑. (8.1.3)
仅由随机误差引起的数据间差异可用组内偏差平方和,也称误差偏差平方和,记为e S ,
211
(),=r(m-1)=n-r.r m
e ij e i i j S y y
f ===-∑∑ (8.1.4)
由效应不同引起的数据差异可用组间偏差平方和表示,也称为因子A 的偏差平方和,
记为A S ,
21
(),=-1.r
A A i
i S m y
y f r ==-∑ (8.1.5)