第八章方差分析与回归分析

  • 格式:doc
  • 大小:1.01 MB
  • 文档页数:14

下载文档原格式

  / 14
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第八章 方差分析与回归分析

一、教材说明

本章内容包括:方差分析,多重比较,方差齐性检验,一元线性回归,一元非线性回归.主要讲述方差分析和一元线性回归两节内容.

1、教学目的与教学要求

(1)了解方差分析的统计模型,掌握平方和的分解,熟悉检验方法和参数估计,会解决简单的实际问题.

(2)了解效应差的置信区间的求法,了解多重比较问题,掌握重复数相等与不相等场合的方法,会解决简单的实际问题.

(3)熟练掌握Hartley 检验,Bartlett 检验以及修正的Bartlett 检验三种检验方法,会解决简单的实际问题.

(4)理解变量间的两类关系,认识一元线性和非线性回归模型,熟悉回归系数的估计方法,熟练掌握回归方程的显著性检验.能用R 软件来进行回归分析,会解决简单的实际问题.

2、本章的重点与难点

本章的重点是平方和的分解,检验方法和参数估计、重复数相等与不相等场合的方法、检验方法的掌握,回归系数的估计方法,回归方程的显著性检验,难点是检验方法和参数估计,重复数相等与不相等场合的方法. 实际问题的检验,回归方程的显著性检验.

二、教学内容

本章共分方差分析,多重比较,方差齐性检验,一元线性回归,一元非线性回归等5节来讲述本章的基本内容.

§8.1 方差分析

教学目的:了解方差分析的统计模型,掌握平方和的分解,熟悉检验方法和参数估计,会

解决简单的实际问题.

教学重点:平方和的分解,检验方法和参数估计 教学难点:检验方法和参数估计

教学内容:

本节包括方差分析问题的提出,单因子方差分析的统计模型,平方和分解,检验方法,参数估计,重复数不等情形.

8.1.1 问题的提出

在实际工作中经常会遇到多个总体均值的比较问题,处理这类问题通常采用方差分析方法.

例8.1.1

8.1.2 单因子方差分析的统计模型

在例8.1.1中,我们只考察一个因子,称为单因子试验.记因子为A ,设其有r 个水平,记为1r A ,

,A ,在每一水平下考察的指标可看做一个总体,故有r 个总体,假定

(1)每一总体均为正态总体,记为2

i i N(,)μσ,i 1,2,,r =;

(2)各总体方差相同,即22

2212r σσσσ==

==

(3)每一总体中抽取的样本相互独立,即诸数据ij y 都相互独立 在这三个基本假定下,要检验的假设是

012112::,,,r

r H H μμμμμμ===↔

⋯不全相等 (8.1.1)

如果0H 成立,因子A 的r 个水平均值相同,称因子A 的r 个水平间没有显著差异,简称因子A 不显著;反之,若0H 不成立,因子A 的r 个水平均值不全相同,称因子A 的r 个水平间有显著差异,简称因子A 显著.

在每一水平下各作m 次独立重复试验,若记第i 个水平下第j 次重复的实验结果为ij y ,得到r m ⨯个实验结果:ij y ,=1,2,

,=1,2,,.i r j m

在水平A i 下的实验结果ij y 与该水平下的均值i μ的差距ij ij =y -i εμ称为随机误差.于是有

ij ij y =+i εμ, (8.1.2)

该式称为实验结果ij y 的数据结构式.

把三个假定用于数据结构式就得到单因子方差分析的统计模型:

ij ij 2

ij y =+,=1,2,,=1,2,,;

(0,)i i r j m N εμεσ⎧⎪⎨⎪⎩诸相互独立,且都服从 (8.1.3) 称诸i μ的平均1=1

1

1=(+

+)=r

r i i r

r μμμμ∑为总均值,第i 水平下均值i μ与总均值的差

=-i i a μμ称为因子A 的第i 水平的主效应,简称为A i 的主效应.则有=1

=0,=+.r

i i i i a a μμ∑

统计模型(8.1.3)可改写为

ij ij =1

2ij

y =+a +,=1,2,,=1,2,,;=0;(0,)i r i i i r j m a N μεεσ⎧⎪⎪

⎨⎪⎪⎩∑诸相互独立,且都服从 假设(8.1.1)可改写为

012112:=0

:,,,0r r H a a a H a a a ===↔

⋯不全为.

8.1.3 平方和分解

一 实验数据

在单因子方差分析中可将实验数据列成如下表格形式

因子水平 试验数据 和 平均

1A 11y 12y 1m y 1T 1y 2A 21y 22y 2m y 2T 2

y

r A r1y r2y rm y r T y

r

合计 T y 二 组内偏差与组间偏差

ij ij y -=(y -)+(-)i i y y y y ,记=1i =1i =1=1111=,==m r r m

i i j i i j j j

m r n εεεεε∑∑∑∑,ij y -i y 称为组内偏

差,-i y y 称为组间偏差.

三 偏差平方和及其自由度 在统计学中,把k 个数据1,

,k y y 分别对其均值1=(++)/k y y y k 的偏差平方和

2=1

=(-)k

i i Q y y ∑称为k 个数据的偏差平方和,简称平方和.

由于

=1

(-)=0k

i

i y y ∑,说明在Q 中独立的偏差只有-1k 个,称为该平方和的自由度,记为

f ,=-1.Q f k

四 总平方和分解公式

各ij y 间总的差异大小可用总偏差平方和T S 表示为

211

(),=-1r m

T ij T i j S y y f n ===-∑∑. (8.1.3)

仅由随机误差引起的数据间差异可用组内偏差平方和,也称误差偏差平方和,记为e S ,

211

(),=r(m-1)=n-r.r m

e ij e i i j S y y

f ===-∑∑ (8.1.4)

由效应不同引起的数据差异可用组间偏差平方和表示,也称为因子A 的偏差平方和,

记为A S ,

21

(),=-1.r

A A i

i S m y

y f r ==-∑ (8.1.5)