当前位置:文档之家› 第六章(4)多元正态总体均值向量的假设检验

第六章(4)多元正态总体均值向量的假设检验

第六章(4)多元正态总体均值向量的假设检验
第六章(4)多元正态总体均值向量的假设检验

第六章(4)多元正态总体均值向量的假设检验

类似一元统计分析中的各种均值和方差的检验相应给出多元统计分析中的各种均值向量和协差阵的检验。我们只侧重于解释选取统计量的合理性,而不给出推导过程,最后给出几个实例

第1节 HotellingT 2分布

为了对多元正态总体均值向量作检验,首先需要给出HotellingT 2分布的定义。

定义 设),(~),,(~∑∑n W S N X

p p μ且

X 与S 相互独立,p

n ≥

,则称统计量

X

S X n T

1

2

-'=的分布为非中心HotellingT 2分布,记为),,(~2

2

μn p T T 。当0=μ时,

称2T 服从(中心)HotellingT 2分布,记为),(2n p T ,由于这一统计量的分布首先由Harold Hotelling 提出来的,故称为HotellingT 2分布,值得指出的是,我国著名统计学家许宝马录 先生在1938年用不同方法也导出T 2分布的密度函数,因表达式很复杂,故略去。

在一元统计中,若n X X ,,1 来自总体)

,(2

σ

μN 的样本,则统计量:

)

1(~?)(--=n t X n t σ

μ分布

其中

2

1

2

)

(1

1?∑=--=

n

i i

X X

n σ

显然

)

()?()(?)

(1

22

2

2

μσ

μσ

μ-'-=-=

-X X n X n t

与上边给出的T

2

统计量形式类似,且???

?

??-n N X 2

,0~σμ。 可见,T 2分布是一元统计中t 分布的推广。 基本性质:

在一元统计中,若统计量)1(~-n t t 分布,则)

1,1(~2

-n F t 分布,即把t 分布

的统计量转化为F 统计量来处理,在多元统计分析中T 2统计量也具有类似的性质。

定理 若),(~),,0(~∑∑n W S N X

p p 且

X 与S 相互独立,令X S X n T 1

2-'=,则

)

1,(~12

+-+-p n p F T

np

p n

这个性质在后面经常用到。

第2节 均值向量的检验

设p 元正态总体

)

,(∑μp N ,从总体中抽取容量为n 的样本

∑∑=='--=

=

n

i n

i i i i n X X X X

S X n

X X X X 1

1

)()

()

()()2()1())((,1

,,,, 。

一、∑已知时均值向量的检验

01000:H )(:μμμμμ≠=为已知向量H

检验统计量:

)(~)()(2

01

02

0p X X n T χμμ-∑

'-=-(在H 0成立时)

给出检验水平α,查2χ分布表使{}αλα=>20T P ,可确定出临界值αλ,再用样本值计算出20T ,若αλ>20T ,则否定H 0,否则H 0接受。

这里要对统计量的选取作两点解释,一是说明它为什么取为这种形式。二

是说明它为什么服从)(2p χ分布。

一元统计中,当2σ已知时,作均值检验所取的统计量为:

)1,0(~0

N n

X U σ

μ-=

显然,

)()

)(()

(01

202

2

02

μσμσ

μ--=-=

-X X n X n U

与上边给出的检验统计量20T 形式相同。另外根据二次型分布定理: 若),0(~∑p N X

,则)(~2

1

p X X χ-∑

'。显然,

1

001

02

0)()()(--∑

'-=-∑

'-=μμμX n X X n T )

(0μ-X n Y

Y 1

-∑'?。其中,

),0(~)(0∑-=

p N X n Y μ,因此,)(~)()(2

01

02

0p X X n T χμμ-∑'-=-。

二、∑未知时均值向量的检验

00:μμ=H

01:μμ≠H

检验统计量:

),(~)1(1)1(2

p n p F T

p

n p n --+--(在H 0成立时)

其中[])()()1(01'02μμ---=-X n S X n n T 。

给定检验水平α,查F 分布表,使α

α=?

?????>--F T

p

n p n p 2

)1(,可确定出临界

值αF ,再用样本值计算出2T ,若

αF T

p

n p n >--2

)1(,则否定0H ,否则0H 相容。

这里需要解释的是,当∑未知时,自然想到要用样本协差阵S

n 1

1-去代替∑,

因(1-n )S -1是1-∑的无偏估计量,而样本离差阵

)

,1(~)()()(1

)

(∑-'--=

∑=n W X X X X

S p a n

x a

)

,0(~)(0∑-p N X n μ

[

]

)

,(~)()()

1(T 2

01

02

p n p T X n S

X n n --'--=∴-μμ

再根据Hotelling T 2分布性质,所以

),(~)1(1)1(2

p n p F T

p

n p n --+--

例1. 人的出汗多少与人体内钠和钾的含量有一定的关系。今测20名健康成年女性的出汗多少(X 1)、钠的含量(X 2)和钾的含量(X 3),其数据如下表。试检验0100:,)10,50,4(:μμμμ≠'==H H 。

经计算

)965.9,4.45,64.4('=X )035.0,6.4,64.0(0'

-=-μX

??

?

?

?

???

??----=9255.6816

.107374

.3216

.10798.379559

.177374.3259.177764.55S

为了计算)()(01

0μμ-'--X S

X ,令)(),(001

μμ-=-=-X SY X S Y 则,于是得如下方

程组,

??

?

??=+---=-+=-+035

.09255.6816.107374.326.416.10798.379559.17764

.0374.3259.177764.55321321321y y y y y y y y y

解得:0020

.0,0015.0,0151.0321

-=-==y y y 。

于是

Y

X X S

X )()()(001

0'-=-'--μμμ

???

?

?

?????---=0020.00015

.00151.0)035.0,6.4,64.0(

=0.016494

)())(1(01

02

μμ-'--=-X S

X n n T

26772

.6016494

.01920=??=

87

.126772.63

1917=??=

F

查F 表得18.5)01.0(,2.3)05.0(17,317,3==F F 。 因此在a = 0.05或0.01时接受H 0假设。

三、协差阵相等时,两个正态总体均值向量的检验

设 ,n ,a N X X X X p ap a a a 1 ),(~),,,(121)(=∑'=μ

,m ,a N Y Y Y Y p ap a a a 1 ),(~),,,(221)(=∑'=μ

且两组样本相互独立,∑∑===

=

m

i i n

i i Y m

Y X

n

X

1

)

(1

)

(1,1。

(1)有共同已知协差阵时

210:μμ=H

211:μμ≠H

检验统计量:

)

(~)()(2

_1

20

p Y X Y X m

n m n T

χ-

--∑'-+?=

(在H 0成立时)

给出检验水平a ,查)(2p x 分布表使{}

a

T P a =>λ2

,可确定出临界值a λ,再

用样本值计算出20T ,若a

T λ>2

0,则否定H 0,否则H 0相容。

在一元统计中作均值相等检验所给出的统计量:

)1,0(~2

2

N m

n

Y

X U σ

σ

+

-=

显然,

2

2

2

2

22

)

()()

(Y X m n m n m

n

Y X U

-+?=

+

-=

σ

σ

σ

)

1(~)()

()(2

1

2,χσY X Y X m

n m n --+?=

-

此式恰为上边统计量当1=p 时的情况,不难看出这里给出的检验统计量是一元情况的推广。

(2)有共同的未知协差阵0>∑

210:μμ=H

2

11:μμ≠H

检验统计量:

)1,(~)2(1)2(2

--+-++--+=

p m n p F T

p

m n p m n F (在H 0成立时)

其中:

???

??

?-+?????

?

?

-+?-+=-)()()2(1'

2

Y X m n m

n S Y X m n m

n m n T

21S S S +=

'

211

)()

(1),,,(X ,))((p n

a a a X X X X X X X

S ='

--=

∑=

'

21'

1

)()

(2),,,(Y ,))((Y Y Y Y Y Y Y

S m

a a a =--=

∑=

给定检验水平α,查F 分布表使{}αα=>F F P ,可确定出a F ,再用样本值计算出F ,若αF F >,则否定H 0,否则H 0相容。

当两个总体的协差阵未知时,自然想到用每个总体的样本协差阵

11

1S n -和

21

1S m -去代替,而

),1(~)()()(1

)

(1∑-'--=

∑=n W X X X X

S p n

a a α

),1(~)()()(1

)

(2∑-'--=

∑=m W Y Y Y Y

S p m

a a α

从而),2(~21∑-++=m n W S S S p ,

所以

)1,(~)

2(1

)2(2

--+-++--+p m n p F T

m n p m n

下述假设检验统计量的选取和前边统计量的选取思路是一样的,以下只提出待检验的假设,然后给出统计量及其分布,为节省篇幅,不做重复的解释。

四、协差阵不等时,两个正态总体均值向量的检验

n

,1, ),(~),,,(1121)( =∑'=αμp ap

a a a N X

X

X

X

m

,1, ),(~),,,(2221)( =∑'=αμp ap a a a N Y Y Y Y

且两组样本相互独立,0,021>∑>∑

210:μμ=H

2

11:μμ≠H

分两种情况 (1)n = m 令

n

,1,i )()()( =-=i i i Y X Z

Y

X Z n

Z n

i i -==

∑=1

)

(1

∑=--=

n

j j j Z Z Z Z

S 1

'

)()

()

)((

∑=+--+--=

n

j i j i j Y X Y X Y X Y X

1

'

)()()()

())((

检验统计量:

),(~)(1

'

p n p F Z S

Z p

n

p n F --=

- (在H 0成立时)

(2),m n ≠不妨假设m n < 令

∑∑==-

?+

-=n

j m

j j j i i i Y m

Y

m

n Y m

n X Z 1

1

)

()

()()()(1

1

n

i ,,1 =

Y

X Z

n

Z n

i i -==

∑=1

)

(1

∑='--=

n

i i i Z Z Z Z

S 1

)()

())((

==????

???

?

---=

n

i n

j j i i Y n Y m

n X X 1

1)()

()()1

()(

'

????

???

?

---?∑

=)1

()(1)()

()(n

j j i i Y n Y m

n X X

检验统计量:

),(~)(1

'

p n p F Z S

Z p

n

p n F --=

-

例2 。 为了研究日、美两国在华投资企业对中国经营环境的评价是否存在差异,今从两国在华投资企业中各抽出10家,让其对中国的政治、经济、法律、文化等环境进行打分,其结果如下表:

1~10号为美国在华投资企业代号,10~20号为日本在华投资企业的代号。数据来源:国务院发展研究中心APEC 在华投资企业情况调查。

设两组样本来自正态总体分别记为:

,101, ),(~14)( =∑a N X a μ ,10

1, ),(~24)( =∑a N Y a μ

且两组样本相互独立,共同未知协差阵0>∑:

211210:H :μμμμ≠=H

检验统计量: )1,(~)2(1)2(2

--+-++--+=

p m n p F T

p

m n p m n F 。

经计算

)63,5.30,43,64('=X )5.40,40,51,5.50('=Y

∑='--=

10

1

)()

(1))((A a a X X X X

S

??

???

????

?

??----=51084

422

8

845.332380422

3510170880170410

∑='

--=

10

1

)()

(2))((a a a Y Y Y Y

S

??

???

?

?

?????----=5.2525

.52139

5

5.52475140165139

140390605165605.512

21S S S +=

??

???

?????

??--=5.7625

.31561

3

5.315.80714385561

1439001103

851105.922

?

?

?

?

?

?

?

??

?

??--------=-0025.00002

.00016

.00002

.00002.00013.00004.00002.00016

.00004.00022.00003.00002.00002.00003.00011.01

S

代入统计量中得

6913

.7=F

查F 分布表得 89

.415401.0=),(F 。

显然

)15.4(01.0F F >

故否定H 0,即认为日、美两国在华投资企业对中国经营环境的评价存在显著差异。

一般总体均值的假设检验.

§7.4 一般总体均值的假设检验 一、一般总体均值的大样本假设检验 1. 一个总体均值的大样本假设检验 设样本12(,,,)n X X X 取自非正态总体X ,记总体均值μ=)(X E 。样本均值及样本方差分别为11n i i X X n ==∑,2211()1n i i S X X n ==--∑。 如果我们要做双侧检验:0100::μμμμ≠?=H H ,在大样本情况(样本容量30≥n )下可选 n S X Z /0 μ-=为检验统计量,由中心极限定理知,它在0H 成立时近 似服从)1,0(N 。检验的P 值近似为|))(|1(2)| |(20O O z z Z P Φ-==≥μμ,其中检验统计量Z 的观测值为 n s x z O /0 μ-=。 例7.4.1 一种机床加工的零件尺寸绝对平均误差为1.35mm 。生产厂家现采用一种新的 机床进行加工以期降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。50个零件尺寸的绝对误差数据(mm )如下所示: 1.26 1.19 1.31 0.97 1.81 1.13 0.96 1.06 1.00 0.94 0.98 1.10 1.12 1.03 1.16 1.12 1.12 0.95 1.02 1.13 1.23 0.74 1.50 0.50 0.59 0.99 1.45 1.24 1.01 2.03 1.98 1.97 0.91 1.22 1.06 1.11 1.54 1.08 1.10 1.64 1.70 2.37 1.38 1.60 1.26 1.17 1.12 1.23 0.82 0.86 利用这些数据,检验新机床加工的零件尺寸的平均误差是否显著降低?(0.01α=) 解:这里研究者所关心的是新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低,也就是新机床加工的零件尺寸的误差的数学期望μ=)(X E 是否小于1.35,因此属于单左侧检验。提出的假设如下: 0: 1.35H μ≥?1: 1.35H μ< 现在50=n ,检验统计量可选为 )1,0(~/35.135.1N n S X Z =-=μ; 由数据得:215.1=x ,366.0=s ,故检验统计量Z 的观测值为608.250 /366.035 .1215.1-≈-≈O z ,所以检验的P 值近似为 0046.0)608.2()35.1608.2(=-Φ≈=-≤μZ P 。 因为01.0

spss教程均值比较检验与方差分析

第二章均值比较检验与方差分析 在经济社会问题的研究过程中,常常需要比较现象之间的某些指标有无显著差异,特别当考察的样本容量n比较大时,由随机变量的中心极限定理知,样本均值近似地服从正态分布。所以,均值的比较检验主要研究关于正态总体的均值有关的假设是否成立的问题。 ◆本章主要内容: 1、单个总体均值的 t 检验(One-Sample T Test); 2、两个独立总体样本均值的 t 检验(Independent-Sample T Test); 3、两个有联系总体均值均值的 t 检验(Paired-Sample T Test); 4、单因素方差分析(One-Way ANOVA); 5、双因素方差分析(General Linear Model Univariate)。 ◆假设条件:研究的数据服从正态分布或近似地服从正态分布。 在Analyze菜单中,均值比较检验可以从菜单Compare Means,和General Linear Model得出。如图2.1所示。 图2.1 均值的比较菜单选择项 §2.1 单个总体的t 检验(One-Sample T Test)分析 单个总体的 t 检验分析也称为单一样本的 t 检验分析,也就是检验单个变量的均值是否与假定的均数之间存在差异。如将单个变量的样本均值与假定的常数相比较,通过检验得出预先的假设是否正确的结论。

例1:根据2002年我国不同行业的工资水平(数据库SY-2),检验国有企业的职工平均年工资收入是否等于10000元,假设数据近似地服从正态分布。 首先建立假设:H0:国有企业工资为10000元; H1:国有企业职工工资不等于10000元 打开数据库SY-2,检验过程的操作按照下列步骤: 1、单击Analyze →Compare Means →One-Sample T Test,打开One-Sample T Test 主对话框,如图2.2所示。 图2.2 一个样本的t检验的主对话框 2、从左边框中选中需要检验的变量(国有单位)进入检验框中。 3、在Test Value框中键入原假设的均值数10000。 4、单击Options按钮,得到Options对话框(如图2.3),选项分别是置信度(默认项是95%)和缺失值的处理方式。选择后默认值后返回主对话框。 图2.3 一个样本t检验的Options对话框 5、单击OK,得输出结果。如表2.1所示。 表2.1(a).数据的基本统计描述 One-Sample Statistics

总体均值的假设检验

总体均值的假设检验 一、正态总体均值的检验 设n X X X ,, , 21为总体),(2 N 的一个容量为n 的样本. 1.方差2 已知, 的检验——u 检验法. 当2 02 已知时, 假设检验问题:0100 :;:H H . 选择检验统计量n X U /00 ,当0H 成立时,)1,0(~N U . 给定显著性水平 ,由标准正态分布分位点的定义, 有 }|{|2/u U P , 故拒绝域}{}{}|{|2/2/2/ u U u U u U W , 这种利用服从正态分布的检验统计量的检验方法称为u 检验法. 有时我们只关心总体的均值是否增大(或减小).比如,经过工艺改革后,产品的质量(如材料的强度)比以前是否提高,此时我们要研究的是新工艺下总体的均值 是小于等于原来的均值0 ,还是大于0 , 即检验假设 0100 :;:H H . 可以证明,在显著性水平 下,上述假设检验问题和 检验假设0100 :;:H H 有相同的拒绝域, 因此,遇到形如00 :H 的检验问题,可归结为后一个假设检验问题讨论. 类似地,形如0100 :;:H H 的检验问题, 可归结为检验假设 0100 :;:H H . 这都是单边检验问题.给定显著性水平 ,求得的临界值点是上 分位点或上 1分位点.

例1 某厂生产的某种钢索的断裂强度X 服从),(2 N ,其中 40 (kg/cm 2),现从这批钢索中抽取容量为9的样本,测得断裂强度的平均值 x 较以往正常生产的 大20(kg/cm 2 ),设总体方差不变,问在1.00 下,能否 认为这批钢索质量有显著提高? 解 依题意,检验假设0100 :;:H H , 由于40 已知,选择检验统计量n X U /0 因为0H 中的 全部都比1H 中的 要小,从直观上看,当0H 成立时,X 的取值 x 不应比 大很多,若偏差0 x 过大,则拒绝0H 而接受1H . 因为 0100 :;:H H 的拒绝域为}{ u U W , 故在显著性水平1.00 下原假设的拒绝域为 }{}{0n u X u U W . 本题中,9 n ,40 ,200 x ,33.201.0 u , 计算U 的值33.25.1/0 n x u 因此在显著性水平1.00 下不能拒绝0H ,即认为这批钢索质量没有显著提高. 2.方差2 未知, 的检验——t 检验法. 检验假设0100 :;:H H . 因为2 未知,而样本方差2S 是总体方差2 的无偏估计量,用S 代替 . 选择检验统计量 n S X T /0 , 当0H 成立时,)1(~ n t T .给定显著性水平 ,由t 分布分位点的定义, 有 )}1(|{|2/n t T P ,

均值比较与实验法常用的统计检验

均值比较与实验法常用的统计检验 总结与范例 理论基础: 一、描述性统计与推断性统计 二、抽样分布:样本统计量的分布 三、假设检验的(1)原理(小概率事件反证法),(2)步骤(原假设与备择假设、计算统计量、显著性水平、拒绝或接受原假设、I类错误和II类错误),(3)实用条件(总体正态分布、独立随机抽样、方差齐性)。 四、样本均值的抽样分布—t分布 1.单样本t检验(样本均值与总体均值的差异显著性检验) 例1:医学界测得正常人的每分钟脉搏次数为72,下面是本年度体检时随机抽查的20位电子科大教职工的每分钟脉搏次数,分别为:72,76,68,78,62,59,64,85,70,75,61,74,87,83,54,76,56,66,68,62。请问电子科大教职工的脉搏次数与正常人是否有显著差异? 2.独立样本t检验(实验组\控制组,完全随机分组,被试间设计) 例2:在一项关于反馈对知觉判断(直线长度判断)的影响的研究中,将被试随机分成两组,其中一组20人,每一次知觉判断后将结果告诉被试。另一组20人,每次知觉判断后不将结果告诉被试。测量被试判断线段长度的准确度,并按一定的评分标准打分,分值越高表明长度判断的准确度越高。两组被试的实验得分如下: 反馈组:78 82 83 77 78 81 85 84 86 75 78 86 84 88 75 90 88 70 69 80 不反馈组:74 80 70 65 72 80 66 73 82 83 69 85 66 75 74 78 69 70 71 79 请问给不给反馈会不会显著影响被试的长度判断的准确度? 3.配对样本t检验(重复测量\前后测、匹配\配对组设计、被试内设计) 例3:从某小学三年级随机抽取20名儿童,分别在学期初和学期末进行瑞文推理测验,结果如下: 学生编号 1 2 3 4 5 6 7 8 9 10 学期初12 13 12 11 10 13 14 15 15 11 学期末14 14 11 15 11 14 14 17 15 14 学生编号11 12 13 14 15 16 17 18 19 20 学期初13 12 11 10 13 14 15 15 11 12 学期末14 14 11 15 14 14 16 18 15 14 请问经过一学期的学习,学生的瑞文推理测验成绩是否有显著提高? 五、样本方差的抽样分布—F分布 方差分析(Analysis of Variance, ANOV A) 1.单因素方差分析(事后比较,post hoc)、 例4:喝酒会不会使一个人的认知判断更容易受外界影响呢?Gustafson(1987)设计了一个实验探讨这个问题。在实验中,被试的任务是进行线段长度判断,三十九名被试随机分成三组:其中,第一组被试喝果汁,第二组被试也喝果汁,但告诉他们果汁中加入了一定量的酒,第三组被试依其体重喝一定量的酒。饮用15分钟之后开始进行线段长度判断任务,每个被试进行75次重

正态总体均值及方差的假设检验表

正态总体均值及方差的假设检验表: 单正态总体均值及方差的假设检验表(显著性水平α) 1 a n ~N (0,1)2 01 a S n ~t 2 2 02 1 0n i n i a ~ 2或 2 21 2 n 2 2n 2 21 n 20 ~ 22 21 1 2 n 2 21n 21 1 n

2 212 12 n n ~N (0,1) 2 1 2 11W S n n ~ 2 , 22 1122 122 n S n S n n 22 22 21112 2 1 2 1i i n i i a a n ~12,F n n 2 或 2 2 221 n S n ~21,1n 1 2或 2

Z =ξ-η~N (a 1-a 2,21σ+2 2σ),Z i =ξi -ηi . 2 21 2 Z n ) 2 1 S n ~ 2

单正态总体均值及方差的区间估计(置信度1-α) 已知 1 a n ~N (0,1)0 1 1 , n n u u n n 1 a S n ~t , 1 1 t t n n 2 02 1 n i n i a ~ 001 122, 12 2 i i i i n n a a 20 ~ 21 ,12 2 n

2个正态总体均值差及方差比的区间估计(置信度1-α) 12 212 12 a n n ~N (0,1) 2212 12 u n n 112 11W a S n n 22 n t 1 22 12 11W n n t S n n )2 a ξ-12 ,1 ,2 2 n n A F A 2 112 222 2 11n S n S ~ 2 2 21112W n S n S n n 212 1212 2 2 1 n i i n i i n a A n a ,2 122 2 21111n n S B n n S . (注:专业文档是经验性极强的领域,无法思考和涵盖全面,素材和资料部分来自网络,供参考。可复制、编制,期待你的好评与关注)

§8.2总体均值的假设检验

§8.2总体均值的假设检验 一、正态总体均值的检验 设n X X X ,,, 21为总体),(2σμN 的一个容量为n 的样本. 1.方差2σ已知,μ的检验——u 检验法. 当2 02σσ=已知时, 假设检验问题:0100μμμμ≠=:;:H H . 选择检验统计量n X U /00 σμ-= ,当0H 成立时,)1,0(~N U . 给定显著性水平α,由标准正态分布分位点的定义, 有αα=>}|{|2/u U P , 故拒绝域}{}{}|{|2/2/2/αααu U u U u U W >-<=>= , 这种利用服从正态分布的检验统计量的检验方法称为u 检验法. 有时我们只关心总体的均值是否增大(或减小).比如,经过工艺改革后,产品的质量(如材料的强度)比以前是否提高,此时我们要研究的是新工艺下总体的均值μ是小于等于原来的均值0μ,还是大于0μ, 即检验假设 0100μμμμ>≤:;:H H . 可以证明,在显著性水平α下,上述假设检验问题和 检验假设0100μμμμ>=:;:H H 有相同的拒绝域, 因此,遇到形如00μμ≤:H 的检验问题,可归结为后一个假设检验问题讨论. 类似地,形如0100μμμμ<≥:;:H H 的检验问题, 可归结为检验假设 0100μμμμ<=:;:H H . 这都是单边检验问题.给定显著性水平α,求得的临界值点是上α分位点或上α-1分位点. 例1 某厂生产的某种钢索的断裂强度X 服从),(2σμN ,其中40=σ(kg/cm 2),现从这批钢索中抽取容量为9的样本,测得断裂强度的平均值x 较以往正常生产的μ大20(kg/cm 2),设总体方差不变,问在1.00=α下,能否认为这批钢索质量有显著提高?

单个正态总体的假设检验

学院数学与信息科学学院 专业信息与计算科学 年级 2011级 姓名姚瑞娟 论文题目单个正态总体的检验假设 指导教师韩英波职称副教授成绩 2014年3月10日

目录 摘要 (1) 关键词 (1) Abstrac (1) Keywords (1) 前言 (1) 1 假设检验的基本步骤 (2) 1.1 建立假设 (2) 1.2 建立假设选择检验统计量,给出拒绝域形式 (2) 2 单个正态总体均值的检验 (3) 2.1 δ已知时的μ检验 (4) 2.2 δ未知时的t检验 (6) 3 单个正态总体方差的检验 (8) 参考文献 (9)

单个正态总体的假设检验 学生姓名:姚瑞娟学号:20115034036 数学与信息科学学院信息与计算科学专业 指导老师:韩英波职称:副教授 摘要:本文介绍了假设检验的基本步骤,如何建立假设检验,判断假设是否正确.此外,从2δ已知和2δ未知详细的讲述了单个正态总体μ的检验,还有单个正态总体方差的检验,及与它们相关的应用举例. 关键词:正态分布;假设检验;均值;方差;拒绝域;接受域;原假设; Hypothesis test of one normal population Abstract:It introduces the basic steps of hypothesis test in this paper, and how to build hypothesis and correct judgment test. In addition, it detailed introduces the single hypothesis test from variance is known and unknown. There is a single of normal population variance test and the related application. Keywords:normal distribution;price value;hypothesis test;variance;rejected region;receptive regions;the original hypothesis 前言 假设检验是由K.Pearson于20世纪初提出的,之后由费希尔进行了细化,并最终由奈曼和E.Pearson提出了较完整的假设检验理论.统计推断的一个重要内容就是假设检验.然而,正态分布正态分布是最重要的一种概率分布,正态分布概念是由德国的数学家和天文学家Moiré于1733年受次提出的,但由于德国数学家Gauss率先将其应用于天文学家研究,故正态分布又叫高斯分布,高斯这项工作对后世的影响极大他使正态分布同时有了”高斯分布”的名称,后世之所以多将最小二乘法的发明权归之于他.也是出于这一工作,高斯是一个伟大的数学家,重要的贡献不胜枚举.但现今德国10马克的印有高斯头像的钞票,其上还印有正态

均值比较与t检验

第3章均值比较与t检验(t代表平均值间的差距p代表的是可信度) 3.1样本平均数与总体平均数差异显著性检验 在实际工作中,我们往往需要检验一个样本平均数与已知的总体平均数是否有显著差异,即检验该样本是否来自某一总体,已知的总体平均数一般为一些公认的理论数值、经验数值或期望数值,比较的目的是推断样本所代表的未知总体均数与已知总体均数有无差别。 例题:已知玉米单交种群单105的平均穗重为300g,喷药后随机抽取9个果穗称重,穗重分别为:308、305、311、298、315、300、321、294、320g,问喷药前后果穗穗重差异是否显著。 具体操作可参看多媒体教程-3.1单一样本t检验,例题中的数据编号为data-01。 操作步骤:Analyze→Compare Means→点击One-Sample T Test,进人对话框→将要分析的变量选入Test Variables→Test Value项填入已知总体均数→点击Options按钮,进入Options子对话框,Confidence Interval选项中填入95或99,确定显著水平后返回上一对话框→点击OK键运行,显示结果界面。 结果界面包括描述性统计量表(One-Sample Statistics) 和t检验表(One-Sample Test)两个表格。描述性统计量表中输出样本含量、均数、标准差和标准误;t检验表中显示t 值(t)自由度(df)、双尾P值(Sig.2-tailed)、样本均数与已知总体均数的差值(Mean Difference)、差

值的95%或99%置信区间的上限与下限(95%Confidence Interval of the Difference,Lower,Upper)。 3.2独立样本t检验 在实际工作中,还经常会遇到推断两个样本平均数差异是否显著的问题,以了解两样本所属总体的平均数是否相同。因试验设计不同,一般可分为:非配对或成组设计两样本平均数的差异显著性检验和配对设计两样本平均数的差异显著性检验。 非配对设计或成组设计是指当进行只有两个处理的试验时,将试验单位完全随机地分成两个组,然后对两组随机施加一个处理。在这种设计中两组的试验单位相互独立,所得的两个样本相互独立,其含量不一定相等。 例题:某家禽研究所对粤黄鸡进行饲养对比试验,试验时间为60天,增重结果如下,问两种饲料对粤黄鸡的增重效果有无显著差异?

第三节-两正态总体的假设检验

第三节 两个正态总体的假设检验 上一节介绍了单个正态总体的数学期望与方差的检验问题,在实际工作中还常碰到两个正态总体的比较问题. 1.两正态总体数学期望假设检验 (1) 方差已知,关于数学期望的假设检验(Z 检验法) 设X ~N (μ1,σ12),Y ~N (μ2,σ22),且X ,Y 相互独立,σ12与σ22 已知,要检验的是 H 0:μ1=μ2;H 1:μ1≠μ2.(双边检验) 怎样寻找检验用的统计量呢从总体X 与Y 中分别抽取容量为n 1,n 2的样本X 1,X 2,…, 1n X 及Y 1,Y 2,…,2n Y ,由于 2111~,X N n σμ?? ??? ,2222~,Y N n σμ?? ???, E (X -Y )=E (X )-E (Y )=μ1-μ2, D (X -Y )=D (X )+D (Y )= 22 121 2 n n σσ+, 故随机变量X -Y 也服从正态分布,即 X -Y ~N (μ1-μ2, 22 121 2 n n σσ+). 从而 X Y ~N (0,1). 于是我们按如下步骤判断. (a ) 选取统计量 Z X Y , () 当H 0为真时,Z ~N (0,1). (b ) 对于给定的显著性水平α,查标准正态分布表求z α/2使 P {|Z |>z α/2}=α,或P {Z ≤z α/2}=1-α/2. () (c ) 由两个样本观察值计算Z 的观察值z 0: z 0 x y . (d ) 作出判断: 若|z 0|>z α/2,则拒绝假设H 0,接受H 1; 若|z 0|≤z α/2,则与H 0相容,可以接受H 0. 例8.7 A ,B 两台车床加工同一种轴,现在要测量轴的椭圆度.设A 车床加工的轴的椭

均值比较和T检验

Spss16.0与统计数据分析均值比较和T检验 2013年6月13日

均值比较和T 检验 统计分析常常采取抽取样本的方法,即从总体中随机抽取一定数量的样本进行研究来推论总体的特性。但是,由于抽取的样本不一定具有完全代表性,样本统计量与总体参数间存在差异,所以不能完全的说明总体的特性。同时,我们也可以知道,均值不等的两个样本不一定来自均值不同的整体。对于如何避免这些问题,我们自然可以想均值比较和T 检验 1、Means 过程 1.1 Means 过程概述 (1)功能:对数据进行进行分组计算,比较制定变量的描述性统计量包括均值、标准差 、总和、观测量数、方差等一系列单列变量描述性统计量,还可以给出方差分析表和线性检验结果。 (2)计算公式为: n x x n i i ∑==1 11 1.2问题举例: 比较不同性别同学的体重平均值和方差。数据如下表所示: 体重表 1.3用SPSS 操作过程截图:

1.4 结果和讨论 p{color:black;font-family:sans-serif;font-size:10pt;font-weight:normal} Your trial period for SPSS for Windows will expire in 14 days.p{color:0;font -family:Monospaced;font-size:13pt;font-style:normal;font-weight:normal;text-decoration:none} MEANS TABLES=体重 BY 性别 /CELLS MEAN COUNT STDDEV VAR. Means

单个正态总体均值和方醚的假设检验

§2 一.已知方差2σ, 检验假设::H μμ=o o (1)提出原假设::H μμ=o o ( μo 是已知数) (2)选择统计量: 2 X U n μσ-= o (3 )求出在假设H o 成立的条件下,确定该统计量服从的概率分布: (0,1)U N : (4)选择检验水平 α,查正态分布表(附表1),得临界值12 u α- ,即 2 12 ( )X P u n α μα σ- ->=o (5) 根据样本值计算统计量的观察值u o ,给出拒绝或接受H 。的判断: 当 12 u u α - >o 时, 则拒绝H 。; 当 12 u u α - ≤o 时, 则接受H 。. 【例1】 某厂生产干电他,根据长期的资料知道,干电他的寿 解:

现取0.05 α=,即 ( 1.96)0.05 5/10 X P>= 因而,拒绝原假设,即这批干电他的平均寿命不是200小时. 【例2】P.191 ――例2.1(0.05 α=,0.01) P.193――例2.2 二.未知方差2σ, 检验假设:: Hμμ = o o : (1)提出原假设:: Hμμ = o o ( μ o是已知数) (2)选择统计量:2 X T S n - =o (3)求出在假设H o成立的条件下,确定该统计量服从的概率分布: (1) T t n- : (4)选择检验水平 α,查自由度为1 n-的t-分布表(附表2),得临界值λ,即 2 () X P S n μ λα - >= o

(5) 根据样本值计算统计量的观察值t o ,且给出拒绝或接受H 。的判断: 当t λ> o 时, 则拒绝H 。; 当 t λ≤o 时, 则接受H 。. 【例2】 某糖厂用自动打包机包装糖,每包重量服从正态分布,其标准重量μo =100斤.某日开工后测得9包重量如下: 99.3, 98.7, 100.5,101.2, 98.3, 99.7, 99.5, 102.1,100.5, 问:这一天打包机的工作是否正常?(检验水平α=5%) 解: (0)计算样本均值与样本均方差: 1.21S = (1)提出原假设::100H μ=o (2)选择统计量: 2 9 X T S = (3)求出在假设H o 成立的条件下,确定该统计量服从的概率分布: (8)T t : (4)检验水平 α=0.05,查自由度为8的t -分布表(附表2),得临界值 2.36λ= ,即

均数差别比较的t检验

样本均数间的差别原因
均数差别比较的 t检验
z 总体均数不同 z 总体均数相同,差别仅仅由抽样误
差引起
z 一般做法是计算某个统计量(如t
值),然后根据相应的概率作出推 断
t检验(student’s t test)
t检验常用于样本含量较小,并且总 体标准差σ未知时
三种t检验 z 样本均数 X 与已知某总体均数μ0 的比较; z 两组样本均数 X 1 与 X 2 的比较; z 配对设计资料均数的比较。
t检验的应用条件
z 1.当样本含量较小时(n<60),理论上
要求样本为来自正态分布总体的随机 样本; z 2.当做两样本均数比较时,还要求两 总体方差相等(方差齐性,即 σ12=σ22)。 在实际工作中,若上述条件略有偏 离,仍可进行t检验分析。
一、样本均数和总体均数比较的t检验 (one sample t test)
z 目的是推断样本所代表的未知总体
假设检验的独特逻辑
例 : 某病患者20人,其血沉 (mm/h)均数为 9.15,标准差为2.13,问是否该病患者血 沉与以往文献报道的均数10.50有差别?
均数μ与已知总体均数μ0有无差 别。 z 已知的总体均数μ0一般为理论值、 标准值或经过大量观察所得的稳定 值等。 z 条件:当n较小时,要求样本来自于 正态分布总体
x ± t0.05 / 2,19 s / n = 9.15 ± 2.093 × 2.13 / 20 = (8.15,10.15)
1

1.两个假设,决策者在其中作出抉择 该病患者血沉总体均数与10.50无差别, 该病患者血沉总体均数与10.50有差别。 简写 H0:μ=10.50 H1:μ≠10.50 单凭一份样本不可能证明哪一个正确, 一般利用小概率反证法思想,从问题的对 立面出发(H0)间接判断要解决的问题(H1) 是否成立。
H0:μ=10.50
H1:μ≠10.50
μ = 10.50
X
10.50
μ
X
2. H0成立时会怎样? 所得t值因样本而 异,但其绝对值多数情况下落在0附近。 t的分布规律可由t界值表查出
t = | X ? 10 . 50 | | X ? 10 . 50 | = ,ν = n ? 1 s sx n
P值系指在H0成立的假设前提下,出现 当前检验统计量以及更极端情况的概 率。 查表,对于自由度为19的t分布曲线,当 前t值以外的双侧尾部面积 P ( t ≥ 2 . 8345 ) 介于0.01和0.02之间 4.决策 决策者需要事先规定一个可以忽略 的小概率值α。如取0.05,那么上述P值 可认为很小。即H0成立时,几乎不可能 出现当前的状况。
3.当前状况如何,发生的可能性(P值)有 多大?
n=20, X =9.15,S=2.13, μ0 =10.50 得t=2.8345, ν=19
于是,面临两种抉择,一是认为H0是成 立的,而当前情况又恰好偶然发生了; 二是怀疑H0的正确性。通常选择后者。 本例,可认为该病患者血沉总体均数与 10.50有差别。 当然,此时决策者也可能 错误地拒绝H0,通常称之为第Ⅰ类错 误,概率为P。
例 某医生测量了36名从事铅作业男性工人的 血红蛋白含量,算得其均数为130.83g/L,标 准差为25.74g/L。问从事铅作业工人的血红 蛋白是否不同于正常成年男性平均值 140g/L? 1.建立假设。 H0:μ=μ0 ,从事铅作业工人的血红蛋白与 正常成年男性平均值相等。 H1:μ≠μ0,从事铅作业工人的血红蛋白与 正常成年男性平均值不相等。 α=0.05
2

相关主题
文本预览
相关文档 最新文档