【2019-2020年整理】管理统计学第3章--非参数假设检验

格式：ppt
大小：1.22 MB
文档页数：70

下载文档原格式

管理统计学马庆国著部分参数假设检验PPT课件

已知总体分布，猜出总体的某个参数（假设H0），用一组样本来检验这个假设是否正确（是接受还是拒绝H0 ）。 2、非参数假设检验：
猜出总体分布（假设H0），用一组样本来检验这个假设是否正确（是接受还是拒绝H0 ）。
在检验中，我们通常设法保证“弃真”（以真为假）的错误的概率很小，也就是概率 P{拒绝H0 | H0为真}很小。这是我们在假设检验时，分析问题的主线。
ˆ X sX
s n
检验统计量
Z X ~ N (0, 1)
sX
第22页/共98页
与总体均值有关的决策
举例:
一家大型电子商店的信贷经理说，该商店赊购帐户上的平均余额为575元。一名审计人员随机抽取了33名顾客作为一个样本，结果发现赊购帐户上的平均余额为518.5元、标准差为181元。如果信贷经理的陈述得不到数据支持，审计人员将检查所有的赊购帐户。请问当 = 0.05时，审计人员应当采取什么行动？
（1）已知方差2，假设 H0 ：= 0，通过样本观测值x1， x2，···，xn ，检验H0 是否成立。（2）未知方差2，假设 H0 ：= 0，通过样本观测值x1， x2，···，xn ，检验H0 是否成立。（3）未知方差2，假设 H0 ： 0 (或 0), 通过样本观测值x1，x2，···，xn ，检验H0 是否成立。
第11页/共98页
原假设 (H0) 或备择假设(HA) – 检验统计量落在临界区域之外接受 H0 检验统计量落在临界区域之内拒绝 H0
第12页/共98页
构造假设
决策原则 – p值法：
什么是“‘p值” –
如果H0 为真,
几乎不可能获得样本统计量的值，或者说在研究过程中
获得样本统计量值的概率非常小。

非参数检验课件

13.71
5
19.61
24.37
4.76
6
14.50
92.75
78.25
7
49.63
121.57
71.94
8
44.56
89.76
45.20
编秩次，求秩和去掉d=0的对子，总的对子数也要相应减去；用绝对值︱d︳编秩次，如果出现绝对值相等时（ties），则将它们的平均秩次值作为他们的秩次；
第二节单样本资料的符号秩和检验
• 目的：推断样本中位数与已知总体中位数（常为标准值或大量观察的稳定值）有无差别，常用于不满足单样本t检验应用条件的资料；其检验假设是M=M0.
• 例10-2 已知某地正常人尿氟含量的中位数为2.15mmol/L.今在该地某厂随机抽取 12名工人，测得尿氟含量，结果见表2。问该工厂的尿氟含量是否高于当地正常人？
参数检验方法
• t检验两独立样本t检验要求：正态、方差相等、个体独立配对t检验要求：差值正态、个体独立
• 方差分析完全随机设计方差分析要求：正态、方差相等、个体独立
参数检验方法
• 两组性别结构是否相同？
• 两组某种不良反应的发生率是否相同？
• 多组发生率是否相同？ • 多组构成是否相同？
定性无序分类资料
未解决的问题
• 疗效用痊愈、显效、有效、无效四级分类法进行评价时，两组或多组如何比较？
• 对两组患者空腹胰岛素水平进行比较时，有的病例测量结果为Ins<2.0 或Ins>300，如何处理？
未解决的问题
• 对应于多分类变量（有序） • 非正态分布 • 不完整数据：如，Ins<2.0 或Ins>300 • 正态分布但方差不相等时

4-3非参数假设检验

解：H0:IQ 得分服从正态分布，H1:不服从正态，α =0.05， X 101.294
S =15.585
正态分布拟合优度χ 2 检验的计算表
实际观 IQ 得分组限测频数概率理论频数
ˆ k )2 ( nk np ˆk np
ˆ k )2 ( nk np np ˆk
55.0 ~ 65.0 ~ 75.0 ~ 85.0 ~ 95.0 ~ 105.0~ 115.0~ 125.0~ 135.0~ 145.0~155
(ni npi ) npi i 1
2 k
2
~

2 (k 1)
注: 若在 H0下分布类型已知，但其参数未知，这时需要先用极大似然估计法估计参数，然后作检验.
Fisher证明了如下定理:
若原假设中的理论分布 F(x) 中有 r 个未知参数需用相应的最大似然估计来代替，那么当 n 充分大时，统计量
npi 是常量
Pearson证明了如下定理: 若原假设中的理论分布 F(x) 已经完全给定，那么当 n 充分大时，统计量
(ni npi ) npi i 1
2 k
2
~

2 (k 1)
注1:定理中的 pi 为 pi P( xi 1 X xi ) F ( xi ) F ( xi 1 )
三、两总体分布比较的假设检验
参数检验（t-检验，u-检验）
1、关于总体均值的检验 2、两个总体的均值是否相等（1）独立样本问题（2）配对样本问题
非参数检验（符号检验、秩检验）
1、关于总体分布、中位数等特征的检验 2、两个总体的分布、中位数是否相等（1）独立样本问题（2）配对样本问题
秩和检验 ( Rank Test ) 方法： — 将观察值按由小到大的次序排列， — 编定秩次，

非参数假设检验.pptx

取 1。.据9 此，我们可以用参数的泊1松.9分布来
计算每分钟内通过收费站的汽车为0辆、1辆、2辆、3 辆、4辆或更多的概率。
第12页/共43页
e 各概率乘以观测总数n=100，便得到理论频数，具体结果见下表： i ei
计算 2统计量的值：
2 (14.96 10)2 (28.42 26)2 (27.0 35)2
H0 ：汽车通过收费站的辆数服从泊松分布； H1 ：不服从泊松分布。
观测值分为5组，且有 u0 10,u1 26,u2 35,u4 5
第11页/共43页
回忆泊松分布
P{X x} e x , x 0,1, 2,
x!
其中为泊松分布的期望值，是未知的，需要用样
本观测值来估计。由于100分钟内观测到190辆汽车，所以平均每分钟观测到190/100=1.9辆汽车，故
第9页/共43页
计算 2统计量的值：
2 6 (ui ei )2
i1
ei
(27 25)2 (18 25)2 (15 25)2 (24 25)2
25
25
25
25
(36 25)2 (30 25)2 12
25
25
在本例的情况下，统2 计量的自由度为m-1=6-1=5。
第8页/共43页
解：本例中的观测值以月为组，共分为m=6组，
每月的销售台数即为观测的频v数i ，观测的总次
数为n=150。现欲检验是否服从（离散的）均匀分布，即每月的销售量是否为
ei
nPi
150 6
25(台),
Pi
1 6
,i
1,
,6
为此，设
H0 ：洗衣机销售量服从均匀分布；
H1 ：并不服从均匀分布；

数理统计13 非参数假设检验

X1,X2,…,Xn 为来自总体X的样本，则 X n F L n N (0,1) ( n ) Sn
均值的渐近分布为N ( F，
F
2
).
定理3 设（X1,X2,…,Xm) 与（Y1,Y2,…,Yn) 是来
自X~N(1,12)与Y~N(2,22)的两独立样本，
则当n趋于无穷， m趋于无穷时有
得到拒绝域{Dn1 ,n2 Dn , }。 Fn1 ( x)和Gn2 ( x)是两个总体对应的经验分布函数
柯尔莫哥洛夫检验当连续分布时,效率较
高,不能用于离散情形
-检验能用于离散情形,连续情形精度较差
2
（三）独立性检验分析
需要检验H0 ：两个总体X和Y是否独立将这两个总体的取值范围分成m个和k个互不相交的区间A1 , A2 , . . . ,Am 和B1 ,B2 ,... ,Bk 。设从总体中抽取一个容量为n的样本 (X1,Y1), (X2,Y2), …,(Xn,Yn),
, ，未知但＝ = .
2 1 2 2 2 3 2 1 2 2 2 3
试提出三正态总体均值1 2 =3的假设检验.
2. 某厂使用两种不同的工艺生产同一类型的产品。现对产品进行分析比较，抽取第一种工艺生产的样品120件，测得均值为1.25 (kg)，标准差为0.52(kg)；抽取第二种工艺生产的样品60 件，测得均值为1.32(kg)，标准差为0.45 (kg)。设产品的质量都服从正态分布，试判断在检验水平0.05下，能否认为两种生产工艺的方差相等？如果能认为两种工艺质量的方差相等，再进一步判断能否认为使用第二种工艺生产的产品的平均质量较使用第一种生产的为大?
记nij表示样本值中其横坐标落入Ai,纵坐标落入Bj中的个数(i=1,2,…,m;j=1,2,…k).

假设检验 - 非参数假设检验

• 确定统计量T
– T为正秩次及负秩次和中绝对值较小者
• 统计推断
– 令正负差值的总个数为n – T＞T0.05(n)，P＞0.05，不能否定H0，两个处理差异不显著 – T0.01(n)＜T≤T0.05(n)，0.01＜P≤0.05，否定H0，接受H1，两个处理
差异显著 – T≤T0.01(n)，P≤0.01，否定H0，接受H1，两个处理差异极显著
零假设：每天心脏病猝死人数分布同预期分布相同
备择假设：每天心脏病猝死人数分布同预期分布不同
（2）构造和计算统计量
日期
周一周二周三周四周五周六周日合计
怎么计算得到的呢？
实际频数期望频差
fi
率 npi
f i - npi
55
53.5
1.5
23
19.1
3.9
18
19.1
-1.1
11
– 令n ＝ n＋＋n－ – K＞K0.05(n)，P＞0.05，不能否定H0，样本中位数与已知总体中位
数差异不显著
– K0.01(n)＜K≤K0.05(n)，0.01＜P≤0.05，否定H0，接受H1，样本中位数与已知总体中位数差异差异显著
– K≤K0.01(n)，P≤0.01，否定H0，接受H1，样本中位数与已知总体中位数差异差异极显著
现在收集到168个观察数据，其中星期一至星期日的死亡人数分别为：55， 23，18，11，26，20，15。
现在利用这批数据，推断心脏病人猝死人数与日期的关系是否成立？
解：该问题可以转化为检验心脏病猝死人数在一周时间内的分布是否同预期分布相同，可以使用卡方检验进行处理，过程如下：（1）建立零假设和备择假设

《数理统计》第三章假设检验

一个正态总体均值假设检验( 检验检验) 一个正态总体均值假设检验(t检验)
P328
P329
第三章 1.2 参数假设检验Parameter hypothesis testing
一个正态总体方差的假设检验
第三章 1.2 参数假设检验Parameter hypothesis testing
一个正态总体方差的假设检验
两个正态总体方差比的假设检验两个正态总体方差比的假设检验方差比
两个正态总体方差比的假设检验两个正态总体方差比的假设检验方差比
P393
P393
第三章 1.2 参数假设检验Parameter hypothesis testing
两个正态总体均值,方差的假设检验举例两个正态总体均值,方差的假设检验举例
第三章 1.2 参数假设检验Parameter hypothesis testing
一个正态总体均值的假设检验( 检验检验) 一个正态总体均值的假设检验(U检验)
第三章 1.2 参数假设检验Parameter hypothesis testing
一个正态总体均值的假设检验( 检验) 一个正态总体均值的假设检验(U检验)表示
两个正态总体均值差假设检验举例两个正态总体均值差假设检验举例
第三章 1.2 参数假设检验Parameter hypothesis testing
两个正态总体均值差假设检验举例两个正态总体均值差假设检验举例
两个正态总体方差比的假设检验
第三章 1.2 参数假设检验Parameter hypothesis testing
总体分布函数的假设检验
1.3 非参数假设检验(Non-Parameter hypothesis testing) 非参数假设检验 Parameter

非参数检验

➢ 编秩：数据相等则取平均秩,
➢ 求秩和
➢ 计算检验统计量H值
H 12 N(N 1)
Ri2 3( N 1) ni
出生体重（kg）xij ABCD
相应秩次 Rij A BCD
2.7 2.9 3.3 3.5
3
4
7 11
2.4 3.2 3.6 3.6
2 5.5 12.5 12.5
2.2 3.2 3.4 3.7
χ 2 12
R
2 i
3(N1)
N(N1) ni
χ2
12 14(14 1)
152
4
152 3
37.52 4
37.52 3
3(14
1)
χ 2 9.375
χ
2 c
1
χ2
(t
3 j
t
j
)
n3 n
1
(23
9.375 2) (33 3) (23
143 14
2)
9.50
四、随机区组设计资料的秩和检验（Friedman test）
正态近似法
如果n1或n2-n1超出附表的范围，可按下式计算u值：
u | T n1(N 1) / 2 | 0.5 n1n2 (N 1) / 12
在相同秩次较多时，应用下式进行校正：
uC u / C
C 1
(t
3 j
t
j
)
/(N
3
N)
tj为第j组相同秩次的个数
频数表资料（或等级资料）两样本资料比较
xi (2) 86 71 77 68 91 72 77 91 70 71 88 87
12 对双胞胎兄弟心理测试结果
后出生者得分差值

3-3 非参数假设检验方法

,m
由前面的分析可以看出，选择皮尔逊统计量
cn2
i 1
m
N i npi 0
npi 0
m
2
2 k N 2 i n 或c n i 1 npi 0
拒绝域为
W { x : cn
2
( N i npi 0 ) c 2 (m 1)} npi 0 i 1
（2）计算概率
pi F0 (ai 1 ) F0 (ai ) P{ai X ai 1 }
并计算 npi ，称为理论频数。（3）计算样本 x1 ,, xn 落在 (ai , ai 1 ]中的个数 Ni 称为实际频数。
（4）计算检验统计量的值
组数
2
( N i npi ) c npi i 1
i Ni Ai 0 1 A0 1 2 3 17 A3 4 5 6 9 A6 7 9 A7 8 2 A8 9 1 A9 10 2 A10 11 1 A11 12 0 A12 5 16 A1 A2 26 11 A4 A5
其中 N i 是观察到有 i 个粒子的次数. 从理论上 e i 考虑 X 应服从泊松分布P X i i 0,1, 2, i! e i 问 PX i 是否符合实际?( 0.05) i!
2
例1 把一颗骰子重复抛掷 300 次, 结果如下:
出现的点数 1 2 3 4 5 6 出现的频数 40 70 48 60 52 30
试检验这颗骰子的六个面是否匀称? (取 0.05 )
解
根据题意需要检验假设
H0: 这颗骰子的六个面是匀称的. 1 (或 H 0 : P{ X i } ( i 1,2,,6)) 6 其中X表示抛掷这骰子一次所出现的点数 (可能值只有6个),

非参数假设检验

§ 7.4 非参数假设检验在§7.2中讨论了母体分布类型为已知时的参数假设检验问题.一般在进行参数假设检验之前,需要对母体的分布进行推断.本节将讨论母体分布的假设检验问题.因为所用的方法适用于任何分布或者仅有微弱假定分布,实质上是不依赖于分布的.在数理统计学中不依赖于分布的统计方法统称为非参数统计方法.这里所讨论的问题就是非参数假设检验问题.这里所研究的检验是如何用子样去似全母体分布,所以又称为分布拟合扰度检验,一般有两种:一是拟合母体的分布函数;另一是拟合母体分布的概率函数.这里我们只介绍三种检验方法:概率图纸法. 2χ-拟合优度检验和柯尔莫哥洛夫斯米尔诺夫检验.一, 概率图纸法这是一种比较直观和简便的检验方法.它适合于在现场使用.目前常见的概率图纸有正态,对数正态,二项分布,指数分布和威布尔分布概率图纸等.这里我们只介绍正态概率图纸,关于其它分布的概率图纸的构造原理和使用方法都是类似的1. 正态概率图纸的构造原理设母体ξ有分布函数F(x),{N(μ,2σ)}表示正态分布族.需要检验假设)},({)(:20σμN x F H ∈这里μ和2σ均为未知常数.在原假设0H 为真时,通过中心化变换)(2121)(22)(222σμπσπσμμσμ-Φ===⎰⎰-∞--∞---x du edt ex F x xt即σμξξμ-=)(服从正态N(0,1).函数u(x)是x 的线性函数. σμξξμ-=)( (7.13) 在(x,u(x))直角坐标平面上是一条直线.这条直线过(μ,0),且斜率为σ1. 2. 检验步骤.事实上,我们知道的不是母体ξ取出的一组子样观察值n x x ,,1 由格里汶科定理知道子样的经验分布函数)(x F n 依概率收剑于母体分布函数F(x).所以在检验母分体布函数F(x)是否属于正态分布族时,我们以大子样的经验分布函数)(x F n 作为母体分布的近似.若0H :F(x) ∈{N(μ,2σ)}为真,那末点,,,1)),(,(n i x F x i i =在正态概率图纸上应该在一条直线上.所以根据上述经验分布函数)(x F n 是母体分布函数F(x)很好的近似,点,,,1)),(,(n i x F x i i =在正态概率图纸上也应该近似地在一条直线附近.倘若点列)),(,(i i x F x 不是近似地在一条直线附近,那末只能说明F(x)不属于正态分布族.根据上述想法,用正态概率图纸去检验假设0H 的具体步骤如下.(1) 整理数据 (2) 描点(3) 目测这些点的位置, 3. 未知参数μ与2σ的估计.若通过概率图纸检验已经知道母体服从正态分布,我们就凭目测在概率图纸上画出最靠近各点,,,1)),(,()()(n i x F x i n i =的一条直线l,因为σμξξμ-=)(服从正态N(0,1),所以当0)(=-=σμξμx ,即x=μ时对应的概率F=0.5.因此,只要在概率图纸上面一条F=0.5的水平直线.这条直线与直线l 的交点的横坐标5.0x 就可以作为参数为μ的估计.又由μ(x)=1时所对应的概率F=0.8413的水平直线,这条直线与直线l 的交点的横坐标为8413.0x .这个8413.0x 显然满足18413.08413.0=-=σμμx 即μσ-=8413.0x 因此可以用差5.08413.0x x -估计σ.例 7.8 (略)见P 338 二, 2χ的似体检验法前面介绍了直观而简便的概率图纸法,它不需要很多计算就能对母体分布族作出一个统计推断,并且还能对分布所含的参数作出估计.但是这种方法因人而异,且精度不高,又不能控制犯错误的概率.这里介绍2χ-拟合检验法,它能够像各种显著性检验一样控制犯第一类错误的概率.设母体ξ的分布函数为具有明确表达式的F(x),.我们把随机变量ξ的值域R 分成k 个互不相容的区间[][][]k k k a a A a a A a a A ,,,,,,1212101-=== 这些区间不一定有相同的长度.设n x x ,,1 是容量为n 的子样的一组观测值.i n 为子样观测值n x x ,,1 中落入i A 的频数.n n ni i =∑=1在这n 次事件i A 出现的频率为nn i. 我们现在检验原假设)()(:00x F x F H =.设在原假设0H 成立下,母体ξ落入区间i A 的概率为i P ,即k i a F a F A P P i i i i ,1),()()(100=-==- (7.14)此时n 个观察值中,恰有1n 个值落入1A 内,2n 的观察值落入2A 内,k n 个观察值落入k A 内的概率为k n n n n k P P P n n n n 212121!!!!这是一个多项分布.按大数定理,在0H 为真时,频率nn i与概率i P 的差异不应太大.根据这个思想构造一个统计量2χ=∑=-ki i i i nP nP n 12)( (7.15)称做2χ-统计量.往后可以看到,用2χ表示这一统计量不是没有原因的.因为它的极限分布就是自由度为k-1的2χ-分布.为了能够把2χ-统计量用来作检验的统计量,我们必须知道它的抽样分布.我们先k=2的简单情形.在0H 成立下,221)(,)(P A P P A P i ==其中121=+P P这时,频数n n n =+21我们考察222212112)()(nP nP n nP nP n -+-=χ (7.16) 令222111,nP n Y nP n Y -=-= (7.17)显然0)(212121=+-+=+P P n n n Y Y (7.18)由此可见1Y 与2Y 不是线性独立,且21Y Y -=.于是21212221212P nP Y nP Y nP Y =+=χ 21111)1(⎥⎥⎦⎤⎢⎢⎣⎡--P nP nP n (7.19) 根据德莫弗-拉普拉斯极限定理,当n 充分大时,随机变量)1(1111P nP nP n --的分布是接近于正态的,从而推得k=2情形的分布,当n 充分大时,是接近于自由度为1的2χ-分布.对于一般情形有如下的定理.定理 7.1 当0H 为真时,即k P P ,,1 为母体的真实概率时,由(7.15)式所定义的统计量2χ的渐近分布是自由度为k-1的2χ-分布,即密度函数为⎪⎪⎩⎪⎪⎨⎧⎪⎭⎫ ⎝⎛-Γ=---,0,2121)(22321xk k e x k x f (7.20) 证因为在n 个观测值中恰有1n 个观测值落入1A 内, 2n 的观察值落入2A 内,k n 个观察值落入k A 内的概率为k n n n n k P P P n n n n 212121!!!!这里n n n n k =+++ 21.其特征函数nk j it jk je P t t ⎪⎪⎭⎫⎝⎛=∑=112),,( ϕ (7.21) 令k j nP nP n Y jjj j ,2,1, =-=(7.22)于是有∑∑===-=kj j kj jj j Y nP nP n 12122)(χ (7.23)和∑=kj j jP Y1=0 (7.24)由此式看出,诸随机变量j Y 不是线性独立的.(k Y Y ,,1 )的联合分布的特征函数具有形状2111exp exp ),,(⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫ ⎝⎛•⎪⎪⎭⎫ ⎝⎛-=∑∑==kj j j j kj j jk nPit P nP it t t ϕ (7.25) 两边取对数得⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫⎝⎛+-=∑∑==k j j jj kj j jn nP it P n P t n i t t 111exp ln ),,(ln ϕ (7.26) 利用指数数函和对数函在0=j t 处的泰勒展开:⎪⎭⎫ ⎝⎛+-=-⎥⎥⎦⎤⎢⎢⎣⎡n nP t nP it np it j jj j jj 121exp 2ο和)(2)1ln(22x x x x ο+-=+于是)1(21211211ln ),,(ln 11212111211οοϕ+⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫ ⎝⎛--+-=⎪⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+-++-=∑∑∑∑∑∑∑=======k j k j k j j j j j j k j j j k j k j j j j kj j jk P t n i t n P t n i n P t n i n t n P t n i n P t n i t t当∞→n 时⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫ ⎝⎛--→∑∑==k j kj j j j k P t t t t 1212121),,(ln ϕ 即⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫ ⎝⎛--=∑∑==∞→k j k j j j j k n P t t t t 1212121exp ),,(lim ϕ (7.26) 作一正交变换:⎪⎪⎩⎪⎪⎨⎧=-==∑∑==kj j k j kj lj l Y P Z k l Y a Z 111,,1, (7.27) 其中lj a 应该满足1,,1,,0,11-=⎩⎨⎧≠==⋅∑=k r l r l r l a a kj rjlj 和1,,1,01-==∑=k l P akj j lj由⎪⎪⎩⎪⎪⎨⎧=-==∑∑==kj j j k kj y ij l t P u k l t a u 111,1, (7.28) 得到∑∑∑-====⎪⎪⎭⎫ ⎝⎛-1122112k j j kj i k j j j u P t t (7.29) 由(7.26)知,当∞→n 时,(k Z Z ,,1 )的特征函数⎭⎬⎫⎩⎨⎧-=∑-=∞→112121exp ),,(lim k j j k n u u u ϕ.这意味着11,,-k Z Z 的分布弱收剑于相互独立的正态N(0,1)分布,而k Z 依概率收剑于0.因此∑∑====kj j k j j Z Y 12122χ的渐近分布是自由度为k-1的2χ-分布.如果原假设0H 只确定母体分布类型,而分布中还含有未知参数m θθ,,1 则我们还不能用定理7.1来作为检验的理论依据.费歇证明了如下定理.从而解决了含未知参数情形的分布检验问题.定理 7.2 设F(x; m θθ,,1 )为母体的真实分布,其中m θθ,,1 为m 个未知参数.在F(x;m θθ,,1 )中用m θθ,,1 的极大似然估计mθθ∧∧,代替m θθ,,1 并且以F(x; mθθ∧∧,)取代(7.4)中的F(x)得到),,1;(),,1;(1m a F m a F i i iP θθθθ∧∧-∧∧∧-= (7.30)则将(7.30)代入(7.15)所得的统计量∑=∧∧-=kj i ini nn p p 122()χ (7.31)当∞→n 时有自由度为k-m-1的2χ-分布.例 7.9 (略)见P 345由例子来总结一下利用2χ-检验分布假设的步骤:(1)把母体ξ的值域划分为k 个互不相交的区间[,,,1),,1k i a a i i =+其中k a a ,1可以分别取∞∞-,;(2) 在0H 成立下,用极大似然估计法估计分布所含的未知参数; (3)在0H 成立下,计算理论概率)()(010i i i a F a F p -=+并且算出理论频数i nP ; (4)按照子样观察值n x x x ,,,21 落在区间),[1+i i a a 中的个数,即实际频数,,,1,k i n i =和(3)中算出的理论频数i nP ,计算ii i nP nP n )(2-=χ的值;(5)按照所给出的显著性水平α,查自由度k-m-1的2χ-分布表得)1(21---m k αχ,其中m 是未知参数的个数; (6)若2χ21αχ-≥,则拒绝原假设0H ,若212αχχ-<,则认为原假设0H 成立.三柯尔莫哥洛夫似合检验------n D 检验2χ-似合检验是比较子样频率与母体的概率的.尽管它对于离散型和连续型母体分布都适用.但它是依赖于区间的划分的.因为即使原假设)()(:00x F x F H =不成立,在某种划分下还是可能有k i P a F a F a F a F i i i i i ,,1,)()()()(1001 ==-=---从而不影响(7.5)中2χ的值,也就是有可能把不真的原假设0H 接受过来.由此看到,用2χ-检验实际上只是检验了,,,1,)()(100k i P a F a F i i i ==--是否为真,而并未真正地检验母体分布F(x)是否为)(0x F .柯尔莫哥洛夫对连续母体的分布提出了一种方法.一般称做柯尔莫哥洛夫检验或n D -检验.这个检验比较子样经验分布函数)(x F n 和母体分布函数F(x)的.它不是在划分的区间上考虑)(x F n 与原假设的分布函数之间的偏差.而是在每一点上考虑它们之间的偏差.这就克服了2χ-检验的依赖于区间划分的缺点.但母体分布必须假定为连续.根据格里汶科定理,我们可以把子样经验分布函数看作实际母体分布函的缩影.如果原假设成立,它与F(x)的差距一般不应太大.由此柯尔莫哥洛夫提出一个统计量|)()(|sup x F x F D n xn -= (7.32)并且得到这统计量n D 的精确分布和极限分布K(λ).它们都不依赖于母体的分布.这里我们不加证明地引入柯尔莫哥洛夫定理.定理 7.3 设母体ξ有连续分布函数F(x),从中抽取容量为n 的字样,并设经验分布函数为)(x F n ,则|)()(|sup x F x F D n xn -=的分布函数⎪⎭⎫ ⎝⎛+<n D P n 21λ=n n n n dy y y f n n n nn n n n n 2120212,1,),,(0,021********22121-<≤⎪⎪⎪⎩⎪⎪⎪⎨⎧-≥<⎰⎰⎰+-+-+---λλλλλλλλλ 当(7.33)其中⎩⎨⎧<<<=其它当,010!),(11n n y y n y y f在∞→时有极限分布函⎪⎩⎪⎨⎧≤>--=→<∑-∞=0,00),2exp()1()()(22λλλλλ当当n j j n j K D n P (7.34) 在应用柯尔莫哥洛夫检验时,应该注意的是,原假设的分布的参数值原则上应是已知的.但在参数为未知时,近年来有人对某些母体分布如正态分布和指数分布用下列两种方法估计.()可用另一个大容量子样来估计未知参数,(2)如果原来子样容量很大,也可用来估计未知参数.不过此n D -检验是近似的.在检验时以取.较大的显著性水平为宜,一般取α=0.10-0.12.n D -检验检验母体有连续分布函数F(x)这个假设的步骤如下:(1) 从母体抽取容量为n 的子样,并把子样观察值按由小到大的次序排列;(2) 算出经验分布函⎪⎪⎩⎪⎪⎨⎧≤=<≤<=+x n j x x x nx n x x x F k j j jn 当当当,1,,1,,)(,0)()1()()1((3) 在原假设0H 下,计算观测值处的理论分布函数F(x)的值; (4) 对每一个i x 算出经验分布函数与理论分布函数的差的绝对值||)()(||)()()()1()()(i i n i i n x F x F x F x F --+与(5) 由(4)算出统计量的值(6) 给出显著性水平α,由柯尔莫哥洛夫检验的临界值表查出αα=≥)(,n n D D P的临界值α,n D ;当n>100时,可通过n D n /1,ααλ-≈查n D 的极限分布函数数值表得αλ-1从而求出α,n D 的近似值.(7) 若由(5)算出的α,n n D D ≥则拒绝原假设0H ;若α,n n D D <则接受假设,并认为原假设的理论分布函数与子样数据是似合得好的. 例 7.10 略) 见P 351定理 7.4 当样本容量21n n 和分别趋身于∞时,统计量|)()(|212121,sup x F x F D n n xn n -=有极限分布函数)(212121λλK D n n n n P n n →⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<+ ⎪⎩⎪⎨⎧≤>--=∑∞-∞=0,00),2exp()1(22λλλ当当j j j (7.35) 例 7.11 (略)见P 353。

《非参数假设检验》第四次课

例题
例题：某地144个周岁儿童身的高数据如下表，问该地区周岁儿童身高频数是否成正态分布？
练习：某报刊亭为研究每天报刊的销售量，为以后每天报刊进量提供依据，统计其在140天的销售中，某日报的日销售量的频数资料如下表，问该资料的频数是否服从正态分布？
检验两个总体的分布是否相同：
方差相同
分布函数形式相同
参数检验只有在关于总体分布的假设成立时，所得出的结论才是正确的，所以它在很多场合不便应用，于是统计学家发展了许多对总体不作太多或严格限定的统计推断方法，这些方法一般不涉及总体参数的假设，与之相对应的统计方法通常称为非参数统计（Nonparametric statistics）或自由分布统计方法（Distribution-free statiscal methods），基于此所做的假设检验则称为非参数检验（Nonparametric test）或自由分布统计检验（Distribution-free statistical test）。非参数检验的前提假设比参数检验方法少很多，也容易满足，适用于已知信息相对较少的数据资料，而且它的计算方法也简便易行。
追求
非参数假设检验
L.N TECHNICAL UNIVERSITY
辽宁工程技术大学
汇报人姓名
非参数检验是相对于参数检验而言的，这两种检验方法在实际中都有广泛的应用，但它们有着不同的数理统计原理和应用场合。
在统计学的发展过程中，最先出现的推断统计方法都对样本所属总体的性质作出若干假设，即对总体的分布形状作某些限定，例如Z检验、t检验，假设样本的总体分布加以某些限定，把所要推断的总体数字特征看作未知的“参数”进行推断，称之为参数统计方法（Parameter statistical methods）或限定分布统计方法（distribution-specified statistical methods），基于此所做的假设检验就称为参数检验（Parametric test）。常用的检验如t检验、Z检验、F检验等都是参数检验。

管理统计SPASS 非参数假设检验

表7-1 参数检验和非参数检验的效率比较
对正态总体的非参数检验的效率评价
应用
参数检验பைடு நூலகம்
非参数检验
配对样本数据
t检验或者z检验
符号检验 Wilcoxon检验
Wilcoxon检验 K-W检验秩相关检验游程检验
0.63 0.95
0.95 0.95 0.91 没有可比较的基础
两个独立样本多个独立样本相关随机性
• Step03：选择期望值在【Expected Values(期望值)】选项组中点选【Values 】单选钮，以指定期望概率值。接着在Values的文本框中分别输入0.8、0.05和0.15这三个数值，并且单击【Add】按钮加以确定。 • Step04：完成操作最后，单击【OK(确定)】按钮，操作完成。
t检验或者z检验方差分析(F检验) 线性相关无可用的参数检验
7.2
卡方检验
1.使用目的卡方检验(Chi-Square Test)也称为卡方拟合优度检验，是K.Pearson给出的一种最常用的非参数检验方法。它用于检验观测数据是否与某种概率分布的理论数值相符合，进而推断观测数据是否是来自于该分布的样本的问题。 2.基本原理 H 0 样本X来自的进行卡方检验时，首先提出零假设：总体分布服从期望分布或某一理论分布。接着，利用实际观测值的频数与理论的期望频数之间的差异来构造检验统 2 c 计量，它描述了观察值和理论值之间的偏离程度。
二项分布检验基本思想
SPSS二项分布检验，在小样本中采用精确检验方法，对于大样本则采用近似检验方法。精确检验方法计算n次试验中成功出现的次数小于等于x 次的概率，即
P{ X x} Cni pi q ni

非参数统计学讲义(第三章)讲稿2

第三章两样本模型§1 两个相关样本的非参数检验一、问题的提出某种统计检验方法应用时，不仅与数据的测量层次有关，与抽样的特点有关。

在抽取样本时有两种形式：相关的和独立的。

苦第—次抽样的所有样本某一属性的测量结果，不影响第二次抽样的所有样本同一属性的测量结果，则这种抽样是独立的；若一次抽样的测量结果影响另一次抽样测量结果，则这种抽样是相关的。

本章介绍两个相关样本的非参数检验方法。

实际问题中，常会有这样的情况：某种药物对治疗某种疾病是否有效，某种训练方法是否能提高人的能力，某次宣传是否能提高人们的认识，价格上涨是否会产生不良影响等等。

当研究者希望知道两种处理结果是否相同，或哪种更好时，往往需要采用两个样本的统计检验。

这时，常用经过处理的一组和未经处理的一组比较，或者一种处理组与另一种处理组相比较，为了避免或尽量减少由于其它因素影引起的两组之间的附加差异，研究中通常采用两个相关样本。

例如，在接受两种不同训练方法的人员中，由于智力、接受能力、耐力等方面的不同，会导致不同处理的结果产生差异，这不是所要研究的问题，而是其它因素影响产生的附加差异。

这些因素在实施不同处理前必须排除。

为获取相关样本，常应用两种方式：一是让每一研究对象作为自身的对照者；一是将研究对象两两配对，分别给每一对两个成员以不同处理。

在进行配对时，应让每—对在可能影响处理结果的其它因素分面尽量相似，以尽量避免和减小附加差异。

一般来说，用研究对象自身作为对照者要优于配对方法。

因为很难在配对过程中，完全控制使其它的影响因素。

二、符号检验1．基本方法设有两个连续总体X 、Y ，累积的分布函狡分别为F(x)，F(y)。

随机地分别从两个总体中抽取数目为n 的样本数据n x x x ,,,21 和n y y y ,,,21 ，将它们配对得到),(11y x ，),(22y x ，…，),(n n y x 。

若研究的问题是它们是否具有相同的分布，即F(x)=F(y)是否成立。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

Mann-Whitney秩和检验法（序号和检验法） 3.1.4 两个总体分布的非参数检验小结

实际问题中，经常要检验两种不同的处理方法效果是否相同。例如，比较在不同钻机、不同操作人员、不同地质条件下，钻机效率是否相同等等。
诸如此类问题是对两个总体的分布是否相同的检验。本章主要介绍两种简单易行的方法：“符号检验法”和“秩和检验法”。
1, xi yi Ai 0, xi yi

于是 A=A1+A2+...+An服从二项分布

即，在H0：F(x)=G(y)的假设下，可以把抽样过程看成一个近似的贝努利实验，服从B(m,p) 分布。
1. 小样本情况下，正负号个数检验法的处理（方法一）

如果实际的“xi-yi>0 的个数n+”在（k1,k2）中，就接受H0:p=0.5 （即F(x)=G(y)），否则，拒绝H0，认为p≠0.5，即F(x)≠G(y)。
第3章非参数假设检验（分布检验）

3.1 两个总体分布的非参数假设检验 3.1.1 检验两个总体的分布是否相同的第一种方法：符号检验法（正负号个数检验法）

3.1.2 检验两个总体的分布是否相同的第二种方法：
Wilcoxon秩和检验法（序号和检验法）

3.1.3 检验两个总体的分布是否相同的第三种方法：
配对
得实验组分对照组
1
2
3
4
5
6
7
8
9 10 11 12
X1 18 20 26 14 25 25 21 12 14 17 20 19 X2 14 20 23 12 29 18 21 10 16 13 17 25
+ 0 + + + 0 + + + -
差数符号
练习∶
某研究测定了噪声刺激前后15只羊的心率，结果见下表。问噪声对羊的心率有无显著影响？已知， K0.05(15)=3 ， K0.01(15) = 2 。

3.1 两个总体分布的非参数假设检验
3.1.1 检验两个总体的分布是否相同的第一种方法：符号检验法（正负号个数检验法）
配对样本
配对样本的概念及属性

配对样本：按某些重要特征相近的原则，可将两样本中的每一个体配成对子，这两组样本称为配对样本。
配对样本的属性： 1）两样本的观察数量应相同； 2）两样本观察顺序不能各自独立地颠倒。
1. 小样本情况下，正负号个数检验法的处理（方法二）
（1）建立假设零假设H0 ： F ( x ) G( y ) 备择假设H1 ：F ( x ) G( y ) （2）计算差值d并赋予符号
d=xi-yi
d＞0，记为“+”，总个数记为n+ d＜0，记为“-”, 总个数记为nd=0，记为“0”, 总个数记为n0 m= n++ n检验的统计量为 K ， K 为 n+ 、 n- 中的较小者，即
配对
1 2 3 4 5 6 7 8 9 10 11 12
得实验组分对照组
X1 18 20 26 14 25 25 21 12 14 17 20 19 X2 14 20 23 12 29 18 21 10 16 13 17 25
解：（1）建立假设。H0 ：颜色教学无显著效果； H1 ：颜色教学有显著效果（2）求差数并记符号，差值计算列于下表。由表可知，n+=7, n-=3,于是，m=n++n-=10。将n+ 和n-中的较小者记为K，K=3。（3）统计推断根据m=10，查符号检验表找临界值，K0.05(10)=1，而K> K0.05(10)，不显著。即，接受原假设，认为：颜色教学无显著效果。
K=min{n+,n-}
（3）统计推断
由m查表得临界值K0.05(m)，K0.01(m)，作统计推断：
如果K＞K0.05(m)，即P＞0.05如果K0.01(m)＜K≤K0.05(m)，即0.01＜P≤0.05，则否定HO，接受H1，两个试验处理差异显著；如果K≤K0.01(m)，即P≤0.01，则否定HO，接受
1 70 48
2 66 54
3 56 52
4 63 62
6 56 55
7 58 54
8 47 45
这两组观察数据即为配对样本。

例：现有18名学生按身体条件大体相近配成９对，并用随机分组将他们分为甲、乙两组，由一位教师采用不同的教法执教一年，一年后测得她们的平衡术成绩（见下表），问两种不同教法的效果是否有显著差异？
这两组观察数据即为配对样本。

例：为了探索长跑对学生体质发展的影响，随机抽取同年龄男生８名，经５个月长跑训练，观测训练前、后心脏功能是否有所增强，用晨脉这个指标来反映，训练前、后的晨脉测试结果如下表，问长跑对晨脉的影响有无显著意义？
训练前、后晨脉数据表单位：次/分钟
编号训练前训练后
H1，两个试验处理差异极显著。
符号检验统计判断规则
K与临界值的比较 K> K0.05(m) P值 P＞0.05 显著性不显著
K0.01(m)＜K≤K0.05(m) K≤K0.01(m)
0.01＜P≤0.05 P≤0.01
显著极显著

例：研究人员将三岁儿童经配对而成的实验组进行颜色试验教学，对照组不进行此种教学。后期测验得分如下表。问颜色教学是否有显著效果？已知K0.05(10)=1。

配对样本可以是同一研究对象分别给于两种不同处理的效果比较的观察值；或，同一研究对象处理前后的效果比较的观察值。
配对样本示例

例：某种干电池，在一定温度下存放之后它的电压有可能升高也可能降低。我们取10个样品做实验。数据如下：
1 2 3 4 5 6 7 8 9 10 编号存前电压 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 存后电压 1.9 1.8 1.7 1.6 1.5 1.4 1.3 1.2 1.1 1.0
一年后甲、乙两组平衡术成绩表
3 4 5 6 7 8 9 配对号１ 2 甲组 8.7 9.3 8.2 9.0 7.6 8.9 8.1 9.5 8.4
乙组 7.8 8.2 8.4 8.1 7.9 8.0 8.2 8.1 6.8
这两组观察数据即为配对样本。

令xi>yi的事件为Ai ,其取值为1，0

非参数假设检验补充例题

页数:31
数理统计13 非参数假设检验

页数:33
第七章SPSS的非参数检验

页数:109
第二讲-非参数统计检验教学内容

页数:8
假设检验——非参数检验

页数:15
非参数假设检验-完整版

页数:43
【2019-2020年整理】管理统计学第3章--非参数假设检验

页数:70
第二讲-非参数统计检验

页数:10
非参数假设检验

页数:43
非参数假设检验

页数:24

【2019-2020年整理】管理统计学第3章--非参数假设检验

合集下载

管理统计学马庆国著部分参数假设检验PPT课件

非参数检验课件

4-3非参数假设检验

非参数假设检验.pptx

数理统计13 非参数假设检验

假设检验 - 非参数假设检验

《数理统计》第三章假设检验

非参数检验

3-3 非参数假设检验方法

非参数假设检验

《非参数假设检验》第四次课

管理统计SPASS 非参数假设检验

非参数统计学讲义(第三章)讲稿2

文档推荐

最新文档

【2019-2020年整理】管理统计学第3章--非参数假设检验

合集下载

管理统计学马庆国著部分参数假设检验PPT课件

非参数检验课件

4-3非参数假设检验

非参数假设检验.pptx

数理统计13 非参数假设检验

假设检验 - 非参数假设检验

《数理统计》第三章 假设检验

非参数检验

3-3 非参数假设检验方法

非参数假设检验

《非参数假设检验》第四次课

管理统计SPASS 非参数假设检验

非参数统计学讲义(第三章)讲稿2

文档推荐

最新文档

《数理统计》第三章假设检验