第十章研究假设的统计假设检验(二)——非参数检验

教育统计学第十章非参数检验ppt课件

普通的秩和检验表，只给出n<=10情况下的实际临界值。当两个样本容量都较大时，T的抽
样分布接近于正态，可以近似地利用正态 T概率n分1 ( 布n 1 做2 秩n 2 和 1检) 验。T在抽样分布中的平均数为
规范误为
T
n1n 2 (n1 n 2 1) 12
Z T T T
例1：在一项关于模拟训练的实验中，以技工学校的学生为对象，对5名学生用针对某一工种的模拟器进展训练，另外让6名学生下车间直接在实习中训练，经过同样时间后对两组人进展该工种的技术操作考核，结果如下：
例3：为了研讨RNA能否可以作为记忆促进剂，以老鼠为对象分成实验组与控制组，实验组注射RNA，控制组注射生理盐水，然后，在同样条件下学习走迷津，结果如下〔以所用时间作为目的〕试检验两组有否显著差别。
实验组： 16.7,16.8,17.0,17.2,17.4,16.8,17.1,17.0,17.2,17.1,17 .2,17.5,17.2,16.8,16.3,16.9
期末课堂练习
第十章非参数检验方法
一、两独立样本的差别显著性检验 1、秩和检验法 2、中数检验法二、相关样本的差别显著性检验 1、符号检验法 2、符号秩次检验法三、等级方差分析 1、克-瓦氏单向方差分析 2、弗里德曼双向等级方差分析
秩和检验
秩和法与参数检验中独立样本的t检验相对应。当“总体正态〞这一前提不成立，不能运用t检验时以秩和法替代t检验。当两个样本都为顺序变量时，也需用秩和法来进展差别检验。
新法 90 84 87 85 90 94 85 88 92
例4的解
解: 配对 1 2 3 4 5 6 7 8 9
传统 85 88 87 86 82 82 70 72 80

非参检验PPT课件

2
Npar
两均值比较相独关立样样本本中符符秩数号号和检等检检验级验验法检法法(((验MSMieg法adnn(i)Wnani)lWcohxiotnne)y U ) 多均值比较随完机全区随组机::弗克里瓦德氏曼方方差差分分析析((KFrruiesdkmalaann)d Wallis H )
非参数检验
1
非参数检验是与参数检验相对应的，参数检验指的是在总体分布已知，满足某些假定条件(独立性、方差齐性等)，检验的数据一般为连续数据的情况下进行的检验。如果有些条件不能满足, 则采用非参数检验，可以根据实际情况采用如下一些方法进行检验, 这些检验都是在 Nonparametric tests菜单项里执行。
9
练习
• 输入以下数据并检验两组数据的差异性：
– 甲：12,14,15,12,21,31,26,21 – 乙：21,32,15,21,12,14,12,15
• 1.假设上述配对样本资料 • 2.假设上述资料不是配对样本资料
10
2020/1/1
11
3
两独立样本非参数检验例题
设有两种安眠药，考虑它们的治疗效果（失眠者服用之后睡眠延长的小时数），现将20名患者分成两组，分别服用一种药，收集的数据如下：
甲 1.9 0.8 1.1 0.1 0.1 4.4 5.5 1.6 4.6 3.4 乙 0.7 –1.6 –0.2 –1.2 –0.1 3.4 3.7 0.8 0.0 2.0 由于延长的时数的分布不明，我们考虑用非参数检验！ Mann－Whitney U 类似于t检验。
由于脉博跳动的次数不服从正态分布，我们考虑用非参数检验。
5
2020/1/1
6
多个独立样本非参数检验例1

第二讲-非参数统计检验

第二讲非参数检验1.实验目的1.了解非参数假设检验基本思想；2.会用SAS软件中的proc npar1way过程进行非参数假设检验和proc freq过程进行列联表的独立性检验。

2. 实验要求1.会用SAS软件建立数据集，并进行统计分析；2.掌握proc npar1way过程进行非参数假设检验的基本步骤；3.掌握proc freq过程进行列联表的独立性检验的基本步骤。

3.实验基本原理3.1 符号检验两种方法的处理效果无显著性差异令统计量表示新方法的处理效果优于对照方法的配对组总数。

若新方法的处理效果显著的优于对照方法，则的值应明显偏大。

因此，若对给定的置信水平，有，则拒绝。

为真时，（1）服从二项分布。

拒绝域为：（2）由中心极限定理可知，当的零分布趋于标准正态分布。

拒绝域为：3.2 Wilcoxon秩和检验（1）单边假设检验两种方法的处理效果无显著性差异 as ：新方法优于对照方法。

用于检验的统计量为：若对给定的置信水平，有，则拒绝。

且的分布列为：根据观测结果计算的观测值，计算检验的p值：然后将值与显著水平作比较，若，则拒绝，否则接受。

（2）双边假设检验给定的显著水平应该满足：仅由上式还不能唯一确定，当我们对两种方法谁优谁劣不得而知时，通常取若利用p值进行检验，设,计算概率值由对称性可知，检验的p值为上述两概率中小于1/2的那一个的2倍。

例如则。

求出p值后，若p<a，拒绝,否则接受。

（3）列联表的独立性检验方法的处理效果无显著性差异：表示格子概率，表示三维列联表中事件发生的理论频数。

将概率用相应的频率频率去估计。

令其中：将样本数据代入统计量进行检验。

然后将P与显著水平作比较，若，拒绝，否则接受。

4. 实验相关SAS知识（1）独立样本的秩检验——proc npar1way过程proc npar1way过程的基本语句形式为proc npar1way [options];class variables;（proc npar1way过程不可缺少的语句）exact;（求出检验的精确p值）var variables;其中“options”可包含以下选项的部分或全部：①DATA=数据集名：指定要分析的数据集。

非参数假设检验.pptx

取 1。.据9 此，我们可以用参数的泊1松.9分布来
计算每分钟内通过收费站的汽车为0辆、1辆、2辆、3 辆、4辆或更多的概率。
第12页/共43页
e 各概率乘以观测总数n=100，便得到理论频数，具体结果见下表： i ei
计算 2统计量的值：
2 (14.96 10)2 (28.42 26)2 (27.0 35)2
H0 ：汽车通过收费站的辆数服从泊松分布； H1 ：不服从泊松分布。
观测值分为5组，且有 u0 10,u1 26,u2 35,u4 5
第11页/共43页
回忆泊松分布
P{X x} e x , x 0,1, 2,
x!
其中为泊松分布的期望值，是未知的，需要用样
本观测值来估计。由于100分钟内观测到190辆汽车，所以平均每分钟观测到190/100=1.9辆汽车，故
第9页/共43页
计算 2统计量的值：
2 6 (ui ei )2
i1
ei
(27 25)2 (18 25)2 (15 25)2 (24 25)2
25
25
25
25
(36 25)2 (30 25)2 12
25
25
在本例的情况下，统2 计量的自由度为m-1=6-1=5。
第8页/共43页
解：本例中的观测值以月为组，共分为m=6组，
每月的销售台数即为观测的频v数i ，观测的总次
数为n=150。现欲检验是否服从（离散的）均匀分布，即每月的销售量是否为
ei
nPi
150 6
25(台),
Pi
1 6
,i
1,
,6
为此，设
H0 ：洗衣机销售量服从均匀分布；
H1 ：并不服从均匀分布；

【统计分析】非参数检验

α=0.05 2. 计算统计量： T+=62.5，T-=3.5
3. 查表与结论查T界值表，T0.05（11）=10～56，T=3.5，在界值范围外，P<0.05，拒绝H0。
符号检验（Sign test)
z n n 1 n
二、两样本比较的秩和检验（Wilcoxon法）
适用条件：完全随机设计的两个样本比较，若不满足参数检验的应用条件，则用本法；两个等级资料比较。
-0.45
-1
13
15.20
5.50
9.70
11
14
16.50
9.00
7.50
8.5
步骤
1. 建立假设：H0：差值的总体中位数=0， H1：差值的总体中位数0；
=0.05 2. 计算统计量
计算差值d，由小到大的顺序编秩次，并冠以原d 的正负号，然后分别求正负秩和，得到T+=73， T-=5，取秩和较小者作为检验统计量T=5 3. 查表及结论
1.0
2.5
4
17.00
6.50
10.50
12
5
13.00
5.50
7.50
8.5
6
18.00
13.50
4.50
5
7
17.50
10.00
7.50
8.5
8
10.20
10.20
0.00
-
9
10.00
10.00
0.00
-
10
10.50
9.50
1.00
2.5
11
13.80
6.80
7.00
6
12
3.03
3.48

第十章非参数检验

10
11 12 13 14 15
70
85 75 68 70 65
66
67 65 70 78 67
76
80 90 86 85 75
SPSS过程演示
五、配对样本间非参数检验
1. 二项选择任务中配对样本间的差异比较实例分析：某体育教师为了改进学校体育工作，有效增进学生体质并提高其体育达标率，他采用匹配方法组织了两个相等的教学试验组，一组作为控制组（group 1) ，继续
实例 2 ：教务处要求各院系在本科生毕业设计的成绩评定中，注意成绩等级的人数分布，一般应符合如下表格中第一行所示的比例。
某院65名本科生毕业设计成绩等级分布如下表第二行数字。请问该
院系学生毕业设计的成绩评定是否符合学校要求？
评定等级
要求比例某院各等级人数
优秀
10% 8
良好
50% 43
中等
30% 13
使用传统教学方法；一个组作为实验组（group2），采用
新的教学方法。经过一年的教学周期后进行达标测试，结果如下页表所示。
请问新的体育教学方法有无明显的优势？其是否可以
有效地提高学生的体育达标率？(McNemar检验)
体育教学训练方法改革试验测试结果（不同方法训练后学生达标情况登记）序号 1 2 3 4 5 6 7 8 控制组达标不达标不达标达标不达标不达标达标不达标实验组达标达标不达标达标达标达标达标不达标
星期日星期一 10500 星期二 11800 星期三 12200 星期四 13200 星期五 14000 星期六 18500
顾客数 15000
解决方案
SPSS过程演示
（1）建立数据文件，包括两个变量：“时间”、“顾客数”；（2）打开“DATA”菜单条选中“Weight cases…”打开对话框，将“顾客数” 变

非参数假设检验

§ 7.4 非参数假设检验在§7.2中讨论了母体分布类型为已知时的参数假设检验问题.一般在进行参数假设检验之前,需要对母体的分布进行推断.本节将讨论母体分布的假设检验问题.因为所用的方法适用于任何分布或者仅有微弱假定分布,实质上是不依赖于分布的.在数理统计学中不依赖于分布的统计方法统称为非参数统计方法.这里所讨论的问题就是非参数假设检验问题.这里所研究的检验是如何用子样去似全母体分布,所以又称为分布拟合扰度检验,一般有两种:一是拟合母体的分布函数;另一是拟合母体分布的概率函数.这里我们只介绍三种检验方法:概率图纸法. 2χ-拟合优度检验和柯尔莫哥洛夫斯米尔诺夫检验.一, 概率图纸法这是一种比较直观和简便的检验方法.它适合于在现场使用.目前常见的概率图纸有正态,对数正态,二项分布,指数分布和威布尔分布概率图纸等.这里我们只介绍正态概率图纸,关于其它分布的概率图纸的构造原理和使用方法都是类似的1. 正态概率图纸的构造原理设母体ξ有分布函数F(x),{N(μ,2σ)}表示正态分布族.需要检验假设)},({)(:20σμN x F H ∈这里μ和2σ均为未知常数.在原假设0H 为真时,通过中心化变换)(2121)(22)(222σμπσπσμμσμ-Φ===⎰⎰-∞--∞---x du edt e x F x xt即σμξξμ-=)(服从正态N(0,1).函数u(x)是x 的线性函数.σμξξμ-=)( (7.13)在(x,u(x))直角坐标平面上是一条直线.这条直线过(μ,0),且斜率为σ1.2. 检验步骤.事实上,我们知道的不是母体ξ取出的一组子样观察值n x x ,,1 由格里汶科定理知道子样的经验分布函数)(x F n 依概率收剑于母体分布函数F(x).所以在检验母分体布函数F(x)是否属于正态分布族时,我们以大子样的经验分布函数)(x F n 作为母体分布的近似.若0H :F(x)∈{N(μ,2σ)}为真,那末点,,,1)),(,(n i x F x i i =在正态概率图纸上应该在一条直线上.所以根据上述经验分布函数)(x F n 是母体分布函数F(x)很好的近似,点,,,1)),(,(n i x F x i i =在正态概率图纸上也应该近似地在一条直线附近.倘若点列)),(,(i i x F x 不是近似地在一条直线附近,那末只能说明F(x)不属于正态分布族.根据上述想法,用正态概率图纸去检验假设0H 的具体步骤如下.(1) 整理数据(2) 描点(3) 目测这些点的位置, 3. 未知参数μ与2σ的估计.若通过概率图纸检验已经知道母体服从正态分布,我们就凭目测在概率图纸上画出最靠近各点,,,1)),(,()()(n i x F x i n i =的一条直线l,因为σμξξμ-=)(服从正态N(0,1),所以当0)(=-=σμξμx ,即x=μ时对应的概率F=0.5.因此,只要在概率图纸上面一条F=0.5的水平直线.这条直线与直线l 的交点的横坐标5.0x 就可以作为参数为μ的估计.又由μ(x)=1时所对应的概率F=0.8413的水平直线,这条直线与直线l 的交点的横坐标为8413.0x .这个8413.0x 显然满足18413.08413.0=-=σμμx 即μσ-=8413.0x 因此可以用差5.08413.0x x -估计σ.例 7.8 (略)见P 338 二, 2χ的似体检验法前面介绍了直观而简便的概率图纸法,它不需要很多计算就能对母体分布族作出一个统计推断,并且还能对分布所含的参数作出估计.但是这种方法因人而异,且精度不高,又不能控制犯错误的概率.这里介绍2χ-拟合检验法,它能够像各种显著性检验一样控制犯第一类错误的概率.设母体ξ的分布函数为具有明确表达式的F(x),.我们把随机变量ξ的值域R 分成k 个互不相容的区间[][][]k k k a a A a a A a a A ,,,,,,1212101-=== 这些区间不一定有相同的长度.设n x x ,,1 是容量为n 的子样的一组观测值.i n 为子样观测值n x x ,,1 中落入i A 的频数.n n ni i =∑=1在这n 次事件i A 出现的频率为nn i .我们现在检验原假设)()(:00x F x F H =.设在原假设0H 成立下,母体ξ落入区间i A 的概率为i P ,即k i a F a F A P P i i i i ,1),()()(100=-==- (7.14)此时n 个观察值中,恰有1n 个值落入1A 内,2n 的观察值落入2A 内,k n 个观察值落入k A 内的概率为k nn n n k P P P n n n n 212121!!!!这是一个多项分布.按大数定理,在0H 为真时,频率nn i 与概率i P 的差异不应太大.根据这个思想构造一个统计量2χ=∑=-ki ii i nP nP n 12)( (7.15)称做2χ-统计量.往后可以看到,用2χ表示这一统计量不是没有原因的.因为它的极限分布就是自由度为k-1的2χ-分布.为了能够把2χ-统计量用来作检验的统计量,我们必须知道它的抽样分布.我们先k=2的简单情形.在0H 成立下,221)(,)(P A P P A P i ==其中121=+P P这时,频数n n n =+21我们考察222212112)()(nP nP n nP nP n -+-=χ(7.16)令222111,nP n Y nP n Y -=-= (7.17)显然0)(212121=+-+=+P P n n n Y Y (7.18)由此可见1Y 与2Y 不是线性独立,且21Y Y -=.于是21212221212P nP Y nP Y nP Y =+=χ21111)1(⎥⎥⎦⎤⎢⎢⎣⎡--P nP nP n (7.19) 根据德莫弗-拉普拉斯极限定理,当n 充分大时,随机变量)1(1111P nP nP n --的分布是接近于正态的,从而推得k=2情形的分布,当n 充分大时,是接近于自由度为1的2χ-分布.对于一般情形有如下的定理.定理 7.1 当0H 为真时,即k P P ,,1 为母体的真实概率时,由(7.15)式所定义的统计量2χ的渐近分布是自由度为k-1的2χ-分布,即密度函数为⎪⎪⎩⎪⎪⎨⎧⎪⎭⎫ ⎝⎛-Γ=---,0,2121)(22321xk k e x k x f (7.20) 证因为在n 个观测值中恰有1n 个观测值落入1A 内, 2n 的观察值落入2A 内,k n 个观察值落入k A 内的概率为k nn nnk P P P n n n n 212121!!!!这里n n n n k =+++ 21.其特征函数nk j it j k je P t t ⎪⎪⎭⎫⎝⎛=∑=112),,( ϕ (7.21) 令k j nP nP n Y jjj j ,2,1, =-=(7.22)于是有∑∑===-=kj jkj jj j YnP nP n 12122)(χ(7.23)和∑=kj j jP Y1=0 (7.24)由此式看出,诸随机变量j Y 不是线性独立的.(k Y Y ,,1 )的联合分布的特征函数具有形状2111exp exp ),,(⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫⎝⎛∙⎪⎪⎭⎫ ⎝⎛-=∑∑==kj j j j kj j jk nP it P nP itt t ϕ (7.25) 两边取对数得⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫⎝⎛+-=∑∑==k j j j j kj j jn nP it P n P t n i t t 111exp ln ),,(ln ϕ (7.26) 利用指数数函和对数函在0=j t 处的泰勒展开:⎪⎭⎫ ⎝⎛+-=-⎥⎥⎦⎤⎢⎢⎣⎡n nP t nP itnp itj jjjjj121exp 2ο 和)(2)1ln(22x xx x ο+-=+于是)1(21211211ln ),,(ln 11212111211οοϕ+⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫⎝⎛--+-=⎪⎪⎭⎫⎝⎛⎪⎭⎫ ⎝⎛+-++-=∑∑∑∑∑∑∑=======kj kj kj j jjj jkj j j kj kj jj jkj j jk P tnit n P tn i n P t n i n t n P tn i n P t n i t t当∞→n 时⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫ ⎝⎛--→∑∑==k j kj j jj k P t t t t 1212121),,(ln ϕ 即⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫⎝⎛--=∑∑==∞→kj k j j jj k n P t t t t 1212121exp ),,(limϕ (7.26) 作一正交变换:⎪⎪⎩⎪⎪⎨⎧=-==∑∑==kj j k j kj lj l Y P Z k l Y a Z 111,,1, (7.27) 其中lj a 应该满足1,,1,,0,11-=⎩⎨⎧≠==⋅∑=k r l r l r l a a kj rj lj 和1,,1,01-==∑=k l P akj j lj由⎪⎪⎩⎪⎪⎨⎧=-==∑∑==kj j j k kj y ij l t P u k l t a u 111,1, (7.28) 得到∑∑∑-====⎪⎪⎭⎫⎝⎛-1122112k j jkj i kj jj uP t t (7.29)由(7.26)知,当∞→n 时,(k Z Z ,,1 )的特征函数⎭⎬⎫⎩⎨⎧-=∑-=∞→112121exp ),,(limk j j k n u u u ϕ.这意味着11,,-k Z Z 的分布弱收剑于相互独立的正态N(0,1)分布,而k Z 依概率收剑于0.因此∑∑====kj jkj jZY12122χ的渐近分布是自由度为k-1的2χ-分布.如果原假设0H 只确定母体分布类型,而分布中还含有未知参数m θθ,,1 则我们还不能用定理7.1来作为检验的理论依据.费歇证明了如下定理.从而解决了含未知参数情形的分布检验问题.定理 7.2 设F(x; m θθ,,1 )为母体的真实分布,其中m θθ,,1 为m 个未知参数.在F(x;m θθ,,1 )中用m θθ,,1 的极大似然估计mθθ∧∧,代替m θθ,,1 并且以F(x; m θθ∧∧,)取代(7.4)中的F(x)得到),,1;(),,1;(1m a F m a F i i i P θθθθ∧∧-∧∧∧-= (7.30)则将(7.30)代入(7.15)所得的统计量∑=∧∧-=kj i ini nn p p 122()χ(7.31)当∞→n 时有自由度为k-m-1的2χ-分布.例 7.9 (略)见P 345由例子来总结一下利用2χ-检验分布假设的步骤:(1)把母体ξ的值域划分为k 个互不相交的区间[,,,1),,1k i a a i i =+其中k a a ,1可以分别取∞∞-,;(2) 在0H 成立下,用极大似然估计法估计分布所含的未知参数; (3)在0H 成立下,计算理论概率)()(010i i i a F a F p -=+并且算出理论频数i nP ; (4)按照子样观察值n x x x ,,,21 落在区间),[1+i i a a 中的个数,即实际频数,,,1,k i n i =和(3)中算出的理论频数i nP ,计算ii i nP nP n )(2-=χ的值;(5)按照所给出的显著性水平α,查自由度k-m-1的2χ-分布表得)1(21---m k αχ,其中m 是未知参数的个数; (6)若2χ21αχ-≥,则拒绝原假设0H ,若212αχχ-<,则认为原假设0H 成立.三柯尔莫哥洛夫似合检验------n D 检验2χ-似合检验是比较子样频率与母体的概率的.尽管它对于离散型和连续型母体分布都适用.但它是依赖于区间的划分的.因为即使原假设)()(:00x F x F H =不成立,在某种划分下还是可能有k i P a F a F a F a F i i i i i ,,1,)()()()(1001 ==-=---从而不影响(7.5)中2χ的值,也就是有可能把不真的原假设0H 接受过来.由此看到,用2χ-检验实际上只是检验了,,,1,)()(100k i P a F a F i i i ==--是否为真,而并未真正地检验母体分布F(x)是否为)(0x F .柯尔莫哥洛夫对连续母体的分布提出了一种方法.一般称做柯尔莫哥洛夫检验或n D -检验.这个检验比较子样经验分布函数)(x F n 和母体分布函数F(x)的.它不是在划分的区间上考虑)(x F n 与原假设的分布函数之间的偏差.而是在每一点上考虑它们之间的偏差.这就克服了2χ-检验的依赖于区间划分的缺点.但母体分布必须假定为连续.根据格里汶科定理,我们可以把子样经验分布函数看作实际母体分布函的缩影.如果原假设成立,它与F(x)的差距一般不应太大.由此柯尔莫哥洛夫提出一个统计量|)()(|supx F x F D n xn -=(7.32)并且得到这统计量n D 的精确分布和极限分布K(λ).它们都不依赖于母体的分布.这里我们不加证明地引入柯尔莫哥洛夫定理.定理 7.3 设母体ξ有连续分布函数F(x),从中抽取容量为n 的字样,并设经验分布函数为)(x F n ,则|)()(|supx F x F D n xn -=的分布函数⎪⎭⎫ ⎝⎛+<n D P n 21λ =n n n n dy y y f n nn n nn n n n 2120212,1,),,(0,021********22121-<≤⎪⎪⎪⎩⎪⎪⎪⎨⎧-≥<⎰⎰⎰+-+-+---λλλλλλλλλ 当 (7.33)其中⎩⎨⎧<<<=其它当,010!),(11n n y y n y y f在∞→时有极限分布函⎪⎩⎪⎨⎧≤>--=→<∑-∞=0,00),2exp()1()()(22λλλλλ当当n j j n j K D n P (7.34) 在应用柯尔莫哥洛夫检验时,应该注意的是,原假设的分布的参数值原则上应是已知的.但在参数为未知时,近年来有人对某些母体分布如正态分布和指数分布用下列两种方法估计.()可用另一个大容量子样来估计未知参数,(2)如果原来子样容量很大,也可用来估计未知参数.不过此n D -检验是近似的.在检验时以取.较大的显著性水平为宜,一般取α=0.10-0.12.n D -检验检验母体有连续分布函数F(x)这个假设的步骤如下:(1) 从母体抽取容量为n 的子样,并把子样观察值按由小到大的次序排列;(2) 算出经验分布函⎪⎪⎩⎪⎪⎨⎧≤=<≤<=+x n j x x x nx n x x x F k j j jn 当当当,1,,1,,)(,0)()1()()1((3) 在原假设0H 下,计算观测值处的理论分布函数F(x)的值; (4) 对每一个i x 算出经验分布函数与理论分布函数的差的绝对值||)()(||)()()()1()()(i i n i i n x F x F x F x F --+与(5) 由(4)算出统计量的值(6) 给出显著性水平α,由柯尔莫哥洛夫检验的临界值表查出α=≥)(,n n D D P的临界值α,n D ;当n>100时,可通过n D n /1,ααλ-≈查n D 的极限分布函数数值表得αλ-1从而求出α,n D 的近似值.(7) 若由(5)算出的α,n n D D ≥则拒绝原假设0H ;若α,n n D D <则接受假设,并认为原假设的理论分布函数与子样数据是似合得好的. 例 7.10 略) 见P 351定理 7.4 当样本容量21n n 和分别趋身于∞时,统计量|)()(|212121,supx F x F D n n xn n -=有极限分布函数)(212121λλK D n n n n P n n →⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<+⎪⎩⎪⎨⎧≤>--=∑∞-∞=0,00),2exp()1(22λλλ当当j j j (7.35) 例 7.11 (略)见P 353。

医学统计学精品教学第十章-非参数检验精品文档

2019/10/13
1
第十章非参数秩和检验
吴库生汕头大学医学院预防医学教研室
参数统计与非参数统计
1、参数统计（parametric statistics）样本所来自的总体分布具有某个已知
的函数形式（如正态分布），而其中有的参数是未知的，统计分析的目的是对这些未知的参数进行估计或检验。
2019/10/13
28
符号秩和检验的SPSS实现
2019/10/13
秩和检验
29
Wilcoxon Signed Ranks Test
结果
Ranks
N Mean RankSum of Ranks
光电比色法 -Negative Ranks
5a
氰化高铁法 Positive Ranks
5b
4.60 6.40
X
41.00±29.81
14.75±11.73
方差齐性检验:
F

S12(大) S22(小)
864.94816.2863 137.5929
F F0.05,(7,7) 4.99
P<0.05
两样本方差不齐，不能应用t检验
2019/10/13
医学统计学-秩和检验
31
采用Wilcoxon两独立样本秩和检验
10
Contents
第一节配对资料的符号秩和检验（Wilcoxon配对法）第二节两独立样本比较的秩和检验（Wilcoxon两样本
法）第三节完全随机设计多个样本比较的秩和检验
（Kruskal-Ｗallis检验）
2019/10/13
秩和检验
11
第一节两配对样本差值的符号秩和检验 (Wilcoxon signed rank test)

非参数检验 PPT

非参数检验
分类
参数检验(parametric tests) －对总体参数(平均数、成数、方差等) 所作得假设进行检验
非参数检验(自由分布检验) －对总体分布形式得假设进行检验
问题得提出
我们想去检验得论述如下: 1、经过西弗吉尼亚公路150号里程碑得汽车平均时速为68 英里/小时。 2、租用雪佛龙Trail Blazer (一款中型SUV车)三年,平均行驶里程为32000英里。 3、美国家庭居住在一座独幢住宅得平均时间为11、8年。 4、2005年四年制大学毕业生得平均起薪为37 130美元/年。 5、中西部偏北地区35%得退休人员会在退休后得1年内卖掉她们得住房,搬到气候温暖得地方居住。 6、80%得经常购买州彩票得彩民,从未在一次下注中赢得超过100美元得奖金。
原假设
如果公司所在市平均受教育年限为:13
问:就是否有所不同就是否高于
数据集3
如果公司所在市平均薪水为:35000
问:就是否有所不同就是否低于
大家学习辛苦了，还是要坚持
继续保持安静
设计检验统计量
所设计得检验统计量与原假设相关, 即与待检验得参数相关。我们需要知道当原假设为真时该统计量得具体分布。
问:就是否有显著不同？
区间估计 x t (n 1) s 499.5 2.797 2.63/ 25 498.03 ~ 500.97
2
n
问:就是否能断定饮料厂商欺骗了消费者？
区间估计
x t (n 1)
s 499.5 2.492 2.63/ n
25 500.81
(,500.81)
假设检验五步法
n1 n2
z X1 X2 s12 s22 n1 n2
t

非参数统计方法在假设检验中的应用研究论文素材

非参数统计方法在假设检验中的应用研究论文素材一、引言假设检验是统计学中一种重要的分析方法，用于根据样本数据推断总体参数的性质。

传统的假设检验通常基于参数统计方法，即假设总体参数服从某种特定的概率分布。

然而，在实际应用中，往往无法确定总体分布的具体形式，这时就需要使用非参数统计方法。

本文旨在探讨非参数统计方法在假设检验中的应用，并提供相应的研究素材。

二、非参数统计方法概述非参数统计方法是指不对总体参数做任何假设的统计方法。

它的优势在于不依赖具体的分布假设，因此更加灵活，适用范围更广。

非参数统计方法主要包括秩和检验、分布自由度检验和重抽样检验等。

1. 秩和检验秩和检验是非参数统计方法中常用的一种方法，适用于两组或多组独立样本的比较。

该方法将观测值按照大小排列，通过比较秩和的大小来进行假设检验。

常见的秩和检验包括Wilcoxon秩和检验和Mann-Whitney U检验。

2. 分布自由度检验分布自由度检验是一种非参数的拟合优度检验方法，用于检验观测数据与某个理论分布是否一致。

该方法基于观测数据的经验分布函数，通过计算观测数据的累积概率与理论分布的累积概率之间的差异来进行假设检验。

3. 重抽样检验重抽样检验是一种基于数据重抽样的非参数统计方法。

常见的重抽样检验包括Bootstrap方法和Permutation方法。

Bootstrap方法通过随机抽样产生重复样本，从而估计总体参数的分布。

Permutation方法则通过对样本数据的重新排列来进行假设检验。

三、非参数统计方法的应用研究素材1. 秩和检验的应用研究文献1：Smith, J. et al. (2015). "A Comparative Study of Nonparametric Rank Tests for Gene Differential Expression Analysis." Journal of Biometrics, 30(4), 123-135.该研究通过比较不同的秩和检验方法在基因差异表达分析中的应用效果，探讨了不同方法的优缺点并给出了相应的建议。

非参数假设检验方法课件

特点
非参数假设检验具有灵活性、稳健性和适用范围广等优点，能够处理更广泛的数据类型和分布情况，不受特定参数假设的限制。
与参数检验的区别与联系
区别
参数检验基于对总体分布的参数假设，如正态分布等，而非参数检验则不依赖于这些假设。
联系
非参数检验和参数检验都是为了对总体进行推断，只是所依据的假设不同。在实际应用中，可以根据具体情况选择合适的检验方法。
大，可能会导致误判。
与参数检验的优缺点比较
适用范围
参数检验方法通常需要假定数据分布的形式，适用范围相对较窄；而非参数检验方法无需假定分布形式，适用范围更广。
解释性
参数检验方法通常可以提供具体的参数估计和效应量估计，解释性较强；而非参数检验方法的解释性相对较差。
计算复杂性
参数检验方法的计算过程通常较为复杂，需要使用复杂的数学公式和推导；而非参数检验方法的计算过程相对简单。
详细描述
符号检验通过计算两组数据中正例和负例的差异数，并利用二项分布的概率公式来计算差异显著的p值。该方法适用于小样本数据，并且对数据的分布没有严格要求。
威尔科克森符号秩检验
总结词
威尔科克森符号秩检验是用于比较两个独立样本的差异是否显著的统计方法。
详细描述
该方法通过比较两个样本的秩和，利用威尔科克森符号秩公式计算差异显著的p 值。该方法适用于处理数据量较小的情况，并且对数据的分布没有严格要求。
05
非参数假设检验的未来发展与展望
现有研究的不足与局限性
方法适用范围有限
01
目前非参数假设检验方法主要适用于特定类型的数据和问题，
对于复杂数据或特定领域的适用性有待提高。
理论基础尚不完备
02

第9讲非参数检验

第13章
非参数检验
第10章非参数检验
第一节非参数检验相关原理简介
一、非参数检验的概念
前面已经讨论的许多统计分析方法对总体有特殊的要求，如T检验要求总体符合正态分布，F检验要求误差呈正态分布且各组方差齐性等等。这些方法常用来估计或检验总体参数，统称为参数检验。
但许多调查或实验所得的科研数据，其总体分布未知或无法确定。因为有的数据不是来自所假定分布的总体，或者数据根本不是来自一个总体，还有可能数据因为某种原因被严重污染，这样在假定分布的情况下进行推断的做法就有可能产生错误的结论。此时人们希望检验对一个总体分布形状不必作限制。
1、单个样本的K-S检验的统计原理
以K-S正态性检验为例介绍它的统计原理
假设检验问题：
2、单个样本的K-S检验的数据要求
K-S检验过程要求检验变量为区间或者比例测度为数值型变量。
3、引例（练习四）
例7 K-S正态性检验。35位健康成年男性在未进食前的血糖浓度如下表所示，试检测这组数据是否服从正态分布？（数据文件：“血糖浓度抽查.sav”）
2、计算泊松分布的期望估计值
【Analyze】\【Descriptives Statistics】\【Descriptives】
3、计算正态分布的期望概率
【Transform】\【Compute Variable】
思考：与区别？
4、利用卡方检验检验这个地区高中二年级学生体重分别是否为正态分布。
Exact tests：
Options：
结果解读：
游程检验结果表
游程检验的检验值，即观测值的均值
观测量总数游程总数 Z检验统计量渐近的双尾显著性概率为0.737>0.05

假设检验非参数检验

假设检验（二）——非参数检验假设检验的统计方法，从其统计假设的角度可分为两类：参数检验与非参数检验。

上一节我们所介绍的Z 检验、t 检验，都是参数检验。

它们的共同特点是总体分布正态，并满足某些总体参数的假定条件。

参数检验就是要通过样本统计量去推断或估计总体参数。

然而，在实践中我们常常会遇到一些问题的总体分布并不明确，或者总体参数的假设条件不成立，不能使用参数检验。

这一类问题的检验应该采用统计学中的另一类方法，即非参数检验。

非参数检验是通过检验总体分布情况来实现对总体参数的推断。

非参数检验法与参数检验法相比，特点可以归纳如下：（1）非参数检验一般不需要严格的前提假设；（2）非参数检验特别适用于顺序资料；（3）非参数检验很适用于小样本，并且计算简单；（4）非参数检验法最大的不足是没能充分利用数据资料的全部信息；（5）非参数检验法目前还不能用于处理因素间的交互作用。

非参数检验的方法很多，分别适用于各种特点的资料。

本节将介绍几种常用的非参数检验方法。

一．2χ检验2χ检验主要用于对按属性分类的计数资料的分析，对于数据资料本身的分布形态不作任何假设，所以从一定的意义上来讲，它是一种检验计数数据分布状态的最常用的非参数检验方法。

2χ检验的方法主要包括适合性检验和独立性检验。

（一）2χ检验概述2χ是实得数据与理论数据偏离程度的指标。

其基本公式为：∑-=ee f f f 202)(χ (公式11—9) 式中，0f 为实际观察次数，e f 为理论次数。

分析公式可知，把实际观测次数和依据某种假设所期望的次数（或理论次数）的差数平方，除以理论次数，求出比值，再将n 个比值相加，其和就是2χ。

观察公式可发现，如果实际观察次数与理论次数的差异越小，2χ值也就越小。

当0f 与e f 完全相同时，2χ值为零。

2χ值的特点为：① 2χ值具有可加性。

② 2χ值永远不会小于零。

③ 2χ值的大小随着实际次数与理论次数之差的大小而变化。

第十章研究假设的统计假设检验(二)——非参数检验

合集下载

教育统计学第十章非参数检验ppt课件

非参检验PPT课件

第二讲-非参数统计检验

非参数假设检验.pptx

【统计分析】非参数检验

第十章非参数检验

非参数假设检验

医学统计学精品教学第十章-非参数检验精品文档

非参数检验 PPT

非参数统计方法在假设检验中的应用研究论文素材

非参数假设检验方法课件

第9讲非参数检验

假设检验非参数检验

文档推荐

最新文档

第十章研究假设的统计假设检验(二)——非参数检验

合集下载

教育统计学第十章 非参数检验ppt课件

非参检验PPT课件

第二讲-非参数统计检验

非参数假设检验.pptx

【统计分析】非参数检验

第十章 非参数检验

非参数假设检验

医学统计学精品教学第十章-非参数检验精品文档

非参数检验 PPT

非参数统计方法在假设检验中的应用研究论文素材

非参数假设检验方法课件

第9讲 非参数检验

假设检验非参数检验

文档推荐

最新文档

教育统计学第十章非参数检验ppt课件

第十章非参数检验

第9讲非参数检验