第十章基于秩次的非参数检验
- 格式:doc
- 大小:31.50 KB
- 文档页数:2
基于秩次的非参数检验1. 问题的提出前面学习了连续型资料两组样本均数差异的假设检验方法:小样本用t检验,条件是变量服从正态分布和方差齐;大样本用标准正态分布的Z检验。
如果是小样本,变量的分布不清,或者已知不服从正态分布或经变量转换后仍不服从正态分布时,如何检验两个样本或多个样本均数差异的统计学意义呢?需要一种不依赖于分布假定的检验方法,即非参数检验。
2. 基本概念前面介绍的检验方法首先假定分析变量服从特定的已知分布(如正态分布),然后对分布参数(如均数)作检验。
这类检验方法称参数检验(parametric test)。
今天介绍的检验方法不对变量的分布作严格假定,检验不针对特定的参数,而是模糊地对变量的中心位置或分布位置作比较。
这类检验称非参数检验(nonparametric test),由于其对总体分布不作严格假定,所以又称任意分布检验。
(distribution-free test)非参数检验的优点:a.不受总体分布的限制,适用范围广。
b.适宜定量模糊的变量和等级变量。
c.方法简便易学。
缺点:如果是精确测量的变量,并且已知服从或者经变量转换后服从某个特定分布(如正态分布),这时人为地将精确测量值变成顺序的秩,将丢失部分信息,造成检验功效能下降。
基于秩次非参数检验(秩和检验)的基本思想假设变量X有观察值1.1, 1.3, 1.7, 4.3, 11.4显然这变量不服从正态分布,观察值间差异较大,既不对称,标准差也较大。
但如果将变量作转换,变成秩变量Y=1,2,3,4,5,则分布对称了,观察值间的差异也均匀了,标准差也减小了。
然后对这秩分布的中心位置(中位数)作检验,这就是秩和检验。
7.1 配对样本的符号秩检验(Wilcoxon signed rank test)例7.1为研究出生先后的孪生兄弟间智力是否存在差异,12对孪生兄弟测试的结果见表7.3。
表7.3 12对孪生兄弟测试结果T +=24.5,T -=41.5符号秩检验的分布理论:假定有4个差值,如果H 0成立时,这4个差值有同等的概率取正值或负值,即每个值取正值的概率等于1/2。
第十章基于秩次的非参数检验习题一、选择题1.两小样本均数比较,方差不齐时,下列说法不正确的是().A. 采用秩和检验B. 采用t′检验C. 仍用t检验D. 变量变换后再作决定E. 要结合正态性检验结果方能作出决定H是().2. 两样本秩和检验的A. 两样本秩和相等B. 两总体分布相同C. 两样本分布相同D. 两总体秩和相等E. 两总体均数相等3. 在统计检验中是否选用非参数统计方法().A. 要根据研究目的和数据特征作决定B. 可在算出几个统计量和得出初步结论后进行选择C. 要看哪个统计结论符合专业理论D. 要看哪个P值更小E. 既然非参数统计对资料没有严格的要求,在任何情况下均能直接使用4. 配对样本差值的Wilcoxon符号秩和检验,确定P值的方法是().A. T越大,P值越小B.T越大,P值越大C. T值在界值范围内,P值小于相应的αD. T值在界值范围内,P值大于相应的αE. T值在界值范围上,P值大于相应的α5. 成组设计两样本比较的秩和检验,其检验统计量T是().A. 为了查T界值表方便,一般以秩和较小者为TB. 为了查T界值表方便,一般以秩和较大者为TC. 为了查T界值表方便,一般以例数较小者秩和为TD. 为了查T界值表方便,一般以例数较大者秩和为TE. 当两样本例数不等时,任取一样本的秩和为T都可以查T界值表多样本定量资料比较,当分布类型不清时应选择().A. 方差分析B. t检验C. Z检验D. Kruskal-Wallis检验E. Wilcoxon检验6. 多组样本比较的Kruskal-Wallis检验中,当相同秩次较多时,如果用H值而不用校正后H值,则会().的cA.提高检验的灵敏度B.把一些无差别的总体推断成有差别C. 把一些有差别的总体推断成无差别D.Ⅰ、Ⅱ类错误概率不变E. 以上说法均不对二、简答题1. 对于完全随机设计两样本定量资料的比较,如何选择统计方法?2. 为什么在秩和检验编秩次时不同组间出现相同数据要给予“平均秩次”,而同一组的相同数据不必计算“平均秩次”?3. 多组定量资料比较时,统计处理的基本流程是什么?。
基于秩的非参数检验介绍秩检验是一种常用的非参数检验方法,它不依赖于总体的具体分布形式,适用于数据不满足正态分布等假设的情况。
秩检验的核心思想是将原始数据转化为秩次,通过比较秩次的大小来进行假设检验。
本文将介绍基于秩的非参数检验的原理、常见的秩检验方法以及如何应用秩检验进行统计推断。
### 一、秩的概念在介绍秩检验之前,首先需要了解秩的概念。
秩是指将一组数据按照大小顺序排列后得到的位置序号,即数据在排序后的位置。
例如,对于一组数据{5, 3, 7, 2},排序后的序列为{2, 3, 5, 7},则对应的秩次为{2, 1, 3, 4}。
### 二、秩和秩次的计算在进行秩检验时,需要计算每个数据点的秩次。
对于有重复数值的情况,可以采用两种方法计算秩次:一是平均秩法,即将重复数值的秩次取平均值;二是顺序秩法,即按照数据出现的先后顺序依次赋予秩次。
### 三、秩和秩次的应用秩和秩次在非参数检验中起着重要作用。
在进行秩检验时,常用的方法包括Wilcoxon秩和检验、Mann-Whitney U检验、Kruskal-Wallis 检验等。
这些方法都是基于秩次进行统计推断,适用于不同类型的假设检验问题。
1. Wilcoxon秩和检验Wilcoxon秩和检验是一种用于比较两组相关样本的非参数检验方法。
它的原假设是两组样本来自同一总体,备择假设是两组样本来自不同总体。
通过比较两组样本的秩和来判断它们是否存在显著差异。
2. Mann-Whitney U检验Mann-Whitney U检验是一种用于比较两组独立样本的非参数检验方法。
它的原假设是两组样本来自同一总体,备择假设是两组样本来自不同总体。
通过比较两组样本的秩和来进行假设检验。
3. Kruskal-Wallis检验Kruskal-Wallis检验是一种用于比较多组独立样本的非参数检验方法。
它的原假设是多组样本来自同一总体,备择假设是多组样本来自不同总体。
通过比较多组样本的秩和来进行假设检验。
第十章基于秩次的非参数检验[教学要求]了解:通过电脑实验了解不同设计类型的秩和检验和相应t检验的功效有何不同。
熟悉:理解非参数统计的概念;熟悉不同设计类型的秩和检验方法。
掌握:掌握不同设计类型的秩和检验的实施方法及其应用条件。
[重点难点]第一节正确理解非参数统计的概念在统计学中,最基本的概念是总体和样本、随机变量、分布和假设检验,其中很大一部分内容是和正态理论相关的,总体的分布形式或分布族往往是给定的或是假定了的,所不知道的仅仅是一些参数的值或他们的范围,人们的任务就是对一些参数(如均值和方差或标准差)进行点估计或区间估计,或者对某些参数进行各种检验,如最常用χFt2的统计量、统计量、统计量均基于正态总体这一假设。
在实际中,对总体分布的假定并非能随便作出,数据可能不是来自所假定分布的总体,或根本不是来自一个总体,或因为种种原因被污染。
在假定总体分布的情况下进行推断可能产生错误甚至灾难性的结论。
于是人们希望在不假定总体分布的情况下,尽量从数据本身获得所需要的信息,这正是非参数统计的宗旨。
非参数统计是一个很广阔的研究领域,本章涉及的仅是基本的秩和检验。
非参数统计方法不利用关于总体分布的知识,即便在对于总体的任何知识都没有的情况下,也容易而又很可靠地获得结论,这是非参数方法优于参数方法的一面;在总体分布族已知的情况下,不需要任何先验知识就成为它的缺点,由于没有充分利用已知的关于总体分布的信息,所作出的结论就不如参数方法得到的精确。
在不知总体分布的情况下如何利用数据所包含的信息呢?一组数据的最基本信息是次序,将数值按大小次序排队,每个数值在整个数据中均有相应的位置和次序,称为该数据的秩(rank)。
在一定的假设下,这些秩及其统计量的分布是可以求出来的,且与原来的总体分布无关,可进行所需要的统计推断。
以上便是非参数统计的基本思想。
注意,非参数(nonparametric) 意味着其方法不涉及特定的总体分布,又称任意分布(distribution-free)或称与分布无关,是因其推断方法和总体分布无关,不应理解为与所有分布(例如有关秩的分布)无关。
第十章基于秩次的非参数检验【教学要求】掌握:非参数检验的基本概念及其适用的资料类型;参数检验与非参数检验的区别;掌握配对设计、单样本设计、完全随机化设计两独立样本及多独立样本秩和检验的应用条件、实施方法。
熟悉:常用秩和检验方法的步骤、结果解释。
了解:完全随机设计多个独立样本间的多重比较;通过电脑实验了解不同设计类型的秩和检验和相应t 检验的功效问题。
【重点难点】(一)参数检验与非参数检验1、参数检验以特定的总体分布(如正态分布)为前提,对未知的总体参数(如总体均数)作推断的假设检验方法统称为参数检验,也叫参数统计。
2、非参数检验当样本所来自的总体分布不服从特定分布,或难以用某种函数式来表达,解决这类问题可用非参数检验方法。
非参数检验不依赖总体分布的具体形式,不受总体参数的限制,它检验的是分布,而不是参数。
(二)非参数检验的特点和适用范围1、特点(1)对样本所来自的总体分布形式没有要求。
(2)收集资料方便,可用“等级”或“符号”来记录观察结果。
(3)多数非参数检验方法比较简便,易于理解和掌握。
(4)缺点是损失信息量,适用于参数检验的资料用非参数检验会降低检验效能。
2、适用范围(1)等级资料。
(2)偏态分布资料。
当观察资料呈明显偏态分布而又未作变量变换,或经变量变换仍未达到正态或近似正态分布时,宜用非参数检验。
(3)方差不齐,且不能通过变量变换达到齐性。
(4)个体数据偏离过大,或一端或两端无界的资料。
(5)分布类型不明。
(6)初步分析。
有些医学资料由于统计工作量大,可采用非参数检验统计方法进行初步分析,挑选其中有意义者再进一步分析(包括参数统计内容)。
(三)配对设计差值的符号秩和检验(Willcoxon 配对法) 1、建立检验假设,确定检验水准H 0:差值的总体中位数等于0 H 1:差值的总体中位数不等于0α=0.052、计算检验统计量T 值 (1) 求差值d(2)编秩:依差值的绝对值由小到大编秩。
第十章
1. 两样本定量资料比较的假设检验,首先应考虑。
A. 用t 检验
B. 用秩和检验
C. t检验与秩和检验
D 资料符合t检验还是秩和检验的条件 E. X2检验
2.在作等级资料的比较时,宜用。
A. t 检验
B. X2检验
C. 秩和检验
D. F检验
E. 方差分析
3. 在作两样本均数比较时,已知均小于30,总体方差不齐且呈极度偏峰的资料
宜用。
A. t ′检验
B. t 检验
C.U检验
D. 秩和检验
E t ′检验和秩和检验均可
4.非参数统计的应用条件是。
A. 样本数据来自正态总体
B.若两组比较,要求两样本方差相等
C.总体分布类型未知
D.要求样本例数很大
E.总体属于某种已知的分布类型
5.在进行成组设计两样本秩和检验时,以下检验假设中正确的是。
A. H O两样本对应的总体均数相同
B. H O两样本均数相同
C. H O两样本对应的总体分布位置相同
D. H O两样本的中位数相同
E. H O两样本差值的中位数相同
6.配对设计的符号检验的基本思路是:如果检验假设成立,则对样本来
说。
A.正秩和的绝对值与负秩和的绝对值不会相差很大
B.中的秩和为零
C.正秩和的绝对值与负绝对值不会相差很大
D.正秩和的绝对值与负绝对值相等
E.符号相同,按顺序编秩
7.秩和检验和t 检验相比,其优点是。
A.计算更简便
B.公式更为合理
C. 检验效能高
D.抽样误差小
E.不受分布限制
8.秩和检验是一种。
A.U检验
B. X2检验
C.F检验
D.非参数检验
E.以上都不对
9.非参数统计不适合。
A.正态分布且方差齐的资料
B.偏态分布的资料
C.半定量资料
D.有过大值或小值的资料
E.以上均不可
11.不同人群血清反应(- + ++)资料比较宜用:
A.t检验
B.X2检验
C.秩和检验
D.F检验
E. Z检验
12.成组设计两样本比较的秩和检验,其检验统计量T是。
A.以秩和较小者为T
B. 以秩和较大者为T
C.以例数较小者秩和为T
D. 以例数较大者秩和为T
E.当两样本例数不等时,科任区一样本的秩和为T 13.请指出下列五个秩和检验的结果哪个是错误的。
A.配对计量资料n=12,T+=7,T-=71,查得T0.05=13~65,P<0.05
B.配对计量资料n=8,T+=12,T-=24,查得T0.05=3~33,P<0.05
C.两组计量资料n1=12, n2=10,T1=173,T2=80,查得T0.05=84~146,P<0.05 D.两组计量资料n1=10, n2=10,T1=55,T2=155,查得T0.05=78~132,P<0.05 E.两组计量资料n1=9, n2=13,T1=58,T2=195,查得T0.05=73~134,P<0.05 14.配对设计的符号秩合检验中,其检验假设H0为。
A 差值总体均数等于零即u d=0
B 差值总体均数不等于零即u d≠0
C 差值总体中倍数等于零即M d=0
D 差值总体中位数不等于零即M d≠0
E 以上都不对
二.是非题:
1.两样本比较的秩和检验,当n1>10,n2-n1>10时采用检验属于参数检验。
()2.完全随机设计多组独立样本比较的秩和检验得P<0.05,X需进行两两比较。
()3.非参数检验有称任意分布检验,其意义为与任何分布无关。
( )。