第十章 基于秩次的非参数检验
- 格式:doc
- 大小:34.50 KB
- 文档页数:2
基于秩次的非参数检验1. 问题的提出前面学习了连续型资料两组样本均数差异的假设检验方法:小样本用t检验,条件是变量服从正态分布和方差齐;大样本用标准正态分布的Z检验。
如果是小样本,变量的分布不清,或者已知不服从正态分布或经变量转换后仍不服从正态分布时,如何检验两个样本或多个样本均数差异的统计学意义呢?需要一种不依赖于分布假定的检验方法,即非参数检验。
2. 基本概念前面介绍的检验方法首先假定分析变量服从特定的已知分布(如正态分布),然后对分布参数(如均数)作检验。
这类检验方法称参数检验(parametric test)。
今天介绍的检验方法不对变量的分布作严格假定,检验不针对特定的参数,而是模糊地对变量的中心位置或分布位置作比较。
这类检验称非参数检验(nonparametric test),由于其对总体分布不作严格假定,所以又称任意分布检验。
(distribution-free test)非参数检验的优点:a.不受总体分布的限制,适用范围广。
b.适宜定量模糊的变量和等级变量。
c.方法简便易学。
缺点:如果是精确测量的变量,并且已知服从或者经变量转换后服从某个特定分布(如正态分布),这时人为地将精确测量值变成顺序的秩,将丢失部分信息,造成检验功效能下降。
基于秩次非参数检验(秩和检验)的基本思想假设变量X有观察值1.1, 1.3, 1.7, 4.3, 11.4显然这变量不服从正态分布,观察值间差异较大,既不对称,标准差也较大。
但如果将变量作转换,变成秩变量Y=1,2,3,4,5,则分布对称了,观察值间的差异也均匀了,标准差也减小了。
然后对这秩分布的中心位置(中位数)作检验,这就是秩和检验。
7.1 配对样本的符号秩检验(Wilcoxon signed rank test)例7.1为研究出生先后的孪生兄弟间智力是否存在差异,12对孪生兄弟测试的结果见表7.3。
表7.3 12对孪生兄弟测试结果T +=24.5,T -=41.5符号秩检验的分布理论:假定有4个差值,如果H 0成立时,这4个差值有同等的概率取正值或负值,即每个值取正值的概率等于1/2。
基于秩的非参数检验介绍秩检验是一种常用的非参数检验方法,它不依赖于总体的具体分布形式,适用于数据不满足正态分布等假设的情况。
秩检验的核心思想是将原始数据转化为秩次,通过比较秩次的大小来进行假设检验。
本文将介绍基于秩的非参数检验的原理、常见的秩检验方法以及如何应用秩检验进行统计推断。
### 一、秩的概念在介绍秩检验之前,首先需要了解秩的概念。
秩是指将一组数据按照大小顺序排列后得到的位置序号,即数据在排序后的位置。
例如,对于一组数据{5, 3, 7, 2},排序后的序列为{2, 3, 5, 7},则对应的秩次为{2, 1, 3, 4}。
### 二、秩和秩次的计算在进行秩检验时,需要计算每个数据点的秩次。
对于有重复数值的情况,可以采用两种方法计算秩次:一是平均秩法,即将重复数值的秩次取平均值;二是顺序秩法,即按照数据出现的先后顺序依次赋予秩次。
### 三、秩和秩次的应用秩和秩次在非参数检验中起着重要作用。
在进行秩检验时,常用的方法包括Wilcoxon秩和检验、Mann-Whitney U检验、Kruskal-Wallis 检验等。
这些方法都是基于秩次进行统计推断,适用于不同类型的假设检验问题。
1. Wilcoxon秩和检验Wilcoxon秩和检验是一种用于比较两组相关样本的非参数检验方法。
它的原假设是两组样本来自同一总体,备择假设是两组样本来自不同总体。
通过比较两组样本的秩和来判断它们是否存在显著差异。
2. Mann-Whitney U检验Mann-Whitney U检验是一种用于比较两组独立样本的非参数检验方法。
它的原假设是两组样本来自同一总体,备择假设是两组样本来自不同总体。
通过比较两组样本的秩和来进行假设检验。
3. Kruskal-Wallis检验Kruskal-Wallis检验是一种用于比较多组独立样本的非参数检验方法。
它的原假设是多组样本来自同一总体,备择假设是多组样本来自不同总体。
通过比较多组样本的秩和来进行假设检验。
第十章基于秩次的非参数检验[教学要求]了解:通过电脑实验了解不同设计类型的秩和检验和相应t检验的功效有何不同。
熟悉:理解非参数统计的概念;熟悉不同设计类型的秩和检验方法。
掌握:掌握不同设计类型的秩和检验的实施方法及其应用条件。
[重点难点]第一节正确理解非参数统计的概念在统计学中,最基本的概念是总体和样本、随机变量、分布和假设检验,其中很大一部分内容是和正态理论相关的,总体的分布形式或分布族往往是给定的或是假定了的,所不知道的仅仅是一些参数的值或他们的范围,人们的任务就是对一些参数(如均值和方差或标准差)进行点估计或区间估计,或者对某些参数进行各种检验,如最常用χFt2的统计量、统计量、统计量均基于正态总体这一假设。
在实际中,对总体分布的假定并非能随便作出,数据可能不是来自所假定分布的总体,或根本不是来自一个总体,或因为种种原因被污染。
在假定总体分布的情况下进行推断可能产生错误甚至灾难性的结论。
于是人们希望在不假定总体分布的情况下,尽量从数据本身获得所需要的信息,这正是非参数统计的宗旨。
非参数统计是一个很广阔的研究领域,本章涉及的仅是基本的秩和检验。
非参数统计方法不利用关于总体分布的知识,即便在对于总体的任何知识都没有的情况下,也容易而又很可靠地获得结论,这是非参数方法优于参数方法的一面;在总体分布族已知的情况下,不需要任何先验知识就成为它的缺点,由于没有充分利用已知的关于总体分布的信息,所作出的结论就不如参数方法得到的精确。
在不知总体分布的情况下如何利用数据所包含的信息呢?一组数据的最基本信息是次序,将数值按大小次序排队,每个数值在整个数据中均有相应的位置和次序,称为该数据的秩(rank)。
在一定的假设下,这些秩及其统计量的分布是可以求出来的,且与原来的总体分布无关,可进行所需要的统计推断。
以上便是非参数统计的基本思想。
注意,非参数(nonparametric) 意味着其方法不涉及特定的总体分布,又称任意分布(distribution-free)或称与分布无关,是因其推断方法和总体分布无关,不应理解为与所有分布(例如有关秩的分布)无关。
第十章基于秩次的非参数检验习题
一、选择题
1.两小样本均数比较,方差不齐时,下列说法不正确的是().
A. 采用秩和检验
B. 采用t′检验
C. 仍用t检验
D. 变量变换后再作决定
E. 要结合正态性检验结果方能作出决定
H是().
2. 两样本秩和检验的
A. 两样本秩和相等
B. 两总体分布相同
C. 两样本分布相同
D. 两总体秩和相等
E. 两总体均数相等
3. 在统计检验中是否选用非参数统计方法().
A. 要根据研究目的和数据特征作决定
B. 可在算出几个统计量和得出初步结论后进行选择
C. 要看哪个统计结论符合专业理论
D. 要看哪个P值更小
E. 既然非参数统计对资料没有严格的要求,在任何情况下均能直接使用
4. 配对样本差值的Wilcoxon符号秩和检验,确定P值的方法是().
A. T越大,P值越小
B.T越大,P值越大
C. T值在界值范围内,P值小于相应的α
D. T值在界值范围内,P值大于相应的α
E. T值在界值范围上,P值大于相应的α
5. 成组设计两样本比较的秩和检验,其检验统计量T是().
A. 为了查T界值表方便,一般以秩和较小者为T
B. 为了查T界值表方便,一般以秩和较大者为T
C. 为了查T界值表方便,一般以例数较小者秩和为T
D. 为了查T界值表方便,一般以例数较大者秩和为T
E. 当两样本例数不等时,任取一样本的秩和为T都可以查T界值表
多样本定量资料比较,当分布类型不清时应选择().
A. 方差分析
B. t检验
C. Z检验
D. Kruskal-Wallis检验
E. Wilcoxon检验
6. 多组样本比较的Kruskal-Wallis检验中,当相同秩次较多时,如果用H值而不用校正后
H值,则会().
的
c
A.提高检验的灵敏度
B.把一些无差别的总体推断成有差别
C. 把一些有差别的总体推断成无差别
D.Ⅰ、Ⅱ类错误概率不变
E. 以上说法均不对
二、简答题
1. 对于完全随机设计两样本定量资料的比较,如何选择统计方法?
2. 为什么在秩和检验编秩次时不同组间出现相同数据要给予“平均秩次”,而同一组的相同数据不必计算“平均秩次”?
3. 多组定量资料比较时,统计处理的基本流程是什么?。