非参检验概述 Non Parametric Test
- 格式:doc
- 大小:52.00 KB
- 文档页数:6
非参数检验(Non-parametric test)是一种统计分析方法,它不需要假设数据满足特定的概率分布。
与参数检验不同,非参数检验不需要对数据的均值、方差等统计量进行假设。
非参数检验主要应用于计量数据,当数据分布未知或不适宜采用参数检验时,可以考虑使用非参数检验来评估数据之间的差异。
非参数检验的主要优点是不依赖于数据的分布假设,因此对数据的适应性较强。
然而,它的缺点是有些非参数检验的效力较低,即在拒绝原假设时,可能存在较高的Type I 错误概率。
常见的非参数检验方法包括:
1. 符号检验(Signed rank test):用于两个样本的顺序数据,检验两个样本的均值是否存在显著差异。
2. 曼- 惠特尼U 检验(Mann-Whitney U test):用于两个样本的顺序数据,检验两个样本的均值是否存在显著差异。
3. 肯德尔和谐系数检验(Kendall's tau test):用于评估两组评级数据之间的相关性。
4. 莫里斯符号检验(Morris test):用于多个样本的顺序数据,检验各组之间是否存在显著差异。
5. 克鲁斯卡尔- 沃尔斯检验(Kruskal-Wallis test):用于多组数据的顺序变量,检验各组之间的均值是否存在显著差异。
6. 费希尔精确检验(Fisher's exact test):用于两组分类数据,检验两个分类变量之间的关联性。
在实际应用中,根据数据类型、研究目的和假设检验条件,可以选择合适的非参数检验方法。
在使用非参数检验时,需要注意其对样本量、数据类型和数据分布的要求,以确保检验结果的准确性和可靠性。
常用的非参数检验(NonparametricTests)总结非参数检验(Nonparametric tests)是统计分析方法的重要组成部分,它与参数检验共同构成统计推断的基本内容。
参数检验是在总体分布形式已知的情况下,对总体分布的参数如均值、方差等进行推断的方法。
但是,在数据分析过程中,由于种种原因,人们往往无法对总体分布形态作简单假定,此时参数检验的方法就不再适用了。
非参数检验正是一类基于这种考虑,在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。
由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名为“非参数”检验。
•两独立样本的非参数检验两独立样本的非参数检验是在对总体分布不甚了解的情况下,通过对两组独立样本的分析来推断样本来自的两个总体的分布等是否存在显著差异的方法。
独立样本是指在一个总体中随机抽样对在另一个总体中随机抽样没有影响的情况下所获得的样本。
SPSS中提供了多种两独立样本的非参数检验方法,其中包括曼-惠特尼U检验、K-S检验、W-W游程检验、极端反应检验等。
某工厂用甲乙两种不同的工艺生产同一种产品。
如果希望检验两种工艺下产品的使用是否存在显著差异,可从两种工艺生产出的产品中随机抽样,得到各自的使用寿命数据。
甲工艺:675 682 692 679 669 661 693乙工艺:662 649 672 663 650 651 646 652(1)曼-惠特尼U检验两独立样本的曼-惠特尼U检验可用于对两总体分布的比例判断。
其原假设:两组独立样本来自的两总体分布无显著差异。
曼-惠特尼U 检验通过对两组样本平均秩的研究来实现判断。
秩简单说就是变量值排序的名次,可以将数据按升序排列,每个变量值都会有一个在整个变量值序列中的位置或名次,这个位置或名次就是变量值的秩。
(2)K-S检验K-S检验不仅能够检验单个总体是否服从某一理论分布,还能够检验两总体分布是否存在显著差异。
目录第八章非参数检验 ________________________________________________________________________ 2第一节非参数检验概述 __________________________________________________________________ 3第二节单样本非参数检验 ________________________________________________________________ 3χ拟合优度检验__________________________________________________________________ 3一、2二、单样本K-S检验___________________________________________________________________ 5三、符号检验 _________________________________________________________________________ 6四、游程检验 _________________________________________________________________________ 7χ的独立性检验_________________________________________________________ 8第三节列联表与2第四节等级相关分析 ___________________________________________________________________ 10一、Spearman等级相关系数____________________________________________________________11二、Kendall等级相关系数 _____________________________________________________________ 12英文摘要与关键词 ______________________________________________________________________ 14习题 _________________________________________________________________________________ 15第八章非参数检验通过本章的学习,我们应该知道:1.非参数检验的优缺点2.常用的单样本非参数检验方法3.列联表与卡方的独立性检验4.S pearman和Kendall 等级相关系数的计算第一节 非参数检验概述非参数检验(nonparametric tests )是相对于参数检验而言的。
第十一章 非参数检验前面有关章节讨论的参数检验都要求总体服从一定的分布,对总体参数的检验是建立在这种分布基础上的。
例如,两样本平均数比较的t 检验和多个样本平均数比较的F 检验,都要求总体服从正态分布,推断两个或多个总体平均数是否相等。
本章引入另一类检验——非参数检验(non-parametric test )。
非参数检验是一种与总体分布状况无关的检验方法,它不依赖于总体分布的形式,应用时可以不考虑被研究的对象为何种分布以及分布是否已知。
非参数检验主要是利用样本数据之间的大小比较及大小顺序,对两个或多个样本所属总体是否相同进行检验,而不对总体分布的参数如平均数、标准差等进行统计推断。
当样本观测值的总体分布类型未知或知之甚少,无法肯定其性质,特别是观测值明显偏离正态分布,不具备参数检验的应用条件时,常用非参数检验。
非参数检验具有计算简便、直观,易于掌握,检验速度较快等优点。
非参数检验法从实质上讲,只是检验总体分布的位置(中位数)是否相同,所以对于总体分布已知的样本也可以采用非参数检验法,但是由于它不能充分利用样本内所有的数量信息,检验的效率一般要低于参数检验方法。
例如,非配对资料的秩和检验,其效率为t 检验的86.4%,就是说以相同概率判断出差异显著,t 检验所需的样本个数要少13.6%。
非参数检验内容很多,本章只介绍常用的符号检验(sign test ),秩和检验(rank-sum test )和等级相关分析(rank correlation analysis )三种。
第一节 符号检验一、配对资料的符号检验(一)配对资料符号检验的意义 配对资料符号检验是根据样本各对数据之差的正负符号多少来检验两个总体分布位置的异同,而不去考虑差值的大小。
每对数据之差为正值用“+”表示,负值用“-”表示。
可以设想如果两个总体分布位置相同,则正或负出现的次数应该相等。
若不完全相等,至少不应相差过大,否则超过一定的临界值就认为两个样本所来自的两个总体差异显著,分布的位置不同。
非参数统计分析――Nonparametric Tests菜单详解非参数统计分析――Nonparametric Tests菜单详解平时我们使用的统计推断方法大多为参数统计方法,它们都是在已知总体分布的条件下,对相应分布的总体参数进行估计和检验。
比如单样本u检验就是假定该样本所在总体服从正态分布,然后推断总体的均数是否和已知的总体均数相同。
本节要讨论的统计方法着眼点不是总体参数,而是总体分布情况,即研究目标总体的分布是否与已知理论分布相同,或者各样本所在的分布位置/形状是否相同。
由于这一类方法不涉及总体参数,因而称为非参数统计方法。
SPSS的的Nonparametric Tests菜单中一共提供了8种非参数分析方法,它们可以被分为两大类:1、分布类型检验方法:亦称拟合优度检验方法。
即检验样本所在总体是否服从已知的理论分布。
具体包括:Chi-square test:用卡方检验来检验二项/多项分类变量的几个取值所占百分比是否和我们期望的比例有没有统计学差异。
Binomial Test:用于检测所给的变量是否符合二项分布,变量可以是两分类的,也可以使连续性变量,然后按你给出的分界点一分为二。
Runs Test:用于检验样本序列随机性。
观察某变量的取值是否是围绕着某个数值随机地上下波动,该数值可以是均数、中位数、众数或人为制定。
一般来说,如果该检验P值有统计学意义,则提示有其他变量对该变量的取值有影响,或该变量存在自相关。
One-Sample Kolmogorov-Smirnov Test:采用柯尔莫哥诺夫-斯米尔诺夫检验来分析变量是否符合某种分布,可以检验的分布有正态分布、均匀分布、Poission分布和指数分布。
2、分布位置检验方法:用于检验样本所在总体的分布位置/形状是否相同。
具体包括:Two-Independent-Samples Tests:即成组设计的两独立样本的秩和检验。
Tests for Several Independent Samples:成组设计的多个独立样本的秩和检验,此处不提供两两比较方法。
非参数检验
知识引入
比较两个总体间的差异,我们比较熟悉的是可依据总体方差是否已知,选择使用正态Z检验或t检验法。
但如果有明显的证据表明,这些参数型检验法不能使用时又该如何呢?非参数检验法对此提供了解决方案。
作为参数检验的一种推广,非参数检验有何特点?它的使用有什么样的要求?本章首先对非参数检验进行概述,接着按照和参数检验对应的原则分别介绍用于两组比较的非参数检验法和用于多组比较的非参数检验法。
第一节非参数检验概述
假设检验分为参数检验和非参数检验。
参数检验是在已知总体分布的条件下(一般要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验,有时还要求某些总体参数满足一定条件。
如独立样本的T检验和方差分析不仅要求总体符合正态分布,还要求各总体方差齐性。
教材第八章之前所介绍的统计方法都是参数检验法。
非参数检验则不考虑总体分布是否已知,常常也不是针对总体参数,而是针对总体的某些一般性假设(如总体分布的位置是否相同,总体分布是否正态)进行检验。
非参数检验方法简便,不依赖于总体分布的具体形式因而适用性强,但灵敏度和精确度不如参数检验。
一般而言,非参数检验适用于以下三种情况:①顺序类型的数据资料,这类数据的分布形态一般是未知的;②虽然是连续数据,但总体分布形态未知或者非正态,这和卡方检验一样,称自由分布检验;③总体分布虽然正态,数据也是连续类型,但样本容量极小,如10以下(虽然T检验被称为小样本统计方法,但样本容量太小时,代表性毕竟很差,最好不要用要求较严格的参数检验法)。
因为这些特点,加上非参数检验法一般原理和计算比较简单,因此常用于一些为正式研究进行探路的预备性研究的数据统计中。
当然,由于非参数检验许多牵涉不到参数计算,对数据中的信息利用不够,因而其统计检验力相对参数检验也差得多。
前面所学到的参数检验法在非参数法中都能找到替代的方法,因此按照和参数检验法相对应的原则可对非参数检验法进行如下分类:
第二节非参数两组比较法
该类方法实际上对应两总体比较的t检验法。
按照两个样本的相关性,又可分为相关样本检验法和独立样本检验法。
其中相关样本检验法主要包括符号检验和符号等级检验两种方法;独立样本检验法主要包括秩和检验和中数检验两种方法。
一、符号检验法
符号检验法是通过对两个相关样本的每对数据之差的符号(正号或负号)进行检验,以比较这两个样本所代表的总体的差异显著性,对应于参数检验中两相关样本差异显著性的T检验。
其基本思想是:若两总体差异不显著,则两样本差值的正号与负号应大致各占一半,即中位数为0,可见符号检验是以中数作为统计量进行假设检验的。
1、符号检验法的假设是:
H0:差值的总体中位数为0;
H1:差值的总体中位数不为0。
2、符号检验法的步骤为:
①标记出每对数据之差的符号,正号个数记为n+,负号的个数记n-,(显然差值为0的不计算在任何一个中),这两数中最小者记为r,两数之和记为N,即:
N = n+ + n-;r = min(n+,n-)
②分两种情况进行检验:
在双侧检验,.05水平下,若Z值落在-1.96~1.96之间,则表明两总体差异不显著;在此之外则表明差异显著。
在单侧检验,.05水平下,若Z值落在-1.645~1.645之间,则表明两总体差异不显著;在此之外则表明差异显著。
上面第二种情况采用正态分布,是因为将N分成n+和n-两部分,服从二项分布,而当N很大时,二项分布近似于正态分布。
二、符号等级检验法
符号等级检验法是通过对两个相关样本的每对数据之差的符号(正号或负号)及等级进行检验,以比较这两个样本所代表的总体的差异显著性,对应于参数检验中两相关样本差异显著性的T检验。
其基本思想是:若两总体差异不显著,则两样本的正负向差值的等级之和应大致相等,即分布对称,且中位数为0,可见符号检验是以中数和分布的对称性为统计量进行假设检验的。
1、符号等级检验法的假设是:
H0:差值的总体分布对称且中位数为0;
H1:差值的总体分布不对称,或中位数不为0。
2、符号等级检验法的步骤为:
①将两相关样本数据之差按绝对值由小到大排列,若差值为0,则不参与排序;
②在各等级前添上差值的符号;
③记带正号的等级和为T+,记带负号的等级和为T-,并取两者之中最小者记为T,记有正负号的差值的个数为N;
④分两种情况进行检验:
在双侧检验,.05水平下,若Z值落在-1.96~1.96之间,则表明两总体差异不显著;在此之外则表明差异显著。
在单侧检验,.05水平下,若Z值落在-1.645~1.645之间,则表明两总体差异不显著;在此之外则表明差异显著。
符号等级检验比符号检验利用了更多的数据信息,既考虑了符号,也考虑了数据的大小,因而更为常用,统计检验力更高。
三、秩和检验法
秩和检验法适用于两独立样本的差异显著性检验,用以确定两种总体的分布是否相同,对应于参数检验中两独立样本均数之差的T检验。
“秩”又称等级、即按数据大小排定的顺序号,顺序号的和称“秩和”,秩和检验就是用秩和作为统计量进行假设检验的方法。
这一方法首先由维尔克松(Wilcoxon)提出,后由曼-惠特尼(Mann-Whitney)两人加以改进,因此又称曼-惠特尼U检验法。
1、秩和检验法的假设是:
H0:两总体分布相同;
H1:两总体分布不同。
2、秩和检验法的步骤为:
①将两样本混合,由小到大排序(相同数据占平均等级);
②取容量小的样本中各数据的等级相加,记为T;
③分两种情况进行检验:(两样本的容量记为n1,n2)
a.n1≤10,n2≤10:查秩和检验表,当T1<T<T2时两总体的差异不显著,其中T1,T2是查附表14所得。
b.n1>10或n2>10:秩和T趋近于正态分布,即:
因此可以采用Z统计量进行检验:
在双侧检验,.05水平下,若Z值落在-1.96~1.96之间,则表明两总体差异不显著;在此之外则表明差异显著。
在单侧检验,.05水平下,若Z值落在-1.645~1.645之间,则表明两总体差异不显著;在此之外则表明差异显著。
四、中数检验法
中数检验法也适用于两独立样本的差异显著性检验,用以检验两总体是否具有相同中数。
中数检验法是用中位数作为统计量进行假设检验的方法,它将各组样本数据合在一起找出共同的中位数,然后分别计算每个样本在共同中位数上、下的频数,再进行R×C表卡方检验。
所以实际上中数检验法是利用卡方独立性检验进行统计决策。
1、中数检验法的假设是:
H0:两总体分布具有相同中数;
H1:两总体分布的中数不同。
2、中数检验法的步骤为:
①两样本由小到大混合排序;
②求混合排序数列的中数;
③分别找出每一样本中大于及小于总体中数的数据个数(中数本身并不计算在内),并列出四格表;
④对四格表进行χ2检验。
相对秩和检验法,由于中数检验只考虑每个样本里中数上下的数据个数,实际上将顺序数据降级为性质数据进行处理,所以利用数据的信息要少一些,因此可靠性也就差一些。
第三节非参数多组比较法
多组比较的参数检验是方差分析,与之相应,非参数多组比较法也叫方差分析法。
只是其主要用于等级型数据或不满足参数检验条件的场合,故亦称等级方差分析(ANOVA by ranks)。
和方差分析一样,按照实验设计不同,非参数多组比较法也包括适用于完全随机化设计的单向秩次方差分析或称克—瓦氏单向方差分析(Kruskal-Wallis H检验)和适用于随机化区组设计的双向秩次方差分析(Friedman检验)。
一、克-瓦氏单向等级方差分析
克-瓦氏单向等级方差分析对应于参数检验中完全随机化实验设计的方差分析,计算步骤如下:
①将各组数据混合并由小到大排序,再分别求出各组等级之和,记为R i;
②计算统计量H,组数记为k,每组的数据个数记为n i,总的数据个数记为N:
③分两种情况进行检验:
a.当k=3且所有ni≤5时,查附表17,当H所对应的P值小于.05时,则表示各组在.05的显著性水平下有显著的差异;
b.当k>3或者有n i>5时,若H>χ2.05(k-1)则表示各组在.05的显著性水平下有显著的差异。
注意,在非参数检验中,目前还没有比较成熟的多重比较方法,因此若差异显著时只能得到整体间存在差异,还无法知道倒底是哪些组间存显著的差异。
这可以说是非参数方差分析的一个最大的不足。
二、弗里德曼双向等级方差分析
弗里德曼双向等级方差分析对应于参数检验中随机区组设计的方差分析,计算步骤如下:
①将每一区组或每一被试的k个数据从小到大排序,k为处理数;
②每个处理的n个等级之和记为R i;
③计算统计量χ2r,并进行检验:。