非参数检验
- 格式:doc
- 大小:665.50 KB
- 文档页数:17
常见的几种非参数检验方法非参数检验是一种不需要对数据进行假设检验的统计方法,它不需要满足正态分布等前提条件,因此被广泛应用于实际数据分析中。
在本文中,我们将介绍常见的几种非参数检验方法。
一、Wilcoxon符号秩检验Wilcoxon符号秩检验是一种用于比较两个相关样本之间差异的非参数检验方法。
它基于样本差异的符号和秩来计算统计量,并通过查表或使用软件进行显著性判断。
二、Mann-Whitney U检验Mann-Whitney U检验是一种用于比较两个独立样本之间差异的非参数检验方法。
它基于样本排名来计算统计量,并通过查表或使用软件进行显著性判断。
三、Kruskal-Wallis H检验Kruskal-Wallis H检验是一种用于比较多个独立样本之间差异的非参数检验方法。
它基于样本排名来计算统计量,并通过查表或使用软件进行显著性判断。
四、Friedman秩和检验Friedman秩和检验是一种用于比较多个相关样本之间差异的非参数检验方法。
它基于样本排名来计算统计量,并通过查表或使用软件进行显著性判断。
五、符号检验符号检验是一种用于比较两个相关样本之间差异的非参数检验方法。
它基于样本差异的符号来计算统计量,并通过查表或使用软件进行显著性判断。
六、秩相关检验秩相关检验是一种用于比较两个相关样本之间关系的非参数检验方法。
它基于样本排名来计算统计量,并通过查表或使用软件进行显著性判断。
七、分布拟合检验分布拟合检验是一种用于检验数据是否符合某个特定分布的非参数检验方法。
它基于样本数据与理论分布之间的差异来计算统计量,并通过查表或使用软件进行显著性判断。
八、重复测量ANOVA重复测量ANOVA是一种用于比较多个相关样本之间差异的非参数检验方法。
它基于样本方差和均值来计算统计量,并通过查表或使用软件进行显著性判断。
九、Bootstrap法Bootstrap法是一种用于估计总体参数和构建置信区间的非参数方法。
它基于自助重采样技术来生成大量虚拟样本,以此估计总体参数和构建置信区间。
目录第八章非参数检验 ________________________________________________________________________ 2第一节非参数检验概述 __________________________________________________________________ 3第二节单样本非参数检验 ________________________________________________________________ 3χ拟合优度检验__________________________________________________________________ 3一、2二、单样本K-S检验___________________________________________________________________ 5三、符号检验 _________________________________________________________________________ 6四、游程检验 _________________________________________________________________________ 7χ的独立性检验_________________________________________________________ 8第三节列联表与2第四节等级相关分析 ___________________________________________________________________ 10一、Spearman等级相关系数____________________________________________________________11二、Kendall等级相关系数 _____________________________________________________________ 12英文摘要与关键词 ______________________________________________________________________ 14习题 _________________________________________________________________________________ 15第八章非参数检验通过本章的学习,我们应该知道:1.非参数检验的优缺点2.常用的单样本非参数检验方法3.列联表与卡方的独立性检验4.S pearman和Kendall 等级相关系数的计算第一节 非参数检验概述非参数检验(nonparametric tests )是相对于参数检验而言的。
参数检验是一种适用于一些特定环境下的检验,如第六章中进行的均值检验就属于参数检验,首先它对总体作出了服从正态分布的假设,然后根据来自总体的样本资料对均值进行检验。
但在许多实际问题中,人们往往对总体的分布形式知之甚少,很难有正确的假定,这样就不能满足参数检验的条件,也就不能用参数检验方法了。
假定总体分布的具体形式未知,而是从样本数据本身来获得所需信息,对总体分布的类型和位置进行检验,这称为非参数检验。
非参数检验的特点是:1. 从非参数检验的前提条件看,仅要求“观测值是独立的”、“变量具有连续性”等简单假设,不要求确保样本所属的总体符合某种理论分布。
检验不受总体分布形状的限制,使得适用范围更为广泛。
2. 从非参数检验方法对原始数据的要求看,它不要求有很精确的计量值,可以使用分类数据和顺序数据,非参数检验的处理方法大都基于低精度数据,因而它几乎可以处理如何类型的数据。
3. 从非参数检验方法的效率看,虽然非参数检验的计算方法名目繁多,有时对某类数据的算法就有多种,但其表现形式一般比较简单并易于理解,依照不同类型数据的不同算法,效率也不同。
研究表明,多数常用的非参数检验方法的效能是参数检验方法的95%左右。
也就是说,通过95次独立观察获得的数据能够保证参数检验所要达到的精度,那么若用非参数检验方法,则需要100次的独立观察。
总之,非参数检验需要更大的样本容量来保证所要求的检验精度。
本章介绍单样本非参数检验(single-sample nonparametric test )的常用方法:2χ拟合优度检验、K-S 检验、符号检验和游程检验,以及列联表与卡方的独立性检验。
第二节 单样本非参数检验对获取的样本资料,往往最希望了解其所属总体的分布形态是否与已知的理论分布相吻合,或它们是否具有随机性。
人们可以通过绘图作粗略判断,但如果希望得到比较准确的结论,则需要用非参数检验。
下面介绍的方法中,2χ检验、K-S 检验和符号检验都属于拟合优度检验,即都是检验属于每一类别的观测数目与根据零假设所得到的期望数目之间是否有显著性差异;游程检验是用来对样本数据的随机性进行的检验。
一、2χ拟合优度检验2χ拟合优度检验(chi-square goodness-of-fit test )适用于具有明显分类特征的数据。
如要研究消费者对某种产品是否有“颜色”的偏好,可以将200位消费者按购买不同颜色的产品分类,得到各颜色购买者的人数。
根据这些样本数据来判断样本所属的总体分布与某一设定分布是否有显著差异,所谓设定分布可以是我们熟悉的理论分布,如正态分布、均匀分布等,也可以是任何想象的分布。
零假设0H 是:样本所属总体其分布形态与设定分布无显著差异。
在进行检验时需要构造下面的2χ统计量: ∑=-=ki ei ei i f f f 1202)(χ (8.1) 式中:k 是样本分类的个数,i f 0表示实际观察到的频数,ei f 表示设定频数,即理论频数。
可见,如果观察频数与设定频数越接近,则2χ值越小,根据皮尔逊定理,当n 充分大时,2χ统计量渐近服从于k-1个自由度的2χ分布。
我们可以计算出2χ统计量,判断有两种方法:一是依据2χ分布表,给出所对应的概率值,如果该概率值小于或等于给定的显著性水平α,则拒绝0H ,即样本所属的总体分布形态与设定的分布存在显著差异;如果该概率值大于给定的显著性水平α,则不能拒绝0H ,即没有理由认为样本所属的总体分布形态与设定分布有显著差异。
二是依据2χ分布表,给出α所对应的临界值2αχ,如果2χ统计量大于或等于临界值,则拒绝0H ,认为样本所属的总体分布形态与设定分布存在显著差异;如果2χ统计量小于临界值,则不能拒绝0H 。
由于奠定检验基础的皮尔逊定理要求样本是充分大,所以在搜集资料时必须要保证样本容量不小于50,同时每个单元中的期望频数不能太小,如果第一次分类时有单元中的频数小于5,则需要将它与相邻的组进行合并,如果20%的单元理论频数e f 小于5,则不能用2χ检验了。
【例8.1】某企业生产线上星期一至星期五的不合格产品数量如下表所示,试检验五个不同工作日的产品不合格率是否相同(α=0.05)?【解】0H :五个不同工作日的产品不合格数相同;1H :五个不同工作日的产品不合格数不相同。
由于不合格品数的实际数是134,所以其理论值为134÷5 = 26.8。
表8.1是相关数据的计算。
22χ统计量为16.2239,其对应的近似概率值为0.0027。
由于0.0027<0.05,故拒绝0H ,也就是说,五【例8.2】接上题,有人认为产品的不合格率与工人的情绪有关,星期一刚来上班情绪最不稳,不合格率为30%,星期二、五的不合格率次之,为25%,而星期三、四的不合格率仅为10%,这种观点有道理吗?以显著性水平α=0.05来检验这种说法的正确性。
【解】 0H :%25%,10%,10%,25%,3054321=====πππππ1H :至少有一个)5,4,3,2,1(=i i π与上述比例不同。
计算在各设定的比例为真的情况下,每天的不合格品数,如星期一的不合格品数为:134×30%=40.2,星期二的不合格品数为:134×25%=33.5,……,依次类推。
相关计算可借助Excel 数据表,结果见图8.1。
图8.12χ统计量的计算表 由于实际的2χ统计量1.2687小于α=0.05对应的临界值9.4877,或根据2χ统计量对应的概率0.8667大于α,所以不能拒绝0H ,即没有理由认为假想的比例是错的。
二、单样本K-S 检验单样本K-S 检验(1-sample K-S test )是以两位苏联数学家柯尔莫哥(Kolmogorov )和斯米诺夫(Smirnov )命名的。
K-S 检验是一种拟合优度检验,研究样本观察值的分布和设定的理论分布间是否吻合,通过对两个分布差异的分析确定是否有理由认为样本的观察结果来自所设定的理论分布总体。
设)(x S n 是一个n 次观察的随机样本观察值的累积概率分布函数,即经验分布函数;)(0x F 是一个特定的累积概率分布函数,即理论分布函数。
定义)()(0x F x S D n -=,显然若对每一个x 值来说,)(x S n 与)(0x F 十分接近,也就是差异很小,则表明经验分布函数与特定分布函数的拟合程度很高,有理由认为样本数据来自具有该理论分布的总体。
K-S 检验主要考察的是绝对差数)()(0x F x S D n -=中那个最大的偏差,即利用下面的统计量作出判断。
)()(max 0max x F x S D n -= (8.2)K-S 检验的步骤为:1. 提出假设:)()(:00x F x S H n =,)()(:01x F x S H n ≠2. 计算各个D ,找出统计量max D3. 查找临界值:根据给定的显著性水平α和样本数据个数n ,查《单样本K-S 检验统计量表》可以得到临界值αD (单样本K-S 检验统计量表见附录六)。
4. 作出判定:若max D ≥αD ,则在α水平上,拒绝0H ;若max D <αD ,则不能拒绝0H ;【例8.3】 随机抽取100名生产线上的工人,调查他们的日产量,资料情况如下表,判断生产线上工【解】0H :)(x S n 服从正态分布,1H :)(x S n 不服从正态分布。
根据所给的资料,借助Excel 进行相关的计算,见图8.2:图8.2 max D 统计量的计算表查表得136.010036.1==αD ,由于max D = 0.0430<αD ,所以,不能拒绝0H ,即生产线上工人的日产量服从正态分布。
比较2χ检验与K-S 检验:两者均属拟合优度检验,2χ检验常用于分类数据,而K-S 检验还可以运用于顺序数据。