秩转换非参数检验
- 格式:ppt
- 大小:5.62 MB
- 文档页数:57
非参数检验的基本原理非参数检验是一种利用统计方法来检验假设的一种方法,与参数检验相比,非参数检验不需要对总体的分布做出假设,更为灵活。
本文将介绍非参数检验的基本原理。
一、概述非参数检验是一种统计方法,既不要求数据符合特定分布,也不对总体参数做出假设。
与之相反,参数检验通常假设数据服从特定的分布,例如正态分布。
非参数检验的主要优点是可以更全面地处理数据,更适用于复杂的情况。
然而,非参数检验的统计效率通常较低,需要更多的样本来达到相同的置信水平。
二、基本原理1. 秩次转换非参数检验通常使用秩次转换来处理数据。
所谓秩次转换是将原始的数值转换为它们在样本中的秩次,从而消除数值的大小差异。
对于同一组数据,秩次转换后,可以应用更广泛的统计方法。
2. Wilcoxon符号秩检验Wilcoxon符号秩检验是一种非参数检验方法,主要应用于配对样本或者两组独立样本之间的差异比较。
它的基本思想是对每个观测值计算它们的符号秩,然后通过比较两组样本的秩和来判断差异是否显著。
3. Mann-Whitney U检验Mann-Whitney U检验是一种非参数检验方法,用于比较两组独立样本之间的差异。
它的基本原理是将两组样本中的所有观测值汇总,然后对这些观测值进行秩次转换,并计算两组样本排名和。
通过比较两组样本排名和的大小来判断差异是否显著。
4. Kruskal-Wallis H检验Kruskal-Wallis H检验是一种非参数的方差分析方法,用于比较三组或以上独立样本之间的差异。
它的基本原理是将所有样本的观测值汇总,然后进行秩次转换,并计算各组样本排名和的平均值。
通过比较平均排名和的大小来判断差异是否显著。
三、案例研究为了更好地理解非参数检验的原理,我们以某家公司销售部门的两个月销售额作为例子进行案例研究。
假设第一个月公司销售额为[100, 80, 120, 90, 110],第二个月公司销售额为[95, 85, 115, 100, 105]。
秩转换的非参数检验基本概念1.参数检验方法(parametric test):总体分布类型已知的条件下对其参数进行估计或检验。
(如t-test, F- test)2.非参数检验方法(nonparametric test):一种不依赖总体分布的具体形式,也不对参数进行估计或检验的统计方法来分析此类资料这种方法不受总体参数的影响,检验的是分布或分布位置,而不是参数。
这样的检验方法称为非参数检验(如基于秩次的检验)3.秩次(rank)):秩统计量,是指全部观察值按某种顺序排列的位序。
在一定程度上反映了等级的高低。
4.秩和(rank sum):同组秩次之和。
在一定程度上反映了等级的分布位置非参数检验的优缺点:优点:无严格的条件限制,且多数非参数统计方法较为简单,易于理解和掌握,应用范围广缺点:对适宜参数统计的资料,若用非参数统计处理,常损失部分信息,降低检验效能。
总结:因此对适合参数统计条件的资料或经变量变换后适合参数统计的资料,应最好用参数统计。
但资料不具备用参数统计的条件时,非参数统计是很有效的分析方法适用范围:(1)总体分布为偏态或分布形式未知的计量资料(尤其在n<30的情况下)。
(2)等级资料。
(3)个别数据偏大或数据的某一端无确定的数值。
(4)各总体方差不齐。
检验步骤1、检验假设H0:差值的总体中位数Md=0 H1:差值的总体中位数Md≠0 α=0.052、求差值3、编秩:依差值的绝对值从小到大编秩遇差值为0的对子,舍去不计,同时样本量减一遇差值绝对值相等则取平均秩,称为相同秩(ties)然后按差值的正负对秩次冠以正负号4、求检验统计量:任取正秩和或负秩和为T5、确定P值并做出统计推断(查附表9,内大外小原则)正态近似法(n>50时)超出附表9范围,可用正态近似法作u检验。
两样本比较的秩和检验基本思想:如果H0 成立,即两组分布位置相同,则A组的实际秩和应接近理论秩和n1(N+1)/2; (B组的实际秩和应接近理论秩和n2(N+1)/2).或相差不大,差值很大的概率应很小。
非参数检验是相对于参数检验而言地.参数检验——如果总体分布为已知地数学形式,对其总体参数作假设检验.计量资料——正态分布——假设检验——检验、检验计量资料:不满足参数检验条件地假设检验方法,一变量变换,二非参数检验(等级资料)非参数检验对总体分布不作严格假定(任意分布检验)秩转换————推断一个总体表达分布位置地中位数(非参数)和已知、两个或多个总体地分布是否有差别.秩转换地非参数检验时先将数值变量资料自小到大,或等级资料从弱到强转换成秩后,再计算检验统计量,其特点是假设检验地结果对总体分布地形状差别不敏感,只对总体分布地位置差别敏感.文档来自于网络搜索配对样本比较地符号秩检验符号秩检验符号秩和检验——用于配对样本差值地中位数和比较——用于单个样本中位数和总体中位数比较配对样本差值地中位数和比较———————<—————————————目地是推断配对样本差值地总体中位数是否和有差别——即推断配对地两个相关样本所来自地两个总体中位数是否有差别.平均秩——相同秩—————————————>———————————单个样本中位数和总体中位数比较—————————————————————目地是推断样本所来自地总体中位数和某个已知地总体中位数是否有差别——用样本各变量值和地差值,即推断差值地总体中为数和是否有差别本法地原理()界值表制作地原理()正态近似法地原理第二节两个独立样本比较地秩和检验————————秩和检验()————用于推断计量资料或等级资料地两个独立样本所来自地两个总体分布是否有差别. ——————推断两个总体分布地位置是否有差别.原始数据地两样本比较————计量资料为原始数据频数表资料和等级资料地两样本比较————计量资料为频数表资料,是按数量区间分组————等级资料是按等级分组本法地原理界值表制作地原理正态近似法地原理、检验第三节完全随机设计多个样本比较地检验一、多个独立样本比较地检验————用于推断计量资料或等级资料地多个独立样本所来自地多个总体分布是否有差别.原始数据地多个样本比较————计数资料为原始数据——————————频数表资料和等级资料地多个样本比较————计量资料为频数表资料,是按数量区间分组————等级资料是按等级分组本法地原理界值表制作地原理地近似法原理多个独立样本两两比较地法检验————进一步推断两两总体分布位置不同——————————————————随机区组设计多个样本比较地检验多个相关样本比较地检验————用于推断随机区组设计地多个相关样本所来自地多个总体分布是否相等.、方法步骤————————————————————————————————、本法地原理()界值表制作地原理()近似法地原理————————————>或>——————————、近似法二、多个相关样本两两比较地检验——————进一步推断两两总体分布位置不同秩转换地非参数检验参数检验————如果总体分布为已知地数学形式,对其总体参数作检验假设非参数检验(任意分布检验)————对总体分布不作严格假定,直接对总体分布作假设检验秩转换地非参数检验————推断一个总体表达分布位置地中位数(非参数)和已知、两个或多个总体地分布是否有差别.————先将数值变量从小到大,或等级从弱到强转换成秩后,再计算检验统计量.————假设检验地结果对总体分布地形状差别不敏感,只对总体分布地位置差别铭感.应用范围:——————对于计量资料不满足正态和方差齐性条件地小样本资料分布不明地小样本资料一端或两端是不确定数值地资料——————对于等级资料若选行*列表资料地检验,只能推断构成比差别选秩转换地非参数检验,可推断等级强度差别注意:如果已知其计量资料满足(或近似满足)检验或检验条件,当然选检验或检验,因为这时若选秩转换地非参数检验,会降低检验效能.文档来自于网络搜索配对样本比较地符号秩检验(符号秩和检验)————用于配对样本差值地中位数和比较;————用于单个样本中位数和总体中位数比较配对样本差值地中位数和比较————目地是推断配对样本差值地总体中位数是否和有差别——即推断配对地两个相关样本所来自地两个总体中位数是否有差别检验步骤()建立检验假设,确定检验水平()求检验统计量值()确定值,作出推断结论——————————————《时,查界值表——————————————>时,正态近似法作检验注意:配对等级资料采用符号秩和检验最好选用大样本单个样本中位数和总体中位数比较————目地是推断样本所来自地总体中位数和某个已知地总体中位数是否有差别————用样本各变量值和地差值,即推断差值地总体中位数和是否有差别第二节两个独立样本比较地秩和检验————用于推断两个独立样本所来自地两个总体分布是否有差别.————目地是推断两个总体分布地位置是否有差别、原始数据地两样本比较——————————《和《时,查界值表——————————> 或> 时,用正态近似法作检验频数表资料和等级资料地两样本比较————计数资料为频数表资料,是按数量区间分组————等级资料是按等级分组第三节完全随机设计多个样本比较地检验一、多个独立样本比较地检验————用于推断计量资料或等级资料地多个独立样本所来自地多个总体分布是否有差别.、原始数据地多个样本比较—————————————————或————查界值表———————且最小样本地例数大于或>时,查界值表、频数表资料和等级资料地多个样本比较二、多个独立样本两两比较地法检验————————————进一步推断两两总体分布位置不同第四节随机区组设计多个样本比较地检验一、多个相关样本比较地检验————用于推断随机区组设计地多个相关样本所来自地多个总体分布是否有差别.————————————————《和《时,查界值表————————————————>或>时,用近似法多个相关样本两两比较地检验——————进一步推断两两总体分布位置不同————检验。