非参数检验
- 格式:doc
- 大小:44.50 KB
- 文档页数:20
非参数检验的场景与方法非参数检验是一种统计方法,用于对数据进行假设检验,而不需要对数据的分布做出任何假设。
相比于参数检验,非参数检验更加灵活,适用于更广泛的场景。
本文将介绍非参数检验的场景和常用的方法。
一、非参数检验的场景非参数检验适用于以下场景:1. 数据不满足正态分布:在一些实际问题中,数据的分布可能不满足正态分布假设,例如长尾分布、偏态分布等。
此时,非参数检验可以更好地适应数据的特点。
2. 样本量较小:参数检验通常要求样本量较大,以保证统计推断的准确性。
而非参数检验对样本量的要求较低,即使样本量较小,也能得到可靠的结果。
3. 数据类型不同:非参数检验可以处理不同类型的数据,包括连续型数据、离散型数据和顺序型数据等。
4. 异常值存在:在一些实际问题中,数据中可能存在异常值,而参数检验对异常值较为敏感。
非参数检验对异常值的影响较小,能够更好地处理这种情况。
二、常用的非参数检验方法1. Wilcoxon符号秩检验:适用于两个相关样本的比较。
该方法将两个样本的差值取绝对值,并对差值进行秩次排序,然后计算秩次和。
通过比较秩次和与理论值的差异,判断两个样本是否存在显著差异。
2. Mann-Whitney U检验:适用于两个独立样本的比较。
该方法将两个样本的观测值合并,并对合并后的观测值进行秩次排序,然后计算秩次和。
通过比较秩次和与理论值的差异,判断两个样本是否存在显著差异。
3. Kruskal-Wallis检验:适用于多个独立样本的比较。
该方法将多个样本的观测值合并,并对合并后的观测值进行秩次排序,然后计算秩次和。
通过比较秩次和与理论值的差异,判断多个样本是否存在显著差异。
4. Friedman检验:适用于多个相关样本的比较。
该方法将多个样本的观测值合并,并对合并后的观测值进行秩次排序,然后计算秩次和。
通过比较秩次和与理论值的差异,判断多个样本是否存在显著差异。
5. Spearman相关系数检验:适用于两个变量之间的相关性分析。
非参数检验SPSS(中文版)统计分析实用教程(第版)电子工业出版社*第五章非参数检验SPSS(中文版)统计分析实用教程(第版)电子工业出版社*主要内容参数检验与非参数检验的比较单样本的非参数检验独立样本非参数检验相关样本的非参数检验SPSS(中文版)统计分析实用教程(第版)电子工业出版社*参数检验与非参数检验的比较参数检验和非参数检验的区别参数检验和非参数检验最本质的区别:参数检验需要事先确定或假定总体的分布非参数检验则不需要假定总体的分布而是直接用样本来推断总体的分布。
可以通过是否假定总体的分布来区分参数检验和非参数检验除此之外二者之间还可以从很多方面来区分。
()研究的对象和目标不同。
参数检验研究的是总体的参数不涉及总体的分布检验一旦总体的参数确定总体的分布也就确定了非参数检验的目标是直接从样本推导总体的分布或两个总体的分布是否相同。
()研究的统计量有所不同。
参数检验中很少用到秩来构造统计量无论样本量大小都能对总体进行推断非参数检验中常用秩、秩和等来构造统计量且常要求样本量较大。
SPSS(中文版)统计分析实用教程(第版)电子工业出版社*参数检验与非参数检验的比较非参数检验的优点()它对总体分布一般不做过多的限制性假设任何分布都可以用非参数检验进行研究从应用范围看其应用范围大于参数检验。
()由于非参数检验不依赖于总体的分布形式因而它天然具有稳健性特征。
()对资料的测量水平要求不高这给资料的搜集带来了很大的方便可以大大减轻统计资料的搜集工作量。
同时也为属性资料研究提供了广泛的基础。
()非参数检验比较直观很容易理解不需要太多数学知识和统计理论。
多数非参数检验的运算比较简单可以较快地取得统计结果。
非参数检验的上述优点表明在实际问题的研究中它是一种比较有用的统计方法。
SPSS(中文版)统计分析实用教程(第版)电子工业出版社*参数检验与非参数检验的比较非参数检验的缺点有些人主张用非参数检验取代参数检验这种看法有点偏激因为非参数检验毕竟存在着一些自身难以克服的不足表现在:()两者的效率有差距。
非参数检验主要处理定序资料这类资料的测量尺度比较低如果把那些能够用参数检验处理的资料转化为定类和定序资料必然会丢失检验数据的一部分信息因此非参数检验的有效性或检验效率不如参数检验。
()当样本容量比较大时非参数检验的计算也比较繁杂、困难。
()参数检验与非参数检验各有各的特点并非所有的参数检验都能转用非参数检验。
总之参数检验和非参数检验应该结合起来使用做到互相补充。
如果条件允许最好使用参数检验。
SPSS(中文版)统计分析实用教程(第版)电子工业出版社*主要内容参数检验与非参数检验的比较单样本的非参数检验独立样本非参数检验相关样本的非参数检验SPSS(中文版)统计分析实用教程(第版)电子工业出版社*单样本的非参数检验基本概念及设置单样本非参数检验使用一个或多个非参数检验方法来识别单个总体的分布情况不需要待检验的数据呈正态分布。
SPSS的单样本非参数检验方法包括卡方检验、二项分布检验、游程检验、KS检验及Wilcoxon符号检验五种。
在SPSS中单样本非参数检验的对话框有三个选项卡分别为“目标”、“字段”和“设置”。
SPSS(中文版)统计分析实用教程(第版)电子工业出版社*单样本的非参数检验基本概念及设置()“目标”选项卡:用于设置非参数检验的目标每个不同的选项对应于“设置”选项卡上不同的默认配置如图所示。
SPSS(中文版)统计分析实用教程(第版)电子工业出版社*单样本的非参数检验基本概念及设置()“字段”选项卡:用于设定待检验变量。
单击“字段”选项卡按图所示进行设置。
该选项卡主要由以下几部分组成。
SPSS(中文版)统计分析实用教程(第版)电子工业出版社*单样本的非参数检验基本概念及设置()“设置”选项卡:用于设定检验方法及对应的选项如图所示。
SPSS(中文版)统计分析实用教程(第版)电子工业出版社*单样本的非参数检验卡方检验.卡方检验的概念卡方检验(ChiSquareTest)法也称卡方拟合优度检验它是KPearson给出的一种最常用的非参数检验方法用于检验观测数据是否与某种概率分布的理论数值相符合进而推断观测数据是否来自于该分布的样本。
例如根据掷骰子试验中出现的点数检验骰子是否均匀即各点出现的概率是否均为。
卡方检验的原假设H:总体服从某种理论分布。
此外卡方检验还可对定性行列表资料的行列变量的独立性以及线性相关性(线性趋势)进行分析这部分内容可参见第章“交叉表分析”中的内容。
SPSS(中文版)统计分析实用教程(第版)电子工业出版社*单样本的非参数检验卡方检验.统计原理为检验实际分布是否与理论分布(期望分布)一致可采用卡方统计量典型的卡方统计量是Pearson卡方统计量其公式:SPSS(中文版)统计分析实用教程(第版)电子工业出版社*单样本的非参数检验卡方检验.分析步骤第步提出零假设。
卡方检验的零假设H:总体服从某种理论分布其对立假设H:总体不服从某种理论分布。
第步选择检验统计量。
卡方分布选择的是Pearson卡方统计量。
已证明当n充分大时它近似地服从自由度为k的卡方分布。
第步计算检验统计量的观测值和概率P值。
SPSS会根据式()自动计算统计值并依据分布表给出相应的相伴概率值P。
从式()可知如果值较大则说明观测频数分布与期望频数分布差距较大反之则说明观测频数分布与期望频数分布接近。
第步给出显著性水平作出决策。
如果显著性概率P值小于显著性水平则拒绝零假设认为样本来自的总体服从理论分布反之认为样本来自的总体分布与期望分布存在显著性差异。
SPSS(中文版)统计分析实用教程(第版)电子工业出版社*单样本的非参数检验卡方检验.卡方检验SPSS实例分析【例】某公司质检负责人欲了解企业一年内出现的次品数是否均匀分布在一周的五个工作日中随机抽取了件次品的原始记录其结果如表所示问该企业一周内出现的次品数是否均匀分布在一周的五个工作日中?工作日次品数SPSS(中文版)统计分析实用教程(第版)电子工业出版社*单样本的非参数检验卡方检验.卡方检验SPSS实例分析第步分析。
由于考虑的是次品是否服从均匀分布的问题故用卡方检验。
第步数据组织。
首先建立SPSS数据文件建立两个变量:“工作日”、“次品数”录入相应数据并保存。
(注意:“工作日”字段是度量标准为“有序”或“名义”的字符或数值类型“次品数”字段是度量标准为“标度”的数值类型。
)第步“次品数”字段加权处理。
通过分析“工作日”及“次品数”两个字段的含义及度量标准确定“工作日”为被分析字段而“次品数”表示各工作日出现的频数所以应该对“次品数”进行加权处理。
执行“数据”→“个案加权”打开“个案加权”对话框按图所示进行设置。
SPSS(中文版)统计分析实用教程(第版)电子工业出版社*单样本的非参数检验卡方检验.卡方检验SPSS实例分析第步单样本的非参数检验设置。
第步卡方检验的选项设置。
SPSS(中文版)统计分析实用教程(第版)电子工业出版社*单样本的非参数检验卡方检验.卡方检验SPSS实例分析第步主要结果及分析。
完成以上操作步骤后单击左图中的“确定”按钮运行结果如右图所示。
SPSS(中文版)统计分析实用教程(第版)电子工业出版社*单样本的非参数检验卡方检验.卡方检验SPSS实例分析第步主要结果及分析。
具体意义分析如下。
上页右图为单样本卡方检验的假设检验结果根据前面的设置给出了卡方检验的原假设“成绩等级的类别以指定概率发生”即认为新教员给出的成绩等级分布与其他教员相同其相伴概率值显著性概率P=说明应拒绝原假设因此图的“决策”给出“拒绝原假设”的决策。
SPSS(中文版)统计分析实用教程(第版)电子工业出版社*单样本的非参数检验二项分布检验.基本概念二项分布检验正是要通过样本数据检验样本来自的总体是否服从指定的概率为p的二项分布其零假设H是:样本来自的总体与指定的二项分布无显著性差异。
.统计原理二项分布检验在样本小于等于时按下式计算概率值:SPSS(中文版)统计分析实用教程(第版)电子工业出版社*单样本的非参数检验二项分布检验在大样本的情况下计算的是Z统计量认为在原假设下Z统计量服从正态分布其计算公式如下:当x小于n时取加号反之取减号p为检验概率n为样本总数。
SPSS(中文版)统计分析实用教程(第版)电子工业出版社*单样本的非参数检验二项分布检验二项分布检验亦是假设检验问题检验步骤同假设检验步骤。
SPSS会自动计算上述精确概率和近似概率值。
如果概率值小于显著性水平则拒绝原假设认为样本来自的总体与指定的二项分布有显著差异反之样本来自的总体与指定的二项分布无显著差异。
二项分布检验亦是假设检验问题检验步骤同假设检验步骤。
SPSS会自动计算上述精确概率和近似概率值。
如果概率值小于显著性水平.分析步骤SPSS(中文版)统计分析实用教程(第版)电子工业出版社*单样本的非参数检验二项分布检验SPSS实例分析【例】有名学生经过新型教学法后测试成绩如下表所示以分及以上为优秀请检验这名学生的优秀率是否达到了。
(参见数据文件:datasav。
)由于成绩仅分为优秀与非优秀两种状态而且测试的是优秀率是否达到了故应用二项分布检验。
第步数据的组织。
数据组织成一列其变量名为“成绩”输入数据并保存。
第步分析。
成绩SPSS(中文版)统计分析实用教程(第版)电子工业出版社*单样本的非参数检验二项分布检验SPSS实例分析第步单因素的非参数检验设置。
选择菜单“分析→非参数检验→单样本”打开“单样本非参数检验”对话框按以下步骤进行设置:()“目标”选项卡中选择“定制分析”()“字段”选项卡中选择“使用自定义字段分配”并将“成绩”字段选入“检验字段”()“设置”选项卡中选择“定制检验”并选中“比较实测二元概率和假设二元概率(二项检验)(O)”“检验选项”及“用户缺失值”保持默认选项。
第步进行二项分布检验选项设置。
单击“二项检验”对应的“选项”按钮打开“二项选项”对话框设置“假设比例”为选择“定义连续字段的成功值”中的“定制割点”选项并设置割点为。
SPSS(中文版)统计分析实用教程(第版)电子工业出版社*单样本的非参数检验二项分布检验SPSS实例分析第步主要结果及分析:二项式假设检验数据摘要单尾检测的相伴概率Sig=因此应拒绝零假设即小于分的学生所占的比例与总体分布存在显著差异即小于分的学生所占比例比小。
这说明优秀学生所占的比重是大于的。
SPSS(中文版)统计分析实用教程(第版)电子工业出版社*单样本的非参数检验游程检验.基本概念一个游程(Run)就是某序列中位于一种符号之前或之后的另一种符号持续的最大主序列或者说一个游程是指某序列中同类元素的一个持续的最大主集。
主要用于检验一个变量两个值的分布是否呈随机分布即检验前一个个案是否影响下一个个案的值如果没有影响这一组个案便是随机的。