第7章 SPSS非参数检验
- 格式:ppt
- 大小:3.45 MB
- 文档页数:1
SPSS应⽤之⾮参数检验统计学的假设检验可以分为参数检验和⾮参数检验,参数检验是根据⼀些假设条件推算⽽来,当这些假设条件⽆法满⾜的时候,参数检验的效能会⼤打折扣,甚⾄出现错误的结果,⽽⾮参数检验通常是没有假设条件的,因此应⽤范围⽐参数检验要⼴。
⾮参数检验在不做任何假设的情况下,最⼤限度的使⽤样本信息,利⽤统计学、数学的⽅法和技巧构造统计量并加以检验,在某些情况下,⾮参数检验⽐参数检验拥有更⾼的效能,尽管如此,我们也不能⼀味的使⽤⾮参数检验,毕竟参数检验更加严谨,通常都是在数据不符合参数检验的条件是,才使⽤⾮参数检验,因此,对于数据的前期观察是⾮常重要的。
⾮参数检验⽅法⾮常多,但是绝⼤部分⾮参数检验⽅法都是基于秩和结来构造统计量的,中⾮参数检验是⼀个独⽴的过程,也保留了旧对话框,新对话框按照样本情况分类,根据样本情况来选择⽅法,并且更倾向于⾃动化分析,旧对话框的分类则不是很明确,分我们按照新对话框来进⾏介绍分析—⾮参数检验—单样本⼀、单样本1.⼆项式检验⼆项式检验也称为⼆项分布检验,⽤来检验样本是否来⾃⼆项分布,也就是检查样本的观测值的频数与某⼀特定⼆项分布下的期望频数是否⼀致。
不仅可以针对于⼆分类变量,对于连续变量也可以当做⼆分类变量来处理,例如成绩的及格与否,产品的合格与否等。
本例中是想检验三门学科的及格率是否都在95%以上2.卡⽅检验卡⽅检验是最常⽤的多分类⾮参数检验,卡⽅统计量也⼴泛被其他检验所引⽤,卡⽅检验依据卡⽅分布,主要包括适应性检验和独⽴性检验,适应性检验⽤于检验实际观察频数与期望频数是否⼀致,独⽴性检验⽤于检验两组或多组计数资料是否相互独⽴。
3.K-S检验全称为Kolmogorov-Smirnow检验,在探索性中,也曾出现过⽤它来检验是否服从正态分布。
该检验属于⾮参数检验,⽤来检验某⼀单样本是否服从某⼀理论分布。
4.Wilcoxon符号秩检验该检验将符号和秩相结合,效能⽐单纯的符号检验和秩和检验都⾼,因此⽐较常⽤5.游程检验我们知道样本的随机性很重要,⽽游程检验就是⽤来检验样本数据是否是随机抽取的。
非参数检验-SPSS什么是非参数检验?非参数检验是一种统计假设检验方法,它不依赖于总体的任何假设条件,如总体分布的正态性、方差的同一性等。
与参数检验相比,非参数检验更加灵活,能够适应更多的数据情况。
为什么需要非参数检验?当我们的数据不满足正态分布等假设条件时,就需要使用非参数检验。
此外,非参数检验还有以下优点:1.不需要知道总体分布的具体形态,从而更加适用于实际情况2.对于离群值和极端值并不敏感3.数据缺失并不会影响检验结果SPSS中的非参数检验现在我们来介绍SPSS中的非参数检验。
1. Wilcoxon符号秩检验Wilcoxon符号秩检验旨在检验两组配对样本的中位数差异是否为零。
它的原假设是两组样本中位数相同。
首先,我们需要打开SPSS,导入数据集,然后点击菜单栏中的“数据”-“配对样本T检验”-“Wilcoxon符号秩检验”。
接下来,我们需要在弹出的对话框中选择配对变量,然后点击“OK”即可得到检验结果。
2. Mann-Whitney U检验Mann-Whitney U检验是一种非参数检验方法,用于检验两组独立样本的中位数是否相同。
它的原假设是两组样本中位数相同。
要进行Mann-Whitney U检验,我们需要打开SPSS,导入数据集,然后点击菜单栏中的“分析”-“非参数检验”-“2独立样本”。
接着,在弹出的对话框中选择两组样本的变量,并设置分析的方法为“Mann-Whitney U检验”。
最后点击“OK”即可得到检验结果。
3. Kruskal-Wallis检验Kruskal-Wallis检验是一种非参数检验方法,用于检验多个独立样本的中位数是否相同。
它的原假设是多组样本中位数相同。
要进行Kruskal-Wallis检验,我们需要打开SPSS,导入数据集,然后点击菜单栏中的“分析”-“非参数检验”-“Kruskal-Wallis检验”。
接着,在弹出的对话框中选择多组样本的变量,并点击“OK”即可得到检验结果。
学习必备欢迎下载总体分布未知,不会涉及有关总体分布的参数1.单样本非参数检验:卡方分布,二项分布,K-S检验,变量值随机性检验2.两独立样本非参数检验:两独立样本所来自的总体分布是否存在显著差异3.两配对样本非参数检验4.多独立样本非参数检验5.多配对样本非参数检验得到样本数据后,判断总体分布:直方图、P-P图、Q-Q图,或非参数检验1.1 卡方检验:根据样本数据,推断总体分布于期望分布或某一理论分布是否存在显著性差异,是一种吻合性检验,离散型数据。
原假设:样本来自总体的分布与期望分布或某一理论分布无显著性差异。
Eg:心脏病猝死人数与日期。
1.2二项分布检验:检验总体是否服从指定概率为P的二项分布,原假设:样本来自的总体与指定的二项分布无显著差异。
用于:二值型数据,性别,是否合格,是否为三好学生,硬币正反面等,用01表示。
注:检验概率值(检验比例)1.3单样本K-S检验:样本来自的总体是否与某一理论分布有显著差异,是一种拟合优度的检验方法。
用于:探索连续性变量的分布。
正态分布(normal)、均匀分布(uniform)、指数分布(ex.)、泊松分布。
原假设:样本来自的总体与指定的理论分布无显著差异。
另外,对于数据量很大的连续型变量,可以用图形直观判断。
P-P图:数据与理论分布一致时,各个数据点应落在对角线上。
Q-Q图:如果数据与理论分布无显著差异,点应分布在0横线附近。
(没找到啊?)2 Test type:Mann-Whitney: 秩:变量值排序的名次或位置K-S检验:游程检验Wald-wolfwitz Runs极端反应检验Moses Extreme Reactions:踢出极端值前后P值变化情况,是否踢出。
注:不同分析方法对同批数据的分析,结论可能不相同,要反复进行探索性分析,还要注意方法本身侧重点上的差异性。
4 中位数检验强调位置,Kruskal-Wallis检验侧重分析平均秩,Jonckheere比较同相对数。
《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第7章SPSS的非参数检验1、为分析不同年龄段人群对某商品满意程度的异同,进行随机调查收集到以下数据:满意程度年龄段青年中年老年很不满意126 297 156不满意306 498 349满意88 61 75很满意27 17 44请选择恰当的非参数检验方法,以恰当形式组织上述数据,分析不同年龄段人群对该商品满意程度的分布状况是否一致。
卡方检验步骤:(1)数据→加权个案→对“人数”加权→确定(2)分析→描述统计→交叉表格→行:满意度;列:年龄→Statistics→如图选择→确定满意程度 * 年龄交叉表计数年龄总计青年中年老年满意程度很不满意126 297 156 579 不满意306 498 349 1153满意88 61 75 224很满意27 17 44 88 总计547 873 624 2044卡方检验值自由度渐近显著性(双向)皮尔逊卡方66.990a 6 .000似然比(L) 68.150 6.000线性关联.0081.930McNemar-Bowker 检验. ..b有效个案数2044a. 0 个单元格 (0.0%) 具有的预期计数少于 5。
最小预期计数为 23.55。
b. 仅为 PxP 表格计算(其中 P 必须大于 1)。
因概率P值小于显著性水平(0.05),拒绝原假设,不同年龄度对该商品满意程度不一致。
2、利用第2章第7题数据,选择恰当的非参数检验方法,分析本次存款金额的总体分布与正态分布是否存在显著差异。
单样本K-S检验分析→非参数检验→旧对话框→1-样本-K—S…→选择相关项:本次存款金额[A5] →确定结果如下:单样本 Kolmogorov-Smirnov 检验本次存款金额数字282正态参数a,b平均值4738.09标准偏差10945.569最极端差分绝对.333正.292负-.333检验统计.333渐近显著性(双尾).000ca. 检验分布是正态分布。
SPSS⾮参数检验实验⽬的:学会使⽤SPSS的简单操作,掌握⾮参数检验。
实验内容: 1.中位数符号检验,检验总体中位数是否等于某个假定的值。
设⼀个随机样本有n个数据,总体中位数的实际值为M,假设的总体中位数值为。
当样本中的数据⼤于假设的中位数时,⽤“+”号表⽰,⼩于假设的中位数时,⽤“-”表⽰;对于恰好等于假设的中位数的数据予以剔出。
若关⼼实际的M与假设的是否有差别,应建⽴假设:;计算检验统计量S+和S-。
S+表⽰每个样本数据与与差值符号为正的个数;S-表⽰每个样本数据与差值符号为负的个数。
计算P值并作出决策。
若P<,拒绝原假设。
2.Wilcoxon符号秩检验,检验总体参数(如中位数)是否等于某个假定的值。
它是对符号检验的⼀种改进,弥补了符号检验的不⾜,要⽐单纯的符号检验更准确⼀些(对应的参数检验—单样本均值检验)。
检验步骤:①计算各样本观察值与假定的中位数的差值,并取绝对值;②将差值的绝对值排序,并找出它们的秩;③计算检验统计量和P值,并作出决策。
3.独⽴样本的检验,Mann-Whitney检验不需要诸如总体服从正态分布且⽅差相同等之类的假设,但要求是两个独⽴随机样本的数据⾄少是顺序数据;Kruskal-Wallis检验不需要总体服从正态分布且⽅差相等这些假设。
该检验可⽤于顺序数据,也可⽤于数值型数据。
要检验k个总体是否相同,提出如下假设。
:所有总体都相同,:并⾮所有总体都相同或等价于,不全相同。
4.秩相关检验,对两个顺序变量之间相关程度的⼀种度量。
Spearman秩相关系数也称等级相关系数,记为,计算公式为,的取值范围为[-1,1];,两种排序之间完全相关;若,两种排序之间为负相关;若,两种排序之间为正相关;若,两种排序之间不相关;越趋于1,相关程度越⾼;越趋于0,相关程度越低。
实验步骤: 1.中位数符号检验SPSS操作,点击【分析】→【⾮参数检验】→【相关样本】,打开【⾮参数检验、两个或更多相关样本】对话框。
SPSS-⾮参数检验⾮参数检验(卡⽅(Chi-square)检验、⼆项分布(Binomial)检验、单样本K-S(Kolmogorov-Smirnov)检验、单样本变量值随机性检验(Runs Test)、两独⽴样本⾮参数检验、多独⽴样本⾮参数检验、两配对样本⾮参数检验、多配对样本⾮参数检验)参数检验:T检验、F检验等常⽤来估计或检验总体参数,统称为参数检验⾮参数检验:这种不是针对总体参数,⽽是针对总体的某些⼀般性假设(如总体分布)的统计分析⽅法称⾮参数检验1.总体分布的卡⽅(Chi-square)检验(Q统计量)定义:总体分布的卡⽅检验适⽤于配合度检验,是根据样本数据的实际频数推断总体分布与期望分布或理论分布是否有显著差异。
特点:⽐较适⽤于⼀个因素的多项分类数据分析。
总体分布的卡⽅检验的数据是实际收集到的样本数据,⽽⾮频数数据。
SPSS操作2.⼆项分布检验(Z统计量)⼆项分布:从这种⼆分类总体中抽取的所有可能结果,要么是对⽴分类中的这⼀类,要么是另⼀类,其频数分布称为⼆项分布⼆项分布检验:SPSS⼆项分布检验就是根据收集到的样本数据,推断总体分布是否服从某个指定的⼆项分布SPSS操作3.SPSS单样本变量值随机性检验(Z统计量)定义:单样本变量值的随机性检验是对某变量的取值出现是否随机进⾏检验,也称为游程检验(Run过程)SPSS操作4.SPSS单样本K-S检验(Z统计量)定义:单样本K-S检验是利⽤样本数据推断总体是否服从某⼀理论分布的⽅法,适⽤于探索连续型随机变量的分布形态SPSS操作5.两独⽴样本⾮参数检验定义:两独⽴样本的⾮参数检验是在对总体分布不很了解的情况下,通过分析样本数据,推断样本来⾃的两个独⽴总体分布是否存在显著差异。
⼀般⽤来对两个独⽴样本的均数、中位数、离散趋势、偏度等进⾏差异⽐较检验。
检验⽅法:①两独⽴样本的Mann-Whitney U检验(主要检验总体均值有没有显著差异)②两独⽴样本的K-S检验③两独⽴样本的游程检验④两独⽴样本的极端反应检验SPSS操作6.多独⽴样本⾮参数检验定义:多独⽴样本⾮参数检验分析样本数据是推断样本来⾃的多个独⽴总体分布是否存在显著差异SPSS多独⽴样本⾮参数检验⼀般推断多个独⽴总体的均值或中位数是否存在显著差异检验⽅法:①多独⽴样本的中位数检验②多独⽴样本的K-W检验③多独⽴样本的Jonkheere-Terpstra检验SPSS操作7.两配对样本⾮参数检验定义:两配对样本(2 Related Samples)⾮参数检验是在对总体分布不很清楚的情况下,对样本来⾃的两相关配对总体分别进⾏检验。
SPSS非参数检验非参数检验 SPSS单样本非参数检验是对单个总体的分布形态等进行推断的方法,其中包括卡方检验、二项分布检验、K-S检验以及变量值随机性检验等方法。
参数检验与非参数检验的区别:参数检验是在总体分布形式已知的情况下,对总体分布的参数如均值、方差等进行推断的方法。
但是,在数据分析过程中,由于种种原因,人们往往无法对总体分布形态作简单假定,此时参数检验的方法就不再适用了。
非参数检验正是一类基于这种考虑,在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。
由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名为“非参数检验”。
一、几种常见的非参数检验1、总体分布的卡方检验卡方检验方法可以根据样本数据,推断总体分布与期望分布或某一理论分布是否存在显著差异,是一种吻合性检验,通常适于对有多项分类值的总体分布的分析。
它的原假设是:样本来自的总体分布与期望分布或某一理论分布无差异。
例如,医学家在研究心脏病人猝死人数与日期的关系时发现:一周之中,星期一心脏病人猝死者较多,其他日子则基本相当。
当天的比例近似为2.8:1:1:1:1:1:1。
现收集到心脏病人死亡日期的样本数据,推断其总体分布是否与上述理论分布相吻合。
2、二项分布检验SPSS的二项分布检验正是要通过样本数据检验样本来自的总体是否服从指定的概率为P的二项分布,其原假设是:样本来自的总体与指定的二项分布无显著差异。
在生活中有很多数据的取值是二值的,例如,人群可以分成男性和女性,产品可以分成合格和不合格,学生可以分成三好学生和非三好学生,投掷硬币实验的结果可以分成出现正面和出现反面等。
通常将这样的二值分别用1或0表示。
如果进行n次相同的实验,则出现两类(1或0)的次数可以用离散型随机变量X来描述。
如果随机变量X为1的概率设为P,则随机变量X值为0的概率Q便等于1-P,形成二项分布。
从某产品中随机抽取23个样品进行检测并得到检测结果。