第七章--spss非参数估计
- 格式:doc
- 大小:144.00 KB
- 文档页数:5
SPSS中非参数检验要领的施用一、Chello-SquareChello-Square是对单个样本作检验的推断要领,用于推断目前掌握的样本是否来自某特别指定分布总体,属拟合优度检验〔1〕。
要求供给假定总体的理论频数;默认总体为均匀分布时无需供给理论频数。
Chello-Square 过程通过阐发实际频数与理论频数吻合的程序来完成检验,是以特别适合于频数资料的阐发,也只接受和处理频数资料,如病人经疗治后治愈、好转、有用和失效的人次总的说来是否相同(实为治愈、好转、有用和失效的几率或时机是否相同),成就优、良、中、差的学出生次总的说来是否相同,赞同某种不雅点的人次总的说来是否达到80%,等等。
要求样本足够大,按不雅察值自小到大的挨次供给理论频数。
理论频数通过主会话框中Expected Values的Values选项供给,All categories equal是默认项,即均匀分布。
若只想推断样本中某一范围内的频数是否来自某种特别指定分布总体,可通过主会话框中Expected Range的Use speciffied range选项供给范围的上、下限。
上述理论频数需按照假定总体分布计较或需要解答的题目的实际配景确定。
二、BinomialBinomial过程对二值变量的单个样本作检验,推断总体中两类个别的比例是否分别为π和(1-π),π值通过Test Proportion选项供给,默认值是π=0.5〔2〕。
可借助于主会话框中Define Dichotomy的Cut point选项供给截断点,将持续变量转化成二值变量作阐发;若供给的变量已是二值变量,则不需供给截断点。
小样本时输出精确几率,大样本时输出正态近似法的结果。
显然,在大样本时,也可用Chello-Square过程完成。
3、RunsRuns过程借助样本序列的挨次推断总体序列的挨次是否是随机的,属随机性检验。
过程将变量转化成二值变量后再作检验,转化时所用截断点可所以Median、Mode、Mean或指定的数据,需通过Cut Point会话框指明截断点。
实验实训报告课程名称:统计分析与SPSS的应用开课学期: 2016-2017学年第2学期开课系(部):经济系开课实验(训)室: 10316 学生姓名:专业班级:学号:得分:重庆工商大学融智学院教务处制实验一均值比较与T检验一、实验目的通过本次实验,了解如何进行各种类型均值的比较与检验。
二、实验性质必修,基础层次三、主要仪器及试材计算机及SPSS软件四、实验内容1.MEANS 过程2.非参数单一样本检验3.非参数独立样本检验4.非参数配对样本检验五、实验学时2学时六、实验方法与步骤1.开机2.找到SPSS的快捷按纽或在程序中找到SPSS,打开SPSS3.打开一个已经存在的数据文件4.按要求完成上机作业;5. 关闭SPSS,关机。
七、实验注意事项1.实验中不轻易改动SPSS的参数设置,以免引起系统运行问题。
2.遇到各种难以处理的问题,请询问指导教师。
3.为保证计算机的安全,上机过程中非经指导教师和实验室管理人员同意,禁止使用移动存储器。
4.每次上机,个人应按规定要求使用同一计算机,如因故障需更换,应报指导教师或实验室管理人员同意。
5.上机时间,禁止使用计算机从事与课程无关的工作。
八、上机作业要求:请根据你的分析用Word写出你对以下六题的答案及解释,保存为“班级+姓名+学号.doc”1、课后习题第3题。
请将你的分析结果粘贴到此处,并给出你对分析结果的解释。
2、课后习题第4题。
请将你的分析结果粘贴到此处,并给出你对分析结果的解释。
3、课后习题第5题。
请将你的分析结果粘贴到此处,并给出你对分析结果的解释。
4、课后习题第7题。
请将你的分析结果粘贴到此处,并给出你对分析结果的解释。
5、第七章课后习题第1题。
请将你的分析结果粘贴到此处,并给出你对分析结果的解释。
(选做题)。
SPSS⾮参数检验实验⽬的:学会使⽤SPSS的简单操作,掌握⾮参数检验。
实验内容: 1.中位数符号检验,检验总体中位数是否等于某个假定的值。
设⼀个随机样本有n个数据,总体中位数的实际值为M,假设的总体中位数值为。
当样本中的数据⼤于假设的中位数时,⽤“+”号表⽰,⼩于假设的中位数时,⽤“-”表⽰;对于恰好等于假设的中位数的数据予以剔出。
若关⼼实际的M与假设的是否有差别,应建⽴假设:;计算检验统计量S+和S-。
S+表⽰每个样本数据与与差值符号为正的个数;S-表⽰每个样本数据与差值符号为负的个数。
计算P值并作出决策。
若P<,拒绝原假设。
2.Wilcoxon符号秩检验,检验总体参数(如中位数)是否等于某个假定的值。
它是对符号检验的⼀种改进,弥补了符号检验的不⾜,要⽐单纯的符号检验更准确⼀些(对应的参数检验—单样本均值检验)。
检验步骤:①计算各样本观察值与假定的中位数的差值,并取绝对值;②将差值的绝对值排序,并找出它们的秩;③计算检验统计量和P值,并作出决策。
3.独⽴样本的检验,Mann-Whitney检验不需要诸如总体服从正态分布且⽅差相同等之类的假设,但要求是两个独⽴随机样本的数据⾄少是顺序数据;Kruskal-Wallis检验不需要总体服从正态分布且⽅差相等这些假设。
该检验可⽤于顺序数据,也可⽤于数值型数据。
要检验k个总体是否相同,提出如下假设。
:所有总体都相同,:并⾮所有总体都相同或等价于,不全相同。
4.秩相关检验,对两个顺序变量之间相关程度的⼀种度量。
Spearman秩相关系数也称等级相关系数,记为,计算公式为,的取值范围为[-1,1];,两种排序之间完全相关;若,两种排序之间为负相关;若,两种排序之间为正相关;若,两种排序之间不相关;越趋于1,相关程度越⾼;越趋于0,相关程度越低。
实验步骤: 1.中位数符号检验SPSS操作,点击【分析】→【⾮参数检验】→【相关样本】,打开【⾮参数检验、两个或更多相关样本】对话框。
SPSS-⾮参数检验⾮参数检验(卡⽅(Chi-square)检验、⼆项分布(Binomial)检验、单样本K-S(Kolmogorov-Smirnov)检验、单样本变量值随机性检验(Runs Test)、两独⽴样本⾮参数检验、多独⽴样本⾮参数检验、两配对样本⾮参数检验、多配对样本⾮参数检验)参数检验:T检验、F检验等常⽤来估计或检验总体参数,统称为参数检验⾮参数检验:这种不是针对总体参数,⽽是针对总体的某些⼀般性假设(如总体分布)的统计分析⽅法称⾮参数检验1.总体分布的卡⽅(Chi-square)检验(Q统计量)定义:总体分布的卡⽅检验适⽤于配合度检验,是根据样本数据的实际频数推断总体分布与期望分布或理论分布是否有显著差异。
特点:⽐较适⽤于⼀个因素的多项分类数据分析。
总体分布的卡⽅检验的数据是实际收集到的样本数据,⽽⾮频数数据。
SPSS操作2.⼆项分布检验(Z统计量)⼆项分布:从这种⼆分类总体中抽取的所有可能结果,要么是对⽴分类中的这⼀类,要么是另⼀类,其频数分布称为⼆项分布⼆项分布检验:SPSS⼆项分布检验就是根据收集到的样本数据,推断总体分布是否服从某个指定的⼆项分布SPSS操作3.SPSS单样本变量值随机性检验(Z统计量)定义:单样本变量值的随机性检验是对某变量的取值出现是否随机进⾏检验,也称为游程检验(Run过程)SPSS操作4.SPSS单样本K-S检验(Z统计量)定义:单样本K-S检验是利⽤样本数据推断总体是否服从某⼀理论分布的⽅法,适⽤于探索连续型随机变量的分布形态SPSS操作5.两独⽴样本⾮参数检验定义:两独⽴样本的⾮参数检验是在对总体分布不很了解的情况下,通过分析样本数据,推断样本来⾃的两个独⽴总体分布是否存在显著差异。
⼀般⽤来对两个独⽴样本的均数、中位数、离散趋势、偏度等进⾏差异⽐较检验。
检验⽅法:①两独⽴样本的Mann-Whitney U检验(主要检验总体均值有没有显著差异)②两独⽴样本的K-S检验③两独⽴样本的游程检验④两独⽴样本的极端反应检验SPSS操作6.多独⽴样本⾮参数检验定义:多独⽴样本⾮参数检验分析样本数据是推断样本来⾃的多个独⽴总体分布是否存在显著差异SPSS多独⽴样本⾮参数检验⼀般推断多个独⽴总体的均值或中位数是否存在显著差异检验⽅法:①多独⽴样本的中位数检验②多独⽴样本的K-W检验③多独⽴样本的Jonkheere-Terpstra检验SPSS操作7.两配对样本⾮参数检验定义:两配对样本(2 Related Samples)⾮参数检验是在对总体分布不很清楚的情况下,对样本来⾃的两相关配对总体分别进⾏检验。
第七章非参数检验1、为分析不同年龄段人群对某商品满意程度的异同,进行随机调查收集到以下数据:请选择恰当的非参数检验方法,以恰当形式组织上述数据,分析不同年龄段人群对该商品满意程度的分布状况是否一致。
原假设:不同年龄段人群对该商品满意程度的分布无显著差异。
步骤:建立SPSS数据数据→加权个案→对频次进行加权→分析→非参数检验→旧对话框→两个独立样本→把年龄段导入分组变量、满意程度导入检验变量列表→确定表7-1检验统计量a满意程度最极端差别绝对值.121正.121负.000Kolmogorov-Smirnov Z 2.217渐近显著性(双侧).000a. 分组变量: 年龄段分析:从上表中可以看出,在显著水平为0.05下得到的sig值均为0.00<0.05,故拒绝原假设,即认为不同年龄段人群对该商品满意程度的分布存在显著差异。
2、利用习题二第6题数据,选择恰当的非参数检验方法,分析本次存款金额的总体分布与正态分布是否存在显著差异。
原假设:本次存款金额的总体分布与正态分布无显著差异步骤:分析→非参数检验→旧对话框→单个独立样本K-S检验→本次存款金额导入检验变量列表→正太分布检验→确定表7-2单样本 Kolmogorov-Smirnov 检验本次存款金额N282正态参数a,b均值4738.09标准差10945.569最极端差别绝对值.333正.292负-.333Kolmogorov-Smirnov Z 5.585渐近显著性(双侧).000a. 检验分布为正态分布。
b. 根据数据计算得到。
分析:如上表,在显著水平为0.05下得到的sig值均为0.00<0.05,故拒绝原假设,认为本次存款金额的分布与正太分布有显著差异。
3、利用习题二第6题数据,选择恰当的非参数检验方法,分析不同常住地人群本次存款金额的总体分布是否存在显著差异。
原假设:不同常住地人群本次存款金额的总体分布无显著差异。
步骤:分析→非参数检验→旧对话框→2个独立样本→常住地导入分组变量、本次存款金额导入检验变量列表→确定表7-3检验统计量a本次存款种类最极端差别绝对值.280正.000负-.280Kolmogorov-Smirnov Z 2.138渐近显著性(双侧).000a. 分组变量: 常住地分析:从图中可以看出,在显著水平为0.05下得到的sig值均为0.00<0.05,故拒绝原假设,认为不同常住地人群本次存款金额的总体分布存在显著差异。
第七章非参数检验
1、为分析不同年龄段人群对某商品满意程度的异同,进行随机调查收集到以下数据:请选择恰当的非参数检验方法,以恰当形式组织上述数据,分析不同年龄段人群对该商品满意程度的分布状况是否一致。
原假设:不同年龄段人群对该商品满意程度的分布无显著差异。
步骤:建立SPSS数据数据→加权个案→对频次进行加权→分析→非参数检验→旧对话框→两个独立样本→把年龄段导入分组变量、满意程度导入检验变量列表→确定
表7-1
检验统计量a
满意程度
最极端差别绝对值.121
正.121
负.000
Kolmogorov-Smirnov Z 2.217
渐近显著性(双侧).000
a. 分组变量: 年龄段
分析:从上表中可以看出,在显著水平为0.05下得到的sig值均为0.00<0.05,故拒绝原假设,即认为不同年龄段人群对该商品满意程度的分布存在显著差异。
2、利用习题二第6题数据,选择恰当的非参数检验方法,分析本次存款金额的总体分布与正态分布是否存在显著差异。
原假设:本次存款金额的总体分布与正态分布无显著差异
步骤:分析→非参数检验→旧对话框→单个独立样本K-S检验→本次存款金额导入检验变量列表→正太分布检验→确定
表7-2
单样本 Kolmogorov-Smirnov 检验
本次存款金额
N282
正态参数a,b均值4738.09
标准差10945.569
最极端差别绝对值.333
正.292
负-.333
Kolmogorov-Smirnov Z 5.585
渐近显著性(双侧).000
a. 检验分布为正态分布。
b. 根据数据计算得到。
分析:如上表,在显著水平为0.05下得到的sig值均为0.00<0.05,故拒绝原假设,认为本次存款金额的分布与正太分布有显著差异。
3、利用习题二第6题数据,选择恰当的非参数检验方法,分析不同常住地人群本次存款金
额的总体分布是否存在显著差异。
原假设:不同常住地人群本次存款金额的总体分布无显著差异。
步骤:分析→非参数检验→旧对话框→2个独立样本→常住地导入分组变量、本次存款金额导入检验变量列表→确定
表7-3
检验统计量a
本次存款种类
最极端差别绝对值.280
正.000
负-.280
Kolmogorov-Smirnov Z 2.138
渐近显著性(双侧).000
a. 分组变量: 常住地
分析:从图中可以看出,在显著水平为0.05下得到的sig值均为0.00<0.05,故拒绝原假设,认为不同常住地人群本次存款金额的总体分布存在显著差异。
4、利用习题二第6题数据,选择恰当的非参数检验方法,分析不同收入人群本次存款金额的总体分布是否存在显著差异。
原假设:不同收入人群本次存款金额的总体分布无显著差异。
步骤:分析→非参数检验→旧对话框→2个独立样本→不同收入人群导入分组变量、本次存款金额导入检验变量列表→确定
表7-4
检验统计量a
本次存款金额
最极端差别绝对值.361
正.006
负-.361
Kolmogorov-Smirnov Z 2.238
渐近显著性(双侧).000
a. 分组变量: 月收入水平
分析:在图中可以看出,在显著水平为0.05下得到的sig值均为0.00<0.05,所以拒绝原假设,即认为不同收入人群本次存款金额的总体分布存在显著差异。
5、选择恰当的非参数检验方法,对“裁判打分.sav”数据随机选取10%的样本,并以恰当形式重新组织数据后,分析不同国家裁判对运动员的打分标准是否一致。
原假设:不同国家裁判对运动员的打分标准无显著差异
步骤:数据→选择个案→随机个案样本→样本→大约10%所有个案→继续→确定
表7-5
描述性统计量
N均值标准差极小值极大值
意大利388.4947.809397.109.80
韩国388.8658.791947.409.90
罗马尼亚388.0632.767037.109.70
法国388.9395.627977.709.90
中国 38 8.0421 .67649 7.10 9.50 美国 38 8.8658 1.00143 7.00 10.00 俄罗斯
38
8.0737
.92113
7.00
9.80
步骤:挑选初选中的数据→国家和评分组建新的SPSS 数据→分析→非参数检验→多个独立样本检验→把评分导入检验量→把国家导入分组→确定 表7-6
秩
国家 N 秩均值 评分
意大利 38 134.26 韩国 38 166.03 罗马尼亚 38 97.22 法国 38 171.45 中国 38 96.54 美国 37 164.86 俄罗斯 37 97.05
总数
264
表7-7
表7-8
Jonckheere-Terpstra 检验a
评分 国家 中的水平数 7 N
264 J-T 观察统计量 13691.500 J-T 统计量均值
14934.500 J-T 统计量的标准差 708.825 标准J-T 统计量 -1.754 渐近显著性(双侧) .079
a. 分组变量: 国家
表7-9
检验统计量a
N 38 卡方 155.226 df
6 渐近显著性 .000
a. Friedman 检验
频率
国家
意大利韩国罗马尼亚法国中国美国俄罗斯评分> 中值2025112872512 <= 中值18132710311225表7-10
检验统计量b
评分
N264
中值8.5000
卡方43.248a
df6
渐近显著性.000
a. 0 个单元 (.0%) 具有小于 5 的期望频率。
单元最小期望频率为 17.9。
b. 分组变量: 国家
分析:根据上表,在秩检验和中值检验中,在显著水平为0.05下得到的sig值均为0.00,小于0.05,拒绝原假设,认为不同国家对其评分有显著影响。
但是在JTerpstra 检验中在显著水平为0.05下得到的sig值均为0.079,大于0.05,接受原假设,不同国家对其评分不具有显著影响。
6、为分析大众对牛奶品牌是否具有偏好性,随机挑选超市了收集其周一至周六各天三种品牌牛奶的日销售额数据,如下表:请选择恰当的非参数检验方法,以恰当形式组织上述数据进行分析,并说明分析结论。
原假设:日期与品牌的分布无显著差异
步骤:建立spss数据→加权个案→销售额进行加权→分析→非参数检验→两个独立样本检验→确定
表7-11::
秩
星期N秩均值
品牌12162.76
22383.80
33172.63
43277.83
52681.27
61667.16
总数149
表7-12
检验统计量a,b
品牌
卡方 4.469
df5
渐近显著性.484
a. Kruskal Wallis 检验
检验统计量a,b
品牌
卡方 4.469
df5
渐近显著性.484
a. Kruskal Wallis 检验
b. 分组变量: 星期
表7-13
频率
星期
1234567
品牌> 中值481010930 <= 中值1715212217130
表7-14
检验统计量b
品牌
N149
中值 2.00
卡方 2.787a
df5
渐近显著性.733
表7-15
Jonckheere-Terpstra 检验a
品牌
星期中的水平数6
N149
J-T 观察统计量4706.000
J-T 统计量均值4578.500
J-T 统计量的标准差281.561
标准J-T 统计量.453
渐近显著性(双侧).651
a. 分组变量: 星期
分析:根据上表7-11到7-15,在显著水平为0.05下得到的sig值均大于0.05,故接受原假设,认为日期与品牌的分布无显著差异。