第10章 非参数检验
- 格式:doc
- 大小:58.00 KB
- 文档页数:3
第10章非参数检验平时我们使用的统计推断方法大多为参数统计方法,它们都是在已知总体分布的条件下,对相应分布的总体参数进行估计和检验。
比如单样本u检验就是假定该样本所在总体服从正态分布,然后推断总体的均数是否和已知的总体均数相同。
本节要讨论的统计方法着眼点不是总体参数,而是总体分布情况,即研究目标总体的分布是否与已知理论分布相同,或者各样本所在的分布位置/形状是否相同。
由于这一类方法不涉及总体参数,因而称为非参数统计方法。
SPSS的Nonparametric Tests菜单中一共提供了8种非参数分析方法,它们可以被分为两大类:1、分布类型检验方法:亦称拟合优度检验方法。
即检验样本所在总体是否服从已知的理论分布。
具体包括:Chi-square test:用卡方检验来检验二项/多项分类变量的几个取值所占百分比是否和我们期望的比例有没有统计学差异。
Binomial Test:用于检测所给的变量是否符合二项分布,变量可以是两分类的,也可以使连续性变量,然后按你给出的分界点一分为二。
Runs Test:用于检验样本序列随机性。
观察某变量的取值是否是围绕着某个数值随机地上下波动,该数值可以是均数、中位数、众数或人为制定。
一般来说,如果该检验P值有统计学意义,则提示有其他变量对该变量的取值有影响,或该变量存在自相关。
One-Sample Kolmogorov-Smirnov Test:采用柯尔莫哥诺夫-斯米尔诺夫检验来分析变量是否符合某种分布,可以检验的分布有正态分布、均匀分布、Poission 分布和指数分布。
2、分布位置检验方法:用于检验样本所在总体的分布位置/形状是否相同。
具体包括:Two-Independent-Samples Tests:即成组设计的两独立样本的秩和检验。
Tests for Several Independent Samples:成组设计的多个独立样本的秩和检验,此处不提供两两比较方法。
第10章非参数检验
非参数检验是指在总体不服从正态分布或分布情况不明时,用来检验数据资料是否来自同一个总体假设的一类检验方法。
SPSS提供的非参数检验共有以下几种:
Chi-Square:卡方检验(举例data16-01,data16-02)
在前面介绍的方法中,往往都事先假定总体服从正态分布,然后对其均值或方差作检验。
但某个随机变量是否服从某种特定的分布是需要进行检验的。
可以根据以往的经验或实际的观测数据的分布情况,推测总体可能服从某种分布函数F(x),利用这些样本数据来具体检验该总体分布函数是否真的就是F(x)。
卡方检验(Chi-Square)就是这样一种用来检验给定的概率值下数据来自同一总体的无效假设的方法。
data16-01:掷一颗六面体300次,用1、2、3、4、5、6分别代表六面的六个点,试问这颗六面体是否均匀。
表16—1 300次掷一颗六面体实验观测结果
data16-02:100名健康成年女子血清总蛋白含量,试它是否服从正态分布。
Binomial:二项检验(举例data16-03)
二项分布检验(Binomial test)是一种用来检验在给定的落入二项式中第一项概率值的前提下数据来自二项分布的无效假设的方法。
(二项分布是从二分类总体抽得的随机样本中可能观察到的两类比例的抽样分布。
这就是说,它给出了在零假设成立时两类比例的各种可能值。
这里,零假设是指总体值为P的假设,当一项研究的“结果”可分为两类时,就可以用二项分布来检验零假设。
这种检验属于拟合优度型。
它告诉我们是否能够认为从样本中观察到的两类比例(或频数)来自于具有指定P值的总体。
)
data16-03:掷一枚球类比赛用的挑边器31次,出现A面、B面在上的次数见表16-3,取变量名为“tbh”,用数字型数据1代表“A”,用数字型数据1代表“B”,试问这枚挑边器是否均匀。
表16-3 31次掷一枚球类比赛用的挑边器实验观测结果
Runs:游程检验(举例data16-04)
例如,假定观察的结果用加、减号表示,得到一组这样的记录顺序:
++---++----++-+
我们总共观察到7个游程。
游程检验是指根据游程数所作的二分变量的随机性检验。
游程检验可用来检验样本的随机性,这对统计推断是很重要的,游程检验也可用来检验任何序列的随机性,而不管这个
序列是怎样产生的,此外还可用来判断两个总体的分布是否相同,从而检验出它们的位置中心有无显著差异。
data16-04:为了鉴别两种操作方法对劳动效率的影响,随机抽取12人用第一种操作法,10人用第二种操作法,对每人平均日产量记录,第一组的数据用数字型数据1表示,第二组的数据用数字型数据2表示,取变量名为“zb”。
试问两种操作方法对日产量影响有无显著差异。
1-S ample K-S:Kolmogorov-Smirnov 单样本检验(举例data16-05)
一个样本的柯尔莫哥洛夫-斯米诺夫检验(1-Sample Kolmogorov-Smirnov)是用来检验样本来自同一总体(Normal、Uniform、Poisson)的假设。
这也是一种拟合优度检验方法,它主要是运用某随机变量x的顺序样本来构造样本分布函数,使得能以一定的概率保证x 的分布函数F(x)落在某个范围内。
data16-05:芦瑟福与盖革作了一个著名的实验,他们观察了长为7.5秒的时间间隔里到达某个计数器的某块放射物质放出的α质点数,共观察了2608次。
下面是完整的实验记录,表中第1行给出的是质点数I,第2行表示有I个质点到达计数器的时间间隔数vi(每个时间间隔都是长为7.5秒)。
试问这种分布规律是否遵从泊松分布。
2 Independend Samples:两独立样本检验(举例data16-06)
有时样本隶属的总体的分布类型往往可能是不明的,但还是想知道在这种情况下两个独立样本间是否具有相同的分布,两独立样本检验就是用来处理此类问题的一种有效方法。
data16-06:设有甲、乙两种安眠药,用X表示失眠者服甲药后睡眠时间延长的时数;用y 表示失眠者服乙药后睡眠时间延长的时数。
20个患者,10人服甲药,10人服乙药。
现延长的睡眠时数的分布不明,试问这两种药物的疗效有无显著差异。
“ycss”表示睡眠时间延长的时数;“zb”表示组别,1表示甲药,2表示乙药。
表16-6 两种安眠药效果对比数据
K Independend Samples:K个独立样本的检验(举例data16-07)
上面所提到的两个独立样本检验是多个独立样本检验中最基本的形式,要解决多个独立样本间是否具有相同分布的问题,需借助于多个独立样本检验的方法。
data16-07:用四种不同的操作方法各作若干批试验,试验中优等品率%用“ydpl”表示,用“ff”表示操作方法,试问操作方法对产品优等品率是否有显著影响。
表16-7 四种不同操作方法的优等品率试验数据
2 Related Samples:两个相关样本的检验(举例data16-08)
从同一个被测试对象身上测试2个或多个观测值的情况,这样数据间就不再是相互独立的了,而是彼此相关,在此种情况下,检验样本间是否具有相同的分布,要用两个相关样本的检验。
data16-08:对某院15名男生进行实验,经过5个月的长跑锻炼后看其晨脉是否减少。
锻炼前后晨脉数据如下,试问锻炼前后晨脉有无显著差异。
锻炼前晨脉用“dlq”,锻炼后晨脉用“dlh”。
表16-8 长跑锻炼后晨脉变化
K Related Samples:K个相关样本的检验(举例data16-09)
上面所提到的两个相关样本检验是多个相关样本检验中最基本的形式,要解决多个相关样本间是否具有相同分布的问题,需借助于多个相关样本检验的方法。
data16-09:某日询问了9名顾客,请他们对3种款式的衬衣喜爱程度排次序(最喜爱给秩1,其次秩2,再其次秩3),结果如下,试问顾客对3种款式的衬衣的喜爱程度是否相同。
表16-9 顾客对不同款式服装喜爱程度。