非参数统计-总体分布的拟合优度检验
- 格式:ppt
- 大小:429.50 KB
- 文档页数:25
第四章 非参数统计实验参数统计学中的许多统计分析方法的应用对总体都有严格的假定,例如,t 检验要求总体服从正态分布,F 检验要求误差呈正态分布且各组方差为齐性的等等,然而在现实生活中,有许多总体的分布我们却是一无所知或知之甚少,所以在参数模型中所建立的统计推断就会失效,于是,人们希望在不假定总体分布的情况下,尽量从数据本身来获得所需要的信息。
这就是非参数统计的宗旨。
非参数统计方法简便,适用性强,但检验效率较低,应用时应加以考虑。
实验一 卡方检验(Chi-square test )实验目的:掌握卡方检验方法。
实验内容:一、2χ拟合优度检验 二、2χ独立性检验 三、2χ齐性检验 实验工具:SPSS 非参数统计分析菜单项和Crosstabs 菜单项。
知识准备:一、卡方拟合优度检验2χ检验(Chi —Square Test) 适用于拟合优度检验,适用于定类变量的检验问题,用来检验实际观察数目与理论期望数目是否有显著差异。
当检验问题是实际分布是否与理论分布相符合时,在大样本时也可以用分类数据的卡方检验来解决,这时的卡方检验也称为分布拟合的卡方检验。
若样本分为k 类,每类实际观察频数为k f f f ,,,21 ,与其相对应的期望频数为ke e e ,,,21 ,则检验统计量2χ可以测度观察频数与期望频数之间的差异。
其计算公式为:∑∑-=-==期望频数期望频数实际频数2122)()(ki ii i e e f χ很显然,实际频数与望频数越接近,2χ值就越小,若2χ=0,则上式中分子的每—项都必须是0,这意味着k 类中每一类观察频数与期望频数完全一样,即完全拟合。
2χ统计量可以用来测度实际观察频数与期望频数之间的拟合程度。
在H 0成立的条件下,样本容量n 充分大时,2χ统计量近似地服从自由度df =k-1的2χ分布,因而,可以根据给定的显著性水平α,在临界值表中查到相应的临界值)1(2-k αχ。
若)1(22-≥k αχχ,则拒绝H 0,否则不能拒绝H 0。
非参数统计分析――Nonparametric Tests菜单详解非参数统计分析――Nonparametric Tests菜单详解平时我们使用的统计推断方法大多为参数统计方法,它们都是在已知总体分布的条件下,对相应分布的总体参数进行估计和检验。
比如单样本u检验就是假定该样本所在总体服从正态分布,然后推断总体的均数是否和已知的总体均数相同。
本节要讨论的统计方法着眼点不是总体参数,而是总体分布情况,即研究目标总体的分布是否与已知理论分布相同,或者各样本所在的分布位置/形状是否相同。
由于这一类方法不涉及总体参数,因而称为非参数统计方法。
SPSS的的Nonparametric Tests菜单中一共提供了8种非参数分析方法,它们可以被分为两大类:1、分布类型检验方法:亦称拟合优度检验方法。
即检验样本所在总体是否服从已知的理论分布。
具体包括:Chi-square test:用卡方检验来检验二项/多项分类变量的几个取值所占百分比是否和我们期望的比例有没有统计学差异。
Binomial Test:用于检测所给的变量是否符合二项分布,变量可以是两分类的,也可以使连续性变量,然后按你给出的分界点一分为二。
Runs Test:用于检验样本序列随机性。
观察某变量的取值是否是围绕着某个数值随机地上下波动,该数值可以是均数、中位数、众数或人为制定。
一般来说,如果该检验P值有统计学意义,则提示有其他变量对该变量的取值有影响,或该变量存在自相关。
One-Sample Kolmogorov-Smirnov Test:采用柯尔莫哥诺夫-斯米尔诺夫检验来分析变量是否符合某种分布,可以检验的分布有正态分布、均匀分布、Poission分布和指数分布。
2、分布位置检验方法:用于检验样本所在总体的分布位置/形状是否相同。
具体包括:Two-Independent-Samples Tests:即成组设计的两独立样本的秩和检验。
Tests for Several Independent Samples:成组设计的多个独立样本的秩和检验,此处不提供两两比较方法。
参数、非参数检验操作步骤参数检验非参数检验对象针对参数做的假设针对总体分布情况做的假设使用范围等距数据和比例数据(度量)定类数据和定序数据(名义和有序)分布正态分布正态、非正态分布内容Means检验单样本T检验独立样本T检验配对样本T检验卡方检验(均匀分布)二项分布检验(两个变量)游程检验(随机分布)K-S检验(正态分布检验)参数检验一Means过程Means过程用于统计分组变量的的基本统计量,这些基本统计量包括:均值(Mean)、标准差(Standard Deviation)、观察量数目(Number of Cases)、方差(Variance)。
1数据编辑窗口输入分析的数据2 分析→比较均值→均值因变量、自变量的选择可根据实际情况。
“选项”3 结果分析P<0.05,拒绝原假设,显著性强。
结果报告,分别给出暴雨前和暴雨后卵量的统计量:暴雨前有13个样本,平均数122.3846,标准差15.95065,方差254.423; 暴雨后有13个样本,平均数104.4615,标准差15.10858,方差228.269;总体26个样本,平均数113.4231,标准差17.75426,方差315.214。
方差分析表,共有六列,第一列说明方差的来源,Between Groups是组间的,Within Groups 组内的,Total 总的。
第二列为平方和,其大小说明了各方差来源作用的大小。
第三列为自由度。
第四列为均方,即平方和除以自由度。
第五列F值是F统计量的值,其计算公式为模型均方除以误差均方,用来检验模型的显著性。
第六列是F统计量的显著值,由于这里的显著值0.007小于0.05,所以模型是显著的,降雨对卵量有显著影响。
二单一样本的T检验T检验是检验单个变量的均值与指定的检验值之间是否存在显著差异。
如:研究人员可能想知道一组学生的IQ平均分与100分的差异。
1 分析→比较均值→单一样本的T检验检验值中输入用于比较的均值(一般题目中会提供)。
几种常用的非参数检验在假设检验中,除了已知总体分布类型,对若干个未积压参数作统计检验的参数统计检验外,还有一类所谓非参数检验,非参数检验往往不假定总体的分布类型,直接对总体的分布的某种假设(例如如称性、分位数大小等等假设)作统计检验。
当然,上一节介绍的拟合优度检验也是非参数检验。
除了拟合优度检验外,还有许多常用的非参数检验。
最常见的非参数检验统计量有3类:计数统计量、秩统计量、符号秩统计量。
例6.1 某工厂为提高某种产品的质量,对生产工艺进行了改变。
为了检验新工艺下的产品是否比原工艺下的产品质量确有改进,随机地取一新产品和一旧产品作为一对进行比较,共比较了20对,记录如下(“+”表示新产品好,“-”表示旧产品好):+,-,-,+,+,+,+,+,-,+,+,+,-,+,+,+,+,+,+,+ 检验问题是0H :新旧产品质量一样:新产品比旧产品好1H ↔对此可用符号检验作单边检验。
用B 表示观测结果中+号的个数。
给定显著性水平α,找尽可能小的整数C 满足:0()P B C H α≥≤,取{,1,,20}W C C =+L 作为否定域,当且仅当B W ∈时拒绝。
若0H 0.05α=,查本书附表8知C=15。
由本例的实际结果算出,故否定,即认为新产品比旧产品在质量上确有改进。
1615B =>0H 例6.2 在对照实验中有两个总体:F (x )和G (x )。
1,,m X X L 是对照组的观测值,它们是来自F (x )的样本。
是处理组的观测值,它们是来自G(x )的样本。
检验问题是1,,n Y Y L 01:()():()()H F x G x H G x F x c ≡↔≡−(其中c>0,c 是处理效应)。
将1,,m X X L ,这m+n=N 个随机变量混在一起排序(从小到大排列),产生对应的秩:1,,n Y Y L11,,,,,m n Q Q R R L LWilcoxon 秩和统计量为1ni i W R ==∑直观上可以看出,若为真,则W 的值应该比较大。