非参数假设检验-第四次课新
- 格式:ppt
- 大小:3.87 MB
- 文档页数:90
假设检验(二)——非参数检验假设检验的统计方法,从其统计假设的角度可分为两类:参数检验与非参数检验。
上一节我们所介绍的Z 检验、t 检验,都是参数检验。
它们的共同特点是总体分布正态,并满足某些总体参数的假定条件。
参数检验就是要通过样本统计量去推断或估计总体参数。
然而,在实践中我们常常会遇到一些问题的总体分布并不明确,或者总体参数的假设条件不成立,不能使用参数检验。
这一类问题的检验应该采用统计学中的另一类方法,即非参数检验。
非参数检验是通过检验总体分布情况来实现对总体参数的推断。
非参数检验法与参数检验法相比,特点可以归纳如下:(1)非参数检验一般不需要严格的前提假设;(2)非参数检验特别适用于顺序资料;(3)非参数检验很适用于小样本,并且计算简单;(4)非参数检验法最大的不足是没能充分利用数据资料的全部信息;(5 )非参数检验法目前还不能用于处理因素间的交互作用。
非参数检验的方法很多,分别适用于各种特点的资料。
本节将介绍几种常用的非参数检验方法。
一.2检验2检验主要用于对按属性分类的计数资料的分析,对于数据资料本身的分布形态不作任何假设,所以从一定的意义上来讲,它是一种检验计数数据分布状态的最常用的非参数检验方法。
22检验的方法主要包括适合性检验和独立性检验。
(一)2检验概述2是实得数据与理论数据偏离程度的指标。
其基本公式为:2 ( f0 f e)(公式11—9)fe式中,f0 为实际观察次数,f e 为理论次数。
分析公式可知,把实际观测次数和依据某种假设所期望的次数(或理论次数)的差数平方,除以理论次数,求出比值,再将n 个比值相加,其和就是2。
观察公式可发现,如果实际观察次数与理论次数的差异越小, 2值也就越小。
当 f 0 与 f e 完全相同时,2值为零。
际次数与理论次数之差的大小而变化利用2值去检验实际观察次数与理论次数的差异是否显著的方法称为2检验有两个主要的作第一,可以用来检验各种实际次数与理论次数是否吻合的这类问题统称为适合性检验; 第二, 判断计数的两组或多组资料是否相互关联还是相互独立的问 题,这类问题统称为独立性检验。
第四章多样本数据检验在参数检验中,我们常常对三个或三个以上的总体的均值进行相等性检验,使用的方法是方差分析。
方差分析过程需要假定条件,F检验才有效。
可有时候所采集的数据常常不能满足这些条件。
像两样本比较时一样,我们不妨尝试将数据转化为秩统计量。
在非参数分析中也会遇到同样的问题,检验多个总体的分布是否相同。
更严密的说,当几个总体的分布相同的条件下,讨论其位置参数是否相等。
因为秩统计量的分布与总体分布无关,可以摆脱总体分布的束缚。
第一节 Kruskal-Wallis检验正态总体:第一节 Kruskal-Wallis检验基本原理:与处理两样本位置检验的W-M-W方法类似,将多个样本混合起来求秩,如果遇到打结的情况,采用平均秩,然后再按样本组求秩和。
将 k 组数据混合,并从小到大排列,列出等级,如有相同数据则取平均等级,如果原假设为不真,某个总体的位置参数太大,则其观测值也倾向于取较大的值,则该总体的观测值的秩和也会偏大。
一般总体:检验方法计算第i组的样本平均秩:对秩依照正态总体中MST的结构,得到Kruskal-Wallis的H统计量:在零假设情况下,H近似服从,当的时候拒绝零假设,p值为P(H≥h)。
大样本近似[例]为研究4种不同药物对儿童咳嗽的治疗效果,将25个体质相似的病人随机分为4组,各自采用A/B/C/D四种药物进行治疗,假定其他条件均保持相同。
5天后测量每个病人每天咳嗽次数如下,试比较这4种药物的治疗效果是否相同。
多重比较对比其中每两组差异的时候,用Dunn(1964)年提出用:其中如果那么表示i和j两组之间存在差异,,为标准正态分布分位数。
本节软件的注kw3>.test=function(m1=5,m2=5,m3=4,Hvalue=9.4114){m<-m1+m2+m3;Jh5=function(m){a<-rep(0,5);for(i in 1:(m-4)){for(j in (i+1):(m-3)){for(k in (j+1):(m-2)){for(l in (k+1):(m-1)){for(f in (l+1):m){a<-rbind(a,c(i,j,k,l,f))}}}}};a[2:nrow(a),]};JTid1<-Jh5(m1+m2+m3);n1<-nrow(JTid1);JTid2<-Jh5(m2+m3);n2<-nrow(JTid2);nn<-n1*n2;const<-1:m;y<-0;for(i in 1:n1){for(j in 1:n2){temp1<-c(JTid1[i,]);temp2<-(const[-temp1])[c(JTid2[j,])];temp3<-const[-c(temp1, temp2)];y<-c(y,12/(m*(m+1))*((sum(temp1))^2/m1+(sum(temp2))^2/m2+(sum(temp3))^2/m3)-3*(m+1))}};y<-y[2:(nn+1)];pvalue<-(sum(y>=Hvalue))/nn;y<-sort(y) ;aaa<-aa<-y[1];tempc<-1;for(i in 2:nn){if ((y[i]-aa)>10^{-12}){aaa<-c(aaa,y[i]);aa<-y[i];tempc<-c(t empc,1-(i-1)/nn)}};out<-cbind(aaa,tempc);List(c(;(m1,m2,m3); =c(m1.m2,m3), ;H; =Hvalue, ;pval; =pvalue),out)}改进kw.test=function(m1=5,m2=5,m3=4,Hvalue=9.4114){m<-m1+m2+m3;Jh5=function(m){a<-rep(0,5);for(i in 1:(m-4)){for(j in (i+1):(m-3)){for(k in (j+1):(m-2)){for(l in (k+1):(m-1)){for(f in (l+1):m){a<-rbind(a,c(i,j,k,l,f))}}}}};a[2:nrow(a),]};JTid1<-Jh5(m1+m2+m3);n1<-nrow(JTid1);JTid2<-Jh5(m2+m3);n2<-nrow(JTid2);nn<-n1*n2;const<-1:m;y=matrix(0,ncol=nn, nrow=1)for(i in 1:n1){for(j in 1:n2){temp1<-c(JTid1[i,]);temp2<-(const[-temp1])[c(JTid2[j,])];temp3<-const[-c(temp1,temp2)];y[(i-1)*n2+j]<-12/(m*(m+1))*((sum(temp1))^2/m1+(sum(temp2))^2/m2+(sum(temp3))^2/m3)-3*(m+1)}};pvalue<-(sum(y>=Hvalue))/nn;y<-sort(y);aaa<-aa<-y[ 1];tempc<-1;for(i in 2:nn){if ((y[i]-aa)>10^{-12}){aaa<-c(aaa,y[i]);aa<-y[i];tempc<-c(t empc,1-(i-1)/nn)}};out<-cbind(aaa,tempc);list(c(;(m1,m2,m3); =c(m1.m2,m3), ;H; =Hvalue, ;pval; =pvalue),out)}第二节正态记分检验*本节软件的注第三节 Jonckheere-Terpstra 检验在上一节中,我们只是考虑了备选假设无方向时的秩检验法,而在实际中有许多问题,其备选假设可能是有方向的。