当前位置:文档之家› (完整版)非参数统计(第二版)习题R程序

(完整版)非参数统计(第二版)习题R程序

(完整版)非参数统计(第二版)习题R程序
(完整版)非参数统计(第二版)习题R程序

P37.例2.1

build.price<-

c(36,32,31,25,28,36,40,32,41,26,35,35,32,87,33,35 );build.price

hist(build.price,freq=FALSE)#直方图

lines(density(build.price),col="red")#连线

#方法一:m<-mean(build.price);m#均值

D<-var(build.price)#方差

SD<-sd(build.price)#标准差S

t=(m-37)/(SD/sqrt(length(build.price)));t#t统计量计算检验统计量

t=

[1] -0.1412332

#方法二:t.test(build.price-37)#课本第38页

例2.2

binom.test(sum(build.price<37),length(build.price), 0.5)#课本40页

例2.3

P<-2*(1-pnorm(1.96,0,1));P

[1] 0.04999579

P1<-2*(1-pnorm(0.7906,0,1));P1

[1] 0.4291774

> 例2.4

> p<-2*(pnorm(-1.96,0,1));p

[1] 0.04999579

>

> p1<-2*(pnorm(-0.9487,0,1));p1

[1] 0.3427732

例2.5(P45)

scores<-

c(95,89,68,90,88,60,81,67,60,60,60,63,60,92, 60,88,88,87,60,73,60,97,91,60,83,87,81,90);length( scores)#输入向量求长度

ss<-c(scores-80);ss

t<-0

t1<-0

for(i in 1:length(ss)){

if (ss[i]<0) t<-t+1#求小于80的个数

else t1<-t1+1求大于80的个数

}

t;t1

> t;t1

[1] 13

[1] 15

binom.test(sum(scores<80),length(scores),0.75)

p-value = 0.001436<0.01

Cox-Staut趋势存在性检验P47

例2.6

year<-1971:2002;year

length(year)

rain<-

c(206,223,235,264,229,217,188,204,182,230,223, 227,242,238,207,208,216,233,233,274,234,227,221 ,214,

226,228,235,237,243,240,231,210)

length(rain)

#(1)该地区前10年降雨量是否变化?

t1=0

for (i in 1:5){

if (rain[i]

}

t1

k<-0:t1-1

sum(dbinom(k,5,0.5))# =0.1875

y<-6/(2^5);y# =0.1875

#(2)该地区前32年降雨量是否变化?

t=0

for (i in 1:16){

if (rain[i]

}

t

k1<-0:min(t,16-t)-1

sum(dbinom(k1,16,0.5))# =0.0002593994 pbinom(max(k1),16,0.5)#= 0.0002593994

y1<-(1+16)/(2^16);y1#=0.0002593994

plot(year,rain)

abline(v=(1971+2002)/2,col=2)

lines(year,rain)

anova(lm(rain~(year)))

随机游程检验(P50)

例2.8

client<-c("F","M","M","M","M","M","F","M", "M","F","M","M","M","M","F","M","F", "M","M","M","F","F","F","M","M","M");client

n<-length(client);n

n1<-sum(client=="M");n1

n0<-n-n1;n0

t1<-0

for (i in 1:(length(client)-1)){

if (client[i]==client[i+1]) t1<-t1

else t1<-t1+1

}

R<-t1+1;R#=12

#find rejection region(不写)

rl<-1+2*n1*n0/(n1+n0)*(1-1.96/sqrt(n1+n0));rl ru<-

2*n1*n0/(n1+n0)*(1+1.96/sqrt(n1+n0));ru#=15.3 3476(课本为ru=17)例2.9

shuju39<-data.frame(read.table

("SHUJU39.txt",header=TRUE));shuju39

attach(shuju39)

sum.a=0

sum.b=0

sum.c=0

for (i in 1:length(id)){

if (pinzhong[i]=="A") sum.a<-sum.a+chanliang[i] else if (pinzhong[i]=="B") sum.b<-

sum.b+chanliang[i]

else fuhao<-sum.c<-sum.c+chanliang[i]

}

sum.a;sum.b;sum.c

ma<-sum.a/4

mb<-sum.b/4

mc<-sum.c/4

ma;mb;mc

fuhao<-rep("a",12);fuhao

for (i in 1:length(id)){

if (pinzhong[i]=="A" & ((chanliang[i]-ma)>0)) fuhao[i]<-"+"

else if (pinzhong[i]=="B" & ((chanliang[i]-mb)>0)) fuhao[i]<-"+"

else if (pinzhong[i]=="C" & ((chanliang[i]-mc)>0)) fuhao[i]<-"+"

else fuhao[i]<-"-"

}

fuhao

#利用上题编程解决检验的随机性

n<-length(fuhao);n

n1<-sum(fuhao=="+");n1

n0<-n-n1;n0

t1<-0

for (i in 1:(length(fuhao)-1)){

if (fuhao[i]==fuhao[i+1]) t1<-t1

else t1<-t1+1

}

R<-t1+1;R

#find rejection region

rl<-1+2*n1*n0/(n1+n0)*(1-1.96/sqrt(n1+n0));rl

ru<-2*n1*n0/(n1+n0)*(1+1.96/sqrt(n1+n0));ru

例2.10(P52)library(quadprog)# 不存在叫

‘quadprog’这个名字的程辑包

library(zoo)# 不存在叫‘zoo’这个名字的程辑包

library(tseries)# 不存在叫‘tseries’这个名字的程

辑包

run1=factor(c(1,1,1,0,rep(1,7),0,1,1,0,0,rep(1,6),0,r ep(1,4),

0,rep(1,5),rep(0,4),rep(1,13)));run1

y=factor(run1)

runs.test(y)# 错误: 没有"runs.test"这个函数Wilcoxon符号秩检验

W+在零假设下的精确分布

#下面的函数dwilxonfun用来计算W+分布密度函数,即P(W+=x)的一个参考程序!

dwilxonfun=function(N){

a=c(1,1) #when n=1 frequency of W+=1 or o

n=1

pp=NULL #distribute of all size from 2 to N

aa=NULL #frequency of all size from 2 to N

for (i in 2:N){

t=c(rep(0,i),a)

a=c(a,rep(0,i))+t

p=a/(2^i) #density of Wilcox distribut when

size=N }

p

}

N=19 #sample size of expected distribution of W+ y<-dwilxonfun(N);y

#计算P(W+=x)中的x取值的R参考程序!!dwilxonfun=function(N){

a=c(1,1) #when n=1 frequency of W+=1 or o

n=1

pp=NULL #distribute of all size from 2 to N

aa=NULL #frequency of all size from 2 to N

for (i in 2:N){

t=c(rep(0,i),a)

a=c(a,rep(0,i))+t

p=a/(2^i) #density of Wilcox distribut when size=N

}

a

}

N=19 #sample size of expected distribution of W+ y<-dwilxonfun(N);length(y)-1

hist(y,freq=FALSE)

lines(density(y),col="red")

例2.12(P59)

ceo<-c(310,350,370,377,389,400,415,425,440,295, 325,296,250,340,298,365,375,360,385);length(ceo) #方法一

wilcox.test(ceo-320)

#方法二

ceo.num<-sum(ceo>320);ceo.num

n=length(ceo)

binom.test(ceo.num,n,0.5)

例2.13(P61)

a<-c(62,70,74,75,77,80,83,85,88)

walsh<-NULL

for (i in 1:(length(a)-1)){

for (j in (i+1):length(a)){

walsh<-c(walsh,(a[i]+a[j])/2)

}

}

walsh=c(walsh,a)

NW=length(walsh);NW

median(walsh)

2.5单组数据的位置参数置信区间估计(P61)

例2.14‘

stu<-c(82,53,70,73,103,71,69,

80,54,38,87,91,62,75,65,77);stu

alpha=0.05

rstu<-sort(stu);rstu

conff<-NULL;conff

n=length(stu);n

for(i in 1:(n-1)){

for (j in (i+1):n){

conf=pbinom(j,n,0.5)-pbinom(i,n,0.5)

if (conf>1-alpha){conff<-c(conff,i,j,conf)}

}

}

conff

length(conff)

min<-103-38;min

c<-seq(1,(length(conff)-1),3);c

for(i in c){

col<-c(rstu[conff[i]],rstu[conff[i+1]],conff[i+2]) min1<-rstu[conff[i+1]]-rstu[conff[i]]

if (min1

}

col1<-

c(rstu[conff[l]],rstu[conff[l+1]],conff[l+2]);col1 min

例2.14“

stu<-c(82,53,70,73,103,71,69,

80,54,38,87,91,62,75,65,77);stu

alpha=0.05

n=length(stu);n

conf=pbinom(n,n,0.5)-pbinom(0,n,0.5);conf for(k in 1:n){

conf=pbinom(n-k,n,0.5)-pbinom(k,n,0.5)

if (conf<1-alpha){loc=k-1;break}

}

print(loc)

(剩余的例题参考程序在课本)

3.6正态记分检验

例2.18

baby1<-c(4,6,9,15,31,33,36,65,77,88)

baby=(baby1-34);baby

baby.mean=mean(baby);baby.mean

例2.18

qiuzhi<-function(x){

n=length(x)

a=rep(2,n)

for (i in 1:n){

a[i]=sum(x<=x[i])

}

a

}

fuhao<-function(x,y){

n=length(x)

sgn=rep(2,n)

for(i in 1:n){

if (x[i]>y)

sgn[i]=1

else if (x[i]==y)

sgn[i]=0

else

sgn[i]=-1

}

sgn

}

n1<-length(baby)

babyzhi=qiuzhi(baby)

q=(n1+1+babyzhi)/(2*n1+2)

babysgn<-fuhao(baby,34)

babysgn=sign(baby1-34);babysgn

s=qnorm(q,0,1)

W<-t(s)%*%babysgn;W

sd<-sum((s*babysgn)^2);sd

T=W/sd;T

2.7分布的一致性检验

例2.19

shuju1<-data.frame(month=c(1:6), customers=c(27,18,15,24,36,30));shuju1 attach(shuju1)

n<-sum(customers);n

expect<-rep(1,6)*(1/6)*n;expect

x.squ=sum((customers-expect)^2)/25;x.squ

#方法一

value<-qchisq(1-0.05,length(customers)-1);value #方法二pvalue<-1-pchisq(x.squ,length(customers)-1);pvalue

例2.20

shuju2<-data.frame(chongshu=c(0:6),

zhushu=c(10,24,10,4,1,0,1));shuju2

attach(shuju2)

n=sum(zhushu);n

lamda<-sum(chongshu*zhushu)/n;lamda

p<-dpois(chongshu,lamda);p

n*p

x.squ=sum((zhushu^2)/(n*p))-n;x.squ

#方法一

value<-qchisq(1-0.05,length(zhushu)-1);value

#方法二

pvalue<-1-pchisq(x.squ,length(zhushu)-1);pvalue

例2.21

shuju3<-c(36,36,37,38,40,42,43,43,44,45,48,48, 50,50,51,52,53,54,54,56,57,57,57,58,58,58,58, 58,59,60,61,61,61,62,62,63,63,65,66,68,68,70, 73,73,75);shuju3

n=length(shuju3)

n0=sum(shuju3<30);n0

n1=sum(shuju3>30 & shuju3<=40);n1

n2=sum(shuju3>40 & shuju3<=50);n2

n3=sum(shuju3>50 & shuju3<=60);n3

n4=sum(shuju3>60 & shuju3<=70);n4

n5=sum(shuju3>70 & shuju3<=80);n5

n6=sum(shuju3>80);n6

nn<-c(n0,n1,n2,n3,n4,n5,n6);nn #计算45位学生体重分类的频数!

shuju3.mean=mean(shuju3);shuju3.mean

shuju3.var=var(shuju3);shuju3.var

shuju3.sd=sd(shuju3);shuju3.sd

e0=pnorm(30,shuju3.mean,shuju3.sd)

e1=pnorm(40,shuju3.mean,shuju3.sd)-

pnorm(30,shuju3.mean,shuju3.sd)

e2=pnorm(50,shuju3.mean,shuju3.sd)-

pnorm(40,shuju3.mean,shuju3.sd)

e3=pnorm(60,shuju3.mean,shuju3.sd)-

pnorm(50,shuju3.mean,shuju3.sd)

e4=pnorm(70,shuju3.mean,shuju3.sd)-

pnorm(60,shuju3.mean,shuju3.sd)

e5=pnorm(80,shuju3.mean,shuju3.sd)-

pnorm(70,shuju3.mean,shuju3.sd)

e6=1-pnorm(80,shuju3.mean,shuju3.sd)

e=c(e0,e1,e2,e3,e4,e5,e6);e

ee=n*c(e0,e1,e2,e3,e4,e5,e6);ee

x.squ=sum((nn^2)/(ee))-n;x.squ

#方法一

value<-qchisq(1-0.05,length(ee)-1);value

#方法二

pvalue<-1-pchisq(x.squ,length(ee)-1);pvalue

例2.22

healthy<-

c(87,77,92,68,80,78,84,77,81,80,80,77,92,86, 76,80,81,75,77,72,81,90,84,86,80,68,77,87,76,77,7 8,92,

75,80,78);healthy

ks.test(healthy,pnorm,80,6)

第三章

#Brown_Mood中位数

#Brown-Mood中位数检验程序

BM.test<-function(x,y,alt){

xy<-c(x,y)

md.xy<-median(xy) #利用中位数的检验 #md.xy<-quantile(xy,0.25) #利用p分位数的检

t<-sum(xy>md.xy)

lx<-length(x)

ly<-length(y)

lxy<-lx+ly

A<-sum(x>md.xy)

if (alt=="greater")

{w<-1-phyper(A,lx,ly,t)}

else if (alt=="less")

{w<-phyper(A,lx,ly,t)}

conting.table=matrix(c(A,lx-A,lx,t-A,ly-(t-A),ly,t,lxy-t,lxy),3,3)

https://www.doczj.com/doc/e513220958.html,<-c("X","Y","X+Y")

https://www.doczj.com/doc/e513220958.html,<-c(">MXY","

dimnames(conting.table)<-list(https://www.doczj.com/doc/e513220958.html,, https://www.doczj.com/doc/e513220958.html,) list(contingency.table=conting.table,p.vlue=w)

}

例3.2

X<-c(698,688,675,656,655,648,640,639,620)

Y<-c(780,754,740,712,693,680,621)

#方法一:

BM.test(X,Y,"less")

#方法二:

XY<-c(X,Y)

md.xy<-median(XY)

t<-sum(XY>md.xy)

lx<-length(X)

ly<-length(Y)

lxy<-lx+ly

A<-sum(X>md.xy)

#没有修正时的情形

pvalue1<-pnorm(A,lx*t/(lx+ly),

sqrt(lx*ly*t*(lx+ly-t)/(lx+ly)^3));pvalue1

#修正时的情形

pvalue2<-pnorm(A,lx*t/(lx+ly)-0.5,

sqrt(lx*ly*t*(lx+ly-t)/(lx+ly)^3));pvalue2

3.2、Wilcoxon-Mann-Whitney秩和检验

#求两样本分别的秩和的程序.

Qiuzhi<-function(x,y){

n1<-length(y)

yy<-c(x,y)

wm=0

for(i in 1:n1){

wm=wm+sum(y[i]>yy,1)

}

wm

}

例3.3

weight.low=c(134,146,104,119,124,161, 107,83,113,129,97,123)

m=length(weight.low)

weight.high=c(70,118,101,85,112,132,94)

n=length(weight.high)

#方法一:

wy<-Qiuzhi(weight.low,weight.high)##wy=50 wxy<-wy-n*(n+1)/2;wxy#=22

mean<-m*n/2

var<-m*n*(m+n+1)/12

pvalue<-1-2*pnorm(wxy,mean-0.5,var);pvalue

#方法二

wilcox.test(weight.high,weight.low)

例3.4 Mx-My的R参考程序:

x1<-c(140,147,153,160,165,170,171,193)

x2<-c(130,135,138,144,148,155,168)

n1<-length(x1)

n2<-length(x2)

th.hat<-median(x2)-median(x1)

B=10000

Tboot=c(rep(0,1000)) #vector of length Bootstrap

for (i in 1:B)

{

xx1=sample(x1,5,T) #sample of size n1 with replacement from x1

xx2=sample(x2,5,T) #sample of size n2 with replacement from x2

Tboot[i]=median(xx2)-median(xx1)

}

th<-median(Tboot);th

se=sd(Tboot)

Normal.conf=c(th+qnorm(0.025,0,1)*se,th-qnorm(0.025,0,1)*se);Normal.conf Percentile.conf=c(2*th-quantile(Tboot,0.975),2*th-quantile

(Tboot,0.025));Percentile.conf

Provotal.conf=c(quantile(Tboot,0.025),quantile(Tbo ot,0.975));Provotal.conf

th.hat

3.3、Mood方差检验

qiuzhi<-function(x,y){

xy<-c(x,y)

zhi<-NULL

for (i in 1:length(x)){

zhi<-c(zhi,sum(x[i]>=xy))

}

zhi

}

引例:

x1<-c(48,56,59,61,84,87,91,95)

x2<-c(2,22,49,78,85,89,93,97)

zhi_x1=qiuzhi(x1,x2);zhi_x1

#zhi_x2=qiuzhi(x2,x1);zhi_x2

#var_x1=var(x1);var_x1

#var_x2=var(x2);var_x2

m=length(x1);m

n=length(x2);n

mean_R=(m+n+1)/2;mean_R

mean1=m*(m+n+1)*(m+n-1)/12;mean1

var1=m*n*(m+n+1)*(m+n+2)*(m+n-2)/180;var1 M1=sum((zhi_x1-mean_R)^2);M1

p_value=2*pnorm(M1,mean1-0.5,sqrt(var1))

p_value

例3.5

X<-c(4.5,6.5,7,10,12)

Y<-c(6,7.2,8,9,9.8)

zhi_X=qiuzhi(X,Y);zhi_X

m=length(X);m

n=length(Y);n

mean_R=(m+n+1)/2;mean_R

mean2=m*(m+n+1)*(m+n-1)/12;mean2

var2=m*n*(m+n+1)*(m+n+2)*(m+n-2)/180;var2 M2=sum((zhi_X-mean_R)^2);M2

#方法一:查附表9

#方法二:

p_value=2*(1-pnorm(M2,mean2-0.5,sqrt(var2))) p_value

#方法三

Z=1/(sqrt(var2))*(M2-mean2+0.5);Z 3.4、Moses方差检验

qiuzhi<-function(x,y){

xy<-c(x,y)

zhi<-NULL

for (i in 1:length(x)){

zhi<-c(zhi,sum(x[i]>=xy))

}

zhi

}

例3.6

x1<-c(8.2,10.7,7.5,14.6,6.3,9.2,11.9,

5.6,12.8,5.2,4.9,13.5)

m1=length(x1);m1

x2<-c(4.7,6.3,5.2,6.8,5.6,4.2,

6.0,

7.4,

8.1,6.5)

m2=length(x2);m2

A<-matrix(x1,ncol=3);A#随机分组

a1=sample(x1,3,F)

xx2=NULL

for(i in 1:m1){

if(sum(a1==x1[i])==0) xx2=c(xx2,x1[i]) }

a2=sample(xx2,3,F)

xx3=NULL

for(i in 1:(m1-3)){

if(sum(a2==xx2[i])==0) xx3=c(xx3,x1[i]) }

a3=sample(xx3,3,F)

x11=sum((A[1,]-mean(x1))^2);x11

x12=sum((A[2,]-mean(x1))^2);x12

x13=sum((A[3,]-mean(x1))^2);x13

x14=sum((A[4,]-mean(x1))^2);x14

SSA<-c(x11,x12,x13,x14);SSA

B<-matrix(x2[1:9],ncol=3);B

y11=sum((B[1,]-mean(x2))^2);y11

y12=sum((B[2,]-mean(x2))^2);y12

y13=sum((B[3,]-mean(x2))^2);y13

SSB<-c(y11,y12,y13);SSB

zhi_SSA=qiuzhi(SSA,SSB);zhi_SSA

zhi_SSB=qiuzhi(SSB,SSA);zhi_SSB

S=sum(zhi_SSA);S

TM=S-4*(4+1)/2;TM

#方法一(查附表4)

拒绝域C=(TM

TM>W(0.975,m1,m2))

其中W(0.975,m1,m2)=m1*m2-W(0.025,m1,m2). #方法二(Wilcoxon秩和检验)

wilcox.test(SSA,SSB)

#方法二(Mann-Whitney秩和检验)

m=length(SSA);m

n=length(SSB);n

mean_AB=m*n/2;mean_AB

var_AB=m*n*(m+n+1)/12;var_AB

p_value=1-

pnorm(S,mean_AB,sqrt(var_AB));p_value

第四章

4.1、试验设计和方差分析的基本概念回顾

#R软件中单因素方差分析的函数

例4.1

#方法一:

****Analysis of Variance Model ****

y<-

c(2.0,1.4,2.0,2.8,2.4,1.9,1.8,2.5,2.0,1.5,2.1,2.2);y lever<-

c("B","A","C","C","B","A","B","C","A","A","C","B") x<-factor(lever);x

xy<-data.frame(y,x)

attach(xy)

aov(formula=y~x,data=xy)

aov.xy<-aov(formula=y~x,data=xy)

summary(aov.xy)

#方法二:

x1<-c(1.4,1.9,2.0,1.5)

x2<-c(2.0,2.4,1.8,2.2)

x3<-c(2.6,2.8,2.5,2.1)

y<-c(x1,x2,x3);y

y.mean<-mean(y);y.mean

ssT<-sum((y-y.mean)^2);ssT #计算总的平方和

x1.mean<-mean(x1)

x2.mean<-mean(x2)

x3.mean<-mean(x3)

sse<-sum(sum((x1-x1.mean)^2),

sum((x2-x2.mean)^2),sum((x3-x3.mean)^2));sse #计算误差平方和

sst<-ssT-sse;sst #计算组间平方和

F<-(sst/2)/(sse/(length(y)-3));F #计算方差分析的F 检验统计量

#临界值的计算

value<-qf(0.95,2,length(y)-3);value

#计算p-value值

p.value<-1-pf(8,2,length(y)-3);p.value

表4.5

xueye<-c(8.4,9.4,9.8,12.2,

10.8,15.2,9.8,14.4,8.6,9.8,10.2,9.8,

8.8,9.8,8.9,12.0,8.4,9.2,8.5,9.5);xueye

sst1<-sum((xueye-mean(xueye))^2);sst1

a=matrix(xueye,ncol=5);a

quzu<-apply(a,2,sum);quzu

chuli<-apply(a,1,sum);chuli

k=5

b=4

ssb=1/4*sum(quzu^2)-sum(quzu)^2/(k*b);ssb sst=1/5*sum(chuli^2)-sum(chuli)^2/(k*b);sst sse=sst1-ssb-sst;sse

mssb=ssb/(k-1);mssb

msst=sst/(b-1);msst

msse=sse/(k*b-k-b+1);msse

F1=mssb/msse;F1

F2=msst/msse;F2

value1=qf(1-0.05,k-1,k*b-k-b+1)

value2=qf(1-0.05,b-1,k*b-k-b+1)

例4.3

qiuzhi<-function(w,x,y,z){

xy<-c(w,x,y,z)

zhi<-NULL

for (i in 1:length(w)){

zhi<-c(zhi,sum(w[i]>=xy))

}

zhi

}

a<-c(80,203,236,252,284,368,457,393)

b<-c(133,180,100,160)

c<-c(156,295,320,448,465,481,279)

d<-c(194,214,272,330,386,475)

azhi=qiuzhi(a,b,c,d);azhi

bzhi=qiuzhi(b,a,c,d);bzhi

czhi=qiuzhi(c,a,b,d);czhi

dzhi=qiuzhi(d,a,b,c);dzhi H=12/(n*(n+1))*(sum(azhi)^2/length(a)+sum(bzhi )^2/length(b)

+sum(czhi)^2/length(c)+sum(dzhi)^2/length(d))-(3*(n+1))

方法一:value=qchisq(1-0.05,3);value

方法二:pvalue=1-pchisq(H,3);pvalue

mean=c(mean(a),mean(b),mean(c),mean(d))

#两两比较的程序

bjiao=function(azhi,bzhi,czhi,dzhi){

{n=length(c(azhi,bzhi,czhi,dzhi))

av=sum(azhi)/length(azhi)

bv=sum(bzhi)/length(bzhi)

se=sqrt(n*(n+1)/12*(1/length(azhi)+1/length(bzhi) ))

d=abs(av-bv)

dab=d/se

huizong=c(d,se,dab,qnorm(1-0.05,0,1))}

huizong

}

bjiao(azhi,bzhi,czhi,dzhi)

bjiao(czhi,dzhi,azhi,bzhi)

4.3、Jonckheere-Terpstra检验

例4.5

x=c(125,136,116,101,105,109)

y=c(122,114,131,120,119,127)

z=c(128,142,128,134,135,131,140,129)

xm=mean(x);xm

ym=mean(y);ym

zm=mean(z);zm

g=c(rep(1,6),rep(2,6),rep(3,8))

tapply(c(x,y,z),g,median)

JT.test(data=t(c(x,y,z)),class=g)

Wij<-function(x,y){

n1=length(y)

zhiij<-0

for(i in 1:n1){

zhiij=zhiij+sum(x

}

zhiij

}

w12=Wij(x,y);w12

w13=Wij(x,z);w13

w23=Wij(y,z);w23

#方法一:通过查表决策!#

W=sum(w12,w13,w23);W

#方法二:通过中心极限定律决策!#

N=length(c(x,y,z))

n1=length(x)

n2=length(y)

n3=length(z)

E=(N^2-sum(n1^2,n2^2,n3^2))/4;E #计算J的数学期望#

f1=function(n){f=n^2*(2*n+3)}

Var=(f1(N)-sum(f1(n1),f1(n2),f1(n3)))/72;Var

sd.Var=sqrt(Var);sd.Var #计算J的方差和标准差#

z1=(W-E)/sd.Var;z1 #可以通过拒绝域来决策#

pvalue=2*(1-pnorm(z,0,1));pvalue #可以通过pvalue值来决策#

例4.6

jie=function(x,y){{

jiedian<-NULL

shuju<-NULL

xy<-c(x,y)

y1<-unique(y)

for (i in 1:length(y1)){ if(sum(xy==y1[i])>1)

{jiedian<-c(jiedian,sum(xy==y1[i]))

shuju<-c(shuju,y1[i])

}

}

j=c(jiedian,shuju)

#shuju 输出是那些数据打结#

}

j

}

a=c(40,35,38,43,44,41)

b=c(38,40,47,44,40,42)

c=c(48,40,45,43,46,44)

jie12=jie(a,b);jie12

jie13=jie(a,c);jie13

jie23=jie(b,c);jie23

#例4.7(P128)

qiuzhi=function(x){

n1=length(x)

n2=length(unique(x))

zhi=NULL

if (n1==n2){

for (i in 1:n1){

zhi=c(zhi,sum(x<=x[i]))

}

}

else{

for (i in 1:n1){

zhi=c(zhi,mean(sum(x

}

zhi

}

jiedian=function(x1){

n1=length(x1)

x2=unique(x1)

n2=length(x2)

jie=NULL

for(i in 1:n2){

n=sum(x1==x2[i])

if (n>1) jie=c(jie,n)

}

jie

}

a1=c(85,82,82,79)

a2=c(87,75,86,82)

a3=c(90,81,80,76)

a4=c(80,75,81,75)

zhi1=qiuzhi(a1);zhi1

zhi2=qiuzhi(a2);zhi2

zhi3=qiuzhi(a3);zhi3

zhi4=qiuzhi(a4);zhi4

a1=t(matrix(c(zhi1,zhi2,zhi3,zhi4),ncol=4));a1 b1=apply(a1,2,sum);b1

b=4

k=4

Q=12/(b*k*(k+1))*sum(b1^2)-3*b*(k+1);Q jie1=jiedian(a1);jie1

jie2=jiedian(a2);jie2

jie3=jiedian(a3);jie3

jie4=jiedian(a4);jie4

jien=c(jie1,jie2,jie3,jie4);jien

jienn=sum(jien^3-jien);jienn

t1=b*k*(k^2-1);t1

Qc=Q/(1-jienn/t1);Qc 5.3、Fisher精确性检验

setwd("")

getwd()

例5.3

medicine<-matrix(c(8,2,7,23),,2,byrow=T) medicine

fisher.test(medicine)

chisq.test(medicine)

非参数统计题目及答案

1.人们在研究肺病患者的生理性质时发现,患者的肺活量与他早在儿童时期是否接受过某种治疗有关,观察3组病人,第一组早在儿童时期接受过肺部辐射,第二组接受过胸外科手术,第三组没有治疗过,现观察到其肺活量占其正常值的百分比如下: 这一经验是否可靠。 解: H 0:θ2≤θ1≤θ 3 H 1 :至少有一个不等式成立 可得到 N=15 由统计量H= ) 112 +N N (∑=K i i N R 1i 2 -3(N+1)=)(1151512+(32×6.4+29×5.8+59×11.8)-3×(15+1)=5.46 查表(5,5,5)在P(H ≥4.56)=0.100 P(H ≥5.66)=0.0509 即P (H ≥5.46)﹥0.05 故取α=0.05, P ﹥α ,故接受零假设即这一检验可靠。

2.关于生产计算机公司在一年中的生产力的改进(度量为从0到100)与它们在过去三年中在智力投资(度量为:低,中等,高)之间的关系的研究结果列在下表中: 值等等及你的结果。(利用Jonkheere-Terpstra 检验) 解: H 0:M 低=M 中=M 高 H 1:M 低﹤M 中﹤M 高 U 12=0+9+2+8+10+9+10+2+10+10+8+0.5+3=82.5 U 13=10×8=80 U 23=12+9+12+12+12+11+12+11=89 J= ∑≤j ij U i =82.5+80+89=251.5 大样本近似 Z= []72 )32()324 1 2 1i 22 2∑ ∑==+-+--k i i i k i n n N N n N J ()(~N (0,1) 求得 Z=3.956 Ф(3.956)=0.9451 取α=0.05 , P >α, 故接受原假设,认为智力投资对改进生产力有帮助。

医学统计学总复习练习题(含答案)

医学统计学总复习练习题(含答案)

一、最佳选择题 1.卫生统计工作的步骤为 C A.统计研究调查、搜集资料、整理资料、分析资料 B.统计资料收集、整理资料、统计描述、统计推断 C.统计研究设计、搜集资料、整理资料、分析资料 D.统计研究调查、统计描述、统计推断、统计图表 E.统计研究设计、统计描述、统计推断、统计图表 2.统计分析的主要内容有 D A.统计描述和统计学检验 B.区间估计与假设检验 C.统计图表和统计报告 D.统计描述和统计推断 E.统计描述和统计图表 3.统计资料的类型包括E A.频数分布资料和等级分类资料 B.多项分类资料和二项分类资料 C.正态分布资料和频数分布资料 D.数值变量资料和等级资料 E.数值变量资料和分类变量资料 4.抽样误差是指 B A.不同样本指标之间的差别 B.样本指标与总体指标之间由于抽样产生的差别 C.样本中每个体之间的差别 D.由于抽样产生的观测值之间的差别 E.测量误差与过失误差的总称 5.统计学中所说的总体是指 B A.任意想象的研究对象的全体 B.根据研究目的确定的研究对象的全体 C.根据地区划分的研究对象的全体 D.根据时间划分的研究对象的全体 E.根据人群划分的研究对象的全体 6.描述一组偏态分布资料的变异度,宜用 D A.全距 B.标准差 C.变异系数 D.四分位数间距 E.方差7.用均数与标准差可全面描述其资料分布特点的是 C A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.对称分布 E.任何分布 8.比较身高和体重两组数据变异度大小宜采用 A A.变异系数 B.方差 C.极差 D.标准差 E.四分位数间距 9.频数分布的两个重要特征是 C A.统计量与参数 B.样本均数与总体均数 C.集中趋势与离散趋势 D.样本标准差与总体标准差 E.样本与总体 10.正态分布的特点有 B A.算术均数=几何均数 B.算术均数=中位数 C.几何均数=中位数 D.算术均数=几何均数=中位数 E.以上都没有

非参数统计部分课后习题参考答案

课后习题参考答案 第一章p23-25 2、(2)有两组学生,第一组八名学生的成绩分别为x 1:100,99,99,100,99,100,99,99;第二组三名学生的成绩分别为x 2:75,87,60。我们对这两组数据作同样水平a=0.05的t检验(假设总体均值为u ):H 0:u=100 H 1:u<100。第一组数据的检验结果为:df=7,t 值为3.4157,单边p 值为0.0056,结论为“拒绝H 0:u=100。”(注意:该组均值为99.3750);第二组数据的检验结果为:df=2,t 值为3.3290,单边p值为0.0398;结论为“接受H 0:u=100。”(注意:该组均值为74.000)。你认为该问题的结论合理吗?说出你的理由,并提出该如何解决这一类问题。 答:这个结论不合理(6分)。因为,第一组数据的结论是由于p-值太小拒绝零假设,这时可能犯第一类错误的概率较小,且我们容易把握;而第二组数据虽不能拒绝零假设,但要做出“在水平a时,接受零假设”的说法时,还必须涉及到犯第二类错误的概率。(4分)然而,在实践中,犯第二类错误的概率多不易得到,这时说接受零假设就容易产生误导。实际上不能拒绝零假设的原因很多,可能是证据不足(样本数据太少),也可能是检验效率低,换一个更有效的检验之后就可以拒绝了,当然也可能是零假设本身就是对的。本题第二组数据明显是由于证据不足,所以解决的方法只有增大样本容量。(4分) 第三章p68-71 3、在某保险种类中,一次关于1998年的索赔数额(单位:元)的随机抽样为(按升幂排列): 4632,4728,5052,5064,5484,6972,7596,9480,14760,15012,18720,21240,22836,52788,67200。已知1997年的索赔数额的中位数为5064元。 (1)是否1998年索赔的中位数比前一年有所变化?能否用单边检验来回答这个问题?(4分) (2)利用符号检验来回答(1)的问题(利用精确的和正态近似两种方法)。(10分) (3)找出基于符号检验的95%的中位数的置信区间。(8分) 解:(1)1998年的索赔数额的中位数为9480元比1997年索赔数额的中位数5064元是有变化,但这只是从中位数的点估计值看。如果要从普遍意义上比较1998年与1997年的索赔数额是否有显著变化,还得进行假设检验,而且这个问题不能用单边检验来回答。(4分) (2)符号检验(5分) 设假设组:H 0:M =M 0=5064 H 1:M ≠M 0=5064 符号检验:因为n +=11,n-=3,所以k=min(n+,n-)=3 精确检验:二项分布b(14,0.5), ∑=-=3 0287 .0)2/1,14(n b ,双边p-值为0.0576,大于a=0.05, 所以在a水平下,样本数据还不足以拒绝零假设;但假若a=0.1,则样本数据可拒绝零假设。查二项分布表得a=0.05的临界值为(3,11),同样不足以拒绝零假设。 正态近似:(5分) np=14/2=7,npq=14/4=3.5 z=(3+0.5-7)/5.3≈-1.87>Z a/2=-1.96 仍是在a=0.05的水平上无法拒绝零假设。说明两年的中位数变化不大。 (3)中位数95%的置信区间:(5064,21240)(8分) 7、一个监听装置收到如下的信号:0,1,0,1,1,1,0,0,1,1,0,0,0,0,1,1,1,1,1,1,1,1,1,0,1,0,0,1,1,1,0,1,0,1,0,1,0,0,0,0,0,0,0,0,1,0,1,1,0,0,1,1,1,0,1,0,1,0,0,0,1,0,0,1,0,1,0,1,0,0,0,0,0,0,0,0。能否说该信号是纯粹随机干扰?(10分)

《非参数统计》与MATLAB编程 第二章 描述性统计

第二章描述性统计 2.1 表格法和图形法 表2.1 灯丝寿命数据 107 73 68 97 76 79 94 59 98 57 73 81 54 65 71 80 84 88 62 61 79 98 63 65 66 62 79 86 68 74 61 82 65 98 63 71 62 116 65 88 64 79 78 79 77 86 89 76 74 85 73 80 68 78 89 72 58 69 82 72 92 78 88 77 103 88 63 68 88 81 64 73 75 90 62 89 71 71 74 70 74 70 85 61 65 81 75 62 94 71 85 84 83 63 92 68 81 62 79 83 93 61 65 62 92 65 64 66 83 70 70 81 77 72 84 67 59 58 73 83 78 66 66 94 77 63 66 75 68 76 73 76 90 78 71 101 78 43 59 67 61 71 77 91 96 75 64 76 72 77 74 65 82 86 79 74 66 86 96 89 81 71 85 99 59 92 94 62 68 72 77 60 87 84 75 77 51 45 63 102 85 67 87 80 84 93 69 76 89 75 59 77 83 68 72 67 92 89 82 96 a = Columns 1 through 17 107 73 68 97 76 79 94 59 98 57 73 81 54 65 71 80 84 79 98 63 65 66 62 79 86 68 74 61 82 65 98 63 71 62 64 79 78 79 77 86 89 76 74 85 73 80 68 78 89 72 58 92 78 88 77 103 88 63 68 88 81 64 73 75 90 62 89 71 74 70 85 61 65 81 75 62 94 71 85 84 83 63 92 68 81 93 61 65 62 92 65 64 66 83 70 70 81 77 72 84 67 59 78 66 66 94 77 63 66 75 68 76 73 76 90 78 71 101 78

王静龙《非参数统计分析》课后计算题参考标准答案

王静龙《非参数统计分析》课后习题计算题参考答案习题一 1. One Sample t-test for a Mea n Sample Statistics for x N Mea n Std. Dev. Std. Error 26 1.38 8.20 1.61 Hypothesis Test Null hypothesis: Mea n of x = 0 Alternative: Mea n of x A= 0 t Statistic Df Prob > t 0.861 25 0.3976 95 % Con fide nee In terval for the Mea n Lower Limit: -1.93 Upper Limit: 4.70 则接受原假设认为一样 习题二 1.描述性统计

习题二 1.1 S+=13 n 39 H o: me 6500 H〔:me 6500 PS 13 二BINOMDIST(13,39,0.5,1) =0.026625957 另外:在excel2010中有公式BINOM.INV(n,p,a)返回一个数值,它使得累计二项式分布的函数值大于或等于临界值a的最小整数 * 1 m n m inf m ■ 2 i 0 i BINO M」N V(39,0.5,0.05)=14 * n 1 * d n d=sup d : m 1 13 2 i 0 i S+13 d 13 以上两种都拒绝原假设,即中位数低于6500 1.2

n 1 inf n * * 1 m n m inf m :- 2 i o i BINOM.INV(40,0.5,1 -0.025)=26 d=n-c=40-26=14 x 14 5800 x 26 6400 me x 20 6200 2. S + =40 n 70 H 0: me 6500 H 1: me 6500 2P S 40 2*(1-BIN0MDIST(39,70,0.5,1)) =0.281978922 则接受原假设,即房价中位数是 6500 3.1 S + =1552 n 1552 527 2079 inf m inf m=BINOM.INV(2079,0.5,0.975)=1084 则拒绝原假设,即相信孩子会过得更好的人多 3.2 P 为认为生活更好的成年人的比例,则 H 。: p 出:p n 比较大,则用正态分布近似 P S 1552 1039.5-1552+0.5 、519.75 =5.33E-112 另外:S +=1552 n 1552 527 2079

非参数统计十道题

非参数统计----十道题 09统计学 王若曦 114 一、 Wilcoxon 符号秩检验 下面是10个欧洲城镇每人每年平均消费的酒类相当于纯酒精数,数据已经按升序排列: 人们普遍认为欧洲各国人均年消费酒量的中位数相当于纯酒精8升,试用上述数据检验这种看法。 数据来源:《非参数统计(第二版)》 吴喜之 手算: % 建立假设组: 01H :M=8H :M>8 T 2467891046T 5319n=10 +-=++++++==++= 查表得P=<α=,因此拒绝原假设,即认为欧洲各国人均年消费酒量的中位数多于8升。 》 SPSS : 操作:Analyze ——Nonparametric Tests ——2-Related Sample Test

Test Statistics b c - x Z-1.886a Asymp. Sig. (2-tailed).059 Exact Sig. (2-tailed)! .064 Exact Sig. (1-tailed).032 Point Probability.008 a. Based on positive ranks. b. Wilcoxon Signed Ranks Test 由输出结果可知,单侧精确显著性概率P=<α=,因此拒绝原假设,即认为欧洲各国人均年消费酒量的中位数多于8升。与手算结果相同。 R语言: … > x=c,,,,,,,,, > (x-8,alt="greater") Wilcoxon signed rank test data: x - 8 V = 46, p-value = alternative hypothesis: true location is greater than 0 由输出结果可知,P=<α=,因此拒绝原假设,即认为欧洲各国人均年消费酒量的中位数多于8升。与以上结果一致。 |

非参数统计题

一、 填空题(每空2分,共计30分) 1、 性别属于_______尺度的测量层次,文化程度属于_______尺度的测量层次,温度属于________尺度的 测量层次,年龄属于________尺度的测量层次。 2、 某一序列的观察值为2,5,3,7,8,9,6,4,16,10,则上游程数为______,下游程为_______, 第一个下游程的长度是_________。 3、 两组独立的随机样本的观察值分别为: 第一组(X ):9,12,3,7 第二组(Y ):5,8,6,14,16 则第一组X 的等级和T x =_______,第二组Y 的等级和T y =_______,Y 的评分值先于X 的总次数U =_______,游程的总数目V =________。 4、 则列边缘次数为___________,不考虑X ,直接预测Y 时产生的误差1E =______,用X 预测Y 时产生的误差2E =______,非对称形式的λ系数yx λ=___________。 二、 (10分)某地一周内个日患忧郁症的人数分布如表所示,请用2χ检验法检验一周内个日人们忧郁数 是否满足1:1:2:2:1:1:1 三、(20分)试根据下表的数据分别用符号检验和Wilcoxon 符号秩检验法检验学生接受某种方法训练前后成绩是否存在显著差异,训练能否提高学生的成绩?(显著性水平0.05α=)

四、(10分)随机抽取3个班级的学生,得到21个成绩样本,如表所示,试用Kruskal-Wallis检验法检验 α=) 3个班级学生成绩是否存在显著差异?(显著性水平0.05 五、(10 三个月后的体重,试用Friedman检验法检验在这4个时期,10个人的体重有无发生显著的变化?(显著α=) 性水平0.05 六、(20分)两名裁判员对六名歌手评分的等级如下: X的秩:1,2,5,6,4,3 Y的秩:5,3,6,4,2,1 分别用Spearman等级相关系数及Kendall秩相关系数分析两位裁判员评分的相关程度。

非参数统计检验方法的应用

论文投稿领域:数理经济与计量经济学 非参数统计检验方法的应用 阮曙芬1 程娇翼 1 张振中2 (1.中国地质大学数理学院,武汉 430074;2.中南大学数学科学与计算学院,长沙 410075) 摘要:本文对非参数统计中常用的三种假设检验方法进行了简单的介绍。运用 Kruskal-Wallis 检验方法对2002年前三季度的上海股市综合指数收益率数据进行了周末效应的检验,结果表明2002年上海股市综合指数收益率不具有周末效应。 关键字:符号检验;Wilcoxon 秩和检验;Kruskal-Wallis 检验 1引言 非参数统计是统计分析的重要组成部分。非参数假设检验是在总体分布未知或者总体分布不满足参数统计对总体所做的假定的时候,分析样本特点,寻找相应的非参数检验统计量。本文就是以此为出发点,介绍了非参数统计中假设检验常用的几个检验方法:符号检验、Wilcoxon 秩和检验和Kruskal-Wallis 检验,然后结合具体的问题和数据,在统计软件SAS 中作相应的非参数检验。 2非参数假设检验介绍 2.1 配对样本的符号检验 符号检验是根据正、负符号进行假设检验的方法。这种检验方法用于配对设计数值变量资料的假设检验,常常是差值不服从正态分布或者总体分布未知的情况下不能用t 检验的时候使用。其原理是对差值进行编制并冠以符号,然后对正负秩和进行比较检验。 设随机变量12,,...,n X X X 相互独立同分布,分布为()F x ,()F x 在0x =连续。假设检验问题 2.2 两独立样本的Wilcoxon 秩和检验 Wilcoxon 秩和检验的理论背景如下:有两个总体,一个总体的样本为12,,...,n X X X ,相互独立同分布,分布为()F x ;另一个样本为12,,...,n Y Y Y ,相互独立同分布,分布为()G x ,()F x , ()G x 连续。问随机变量Y 是否随机大于随机变量X ,即检验

非参数统计

中国海洋大学本科生课程大纲 课程属性:公共基础/通识教育/学科基础/专业知识/工作技能,课程性质:必修、选修 一、课程介绍 1.课程描述: 非参数统计是数理统计学的一个分支,它是针对参数统计而言的。所谓参数统计,简 单地说就是建立在总体具有明确分布形式,通常多为正态分布形式的假定基础之上,所建立 的统计理论和统计方法。而非参数统计是在不假定总体分布形式或在较弱条件下,例如总体 分布形式完全未知或分布形式是对称的,诸如这样一些宽泛条件下,尽量从数据本身获 得的信息,建立对总体相关统计特征进行分析和推断的理论、方法。 2.设计思路: 本课程是在已学数理统计基础上,通过非参数统计的学习,引导数学专业学生进一步增强对一般总体分析、推断的能力并加深对相关理论和方法的理解。 课程内容着重于基本知识点的理解,避免难度较大或较长定理的证明。目的是使学生对理论有一个基本的理解和在应用能力上的提高。课程内容包括以下四个方面: (1).非参数统计的基本概念:非参数统计方法的主要特点,次序统计量及其分布,U统计量, 秩统计量的概念,一些统计量的近似分布。 (2).非参数估计的方法:总体分位数的估计,对称中心的估计,位置差的估计。 (3).非参数检验的方法:总体p分位数的检验,总体均值检验,两样本的比较,随机性与 独立性检验,多总体的比较。 - 1 -

(4).总体分布类型的估计与检验:分布函数的估计与检验,概率密度估计。 3. 课程与其他课程的关系: 先修课程:《概率论》,《数理统计》,《多元统计分析》;并行课程:《应用回归分析》;后置课程:《统计软件》。 非参数统计是应用数学专业、信息与计算科学专业的选修课程,但对于今后从事统计研究和统计应用工作的学生来讲可以作为专业必修课学习。 二、课程目标 非参数统计具有应用性广,稳健性好等特点。通过本课程学习,要求学生了解或理解非参数统计的一些基本理论和方法,注重利用理论和方法、借助计算机解决问题的能力。开课学期结束时,要求学生能够做到: (1)理解非参数统计方法的主要特点及与参数统计方法的区别。掌握次序统计量及其分布;理解并掌握U统计量秩统计量的概念;理解一些常用统计量的近似分布。重点是次序统计量及其分布; U统计量构造,秩统计量; (2)掌握总体分位数估计、对称中心的估计、位置差估计的方法。 (3)理解各种检验的基本思想,掌握检验的一般步骤,掌握检验统计及其拒绝域。难点在于检验统计量的选取及概率分布。 (4)理解分布函数估计及检验的基步骤和过程。 (5)为更深入学习非参数统计学理论打下初步的基础。也为学习专业统计软件的作好准备。 三、学习要求 要完成所有的课程任务,学生必须: (1)按时上课,认真听讲,认真完成作业。其中有一些作业需要学生自编程序用机器完成。(2)按时完成并按时提交书面形式的作业。延期提交作业需要得到任课教师的许可。 (3)完成一定量的阅读文献和背景资料,可以以小组的形式讨论学习,促进同学间的心得交 - 1 -

非参数统计分析方法总结

非参数统计分析方法 一单样本问题 1,二项式检验:检验样本参数是否与整体参数有什么关系。 样本量为n给定一个实数MO(代表题目给出的分位点数),和分位 点口(0.25,0.5,0.75)。用S-记做样本中比M0小的数的个数,S+记做样本中比M0大的数的个数。如果原假设H0成立那么S-与n的比之应为n。 H0:M=M0 HI: M k MO或者M>M(或者M

H1 :不是随机的(混合倾向,游程多,长度短)(成群倾向,游程少,长度长) Spss步骤:分析一非参数检验一游程 得出统计量R 和p 值 当p值小于0.05时拒绝原假设,没有充足理由证明该数据出现是随机的二,两个样本位置问题 1,Brown —Mood 中位数检验 给出两个样本比较两个样本的中位数或者四分位数等是否相等或者有一定关系,设一个中值为M1,—个为M2 H0:M1=M2. HI: M1H M2或者M1>M或者M1

非参数统计十道题

非参数统计----十道题 09统计学 王若曦 32009121114 一、 Wilcoxon 符号秩检验 下面是10个欧洲城镇每人每年平均消费的酒类相当于纯酒精数,数据已经按升序排列: 4.12 5.81 7.63 9.74 10.39 11.92 12.32 12.89 13.54 14.45 人们普遍认为欧洲各国人均年消费酒量的中位数相当于纯酒精8升,试用上述数据检验这种看法。 数据来源:《非参数统计(第二版)》 吴喜之 手算: 建立假设组: 01H :M=8H :M>8 T 2467891046T 5319n=10 +-=++++++==++= 查表得P=0.032<α=0.05,因此拒绝原假设,即认为欧洲各国人均年消费酒量的中位数多于8升。 SPSS : 操作:Analyze ——Nonparametric Tests ——2-Related Sample Test Ranks N Mean Rank Sum of Ranks c - x Negative Ranks 7a 6.57 46.00 Positive Ranks 3b 3.00 9.00 Ties 0c Total 10

由输出结果可知,单侧精确显著性概率P=0.032<=0.05,因此拒绝原假设,即认为欧洲各国人均年消费酒量的中位数多于8升。与手算结果相同。 R语言: > x=c(4.12,5.81,7.63,9.74,10.39,11.92,12.32,12.89,13.54,14.45) > wilcox.test(x-8,alt="greater") Wilcoxon signed rank test data: x - 8 V = 46, p-value = 0.03223 alternative hypothesis: true location is greater than 0 由输出结果可知,P=0.03223<α=0.05,因此拒绝原假设,即认为欧洲各国人均年消费酒量的中位数多于8升。与以上结果一致。 二、Mann-Whitney-Wilcoxon检验 下表为8个亚洲国家和8个欧美国家2005年的人均国民收入数据。检验亚洲国家和欧美国家的人均国民收入是否有显著差异(α=0.05)。

非参数统计——期末试卷

每小题20分 1. 下面是DMBA 公司为了研究某一种癌症所做的试验。Group 1和2分别代表试验的控制组和对照组。下面是所得的试验老鼠的生存数据,*代表数据被右删失。请回答下面问题: Group 1: 164 188 190 192 206 209 213 216 220 230 234 246 265 304 216* 244* Group 2: 156 163 198 205 232 233 239 240 261 280 296 323 204* 344* 1)请给出非参数的Kaplan-Meier 估计的公式,并计算在时间点t=156,164这两点的具体估计值,若假设在t=164处被删失,计算此处的估计值。 2)如果协变量分别取为1和0,请用Cox 模型模拟上述数据,给出计算协变量的系数的相关公式; 3)给出Kaplan-Meier 估计的Matlab 程序。 2. 下面是16个学生的体能测试数据: P81例3.14 82 53 70 73 103 71 69 80 54 38 87 91 62 75 65 77。 1) 请用顺序统计量方法构造置信度为95%的中位数的置信区间; 2) 编写上述计算的Matlab 程序 3. 下面是申请进入法学院学习的学生的LSAT 测试成绩和GPA 成绩。 LSAT: 576 635 558 578 666 580 555 661 651 605 653 575 545 572 594 GPA: 3.39 3.30 2.81 3.03 3.44 3.07 3.00 3.43 3.36 3.13 3.12 2.74 2.76 2.88 3.96 每个数据点用(,),i i i X Y Z 其中i Y 表示LSAT 成绩,i Z 表示GPA 成绩 1) 计算i Y 和i Z 的Pearson 相关系数 (只写出公式); (5分) 2) 使用Boostrap 方法估计相关系数的标准误差(只写出算法步骤);(5分) 3) 编写相应的Matlab 程序。(10分)

《卫生统计学》考试题及答案

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 《卫生统计学》考试题及答案 《卫生统计学》一、名词解释 1. 计量资料 2. 计数资料 3. 等级资料 4. 总体 5. 样本 6. 抽样误差 7. 频数表 8. 算术均数 9. 中位数 10. 极差 11. 方差 12. 标准差 13. 变异系数 14. 正态分布 15. 标准正态分布 16. 统计推断 17. 抽样误差 18. 标准误 19. 可信区间 20. 参数估计 21. 假设检验中 P 的含义 22. I 型和 II 型错误 23. 检验效能 24. 检验水准 25. 方差分析 26. 随机区组设计 27. 相对数-1- 1/ 29

28. 标准化法 29. 二项分布 30. Yates 校正 31. 非参数统计 32. 直线回归 33. 直线相关 34. 相关系数 35. 回归系数 36. 人口总数 37. 老年人口系数 38. 围产儿死亡率 39. 新生儿死亡率 40. 婴儿死亡率 41. 孕产妇死亡率 42. 死因顺位 43. 人口金字塔二、单项选择题 1.观察单位为研究中的( D )。 A.样本 C.影响因素 2.总体是由( C )。 A.个体组成 C.同质个体组成 3.抽样的目的是( B )。 A.研究样本统计量 C.研究典型案例研究误差 4.参数是指( B )。 A.参与个体数 C.样本的统计指标 B.总体的统计指标 D.样本的总和 B.由样本统计量推断总体参数 D.研究总体统计量B.研究对象组成 D.研究指标组成 B.全部对象 D.个体5.关于随机抽样,下列那一项说法是正确的( A )。 -2-

第7章 非参数检验试题

第7章非参数检验试题 选择题: 1、4组学生成绩(优、良、中、差)比较,宜用(B )。 A 方差分析 B 秩和检验 C 卡方检验 D 四格表直接计算概率法 2、两样本秩和检验的无效假设是(B )。 A 两样本秩和相等 B 两总体分布相同 C 两样本分布相同 D 两总体秩和相等 3、(C ),应该用非参数统计方法。 A 正态分布资料n不相等时两样本均数比较 B 正态分布资料两样本方差都比较大时两样本均数的比较 C 两组等级资料的比较 D 两组百分比资料的平均数比较 4、在统计检验中是否选择用非参数统计方法,( A )。 A 要根据研究目的和数据特征作决定 B 可在算出几个统计量和得出初步结论后进行选择 C要看哪个统计结论符合专业理论 实验组对照组 实测值甲的编秩乙的编秩实测值甲的编秩乙的编秩 10 7.5 7.5 10 7.5 7.5 12 9 9 8 4 5 15 10 10.5 8 5 5 15 11 10.5 6 1 2 17 12 13 6 2 2 17 13 13 6 3 2 17 14 13 8 6 5 19 17 17 19 17 17 19 17 17 20 20 20.5 19 17 17 20 21 20.5 19 17 17 21 22 22 D 要看哪个P值更小 5、下表列出了成组设计的两样本资料及甲乙两个研究者的编秩结果,下面哪一个说法是对的?( C ) A 甲的编秩方法是错的 B 乙的编秩方法是错的 C 甲乙两人方法均对 D 甲乙两人的编秩方法均错 6、以下检验方法中,(A )不属于非参数统计方法。 A.t检验 B.H检验 C.T检验D.χ2检验 7、为判断各总体均数是否相等,对于来自方差齐性及正态分布总体的多个样本比较,可以作秩和(H)检验,通过判断各总体分布的位置是否相同而判断各总体均数是否相等,与作方差分析相比( C )。 A.应该把α定得小一点 B.将增大犯I类错误的概率

非参数统计(第二版)习题测验R程序

P37.例2.1 build.price<- c(36,32,31,25,28,36,40,32,41,26,35,35,32,87,33,35 );build.price hist(build.price,freq=FALSE)#直方图 lines(density(build.price),col="red")#连线 #方法一:m<-mean(build.price);m#均值 D<-var(build.price)#方差 SD<-sd(build.price)#标准差S t=(m-37)/(SD/sqrt(length(build.price)));t#t统计量计算检验统计量 t= [1] -0.1412332 #方法二:t.test(build.price-37)#课本第38页 例2.2 binom.test(sum(build.price<37),length(build.price), 0.5)#课本40页 例2.3 P<-2*(1-pnorm(1.96,0,1));P [1] 0.04999579 P1<-2*(1-pnorm(0.7906,0,1));P1 [1] 0.4291774 > 例2.4 > p<-2*(pnorm(-1.96,0,1));p [1] 0.04999579 > > p1<-2*(pnorm(-0.9487,0,1));p1 [1] 0.3427732 例2.5(P45) scores<- c(95,89,68,90,88,60,81,67,60,60,60,63,60,92, 60,88,88,87,60,73,60,97,91,60,83,87,81,90);length( scores)#输入向量求长度 ss<-c(scores-80);ss t<-0 t1<-0 for(i in 1:length(ss)){ if (ss[i]<0) t<-t+1#求小于80的个数 else t1<-t1+1求大于80的个数 } t;t1 > t;t1 [1] 13 [1] 15 binom.test(sum(scores<80),length(scores),0.75) p-value = 0.001436<0.01 Cox-Staut趋势存在性检验P47 例2.6 year<-1971:2002;year length(year) rain<- c(206,223,235,264,229,217,188,204,182,230,223, 227,242,238,207,208,216,233,233,274,234,227,221 ,214, 226,228,235,237,243,240,231,210) length(rain) #(1)该地区前10年降雨量是否变化? t1=0 for (i in 1:5){ if (rain[i]

王静龙非参数统计分析课后计算题参考答案Word版

王静龙《非参数统计分析》课后习题计算题参考答案 习题一 1.One Sample t-test for a Mean Sample Statistics for x N Mean Std. Dev. Std. Error ------------------------------------------------- 26 1.38 8.20 1.61 Hypothesis Test Null hypothesis: Mean of x = 0 Alternative: Mean of x ^= 0 t Statistic Df Prob > t --------------------------------- 0.861 25 0.3976 95 % Confidence Interval for the Mean Lower Limit: -1.93 Upper Limit: 4.70 则接受原假设认为一样 习题二 1.描述性统计

习题三 1.1 {}+01=1339 :6500:650013=BINOMDIST(13,39,0.5,1)=0.026625957 S n H me H me P S +==<≤ 另外:在excel2010中有公式 BINOM.INV(n,p,a) 返回一个数值,它使得累计二项式分布的函数值大于或等于临界值a 的最小整数 * **0*0+1inf :2BINOM.INV(39,0.5,0.05)=14 1sup :113 2S 1313 n m i n d i n m m i n d d m i d αα==?????? ??=≥?? ? ????????? ?????? ??≤=-=?? ? ????????? =≤=∑∑= 以上两种都拒绝原假设,即中位数低于6500 1.2

王静龙《非参数统计分析》教案

.引言 一般统计分析分为参数分析与非参数分析,参数分析是指,知道总体分布,但其中几个参数的值未知,用统计量来估计参数值,但大部分情况,总体是未知的,这时候就不能用参数分析,如果强行用可能会出现错误的结果。 例如:分析下面的供应商的产品是否合格? 合格产品的标准长度为(±),随即抽取n=100件零件,数据如下: 表 经计算,平均长度为cm x 4958.8=,非常接近中心位置,样本标准差为 () 1047.011 2 =--= ∑=n i i n x x s cm.一般产品的质量服从正态分布,),(~2δμN X 。 这说明产品有接近三分之一不合格,三分之二合格,所以需要更换供应厂 商,而用非参数分析却是另外一个结果。 以下是100个零件长度的分布表:

这说明有90%的零件长度在)2.05.8(±cm 之间,有9%的零件不合格,所以工厂不需要换供应商。 例2 哪一个企业职工的工资高? 表两个企业职工的工资 显然,企业1职工的工资高,倘若假设企业1与企业2的职工工资分别服从正态分布),(),,(22σσb N a N ,则这两个企业职工的工资比较问题就可以转化为一个参数的假设检验问题,原假设为b a H =:0,备择假设为b a H >:0 则 ))11(,(~2σn m b a N y x +-- 若0H 为真,则 其中])()([211 212 2∑∑==-+--+= n i i m i i w y y x x n m S 拒绝域为:}325.1{)}20({90.0≥=≥t t t 检测值为:282.1=t 故不能拒绝原假设,认为两企业的工资水平无差异。 也可以用值-P 检验 由于1073.0)282.1)20((=≥t P 故不能拒绝原假设,认为两企业的工资水平无差异。

最新王静龙《非参数统计分析》课后计算题参考答案

精品文档 精品文档王静龙《非参数统计分析》课后习题计算题参考答案 习题一 1.One Sample t-test for a Mean Sample Statistics for x N Mean Std. Dev. Std. Error ------------------------------------------------- 26 1.38 8.20 1.61 Hypothesis Test Null hypothesis: Mean of x = 0 Alternative: Mean of x ^= 0 t Statistic Df Prob > t --------------------------------- 0.861 25 0.3976 95 % Confidence Interval for the Mean Lower Limit: -1.93 Upper Limit: 4.70 则接受原假设认为一样 习题二 1.描述性统计

精品文档 习题三 1.1 {}+01=1339 :6500:650013=BINOMDIST(13,39,0.5,1)=0.026625957 S n H me H me P S +==<≤ 另外:在excel2010中有公式 BINOM.INV(n,p,a) 返回一个数值,它使得累计二项式分布的函数值大于或等于临界值a 的最小整数 * **0*0+1inf :2BINOM.INV(39,0.5,0.05)=14 1sup :113 2S 1313 n m i n d i n m m i n d d m i d αα==?????? ??=≥?? ? ????????? ?????? ??≤=-=?? ? ????????? =≤=∑∑= 以上两种都拒绝原假设,即中位数低于6500 1.2

非参数统计部分课后习题参考答案

课后习题参考答案 第一章p23-25 2、(2)有两组学生,第一组八名学生的成绩分别为x 1:100,99,99,100,99,100,99,99;第二组三名学生的成绩分别为x 2:75,87,60。我们对这两组数据作同样水平a=的t检验(假设总体均值为u ):H 0:u=100 H 1:u<100。第一组数据的检验结果为:df=7,t 值为,单边p 值为,结论为“拒绝H 0:u=100。”(注意:该组均值为);第二组数据的检验结果为:df=2,t 值为,单边p值为;结论为“接受H 0:u=100。”(注意:该组均值为)。你认为该问题的结论合理吗说出你的理由,并提出该如何解决这一类问题。 答:这个结论不合理(6分)。因为,第一组数据的结论是由于p-值太小拒绝零假设,这时可能犯第一类错误的概率较小,且我们容易把握;而第二组数据虽不能拒绝零假设,但要做出“在水平a时,接受零假设”的说法时,还必须涉及到犯第二类错误的概率。(4分)然而,在实践中,犯第二类错误的概率多不易得到,这时说接受零假设就容易产生误导。实际上不能拒绝零假设的原因很多,可能是证据不足(样本数据太少),也可能是检验效率低,换一个更有效的检验之后就可以拒绝了,当然也可能是零假设本身就是对的。本题第二组数据明显是由于证据不足,所以解决的方法只有增大样本容量。(4分) 第三章p68-71 3、在某保险种类中,一次关于1998年的索赔数额(单位:元)的随机抽样为(按升幂排列): 4632,4728,5052,5064,5484,6972,7596,9480,14760,15012,18720,21240,22836,52788,67200。已知1997年的索赔数额的中位数为5064元。 (1)是否1998年索赔的中位数比前一年有所变化能否用单边检验来回答这个问题(4分) (2)利用符号检验来回答(1)的问题(利用精确的和正态近似两种方法)。(10分) (3)找出基于符号检验的95%的中位数的置信区间。(8分) 解:(1)1998年的索赔数额的中位数为9480元比1997年索赔数额的中位数5064元是有变化,但这只是从中位数的点估计值看。如果要从普遍意义上比较1998年与1997年的索赔数额是否有显著变化,还得进行假设检验,而且这个问题不能用单边检验来回答。(4分) (2)符号检验(5分) 设假设组:H 0:M =M 0=5064 H 1:M ≠M 0=5064 符号检验:因为n +=11,n-=3,所以k=min(n+,n-)=3 精确检验:二项分布b(14,, ∑=-=3 0287 .0)2/1,14(n b ,双边p-值为,大于a=,所以在a水平 下,样本数据还不足以拒绝零假设;但假若a=,则样本数据可拒绝零假设。查二项分布表得a=的临界值为(3,11),同样不足以拒绝零假设。 正态近似:(5分) np=14/2=7,npq=14/4= z=(3+/5.3≈>Z a/2= 仍是在a=的水平上无法拒绝零假设。说明两年的中位数变化不大。 (3)中位数95%的置信区间:(5064,21240)(8分) 7、一个监听装置收到如下的信号:0,1,0,1,1,1,0,0,1,1,0,0,0,0,1,1,1,1,1,1,1,1,1,0,1,0,0,1,1,1,0,1,0,1,0,1,0,0,0,0,0,0,0,0,1,0,1,1,0,0,1,1,1,0,1,0,1,0,0,0,1,0,0,1,0,1,0,1,0,0,0,0,0,0,0,0。能否说该

相关主题
文本预览
相关文档 最新文档