非参数统计----十道题
09统计学 王若曦 32009121114
一、 Wilcoxon 符号秩检验
下面是10个欧洲城镇每人每年平均消费的酒类相当于纯酒精数,数据已经按升序排列: 4.12 5.81 7.63 9.74 10.39 11.92 12.32 12.89 13.54 14.45 人们普遍认为欧洲各国人均年消费酒量的中位数相当于纯酒精8升,试用上述数据检验这种看法。
数据来源:《非参数统计(第二版)》 吴喜之
手算:
建立假设组:
01H :M=8H :M>8
T 2467891046T 5319n=10
+-=+++
+++==++=
查表得P=0.032<α=0.05,因此拒绝原假设,即认为欧洲各国人均年消费酒量的中位数多于8升。
SPSS :
操作:Analyze ——Nonparametric Tests ——2-Related Sample Test
由输出结果可知,单侧精确显著性概率P=0.032<=0.05,因此拒绝原假设,即认为欧洲各国人均年消费酒量的中位数多于8升。与手算结果相同。
R语言:
> x=c(4.12,5.81,7.63,9.74,10.39,11.92,12.32,12.89,13.54,14.45)
> wilcox.test(x-8,alt="greater")
Wilcoxon signed rank test
data: x - 8
V = 46, p-value = 0.03223
alternative hypothesis: true location is greater than 0
由输出结果可知,P=0.03223<α=0.05,因此拒绝原假设,即认为欧洲各国人均年消费酒量的中位数多于8升。与以上结果一致。
二、Mann-Whitney-Wilcoxon检验
下表为8个亚洲国家和8个欧美国家2005年的人均国民收入数据。检验亚洲国家和欧美国家的人均国民收入是否有显著差异(=0.05)。
数据来源:《统计学(第三版)》 贾俊平
手算:
设亚洲国家为X ,欧美国家为Y 建立假设组:
0x y 1x y
H :M =M H :M M ≠
x y x T 12346891548T 5710111213141688
N m n 16m n 8U T m(m 1)/212
=+++++++==+++++++==+====-+=,,
查表得,T x =48的右尾概率的2倍为0.019*2=0.038< α=0.05,因此拒绝原假设,即认
为亚洲国家和欧美国家的人均国民收入有显著差异。
SPSS :
操作:Data ——Sort Cases
Analyze
由输出结果可知,精确双尾概率P=0.038<=0.05,因此拒绝原假设,即认为亚洲国家和欧美国家的人均国民收入有显著差异。与手算结果一致。
R语言:
> x<-c(1740,38980,1280,4960,2750,27490,15830,720)
> y<-c(43740,32600,34580,37600,34810,30010,7310,3460)
> wilcox.test(x,y,exact=F,cor=F)
Wilcoxon rank sum test
data: x and y
W = 12, p-value = 0.03569
alternative hypothesis: true location shift is not equal to 0
由输出结果可知,P=0.03569< α=0.05,因此拒绝原假设,即认为亚洲国家和欧美国家的人均国民收入有显著差异。与以上结果一致。
三、两样本的Kolmogorov-Smirnov检验
下面是13个非洲地区和13个欧洲地区的人均酒精年消费量,试分析这两个地区的酒精人均年消费量是否分布相同。
》吴喜之手算:
建立假设组:
012112H :F (x)=F (x)H :F (x)F (x)
≠
D=max D =0769231mnD=130().,
查表得,当mnD=130时,双侧检验的概率P<0.01,所以P<α=0.05,因此拒绝原假设,即认为这两个地区的酒精人均年消费量分布有显著差异。
SPSS :
操作:Analyze ——
由输出结果可知,双侧精确显著性概率P =0.05,因此拒绝原假设,即认为这两个地区的酒精人均年消费量分布有显著差异。与手算结果一致。
四、 Cochran Q 检验
下面是某村村民对四个候选人(A ,B ,C ,D )的赞同与否的调查(“1”代表同意,“0”代表不同意);最后一列为行总和,最后一行为列总和,全部“1”的总和为42。试分析4
手算:
建立假设组:
01H 4H 4:位候选人在村民眼中没有差异:位候选人在村民眼中有差异
k k 22j j 22222j=1j=1n n 222
2
i i i=1
i=1
k-1k x -x (41)[4(161196)42]Q =9.35294(42)(518273)
k y -y df 413
????
-+++-??==-?+?+?=-=∑∑∑∑()() 查表得2
0.057.82Q 9.3529χ=<=,因此在5%的显著性水平上拒绝原假设,即认为4
位候选人在村民眼中有显著差异。
SPSS :
操作:Analyze ——
由输出结果可知,Q=9.353,精确的显著性概率P=0.025< α=0.05,因此拒绝原假设,即认为4位候选人在村民眼中有显著差异。与手算结果一致。
R 语言:
> x=read.table("f:/CochranQ.txt") > n=apply(x,2,sum) > N=sum(n)
> L=apply(x,1,sum) > k=dim(x)[2]
> Q=(k*(k-1)*sum((n-mean(n))^2))/(k*N-sum(L^2)) > Q
[1] 9.352941
> pvalue=pchisq(Q,k-1,low=F) > pvalue
[1] 0.02494840
由输出结果可知,Q=9.352941, P=0.02494840< α=0.05,因此拒绝原假设,即认为4位候选人在村民眼中有显著差异。与以上结果一致。
五、 Friedman 检验
一项关于销售茶叶的研究报告说明销售方式可能和售出率有关。三种方式为:在商店内等待,在门口销售和当面表演炒制茶叶。对一组商店在一段时间的调查结果列再下表中(单位为购买者人数)。试问三种不同的销售方式是否有显著差异(
=0.05)。 手算:
建立假设组:
01H H :三种销售方式无差异:三种销售方式有差异
k
22
222r
j
j=11212R 3n(k 1)(101424)3
8(31)13nk(k 1)83(31)
df 312
χ=-+=++-?+=+?+=-=∑ 查表得2
20.05r 5.9913χχ=<=,因此在5%的显著性水平上拒绝原假设,即认为三种销
售方式有显著差异。
SPSS :
操作:Analyze ——Nonparametric Tests ——K Related Samples
由输出结果可知,22
r 0.0513 5.99χχ=>=,精确的显著性概率P<0.001,因此在5%的
显著性水平上拒绝原假设,即认为三种销售方式有显著差异。与手算结果一致。
R 语言:
> d=read.table("f:/Friedman.txt") > friedman.test(as.matrix(d))
Friedman rank sum test
data: as.matrix(d)
Friedman chi-squared = 13, df = 2, p-value = 0.001503
由输出结果可知,213χ=, P=0.001503<α=0.05,因此拒绝原假设,即认为三种销售方式有显著差异。与以上结果一致。
六、 K 个样本的卡方检验
在一个有三个主要百货商场的商贸中心,调查者问479个不同年龄段的人首先去三个商 王星
手算:
建立假设组:
01H H :人们去三个商场的概率相同:人们去三个商场的概率不同
()
2
r
k
ij ij i=1j=1
ij
f -e Q==0.685+2.274+15.691=18.651
e df=(k-1)(r-1)=4
∑∑
查表得20.05=9.49χ,因为Q=18.651>2
0.05=9.49χ,因此拒绝原假设,即认为人们去三个
商场的概率不同。
SPSS :
操作:Data ——Weight Cases
由输出结果可知,卡方统计量为18.651,精确双尾检验概率P=0.01<=0.05,因此拒绝原假设,即认为人们去三个商场的概率不同。与手算结果一致。
七、 Kruskal-Wallis 检验
某制造商雇用了来自三个本地大学的雇员作为管理人员。最近,公司的人事部门已经收集信息并考核了年度工作成绩。从三个大学来的雇员中随机地抽取了三个独立样本。制造商想知道是否来自这三个不同的大学的雇员在管理岗位上的表现有所不同。
数据来源:百度文库 SAS 讲义
手算:
建立假设组:
01H H :三个总体的考核成绩分布相同:三个总体的考核成绩分布不同
各雇员的成绩等级
2
222k j
j=1j R 1212(95)(27)(88)KW H 3(N+1)=3(201)8.9163N(N+1)n 20(21)767??=-++-+=????
∑统计量因为出现同分的情况,应对H 进行校正,校正系数
3
3
33322
u u (33332222)
C 1=10.9925N(N +1)
20(20+1)
H 8.9163/0.99258.9839df=k 12
--+-+-+-=-
-===-=∑∑校正后的统计量
查表得,在05.0=α的显著性水平上,20.05χ=5.99,由于H=8.9839>2
0.05χ=5.99,因此
拒绝原假设,即三个总体的考核成绩分布不同。
SPSS :
操作:Analyze ——Nonparametric Tests ——K Independent Samples
由输出结果可知,KW 统计量为8.984,精确概率为0.006,远远小于显著性水平0.05,因此拒绝原假设,即三个总体的考核成绩分布不同。与手算结果一致。
八、 列联表卡方检验
一种原料来自三个不同的地区,原料质量被分成三个不同等级。从这批原料中随机抽取500
数据来源:百度文库 统计学教程PPT
手算:
建立假设组:
01H H :地区与原料质量无关:地区与原料质量相关
2
r
c
ij ij i=1j=1ij
(f -e )Q==19.82
e df=(r-1)(c-1)=4
∑∑
查表得,20.05=9.49χ,由于Q=19.82>2
0.05=9.49χ,因此拒绝原假设,即认为地区与原
料质量相关。
SPSS:
操作:Data——Weight Cases
0.05,因此拒绝原假设,即认为地区与原料质量相关。与手算结果一致。
九、Kendall秩相关
某研究所对10对双胞胎儿童的智力进行调查,结果如下表:
儿童智力测试得分
数据来源:《非参数统计:方法与应用》 易丹辉 董寒青 手算:
U 9V 020********
2(U-V)2(37-7)
Kendall T===0.6667n(n-1)1010-1=+
=+++++++++=秩相关系数()
由于同分,所以
对T 的显著性进行检验,建立假设组:
0+H H :不相关:正相关
查表得,n=10,T=0.6667或T=0.6742相应的概率在0.0002至0.0005之间,远远小于显著性水平0.05,因此拒绝原假设,即认为双胞胎儿童的智力之间存在着正相关。
SPSS :
操作:Analyze ——Correlate ——Bivariate
由输出结果可知,T=0.674,双侧检验的显著性概率为0.007,则单侧的显著性概率为0.0035,远远小于显著性水平0.05,因此拒绝原假设,即认为双胞胎儿童的智力之间存在着正相关。与手算结果一致。
R语言:
> x=c(9.0,16.6,16.2,11.3,16.2,7.1,7.8,4.0,11.2,1.3)
> y=c(7.8,19.3,20.1,7.1,13.0,4.8,8.9,7.4,10.0,1.5)
> cor.test(x,y,method="kendall")
Kendall's rank correlation tau
data: x and y
z = 2.6941, p-value = 0.007058
alternative hypothesis: true tau is not equal to 0
sample estimates:
tau
0.6741999
警告信息:
In cor.test.default(x, y, method = "kendall") : 无法给连结计算精確p值
由输出结果可知,T=0.6741999,P=0.007058,远远小于显著性水平0.05,因此拒绝原假设,即认为双胞胎儿童的智力之间存在着正相关。与以上结果一致。
十、完全秩评定的Kendall协和系数
下面是4个独立的环境研究单位对10个城市空气等级排序的结果,试分析这4个评估机构的结果是否是随机的。
数据来源:《非参数统计(第二版)》吴喜之
手算:
2j 2222S [R k(n 1)/2]1126
12S 121126
W 0.8530
k n(n 1)410(101)
=-+=?===-?-∑
对W 进行显著性检验,建立假设组:
01H H :这些评估是不相关的:这些评估是相关的
12S 121126
Q 30.7091
kn(n 1)410(101)
df 1019
?=
==+?+=-= 查表得2
16.92Q 30.7091αχ=<=,因此拒绝原假设,即认为这些评估之间是显著相关
的。
SPSS :
操作:Analyze ——Nonparametric Tests ——K Related Samples
由输出结果可知,W=0.8530.05,因此拒绝原假设,即认为这些评估之间是显著相关的。与手算结果一致。
R语言:
> d=read.table("f:/airp.txt")
> R=apply(d,2,sum)
> m=nrow(d)
> n=ncol(d)
> S=sum((R-m*(n+1)/2)^2)
> W=12*S/m^2/(n^3-n)
> W
[1] 0.8530303
> pchisq(m*(n-1)*W,n-1,low=F)
[1] 0.0003320349
由输出结果可知,W=0.8530303,P= 0.0003320349,远远小于显著性水平0.05,因此拒绝原假设,即认为这些评估之间是显著相关的。与以上结果一致。