非参数统计十道题
- 格式:doc
- 大小:684.50 KB
- 文档页数:17
非参数统计----十道题
09统计学
王若曦
32009121114
一、 Wilcoxon 符号秩检验
下面是10个欧洲城镇每人每年平均消费的酒类相当于纯酒精数,数据已经按升序排列:
4.12 5.81 7.63 9.74 10.39 11.92 12.32 12.89 13.54 14.45
人们普遍认为欧洲各国人均年消费酒量的中位数相当于纯酒精8升,试用上述数据检验这种
看法。
数据来源:《非参数统计(第二版)》 吴喜之
手算:
建立假设组:
0
1
H:M=8
H:M>8
编号 纯酒精数x D=x-8 |D| |D|的秩 D的符号
1 4.12 -3.88 3.88 5 -
2 5.81 -2.19 2.19 3 -
3 7.63 -0.37 0.37 1 -
4 9.74 1.74 1.74 2 +
5 10.39 2.39 2.39 4 +
6 11.92 3.92 3.92 6 +
7 12.32 4.32 4.32 7 +
8 12.89 4.89 4.89 8 +
9 13.54 5.54 5.54 9 +
10 14.45 6.45 6.45 10 +
T2467891046T5319n=10
查表得P=0.032<=0.05,因此拒绝原假设,即认为欧洲各国人均年消费酒量的中位数
多于8升。
SPSS:
操作:Analyze——Nonparametric Tests——2-Related Sample Test
Ranks
N Mean Rank Sum of Ranks
c - x Negative Ranks 7a 6.57 46.00
Positive Ranks 3b 3.00 9.00
Ties 0c
Total 10
a. c < x
b. c > x
c. c = x
Test Statisticsb
c - x
Z -1.886a
Asymp. Sig. (2-tailed) .059
Exact Sig. (2-tailed) .064
Exact Sig. (1-tailed) .032
Point Probability .008
a. Based on positive ranks.
b. Wilcoxon Signed Ranks Test
由输出结果可知,单侧精确显著性概率P=0.032< =0.05,因此拒绝原假设,即认为
欧洲各国人均年消费酒量的中位数多于8升。与手算结果相同。
R语言:
> x=c(4.12,5.81,7.63,9.74,10.39,11.92,12.32,12.89,13.54,14.45)
> wilcox.test(x-8,alt="greater")
Wilcoxon signed rank test
data: x - 8
V = 46, p-value = 0.03223
alternative hypothesis: true location is greater than 0
由输出结果可知,P=0.03223< =0.05,因此拒绝原假设,即认为欧洲各国人均年消费
酒量的中位数多于8升。与以上结果一致。
二、 Mann-Whitney-Wilcoxon检验
下表为8个亚洲国家和8个欧美国家2005年的人均国民收入数据。检验亚洲国家和欧
美国家的人均国民收入是否有显著差异(=0.05)。
亚洲国家 人均国民收入(美元) 欧美国家 人均国民收入(美元)
中国 1740 美国 43740
日本 38980 加拿大 32600
印度尼西亚 1280 德国 34580
马来西亚 4960 英国 37600
泰国 2750 法国 34810
新加坡 27490 意大利 30010
韩国 15830 墨西哥 7310
印度 720 巴西 3460
数据来源:《统计学(第三版)》 贾俊平
手算:
设亚洲国家为X,欧美国家为Y
建立假设组:
0xy
1xy
H:M=M
H:MM
数值 秩 组别 数值 秩 组别
720 1 X 27490 9 X
1280 2 X 30010 10 Y
1740 3 X 32600 11 Y
2750 4 X 34580 12 Y
3460 5 Y 34810 13 Y
4960 6 X 37600 14 Y
7310 7 Y 38980 15 X
15830 8 X 43740 16 Y
x
y
x
T12346891548T5710111213141688Nmn16mn8UTm(m1)/212
,,
查表得,Tx=48的右尾概率的2倍为0.019*2=0.038< =0.05,因此拒绝原假设,即认
为亚洲国家和欧美国家的人均国民收入有显著差异。
SPSS:
操作:Data——Sort Cases
Analyze——Nonparametric Tests——2-Independent Samples
Ranks
分组
N Mean Rank Sum of Ranks
收入 亚洲国家
8 6.00 48.00
欧美国家
8 11.00 88.00
Total 16
Test Statisticsb
收入
Mann-Whitney U 12.000
Wilcoxon W 48.000
Z -2.100
Asymp. Sig. (2-tailed) .036
Exact Sig. [2*(1-tailed Sig.)] .038a
Exact Sig. (2-tailed) .038
Exact Sig. (1-tailed) .019
Point Probability .005
a. Not corrected for ties.
b. Grouping Variable: 分组
由输出结果可知,精确双尾概率P=0.038<=0.05,因此拒绝原假设,即认为亚洲国家
和欧美国家的人均国民收入有显著差异。与手算结果一致。
R语言:
> x<-c(1740,38980,1280,4960,2750,27490,15830,720)
> y<-c(43740,32600,34580,37600,34810,30010,7310,3460)
> wilcox.test(x,y,exact=F,cor=F)
Wilcoxon rank sum test
data: x and y
W = 12, p-value = 0.03569
alternative hypothesis: true location shift is not equal to 0
由输出结果可知,P=0.03569< =0.05,因此拒绝原假设,即认为亚洲国家和欧美国家
的人均国民收入有显著差异。与以上结果一致。
三、 两样本的Kolmogorov-Smirnov检验
下面是13个非洲地区和13个欧洲地区的人均酒精年消费量,试分析这两个地区的酒精
人均年消费量是否分布相同。
非洲 欧洲
5.38 6.67
4.38 16.21
9.33 11.93
3.66 9.85
3.72 10.43
1.66 13.54
0.23 2.4
0.08 12.89
2.36 9.3
1.71 11.92
2.01 5.74
0.9 14.45
1.54 1.99
数据来源:《非参数统计(第二版)》 吴喜之
手算:
建立假设组:
012
112
H:F(x)=F(x)
H:F(x)F(x)
x
1
f
2
f
1f 2f 1
Sx 2Sx D
0.08 1 0 1 0 0.076923 0 0.076923
0.23 1 0 2 0 0.153846 0 0.153846
0.9 1 0 3 0 0.230769 0 0.230769
1.54 1 0 4 0 0.307692 0 0.307692
1.66 1 0 5 0 0.384615 0 0.384615
1.71 1 0 6 0 0.461538 0 0.461538
1.99 0 1 6 1 0.461538 0.076923 0.384615
2.01 1 0 7 1 0.538462 0.076923 0.461538
2.36 1 0 8 1 0.615385 0.076923 0.538462
2.4 0 1 8 2 0.615385 0.153846 0.461538
3.66 1 0 9 2 0.692308 0.153846 0.538462
3.72 1 0 10 2 0.769231 0.153846 0.615385
4.38 1 0 11 2 0.846154 0.153846 0.692308
5.38 1 0 12 2 0.923077 0.153846 0.769231
5.74 0 1 12 3 0.923077 0.230769 0.692308
6.67 0 1 12 4 0.923077 0.307692 0.615385
9.3 0 1 12 5 0.923077 0.384615 0.538462
9.33 1 0 13 5 1 0.384615 0.615385
9.85 0 1 13 6 1 0.461538 0.538462
10.43 0 1 13 7 1 0.538462 0.461538
11.92 0 1 13 8 1 0.615385 0.384615
11.93 0 1 13 9 1 0.692308 0.307692
12.89 0 1 13 10 1 0.769231 0.230769
13.54 0 1 13 11 1 0.846154 0.153846
14.45 0 1 13 12 1 0.923077 0.076923
16.21 0 1 13 13 1 1 0
D=maxD=0769231mnD=130().,
查表得,当mnD=130时,双侧检验的概率P<0.01,所以P<=0.05,因此拒绝原假设,
即认为这两个地区的酒精人均年消费量分布有显著差异。
SPSS:
操作:Analyze——Nonparametric Tests——2-Independent Samples
Frequencies
分组
N
消费量 非洲地区
13
欧洲地区
13