四、几种常见的统计指标与参数
- 格式:doc
- 大小:220.50 KB
- 文档页数:7
上机实习内容2
几种常见的统计指标与参数
一、描述地理数据集中趋势的指标 1、 平均数(Mean )
(1) 算术平均数(Arithmetic mean ) ① 简单算术平均数(Simple arithmetic mean )
设有n 个地理数据n x x x x ,,,,321 ,其算数平均数x 可按下式计算:
∑==++++=n i i n x n n x x x x x 1
3211
练习1
求上海市1873-1940年100年内的年平均降水量的简单算术平均数。
/*调用Excel 中的average()函数求样本的简单算数平均数*/ 注意:
样本的简单算术平均数易受极端值的影响,如有以下样本资料:
表1-1 13个样本的属性值
样本序号 1 2 3 4 5 6 7 8 9 10 11 12 13 属性值
5
7
5
4
6
7
8
5
4
7
8
6
20
全部资料的简单算术平均数约为7.08,实际上大部分数据(有10个)不超过7,如果去掉第13个属性值20,则剩下的12个数的平均数为6。 ② 加权算术平均数(Weighted arithmetic average )
设有n 个地理数据n x x x x ,,,,321 ,其权重系数分别为n f f f f ,,,,321 ,其加权算术平均数x 可按下式计算:
∑∑===
++++++++=n
i i
n
i i
i n
n n f
f
x f f f f f x f x f x f x x 1
1321332211
练习2
根据黄土高原西部地区某山区县的人工造林地调查的分组数据求其加权算术平均数。
表1-2 某县人工造林地面积的统计分组数据 (单位:ha )
分组序号 1 2 3 4 5 6 7 8 9 10 11 组中值 0.5 1.5 2.5 3.5 4.5 5.5 6.5 7.5 8.5 9.5 10.5 频数
25
96
136
214
253
286
260
203
154
85
24
/*运用Excel 中的相对引用功能和求和sum()函数*/
494.524
962524
*5.1096*5.125*5.0≈++++++=
x
(2) 几何平均数(Geometric mean )
设有n 个地理数据n x x x x ,,,,321 ,其几何平均数g x 可按下式计算:
n n i g x x x x x ⋅⋅⋅⋅= 21
练习3
一位投资者持有一种股票,1997-2000年收益率如下表,计算该投资者在这四年内的平均收益率。
表1-3 投资者4年的收益率
年份 1997 1998 1999 2000 收益率
1.045
1.02
1.035
1.054
/*调用Excel 中的geomean()函数求样本的几何平均数*/
038.1054.1*035.1*02.1*045.14
≈
2、 中位数(Median )
将各个数据从小到大排列,居于中间位置的那个数就是中位数。 (1) 未分组资料的中位数
①当地理数据项数n 为奇数时,变量按大小顺序排列,第
2
1
+n 位数是中位数e m ,即 2
1+=n e x m
练习4 求某地9年年平均气温的中位数。
表1-4 某地9年年平均气温表 (单位:℃) 4.8
5
4.5
3.9
4.7
5.1
4.4
4.6
5.2
计算步骤:
㈠ 对原始数据序列排序
/*运用Excel 中的排序功能*/ 3.9
4.4
4.5
4.6
4.7
4.8
5
5.1
5.2
㈡ 根据公式求得中位数
7.452
19===+x x m e
②当地理数据项数n 为偶数时,变量按大小顺序排列,第2n 项与第2
n
+1项的平均数为中位数e m ,即
)(21
12
2
++=n n e x x m
练习5 求某地8年季节性冻土深度的中位数。
表1-5 某地8年季节性冻土深度 (单位:mm )
50
51
53.5
53
53.6
52
57
58
计算步骤:
㈠ 对原始数据序列排序
/*运用Excel 中的排序功能*/
50
51
52
53
53.5
53.6
57
58
㈡ 根据公式求得中位数
25.53)535.53(*21
)(21)(215412
828=+=+=+=+x x x x m e
(2) 分组资料的中位数
对于分组的资料,可按下式计算中位数
m
m me e f h
f n
L M )2(1--+=
式中,n 为样本大小,me L 为中位数所在组的下限值,1-m f 为中位数所在组的前一组的累积频数,m f 为中位数所在组的频数,h 为组距。
练习6 求上海市1873-1940年100年内的年平均降水量的分组资料的中位数。 计算步骤:
首先求出分组资料的累积频数,如表
组序 组上限 组下限 频数 累积频数 1 649.7 768.7 1 1 2 768.7 887.7 7 8 3 887.7 1006.7 16 24 4 1006.7 1125.7 27 51 5 1125.7 1244.7 22 73 6 1244.7 1363.7 14 87 7 1363.7 1482.7 8 95 8 1482.7 1601.7 3 98 9 1601.7 1720.7 2 100
由样本的大小(数据个数,为100)和累积频数可知,中位数所在的分组为累积频数小于51的分组,即中位数在第4组。
则根据公式可求出该分组资料的中位数为
293.112127
119*)242100(7.1006≈-+=e M
有没有更简单的方法?直接调用Excel 中的median()函数。 3、 众数(Mode )
众数是一个地理观测系列中出现频数(次数)最多的数。 (1)未分组资料的众数