当前位置:文档之家› 基于全国主要城市平均气温的统计分析

基于全国主要城市平均气温的统计分析

基于全国主要城市平均气温的统计分析
基于全国主要城市平均气温的统计分析

基于全国主要城市平均气温的统计分析

摘要本文主要采用2012年全国主要城市平均气温的统计数据,首先通过相关分析对全国主要城市的平均气温进行简单的相关分析,然后在控制平均气温的基础上对个月平均气温进行偏相关分析;其次运用聚类分析对各相似省份进行聚类分析;最后运用因子分析对各城市进行因子分析,计算出每个城市的综合得分,通过综合得分计算出每个城市平均气温的排名。

关键词:相关分析;聚类分析;因子分析

1、研究背景及目的

全球气温变暖为世人所瞩目,近几十年来的全球气候变暖是一个国内外都非常关注的重大问题。自从全球气温变暖的议题出现以来,关于气温的不正常变化仁者见仁,智者见智。气温的变化对农作物,人们的生活及经济的运行都有重要的影响。全世界的气温研究工作者都研究出了许多关于气温的结论,但都有一个共性即全球气温变暖。然而我国跨北纬4度到北纬53度,从东经73度到东经135度,具有比较丰富的气候和比较多变的气温,因此对我国气温的研究具有很重要的意义。

在此大背景下,对我国气温的研究不仅能说明我国气温的分布和变化,同时对世界气温的研究同样具有重要作用。

本文的研究目的如下:通过对我国主要城镇平均气温的研究和分析,一方面可以得出我国各市平均气温与全国平均气温差异;另一方面也可以给我们以后的就业进行指导,在适宜的季节去适宜的城市工作。

2、研究方法

气温的变化不仅能促进经济的发展,同时也能阻碍经济的发展。据此我们通过全国各主要城市每个月份的平均气温对我国气温的分布情况进行分析。

本研究采用的数据是《中国2012年主要城市平均气温的数据指标》,数据摘自《中国统计年鉴2013》7-7.

采用的分析方法主要有相关分析,聚类分析,因子分析等。

基本思路是:首先利用线图分析各个月份平均气温的分布,然后利用条形图分析全国主要城市平均气温的对比,得出平均气温最高和最低的城市;然后利用因子分析对各个月份的平均气温进行相关分析;其次利用聚类分析对各个城市在不同气温下的类别;再次利用因子分析对构成平均气温的各各月平均气温提取公因子;最后使用一些简单的SPSS数据处理技巧依据提出的公因子对各城市进行分类及排序。

3、实证分析

由于从国家统计局网站下载的数据为EXCEL格式,可以将数据导入成SPSS 数据,我们共设置了14个变量,分别是“城市”、“@1月”、“@2月”、“@3月”、“@4月”、“@5月”、“@6月”、“@7月”、“@8月”、“@9月”、“@10月”、“@11月”、“@12月”和“年平均气温”。样本是中国2012年全国重要城市平均气温的主要数据。数据参见附表1。

3.1、画基本图形

图1

通过图1可以看出全国平均的月份气温最低在0度左右,最高在25度左右,说明全国平均月份气温比较温和。

图2

条形图反映的是各个城市的年平均气温的情况,最高的为海口,最低的为哈尔滨,比较符合现实的气温分布。

3.2、相关分析

对于相关分析主要有以下几部分;

第一、对每个季度的平均气温进行简单相关分析;

第二、在控制年平均气温的情况下,再分别对各季度的平均气温进行偏相关分析。

3.2.1各季度平均气温的相关分析

相关性

1月2月3月

1月Pearson 相关性 1 .989**.981**

显著性(双侧).000 .000

N 31 31 31

2月Pearson 相关性.989** 1 .984**

显著性(双侧).000 .000

N 31 31 31

3月Pearson 相关性.981**.984** 1

显著性(双侧).000 .000

N 31 31 31

**. 在 .01 水平(双侧)上显著相关。

图3显示的是1月、2月和3月的平均气温的相关性,可以看出这三个月的相关性比较明显。通过这三个月的相关分析我们容易得到其他三个季度的气温也具有比较强的相关性。

3.2.2各个季度平均气温的偏相关分析

图4

相关性

控制变量1月2月3月

年平均1月相关性 1.000 .913 .724

显著性(双侧). .000 .000

0 28 28

df

2月相关性.913 1.000 .859

显著性(双侧).000 . .000

df 28 0 28

3月相关性.724 .859 1.000

显著性(双侧).000 .000 .

df 28 28 0

在控制年平均气温的情况下第一季度个月平均气温的相关性有所下降,但是没有改变它们的相关性。说明各个季度各个月份的平均气温都具有非常强的相关性。

图5

图5表示的是各个月份平均气温的相关图,可以看出每个月份之间的相关性都非常好。 3.3聚类分析

图8

聚类成员

案例号城市聚类距离

1 北京 3 4.686

2 天津

3 4.215

3 石家庄 3 6.470

4 太原 3 5.996

5 呼和浩特 1 4.772

6 沈阳 1 5.291

7 长春 1 7.295

8 哈尔滨 1 10.396

9 上海 2 3.933

10 南京 2 4.354

11 杭州 2 3.896

12 合肥 2 4.869

13 福州 4 8.106

14 南昌 2 5.977

15 济南 3 7.860

16 郑州 2 8.487

17 武汉 2 4.328

18 长沙(望城) 2 4.953

19 广州 4 1.885

20 南宁 4 3.346

21 海口 4 10.973

22 重庆(沙坪坝) 2 7.870

23 成都(温江) 2 5.005

24 贵阳 2 11.223

25 昆明 2 16.419

26 拉萨 3 17.504

27 西安(泾河) 3 7.079

28 兰州(皋兰) 1 8.338

29 西宁 1 13.208

30 银川 3 9.756

31 乌鲁木齐 1 7.466

通过聚类分析,由图6到图8我们可以清晰的看出,在图6和图8中对各个城市的划分比较统一,而在图7中我们显然发现对于气温我们可以分成4类,分别是5、6、7、8、9月为第一类,4、10月为第二类,3、11月第三类,1、

2、12月为第四类,很显然是根据气温的从高到低进行分类的,第一类温度

最高,第二类次之,第三类温度稍低,第四类温度最低。

3.4因子分析

在上面的研究中,我们分别对温度和城市进行了分类,并且对气温进行了相关分析,得出了气温的分布情况,并且研究了气温对城市的影响,但是由于各种变量的多重共线性问题,不太利于具体问题意义解释,因此我们可以利用因子分析对各个月份的平均气温变量提取公因子,对数据进行降维处理。

首先利用主菜单分析中的降维工具条进行因子分析。在对话框中,依次将“@1月”、“@2月”、“@3月”、“@4月”、“@5月”、“@6月”、“@7月”、“@8月”、“@9

月”、“@10月”、“@11月”和“@12月”添加到“变量”列表中。

接着在相应的按钮中选中输出相关系数矩阵和KMO和Bartlett的球形度检验的复选框,并且设置特征根大于1为提取公因子的要求,利用最大方差法进行因子旋转,最后保存因子得分变量,并显示因子得分系数矩阵,输出结果参见图9至图15

(1)KMO 和 Bartlett 的检验,如图9所示,KMO的取值为0.811,表明变量间有较强的相关性,数据很适合做因子分析。Bartlett检验的Sig.值为0.000,说明数据来自正态总体,适合进一步分析。

图9

KMO 和 Bartlett 的检验

取样足够度的 Kaiser-Meyer-Olkin 度量。.811

Bartlett 的球形度检验近似卡方1009.087 df 66 Sig. .000

(2)变量共同度,指的是按照所选标准提取相应数量主成分后,各变量中信息分别被提取的比例。如图10所示,所有变量共同度都在90%以上,所以提取这几个公因子对各变量的解释力非常好。

公因子方差

初始提取

1月 1.000 .984

2月 1.000 .987

3月 1.000 .990

4月 1.000 .952

5月 1.000 .890

6月 1.000 .925

7月 1.000 .962

8月 1.000 .924

9月 1.000 .952

10月 1.000 .984

11月 1.000 .987

12月 1.000 .986

提取方法:主成份分析。

(3

两个特征值大于1,所以只选取了前两个公因子;“提取平方和载入”一栏显示第一公因子的方差贡献率是82.367%,前两个公因子的方差总和占所有主成分方差的96.014%,可见选取前两个因子已足够替代原来的变量。

解释的总方差

成份

初始特征值提取平方和载入旋转平方和载入

合计方差的 % 累积 % 合计方差的 % 累积 % 合计方差的 % 累积 %

1 9.884 82.367 82.367 9.884 82.367 82.367 6.458 53.813 53.813

2 1.638 13.646 96.014 1.638 13.646 96.014 5.064 42.201 96.014

3 .260 2.166 98.180

4 .074 .618 98.798

5 .065 .545 99.343

6 .032 .266 99.610

7 .025 .208 99.818

8 .008 .070 99.888

9 .007 .056 99.944

10 .005 .040 99.984

11 .001 .010 99.994

12 .001 .006 100.000

提取方法:主成份分析。

可以看到有;两个成分的特征值超过1。

图12

(5)成分矩阵,如表13可见,所有的因子都聚集在第一主成分中,因此有必要进行因子旋转。我们利用最大方差法进行因子旋转得到的旋转成分矩阵如图13所示。

图13

成份矩阵a

成份

1 2

10月.992 -.032

4月.975 -.002

11月.958 -.262

9月.951 .216

1月.927 -.352

5月.916 .227

12月.906 -.407

2月.895 -.432

8月.838 .471

6月.821 .500

7月.750 .632

提取方法 :主成份。

a. 已提取了 2 个成份。

图14

旋转成份矩阵a

成份

1 2

2月.962 .246

12月.955 .273

3月.937 .333

1月.936 .329

11月.902 .417

10月.779 .615

4月.747 .627

7月.166 .966

6月.305 .912

8月.337 .900

9月.588 .778

5月.554 .763

提取方法 :主成份。

旋转法 :具有 Kaiser 标准化的

正交旋转法。

a. 旋转在 3 次迭代后收敛。

这样每个因子都很明确了,第一主成分包括1、2、3、4、10、11、12月,可以命名为较冷气温;第二主成分包括5、6、7、8、9月,可以命名为叫人气温。(6)成分得分矩阵

成份得分系数矩阵

成份

1 2

1月.210 -.104

3月.210 -.103

4月.076 .063

5月-.018 .165

6月-.133 .287

7月-.191 .344

8月-.121 .275

9月-.011 .163

10月.089 .050

11月.177 -.060

12月.230 -.131

提取方法 :主成份。

旋转法 :具有 Kaiser 标准化的

正交旋转法。

构成得分。

通过图15可以得出,F1=0.21*1月+0.239*2月+0.21*3月+0.076*4月-0.018*5月

-0.133*6月-0.191*7月-0.121*8月-0.011*9月+0.089*10月+0.177*11月+0.23*12月,F2也可以如此得出。

通过图16可见,各因子之间是正交的,即相互之间彼此独立。

图16

成份得分协方差矩阵

成份 1 2

1 1.000 .000

2 .000 1.000

提取方法 :主成份。

旋转法 :具有 Kaiser 标准化的

正交旋转法。

构成得分。

3.5因子分析后续分析

当我们获得两个因子的得分之后,就可以利用因子分析进行分类和排序,我们可以利用计算变量和排序来进行各城市的平均气温得分计算和排序,具体操作步骤

如下:

【1】打开数据文件,依次单击“转换”→“计算变量”命令,弹出如图4所示的对话框。

图17

在“目标变量”一栏中输入“综合得分”,这一变量将最终代表各个城市的综合

排名。综合得分=FAC1_1 * 53.813 + FAC2_1*42.201,单击“确定”,返回数据

文件可以看到“综合得分”这一变量。

【2】在数据文件中,在“综合得分”单元格上单击右键,在弹出的菜单中选择“降序”排列,对数据进行整理,得到综合排名,参见图18。

图18

观察“综合得分”一列,可以看出,海口、广州和南宁平均气温最高,因为该类城市所处纬度比较低,因此该类地区气温比较高;然而长春、哈尔滨和西宁的得分比较低,说明该类城市的平均气温比较低,因为长春和哈尔滨所处维度比较高,温度较为寒冷,西宁位于青海省,地势较高,容易受高寒气候影响,因此也较为寒冷。

3.6结论研究

通过以上的研究分析,我们可以从一种宏观的视野下对我国的城市的平均气温有一个比较全面的了解,这对于我们以后对工作和生活的城市有重要的借鉴和指导意义。同时,对于我们个人来说也是工作地选择的重要参考。比如,因子分析表明,排序靠前的南方沿海城市,平均气温比较高,适合冬季到南方生活和工作。

4、结论

本文利用了多种统计学的方法对各地区的平均气温进行了统计分析,加入了偏相关分析,这样有利于控制其他变量的影响。同时有借住聚类分析对各个城市在不同气温下的分类;又利用因子分析对各月平均气温进行降维处理,并且利用各因子得分可以计算综合成绩,进而对各地区进行综合排名,但是,由于缺少季度数据,在分析过程中用月度数据代替了季度数据,这点事本文的不足,有望在以后的数据分析中搜集更全面的数据,并且可以利用回归分析和多重对应分析对

各地区的平均气温进行更多信息的提取。

参考文献

[1] 赵辉,基于城市综合经济实力评价指标的统计分析

[J].spss论文

[2] 谢龙汉,尚涛.SPSS统计分析与数据挖掘[M].电子工业出版社,2012.1.

附表

本文数据选自2013年中国统计年鉴7-7

城市1月2月3

4月5月6月7月8月9月

10

11

12

北京-3.6 -1.3 5.9 16.

2

22.

8

25.

27.

4

26.

21.

1

14.

6

4.3 -4.2

12.

9

天津-3.8 -2.2 5.2 15.

6

22.

6

24.

7

27.

2

25.

2

20.

7

14.

6

4.5 -3.9

12.

5

石家庄-2.2 0.5 7.6 17.

9

23.

8

26.

6

28.

25.

8

20.

8

15.

6

5.3 -2.2

14.

太原-5.4 -2.2 4.8 14.

7

20.

9

22.

8

24.

5

22.

7

16.

7

10.

9

2.1 -4.7

10.

7

呼和浩特-10.

8

-7.7 0.7

11.

5

18.

4

20.

6

23.

7

21.

6

14.

3

7.2

-3.

7

-10.

7.2

沈阳-14.

-8.8

-0.

4

10.

5

18.

6

21.

6

24.

8

23.

17.

7

9.4

-0.

4

-12.

9

7.4

长春-16.

1

-11.

9

-3.

5

8.7

17.

2

20.

4

23.

5

22.

1

17.

7.0

-4.

9

-16.

7

5.2

哈尔滨-18.

3

-12.

4

-3.

3

7.8

16.

4

21.

3

23.

9

21.

8

16.

4

6.4

-5.

2

-19.

4

4.6

上海 4.7 4.4 9.5 17.

5

21.

3

24.

3

29.

7

29.

23.

7

19.

8

12.

2

6.3

16.

9

南京 2.9 3.0 9.0 17.

9

21.

9

25.

5

29.

4

28.

1

22.

3

18.

3

10.

3.5

16.

杭州 4.3 4.3 ##

#

19.

21.

8

25.

1

30.

8

28.

7

23.

4

19.

7

12.

1

6.0

17.

1

合肥 3.1 3.5 9.6 18.

8

22.

7

26.

7

30.

6

28.

2

22.

7

18.

6

10.

3.4

16.

5

福州10.0 10.6 ##

#

20.

23.

26.

5

29.

9

28.

8

25.

8

22.

4

17.

7

12.8

20.

2

南昌 5.0 5.5 ##

#

19.

5

23.

4

26.

5

31.

29.

6

24.

5

20.

9

12.

5

6.6

18.

济南-1.1 0.9 7.1 17.

6

23.

8

27.

28.

1

24.

7

20.

9

17.

3

7.1 -1.3

14.

3

郑州0.3 2.9 9.1 18.

5

23.

8

27.

8

28.

9

25.

9

21.

9

17.

3

8.6 0.5

15.

5

武汉 2.8 4.1 9.4 18.

2

22.

3

26.

6

30.

3

28.

22.

9

17.

8

10.

1

3.9

16.

4

长沙(望城) 4.1 5.4

##

#

19.

2

22.

9

27.

1

30.

9

28.

7

24.

5

19.

6

12.

2

5.9

17.

6

广州11.4 14.0 ##

#

23.

1

26.

8

27.

6

28.

1

28.

1

26.

23.

2

19.

2

14.6

21.

7

南宁9.8 12.1 ##

#

24.

27.

1

27.

5

28.

2

27.

9

25.

8

23.

8

19.

2

14.4

21.

4

海口16.4 17.8 ##

#

26.

6

28.

3

28.

4

28.

5

28.

1

27.

6

26.

1

24.

5

20.6

24.

6

重庆(沙坪坝) 7.2 8.7

##

#

20.

22.

5

24.

5

28.

5

29.

8

23.

2

18.

4

13.

4

9.4

18.

3

成都(温江) 5.0 6.0

##

#

17.

7

21.

2

22.

5

24.

8

26.

20.

9

17.

2

11.

6.8

15.

9

贵阳0.7 2.5 9.6 17.

1

19.

2

19.

8

22.

8

23.

18.

2

15.

6

10.

2

5.1

13.

7

昆明9.9 13.1 ##

#

17.

9

20.

8

20.

7

20.

5

20.

5

18.

3

16.

5

13.

9

9.5

16.

3

拉萨-1.1 3.8 6.6 8.9 15.

1

18.

1

16.

9

16.

7

15.

2

9.9 3.8 1.4 9.6

西安(泾河) -0.9 2.0 8.3

17.

8

21.

6

26.

7

27.

6

25.

5

19.

8

15.

6.4 0.2

14.

2

兰州(皋兰) -10.

1

-5.3 3.1

11.

3

15.

7

20.

4

21.

4

21.

1

14.

8.0

-1.

5

-7.6 7.5

西宁-10.

3

-6.3 1.0 8.4

12.

4

15.

4

17.

2

16.

4

11.

9

5.8

-2.

8

-6.5 5.2

银川-8.5 -4.7 4.5 13.

5

19.

3

23.

1

24.

8

23.

7

16.

3

10.

1

0.8 -5.2 9.8

乌鲁木齐-15.

-12.

0.5

14.

18.

7

23.

7

24.

6

23.

7

18.

1

8.9

-3.

9

-12.

6

7.4

相关主题
文本预览
相关文档 最新文档