当前位置:文档之家› 我国水资源分布及其现状的分析

我国水资源分布及其现状的分析

学号:

HEBEI UNITED UNIVERSITY

多元统计分析论文

论文题目:对我国水资源分布及其现状的分析

------基于主成分分析和聚类分析学生姓名:

专业班级:

学院:

指导教师:

2014年12月12 日

摘要:水资源是人类赖以生存的资源,近年来,随着经济的增长,人们对于水

的需求越来越大,而水资源总量在不断减少,我国大部分地区已经出现了水资源不足的现象,局部地区水资源极度缺乏,这警示我们需要防患于未然,对我国水资源基本情况进行了解,据此,本文将对我国的水资源分布及其现状进行分析。

本文主要采用多元统计分析中的主成分分析和聚类分析的分析方法,借助于SPSS软件,初步了解影响水资源的因素,寻找所得因素在我国各个省市中的数据,进行分析,通过分析结果来了解我国的水资源在我国各个省市的分布情况及其现状,进一步给出针对我国水资源分布及其现状的合理意见及建议。

关键词:水资源分布及现状省市主成分分析聚类分析

Abstract:Water is the survival of human resources.Recently,As the

growth of the economy,People’s of demand for water is growing.However,the number of water is becoming less and less.Most areas in China has appeared the phenomenon of insufficient water resources.Moreover,some areas extreme lack of water resources,which warn us need to nip in the bud to understand the basic water resources situation in our country.On the basis of it this article will analyze the distribution of water resources and its status of our country.

This article,mainly adopting principal component analysis and cluster analysis in multivariate statistical analysis,with the aid of SPSS software,preliminary understanding of the influencing factors of water resources.Finding the factors of data in various provinces and cities in our country,and then,analyzing.By analyzing the results to get to know the distribution of our country's water resources and its present situation in various provinces and cities in our country,eventually,we will give reasonable opinions and suggestions ,aiming at the distribution of our country's water resources and its present situation.

目录

摘要--------------------------------------------------------(错误!未定义书签。)

Abstract----------------------------------------------------(错误!未定义书签。)

1.引言------------------------------------------------------(1)

2.研究对象--------------------------------------------------(1)

3.数据分析--------------------------------------------------(2)

3.1描述性统计分析-----------------------------------------(2)

3.2主成份分析---------------------------------------------(4)

3.3聚类分析-----------------------------------------------(8)

4.结论------------------------------------------------------(10)

对我国水资源分布及其现状的分析

------基于主成分分析和聚类分析

1引言

水是人类赖以生存的资源,在人类的生产生活中必不可少。我国是一个严重缺水的国家,且水资源区域分布不均。据统计我国的淡水资源总量为28000亿立方米,占全球水资源的6%,然而人均水资源总量只有2300立方米,仅为世界平均水平的1/4,在世界排名中占地121位。因此,深刻剖析其现状,寻求保护以及充分利用水资源的有效之法刻不容缓。

水资源的水量、水质以及可持续利用性等等,关系着国民的日常生活。而在对水资源的分析过程中,影响因素种类繁多,若就其单一因素对我国的水资源现状进行分析,结果必定会存在着很大的误差。本文将从影响水资源的众多指标中,选取最具代表性,最具科学的指标,运用多元的知识(主成分分析,因子分析)进行分析,得出我国的水资源现状。

2研究对象

由于在水资源的影响因素中,地表水量,地下水量,重复计算量,水资源总量,年产水模数,年降水量,年径流深,年降水总量,年径流量等8个指标影响意义极为重大。因此,本文将采用上述指标在18个省市中的数据为样本,分析我国的水资源现状。

水资源在各个地区的分布有一定的差异,我们从历年的数据中,找到了我们关于上述变量的数据如下

城市地表

水量

8

10

立方

米)

地下水

量(8

10

立方

米)

重复计

算量

(8

10

立方

米)

水资源

总量

(8

10

立方

米)

年产水

模数

(4

10

立方米

/3

10公

里)

年降水

量(毫

米)

年径流

深(毫

米)

年降水

总量

(8

10

立方

米)

年径

流量

8

10

立方

米)

北京25.3 26.2 10.7 40.8 24.29 625 150.6 105 25.3 天津10.8 5.8 2 14.6 12.91 604.2 95.5 68.3 10.8 河北167 145.8 75.9 236.9 12.62 550.9 89 1034 167 山西115 94.6 66.1 143.5 9.18 531.8 73.6 831 115 内蒙古371 248.3 112.6 56.7 4.39 275.9 32.2 3183 371 辽宁325 105.5 67.3 363.2 24.96 687.3 223.4 1000 325 上海18.6 12 3.7 26.9 43.49 1052.5 300.7 65.1 18.6

江苏249 115.3 38.9 325.4 31.88 996.3 243.9 1017 249 安徽617 166.6 106.8 676.8 48.49 1139.2 442.1 1590 617 江西1416 322.6 316.2 1422.4 85.08 1591.1 847 2660 1416 河南311 198.9 102.2 407.7 24.41 772.5 186.2 1290 311 湖北946 291.3 256.1 981.2 52.78 1165.1 508.9 2166 946 广东2111 545.9 522.8 2134.1 100.66 1772.1 995.7 3757 2111 四川3131 801.6 798.8 3133.8 55.21 1037.5 551.6 5889 3131 贵州1035 258.9 258.9 1035 58.76 1188.9 587.6 2094 1035 云南2221 738 738 2221 57.86 1256.7 578.6 4824 2221 西藏4482 1094.3 1094.3 4482 37.31 593.7 373.1 7132 4482 青海623 258.1 254.9 626.2 8.66 285.5 86.2 2064 623

3数据分析

3.1描述性统计分析

根据上面的原始数据,下面我们运用SPSS软件进行描述性统计分析,由描述性统计过程得到:

描述统计量

N 极小值极大值均值标准差地表水量18 10.80 4482.00 1009.7056 1239.39670

地下水量18 5.80 1094.30 301.6500 302.13680

重复计算量18 2.00 1094.30 268.1222 316.96481

水资源总量18 14.60 4482.00 1018.2333 1239.72957

年产水模数18 4.39 100.66 38.4967 26.89184

年降水量18 275.90 1772.10 895.9000 418.01330

年径流深18 32.20 995.70 353.6611 279.02111

年降水总量18 65.10 7132.00 2264.9667 2016.69720

年径流量18 10.80 4482.00 1009.7056 1239.39670

描述统计量

N 极小值极大值均值标准差地表水量18 10.80 4482.00 1009.7056 1239.39670

地下水量18 5.80 1094.30 301.6500 302.13680 重复计算量18 2.00 1094.30 268.1222 316.96481 水资源总量18 14.60 4482.00 1018.2333 1239.72957 年产水模数18 4.39 100.66 38.4967 26.89184 年降水量18 275.90 1772.10 895.9000 418.01330 年径流深18 32.20 995.70 353.6611 279.02111 年降水总量18 65.10 7132.00 2264.9667 2016.69720 年径流量18 10.80 4482.00 1009.7056 1239.39670

有效的 N (列表状

态)

18

由上表可以看到上述9个指标中,样本的极大值和极小值均存在着较大差异,这表明我国的水资源在各省市中存在着时空分布不均的现象。再看表中的极小值,地下水量,年产水模数的极小值仅为5.80和4.39,可见我国局部地区水资源紧缺现象严重。其中,地表水量,降水总量,年降水总量标准差显著偏高,表明我国的水资源地区分布严重不平衡。

为了更好的说明问题,我们运用SPSS对上述数据进行相关性检验

相关矩阵

地表水量地下水

重复计

算量

水资源

总量

年产水

模数

年降水

年径流

年降水

总量

年径流

相关地表水

1.000 .980 .986 .998 .491 .299 .546 .955 1.000

地下水

.980 1.000 .993 .974 .422 .237 .485 .982 .980

重复计

算量

.986 .993 1.000 .982 .451 .265 .513 .963 .986

水资源

总量

.998 .974 .982 1.000 .505 .321 .558 .938 .998

年产水

模数

.491 .422 .451 .505 1.000 .961 .991 .399 .491

年降水

.299 .237 .265 .321 .961 1.000 .936 .206 .299

年径流

.546 .485 .513 .558 .991 .936 1.000 .470 .546

年降水

总量

.955 .982 .963 .938 .399 .206 .470 1.000 .955

年径流

1.000 .980 .986 .998 .491 .299 .546 .955 1.000

由上表可知,部分指标之间的相关系数很大,表明这些变量存在着某些相关

性,例如地表水量和地下水量的相关系数为0.980,这说明地表水量和地下水量

存在着较强的关联性。而实际上我们也知道,地表水量在很大程度上受地下水量

的影响。因此有必要对这9个变量进行降维处理。

3.2主成分分析

考虑到上述指标之间的相关性较大,在此,我们构造新的衡量指标衡量城市

的水资源量,对此我们进行主成分分析,其分析结果如下表所示:

解释的总方差

成份

初始特征值提取平方和载入

合计方差的 % 累积 % 合计方差的 % 累积 %

1 6.74

2 74.910 74.910 6.742 74.910 74.910

2 2.124 23.599 98.509 2.124 23.599 98.509

3 .077 .85

4 99.364

4 .033 .370 99.733

5 .017 .188 99.921

6 .004 .04

7 99.969

7 .002 .025 99.994

8 .001 .006 100.000

9 2.946E-16 3.273E-15 100.000

提取方法:主成份分析。

由上表可知,前两个主成分的累积贡献值达到了98.509%>90%,因此我们选择前两个主分量。

成份矩阵a

成份

1 2

地表水量.972 -.218

地下水量.952 -.288

.960 -.257

重复计算

.972 -.197

水资源总

年产水模

.670 .740

年降水量.502 .855

年径流深.719 .686

.929 -.302

年降水总

年径流量.972 -.218

提取方法 :主成分分析法。

a. 已提取了 2 个成份。

我们知道上表是因子荷载阵,而不是主成份的系数矩阵,我们将上表转化成主成分系数矩阵,将上表中的第i列的每个元素分别除以第i个特征根的平方根 ,得到结果如下表所示

主成份的系数矩阵

F1 F2

x1 0.374 -0.150

x2 0.367 -0.198

x3 0.370 -0.176

x4 0.374 -0.135

x5 0.258 0.508

x6 0.193 0.587

x7 0.277 0.471

x8 0.358 -0.207

x9 0.374 -0.150

由此,我们可以得到如下结果:

F1=0.374x1+0.367x2+0.370x3+0.374x4+0.258x5+0.193x6+0.277x7+0.358x8+0.

374x9

F2=-0.150x1-0.198x2-0.176x3-0.135x4+0.508x5+0.587x6+0.471x7-0.207x8-0 .150x9

根据上表,我们可看出2个新变量和9个原始变量的关系,其中第一主成份包含地表水量,地下水量,重复计算量,水资源总量,年降水总量,年径流量;第二主成份包含年产水模数,年降水量。

根据上述变量的样本数据我们利用SPSS计算其Z得分如下表所示:

Z地表水量Z地下

水量

Z重复

计算量

Z水资

源总量

Z年产

水模数

Z年降

水量

Z年径

流深

Z年降

水总量

Z年径

流量

-0.794 -0.912 -0.812 -0.788 -0.528 -0.648 -0.728 -1.071 -0.794 -0.806 -0.979 -0.84 -0.81 -0.951 -0.698 -0.925 -1.089 -0.806 -0.68 -0.516 -0.606 -0.63 -0.962 -0.825 -0.949 -0.61 -0.68 -0.722 -0.685 -0.637 -0.706 -1.09 -0.871 -1.004 -0.711 -0.722 -0.515 -0.177 -0.491 -0.776 -1.268 -1.483 -1.152 0.455 -0.515 -0.552 -0.649 -0.634 -0.528 -0.503 -0.499 -0.467 -0.627 -0.552 -0.8 -0.959 -0.834 -0.8 0.186 0.375 -0.19 -1.091 -0.8 -0.614 -0.617 -0.723 -0.559 -0.246 0.24 -0.393 -0.619 -0.614 -0.317 -0.447 -0.509 -0.275 0.372 0.582 0.317 -0.335 -0.317 0.328 0.069 0.152 0.326 1.732 1.663 1.768 0.196 0.328 -0.564 -0.34 -0.523 -0.492 -0.524 -0.295 -0.6 -0.483 -0.564 -0.051 -0.034 -0.038 -0.03 0.531 0.644 0.556 -0.049 -0.051

0.889 0.808 0.803 0.9 2.312 2.096 2.301 0.74 0.889

1.712 1.655 1.674 1.706 0.622 0.339 0.709 1.797 1.712 0.02 -0.141 -0.029 0.014 0.754 0.701 0.838 -0.085 0.02 0.977 1.444 1.482 0.97 0.72 0.863 0.806 1.269 0.977

2.802 2.623 2.607 2.794 -0.044 -0.723 0.07 2.413 2.802 -0.312 -0.144 -0.042 -0.316 -1.11 -1.46 -0.959 -0.1 -0.312 根据两个主成份的累积贡献率得到各权重分配如下:

F=74.910F1+23.599F2

由此再根据各城市相关数据进行转换得到因子得分表如下表所示:

F1 F2 北京-2.37013 -0.101723 天津-2.60208 -0.410254 河北-2.046526 -0.795806 山西-2.273154 -0.831052 内蒙古-1.69165 -1.77072 辽宁-1.663037 -0.161639 上海-1.880978 1.135626 江苏-1.509898 0.468021 安徽-0.516164 1.059577 江西 1.77655 2.465369 河南-1.455411 -0.226988 湖北0.321854 0.952565 广东 3.498539 2.645927 四川 4.211007 -0.889295 贵州0.48924 1.231944 云南 3.201747 0.01849

西藏 5.800436 -3.10925 青海-1.289551 -1.679725

根据因子得分表,从而,我们可以得到各个省市的综合评价值如下:

省市综合评价值排名

西藏361.1355 1

广东324.5168 2

四川294.4601 3

云南240.2792 4

江西191.2616 5

贵州65.72161 6

湖北46.589667

安徽-13.66098

江苏-102.0629

上海-114.10410

河南-114.38211

辽宁-128.39312

青海-136.2413

内蒙古-168.50914

河北-172.08515

北京-179.94716

山西-189.89417

天津-204.60318

由最后结果可知,从整体上看,我国东南部水资源量高于其他地区,而局部分析数据,可以看出,我国西藏地区水资源量最为充足,广东,四川等地局于后位。而北京,天津,山西,内蒙古等地出现了严重的缺水现象。

根据以上分析过程,我们可以看出,我国的水资源总量不足,地区分布步不均,部分地区出现了极度缺水的现象,水资源短缺现象已经成为我国面临的重大问题。

接下来,我们运用聚类分析,对问题做进一步的说明。

3.3聚类分析

利用SPSS对各个省市之间进行聚类分析,以此进行指标的重要性的评判,我们采用组间联接的聚类方法,以欧式距离为判断标准,进行分析,下面是我们的分析过程:

聚类表如下:

聚类表

群集组合

系数

首次出现阶群集

下一阶群集 1 群集 2 群集 1 群集 2

1 3 4 .070 0 0 5

2 12 15 .157 0 0 8

3 6 11 .190 0 0 6

4 1 2 .227 0 0 5

5 1 3 .583 4 1 9

6 6 8 .593 3 0 9

7 5 18 .867 0 0 13

8 9 12 .945 0 2 14

9 1 6 1.287 5 6 11

10 14 16 2.274 0 0 15

11 1 7 2.512 9 0 13

12 10 13 3.033 0 0 15

13 1 5 4.060 11 7 14

14 1 9 7.475 13 8 16

15 10 14 11.607 12 10 16

16 1 10 27.625 14 15 17

17 1 17 55.095 16 0 0

得到树状图如下:

C A S E 0 5 10 15 20 25

Label Num +---------+---------+---------+---------+---------+

北京 1 -+

天津 2 -+

上海 7 -+-----+

河北 3 -+ |

山西 4 -+ |

辽宁 6 -+ |

河南 11 -+ |

江苏 8 -+ +-----------------------------------------+

湖北 12 -+ | |

贵州 15 -+ | |

安徽 9 -+-+ | |

青海 18 -+ +-+ | |

江西 10 ---+ +-+ |

内蒙古 5 -----+ |

广东 13 -+-----+ |

云南 16 -+ +---------------+ |

四川 14 -------+ +-------------------------+

西藏 17 -----------------------+

由分析所得,我们可以看出,在阈值选取为10的情况下,我们可以将样本分为三类,第一类为西藏,第二类为广东,云南,四川,第三类为背景,天津,上海,河北,山西,辽宁,河南,江苏,湖北,贵州,青海,江西,内蒙古。可见,我国的水资源分布极其不均,大部分地区水资源处于贫乏状态,仅西藏地区水资源较为充足。

我们可以看出,西藏的地表水量为4482,地下水量为1094.3,年降水总量为7132.00,年径流量为4482.00,这些指标在西藏地区的数据都明显高于其他地区。可见,在水资源的分布影响因素中,这些指标占据了重要的位置。

在第二类中,广东,云南,四川,而上述指标在这些地区的数据趋于中间水平,说明,我国少数地区水资源比较充足,其水资源量虽不能比及西藏,但水资源较为丰富,一定程度上能满足人们的生产和生活。由此可见,我国少数地区水资源可以满足自身的地区需求。

我国大部分省市都位于第三类。这些地区在上述指标中数据较小,明显可以看出,这些地区的水资源较少,甚至有些地区表现出来了季度的匮乏,如山西,天津等地。

通过以上分析,我们可以看出,我国大部分地区表现出了水资源不足,仅少

数地区水资源较为丰富。我国的水资源短缺,地区分布不均现象显而易见。这与我们在之前的主成分分析中得到的结果一致。

4意见及建议

通过以上分析,我们得到的最终结果,了解到我国水资源紧缺,地区分布不均现象严重。因此,在我国的经济发展过程中,我们必须时刻谨记以水资源保护为前提,杜绝水资源浪费现象。对此,我们给出以下几点建议:

(1)加强宣传,强化资源意识

(2)建立健全地下水管理保护的制度体系

(3)统一管理,实行水权制度改革

(4)加强防治,改善水资源环境

(5)节约用水,减少人为浪费

(6)坚持治理水污染,加强水环境保护

水资源保护是全民共同的责任和使命,水资源与国民生活息息相关,与我们生活的方方面面有着千丝万缕的联系,我们必须以水资源保护为己任,全民共同行动。这样,我们的生活才能更加美好,幸福。

参考文献:

【1】何晓群多元统计分析出版地:中国人民大学出版社 2011-7 第六章228-237 第七章265-273

【2】武宝志、张孝荣、高宏开展水资源的探讨吉林省水文水资源局 2010-3 25卷4期1335-1479

【3】江培福、谢春芳城市水资源监测系统设计研究内蒙古水利 2011-7 39卷第6期85-93

【4】李靖华、郭耀煌主成分分析用于多指标评价的方法研究——主成分评价 2002《管理工程学报》第1期

【5】阎慈琳关于用主成分分析做综合评价的若干问题 1998年第2期数理统计与管理

【6】傅景广、许刚、王裕国基于遗传算法的聚类分析 2004年 04期《计算机工程》

附录: 原始数据

城市地表

水量

8

10

立方

米)

地下水

量(8

10

立方

米)

重复计

算量

(8

10

立方

米)

水资源

总量

(8

10

立方

米)

年产水

模数

(4

10

立方米

/3

10公

里)

年降水

量(毫

米)

年径流

深(毫

米)

年降水

总量

(8

10

立方

米)

径流

量(8

10

立方

米)

北京25.3 26.2 10.7 40.8 24.29 625 150.6 105 25.3 天津10.8 5.8 2 14.6 12.91 604.2 95.5 68.3 10.8 河北167 145.8 75.9 236.9 12.62 550.9 89 1034 167 山西115 94.6 66.1 143.5 9.18 531.8 73.6 831 115 内蒙古371 248.3 112.6 56.7 4.39 275.9 32.2 3183 371 辽宁325 105.5 67.3 363.2 24.96 687.3 223.4 1000 325 上海18.6 12 3.7 26.9 43.49 1052.5 300.7 65.1 18.6 江苏249 115.3 38.9 325.4 31.88 996.3 243.9 1017 249 安徽617 166.6 106.8 676.8 48.49 1139.2 442.1 1590 617 江西1416 322.6 316.2 1422.4 85.08 1591.1 847 2660 1416 河南311 198.9 102.2 407.7 24.41 772.5 186.2 1290 311 湖北946 291.3 256.1 981.2 52.78 1165.1 508.9 2166 946

广东2111 545.9 522.8 2134.1 100.66 1772.1 995.7 3757 2111 四川3131 801.6 798.8 3133.8 55.21 1037.5 551.6 5889 3131 贵州1035 258.9 258.9 1035 58.76 1188.9 587.6 2094 1035 云南2221 738 738 2221 57.86 1256.7 578.6 4824 2221 西藏4482 1094.3 1094.3 4482 37.31 593.7 373.1 7132 4482 青海623 258.1 254.9 626.2 8.66 285.5 86.2 2064 623

相关主题
文本预览
相关文档 最新文档