山东省各市经济指标和地区特征的综合评价 —基于大数据方法
- 格式:pdf
- 大小:3.46 MB
- 文档页数:11
山东省地级市城市化水平综合评价摘要:为了客观、科学地了解山东省不同地区的社会经济发展水平,本文对山东省17个地级市的城市化水平进行对比研究。
本文主要采用主成分分析法和聚类分析法分别对山东省各地市的城市化水平和城市化分区进行研究,将山东省17个地级市划分为四个级别的城市化水平区域,同时,对评价结果进行分析,并提出合理建议。
关键词:山东省;城市化;综合评价中图分类号:f291.1 文献标识码:a 文章编号:1 引言城市化水平是一个国家或地区社会经济发展水平的重要标志之一。
目前,我国已经进入城市化快速发展时期,各个地区纷纷提出了加速城市化,以城市化推动区域经济快速发展的战略。
但科学的城市化战略必然要求对现有城市化水平的准确掌握,因而就需要城市化水平的综合评价。
本文以山东省17个地级市的城市化水平为研究对象,从人口城市化、经济城市化、地域景观城市化、生活方式城市化和环境城市化五方面共选取18项指标,构建山东省地级市城市化水平综合评价指标体系,并对其进行主成分分析和聚类分析,从而清楚的认识到山东省各地市城市化水平的现状、分类、区域差异以及在城市化过程中存在的问题,并提出相关建议。
2 评价指标体系的建立参考相关研究成果和各种指标体系的基础上,结合山东省的现在的具体情况和综合实力,同时考虑环境对城市化发展的重要性,本文从人口城市化、经济城市化、地域景观城市化、生活方式城市化和环境城市化五方面共选取18项指标,主要包括人均gdp(x1)、城镇居民家庭人均可支配收入(x2)、第二产业占gdp比重(x3)、第三产业占gdp比重(x4)、第二产业从业人员比重(x5)、第三产业从业人员比重(x6)、高等学校专任教师数(x7)、人口密度(x8)、城镇居民消费性支出(x9)、每万人拥有公共交通车辆(x10)、职工平均货币工资(x11)、城市人均日生活用水量(x12)、医院床位数(x13)、人均拥有道路面积(x14)、人均公园绿地面积(x15)、建成区绿化覆盖率(x16)、城镇生活污水处理率(x17)、工业固体废物综合利用率(x18),构建山东省17个城市的城市化水平综合评价体系,个指标数据主要来源于中国统计年鉴(2011)、山东统计年鉴(2011)相关数据。
山东省17个地级市经济发展水平测度———基于因子分析和聚类分析郑 静1,吴海伟2,郑小青3(上海金融学院公共经济管理学院,上海201209) [摘 要]为了评价山东省内各个城市的发展水平,依据经济学理论,选取了12项统计指标,利用因子分析法和聚类分析法,对各个城市的经济数据进行分析,根据综合因子得分和SPSS结果,发现这些城市的发展水平分为四个等级,并据此从政府调控、吸引内资和外资以及产业结构调整三个方面给出相应的建议。
[关键词]因子分析;聚类分析;SPSS;经济数据 一、山东省17个地级市经济发展水平测度指标体系的建立地区经济发展水平不仅仅要反映一个地区在一定时期内国民经济各方面的综合发展状况,而且也要反映该地区的国民经济持续发展的可能性。
因此,测度地区经济发展水平的评价指标不仅要反映该地区现有的经济实力,又要反映其经济发展前景。
本着科学性、实用性以及可操作性、可比性、可量化等原则,选取12个经济指标以全面、客观地反映各市的经济发展水平。
X1:地区生产总值;X2:工业增加值;X3:进口;X4:出口;X5:地方财政支出;X6:第二产业增加值;X7:第三产业增加值;X8:实际利用外资;X9:社会消费品零售总额;X10:城市居民消费性支出;X11:金融机构存款余额;X12:金融机构贷款余额。
根据《2009年山东省统计年鉴》得出山东省17个地级市的相应数据指标,对其进行标准化处理,即用公式:其中,是的期望,是的标准差,原始数据的标准化以消除不同量纲的影响。
二、山东省17个地级市经济发展水平测度的实证分析(一)山东省17个地级市经济发展水平的因子分析因子分析的基本思想是根据相关性大小将多个实测变量转换为少数几个不相关的综合指标的多元统计分析方法。
通过因子分析,即可使用较少的不相关的综合指标来描述原来观察的每一分量指标,在尽可能少的信息损失情况下,降低分析问题的复杂性的统计分析方法。
1.因子分析适宜性检验使用SPSS13.0对表1进行因子分析。
山东省循环经济指标体系构建及综合评价构建循环经济指标体系是为了更好地监测和评估循环经济的发展情况,为政府制定政策提供科学依据。
山东省循环经济指标体系应包括资源利用率、废物减量、能源消耗、环境排放等指标。
资源利用率指标包括各种资源的开发利用率,如水资源利用率、土地利用率等。
废物减量指标包括废物的产生量和处理率,如工业废物的减量和处理率、生活垃圾的减量和处理率等。
能源消耗指标包括能源的消耗量和能源利用效率,如碳排放量、能源利用率等。
环境排放指标包括大气、水和土壤污染物的排放量和污染物处理率等。
这些指标可以全面反映循环经济的发展状况和环境效益。
循环经济指标体系的构建应考虑到山东省的实际情况和特点。
山东省是一个经济发达的地区,资源丰富,工业基础雄厚。
循环经济指标体系应该注重资源的节约利用和废物的减量化处理。
山东省还有一个大规模的农业和渔业产业,循环经济指标体系还应包括农业资源利用率和渔业废物处理率等指标。
循环经济指标体系的评价可以采用定性和定量相结合的方法。
定性评价主要是根据各项指标的达成情况,对山东省的循环经济发展情况进行评估。
定量评价主要是对各项指标的数值进行计算和分析,得出综合评价指数,从而对山东省的循环经济发展做出全面评估。
综合评价指数可以采用加权平均或层次分析等方法进行计算,体现各个指标的重要性和权重。
通过循环经济指标体系的构建和综合评价,可以更好地推动山东省循环经济的发展。
政府可以根据评价结果,针对性地制定政策和措施,促进资源的节约利用和废物的减量化处理。
企业也可以通过评价结果,了解自身的循环经济发展情况,主动进行技术革新和管理创新,提高资源利用效率和减少废物的产生。
山东省循环经济指标体系的构建及综合评价是推动循环经济发展的重要举措。
通过科学的指标体系和评价方法,可以实现循环经济的可持续发展和资源的有效利用,促进经济的绿色发展和环境的改善。
山东省各市经济指标和地区特征的综合评价—基于大数据方法眭铭刚;柳向东【摘要】对2015年山东省各市的多个经济指标进行大数据方法分析,利用可视化方法显示出各市的一些指标,然后利用k-均值聚类算法对各市进行聚类,并结合数据挖掘,得出各地区经济排名及分类,为山东省经济规划提供了依据。
【期刊名称】《统计学与应用》【年(卷),期】2017(006)004【总页数】11页(P472-481)【关键词】大数据方法;经济指标;可视化分析;数据挖掘;k-均值聚类【作者】眭铭刚;柳向东【作者单位】[1]暨南大学经济学院,广东广州;;[1]暨南大学经济学院,广东广州【正文语种】中文【中图分类】F2对一个区域的经济分析,有利于该区域的经济规划,并为政府决策提供建议。
本文主要研究了山东省17个市的经济状况。
通过对8项经济指标(x1人均地区生产总产值(元/人)、x2人均工业总产值(元/人)、x3人均建筑业总产值(元/人)、x4人均实际使用外资(元/人)、x5人均入境旅游外汇收入(元/人)、x6人均批发零售贸易业营业利润(元/人)、x7人均公共财政收入(元/人)、x8人均农林牧渔业总产值(元/人))的研究和分析,利用大数据的方法探索出几个具有代表性的因子,并对各市进行分类,得出各市的经济排名以及区域特征,并根据研究得出一些指导性的建议。
陈伟[1]用多元统计分析中的主成分分析和因子分析法对武汉城市圈的经济状况进行了较科学的分析;左瑞琼[2]介绍了多元统计分析方法的主要内容以及在经济研究工作的应用;柳向东和陈锦岚[3]在大数据与数据可视化方法方面进行的研究。
本文就在此基础上探索了可视化方法包括脸谱图法和星象图法,并利用数据挖掘中的 k-means均值聚类以及因子探索分析等方法得出了一些经济指标的综合因子分类和相对应的政策建议。
在选取指标时,主要考虑这些指标能从国民经济、对外经济、旅游、财政、工业、农业等方面反映地区经济特性,统计数据应可靠且相关性较小。
山东省发展和改革委员会、山东省大数据局关于印发《山东省公共信用信息归集管理办法》的通知文章属性•【制定机关】山东省发展和改革委员会,山东省大数据局•【公布日期】2021.12.27•【字号】•【施行日期】2022.02.01•【效力等级】地方规范性文件•【时效性】现行有效•【主题分类】宏观调控和经济管理综合规定正文山东省发展和改革委员会、山东省大数据局关于印发《山东省公共信用信息归集管理办法》的通知省政府有关部门(单位),各市发展改革委、大数据局:《山东省公共信用信息归集管理办法》已经省政府同意,现印发给你们,请认真组织实施。
山东省发展和改革委员会山东省大数据局2021年12月27日目录第一章总则第二章公共信用信息采集归集第三章公共信用信息管理第四章附则山东省公共信用信息归集管理办法第一章总则第一条为规范和促进公共信用信息采集归集,加强公共信用信息管理,根据《山东省社会信用条例》,结合本省实际,制定本办法。
第二条本办法适用于本省行政区域内公共信用信息的采集、归集和管理活动。
法律、法规另有规定的,从其规定。
第三条公共信用信息,是指国家机关和法律法规授权的具有管理公共事务职能的组织以及人民团体等公共信用信息提供单位,在依法履行公共管理职责、提供公共服务过程中产生或者获取的信用信息。
第四条公共信用信息的采集、归集,应当遵循合法、安全、客观、及时、准确的原则,维护信息主体的合法权益,不得泄露国家秘密,不得侵犯商业秘密和个人隐私。
第五条县级以上人民政府发展改革、大数据部门负责本行政区域内公共信用信息归集管理,指导、监督公共信用信息的采集、归集、共享和使用。
第六条公共信用信息提供单位应当在各自职责范围内,依法依规做好本行业(领域)公共信用信息的采集、归集、异议处理、信用修复和信息安全等工作,及时将本行业(领域)产生或获取的公共信用信息提供给公共信用信息平台。
第二章公共信用信息采集归集第七条公共信用信息实行目录管理。
浅议山东省各地级市区域竞争力实证一区域竞争力评价方及算法步骤本文以山东17个地市作为研究对象采用主成分分析法,山东省各地市的区域竞争力进比较分析。
用主成分析法进行评价的思路是:先求出始p个指标的q个主成分,然后选少数几个主成分代替原始标,再将所选取的主成分进行综,就得到综合评价指标然后依据综合评价指标被评价对象进行比较用主成分分析法评价区域竞争力步骤为:(一)构建指标体系阵。
设n为样本,m为指标数,有X=x11x12x13...x1mx12x22x23...x2m...........................xn1xn2xn3 (x)nm其中,xij为第j个变量在第i个样本的观察值,(i=1,2…n;j=1,2,m)。
(二)对原指标数据进行标准化处理。
由于项指标数据的量纲统一,为消除变量间量纲上的不同,需要对原数据进行标准化处理若指标体系中有逆指标要转化为指标,本文采用Xik**=的方法将逆指标化为正指标,采用的标化公式:Xik**=(Xik-)/SK,其中Xik**为Xik 的倒数,Xik*为Xk中第i个观察值Xik标准值;为变量Xk中观察值的均值;SK为变量Xk标准差;i为第i时期k为第k个变量。
(三)计各变量数值之间的相关矩R。
R=(rjk)m×m式中,xijXik*分别为变量jk的观察值;rjk为变量j、k之间的相关系数,相关系数阵反映了各变量之的相关程度。
(四)计算相关系矩阵R的特征根R-?姿I、征向量矩阵U=(uij)mm,计算特征值及方差贡献率,成原指标到各成分转换,把原指标合成为各分,再合成为总评价的权数(五)构造区域争力综合指数。
将q主成分转化为一个综合指数Zt,映该区域经济的综合争力水平。
Zt=w1F1+w2F2+…+wqFqFi(i=12,…q)代表了该区域某方面的竞争力水平,wi(i=1,2,q)是这q个主成分的方差贡率,即某个主成分构成区域竞争力综合指数Zt的权重二实证分析本文的研究对是2009年山东省17个地市的区域竞争力。
Statistics and Application 统计学与应用, 2017, 6(4), 472-481Published Online October 2017 in Hans. /journal/sahttps:///10.12677/sa.2017.64053Economic Comprehensive Evaluation andRegional Characteristics Analysis of Citiesin Shandong Province—Based on Big Data AnalysisMinggang Sui, Xiangdong LiuSchool of Economics, Jinan University, Guangzhou GuangdongReceived: Oct. 9th, 2017; accepted: Oct. 23rd, 2017; published: Oct. 30th, 2017AbstractUsing the big data analysis, economic indicators in different cities of Shandong province in 2015 are investigated. Some economic indicators are visualized. Then the k-means cluster is used to cluster the cities. Both city rank and category are obtained by data mining, which provides the ba-sis for the planning of city economy.KeywordsBig Data Analysis, Economic Indicators, Visualization Method, Data Mining, k-Means Cluster山东省各市经济指标和地区特征的综合评价—基于大数据方法眭铭刚,柳向东暨南大学经济学院,广东广州收稿日期:2017年10月9日;录用日期:2017年10月23日;发布日期:2017年10月30日摘要对2015年山东省各市的多个经济指标进行大数据方法分析,利用可视化方法显示出各市的一些指标,然眭铭刚,柳向东后利用k-均值聚类算法对各市进行聚类,并结合数据挖掘,得出各地区经济排名及分类,为山东省经济规划提供了依据。
关键词大数据方法,经济指标,可视化分析,数据挖掘,k-均值聚类Copyright © 2017 by authors and Hans Publishers Inc.This work is licensed under the Creative Commons Attribution International License (CC BY)./licenses/by/4.0/1. 引言对一个区域的经济分析,有利于该区域的经济规划,并为政府决策提供建议。
本文主要研究了山东省17个市的经济状况。
通过对8项经济指标(x1人均地区生产总产值(元/人)、x2人均工业总产值(元/人)、x3人均建筑业总产值(元/人)、x4人均实际使用外资(元/人)、x5人均入境旅游外汇收入(元/人)、x6人均批发零售贸易业营业利润(元/人)、x7人均公共财政收入(元/人)、x8人均农林牧渔业总产值(元/人))的研究和分析,利用大数据的方法探索出几个具有代表性的因子,并对各市进行分类,得出各市的经济排名以及区域特征,并根据研究得出一些指导性的建议。
陈伟[1]用多元统计分析中的主成分分析和因子分析法对武汉城市圈的经济状况进行了较科学的分析;左瑞琼[2]介绍了多元统计分析方法的主要内容以及在经济研究工作的应用;柳向东和陈锦岚[3]在大数据与数据可视化方法方面进行的研究。
本文就在此基础上探索了可视化方法包括脸谱图法和星象图法,并利用数据挖掘中的k-means均值聚类以及因子探索分析等方法得出了一些经济指标的综合因子分类和相对应的政策建议。
2. 经济指标的建立在选取指标时,主要考虑这些指标能从国民经济、对外经济、旅游、财政、工业、农业等方面反映地区经济特性,统计数据应可靠且相关性较小。
由于每个地方的人口总数不一致,所以每项指标的总值并不能很好的代表每个地方的经济发展水平,所以本文将选取的2015年山东省统计年鉴中17个市8项经济指标进行人均化,建立如下的经济指标体系:x1人均地区生产总产值(元/人)、x2人均工业总产值(元/人)、x3人均建筑业总产值(元/人)、x4人均实际使用外资(元/人)、x5人均入境旅游外汇收入(元/人)、x6人均批发零售贸易业营业利润(元/人)、x7人均公共财政收入(元/人)、x8人均农林牧渔业总产值(元/人)。
3. 数据描述和可视化分析1) 各地区经济的星象(图1)。
2) 各地区经济的脸谱(图2)。
4. 基于数据挖掘的统计分析4.1. 主成分分析根据所搜集整理的数据[4],R3.3.2 [5]统计软件进行相关分析:从表1中可看出x7与x1、x2、x3、x4、x5相关性较强,尤其是与x1,即人均公共财政收入与人均眭铭刚,柳向东Figure 1. Star chart of economic analysis of cities 图1. 各市经济分析的星象图Figure 2. Face spectrum city economic analysis 图2. 各市经济分析的脸谱图地区生产总产值、人均工业总产值(元/人)、人均建筑业总产值(元/人)、人均实际使用外资(元/人)、人均入境旅游外汇收入(元/人)相关性较强,而尤其是与人均地区生产总值,这符合人均公共财政收入来源于这些项目的情况,故可把x 7删掉。
眭铭刚,柳向东Table 1.Coefficient matrix表1.系数矩阵X1X2X3X4X5X6X7X8 X1 1X20.869241 1X30.630158 0.313056 1X40.46119 0.095492 0.391481 1X50.493689 0.163757 0.366582 0.887571 1X60.172857 0.270783 0.078619 −0.10866 0.102032 1X70.909432 0.627116 0.690721 0.736312 0.674141 0.022955 1X80.388064 0.397192 −0.15383 0.148329 0.346287 0.266407 0.318146 1主成分分析的原理是设法将原来变量重新组合成一组新的相互无关的几个综合变量,同时根据实际需要从中可以取出几个较少的总和变量尽可能多地反映原来变量的信息,也是统计上处理降维的一种方法,是一种无指导学习方法。
下面做主成分分析,结果如下:Importance of components:Comp.1 Comp.2 Comp.3 Comp.4 Standard deviation 1.9999045 1.2467232 1.0808535 0.9118963Proportion of Variance 0.4999523 0.1942899 0.1460305 0.1039444Cumulative Proportion 0.4999523 0.6942421 0.8402727 0.9442170Comp.5 Comp.6 Comp.7 Comp.8 Standard deviation 0.56468885 0.31901161 0.13468005 0.0865060867Proportion of Variance 0.03985919 0.01272105 0.00226734 0.0009354129Cumulative Proportion 0.98407620 0.99679725 0.99906459 1.0000000000Loadings:Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 Comp.7 Comp.8 x1−0.464 0.194 0.209 0.155 0.367 0.732x2−0.338 0.472 0.238 0.269 −0.436 −0.226 −0.450 −0.299x3−0.330 −0.178 0.521 −0.313 0.596 −0.147 −0.335x4−0.363 −0.456 −0.285 −0.285 0.431 −0.498 0.243x5−0.379 −0.296 −0.419 −0.197 −0.104 −0.692 0.194 −0.165x60.492 −0.141 −0.821 −0.136 0.189x7−0.484 0.110 0.467 0.480 −0.536x8−0.209 0.405 −0.584 0.276 0.581 −0.177结果表明前4个主成分已达94%的累积贡献率,这说明前4个主成分已经反映了信息的94%,于是前4个因子可以作为评价山东省17个市的经济发展指标的综合变量。
从而达到降维的目的,而损失的信息却不多。
上面Loadings反映了载荷的大小,它反映了原变量指标与主成分的相关关系,即反映了原变量对于主成分的重要程度。
在解释主成分时,我们需要考察载荷,同时也需要考察一下原变量与主成分的相关眭铭刚,柳向东系数。
前者是从多变量的角度,后者是从单变量的角度,因而前者应更值得重视[6]。
而我们知道相关系数与载荷同符号,且成正比(图3)。
下面得出前四个主成分: F 1代表反映地区的综合经济实力112345780.4640.3380.3300.3630.3790.4840.209F x x x x x x x =−−−−−−−第1主成分对应载荷的符号相同,且其值都在0.3左右,差别不大,它反映了地区的综合经济实力。
综合经济实力较强的地区,它的8项指标的值都较大,所以第1主成分的值较小(因为载荷均为负数);而综合实力较弱的地区,它的8项指标的值都较小,因此第1主成分的值就较大。
所以称第1主成分为综合经济因子。
F 2代表反映批发零售贸易业、工业实力21234580.1940.4720.1780.4560.2960.49260.405F x x x x x x x =+−−−++第2主成分中x 1、x 2、x 6、x 8对应的载荷为正,载荷总和为1.563,而x 1、x 2、x 6、x 8分别代表人均地区生产总值、人均工业生产总值、人均批发零售贸易业营业利润、人均农林牧渔业总产值,其中x 2、x 6、x 8对应的载荷较大;x 3、x 4、x 5对应载荷为负,载荷绝对值总和为0.93,x 4有绝对值较大的负载荷,x 4代表人均使用外资;结合变量的含义,第2主成分反映了批发零售贸易业、工业相对于外商投资的经济状况,称为批发零售、工业因子。