基于主成份与聚类的新疆城市化发展水平综合评价
- 格式:pdf
- 大小:175.52 KB
- 文档页数:5
全国30省市自治区经济发展水平综合评价——基于因子分析和聚类分析王喆[摘要] 衡量一个地区的经济发展程度,要从其生产、消费等各个方面进行综合评价。
本文基于全国30省市自治区的GDP、CPI等8个经济指标的数据,应用因子分析的方法对其经济发展水平进行了排名和聚类分析的方法将其分为一线、二线、三线地区。
根据排名及分类结果,本文对各类地区的经济发展状况进行了全面评价,并提出了相关建议。
[关键词]因子分析;聚类分析;经济发展;综合评价一、数据背景1.变量选取本文选取了国民生产总值、居民消费水平、固定资产投资、职工平均工资、货物周转量、居民消费价格指数、商品价格指数、工业总产值等8个指标进行量化评价我国30个省、市、自治区(不包括重庆、香港、澳门、台湾)的经济发展水平状况。
二、数据描述1.描述统计本文计算了各变量的极大值、极小值、均值、标准差等指标(表1),计算结果表明,各变量均不存在缺失值,数据的完整性较好。
各地区的的居民消费价格指数、商品价格指数这两个指标差异不大,但是其他指标的差异很明显,这也符合我国经济发展不平衡、地区差异显著的特点。
表1 各变量的一般统计量描述表2.相关性分析根据各变量的经济含义,许多变量之间应该存在高度相关,为了更好的看出各变量的相关关系,本文计算了各变量之间的Pearson相关系数及相关的显著性检验(表2)。
结果表明,许多变量之间存在较强的相关关系,比如国民生产总值与固定资产投资之间的相关系数高达0.951,居民消费价格指数与商品价格指数之间的相关系数高达0.763。
**表示在0.01 水平(双侧)上显著相关。
*表示在0.05 水平(双侧)上显著相关。
三、因子分析1.KMO 和 Bartlett 的检验做因子分析之前,首先要进行KMO检验或Bartlett检验,只有当检验通过之后才能进行因子分析,一般认为KMO检验的结果大于0.5或Bartlett检验通过即适合进行因子分析。
新疆城市化水平的统计分析广义的城市化的内涵是指,构建融经济、居民生活方式与质量、人口、环境改善于一体的城市化水平评价指标体系。
本文运用主成分分析模型及对主成分分析结果的辅助聚类分析,找出各地区的优势和差距,以期为加快新疆城市化进程提供借鉴。
关键词:城市化水平指标体系主成分分析法聚类分析法改革开放以来,新疆城市化进程加快,但城市化水平仍滞后于经济发展水平。
如何客观、全面、真实地反映新疆城市化进程,对城市化程度进行综合评价,是一个值得关注的问题。
城市化水平的评价,属于多指标综合评价问题。
传统上大都采用主观赋权的方法,但由于其存在着赋权的主观性,不考虑指标之间的相关性等缺陷,使其评价的科学性受到质疑,从而使评价结果缺乏说服力。
为了克服这些缺陷,本文对所构建的指标体系采用主成分分析法这种客观赋权的评价方法,对新疆19个城市进行评价与分析,并对其结果进行聚类分析,以期为新疆城市化进程提供借鉴。
综合评价指标体系从现象上看,城市化是一个国家或地区城市数目增加或城市规模增大,城市人口占全部人口的比重上升的过程。
但从本质上,城市化是一个国家或地区经济发展与社会进步的过程,是一个国家或地区由传统农村文明向现代城市文明转化的过程。
因此,本文从广义城市化内涵出发,充分考虑到指标选取的针对性、层次性、全面性、可操作性及动态性原则,从四个方面确定了10项指标:人口城市化水平,人口城市化是区域城市化的核心,表现为人口向工业区聚集、农业人口转化为非农业人口,可以从人口结构、人口数量等方面设置指标。
本文选x1表示非农业人口比重反映人口城市化水平;经济城市化水平,经济城市化的核心内涵是经济结构的非农化,其中工业化是直接推动因素,第三产业的兴起与兴旺则是城市化向纵深拓进的表现。
因此可以从经济实力、产业结构、经济效益等方面设置指标,本文选x2表示人均GDP、x3表示工业增加值占GDP 比重、x4表示第三产业增加值占GDP比重来反映经济城市化水平;生活方式城市化水平,居民的生活环境、生活质量能在一定程度上反映生活方式的城市化水平。
基于面板数据的新疆城市经济发展因子聚类分析
德娜·吐热汗;张瑜;刘新平
【期刊名称】《新疆农业科学》
【年(卷),期】2012(049)010
【摘要】[目的]选取新疆15个地、州、市的主要城市,对其经济发展状况进行研究,说明城市经济的发展对新疆经济发展的作用.[方法]基于面板数据采用因子分析和聚类分析的方法.[结果]通过有效降维,提炼出三个具有代表性的公共因子,城市发展综合经济实力因子、城市发展潜力因子和第一产业因子,并以此作为聚类分析的输入,提高分析精度,所得结论与实际基本相符.[结论]各城市应该根据自身的特点和优势发展适合自己的产业.第一类城市要加快建设先进制造业基地;第二类城市要进行合理的产业结构调整;第三类城市要加快推进新型工业化,农牧业现代化和新型城镇化步伐.同时各城市也要重视第三产业的发展.
【总页数】6页(P1955-1960)
【作者】德娜·吐热汗;张瑜;刘新平
【作者单位】新疆农业大学数理学院,乌鲁木齐830052;新疆农业大学数理学院,乌鲁木齐830052;新疆农业大学管理学院,乌鲁木齐830052
【正文语种】中文
【中图分类】S-03
【相关文献】
1.基于因子分析与聚类分析的新疆15个城市(地区)产业综合实力研究 [J], 刘林军;吴黎军
2.基于因子分析和聚类分析的部分城市经济发展的综合评价 [J], 尚洁;骆旗;完颜娟
3.新疆各城市综合经济发展实力评价——基于因子分析 [J], 王亚珍;范楠楠;陈星;
4.基于因子和聚类分析的安徽省各城市经济发展评价 [J], 侯美婷[1]
5.新疆城市集聚能力评价研究——基于因子分析与聚类分析方法 [J], 张杰;龚新蜀因版权原因,仅展示原文概要,查看原文内容请购买。
2012年第21期科技管理研究Science and Technology Management Research2012No.21收稿日期:2012-02-14,修回日期:2012-06-13doi :10.3969/j.issn.1000-7695.2012.21.012基于主成份分析与聚类分析的新疆城市化发展水平综合评价约麦尔·玉苏普(新疆师范大学,新疆乌鲁木齐830054)摘要:在新疆城市化发展状况的基础上,从经济、社会、人口三个方面设计14个地区的城市化水平综合评价指标体系,运用主成份分析与聚类分析对这些地区的城市化水平进行综合评价及聚类,同时为以后的城市化发展提出提高第二三产业就业比重,增加城市人口数量及质量,加快社会基础设施建设与加快生活环境建设等相应的建议。
关键词:主成份分析;聚类分析;城市化;评价中图分类号:F291;F293.22文献标识码:A 文章编号:1000-7695(2012)21-0051-05Comprehensive Evaluation of Urbanization Development Level in XinjiangBased on Principal Components Analysis and Clustering AnalysisUMAR Yusup(Xinjiang Normal University ,Urumchi 830054,China )Abstract :The paper ,based on the development status of urbanization in Xinjiang ,designs out of the 14areas urbaniza-tion level of comprehensive evaluation index system ,comprehensive evaluation and clustering to the urbanization level of these areas from three aspects like economic ,social and population.At the same time for the later development of urbani-zation ,the paper puts forward the corresponding proposal about improving the proportion of second and third industry em-ployment ,increasing urban population quantity and quality ,speeding up the social infrastructure construction ,improving the living environment construction and so on.Key words :principal component analysis ;cluster analysis ;urbanization ;evaluate1新疆城市化概况起步阶段(1949—1957年):1949年新中国成立后,新疆的城市化发展进入了起步阶段。
当时只有乌鲁木齐市,到了1952年建制了伊宁市和喀什市,新疆非农业人口及城镇人口稳定发展即1949年城镇人口52.93万人,1951年59.85万人到1957年增加到94.07万人,城市化率(城镇人口比重)1949年的12%,1957年增加到17%。
非农业人口比重达到20%。
大起大落阶段(1958—1963年):1958年,国务院批准设置克拉玛依市,1961年设置哈密市,此时大量人口涌入城市,城市化速度骤增即1958年114.37万人,非农业人口136.62万人,城市化率20%。
至1960年底,全疆城镇人口已达180.04万人,非农业人口218.5万人,城市化率26%,从1961年开始,大量压缩城镇人口,撤销了哈密市,至1963年城镇人口压缩至139.32万人,非农业人口163.26万人,全区城镇化水平下降至19.5%。
停滞阶段(1964—1978年):由于“文化大革命”的动乱,城市工业发展受阻。
1964年新疆城镇人口136.01万人,非农业人口168.45万人,城市化率18.3%,直到1974年城镇人口213.91万人,非农业人口297.66万人,城市化率19%,只增加0.7%。
,截至1978年共设市7个,从1964年至1978年十五年间的平均城市化率19.6%,城市化水平始终保持在19.6%左右。
恢复发展阶段(1979—2000年):1978年,中共十一届三中全会确立的“一个中心,两个基本点”路线的引导下,新疆的工农业发展有了较快发展,经济发展和城市化建设步入持续稳定的恢复发展阶段。
1979年城镇人口361.2万人,非农业人口348.81万人,城市化率29%。
2000年,将昌吉,阿克苏,塔城,吐鲁番,库尔勒,阿勒泰,博乐,阿图什,和田,阜康,米泉,乌苏改为县级市,城市数量增加一倍,城镇人口达到624.18万人,城市化水平提高到33.8%,城市网络基本完善,空间布局逐步趋于合理。
2001年—至今:西部大开发以后(2002年)新疆城市人口密度达到187(人/平方公里),非农业人口684.1万人。
新疆的城市化进程步入了一个快速发展的时期,2009年,城市人口密度4922(人/平方公里),约麦尔·玉苏普:基于主成份分析与聚类分析的新疆城市化发展水平综合评价非农业人口928.86万人,占全区总人口的43.23%。
设市城市22个,其中,人口超过100万以上的特大城市1个,20万以上的中等城市15个,人口20万以下的小城市6个。
2基于主成份分析的新疆14个地(州),市城市化水平的实证分析2.1指标的选取在总结相关研究成果的基础上,指标的选取要遵循有效性、系统性、科学性、可比性和实际可操作性,独立性这五大原则,建立了如下指标体系:总指标一级指标二级指标新疆城市化水平的指标体系经济城市化指标X1人均GDP(万元)X2第二产业GDP的比重(%)x3地方财经预算收入(万元)X4人均固定资产投资(万元)x5第三产业GDP的比重(%)x6在岗职工平均货币工资(元)X7工业增加值GDP的比重(%)x8经济外向度(%)社会城市化指标x9社会劳动生产率(%)X10在岗职工(人)X11城市用水普及率(%)X12人均道路铺装面积(平方米)x13城市燃气普及率(%)x14人均公共绿地面积(平方米)x15平均每万人床位数(张)x16平均每万人医生数(人)人口城市化指标X17非农人口比重(%)X18城镇人口的比重(%)X19人口自然增长率(%)X20人口密度(人/平方公里)2.2样本数据来源及标准化处理(原数据及标准化数据省略)文章采用主成份分析和聚类分析法通过新疆14个地,州,市作为样本,对其市城市化水平实施评价,样本数据来源“新疆统计年鉴—2011”,“新疆统计年鉴—2010”,“中国统计年鉴—2011”。
首先,对指标体系中的20个指标依次排序命,名为:X1,X2,X3…X20。
由于各个指标的量纲不同,主成份分析之前各个样本数据要进行标准化处理以确保最后结构的准确性。
处理公式:x*ij =xij-x-jσj其中㊄Xj,为j个样本的样本算术平均值,σj 为样本的标准差,Xij为处理以后的样本指标值。
它们的计算方式为:x-j=1 n ∑ni=1xijσ2j=1n∑ni=1(xij-x-j)2;2.3主成份分析的KMO检验及相关系数矩阵对数据进行主成份分析可行性检验,由KMO和Bartlett检验结果知,在SPSS19的输出结果中,df= 351,KMO值=0.892>0.5,Barlett球形检验卡方统计量为1646.130,同时Bartlett检验的伴随概率为0.001,小于显著水平0.05,检验结果表明适用于进行主成份分析。
数据输入SPSS19软件进行数据处理,得出的相关系数矩阵结果知:这20个指标间的相关系数较大,多数变量之间存在高度的相关关系,表示这些指标代表的信息有较大的重复,可以通过主成份分析得到简化的主成份变量。
2.4提取主成份(特征值与特征向量)使用spss19统计分析软件对新疆14个地(州)市城市化水平评价指标体系数据进行计算,要算出矩阵特征值,贡献比例值和累计贡献比例值,结果如表1所示:表1解释的总方差成份初始特征值提取平方和载入旋转平方和载入合计方差的%累积%合计方差的%累积%合计方差的%累积% 17.96940.84640.8467.96940.84640.846 6.76234.81234.8122 4.06121.30462.149 4.06121.30462.149 3.46218.31152.1233 2.98915.94372.093 2.98915.94372.093 3.38617.92871.0514 1.7429.70887.801 1.7429.70887.801 3.15016.74987.801提取方法:主成份分析由特征值、累计贡献率可知,按照特征值大于1的原则选择4个主成份,各主成份的贡献率分别为40.846%,21.304%,15.943%与9.708%,累计贡献率为87.801%(一般累积贡献率≥85%为标准)。
可以说,我们所代表的信息量(4个主成份)就能较充分地解释并提供原始数据所能表达的信息。
2.5旋转主成份矩阵通过旋转变换,对主成份作合理解释。
按主成份载荷阵各列元素的绝对值大小,可判断主成份主要对那些变量有潜在支配作用。
是将具有相近的成份载荷的各个变量进行合理的解释并代表原来变量的含义。
结果如表2:表2旋转主成份矩阵a主成份1234X1人均GDP(万元)0.9100.0920.1160.208X2第二产业GDP的比重(%)0.9530.0130.1530.058x3地方财经预算收入(万元)0.1560.8610.2990.222X4人均固定资产投资(万元)0.867-0.071-0.0610.306x5第三产业GDP的比重(%)-0.8570.2150.1050.283x6在岗职工平均货币工资(元)0.4950.2470.6420.337X7工业增加值GDP的比重(%)0.9450.0650.1580.046x8经济外向度(%)-0.2800.697-0.4560.035x9社会劳动生产率(%)0.8360.0260.3980.207X10在岗职工(人)0.0480.9260.080-0.188 X11城市用水普及率(%)0.1690.0680.8270.035X12人均道路铺装面积(平方米)0.533-0.3730.336-0.409 x13城市燃气普及率(%)0.1950.0570.861-0.139 x14人均公共绿地面积(平方米)0.240-0.045-0.787-0.075 x15平均每万人床位数(张)-0.0610.4400.3770.506x16平均每万人医生数(人)0.4460.410-0.2000.597X17非农人口比重(%)0.7390.353-0.1210.652X18城镇人口的比重(%)0.6360.2030.0280.613X19人口自然增长率(%)-0.1680.258-0.003-0.845 X20人口密度(人/平方公里)0.0920.7130.2800.47725约麦尔·玉苏普:基于主成份分析与聚类分析的新疆城市化发展水平综合评价2.6对主成份经济意义的解释采用方差最大化正交旋转的方法,对主成份的特征向量进行旋转,旋转后的主成份结果从表2中可以看出:第一主成份对第二产业GDP的比重,工业增加值GDP的比重,人口密度,人均GDP、人均固定资产投资,社会劳动生产率,非农人口比重,城镇人口的比重,人均道路铺装面积这9个指标有较大的负荷系数,特别是在第二产业GDP的比重,工业增加值GDP的比重,人口密度,人均GDP的载荷大,因此可以将第一主成份定义为工业和人口因子Fac1。