应用多元统计分析论文

  • 格式:docx
  • 大小:93.98 KB
  • 文档页数:12

下载文档原格式

  / 12
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

应用多元统计分析论

Revised on November 25, 2020

山东省十一城市综合实力统计分析摘要:本文根据中国城市经济发展研究中心提出的城市综合经济实力和区域的概念,并利用2009年各城市社会经济发展状况的截面数据,就山东省11市的经济数据进行分析。首先建立了评价的指标体系,其次,分别采用主成分分析法和聚类分析法对山东省根据行政区域划分的11个市的综合经济实力进行了全面的评价和比较,并在此基础上提出了促进山东各市经济协调发展、共同进步的相关措施。

关键词:城市经济主成分分析聚类分析

一、引言

在区域经济发展中,城市处于核心和龙头的地位,提高城镇化水平、加快城市化进程是解决当前和未来一系列问题的关键。山东经济发展显示出不平衡的态势,鲁东的少数几个城市GDP几乎占据全省三分之二[1]。很显然,山东省各市的城市化水平也存在显着差异, 青岛、济南等的城市化水平始终走在全省乃至全国前列,泰安和滨州则相对落后。随着黄河三角洲经济一体化进程的加快,山东作为沿海省份必须清楚的看到发展差异并找出差异形成的原因,通过核心城市的优先发展带动区域经济和社会的快速发展,是现实提出的急需解决的问题。

为此,本文在参阅相关文献的基础上,根据中国城市经济发展研究中心提出的城市综合经济实力以及区域的概念,根据区域的行政划分,从山东省11个市出发,利用2009年各城市社会经济发展状况的截面数据,首先建立了评价指标体系,其次,分别采用主成分分析法和聚类分析法对山东省11个市的综合经济实力进行了综合的评价和排位,并在此基础上提出了促进山东省各市经济协调发展、共同进步的相关措施。

面对区域差距带来的影响,山东省应该继续加大固定资产投资的力度,在制定区域发展策略时应该加强区域间的交流和合作,促进各地区优势互补,共同发展。同时,也要积极鼓励引进外资和开拓国际市场,加快与国际经济的接轨和融合。另外,还要继续扩大中心城市的规模,在积极建设环渤海产业带的同时,不断加强鲁西和鲁中产业带的建设,提高中心城市的综合竞争力,扩大其对周围地区的辐射和带动作用,最终逐步缩小区域差距,促进各地区和谐发展、共同繁荣。

城市综合经济实力是指城市所拥有的全部实力、潜力及其在国内外经济社会中的地位和影响力。从此定义可以看出,评价城市综合实力应使用城市经济总量,它应该包括国内生产总值、固定资产状况、社会消费水平、外贸出口水平、交通运输能力、通讯设施状况、地方财政实力、人才科技状况及社会医疗保障水平等统计指标[2]。

二、山东省各地区的模型经济分析

本文选取了以下10项指标来构建评价体系。X1:人均生产总值(元);X2:地区生产总值(亿元);X3:财政收入占GDP的比重(%);X4:第三产业产值比重(%);X5:全社会固定资产投资总额(亿元);X6:社会消费品零售总额(亿元);X7:出口总额(亿元);X8:货运总量(万吨)(铁路+公路+水运);X9:每万人中科技人员数(人/万人);X10:每万人医院卫生院床位数(个/万人)[1]。

本文以山东省11个市作为样本,选用上述10个评价指标,则评价样本矩阵为表1。

山东省统计局. 山东省统计年鉴—2010[M]. 中国统计出版社

1、主成分分析法

主成分分析法是通过恰当的数学变换,使新变量主成分成为原变量的线性组合,并选取少数几个在变差总信息量中比例较大的主成分来分析事物的一种方法。主成分在变差信息量中的比例越大,它在综合评价中的作用就越大[3]。以两个指标来衡量n 个样本的简单情况为例。n 个样本之间的变量信息用离差平方和表示,则综合评价时的总变差为:

将原始指标数据进行标准化(这里标准化以后的变量均值为0,方差为1)。由于原始数据有不同的含义,且量纲不同,这样经过标准化以后使数据集中每个变量的变化范围大体相同,这样再进行分析具有很强的客观性[3]。标准化以后的数据用01Z ,02Z ,03Z …10Z 表示(如表2)。

设有n 个样本,p 项指标,可得数据矩阵n i X X p n ij ,2,1,)( ==⨯表示n 个样本,p j ,2,1=表示p 个指标,ij x 表示第i 个样本的第j 项指标值。

用Zscore 法[3]对数据进行标准化变换:

式中p j n

i n x x

S n

x x n

i j ij

j n

i ij j ,2,1,2,1)

1()()

(1

2

21==--=

=

∑∑==

对标准化后的数据进行主成分分析[1]

表3 —特征根和方差贡献率表

从表3可以看出,前2个主成分的累计方差贡献率达到%(>85%),选择2个主成分已足够。且经过主成分分析后,这2个主成分是相互独立的,这对分析带来很大的客观性。

表4 —因子载荷阵

Component Matrix a

根据表4可得这2个主成分的表达式为;

Y1=*X1 + *X2 + *X3 + *X4 + *X5 + *X6 + *X7 + *X8 + *X9 + *X10

Y2=*X1 - *X2 + *X3 + *X4 - *X5 + *X6 - *X7 + *X8 - *X9 - *X10 从上述表达式可看出第2主成分在第4个指标上的系数相对较大,在第9个、第10个2个指标上的权重为负,其含义是有第三产业越大和只有较少的知识分子、较少的病床将获得较大的数值。第2主成分排序,结果见表5.

表5

2、聚类分析法

聚类分析(Cluster Analysis)就是分析如何对样品(或变量)进行量化分类的问题。通常聚类分析分为Q型聚类和R型聚类。Q型聚类是对样品进行分类处理,R型聚类是对变量进行分类处理[4]。

首先对数据进行正规化,计算公式为:

Xi'= (Xi-Xmin)/( Xmax -Xmin)

公式中Xi'为正规化后的值,Xi为原值,Xmax为最大值,Xmin为最小值。进行正规化后,0≤Xi'≤1。所有参与聚类分析的指标数据见下表。

表6 —正规化后的变量

根据上表的数据,利用统计软件SPSS对山东的11个市进行聚类分析,得出如下结果(见表6)。

表6 — 11市的聚类分析结果