应用多元统计分析毕业论文已过查重-优秀毕业论文

  • 格式:doc
  • 大小:2.05 MB
  • 文档页数:17

下载文档原格式

  / 17
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

应用多元统计分析毕业论文已过查重-优秀毕业论文

内蒙古财经大学

应用多元统计分析

期末论文

作者李慧斌

系别统计与数学学院

专业信息与计算科学

年级2012级

学号122093118

指导教师刘勇

导师职称讲师

目录

我国地区经济发展浅析 (2)

摘要 (2)

一、引言 (2)

二、聚类分析 (2)

1.参与聚类的样本总量表 (3)

2.样品聚为3类时的样品归类表 (3)

3.所有样品的聚类树形图 (5)

三、主成分分析 (6)

1.单变量描述统计量表 (6)

2.各变量相关矩阵图 (7)

3.总方差分解图 (8)

4.旋转前的因子载荷矩阵图 (9)

5.利用因子载荷矩阵图计算出的特征向量表 (9)

三、因子分析 (10)

1.旋转后的因子载荷矩阵 (10)

2.因子得分系数矩阵 (11)

3.各样品因子得分 (11)

四、结论 (13)

附表一 (14)

我国地区经济发展浅析

摘要:以聚类分析法、主成分分析法、因子分析法三种多元统计分析方法为主,对2011年我国31个省、市、自治区的地区经济发展状况以及影响地区经济发展的主要因素(指标)相结合进行剖析。根据不同分类方法得出不同的分析结果,从不同角度分析我国各地区经济发展存在的主要差异以及导致这些差异出现的原因,并最终就三种统计分析方法的结果对我国目前地区经济发展状况进行客观的综合概述。

关键字:地区发展水平聚类分析法主成分分析法因子分析法

一、引言

在日常生活过程中,我们常常遇到一些计算量大,分析工作复杂度高的数

据分析工作,为了能够更加简便地进行数据分析,在此给大家介绍几种多元统

计分析的方法。本文主要运用了聚类分析法,主成分分析法和因子分析法对2011

年我国31个省市自治区地区经济发展水平以及影响地区经济发展的几项重要指

标进行了统计分析。

二、聚类分析

聚类分析是应用最广泛的一种分类技术,它把性质相近的个体归为一类,使得同一类中的个体具有高度的同质性,不同类之间的个体具有高度的异质性。聚类分析的职能是建立一种分类方法,它是将一批样品或变量,按照它们在性质上的相似程度进行分类。通常我们用距离来度量样品之间的相似程度,用相似系数来度量变量之间的相似程度。

1.参与聚类的样本总量表

通过观察上表,我们可以看出,在整个聚类过程中,描述我国所有省、市、自治区经济发展状况的31个样品都参与了聚类分析过程,没有遗失或未参与的样品。这充分说明此次聚类分析已经对全部31个样品的各项指标进行了相似聚类,不需要再利用判别分析进行二度聚类。

2.样品聚为3类时的样品归类表

Cluster Membership

Case 3 Clusters

1:Case 1 1

2:Case 2 1

3:Case 3 1

4:Case 4 2

5:Case 5 1

6:Case 6 1

7:Case 7 2

8:Case 8 2

9:Case 9 1

10:Case 10 3

11:Case 11 3

12:Case 12 2

13:Case 13 1

14:Case 14 2

15:Case 15 3 16:Case 16 1 17:Case 17 1 18:Case 18 1 19:Case 19 3 20:Case 20 2 21:Case 21 2 22:Case 22 2 23:Case 23 1 24:Case 24 2 25:Case 25 2 26:Case 26 2 27:Case 27 2 28:Case 28 2 29:Case 29 2 30:Case 30 2 31:Case 31 2

3.所有样品的聚类树形图

(1)结合以上样品归类情况表和聚类树形图,分别给出了将2011年我国31个自治区、省、市经济发展状况作为样品聚类分为三类时的各样品所属类别。观察聚类树形图我们不难看出聚类样品最适合分为三类:第一类包括11个样品(包含:北京市、天津市、河北省、内蒙古自治区、辽宁省、福建省、河南省、湖北省、湖南省和四川省)。通过地区分布和地区经济发展状况,第一类所包含的省、市、自治区主要分布在我国高校林立、资源丰富、交通便利等优质条件的省、市、自治区。

(2)第二类包括16个样品(包括:山西省、吉林省、黑龙江省、安徽省、江西省、广西壮族自治区、海南省、贵州省、云南省、西藏省、重庆市、陕西省、甘肃省、青海省、宁夏回族自治区、新疆维吾尔自治区)。通过地区分布和地区经济发展状况,第二类所包含的省、市、自治区主要分布在我国自然气候条件恶劣、各方面资源有限、人才缺乏、交通不发达、自然条件相对恶劣、城市化水平低等经济发展单一落后的地区。

(3)第三类包括4个样品(包括:江苏省、山东省、浙江省和广东省)。通过地区分布和地

区经济发展状况,第三类所包含的省、市、自治区主要分布在我国东南沿海和临海的华中地区。这些地区高校林立、人才集中基数大、工业高度发达、海陆空交通发达、有中国尖端技术又有国外先进管理文化渗入、经济高速发展等地区。近年来,这些地区涌入大量外来务工发展的人潮,这些社会现象向我们表明这些地区对人才和劳动力的吸引力;也让人们意识到了这些地区丰富的就业机遇和个人发展前景;更重要的是,国内外先进的技术和人才以及眼界开阔的海归们也积极投入到了这些地区的经济发展中,促使这些地区的经济蓬勃发展;同时也在不断地加剧地区之间抢夺资源和地区发展不平衡的矛盾,使中国国内地区贫富差距和国民生活水平差距进一步拉大。

三、主成分分析

主成分分析也称主分量分析,是一种将多个指标化为少数几个综合指标的统计分析方法。在经济问题研究中,为了全面、系统地分析问题,我们必须考虑众多对某经济过程有影响的因素,这些因素在统计学中被称为指标(即变量),每个指标都在不同程度上反映了所研究问题的某些信息,但在指标之间彼此有一定的相关性,因而所得的统计数据在一定程度上反映的信息有重叠。主成分分析可将相关的指标化成不相关的指标,避免了信息重复带来的虚假性。此外,主成分分析能用较少的变量反应更多的问题,减少计算量的同时简化了问题。

1.单变量描述统计量表

(1)由上表第二栏均值可以看出,2011年我国31个省市自治区经济发展地区生产总值均值为16820.68亿元;工业发展均值为7479.8642亿元;建筑业均值为1030.3368亿元······但人均生产总值均值却只有39441.87元。这些数据显著地反映了中国地大物博,经济高速发展,国