当前位置:文档之家› 基于主成分分析的经济发展水平综合评价

基于主成分分析的经济发展水平综合评价

基于主成分分析的经济发展水平综合评价
基于主成分分析的经济发展水平综合评价

基于主成分分析的经济发展水平综合评价1

吴冲,王栋

哈尔滨工业大学管理学院,哈尔滨 (150001)

E-mail:wuchong@https://www.doczj.com/doc/371110349.html,

摘要:衡量一个国家的经济发展程度,要从其社会生产的各个方面去考察,要看各项生产能力的综合效果。为了客观、科学地分析我国的经济发展状况,本文首次把居民消费价格指数和商品零售价格指数引入评价指标体系中,提出一种新的社会发展水平综合指标体系,并通过SPSS分析软件进行上机计算,应用主成分分析方法对我国31个省、直辖市、自治区(不包括香港、澳门和台湾)的经济发展水平进行综合分析和评价,突出了各大省市经济发展进程的特点和优势,为我国实现均衡发展提供理论依据。

关键词:主成分分析,经济发展,综合评价

1. 引言

要描述和评价一个社会的经济发展状况,最理想的是找到一个总括性社会指标体系评价方法,其测度结果能够反映社会经济发展的全部或大部分信息。20世纪60年代以来一些国际性组织、国家和地区的职能部门以及研究学者曾经提出各种不尽完全相同的指标体系评价方法[1]。我国系统地研究社会发展指标体系评价方法起步较晚,但发展很快,20世纪80年代以来,国内一些政府部门、研究单位和个人先后设计了一些“社会指标体系评价方法”[2-4],如:唐晓东[5]采用了21个指标变量的函数模型来评价我国社会经济发展状况,然而此模型一个最大缺点,就是没有把所有反映经济情况的因素考虑在内,得不到预期效果。但到目前为止,还没有形成一套完善、客观的社会经济发展综合指标体系评价方法,为了更加全面、客观地反映我国各地区的社会发展水平,本文在借鉴国内外研究成果的基础上,通过对我国已有研究成果的修正和充实,首次把居民消费价格指数和商品零售价格指数引入评价指标体系中,提出一种新的社会发展水平综合指标体系。

在实际经济问题中,不同的经济变量之间具有一定的相关性,如职工平均工资和消费水平必然有一定的关联性,这样势必增加分析问题的复杂性,因此需要有一种进行简化的方法。主成分分析法可以用较少的指标来代替原来较多的指标,并使这些较少的指标尽可能地反映原来指标的信息,从根本上解决了指标间的信息重叠问题,又大大简化了原指标体系的指标结构,用主成分分析法分析经济发展水平的优势主要体现在: (1)全面性(消除评价指标的相互影响),在满足n p

f的条件下,不限制指标的个数,可以综合评价一国的经济发展状况,主成分分析的降维处理技术能较好地解决多指标评价的要求,在选择了()

p个主成分后,

m m p

仍能保留原是数据信息的85%以上,因此这一方法综合评价经济发展水平比较全面,可以克服片面追求个别经济指标而忽略全面经济发展指标的倾向;(2)可加性(数据标准化处理),在综合评价经济发展水平时,所建立的评价指标量纲往往不同,变差不能直接综合,主成分分析法避免了此现象的发生,因为在计算过程中,主成分分析法把各个指标进行了标准化处理,这就使得各个经济指标之间具有可比性即可加性;(3)客观性(科学的确定权重),在层次分析法计算过程中,通过专家打分来确定权重,也就是说在确定权重的问题上具有了人为因素,而主成分分析法在确定综合因子的权重时,克服了某些评价方法中人为确定权重的缺陷,使得综合评价结果唯一;(4)简单性(计算简介),随着电子计算机技术的发展,SPSS、SAS等计

1本课题得到高校博士点基金(20050213037)资助。

算机软件的推进与使用,使得主成分分析法在综合评价实践中的广泛应用成为现实。

2. 主成分分析的原理

主成分分析法 (Principal Components Analysis)也称主分量分析法,是由Hotelling 于1933年首先提出,它可以在力保原始数据信息丢失最少的情况下,对高维变量空间进行降维。用少数的变量来解释整个问题。

设有N 个样本,每个样本观测到P 个变量(记为,,,12x x x p L

),构成一个n p ×阶的地理数据

矩阵X : 111212122212x x x p x x x p X

x x x np n n =??????????

L L L L L L L 主成分分析的目的在于利用p 个原始变量(,,,)12x x x p L 构造少数几个新的综合变量,使

得新变量为原始变量的线性组合,新变量互不相关,心变量包含p 个原始变量的绝大部分信息。这样定义,,,12x x x p L 为原变量指标,,()12z z z m p m ≤L 为新的综合变量指标,每一个新综合变量指标是p 个原始变量的线性组合:

11111221221122221122

z l x l x l x p p z l x l x l x p p z l x l x l x m mp p m m =+++=+++=+++?????L L M L 同时要求满足以下几个条件:

(1)z i 与z j (; ,1,2,,)i j i j m ≠=L 相互无关;

(2)1z 是,,,12x x x p L 的一切线性组合中方差最大者;2z 是与1z 不相关的,,,12x x x p L 的所

有线性组合中方差最大者;……;z m 是与,121z z z m ?L

都不相关的,,,12x x x p L 所有线性组合中方差最大者,则新变量,12z z z m L

分别称为原变量,,,12x x x p L 的第一,第二,……第M 主成

分。 从以上的分析可以看出,主成分分析的实质就是确定原来变量(1,2,,)x j

p j =L 在诸主成分(1,2,)z i m i =L 上的系数(1,2; 1,2)l i m j p ij ==L L 。从数学上可以证明,它们分别是p 个原始

变量(,,,)12x x x p L 相关矩阵的前m 个具有较大特征值所对应得特征向量,而各个综合变量Z i

的方差()Var Z i 恰好是相应的特征根i λ。各主成分的方差贡献率大小按特征根顺序排列,是依次递减的,即:01

2p λλλ≥≥≥≥L 。本文的整个计算求解过程采用SPSS 统计分析软件来进

行。 3. 指标确定

我们根据选取的指标要能够客观、系统地反映一个地区经济发展水平的原则,并根据数据获取情况,另外结合所研究的具体问题,本文选择反映经济情况的8项主要指标:地区生产总值(1X ),居民消费水平(2X ),基本建设投资(3X ),职工平均工资(4X ),居民消费价格

指数(

X),商品零售价格指数(6X),货物周转量(7X),工业总产值(8X)。指标数值均来自2006 5

年中国统计年鉴及相应整理数据[6]。将数据进行标准化处理,如附表所示,利用SPSS软件进

行主成分分析,得出方差解释表,见表1。

表1 方差解释表

Tab.1 variance explained table

由表1可以看出,前3个特征值的累积贡献率已达到85.928%,这说明用前3个因子来反

映事物的信息占全部信息的85.928%以上,于是,取前3个因子作为主成分,碎石图的分析

结果也说明了这一点。

图1 碎石图

Fig1 Scree Plot

图1是分析结果碎石图(Scree Plot),明显的拐点为3,可以得出保留前3个因子将能概括

大部分信息,前3个因子贡献占总方差的本例为85.918%,说明提取前3个公共因子是比较合

适的。

表2 主成分载荷矩阵

Tab.2 Component Matrix

从图2可以看出,地区生产总值和工业总产值在第一主成分上的载荷较大,即与第一主

成分的相关系数较高;基本建设投资在第二主成分上的载荷较大,即与第二主成分相关程度

较高;消费价格指数在第三主成分上的载荷较大,即与第三主成分相关程度较高。因此可将主成分命名如下:第一主成分:产出主成分; 第二主成分:建设投资主成分; 第三主成分:消费价格主成分。

表3 主成分得分系数矩阵

Tab.3 Component Score Coefficient Matrix

根据该表以及变量的观测值可计算因子得分,主成分得分系数矩阵的数值是主成分载荷除以相应的特征根得到的结果。到目前为止,通过主成分分析法,将8个评价指标转化为了具有典型经济涵义的3个综合评价指标。

4. 经济发展水平的综合分析和评价

为了考察每个城市,并对它们进行分析评价,采用回归方法将三个主成分表示成八个指标的线性组合,即得分函数:

L

0.2180.22

1Z=+

L

0.2320.226

2Z=+

0.161

3Z=?

上式可看作进城市经济发展评价模型,将31个省市标准化后的数据代入上三式,便得到各城市的得分,见表4。

表4 主成分得分表

Tab.4 scores Table

应说明一点的是,某城市的主成分因子得分为负数,这是因为在计算时对原始数据作了标准化处理,把各经济指标的平均水平当作零来处理的缘故。因此,某城市的主成分因子得分为负数,只表明该城市的经济发展水平在全国31个省市的平均发展水平之下。将Z1、Z2、Z3得分绘制在三维坐标系中,如图2,由载荷阵及Z1、Z2、Z3表达式可以看出,Z1、Z2、Z3越大所代表的综合能力越大。

图2 各城市主成分因子得分散布图

Fig2 Score spread map

根据图2可以看出,位于正中间上方的是广东省,其生产总值、基本投资建设和消费水平相对来说都比较高;而位于正中间下方的是西藏省,其消费水平与全国的平均消费水平不相上下,但其生产总值和基本投资建设却低于全国平均水平;位于左上角的城市是生产总值和基本建设投资都很高的城市,如:江苏、和山东;位于右上角的城市是生产总值和消费水平都很高的城市,如:上海、北京和天津。

结合生产总值、基本建设投资和消费水平三方面,可对我国地区经济发展做出如下评价:31个省市大体上可分为7个类别,广东属一类,它位于图2正上方,说明该地区的生产总值、基本建设投资以及消费水平都很高,是投资者首选的黄金地带;江苏和山东属一类,位于图2的左上角,是生产总值和基本建设投资相对较高而其消费水平相对来说不高的省市;河北、河南和辽宁属一类,其生产总值与我国的平均生产总值不相上下但其基本投资建设费用比较高,说明这三个省的基本建设正在逐步完善;浙江属一类,其生产总值比河北、河南和辽宁高,但其基本建设投资和消费与这三个城市不相上下;上海、北京和天津基本属于一类,该地区的生产总值高而且消费水平相对来说也比较高,但其基本建设投资相对来说较低,说明这三个城市的基本建设比较完善;海南、贵州、青海、甘肃、新疆、宁夏和西藏属一类,这几个省市的消费水平基本与我国平均消费水平持平但其生产总值远远落后于我国的平均生产总值,而其基本建设投资却高于我国基本建设投资的平均水平,说明国家比较重视这几个省市的经济发展;其他地区属于一类。需要说明的是,本文对全国31个省市的评价是一种比较分析评价,方便读者的对比。

5. 结束语

本文将主成分分析引入到城市经济发展水平的分析与综合评价中,应用主成分分析的功能,提出了一种可以较为准确的评价各城市经济发展状况的方法,在实际中无论是对投资者、国家经济政策的制定部门及城市本身都有着重要的现实意义。因为该方法在分析过程中对指标进行了标准化处理,避免了不同量纲对分析结果的影响,同时主成分方法成功地消除了指标间信息重叠和人为地确定指标权重的缺点,使得分析结果客观公正、清晰可见。此外,主成分分析法的整个操作过程都可以运用计算机软件:如:SPSS、SAS等方便快捷的进行。

参考文献

[1] Noorbakhsh, Farhad. Human Development and Regional Disparities in china: A Policy Model [J]. Journal of International Development, 2007, Vol. 14: 927 - 949.

[2]乔峰,姚俭.时序全局主成分分析在经济发展动态描绘中的应用[J].数理统计与管理,2003,22(2): 1-5

[3] GAVIN W J, VISARIA P. Urbaniztion in large developing countries. China, Indohesia, Brazilamd India[M]. Oxford: Clarendon Press, 1997.

[4] LIAN Yuming. China cities report [R]. Beijing: China times and economics Press, 2004.

[5]唐晓东, 中国城市发展水平评价指标体系及实证研究[J].生产力研究, 2006, 7: 70-73

[6]国家统计局, 中国统计年鉴[M].北京:中国统计出版社,2006

Comprehensive Evaluation of The Economic Development Level Based on Principal Components Analysis

Wu Chong,Wang Dong

School of management,Harbin Institute of Technology,Harbin (150001)

Abstract

In assessing a country's degree of economic development,the various aspects of social production should be taken into account, and we look at the combined effect of productivity at last. In order to an objective and scientific analysis of China's economic development, this paper applies principal component analysis on China's 31 provinces, municipalities and autonomous regions (not including Hong Kong, Macao and Taiwan) to analysis the economic development level and work out a comprehensive analysis and evaluation by using the SPSS software to make computer computation. Accordingly, the results highlighted the characteristics and advantages of major provinces in the economic development process, and provide a theoretical basis to balanced development of China. Keywords:Principal Components Analysis,Economic development,Comprehensive Evaluation

作者简介:

吴冲,(1971-),男,黑龙江省哈尔滨市,哈尔滨工业大学管理学院,教授,博士生导师,研究方向:金融系统工程、企业系统工程、人工智能在管理中的应用;

王栋,(1982-),男,山西省大同市,哈尔滨工业大学管理学院,硕士研究生,研究方向:金融系统工程。

主成分分析(论文)

高校人文社科科研综合实力评价研究 摘要

一、问题重述 高校人文社科科研综合实力评价研究 根据所给数据,并搜集更多相关数据,回答下面的问题 1.研究数据之间的内在关系; 2.设计几种方案对各省市科研实力进行综合评价并进行分类,论证方法的合 理性,给出合适的建议 二、条件假设 (1)假设高校人文社科科研指标在一定程度上会反映高校的人文社科科研综合实力 (2)假设资料所提供数据准确有效

三、符号约定x—同一葡萄酒样品的平均值 _

四、问题分析 3.主成分分析法 建立模型:基于主成分分析法研究高校人文社科科研综合实力 影响高校人文社科科研综合实力的成分有很多,例如投入的人年数,投入科研事业经费,课题总数等等。常用于研究各变量对结果影响因素的方法有多元回归分析、主成分分析、因子分析、回归分类树等。每种算法各有各的特点,本文尝试选取主成分分析法。 主成分分析:PCA 是将多指标重新组合成一组新的无相关的几个综合指标,是根据实际需要从中选取尽可能少的综合指标,以达到尽可能多地反应原指标信息的分析方法。由于这种方法的第一主成分在所有的原始变量中方差最大,因而综合评价函数的方差总不会超过第一主成分的方差,所以该方法有一定的缺陷。 (1)题中共给影响高校人文社科科研综合能力的7种因素,分别是投入人年数、投入高级职称的人年数、投入科研事业费、课题总数等。设各影响因素为 p 2,1,...,x x x ,它们的综合指标——主成分设为:p ,,...,,21

基于主成分分析的经济发展水平综合评价

基于主成分分析的经济发展水平综合评价1 吴冲,王栋 哈尔滨工业大学管理学院,哈尔滨 (150001) E-mail:wuchong@https://www.doczj.com/doc/371110349.html, 摘要:衡量一个国家的经济发展程度,要从其社会生产的各个方面去考察,要看各项生产能力的综合效果。为了客观、科学地分析我国的经济发展状况,本文首次把居民消费价格指数和商品零售价格指数引入评价指标体系中,提出一种新的社会发展水平综合指标体系,并通过SPSS分析软件进行上机计算,应用主成分分析方法对我国31个省、直辖市、自治区(不包括香港、澳门和台湾)的经济发展水平进行综合分析和评价,突出了各大省市经济发展进程的特点和优势,为我国实现均衡发展提供理论依据。 关键词:主成分分析,经济发展,综合评价 1. 引言 要描述和评价一个社会的经济发展状况,最理想的是找到一个总括性社会指标体系评价方法,其测度结果能够反映社会经济发展的全部或大部分信息。20世纪60年代以来一些国际性组织、国家和地区的职能部门以及研究学者曾经提出各种不尽完全相同的指标体系评价方法[1]。我国系统地研究社会发展指标体系评价方法起步较晚,但发展很快,20世纪80年代以来,国内一些政府部门、研究单位和个人先后设计了一些“社会指标体系评价方法”[2-4],如:唐晓东[5]采用了21个指标变量的函数模型来评价我国社会经济发展状况,然而此模型一个最大缺点,就是没有把所有反映经济情况的因素考虑在内,得不到预期效果。但到目前为止,还没有形成一套完善、客观的社会经济发展综合指标体系评价方法,为了更加全面、客观地反映我国各地区的社会发展水平,本文在借鉴国内外研究成果的基础上,通过对我国已有研究成果的修正和充实,首次把居民消费价格指数和商品零售价格指数引入评价指标体系中,提出一种新的社会发展水平综合指标体系。 在实际经济问题中,不同的经济变量之间具有一定的相关性,如职工平均工资和消费水平必然有一定的关联性,这样势必增加分析问题的复杂性,因此需要有一种进行简化的方法。主成分分析法可以用较少的指标来代替原来较多的指标,并使这些较少的指标尽可能地反映原来指标的信息,从根本上解决了指标间的信息重叠问题,又大大简化了原指标体系的指标结构,用主成分分析法分析经济发展水平的优势主要体现在: (1)全面性(消除评价指标的相互影响),在满足n p f的条件下,不限制指标的个数,可以综合评价一国的经济发展状况,主成分分析的降维处理技术能较好地解决多指标评价的要求,在选择了() p个主成分后, m m p 仍能保留原是数据信息的85%以上,因此这一方法综合评价经济发展水平比较全面,可以克服片面追求个别经济指标而忽略全面经济发展指标的倾向;(2)可加性(数据标准化处理),在综合评价经济发展水平时,所建立的评价指标量纲往往不同,变差不能直接综合,主成分分析法避免了此现象的发生,因为在计算过程中,主成分分析法把各个指标进行了标准化处理,这就使得各个经济指标之间具有可比性即可加性;(3)客观性(科学的确定权重),在层次分析法计算过程中,通过专家打分来确定权重,也就是说在确定权重的问题上具有了人为因素,而主成分分析法在确定综合因子的权重时,克服了某些评价方法中人为确定权重的缺陷,使得综合评价结果唯一;(4)简单性(计算简介),随着电子计算机技术的发展,SPSS、SAS等计 1本课题得到高校博士点基金(20050213037)资助。

基于主成分分析法的科技投入产出聚类分析

2009年第11期 科技管理研究Science and Technol ogyM anage ment Research 2009No 111 收稿日期:2009-08-25,修回日期:2009-09-11 文章编号:1000-7695(2009)11-0169-03 基于主成分分析法的科技投入产出聚类分析 秦浩源 (华中科技大学管理学院,湖北武汉 430074) 摘要:在科技投入与产出指标体系的基础上,利用主成分分析法将指标进行综合,通过区域聚类分析对我国科技经费的配置效果进行评价,为科技体制改革、科技活动的结构调整、科技经费的优化配置和科学管理提供依据。 关键词:科技经费;投入产出;主成分分析法;聚类分析法中图分类号:F223 文献标识码:A 1 引言 随着科技经济一体化进程的不断加深,科技对经济增长 的贡献程度不断提高,各国纷纷加大对科技经费的投入力度以促进科技经济更好更快地协调发展。在各国科技投入不断增加的同时,科技经费资源的稀缺性、配置的低效性则越来越凸显出来:我国长期以来形成科技经费资源的粗放式投入模式,造成了科技经费配置中的巨大浪费[1-2];较高的科技投入并不能带来高质量的科技成果,等等。这严重制约了我国科技创新能力的提高,不利于充分发挥科技对经济的支撑和促进作用。 因此,对科技投入产出状况进行研究,提高科技经费配置效率就显得十分必要,这对缓解我国科技投入压力、提高我国的科技创新能力和科技竞争力具有极其重要的现实意义。 2 指标体系及数据获取 在进行指标选取时,分别考虑科技经费投入、科技活动产出以及两者的关系。科技经费投入指标主要考虑各种科技财力资源,而科技产出指标主要包括知识形态的成果和科技转化成果。因此,在指标的选取时,注重对统计指标进行研究,以避免定性分析带来主观影响。本文选取科技经费投入指标包括:科技经费筹集总额,科技经费中政府投资总额,R&D 经费内部支出总额,R&D 经费内部支出总额与G DP 的比值等;科技活动产出指标包括:发明专利申请受理数,被SC I 、E I 、I STP 检索的论文数,技术市场成交合同金额,高技术产业增加值等。具体的科技投入产出指标如表1所示。 表1 科技投入产出指标 指标 分类 指标名称 指标编号 科技投入指标 科技经费筹集总额(万元)T 1科技经费中政府投资总额(万元)T 2R&D 经费内部支出总额(万元)T 3R&D 经费内部支出总额与G DP 的比值(%) T 4科技产出指标 发明专利申请受理数(件)C 1被SC I 、E I 、I STP 检索的论文数(篇)C 2技术市场成交合同金额(万元)C 3高技术产业增加值(万元) C 4 注:所用数据为2007年各地区科技投入产出指标数值,数据来源于《中国统计年鉴2008》和《中国科技统计年鉴2008》。 3 基于主成分分析法的科技投入产出能力指标综合 本文采用主成分分析法获得投入产出综合能力指数。主成分分析法是通过研究指标体系的内在结构关系,将多个指标的问题化为少数指标问题的一种多元统计分析方法,即把原来多个指标转化为一个或几个综合指标,并且这些少量的指标能够包含原来多个指标的绝大部分信息。 (1)主成分分析法的基本步骤 1)标准化处理。标准化处理也即无量纲化,就是针对量纲不同的各指标间不能简单相加的情况,通过变换,用比率的形式来消除量纲不同所带来的影响,使原本不可以直接相加的变量可以相加。 本文采用的无量纲化的计算公式为: 指标L 比率=011+019×[(L -L m in )/(L max -L m in )] 其中,L max 、L m in 分别表示参加比较的各地区中该指标的最大值和最小值;L 则表示某地区该指标的实际值。 2)通过SPSS 主成分分析选取所选数据主成分,一般要求累计贡献率达到一定要求(如不小于85%)来确定样本主成分个数。 3)用原指标的线性组合来计算各主成分得分[3-4] 。以各主成分对原指标的相关系数为权,即载荷系数为权,将主成分用原指标的线性组合表示,主成分的经济意义由权数较大指标的综合意义决定。 I j =u j 1T 1+u j 2T 2+u j 3T 3+u j 4T 4 (u j 1,u j 2,u j 3,u j 4为主成分对应载荷) O j =v j 1C 1+v j 2C 2+v j 3C 3+v j 4C 4 (v j 1,v j 2,v j 3,v j 4为主成分对应载荷) 4)综合得分。以各主成分方差贡献率为权,进行线性组合得到综合评价指标函数。 I = w 1I 1+w 2I 2+…+w j I j w 1+w 2+…+w j O = w 1O 1+w 2O 2+…+w j O j w 1+w 2+…+w j 其中,w j 为主成分占总方差的比例。 5)得分排序。算出总得分进行名次排序。(2)科技投入产出能力计算 运用SPSS 对标准化后数据进行主成分分析,得到投入指标第一个主成分占总方差的861393%,可代表原来四个指标的全部信息,并且第一主成分在投入指标上的载荷分别为

用主成分分析模型构造综合评价指数

用主成分分析模型构造中学考试综合评价指数 [摘要] 在中学考试的综合评价中,使用较多的指标进行描述使分析复杂化,难以对众多指标的影响作出正确的判断,需要少量几个“综合评价指标”。通过简单加权的合成方法,难以得到科学的结果。主成分分析是一种多元统计方法,可以将众多指标简化浓缩为少量几个甚至一个综合评价指标,使简化的指标既能基本包括全部指标具有的信息,又使指标之间相互无关,较好地解决了这一课题。 [关键词] 考试评价;主成分分析;数学模型;计算步骤,指数构造方法 一、问题的提出 在中学考试评价中,通常使用各学科的“平均分”、“优秀率”、“及格率”和“低分率”等指标。考虑到成绩的分布状况(“优秀率”与“及格率”之间的差距偏大,可能失去部分信息量),某些地区还使用了“良好率”指标。这样,k 个学科的考试评价的p 项指标将多达k ╳p 个。在对考试进行综合的评价时,使用较多的指标进行描述不仅会增加评价的工作量,而且会因评价指标间的相关性造成评价信息重叠,相互干扰,其结果使分析复杂化,难以对众多指标的影响作出正确的判断。因此,需要少数几个甚至一个“综合评价指标”来代替众多的且相互之间具有相关关系的指标,同时又需要不失去原有指标具有的信息量,这是考试评价中具有现实意义的课题。 某些地区采用一种“降维”的方法,较成功地把k ╳p 维指标降为p 维指标,即在使用“总分平均分”的同时,用“科平均╳╳率”取代各科的“╳╳率”(计算方法见备注1)。如何把p 维指标再合成为一个“综合评价指标”?采用一些简单加权的合成方法时,由于对各指标的影响不容易作出正确的定量化的判断,及权数产生的科学性等问题,往往难以得到令人信服的科学的结果。 主成分分析是一种多元统计方法,可以将众多指标简化浓缩为少数几个甚至一个综合评价指标,使简化的指标既能基本包括全部指标具有的信息,又使指标之间相互无关。较好地解决了这一课题。 二、主成分分析的数学模型 设有n 个样品,每个样品观测p 个指标(变量):X 1,X 2,…,X p , 得到原始数据矩阵: 用数据矩阵X 的p 个列向量(即p 个指标向量)作线形组合(即综合指标向量)为: 上述方程组要求: 且系数αij 由下列原则决定: ①、F i 与F j (i ≠j ,i ,j =1,…,p )不相关; ②、F 1是X 1,X 2,…,X p 的一切线性组合(系数满足上述方程组)中方差最大的,F 2是与F 1不相关的X 1,X 2,…,X p 的一切线性组合中方差最大的,…,F p 是是与F 1,F 2,…,F p-1都不相关的X 1,X 2,…,X p 的一切线性组合中方差最大的。 ?? ? ??? ? ???? ???=np n n p p x x x x x x x x x X 2122221 11211 ??? ?? ???????=ni i i i x x x X 2 1 ?? ???? ?+++=+++=+++=p pp p p p p p p p p X a X a X a F X a X a X a F X a X a X a F 22122221122122111111 2 2221=+++pi i i a a a

SPSS因子分析和主成分分析论文

基于因子分析的我国经济发展状况实证分析 摘要:选取了2013年我国31个省、直辖市、自治区经济发展的10项指标作为研究对象,运用因子分析的方法,利用spss对数据进行计算,依据因子分析的结果对我国各省的经济发展做出综合评价,得出了这31各省份经济发展状况的综合排名,广东、江苏、山东、浙江、北京排在前5位,是中国各省、直辖市、自治区沿海经济发展较好的地区;甘肃、海南、青海、宁夏、西藏排在后5位,是西部地区经济发展较落后的地区,较为客观反映了中国各省、直辖市、自治区的综合经济实力,为中国各省、直辖市、自治区今后的经济发展提供了理论依据。 关键词:经济发展;因子分析;综合评价;主成分法 一、引言 我国地域辽阔,由于历史、地理位置及经济基础等原因,各地经济发展水平差异很大。改革开放以来,特别是实施西部大开发、振兴东北地区等老工业基地、促进中部地区崛起、鼓励东部地区率先发展的区域发展总体战略以来,各地经济社会发展水平有了很大提高,人民生活也有了很大改善。但区域发展不协调、发展差距拉大的趋势仍未根本改变。本文从我国31 个省市自治区经济的发展视角入手,运用对应分析方法对我国各地区经济发展状况进行统计分析,用以说明我国各地区经济发展不协调的现状。由于衡量各地区经济发展的指标有很多,故选取了比较有代表性的十个指标。 二、相关统计指标与数据的选取 本文运用了因子分析的方法对我国31个省、直辖市、自治区的经济发展状况进行评价。选取了10项经济指标:第一产业增加值(X1);第二产业增加值(X2);第三产业增加值(X3);地方财政预算收入(X4);地方财政预算支出(X5);固定资产投资额(X6);社会消费品零售总额(X7);货物进出口总额(X8);在岗职工平均工资(X9);城乡居民储蓄年末余额(X10)。X2,X3,X4 反映的是经济总量中构成三大产业的不同增加值;X5,X6 反映的是地方财政预算收支;X7 反映的是居民的购买能力;X8反映的是对外贸易;X9,X10反映的是居民的收入与储蓄。本文数据资料来源于《中国统计年鉴》(2013年),具体数据资料见表1。 表1 各地区经济发展状况(2013) 地区X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 北京11.63 293.03 1316.50 3661.11 4173.66 6847.06 8375.10 4289.96 93997.00 23086.41 天津16.85 612.86 846.57 2079.07 2549.21 9130.25 4470.43 1285.02 68864.00 7612.31

如何有效利用主成分分析进行综合评价

如何有效利用主成分分析进行综合评价 摘要:由于主成分分析在多元统计分析中的降维作用,使之在社会、经济、医疗、生化等 各领域运用越来越广泛,但由于传统主成分分析方法的局限性导致了一些问题的产生。这些 问题吸引了许多领域专家的关注,并具有针对性的提出了一些不同的改进方法。本文介绍了 主成分分析的基本和性质,并整理了近年来主成分分析在综合评价应用中遇到的普遍问题并整理验证了认同率较强的一些改进方法,以供大家研究学习。 关键词:主成分分析;综合评价;均值化 1引言 1.1研究的背景和意义 随着生产力的不断进步,生产方式由外延式扩张转化为追求经济效益的内涵式发展,以 致在生产过程中必须考虑经济效益的各个方面,如生产力水平、技术进步、资源占用等情况, 并需要就综合各方面的因素进行综合评价。 评价是根据确定的目的来测定对象系统的属性,并将这种属性变为客观定量的计值或者主观效用行为,整个过程离不开评价者的参与,而综合评价作为评价的一种也需要评价者做出相应反应或指示,而很多综合评价过程易受到评价者的干预,使评价结果产生偏差。 主成分分析能将高维空间的问题转化到低维空间去处理【9】,使问题变得比较简单、直 观,而且这些较少的综合指标之间互不相关,又能提供原有指标的绝大部分信息。而且,伴 随主成分分析的过程,将会自动生成各主成分的权重,这就在很大程度上抵制了在评价过程 中人为因素的干扰,因此以主成分为基础的综合评价理论能够较好地保证评价结果的客观性,如实地反映实际问题。主成分综合评价提供了科学而客观的评价方法,完善了综合评价 理论体系,为管理和决策提供了客观依据,能在很大程度上减少了上述不良现象的产生。 所以在社会经济、管理、自然科学等众多领域的多指标体系中,如节约型社会指标体系、生态环境可持续型指标体系、和谐社会指标体系、投资环境指标体系等,主成分分析法常被应用于综合评价与监控【6】。 综上所述,对综合评价指标体系理论进行研究,既有理论上的必要性,更有实践中的迫 切性。 1.2研究的发展史

主成分分析计算方法和步骤

主成分分析计算方法和步骤: 在对某一事物或现象进行实证研究时,为了充分反映被研究对象个体之间的差异, 研究者往往要考虑增加测量指标,这样就会增加研究问题的负载程度。但由于各指标都是对同一问题的反映,会造成信息的重叠,引起变量之间的共线性,因此,在多指标的数据分析中,如何压缩指标个数、压缩后的指标能否充分反映个体之间的差异,成为研究者关心的问题。而主成分分析法可以很好地解决这一问题。 主成分分析的应用目的可以简单地归结为: 数据的压缩、数据的解释。它常被用来寻找和判断某种事物或现象的综合指标,并且对综合指标所包含的信息给予适当的解释, 从而更加深刻地揭示事物的内在规律。 主成分分析的基本步骤分为: ①对原始指标进行标准化,以消除变量在数量极或量纲上的影响;②根据标准化后的数据矩阵求出相关系数矩阵 R; ③求出 R 矩阵的特征根和特征向量; ④确定主成分,结合专业知识对各主成分所蕴含的信息给予适当的解释;⑤合成主成分,得到综合评价值。 结合数据进行分析 本题分析的是全国各个省市高校绩效评价,利用全国2014年的相关统计数据(见附录),从相关的指标数据我们无法直接评价我国各省市的高等教育绩效,而通过表5-6的相关系数矩阵,可以看到许多的变量之间的相关性很高。如:招生人数与教职工人数之间具有较强的相关性,教育投入经费和招生人数也具有较强的相关性,教工人数与本科院校数之间的相关系数最高,到达了0.963,而各组成成分之间的相关性都很高,这也充分说明了主成分分析的必要性。 表5-6 相关系数矩阵 本科院校 数招生人数教育经费投入 相关性师生比0.279 0.329 0.252 重点高校数0.345 0.204 0.310 教工人数0.963 0.954 0.896 本科院校数 1.000 0.938 0.881 招生人数0.938 1.000 0.893 教育经费投 0.881 0.893 1.000 入

系统工程 主成分分析及聚类分析

泛珠三角区域物流发展水平综合评价研究 资料来源:吴晓燕. 泛珠三角区域物流发展水平综合评价研究 泛珠三角区域是我国最主要的经济发达地区之一,也是现代物流最为强劲的“增长极”,具有优越的地理、交通与经济区位优势。但是区域内有发达省份,也有不发达省份,有沿海的省份,也有内陆省份,有东部省份,也有西部省份,彼此之间存在不同的优势和劣势。因此对泛珠三角区域物流发展水平进行评估与分析,有利于明确广东、福建、江西、广西、海南、湖南、四川、云南、贵州九省(区)的区域物流发展现状及差异,找出区域间的优势互补项目,为区域内物流资源有效利用和合理共享、促进区域物流一体化发展提供方向和依据。 评价区域物流综合发展水平是一项很复杂的工作。选择并构建区域物流发展水平综合评价指标体系是评价的关键。因此选择指标构建评价指标体系,必须以综合评价目的为依据,对所要考察的事物进行认真分析,寻找出影响评价对象的因素,从中选出若干主要因素,构建成综合评价指标体系。在多指标综合评价中,如果指标选择不当,再好的综合评价方法也会出现差错,甚至完全失败。 区域物流发展水平评价指标体系实际上就是利用具体的指标将区域物流所包括的功能、区域物流的内涵、特征具体化、层次化的统计描述和综合评价。为了合理评估区域物流发展综合水平,我们主要选取6个一级评价指标,20个次级评价指标对其进行评估,具体结构如下表:

表1 区域物流发展水平评价指标体系 1、社会经济发展类 经济发展是区域物流发展的基础保障,一个地区雄厚的经济基础有利于该物流的加速发展。一般来说,区域物流发展水平与区域的经济发展水平成正比。因此,我们考虑GDP和人均GDP两个次级指标,他们综合反映了物流发展的社会经济基础。 2、生产、消费流通类 从物流需求源考虑,农业、制造业等产业中的物流需求主要是生产资料的位移、储存和流通加工等,这类产业的物流需求与各行业的产量产值存在正比关系,物流需求是商品需求的派生物,与消费品销售,生产资料市场直接相关,商品市场的规模直接决定物流需求的大

股票投资选择中的主成分分析毕业论文

目录 中文摘要、关键词 (1) 英文摘要、关键词 (1) 正文 (2) 一、引言 (2) 二、上市公司财务指标的选择 (2) 三、财务指标的主成分处理 (4) 四、构造上市公司综合评价指数 (5) 五、实例分析 (6) 六、结果分析 (9) 参考文献 (13) 附表 (14) 股票投资选择中的主成分分析 摘要:股票市场变化莫测,股票价格涨跌无常。如何从众多的上市公司中选择具有投资价值的股票进行投资,进而获得丰厚的投资回报,是许多投资者梦寐以求的一件事。本文运用多元统计分析中的主成分分析方法,通过对上市公司的多个财务指标变量进行主成分处理,构造了上市公司的综合评价指数模型,从而为投资者选择提供一种投资参考。

关键字:主成分分析,股票投资,股票选择 Abstract: The stock market is unpredictable, the rising and dropping of stock prices are variable. How to choose stock with a high investment value from numerous listed companies and then obtaining rich investment repayment are important matters for many investors. This paper utilizes the principal components analysis method of multi-dimensional statistical analysis. By using principal component method to process a number of listed companies financial indicators, it construct a comprehensive evaluation index model of listed companies, thus provide some valuable references for investors. Key worlds: principal components analysis,Stock Investment,Stock options 一、引言 随着我国市场经济的进一步发展,证券投资已成为企业与个人投资的热点,而证券投资是收益与风险并存的一大投资方向。在众多上市公司中,如何选择行业股票,是股票投资者的热门话题,而在同一行业上市公司中,也是良莠不齐,投资者应该用综合的眼光分析上市公司的财务状况和发展潜力,才能选择收益大而风险小的上市公司进行投资。 然而多数投资者并不具备对上市公司进行综合定量分析的能力和方法,而只能从每股收益、每股净资产及净资产收益率三项指标进行简单对比。有些系统分析者采用模糊评判的方法对上市公司的多项指标进行综合分析,但模糊综合评判法的最大缺陷是指标权重的确定问题,指标权重的确定尚未有公认的标准,而简单可行的各种主观确定指标权重的方法难免给问题的分析带来一定的偏差,使决策结果的可信度降低。 对于这类经济决策问题,单纯地运用统计分析又难于达到决策的目的,为此,我们将统计分析与多指标决策结合起来,首先运用多元统计分析中的主成分分析

主成分和聚类分析

4实证过程与结果 4.1主成分与聚类分析 首先通过SPSS软件对环境污染的相应指标进行主成分分析,得到:提取Y1、Y2、Y3和Y4四个主成分,其累积贡献率已经达到,超过80%,代表所有环境污染指标的绝大部分信息。Y1偏向于解释工业氢氧化物排放量,Y2偏向于解释生活烟尘排放量,Y3偏向于解释生活废水排放量,Y4偏向于解释工业二氧化硫排放量。 然后,根据主成分分析结果,用Z=0.43226*Y1+0.21911*Y2+0.10380*Y3+ 0.06519*Y4计算综合得分,见下表1。 表1环境污染地区的主成分综合得分表 序号地区Z 排名序号地区Z 排名 1 北京0.863 5 17 武汉-0.116 13 2 天津 1.088 4 18 长沙-0.841 28 3 石家庄0.455 6 19 广州-0.373 19 4 太原0.209 8 20 南宁-0.519 24 5 呼和浩特-0.052 12 21 海口-1.29 31 6 沈阳-0.273 1 7 22 重庆 2.767 1 7 长春-0.257 16 23 成都-0.451 20 8 哈尔滨 2.489 2 24 贵阳-0.331 18 9 上海 1.979 3 25 昆明-0.552 26 10 南京-0.232 15 26 拉萨-1.275 30 11 杭州0.175 9 27 西安0.357 7 12 合肥-0.5 21 28 兰州-0.514 23 13 福州-0.525 25 29 西宁0.004 11 14 南昌-0.949 29 30 银川-0.702 27 15 济南0.022 10 31 乌鲁木齐-0.502 22 16 郑州-0.152 14 最后将环境污染的综合得分作为个案进行层次聚类分析,将31个地区分为5类,如表2。

主成分分析论文

利用主成分分析对江苏省沿江地区物流产业发展的综合评价 【摘要】现代物流的发展程度已经逐渐成为衡量一个区域或国家现代化程度和综合竞争力的重要标志之一。物流产业的实质体现为技术密集和劳动密集相结合,是具有第三产业特征的跨地区、跨行业、跨部门特点的产业形式。物流产业对经济增长,特别是区域经济增长和区域产业协作的推动,都有着不可替代的重大意义,在区域经济、产业布局研究过程中,都不能忽视物流产业在其中的基础保障作用。本文在构建江苏省沿江地区物流产业发展综合指标体系的基础上,运用多元统计分析中的主成分分析方法,对江苏省沿江地区20个地市的物流发展现状进行了综合评价,为江苏省各地市物流产业主管部门制定相应政策提供一定的理论依据,旨在提高江苏省沿江地区整体物流发展水平。 【关键词】主成分分析物流产业综合评价 一.研究背景 经济的快速增长对物流业产生了巨大的需求,促使物流业以及与物流相关的交通运输、仓储配送和邮电通信业等都有较快的发展。同时,作为经济增长的“加速器”物流业的快速发展将会改变国民经济增长方式,降低国民经济的运行成本,促进了经济的可持续发展。物流对于经济增长的影响以及物流业与经济增长之间的关系已经成为物流领域的一个研究重点。本文拟从主成分分析的角度出发,以江苏省数据为例来探讨哪些因素是物流发展的主要因素,对江苏省物流产业发展现状进行综合评价,从而为江苏省乃至全国的物流产业的发展提供一定的启示。 二.主成分分析方法介绍 主成分分析是把原来多个变量化为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术。假定有n个地理样本,每个样本共有p个变量描述,这样就构成了一个n×p阶的数据矩阵: 如何从这么多变量的数据中抓住主要的变量指标呢?要解决这一问题,自然要在p维空间中加以考察,这是比较麻烦的。为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标来代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多指标所反映的信息,同时它们之间又是彼此独立的。那么,这些综合指标(即新变量)应如何选取呢?显然,其最简单的形式就是取原来变量指标的线性组合,适当调整组合系数,使新的变量指标之间相互独立且代表性最好。 如果记原来的变量指标为x1,x2,…,xp,它们的综合指标——新变量指标为x1,x2,…,zm(m≤p)。则 在(2)式中,系数lij由下列原则来决定: (1)zi与zj(i≠j;i,j=1,2,…,m)相互无关;

主成分进行综合评价 综合评价主成分分析方法与因子分析方法的比较

主成分进行综合评价综合评价主成分分析方法 与因子分析方法的比较 统计研究 主成分分析方法和因子分析方法都是寻求从高维空间到低维空间的映射的方法,其目的是起到降维的效果,以便于用几个较少的综合指标来综合所研究总体各方面的信息,且这几个指标所代表的信息不重叠,也就是说从高维空间到低维空间的映射仍保持高维空间的“序”的结构。但这两种综合评价方法往往易混淆,本文从这两种方法的统计依据、数学模型、计算方法、综合指标的选取等方面比较它们的异同,以供初学者参考。 1、统计依据不同。主成分分析方法的统计问题:依P个指标戈l,x2,A,戈P的/7,个观察值矩阵X=G0帅,能否找到能较好地综合反映这个P 、二 指标的线性函数Y=乞atxt,即 i=1 找到这个主成分的方法就是主成分分析方法。 因子分析方法的统计问题仍 口由P个指标戈。,戈:,A,却的几个观钱道察信息阵X=GF)忡,用有限个不翠

可观测的潜在变量来解释原始变量间的相关性或协方差关系,寻求这几个公因子的方法就是因子缉含汗价士气分析劣珐乡图分奸劣珐的火仪 分析法。它的原理源于已知信息的指标向量戈=0。,戈:,A,菇P)’,总存在正交变换戈=Qy使得记x=Az,这里正交阵Q是X=G0。巾的 协方差阵y的特征向量排成的,y的各分量是不相关的,若茹的方差集中在少数几个变量三,,A,缸上,即y的特征值A,,A,A。较大,后几个特征值A㈨,A,A。很小几乎为零,于是就有因子模型算=4厂+s。寻求公因子、厂及因子载荷阵A的方法就是因子分析法。 , 2、数学模型不同。主成分分析的数学模型:Y=Eat、、ri, 1=1 即主成分是原始指标的线性函数。因子分析的数学模型:戈=4厂+£,A为因子载荷阵。厂为公因子向量,£为随机误差项,Vnroq=I。,Var=o,Var I30圈羹堑绻过丝Q丝生皇塑万 方数据=D。从形式上看二者的模型不同,但主成分分析又为因子分析中因子的寻求提供了一个有效的途径。主成分分析与因子分析法最易混淆的地方在于,将主成分分析方法与因子分析

主成分分析法概念及例题

主成分分析法 主成分分析(principal components analysis,PCA)又称:主分量分析,主成分回归分析法 目录 [显示] 1 什么是主成分分析法 2 主成分分析的基本思想 3 主成分分析法的基本原理 4 主成分分析的主要作用 5 主成分分析法的计算步骤 6 主成分分析法的应用分析 o案例一:主成分分析法在啤酒风味评价分析中的应用[1] 1 材料与方法 2 主成分分析法的基本原理 3 主成分分析法在啤酒质量一致性评价中的应用 4 结论 7 参考文献 [编辑] 什么是主成分分析法 主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。 在统计学中,主成分分析(principal components analysis,PCA)是一种简化数据集的技术。它是一个线性变换。这个变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。主成分分析经常用减少数据集的维数,同时保持数据集的对方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面。但是,这也不是一定的,要视具体应用而定。 [编辑] 主成分分析的基本思想

在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。主成分分析正是适应这一要求产生的,是解决这类题的理想工具。 同样,在科普效果评估的过程中也存在着这样的问题。科普效果是很难具体量化的。在实际评估工作中,我们常常会选用几个有代表性的综合指标,采用打分的方法来进行评估,故综合指标的选取是个重点和难点。如上所述,主成分分析法正是解决这一问题的理想工具。因为评估所涉及的众多变量之间既然有一定的相关性,就必然存在着起支配作用的因素。根据这一点,通过对原始变量相关矩阵内部结构的关系研究,找出影响科普效果某一要素的几个综合指标,使综合指标为原来变量的线性拟合。这样,综合指标不仅保留了原始变量的主要信息,且彼此间不相关,又比原始变量具有某些更优越的性质,就使我们在研究复杂的科普效果评估问题时,容易抓住主要矛盾。上述想法可进一步概述为:设某科普效果评估要素涉及个指标,这指标构成的维随机向量为。对作正交变换,令,其中为正交阵,的各分量是不相关的,使得的各分量在某个评估要素中的作用容易解释,这就使得我们有可能从主分量中选择主要成分,削除对这一要素影响微弱的部分,通过对主分量的重点分析,达到对原始变量进行分析的目的。的各分量是原始变量线性组合,不同的分量表示原始变量之间不同的影响关系。由于这些基本关系很可能与特定的作用过程相联系,主成分分析使我们能从错综复杂的科普评估要素的众多指标中,找出一些主要成分,以便有效地利用大量统计数据,进行科普效果评估分析,使我们在研究科普效果评估问题中,可能得到深层次的一些启发,把科普效果评估研究引向深入。 例如,在对科普产品开发和利用这一要素的评估中,涉及科普创作人数百万人、科普作品发行量百万人、科普产业化(科普示范基地数百万人)等多项指标。经过主成分分析计算,最后确定个或个主成分作为综合评价科普产品利用和开发的综合指标,变量数减少,并达到一定的可信度,就容易进行科普效果的评估。 [编辑] 主成分分析法的基本原理 主成分分析法是一种降维的统计方法,它借助于一个正交变换,将其分量相关的原随机向量转化成其分量不相关的新随机向量,这在代数上表现为将原随机向量的协方差阵变换成对角形阵,在几何上表现为将原坐标系变换成新的正交坐标系,使之指向样本点散布最开的p 个正交方向,然后对多维变量系统进行降维处理,使之能以一个较高的精度转换成低维变量系统,再通过构造适当的价值函数,进一步把低维系统转化成一维系统。 [编辑] 主成分分析的主要作用

主成分和聚类分析

4实证过程与结果 主成分与聚类分析 首先通过SPSS软件对环境污染的相应指标进行主成分分析,得到: 提取Y 1、Y 2 、Y 3 和Y 4 四个主成分,其累积贡献率已经达到,超过80%,代表 所有环境污染指标的绝大部分信息。Y 1偏向于解释工业氢氧化物排放量,Y 2 偏向 于解释生活烟尘排放量,Y 3偏向于解释生活废水排放量,Y 4 偏向于解释工业二氧 化硫排放量。 然后,根据主成分分析结果,用Z=*Y 1+*Y 2 +*Y 3 + *Y 4 计算综合得分,见下表1。 表1 环境污染地区的主成分综合得分表 序号地区Z排名序号地区Z排名1北京517武汉13 2天津418长沙28 3石家庄619广州19 4太原820南宁24 5呼和浩特1221海口31 6沈阳1722重庆1 7长春1623成都20 8哈尔滨224贵阳18 9上海325昆明26 10南京1526拉萨30 11杭州927西安7 12合肥2128兰州23 13福州2529西宁11 14南昌2930银川27 15济南1031乌鲁木齐22 16郑州14 最后将环境污染的综合得分作为个案进行层次聚类分析,将31个地区分为5类,如表2。 表2 各地区污染分类 分类污染情况地区 1轻度污染海口、拉萨

2比较轻度污染合肥、乌鲁木齐、福州、南宁、兰州、,昆明、成都、银川、南昌、长沙、沈阳、长春、南京、广州、贵阳、郑州、武汉、济南、西宁、呼和浩特 3污染情况一般太原、杭州、石家庄、西安 4污染比较严重北京、天津 5污染十分严重上海、哈尔滨、重庆 主成分分析和聚类分析在SPSS中的操作过程 打开SPSS,“文件-打开-数据”,选中excel,如下图结果。 首先将变量标准化,“分析-描述统计-描述”,将变量全部选入对话框,点上“将标准化得分另存为变量(Z)”,结果如下。

spss主成分分析报告

实用标准文档 实验目的:原始数据中每一所高校具有20个相关性很高的变量,利用主成分分析法用较少的变量去解释原来资料中的大部分变异,将手中的众多变量转化成彼此相互独立或不相关的个数较少的变量,即所谓主成分,并用以解释资料的综合性指标,其实质的目的是降维 原始数据截屏: 操作方法: 1.描述性统计 SPS浙调用因子分析过程进行分析时,SPS泊自动对原始数据进行标准化处理, 所以在得到计算结果后指的变量都是指经过标准化处理后的变量,但SPSS¥会直接给出标准化后的数据,然后后期的计算需得到标准化数据,则需调用“描述” 过程进行计算,为了看到标准化数据,所以采用描述性统计下的描述操作获得标准化后的变量数据标准化数据: 文案大全

F|Em畦拇主引M±貌被丁救师中悝十 学待比出漏仔=与姑既K 7-巾式= 科研卷■暑 [生均同京 1^6979937S1? 4T121* 75377-1 979Q0-1 (JB6D9』asciDj-1 391 Bl母W84.B39EI3 2-G9799-91 M2 -1 5U?3D-75372970W-W02-1 060 Dd.1 230313083? 7BCHB 3-69799-SOTM -1 11367-69TT21317196933-7?D5戒主1辖■2S879-&D3B A-.69/991_2?042 -.38931-F5372-2.15TO1-US-1H1.S09B??1/12319>.58750 1.167T9 S-J6?/99-1.1208a -冷/m-.67&J2 -./Z330-1_2倾斗-1-23330.41? 07-1.16156.弓询」-.35303 -翘为9-J20H -邳15-.7201;-72J30-段皿-1.040072J屹尚tai574??9地183 7-^799-如了N TW427537? -72330」024?3-.118D9的迁-6970604683 H?979?醐鸵d J32D1C97+5 ^.723302CG0S? 1.662BB T.6T46Q 1 08^8153271成9 9.韵7 99 -.?6813 -T.06?D4.76372 723X 1 07262.69*24.30648-1.6MS41卫蜘24M2 10.65759-.76^87 .05220-.72012 "72330-14803"744.195B9■ .SW53■ 1.31233 11-6S799-.50022 -1.C204C-.72330-.?550-契H-.11005-1*319 1.05^2-539S3 12-02523 59C20-苍g "131761489473d B6?C46-1 19013-19537 r is68?4140664 2232Q-69772258?&-917J6359-777F1 1 84预? ?494? 14就41,1 睫354 W50T761?9fii* 1 392M3&q罪?73&*g4-5446T 因子分析操作过程: 选取变量: X1:科研经费得分 X2:国家人文社科重点研究基地得分 X3:院士总数得分 X4:生均图书得分 X5:研究中心数得分 X6:国家重点实验室得分 X7:生均教学科研仪器设备得分 X8 :生均教育事业经费得分 X9:精品课程得分 X10:优秀博士生论文总分 X11:人才得分 X12:二级学科建设得分 X13 :生均固定资产得分 X14:科研论文得分 X15:博导及相关合计得分 X16:教师中博士学位比重得分 X17: 一级学科得分 X18 :高级职称比重得分 X19:帅资总分 X20:SCI 数量

基于主成分法的学生成绩综合评价

现代经济信息 一、引言 在经济全球化和社会分工越来越细化的当今社会,人力资源已成为人类的第一宝贵资源。作为高素质人才主要培养基地的高等院校,如何科学地评价大学生的综合成绩成为当前各高校在全面推进素质教育过程中所面临的问题之一。传统的以多门课程总平均分排名的评价方法,比较笼统,为了尽可能全面、科学地反映被评价对象的情况,往往需要选取众多的指标构成评价体系,但是,过多的指标不仅会增加评价的工作量,还会因评价指标间的相关性造成评价信息相互重叠、相互干扰,从而难以客观地反映被评价对象的真实水平。本文认为可以使用主成分分析法解决此类问题。 二、主成分分析方法简介 主成分分析,是利用降维的方法,将多个指标转化为少数几个综合指标,去解释原始资料中的大部分变异的一种方法。在实际问题中,为了全面、系统地分析问题,通常必须考虑众多的影响因素,这些影响因素一般被称为指标或者变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时,变量太多会增加计算量和分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。因此,把这些变量转化成彼此不相关的变量,然后从中选出比原始变量个数少、却能解释原始资料中大部分变异的几个新变量,即所谓的主成分,从而达到降维和简化问题分析的目的。 具体而言,主成分分析法是通过数学变换把给定的一组相关变量通过线性变换转成另一组不相关的变量,并按方差依次递减的顺序排列,找到第一、第二、…第 k个主成分,然后计算因子载荷矩阵,建立主成分模型,最后按因子得分及贡献率的大小,计算综合得分并进行排序。 三、高校学生成绩综合评价应用 (一)研究的对象及指标的选择 本文以贵州航天职业技术学院11级社区管理与服务班在2011—2012学年的13门主要课程考试成绩为研究对象,借助统计软件进行主成分分析,计算出主成分得分,并按主成分得分对学生进行了排名。班上共有28名同学,将这28名同学作为总体,13门主要课程具体为:大学英语Ⅰ(x1)、思想道德修养与法律基础(x2)、管理学原理(x3)、社区管理学(x4)、社会工作法律实务(x5)、应用统计学(x6)、体育(x7)、社会心理学(x8)、服务礼仪(x9)、高等数学(x10)、团队建设(x11)、大学英语Ⅱ(x12)、大学语文(x13),学生姓名用序号1、2、… 28表示,用xij 表示第i个同学在第j 门课上的得分,则x=(xij)28×l3,这样就得到了一 个28×13的原始数据矩阵。见表1。 (二)主成分分析过程 将原始数据标准化,用计算机求出标准化矩阵的相关系数矩阵;求相关矩阵的特征值,确定主成分个数。(见表2) 基于主成分分析法的学生成绩综合评价 李 畅 贵州航天职业技术学院 摘要:以贵州航天职业技术学院2011级社区管理与服务班在2011—2012学年的13门主要课程考试成绩为研究对象,借助统计软件进行主成分分析,计算出主成分得分,并按主成分得分对学生进行了排名。为使成绩评价更具科学性、客观性和合理性,还将平均分和综合分比对,进行综合评价与分析,为教学研究、学生管理及就业指导提供科学依据。 关键词:主成分分析法;学习成绩;评价 中图分类号:G455 文献标识码:A 文章编号:1001-828X(2013)07-0408-03 408

相关主题
文本预览
相关文档 最新文档