稳健主成分分析方法研究及其在经济管理中的应用
- 格式:pdf
- 大小:116.52 KB
- 文档页数:5
文章编号:1000-6060(2001)02-0157-04主成分分析方法在区域经济研究中的应用3———以新疆为例①高志刚 韩延玲(新疆财经学院经济学系、统计与信息管理系,乌鲁木齐 830012)提 要 主成分分析方法(PCA)及采用此法做综合评价的原理和步骤,并用两个方面的实例具体阐述了主成分分析方法在区域经济研究中的应用,最后对这种方法的特点及应用中须注意的问题进行了初步总结。
关键词 主成分分析方法 区域经济中图分类号 F61.5 文献标识码 A1 主成分分析方法(PCA)简介主成分分析方法(Principal Component Analy2 sis),简称PCA,是通过原始变量的线性组合,把多个原始指标减化为有代表意义的少数几个指标,以使原始指标能更集中更典型地表明研究对象特征的一种统计方法。
为什么要减化原始指标?主要是因为各原始指标之间往往不是相互独立的,而不同程度地存在着某种相关关系(这种情况在实际问题中一般是不可避免的),要不使这些相关性造成原始指标信息重叠,降低指标作用,对以后的计算产生误差,就必须在高维空间中加以研究,这显然是比较麻烦的。
为克服此困难,很自然就会想到降维的方法,即利用全部p个指标来重新构造m个新的综合指标(一般m比p要小得多),以使这些较少的且相互之间又是独立的指标能尽可能地多反映原始指标的统计特性和信息量。
此外,如何将多指标综合为一个统一的评价值,这实质上就是怎样科学地确定各个指标的权重问题。
主成分分析方法正是在这两方面显示了其独特的作用。
采用主成分分析方法做综合评价,其原理和步骤如下〔1,2〕:(1)建立n个区域p个指标的原始数据矩阵M ij(i=1,2,…,n;j=1,2,…,p),并对其进行无量纲化或标准化处理,一般采用Z-score法无量纲化,得到M’ij矩阵。
对正指标有:Z ij=(X ij-X j)/S j;则对逆指标有:Z ij=(X j-X ij)/S j,其中:X j=1nΣNi=1X ij, S j=Σni=1(X ij-X j)2n(2)计算指标的相关系数矩阵R jk。
一、概述 在处理信息时,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠,例如,高校科研状况评价中的立项课题数与项目经费、经费支出等之间会存在较高的相关性;学生综合评价研究中的专业基础课成绩与专业课成绩、获奖学金次数等之间也会存在较高的相关性。
而变量之间信息的高度重叠和高度相关会给统计方法的应用带来许多障碍。
为了解决这些问题,最简单和最直接的解决方案是削减变量的个数,但这必然又会导致信息丢失和信息不完整等问题的产生。
为此,人们希望探索一种更为有效的解决方法,它既能大大减少参与数据建模的变量个数,同时也不会造成信息的大量丢失。
主成分分析正式这样一种能够有效降低变量维数,并已得到广泛应用的分析方法。
主成分分析以最少的信息丢失为前提,将众多的原有变量综合成较少几个综合指标,通常综合指标(主成分)有以下几个特点:✍主成分个数远远少于原有变量的个数原有变量综合成少数几个因子之后,因子将可以替代原有变量参与数据建模,这将大大减少分析过程中的计算工作量。
✍主成分能够反映原有变量的绝大部分信息因子并不是原有变量的简单取舍,而是原有变量重组后的结果,因此不会造成原有变量信息的大量丢失,并能够代表原有变量的绝大部分信息。
✍主成分之间应该互不相关通过主成分分析得出的新的综合指标(主成分)之间互不相关,因子参与数据建模能够有效地解决变量信息重叠、多重共线性等给分析应用带来的诸多问题。
✍主成分具有命名解释性总之,主成分分析法是研究如何以最少的信息丢失将众多原有变量浓缩成少数几个因子,如何使因子具有一定的命名解释性的多元统计分析方法。
二、基本原理主成分分析是数学上对数据降维的一种方法。
其基本思想是设法将原来众多的具有一定相关性的指标X1,X2,…,XP (比如p 个指标),重新组合成一组较少个数的互不相关的综合指标Fm 来代替原来指标。
那么综合指标应该如何去提取,使其既能最大程度的反映原变量Xp 所代表的信息,又能保证新指标之间保持相互无关(信息不重叠)。
主成分分析法及其应用一、本文概述主成分分析法(Principal Component Analysis,简称PCA)是一种广泛应用于数据降维和特征提取的统计方法。
它通过正交变换将原始数据集中的多个变量转换为少数几个互不相关的主成分,这些主成分能够最大程度地保留原始数据集中的信息。
本文旨在全面介绍主成分分析法的基本原理、实现步骤以及在各个领域中的应用案例。
我们将详细阐述主成分分析法的数学基础和算法流程,包括协方差矩阵、特征值、特征向量等关键概念的计算方法。
然后,我们将通过实例演示如何使用主成分分析法进行数据降维和特征提取,以及如何通过可视化工具展示降维后的数据效果。
我们将探讨主成分分析法在机器学习、图像处理、生物信息学、社会科学等多个领域中的实际应用,展示其在数据分析和处理中的重要价值和潜力。
二、主成分分析法的基本原理主成分分析法(Principal Component Analysis,简称PCA)是一种在多个变量中找出主要影响因素,并通过降维技术把多个变量转化为少数几个互不相关的综合变量的统计方法。
这种方法在保持数据信息损失最小的原则下,通过正交变换将原始数据转化为一个新的坐标系统,使得在这个新的坐标系统中,任何数据的最大方差都投影在第一主成分上,第二大的方差都投影在第二主成分上,以此类推。
变量降维:在多数情况下,原始数据集中可能存在多个变量,这些变量之间可能存在相关性。
主成分分析通过构造新的变量(即主成分),这些新变量是原始变量的线性组合,并且新变量之间互不相关,从而将原始的高维数据空间降维到低维空间,实现数据的简化。
方差最大化:主成分分析的另一个重要原理是方差最大化。
这意味着,第一个主成分将捕获数据中的最大方差,第二个主成分捕获第二大方差,以此类推。
通过这种方式,主成分分析能够识别出数据中的主要变化方向和模式。
数据解释性:主成分分析生成的主成分是对原始数据的线性变换,因此,每个主成分都可以被解释为原始变量的某种组合。
主成分分析在经济学领域的应用研究主成分分析(Principal Component Analysis,PCA)是一种常用的多变量数据降维技术,可以将高维数据转化为低维数据,以便更好地分析和解释数据的内在结构。
在经济学领域,主成分分析被广泛应用于数据降维、因子分析、经济变量的关联性研究等方面,为经济学研究提供了重要的工具和方法。
以下是主成分分析在经济学领域的应用研究内容:1. 数据降维与可视化分析主成分分析在经济学中最常见的应用是对多维经济数据进行降维处理,以便更好地进行数据分析和解释。
通过主成分分析,可以将大量经济指标或变量投影到几个主成分上,从而得到更少但信息含量丰富的综合指标,方便进一步的分析和处理。
同时,主成分分析还可以通过对数据的可视化分析,帮助经济学家更直观地理解数据的结构和特征。
通过绘制主成分分析得到的降维后的数据的散点图或者热力图,可以直观地观察不同经济变量之间的关系,发现潜在的经济规律和变量之间的相互作用。
2. 因子分析主成分分析在经济学中还被广泛应用于因子分析。
因子分析是一种统计方法,用于确定能够解释变量间方差共享的潜在因子。
通过主成分分析可以得到各个因子的权重系数,进而可以对经济变量进行综合性的评价和分析。
例如,在金融领域中,经济学家可以使用主成分分析来分析股票市场的规律和影响因素。
他们可以将股票市场的多个指标作为原始变量,然后应用主成分分析将这些指标转化为几个潜在的因子。
通过分析这些因子的权重和影响,可以更好地理解和解释股票市场涨跌的主要因素。
3. 经济变量关联性分析主成分分析还可以用于经济变量之间的关联性研究。
通过主成分分析,可以发现经济学中不同变量之间的相关性和相关程度。
这对于经济学研究非常重要,因为经济系统中的不同变量之间存在复杂的关系,如通货膨胀率、利率水平、国内生产总值等指标之间的相互影响。
通过主成分分析,经济学家可以将这些变量转化为少数几个主成分,从而更好地理解变量之间的关系和相互影响。
经济统计学中的主成分分析方法主成分分析(Principal Component Analysis,简称PCA)是一种常用的统计学方法,广泛应用于经济统计学领域。
它通过降维处理,将原始数据转化为一组新的无关变量,以揭示数据内在的结构和规律。
本文将介绍主成分分析的基本原理、应用场景以及相关的注意事项。
一、主成分分析的基本原理主成分分析的基本原理是通过线性变换,将原始数据转化为一组新的变量,使得新变量之间相互无关。
这些新变量被称为主成分,按照其解释原始数据方差的大小排序。
主成分分析的目标是尽可能保留原始数据的信息,同时降低数据的维度,以便更好地理解和分析数据。
主成分分析的步骤如下:1. 标准化数据:将原始数据进行标准化处理,使得每个变量的均值为0,方差为1,以消除变量间的量纲差异。
2. 计算协方差矩阵:根据标准化后的数据,计算变量之间的协方差矩阵。
协方差矩阵反映了变量之间的线性关系。
3. 计算特征值和特征向量:对协方差矩阵进行特征值分解,得到特征值和对应的特征向量。
特征值表示主成分的方差贡献,特征向量表示主成分的线性组合权重。
4. 选择主成分:按照特征值的大小排序,选择解释方差较大的特征值对应的特征向量作为主成分。
5. 重构数据:将原始数据通过主成分的线性组合重构出来,得到降维后的数据。
二、主成分分析的应用场景主成分分析在经济统计学中有着广泛的应用场景,以下列举几个例子。
1. 经济指标分析:主成分分析可以用于经济指标的综合评价。
例如,我们可以将多个相关的经济指标(如GDP、CPI、PPI等)作为原始数据,通过主成分分析得到一组综合指标,用于评估经济的整体状况。
2. 金融风险管理:主成分分析可以用于金融市场的风险管理。
通过将多个相关的金融指标(如股票收益率、利率、汇率等)进行主成分分析,可以得到一组无关的主成分,用于评估和控制金融风险。
3. 消费者行为分析:主成分分析可以用于消费者行为的分析。
例如,我们可以将多个相关的消费者行为指标(如购买金额、购买频率、购买渠道等)进行主成分分析,得到一组无关的主成分,用于揭示消费者的行为模式和偏好。
财务分析中的主成分分析方法研究财务分析是企业经营管理的重要环节之一,通过对企业财务数据的分析,可以为企业的决策提供重要的参考依据。
主成分分析方法是一种常用的财务分析方法,它可以对多个指标进行综合评价,从而更全面地了解企业的财务状况。
本文将从什么是主成分分析、主成分分析的应用以及主成分分析的优缺点三个方面进行探讨。
一、什么是主成分分析主成分分析(PCA)是一种线性变换技术,它通过将原始数据转化为一组新的无关变量,从而减少数据的维度。
在主成分分析中,我们需要确定一组新的变量,这些新变量被称为主成分,每个主成分都是原始变量的线性组合,它们之间是无关的。
每个主成分都代表了原始变量的一部分变异性,而第一主成分则代表了整个数据集的最大变异性。
主成分分析可以用来分析多个指标之间的关系,它可以找到不同指标之间的相似性和重要性,从而更好地了解企业的财务状况。
主成分分析常用于财务比较、研究投资组合中的因素、分析产品特点等等。
二、主成分分析的应用主成分分析可以应用于财务分析中的多个方面,下面将重点介绍其在财务比较和投资组合研究中的应用。
1. 财务比较财务比较是企业财务分析的核心内容之一。
比较不同企业、不同时间段之间的财务数据是必要的,以了解企业的财务状况及其经营效果。
主成分分析可以将多个指标的变异性综合在一起,判断企业的财务状况。
它不仅可以发现财务指标之间的相互影响,还可以定量地评估不同指标对财务状况的影响大小。
例如,在对不同企业的财务比较中,主成分分析可以依据财务指标之间的相关性,建立不同企业财务状况的评价模型,通过计算不同企业在各个因素上所得分值的综合来进行整体比较,从而更好地了解企业在财务方面的状况。
2. 投资组合研究主成分分析也可以应用于投资组合研究中,可以使用主成分分析来理解多种债券之间的风险和回报率、股票之间的相关性等。
通过将多个指标综合在一起,可以找到不同指标之间的相似性和重要性,从而更好地了解投资组合中不同资产的价值。
经济发展指标的主成分分析方法与应用经济发展是一个国家或地区经济水平提高的过程,是衡量一个国家或地区经济状况的重要指标之一。
为了更好地了解和分析经济发展情况,研究者们提出了许多的经济发展指标,并通过各种统计数据来描述经济发展的状态和趋势。
然而,由于经济指标之间存在着相互关联和冗余的问题,单独分析各个指标往往会忽略掉其中的一些信息,为了解决这个问题,主成分分析方法应运而生。
主成分分析是一种多变量统计分析方法,通过线性变换将原始观测变量转换为一组线性无关的主成分,从而达到降低维度的目的。
在经济发展领域,主成分分析被广泛应用于指标的筛选和综合评价。
下面将详细介绍主成分分析方法的原理和应用。
一、主成分分析的原理主成分分析的目标是通过线性变换将原始变量转化为一组新的互相无关的变量,其中第一个主成分解释了原始数据的最大方差,第二个主成分解释了剩余的最大方差,以此类推。
主成分的个数取决于所解释的方差阈值。
主成分分析的步骤如下:1. 数据准备:收集包含各个经济发展指标的数据,并对数据进行标准化处理,以消除量纲的影响。
2. 计算协方差矩阵:将标准化后的数据计算协方差矩阵,用以度量指标之间的相关性。
3. 计算特征值和特征向量:通过对协方差矩阵进行特征值分解,得到一组特征值和对应的特征向量。
4. 选择主成分:按照特征值的大小排序,选择具有最大特征值的前几个特征向量作为主成分。
5. 计算主成分得分:将原始数据与选取的主成分进行线性组合,得到每个观测值对应的主成分得分。
二、主成分分析的应用主成分分析在经济发展领域有着广泛的应用。
以下列举几个常见的应用案例:1. 经济发展指数构建:通过主成分分析可以将多个指标综合为一个经济发展指数,从而更好地反映一个国家或地区的经济发展水平。
通过选取具有较高特征值的主成分,可以确保综合指数包含了最多的原始信息。
2. 指标筛选:通过主成分分析可以识别出对经济发展影响最大的指标,帮助决策者更加精确地制定详细的发展战略。
主成分分析的实施步骤与应用领域主成分分析(Principal Component Analysis,简称PCA)是一种常用的多变量数据分析方法,它通过线性变换将原始数据转换为一组新的无关联线性变量,称为主成分。
这些主成分按照方差的大小依次排列,其中第一个主成分具有最大的方差。
在实践中,主成分分析被广泛应用于数据降维、特征选择和数据探索等领域。
本文将介绍主成分分析的实施步骤,并探讨其在不同应用领域中的具体应用。
一、主成分分析的实施步骤1. 数据预处理在进行主成分分析之前,首先需要对原始数据进行预处理。
这包括数据清洗、数据标准化和数据缺失值处理等步骤。
数据清洗可以剔除异常值和噪声数据,使得分析结果更加准确可靠。
数据标准化可以将数据转换为均值为0、方差为1的标准正态分布,消除不同变量之间的量纲差异。
对于存在缺失值的数据,可以使用插补方法进行处理。
2. 计算协方差矩阵协方差矩阵是主成分分析的基础,它描述了变量之间的线性相关关系。
通过计算原始数据的协方差矩阵,可以得到各个变量之间的相关性。
协方差矩阵的元素表示两个变量之间的协方差,对角线上的元素表示各个变量的方差。
3. 计算特征值和特征向量通过对协方差矩阵进行特征值分解,可以得到特征值和对应的特征向量。
特征值表示主成分的方差,特征向量表示主成分的方向。
特征向量是由归一化的协方差矩阵的特征向量组成。
4. 选择主成分选择主成分的原则是保留方差较大的主成分,以保留最多的原始数据信息。
可以通过特征值的大小进行排序,选择前几个特征值对应的特征向量作为主成分。
5. 计算主成分得分主成分得分是原始数据在主成分上的投影。
通过将原始数据乘以所选择的主成分的特征向量,可以计算得到各个样本在主成分上的得分。
主成分得分可以用于数据降维和分类等应用。
二、主成分分析的应用领域1. 数据降维主成分分析可以用于将高维数据降低到低维空间,减少数据的维度。
通过选择保留的主成分数量,可以实现数据的降维。
金融数据分析中的主成分分析算法研究主成分分析(PCA)是金融数据分析中常用的算法之一。
本文将从介绍PCA的基本原理、PCA在金融数据分析中的应用以及PCA算法的改进等方面进行研究。
一、PCA的基本原理PCA是一种无监督的降维技术,通过线性变换将原始数据转换成一组新的正交变量,使得这些变量能够最大程度地保留原始数据的信息。
简而言之,PCA通过找到数据中最重要的特征来实现数据的降维。
具体而言,PCA首先计算数据的协方差矩阵,然后对协方差矩阵进行特征值分解,得到特征值和对应的特征向量。
特征向量即为主成分,通过按照特征值的大小降序排列,即可选择出最重要的主成分。
二、PCA在金融数据分析中的应用1. 降维处理:金融数据通常包含大量的变量,而其中很多变量之间可能存在高度的相关性。
利用PCA可以将这些相关性较高的变量通过主成分合并为较少的综合指标,从而减少数据维度,简化模型构建过程。
2. 投资组合优化:PCA可以根据历史回报率数据,提取投资组合中的最主要成分。
通过选取适当数量的主成分作为投资组合的权重,可以构建优化后的投资组合,提高投资回报率同时控制风险。
3. 风险管理:金融市场具有高度的不确定性,风险的管理成为金融机构的重要任务之一。
利用PCA可以对金融市场中的各种风险因素进行分析和预测,帮助机构制定风险管理策略。
三、PCA算法的改进传统的PCA算法存在一些问题,例如对于非线性数据表现较差,以及对数据噪声敏感等。
因此,研究者们对PCA算法进行了一系列的改进。
1. 核主成分分析(KPCA):KPCA通过使用核函数来扩展PCA,使得PCA可以应用于非线性数据。
核函数可以将原始数据映射到高维空间,从而使得原本线性不可分的数据变为线性可分。
2. 增量主成分分析(IPCA):传统PCA需要一次性处理所有的数据,对于大规模数据集来说计算量很大。
IPCA通过分批处理数据,每次只处理一部分数据,并根据新加入的数据进行增量更新,从而减少了计算的复杂度。
主成分分析法及其在区域经济评价中的应用王佳(燕山大学经济管理学院,河北秦皇岛,066004)摘要:主成分分析是一种通过降维技术把多个变量化为少数几个主成分的统计分析方法。
本文首先介绍了主成分分析法的基本思想及计算步骤,并以此为研究方法,分析了其在区域经济发展水平评价中的实际应用。
关键词:主成分分析;区域经济;评价0 引言在用统计分析方法研究多变量的课题时,变量个数太多就会增加课题的复杂性。
人们自然希望变量个数较少而得到的信息较多。
在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。
主成分分析是对于原先提出的所有变量,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息。
1 主成分分析法的界定1.1概念主成分分析(principal component analysis)将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法。
又称主分量分析。
在实际课题中,为了全面分析问题,往往提出很多与此有关的变量(或因素),因为每个变量都在不同程度上反映这个课题的某些信息。
信息的大小通常用离差平方和或方差来衡量。
1.2 基本思想主成分分析法是由K.Pearson 在1901 年提出,并由H.Hotelling 在1933 年加以发展的,是一种简化数据集的技术,它是一种较为客观的多指标评价方法。
该方法将多指标问题化为较少的新指标,新指标是原来多个指标的线性组合,它们之间彼此互不相关,又能综合反映原来多个指标的信息,综合后的新指标称为原来指标的主成分。
其目的是:(1)变量的降维;(2)主成分的合理解释。
1.3 计算步骤第一步,对原始数据进行标准化处理,消除量纲不同的影响。
第二步,计算样本矩阵的相关系数矩阵R。
假定某评价体系中有n个样本,每个样本共有p个变量描述,则构成一个n×p 阶的初始矩阵:X=(xij )pn⨯,通过计算得相关系数矩阵R=(rij)pp⨯第三步,计算R的特征值和特征向量。
主成分分析法及其在经济金融中的应用浅析作者:孙一然来源:《文理导航·教育研究与实践》2018年第09期【摘要】主成分分析法,是对多变量大样本数据的一种有效的研究方法。
本文首先介绍主成分分析法的应用背景、定义和基本步骤,进一步介绍其内在本质,即数学中的降维思想。
并通过主成分分析法在经济、金融中的应用,说明数学知识对于各个社会领域的重要的应用意义。
【关键词】主成分分析法;经济金融;应用一、主成分分析法在许多领域中,往往涉及多变量大样本的数据,对这些数据进行分析和预测时,不能仅仅考虑单个变量的影响,而需要多个变量协同考虑。
然而,多个变量又相互作用,这就给分析和预测带来了一定的难度。
对此,需要引入合适的方法,将变量的数目简化,从而用较少的综合指标来反映多个变量中存放的信息。
主成分分析就是这样一种方法。
(一)主成分分析法的定义主成分分析法(principal component analysis,PCA)是一种数学变换的方法,它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。
在数学变换中保持变量的总方差不变,使第一变量具有最大的方差,称为第一主成分,第二变量的方差次大,并且和第一变量不相关,称为第二主成分。
依次类推,I个变量就有I 个主成分。
(二)主成分分析法的具体步骤1)将原始数据按行排列组成矩阵X;2)对X进行数据标准化,也就是使其均值变为零;3)求X的协方差矩阵C;4)将特征向量按特征值由大到小排列,取前k个按行组成矩阵P;5)通过计算Y=PX,得到降维后数据Y;6)计算每个特征根的贡献率,贡献率的大小一般用该特征根对应的特征值占特征值总和的比重来表示。
(三)主成分分析法所体现的数学思想运用主成分分析的目标,是希望用较少的变量去解释原来资料中的大部分变量,通常是选出比原始变量个数少,能解释大部分资料中变量的几个新变量,即所谓主成分。
由此可见,主成分分析法实际上是一种降维方法。
稳健统计在经济指标中的应用研究稳健统计学是一项应用性很强的学科,其主要针对的是统计学中一个普遍而实际的问题,这套方法不管是对科学研究还是对有关部门的经济政策的制定都有着十分重要的理论意义与现实意义,所以,笔者认为稳健统计在经济指标中的应用前景是非常客观的。
本文主要从以人均收入水平为指标以及稳健性的基本思想这两方面对稳健统计在经济指标中的应用进行了研究。
标签:稳健统计;经济指标;应用;一、以人均收入水平为指标对统计稳健性的思考我们在各种媒体上经常会看到平均数,尤其是算数平均数这两个经济指标;平均数是表示一组数据集中趋势的量数,它主要是反映数据集中趋势的一项指标;算术平均数是全部数据的算数平均,它是集中趋势作主要的测度值,在统计学中占有核心地位,是进行统计分析与统计推断的重要基础内容。
对其观察值的代表性研究通常采用的是方差,即各个数据与平均数之差的平方的平均数,将其作为主要的不同类型的指标。
但是,平均值与方差所应用的条件通常没有得到人们的高度重视,其中最具有代表性的表现就是人们日常不会对观察值所具有的形态分布进行全面的考虑,同时,也不会对分布的偏斜程度以及观察值的数据中的一个或几个数值与其他数据之间的差异情况进行充分的考虑。
从数据的纯度量情况上看,如果在实际收入数据中存在着百万或者是亿万的富翁时,那么,在很大程度上会将人均收入水平提高。
从这点我们不难看出,采用算术平均的方法来计算人均平均收入的指标,离群值会对其造成严重的影响,并且离群值对其造成的影响还会将各种数据对平均数造成的不良影响消除。
可以说,在这样的一种情况下,算术平均数在统计指标中算不上是一个好的。
反之,从人均收入本特值的角度而言,如果将中位收入替代算数人均收入,那么就会对一个函数的极大值或者极小值带来的干扰进行有效的抵抗。
当前,就收入的具体分布情况来看,中位收入与算术平均收入相比,其能够充分的抵抗离群值造成的干扰,可以说,它是一项比较好的统计指标。
主成分分析方法的应用研究(桂林理工大学理学院,广西桂林541004)主成分分析法能够在保证原始数据信息损失最小,以少数的综合变量取代原有的多维变量,使数据结构简化。
并且客观的确定权数,避免主观随意性,是经济效益综合评价的一种简单易行的有效方法。
运用此方法可以进行有效的数据分析。
标签:主成分分析;经济效益;多指标决策1 引言研究和应用中经常会碰到许多综合评价问题,其本质是多指标决策问题,多指标综合评价一方面增加了工作量,另一方面淡化了主要指标的作用。
对此,可采用数理统计法对所考虑的众多指标经过正交化处理,使其成为少数几个相互独立的综合指标,再根据综合指标进行评价。
主成分分析法恰为这种思路提供了数学依据。
2 主成分分析法简介2.1主成份分析通过降维的思想来精简变量,将多个相关的原始变量指标转化为几个独立的综合指标。
主成分是原始变量指标的线性组合,其转换的理念是让原始变量指标的线性组合的变异达到最大,这样就可以尽量减少信息的损失,仅利用几个重要的主成分就解释原始数据的大部分变异,同时简化了问题,能更好地揭示事物内部变量之间的规律,提高分析效率。
2.2 主成分分析的数学模型表1各市主要经济指标数据来源:数据来自于江西统计年鉴2009,江西各区域经济发展的相关指标数据如表1所示。
4 使用条件主成分分析适宜用于大样本的场合。
主成分分析要求变量之间有一定的相关关系。
5 应用指标的选取衡量一个地区的发展情况,既要注重某一产业的产值,又应从社会生产的各个方面去考虑,为各地区实现均衡发展提供理论依据。
根据适当性和可得性原则,选取江西各市为样本,选取主要经济指标包括:地区生产总会值X1,第二产业生产总值X2,生产总值增长速度X3,人均地区生产总值X4,地区人均财政一般预算收入X5,实际使用外资额X6,五十万元以上固定资产投资额X7,土地面积X8,卫生工作人员数X9,城乡居民储蓄存款余额X10,第三产业生产总值X11,社会消费品零售总额X12,高等学校学生数X13。