主成分分析和层次分析法
- 格式:doc
- 大小:37.00 KB
- 文档页数:4
主成分分析法及其应用一、本文概述主成分分析法(Principal Component Analysis,简称PCA)是一种广泛应用于数据降维和特征提取的统计方法。
它通过正交变换将原始数据集中的多个变量转换为少数几个互不相关的主成分,这些主成分能够最大程度地保留原始数据集中的信息。
本文旨在全面介绍主成分分析法的基本原理、实现步骤以及在各个领域中的应用案例。
我们将详细阐述主成分分析法的数学基础和算法流程,包括协方差矩阵、特征值、特征向量等关键概念的计算方法。
然后,我们将通过实例演示如何使用主成分分析法进行数据降维和特征提取,以及如何通过可视化工具展示降维后的数据效果。
我们将探讨主成分分析法在机器学习、图像处理、生物信息学、社会科学等多个领域中的实际应用,展示其在数据分析和处理中的重要价值和潜力。
二、主成分分析法的基本原理主成分分析法(Principal Component Analysis,简称PCA)是一种在多个变量中找出主要影响因素,并通过降维技术把多个变量转化为少数几个互不相关的综合变量的统计方法。
这种方法在保持数据信息损失最小的原则下,通过正交变换将原始数据转化为一个新的坐标系统,使得在这个新的坐标系统中,任何数据的最大方差都投影在第一主成分上,第二大的方差都投影在第二主成分上,以此类推。
变量降维:在多数情况下,原始数据集中可能存在多个变量,这些变量之间可能存在相关性。
主成分分析通过构造新的变量(即主成分),这些新变量是原始变量的线性组合,并且新变量之间互不相关,从而将原始的高维数据空间降维到低维空间,实现数据的简化。
方差最大化:主成分分析的另一个重要原理是方差最大化。
这意味着,第一个主成分将捕获数据中的最大方差,第二个主成分捕获第二大方差,以此类推。
通过这种方式,主成分分析能够识别出数据中的主要变化方向和模式。
数据解释性:主成分分析生成的主成分是对原始数据的线性变换,因此,每个主成分都可以被解释为原始变量的某种组合。
主成分分析法什么事主成分分析法:主成分分析(principal components analysis , PCA 又称:主分量分析,主成分回归分析法主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。
在统计学中,主成分分析(principal components analysis,PCA)是一种简化数据集的技术。
它是一个线性变换。
这个变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。
主成分分析经常用减少数据集的维数,同时保持数据集的对方差贡献最大的特征。
这是通过保留低阶主成分,忽略高阶主成分做到的。
这样低阶成分往往能够保留住数据的最重要方面。
但是,这也不是一定的,要视具体应用而定。
主成分分析的基本思想:在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。
这些涉及的因素一般称为指标,在多元统计分析中也称为变量。
因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。
在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。
主成分分析正是适应这一要求产生的,是解决这类题的理想工具同样,在科普效果评估的过程中也存在着这样的问题。
科普效果是很难具体量化的。
在实际评估工作中,我们常常会选用几个有代表性的综合指标,采用打分的方法来进行评估,故综合指标的选取是个重点和难点。
如上所述,主成分分析法正是解决这一问题的理想工具。
因为评估所涉及的众多变量之间既然有一定的相关性,就必然存在着起支配作用的因素。
根据这一点,通过对原始变量相关矩阵内部结构的关系研究,找出影响科普效果某一要素的几个综合指标,使综合指标为原来变量的线性拟合。
什么是主成分分析法主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。
在统计学中,主成分分析(principal components analysis,PCA)是一种简化数据集的技术。
它是一个线性变换。
这个变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。
主成分分析经常用减少数据集的维数,同时保持数据集的对方差贡献最大的特征。
这是通过保留低阶主成分,忽略高阶主成分做到的。
这样低阶成分往往能够保留住数据的最重要方面。
但是,这也不是一定的,要视具体应用而定。
[编辑]主成分分析的基本思想在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。
这些涉及的因素一般称为指标,在多元统计分析中也称为变量。
因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。
在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。
主成分分析正是适应这一要求产生的,是解决这类题的理想工具。
同样,在科普效果评估的过程中也存在着这样的问题。
科普效果是很难具体量化的。
在实际评估工作中,我们常常会选用几个有代表性的综合指标,采用打分的方法来进行评估,故综合指标的选取是个重点和难点。
如上所述,主成分分析法正是解决这一问题的理想工具。
因为评估所涉及的众多变量之间既然有一定的相关性,就必然存在着起支配作用的因素。
根据这一点,通过对原始变量相关矩阵内部结构的关系研究,找出影响科普效果某一要素的几个综合指标,使综合指标为原来变量的线性拟合。
这样,综合指标不仅保留了原始变量的主要信息,且彼此间不相关,又比原始变量具有某些更优越的性质,就使我们在研究复杂的科普效果评估问题时,容易抓住主要矛盾。
综合评价研究方法综述本文主要是在前人研究基础上,分析了AHP层次法、模糊评测法、主成分分析法以及topsis等几种评价方法的基本思想、优缺点。
为以后的研究提供参考。
标签:AHP层次法;模糊评测法;主成分分析法;topsis在工作生活中,我们经常讲影响事物的各个因素分析整理成一个综合指标,从而全面面、准确评价一个问题,这就是多指标综合评价方法。
近年来,围绕多指标综合评价方法,多学科知识不断融合,相应的研究方法已有几十种。
根据权重计算方法大致可以分为依靠专家经验打分的专家经验法以及依靠计量模型的客观复制法。
前者主要是专家学者利用学识、工作经验等人为给予指标权重。
如层次分析法;后者主要是依靠指标之间的统计关系来确定指标权重,依据相关检验筛选指标,如主成分分析方法。
下文对相应的研究进行整理。
一、专家经验法1.层次分析法层次分析法美国运筹学家匹茨堡大学教授萨蒂于20世纪70年代初提出的,他的基本原理是将复杂问题划分成几个层次,层次之间元素大致相等并且相互联系,层次之间按照隶属关系构成一个有序的递阶层次模型。
计算方法是,首先根据两两重要性程度,进行两两对比,并按重要性程度评价,构建一个判断矩阵。
其次根据判断矩阵,计算权重向量,并归一化为权值;最后进行一致性检验,在计算判断矩阵的阶数时,难以构建出满足一致性的矩阵,因此必须对判断矩阵的偏离一致性检验程度进行判定。
(1)层次分析法的优点①定性与定量相结合。
该方法把指标进行两两对比,并根据指标重要性,由专家根据经验赋予指标权重,从而将定性指标定量化。
充分发挥定量分析与定性分析优势。
②所需定量数据信息较少。
层次分析法模拟人脑的思维过程,将各要素抽象化,具体化,定量化。
(2)层次分析法的缺点①定量数据少,定性程序多,信服力不够。
由于各指标之间的重要性是人为赋予的,不同指标的重要性在不同专家那儿重要性不够。
主观随意性强,说服力不够。
②元素过多容易出现不一致问题。
当同一层次的元素数量过多时,决策者容易做出错误的判断,从而矩阵很难满足通过一致性检验,预测效果不理想。
评价指标体系构建原则及综合评价方法设置评价指标体系时一般要遵循以下原则:(1)区域性原则衡量一个研究对象的运行情况,要从特定的区域出发因地制宜、发挥优势,评价指标要具有针对性。
(2)动态性原则研究对象是一个动态的过程,指标的选取不仅要能够静态的反映考核对象的发展现状,还要动态的考察其发展潜力。
选取的指标要能够具有动态性,可以衡量同一指标在不同时段的变动情况,并且要求所选指标在较长的时间具有实际意义。
(3)可量化原则数据的真实性和可靠性是进行监测的前提条件和重要保障,需要大量的统计数据作为支持。
选取的指标应该具有可量化的特点,在保证指标有较高反映考核对象的前提下,能够直接查到或者通过计算间接得到指标数据,以保证评价的可操作性,同时数据来源要具有权威性,这样能保证正确评估研究对象。
(4)层次性原则一级指标同时分别设立多个具体的子指标。
在众多指标中,把联系密切的指标归为一类,构成指标群,形成不同的指标层,有利于全面清晰的反映研究对象。
综合评价方法的选取:随着计算机技术飞速发展和普遍应用,用于定量评价多指标问题的多指标综合评价法被广泛应用到经济、生活的各个方面,特别是SAS、SPSS等统计软件的使用更加提高综合评价法的实用性。
目前用于分析多指标体系的综合评价方法主要有模糊综合评价法、灰色综合评价法、数据包络分析法(DEA 法)、层次分析法、主成分分析法以及因子分析法以等多种方法,不同方法的评价结果都是依据指数或分值对参评对象的综合状况进行排序评价。
在综合评价过程中,指标权重的确定十分重要。
对指标赋值主要有主观赋值和客观赋值,也有将主观、客观赋值法结合起来的。
对于指标数量比较大时,采用传统的主观赋值法确定指标的权重则难以全面把握众多指标,依赖主观判断会增大或降低一些指标的重要程度,导致实证的结果难以反映客观实际情况。
客观赋值法如主成分分析法、变异系数法、熵值法等,权重的确定是根据各项指标的变异程度或者各指标之间的相互关系。
主成分分析法什么事主成分分析法:主成分分析(principal components analysis,PCA)又称:主分量分析,主成分回归分析法主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。
在统计学中,主成分分析(principal components analysis,PCA)是一种简化数据集的技术.它是一个线性变换。
这个变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。
主成分分析经常用减少数据集的维数,同时保持数据集的对方差贡献最大的特征。
这是通过保留低阶主成分,忽略高阶主成分做到的。
这样低阶成分往往能够保留住数据的最重要方面。
但是,这也不是一定的,要视具体应用而定。
主成分分析的基本思想:在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。
这些涉及的因素一般称为指标,在多元统计分析中也称为变量。
因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠.在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。
主成分分析正是适应这一要求产生的,是解决这类题的理想工具。
同样,在科普效果评估的过程中也存在着这样的问题。
科普效果是很难具体量化的。
在实际评估工作中,我们常常会选用几个有代表性的综合指标,采用打分的方法来进行评估,故综合指标的选取是个重点和难点。
如上所述,主成分分析法正是解决这一问题的理想工具.因为评估所涉及的众多变量之间既然有一定的相关性,就必然存在着起支配作用的因素。
根据这一点,通过对原始变量相关矩阵内部结构的关系研究,找出影响科普效果某一要素的几个综合指标,使综合指标为原来变量的线性拟合.这样,综合指标不仅保留了原始变量的主要信息,且彼此间不相关,又比原始变量具有某些更优越的性质,就使我们在研究复杂的科普效果评估问题时,容易抓住主要矛盾。
权重确定方法归纳多指标综合评价是指人们根据不同的评价目的,选择相应的评价形式据此选择多个因素或指标,并通过一定的评价方法将多个评价因素或指标转化为能反映评价对象总体特征的信息,其中评价指标与权重系数确定将直接影响综合评价的结果。
按照权数产生方法的不同多指标综合评价方法可分为主观赋权评价法和客观赋权评价法两大类,其中主观赋权评价法采取定性的方法由专家根据经验进行主观判断而得到权数,然后再对指标进行综合评价,如层次分析法、综合评分法、模糊评价法、指数加权法和功效系数法等。
客观赋权评价法则根据指标之间的相关关系或各项指标的变异系数来确定权数进行综合评价,如熵值法、神经网络分析法、TOPSIS法、灰色关联分析法、主成分分析法、变异系数法等。
两种赋权方法特点不同,其中主观赋权评价法依据专家经验衡量各指标的相对重要性,有一定的主观随意性,受人为因素的干扰较大,在评价指标较多时难以得到准确的评价。
客观赋权评价法综合考虑各指标间的相互关系,根据各指标所提供的初始信息量来确定权数,能够达到评价结果的精确但是当指标较多时,计算量非常大。
下面就对当前应用较多的评价方法进行阐述。
一、变异系数法(一)变异系数法简介变异系数法是直接利用各项指标所包含的信息,通过计算得到指标的权重。
是一种客观赋权的方法。
此方法的基本做法是:在评价指标体系中,指标取值差异越大的指标,也就是越难以实现的指标,这样的指标更能反映被评价单位的差距。
例如,在评价各个国家的经济发展状况时,选择人均国民生产总值(人均GNP)作为评价的标准指标之一,是因为人均GNP不仅能反映各个国家的经济发展水平,还能反映一个国家的现代化程度。
如果各个国家的人均GNP没有多大的差别,则这个指标用来衡量现代化程度、经济发展水平就失去了意义。
由于评价指标体系中的各项指标的量纲不同,不宜直接比较其差别程度。
为了消除各项评价指标的量纲不同的影响,需要用各项指标的变异系数来衡量各项指标取值的差异程度。
2.2 权重确定确定体系指标之后需要确定各指标在体系结构中所发挥影响的大小,即各指标的权重。
比较常见的权重确定方法有层次分析法、专家打分法、模糊分析法、最大熵技术法、主成分分析法、特征值法、灰色关联法、概率统计法等。
2.2.1 层次分析法(AHP法)层次分析法是应用最多的一种权重确定方法,该方法是美国运筹学家Pittsburgh大学教授Satie于20世纪70年代初,在为美国国防部研究“根据各个工业部门对国家福利的贡献大小而进行电力分配”课题时,应用网络系统理论和多目标综合评价方法,提出的一种层次权重决策分析方法。
它将决策问题按总目标、各层子目标、评价准则直至具体的备选方案的顺序分解为不同的层次结构,然后得用求解判断矩阵特征向量的办法,求得每一层次的各元素对上一层次某元素的优先权重,最后再加权和的方法递阶归并各备选方案对总目标的最终权重,最终权重最大者即为最优方案。
以下用数学公式来表述具体步骤:①构建层次结构模型图2.2 AHP法结构示意图②构造判断矩阵B= ⎝⎛⋯12111B B B i i22212B B B ⋯⋯⋯⋯⋯⎪⎪⎪⎪⎪⎭⎫⋯ij j j B B B 21,其中B ij =j i b b ,表示第i 个因素与第j 个因素重要性之比。
重要性的确定一般采用1-9标度法进行,即对各要素重要性进行人为拟定重要程度,级别分为1-9九类程度依次递增。
目标层与准则层,准责层与指标层直接都是使用这种方法构建矩阵。
③权重计算计算相邻层级之间的层次单排序权重就是计算矩阵最大特征值与特征向量,即计算满足B·ν=λ·ν,其中λ为特征值,ν为特征向量,特征向量的每一个分量即为相对应的要素单排序权重。
④一致性检验 CI=1max --n n λ,RI=1max ^--n n λ(其中^λm ax 为随机从B 中任取分量构成的矩阵最大特征向量),CR=RI CI; 当CR<0.1时,不一致性可接受,否则必须调整判断矩阵这种方法的优点是系统、实用,既使用了数学的严谨推导,又保留了人为思考的空间,同时在数学推导方面仅进行较简单的求特征值特征向量与加权求和,简化了过程。
主成分分析(principal components analysis,PCA)又称:主分量分析,主成分回归分析法什么是主成分分析法主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。
在统计学中,主成分分析(principal components analysis,PCA)是一种简化数据集的技术。
它是一个线性变换。
这个变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。
主成分分析经常用减少数据集的维数,同时保持数据集的对方差贡献最大的特征。
这是通过保留低阶主成分,忽略高阶主成分做到的。
这样低阶成分往往能够保留住数据的最重要方面。
但是,这也不是一定的,要视具体应用而定。
[编辑] 主成分分析的基本思想在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。
这些涉及的因素一般称为指标,在多元统计分析中也称为变量。
因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。
在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。
主成分分析正是适应这一要求产生的,是解决这类题的理想工具。
同样,在科普效果评估的过程中也存在着这样的问题。
科普效果是很难具体量化的。
在实际评估工作中,我们常常会选用几个有代表性的综合指标,采用打分的方法来进行评估,故综合指标的选取是个重点和难点。
如上所述,主成分分析法正是解决这一问题的理想工具。
因为评估所涉及的众多变量之间既然有一定的相关性,就必然存在着起支配作用的因素。
根据这一点,通过对原始变量相关矩阵内部结构的关系研究,找出影响科普效果某一要素的几个综合指标,使综合指标为原来变量的线性拟合。
模型3主成分分析法一、原理&问题分析:对供应商的评价方法很多, 主要将其分为定性和定量两大类: 选择供应商的定性方法主要有: 直观判断法、招标法、协商选择法等。
选择供应商的定量方法主要有:线性权重法、采购成本法、ABC (Activity Based Costing Ap2proach) 成本法、层次分析法、数据包络分析法、模糊综合评价法、贴近度法、主成分分析法等等。
评价指标之间存在一定的相关性, 本题目利用主成分分析法对供应商进行综合评价。
主成分分析法是一种有效的多指标决策和综合评价的多元统计方法, 通过恰当的数量变换, 使新变量———主成分成为原变量的线性组合, 并选取少数几个在变差总信息量中比例较大的主成分来分析事物的一种方法。
利用数理统计中的主成分法进行评价, 在指标权重的选择上克服了主观因素的影响, 不仅能综合反映个企业效益强弱的各项信息, 而且能确定出每个指标的客观权重。
主成分分析法通常的做法是,寻求原指标的线性组合F.I满足如下的条件:每个主成分的系数平方和为1。
即主成分之间相互独立,即无重叠的信息。
即主成分的方差依次递减,重要性依次递减,即二、主成分分析法综合评价1.建立样本模型矩阵技术水平,经济效益,供应能力,市场影响度;列向量为5家待选商对应的各个指标值。
其中产品价格、地理位置、售后服务指标属于成本型指标,产品质量、技术水平、供应能力、经济效益、交货情况、市场影响度指标属于效益型指标。
2.对数据进行标准化。
利用公式 min max min jjj ij ij aaa ab --=对效益型指标标准化;利用公式min max max jj ij j ij a a a a b --=对成本型指标标准化。
各指标标准化后利用MATLAB 得相关系数矩阵如下:3.计算特征值和特征向量。
首先由特征方程0=-R I λ,求出特征值)8...1(=i i λ,并将其按从大到小进行排列0821≥≥≥λλλ ;其次分别求出对应于特征值i λ的特征向量)81( =i G i ;最后计算特征值的贡献率和累计贡献率。
5.3.1 指标权重确定的方法
在污泥干化安全评价指标体系中,每个指标对实现系统评价目标和功能的重要程度各不相同,因此,每个指标权重的精确性直接决定了综合安全评价结果的准确定。
在综合安全评价中,权重的确定方法有几十种,按照原始数据的来源可分为两类,一类是主观赋值法,即根据专家的经验主观判断,另一类是客观赋值法即根据评价指标的实际数据确定。
目前,计算权重的方法主要有德尔菲法(专家法)、层次分析法(AHP法)、主成分分析法等。
特尔菲法及因素成对比较方法简便易行,但有时结果不太理想。
层次分析法则具有以下优点:在对整个评价指标体系进行系统分析之后,能形成指标概念明确、直观的评价模型,对其可进行定量的计算,并且可以进行自我检验,权重计算调整也较为方便。
本研究采用特尔菲法及AHP法相结合的方法确定各指标权重。
首先在层次分析法的基础上,对污泥干化各安全指标作出评价,然后通过专家咨询和评分相结合分别构造判断矩阵,然后计算出污泥干化安全评价指标的权重。
5.3.2 层次分析法的分析步骤
1 规定判断矩阵标度
目前矩阵标度大多采用:向填写人(专家)反复询问:针对判断矩阵的准则,其中两个元素两两比较哪个重要,重要多少,对重要性程度按1-9赋值(重要性标度值见下表)。
表1 重要性标度含义表
2 构造判断矩阵并赋值
根据层次分析模型,每位问卷评分者就可以依据个人对评价指标的主观评价,进行综合分析,对各指标之间进行两两对比之后,然后按9分位比率排定各评价指标的相对优劣顺序,依次构造出评价指标的判断矩阵。
权重的确定方法汇总在许多领域,如数据分析、评估体系、决策制定等,确定权重是一项关键任务。
权重的合理确定能够影响最终的结果和决策的准确性。
下面,让我们一起来探讨一些常见的权重确定方法。
一、主观赋权法主观赋权法是基于专家的经验和判断来确定权重的方法。
其中,最常见的就是德尔菲法和层次分析法。
德尔菲法是通过多轮匿名调查,向专家征求意见,并在每一轮结束后进行反馈和调整,直到专家的意见趋于一致。
这种方法的优点是能够充分发挥专家的智慧和经验,但缺点是过程较为繁琐,而且可能受到专家主观因素的影响。
层次分析法则是将复杂的问题分解为多个层次和因素,通过两两比较的方式确定相对重要性,进而得出权重。
它的优势在于能够系统地处理复杂问题,但也存在判断矩阵一致性检验等较为复杂的步骤。
二、客观赋权法客观赋权法是基于数据本身的特征来确定权重,常见的有熵权法、主成分分析法和因子分析法。
熵权法根据指标的变异程度来确定权重。
如果某个指标的变异程度较大,说明其提供的信息量较多,权重也就相应较大。
这种方法的优点是完全基于数据,不受主观因素影响,但对于数据的质量和数量有一定要求。
主成分分析法通过将多个相关变量转化为少数几个不相关的综合变量(主成分),并根据主成分的方差贡献率来确定权重。
它能够有效地减少变量的数量,同时保留原始数据的大部分信息。
因子分析法与主成分分析法类似,但它更侧重于寻找潜在的公共因子,通过因子得分来确定权重。
三、组合赋权法为了综合主观和客观赋权法的优点,常常采用组合赋权法。
组合赋权法通常有两种思路:一是先分别使用主观和客观赋权法得到两组权重,然后通过一定的方法(如加权平均)进行组合;二是将主观和客观的信息同时纳入一个模型中,共同确定权重。
四、基于机器学习的方法在大数据时代,机器学习算法也被应用于权重的确定。
例如,在神经网络中,通过训练模型,让网络自动学习各个特征的权重。
但这种方法需要大量的数据和较高的计算资源,并且模型的解释性相对较差。
指标赋权与评价类方法总结一、主观赋权1、AHP层次分析法(1)模型简介层次分析法(AHP)是一种解决多目标复杂问题的定性定量决策分析方法。
该方法将定量分析与定性分析相结合,以决策者的经验来判断衡量目标能否实现的标准的相对重要性,并合理地给出各决策方案的各标准的权重,利用权重找出各方案的优劣顺序,有效地应用于那些难以用定量方法解决的问题。
(2)步骤标度含义1同等重要性3稍微重要5明显重要7非常重要9极端重要2,4,6,8上述两相邻判断的中值倒数如果A与B相比如果标度为3,则B与A相比为1/3矩阵阶数123456789 RI000.580.961.121.241.321.411.45若判断矩阵 C R = C I R I < 0.10 CR=\frac{CI}{RI}<0.10 CR=RICI<0.10时,则此判断矩阵具有满意的一致性,否则需要对判断矩阵进行调整。
(3)具体算法判断矩阵的一致性检验通过后,计算各指标的权重。
计算权重的方法有三种:算术平均法、几何平均法和特征值法。
(4)模型优缺点优势层次分析法是一种对定性问题进行定量分析的简单、灵活、实用的多准则决策方法。
把研究对象作为一个系统,按照分解、比较判断、综合的思路进行决策,这种方法可以把定量和定性结合起来。
模型中使用了层次分析法得到的权重,综合各种指标得出结论,可以避免一定的误差。
缺点主观因素对判断矩阵影响很大。
当决策者的判断受其主观偏好影响太大时,结果不够客观。
(5)参考资料层次分析法(AHP)详细步骤数学建模十大算法——层次分析法网络分析法ANP AHP、ANP、熵值法二、客观赋权1、主成分分析(1)简介主成分分析(Principal Component Analysis,PCA),是一种统计方法。
通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。
(2)基本原理主成分分析法是一种降维的统计方法,它借助于一个正交变换,将其分量相关的原随机向量转化成其分量不相关的新随机向量,这在代数上表现为将原随机向量的协方差阵变换成对角形阵,在几何上表现为将原坐标系变换成新的正交坐标系,使之指向样本点散布最开的p个正交方向,然后对多维变量系统进行降维处理,使之能以一个较高的精度转换成低维变量系统,再通过构造适当的价值函数,进一步把低维系统转化成一维系统。
(一)层次分析法简介层次分析法其实是主观赋权法的一种,主观赋权法是由评价者对评价指标进行主观上的赋权,主要是通过评价者的对评价指标进行打分,从而获得定量化的数据,常用的还有德尔菲法。
通过主观赋权法对评价指标权重系数进行确定,能够反映评价者的经验知识以及主观意向,是较为常用的指标赋权方法。
但是想要获取较为准确的评价结果,必须要做大量的工作,务必对大量的评价者进行咨询,然后其评价结果也相对主观。
相对而言,客观赋权法的影响因素主要来源于客观环境。
常见的客观赋权法有因子分析法、主成分分析法、嫡值法等。
虽然客观赋权法能够克服主观一些不利的影响因素,所获得的结果也有较强的数学理论基础,但是其并不能完全符合权重的基本性质,没有对指标本身的重要性进行考虑。
为此,本文为了能够更加全面的对数据进行分析,同时采用主观赋权法和客观赋权法进行比较研究,主要采用层次分析法和主成分因子分析法。
“层次分析法(analytic hierarchy process,AHP)是美国运筹学家T.L.Satty教授于20世纪70年代初期提出的一种简便、灵活而又实用的定性与定量分析相结合的多准则决策方法[31]”。
其主要是指将与决策有关的所有影响因素分为目标层、准则层、方案层等层次,并以此基础进行定性和定量分析的一种方法。
其将复杂的问题用有序递阶层次结构表示,并且根据指标的优劣进行对比排序,然后进行指标相对重要性的两两比较,给出与其相对应的比例标度,构造上层某个指标对下层相对应指标的判断矩阵,以确定相关指标对上层指标的相对重要序列。
此外,还要对其一致性进行检验,才能进行目标下的因素单排序,最后将各子目标下因素的排序逐层汇总后,通过计算获得总目标下因素的总排序,从而得出不同要素或评价对象的优劣权重值,为决策和评价提供依据[32]。
(二)模糊综合评价法“模糊综合评价方法是以模糊数学为基础,应用模糊关系合成的原理,将一些边界不清、不易定量的因素定量化,从多个因素对被评价事物隶属等级状况进行综合性评级的一种方法[33]”。
基于主成分分析和层次分析法的某市投资环境评价模型建立研究 1 关于因子分析 围绕浓缩原有变量提取因子的核心目标,因子分析主要涉及以下内容: 1.1因子分析的前提条件; 1.2因子载荷矩阵的求解和因子提取; 1.3因子命名 1.4计算因子得分。 2层次分析法 运用层次分析法建模,大体上可按下面四个步骤进行: 2.1建立递阶层次结构模型; 2.2构造出各层次中的所有判断矩阵; 2.3层次单排序及一致性检验; 2.4层次总排序及一致性检验。 3指标体系的建立与评价模型的构建 3.1指标体系的建立 X市投资环境评价分为三个层次:第一层是目标层;第二层准则层包括发展与效率综合指标、基础设施与配套能力综合指标、人力资源与社会责任综合指标、环境保护与节能减排综合指标、技术创新综合指标等五个二级指标;第三层是具体的评估指标。按照指标选取的全面性、科学性、目的性、可操作性以及最少性的原则,本研究引入22个指标变量以反映综合投资环境水平。 3.2评价模型的构建 3.2.1准则层评价模型的构建 为把各具体投资环境评价指标项聚合成为准则层的综合得分,采用主成分分析法进行处理。使用主成分法作综合评价时,主成分量选择的原则是其累计概率≥85%。 在主成分分析法确定各综合评价因子权重的基础上,构造评价模型,即:
mijijjVUp1)5,4,3,2,1( (1)
其中pj代表各子竞争力得分,Ui为各子竞争力相应的因子的主成分得分,Vi为各子竞争力相应的因子的权重值(即为主成分贡献率),m 为综合因子数。 3.2.2目标层评价模型的构建 在已求得的准则层综合得分的基础上,我们选择层次分析法(AHP)来确定准则层的权重。本研究运用层次分析法建模时,具体步骤为:第一步,建立层次分析模型;第二步,构造判断矩阵A;第三步,计算层次权重及一致性检验。 目标层投资环境评价模型为:
njjjPIS1 (2)
其中S 为研究对象投资环境评价综合得分,Ij为准则层各综合指标的权重值,Pj为准则层各综合指标得分,n为5。 4 某市投资环境评价的实证分析 4.1利用主成分分析计算各准则层综合得分 利用SPSS软件对准则层其下属指标层各变量系统进行主成分分析,其综合得分及排名如表1所示。 以准则层发展与效率指标为例,利用SPSS软件来实现该系统变量的主成分分析。 第一,采用Z-Score方法对原始数据进行标准化处理[6]。本文采用SAS软件中的proc、standard命令对数据进行标准化处理,变换后所得的新数据,mean=0,std=1,变化幅度大大缩小,从而实现了对原始数据的标准化处理。 第二,建立指标之间的相关系数矩阵R。由SPSS程序输出结果知c1与c2、c3、c4、c5这些指标之间存在很强的相关性,所以必须在这些具有重复性情报信息的变量中,选择能够说明大部分情报信息的几个主成分。 第三,计算相关矩阵R的特征值λi和特征向量hj及方差贡献率(如表2所示)。表2是SPSS程序输出样本相关矩阵的特征值、差值、贡献率以及累积贡献率的结果。Eigenvalue是样本相关矩阵的特征值(即主成分的方差),Difference为相关矩阵的差值,Proportion为各主成分的贡献率,Cumulative为主成分的累积贡献率。主成分方差越大,主成分的贡献率越大,则主成分对情报的说明力越强,从表2我们可以看出,第一主成分的特征值是4.91845091,而第一主成分的贡献率也已达到了54.65%。 第四,确定主成分个数。由表2知前四个主成分的累计贡献率已达到93.70%,说明前四个主成分基本包含了全部指标具有的信息,即完全能够反映大部分情报,所以取前四个主成分即可,并计算出相应的特征向量(即主成分负载值,见表3) 第五,利用公式Ci=eiZ=e1iZ1+e2iZ2+K+eπZp计算各主成分得分。其中ei为个主成分负载值,Z 为原始数据经过标准化后的数据(各主成分得分结果略)。 第六,数据解释。各地区得分有负值出现,这是因为在主成分分析中,由于各指标均进行了标准化处理,得分无满分概念,综合得分数值的大小只是反映了样本在经济及产业结构竞争力水平的高低,31个地区的平均水平为零,正分为高出平均水平的程度,负分为低于平均水平的的程度。 4.2利用AHP计算综合竞争力得分1.构造判断矩阵 首先,组织专家利用T.L.Saaty提出的(1~9)九标度方法对四大子竞争力系统进行打分,然后在此基础上,再构造判断矩阵,并由此计算出比较元素间的相对权重[5]。判断矩阵如表4所示。在判断矩阵的基础上,利用Matlab软件计算矩阵最大特征值λmax及相应的特征向量(各子系统的相应权重),结果如下:λmax =4.102 2,W%i =(w1,w2, w3, w4 ) = (0.496 5, 0.313 2,0.139 3,0.050 9)。 2.一致性检验 对判断矩阵的一致性检验的步骤如下: (1)计算一致性指标CI。CI=λmax-n n-1 =4.1022-43 =0.03406 (2)查找相应的平均随机一致性指标RI。对n=1,Λ,9,Saaty给出了RI的值,如表5所示。 (3)计算一致性比例CR。当CR<0.10时,认为判断矩阵的一致性是可以接受的,否则应对判断矩阵作适当修正。 本文中,CR=CIRI=0.034 060.9 =0.037 85<0.10 所以,矩阵A 满足一致性检验,即各子系统权重W%i=(w1,w2,w3,w4)=(0.496 5,0.313 2,0.139 3,0.050 9)是成立的。 3 确定河北省综合竞争力得分及排名 利用评价模型式2计算中国31省市综合竞争力得分及排名,如表6所示。 5.3结果分析 上述31省市综合竞争力得分及排名结果基本上反应了我国地区竞争力的格局。其中,第一集团包括上海、广东、北京、江苏、浙江、天津、山东、辽宁、福建9个地区,这9个地区得分均为正数,说明竞争力处于平均水平之上,而该9地区的前6名得分更是高于1,是中国省域竞争力实力的领跑者。第二集团主要包括重庆、内蒙古、河北、湖北、吉林、山西、河南、湖南、四川等12个地区,该集团主要特点就是地区得分相差不大,综合竞争力水平不相上下。第三集团包括新疆、江西、甘肃、贵州等10地区,由得分可知,该类地区竞争力水平较低,从地理位置上看,这一阵营的地区基本上都是属于我国西部地区,因此,国家还是应该继续加大力度支持西部,以缩小地区之间差距。 由表6可知,河北省综合竞争力在中国31省市中排名第12位,处于第二集团,属于中等发展水平。但是,虽然河北省竞争力名次不太落后,而得分却只有-0.488分,说明竞争力实力水平处于序列域的平均水平之下,发展水平仍需提高。下面我们就各子系统竞争力做详细分析。 经济及产业结构竞争力,河北省得分-0.645, 排名第15位。按照国际惯例,三次产业之间的协调 比例应为1∶4∶5,而河北省这一比例为1.5∶5.2 ∶3.3,与上述要求还有距离,因此,产业结构需要进 一步调整与优化。 国际竞争力,河北省得分-0.645,排名第10 位,较其它子竞争力有相对优势,这主要是因为河北 省地处环京津、环渤海经济圈,位于渤海地区的中心 地带,与日本、韩国隔海相望,是中国东北地区与国 内其它省区联系的通道和西北诸省区的北方出海通 道,具有较好的地区优势。 科学文化竞争力,河北省得分-0.245,排名第 6位,是四个子系统中竞争实力最弱的一个。地区 的文化是城市可持续发展和有效竞争的保障,而科学技术则是地区竞争力的直接推动力,地区的发展 潜力取决于地区的文化和科技竞争力,由此可见科 教文化的重要性。因此,河北省应该加大力度发展 科教文化事业,以推动区域竞争力的尽快提升。 基础设施与环境竞争力,河北省得分0.041,排 名第11位,是四个子系统竞争力中唯一一个竞争实 力高于平均水平的系统。基础设施是地区社会经济 活动的基本载体,是社会经济发展的基本前提和保 证,最近几年以来,河北省努力发展城市建设事业, 不断提高城镇化发展水平,使得河北省的环境竞争 力发展水平有了很大提高。 综上所述,河北省竞争力虽有值得肯定的地方, 但是总体来说,其在经济发展水平、产业结构、科技 文化事业、基础设施等诸多方面与发达地区如上海、 广东的差距明显。在现代化建设的今天,一个地区 的竞争力水平很大程度上反映了该地区社会经济的 发展。因此,面对知识经济时代的挑战,应如何抓住 机遇,努力提高竞争力发展水平是河北省目前经济 发展的首要问题。 参考文献: [1] 鲁继通.国内区域竞争力问题研究综述[J].科技风,2008(2). [2] 金浩.经济统计分析与SAS的应用[M].北京:经济科学出版社,2002. [3] 左继红,胡树华.区域竞争力的指标体系及评价模型研究[J].商业研究,2005(16). [4] 余瑞娟,吴广谋.基于主成分分析的区域产业竞争力评价[J].价值工程.2008(7). [5] 王连月,韩立红.AHP法在区域竞争力综合评价中的应用[J企业经济,2004(6). [6] 中华人民共和国统计局.中国统计年鉴[M].北京:中国统计出版社,2009.