当前位置:文档之家› 基于因子分析方法的城市竞争力比较研究

基于因子分析方法的城市竞争力比较研究

基于因子分析方法的城市竞争力比较研究
基于因子分析方法的城市竞争力比较研究

基于因子分析方法的城市竞争力比较研究摘要:城市不仅是一个市、一个省、一个国家的资源聚集地,而且还是其所在的区域的政治、经济、文化中心。城市竞争力已成为一个城市乃至一个地区经济社会发展的重要标志。在全球化的背景下,是一个非常重要的竞争主体。本文基于因子分析的方法,构建了城市竞争力的指标体系对我国的23个城市竞争力进行排名,并针对排名进行相关分析,提出提升城市竞争力的建议。。

关键词:城市竞争力,因子分析,综合评价模型

The Research of Cities Competitiveness Based

on Factor Analysis

Abstract:A city is the gathering resources of the region, the province and a country , it’s also the political, economic and cultural center. The city is a main competition and the engine of economic growth. In the context of globalization ,the city is a very important main competition.In the Article We will use Factor Analyze method to sort 23 cities of China by using the index System of the city competitiveness. Then we analyse the rankings and give some suggestions to improve the competitiveness of the recommendations of the City

Keywords:Cities Competitiveness,Factor Analysis, Comprehensive evaluation model

一、城市竞争力的概念及评价分析方法

(一)城市竞争力的概念

目前国内外学术界关于城市竞争力的研究文献不断涌现, 大多是把城市竞争力归结到区域竞争力的范围进行研究和探讨。郝寿义和安虎森认为 ,城市竞争力是指一个城市在国内外市场上与其他城市相比所具有的自身创造财富和推动地区、国?或世界创造更多社会财富的能力。倪鹏飞认为城市竞争力主要是指一个城市在竞争和发展过程中与其他城市相比所具有的吸引、争夺、拥有、控制和转化资源 ,争夺、占领和控制市场创造价值,为其居民提供福利的能力。

基于目前城市竞争力的研究:本文认为城市竞争力的内涵至少包括以下两点:第一,城市竞争力是一个复杂混沌的系统,其众多的要素和环境子系统以不同的方式存在共同作用形成并影响了城市竞争力,创造城市的价值。第二,城市竞争力的研究主体是城市,而城市的价值是由众多企业创造的,因此在研究方法上可采用微观研究方法,将城市在区域内的竞争看做为企业的市场竞争。

因此本文将城市竞争力定义为:一个城市与其它城市比较,所具有的多快好省地创造财富或价值及收益的能力。城市竞争力在本质上是为城市发展进行资源优化配置的能力, 其战略目标是促进区域和城市经济的高效运行和持续增长, 进而促进城市社会的全面进步和可持续发展。

(二)城市竞争力的评价方法

评价城市竞争力的关键在于确定各属性指标对竞争力影响的相对权重系数和指标的合成方法。目前权重系数的确定方法主要有主观赋权法和客观赋权法两种。由于主观赋权方法依赖于专家的经验,虽然全面,但难免会有主观臆断性。因此本文的城市竞争力测评运用客观赋权方法中的因子分析方法,并建立城市竞争力综合得分的评价模型,根据模型的综合评价,对23个城市的竞争力进行排名。

因子分析的思路是用较少的相互独立的因子变量来表征原始变量的绝大部分信息,通过再现原始变量与公共因子之间的相关关系,最后计算因子得分来对各个样本城市的竞争力进行排序。最终确立的公共因子不仅能够反映原有众多变量所蕴含的主要信息, 并且能够解释与原有变量之间的相互依存关系,公共因子的个数少于要原始变量的个数,因此大大的简化了分析过程。因子分析主要步骤:

第一, 无量纲化处理,由于各项指标量纲不同, 在对这些指标综合集成之前, 首先要对全部指标进行标准化处理,并据此得到变量间的相关系数矩阵。标准化计算公式为:

i

i i

i X σ

/X

Z )(-=

i Z 标准化后的指标值; i X 为原始数据

;i σ为方差;

第二,根据原始变量矩阵估计因子载荷矩阵。 因子载荷阵的估计方法有很多,主成分法是其中最为普遍的方法,本文采用主成分法。

第三,将公共因子表示为变量的线性组合,得到评价对象在各个公共因子的得分。

第四,建立综合评价模型,根据城市的综合得分进行城市竞争力的排名。

二、城市竞争力的指标体系的构建及数据来源

本文综合借鉴专家学者的研究成果,其中主要参考宁越敏、唐礼智的城市竞争力指标体系,同时借鉴倪鹏飞的城市竞争力理论和模型。按照指标体系选取的全面性、科学性、目的性、 可操作性以及最少性的原则,最初选择1个一级指标、25个二级指标。为了尽可能全面地反映出影响评价对象的各种因素 , 对变量进行因子分析前常需要进行变量相关性检验,最后根据KMO 检验以及巴菲特球度检验(如表1),根据检验值剔除了2个二级级指标,最终确定了4个二级23个二级指标指标(如表2)。

表1 KMO 及Bartlett 检验

本文数据来源于《中国城市统计年鉴—2008》、中经网以及各省市的统计年鉴。 (一)二级指标解释 1.经济及产业结构竞争力

城市发展的动力是经济的持续发展, 经济的持续发展取决于工业化水平高低, 工业化水平高低又决定于产业竞争能力。城市的产业集聚能力和产业扩散力是城市竞争力有利的体现,并且无论是产业集聚还是产业扩散都需要依托于强有力的

经济实力和优质的产业结构。因此,经济及产业结构竞争力是城市竞争力的基础。

2.国际竞争力

市场经济需要的资源是多方面的,任何两个区域的资源都是不同的,只有通过合作才可能发挥不同区域资源禀赋的比较优势。由于我国的城市占有世界上最丰富的劳动力资源和某些特有的自然资源,而当前的经济结构、经济规模和经济发展水平,又难以将这些资源全部吸收。只有通过对外开放,与各国城市发展对外经济关系,才能使自己的资源要素获得最佳配置与最佳利用。因此,对外开放度是衡量城市竞争力的国际化程度的指标。

3.基础设施及环境竞争力

城市基础设施是区域经济发展的重要物质基础,是涉及到区域经济增长、产业结构优化、环境保护、可持续发展的基础性产业。城市基础设施的存量状况、设施能力、设施的先进程度,是区域经济活动正常进行、区域经济不断发展的前提。因此,基础设施水平是城市竞争力持续提升的基础。

4.科学文化竞争力

城市的持续发展需要实现城市自我创新,城市在发展过程中不断吸收和产生知识, 以适应环境变化, 尤其是在目前情况下更是如此, 越来越多迹象表明: 知识及创造知识和运用知识的能力,成为城市保持竞争优势的最重要源泉。文化软实力是城市核心竞争力和综合实力的重要组成部分。科学文化可以促进构建社会主义核心价值体系、培养城市人文精神、加强公共文化服务体系建设、加快文化产业发展、打造城市文化品牌、推进城市文化创新等各个方面的工作。

三、实证分析过程

(一)指标权重的确定

首先将第八个三级指标:GDP(X1)、GDP增长率(X2)、财政预算内收入(X3)、城乡居民储蓄年末余额(X4)、固定资产投资总额(X5)、年末金融机构各项贷款余额(X6)、第二产业占GDP比重(X7)、第三产业占GDP比重(X8)作为一个整体,利用SPSS13.0 中采用方差最大法对因子载荷矩阵实行正交旋转,然后选取主成分分析法提取公因子,选择公共因子个数为1。因为通过了KMO及Bartlett’s球形检验(表2),并且只选取了第一主成分,这样可将八个三级指标综合成一个二级指标,即经济及产业结构竞争力,命名为F1。在一般情况下,

因子载荷的绝对值越大,则表明公因子对所代表的原始指标变量的解释效果越好,提取一个公共因子的因子载荷矩阵如下(表3)

(表2)城市竞争力指标体系

由上表可以看出GDP(X1)、GDP增长率(X2)、财政预算内收入(X3)、城乡居民储蓄年末余额(X4)、固定资产投资总额(X5)、年末金融机构各项贷款余额(X6)、第二产业占GDP比重(X7)、第三产业占GDP比重(X8)在经济及产业竞争力上的因子载荷系数分别为0.94877、-0.45559、0.94180、0.98620、0.88639、0.97443、0.63635、-0.58057,它们分别代表了每个三级指标与公共因子F之间的相关系数,及每个三级指标对二级指标的相对重要性,因此,对因子载荷系数的绝对值进行归一化处理,便可以得到每个三级指标相对于二级指标的权重。对(0.94877、0.45559、0.94180、0.98620、0.88639、0.97443、0.63635、

0.58057)进行归一化处理,得到权重矩阵W1i=(0.1480,0.0711,0.1469,0.1539,0.1383,0.1520,0.0906,0.0993)。同理,可以的到其他三个二级指标F2、F3、F4,以及权重矩阵W2i=(0.2470,0.2640,0.2552,0.2338),W3i =(0.1603,0.0858,0.1527,0.1154,0.1353,0.1594,0.1534,0.0377),W4i=(0.3862,0.2475,0.3664)。

利用SPSS13.0得出各因子的因子得分,应再次进行因子提取,得到经济及产业结构竞争力、国际竞争力、基础设施环境竞争力、科学文化竞争力在一级指标城市综合竞争力上的因子载荷矩阵(表4),同理经过归一化处理的到二级指标的权重为W=(0.2260,0.2709,0.2232,0.2799)。各层指标权重总结如表5

(二)综合评价模型

1.二级指标评价值的计算。设评价的城市个数为m ,评价三级指标数n ,各城市的三级指标标准化值,则某个地区指标的二级指标F p (p=1,2,3,4)

计算公式为:p F =∑n

ij mn W Y )*( (m=1,2,……23) 当p=i=1时的取值对应为n=j=1,2,3,4,5,6,7,8 当p=i=2时的取值对应为n=j=9,10,11,12

当p=i=3时的取值对应为 n=j=13,14,15,16,17,18,19,20 当p=i=3时的取值对应为 n=j=21,22,23 2.综合城市竞争力的计算。

C=∑p

p W F )*(

通过公式计算的出以下各个城市各个指标值,并进行了排序如表6:

各二级指标前五名分别为:

经济产业结构竞争力:上海、北京、广州、深圳、天津

国际竞争力:上海、深圳、苏州、北京、天津

基础设施竞争力:深圳、广州、上海、青岛、北京

科学文化竞争力:上海、深圳、北京、广州、苏州

一级指标前五名为:

城市综合竞争力:上海、深圳、北京、广州、苏州

四、结论分析

(一)数据解释

本文通过选取2007年度数据,由于数据的量纲不同,为了消除数据量纲不同对分析结论的影响,利用SPSS13.0软件对数据进行标准化。本文所有参与计算的数据均为标准化后的数据值。因此,有些城市的得分为负数,并不表示此城市该项指标值为负,而只是表示此城市该指标值低于样本的平均值,说明此城市在某个方面欠缺竞争力。综合评价值(包括一级指标及二级指标)越大,说明城市竞争力的相对水平越高。因此,评价值具有排序作用。

(二)指标值排序分析

1.经济及产业结构竞争力

城市的经济实力是影响城市竞争力高低的重要因素,是城市作为区域经济增长的主要因素。23个城市的排名前5名为上海、北京、广州、深圳、天津,F1为经济发展因子,代表城市的经济实力,它不仅包含城市经济的总量指标,还包含城市的产业结构指标,从数据中可以看出前十名的城市除了在GDP,居民存款总额、金融机构贷款余额等指标上具有较强的实力,同样城市的二、三产业占国内生产总值的比重都超过90%。经济体通过专业化和社会分工会形成一定的产业结构,而产业结构在一定意义上又决定了经济的增长方式。第二产业在

国内生产总值中的比重增加可以扩大经济的规模, 但不能高效率的提高资本生产效率和劳动生产效率。第三产业在国内生产总值中的比重的增加有助于资本生产效率的提高,同时有助于资本所有者收入的增加。从数据中看前五的城市第三产业的比重比较大,这有助于资本生产效率和劳动生产效率的提高。

2.国际竞争力(对外开放度)

竞争的全球化加剧了城市之间的国际竞争;经济、科技的区域化和全球化越来越明显,各种要素在全球范围内的频繁流动,一个城市必须突破城市行政区划的界限在全球范围内重新参与资源的配置,在更大的范围内达成合作。对外开放对于城市提升国际影响力、以积极的姿态公平参与国际竞争,在战略合作和利益博弈中发挥城市的相对竞争优势,实现对外开放与国际影响力的良性互动都具有积极的影响。国际竞争力得分排名前5的城市为上海、深圳、苏州、北京、天津,仔细分析这五个城市不难发现,首先每个城市都占有良好的区位优势,上海,苏州都是长三角中心城市,而北京、天津则是环渤海经济圈的中心城市,深圳则是珠三角的中心城市。良好的区位优势可以减少经济活动的成本,有利于产业集聚和扩散。

3.基础设施及环境竞争力

基础设施是城市社会经济活动的基本载体,是社会经济发展的基本前提和保证。23个城市在二级指标基础设施及环境竞争力得分的前5名为深圳、广州、上海、青岛、北京,F3为基础设施因子,城市基础设施是区域经济发展的重要物质基础,是涉及到区域经济增长、产业结构优化、环境保护、可持续发展的基础性产业。这五个城市无论在城市基础设施的存量状况、设施能力、还是设施的先进程度上都占有相对的优势,因此这五个城市在区域经济活动质量、城市竞争力持续发展上都得到了有力的保证。

4.科学文化竞争力

城市的文化是城市可持续发展和有效竞争的保障,而科学技术则是城市竞争力的直接推动力,城市的发展潜力取决于城市的文化和科技竞争力。科学文化竞争力排名的前5为上海、深圳、北京、广州、苏州,这五个城市的科教费用占财政支出的比重都在5%左右,其中深圳为6.85%。科教事业虽然是一种“烧

钱的事业”,极具公益性;但是它对于加快文化产业发展、打造城市文化,树立城市品牌形象、推进城市文化创新,提升城市竞争力都有着非常重要的影响,是城市持续发展的永动机。

5.城市综合竞争力

结合4个公共因子的排名,根据城市竞争力的综合评价模型计算出的综合得分,排名前5位的城市分别为上海、深圳、北京、广州、苏州。

上海作为国际化大都市,拥有很强的经济实力和对外开放程度,上海肩负着面向世界、服务全国、联动长三角的重任,在全国经济建设和社会发展中具有十分重要的地位和作用。上海市面积仅占全国0.06%、人口占全国1%的城市里,但财政收入占全国的八分之一,港口货物吞吐量占全国的十分之一,口岸进出口商品总额占全国的四分之一。

自改革开放以来,深圳从一个渔村小镇发展成为在高新技术产业、外贸出口、海洋运输等诸多方面具有很大优势的城市。深圳地处珠江三角洲,是连接香港和中国内地纽带和桥梁,也是华南沿海重要的交通枢纽。深圳在扩大开放,制度创新等方面具有优势。独特的区位优势,深圳是中国口岸最多和惟一拥有海陆空口岸的城市,是中国与世界交往的主要门户之一,有着强劲的经济支撑与现代化的城市基础设施。深圳正逐步成为中国高新技术产业基地和区域性金融中心、信息中心、商贸中心、运输中心。

身为首都的北京位于渤海沿岸,是环渤海经济圈的中心城市,发展经济的条件优越。同时北京作为全国陆上交通总枢纽,与东南、华南经济发达地区的交通都相当便利,这不仅为北京成为区域经济中心提供了强有力的支持,更为北京吸引、占有资源打好坚实的基础。同时作为政治文化中心的北京,在城市的品牌树立,城市的营销方面都占有优势。

改革开放以来,广州的国民经济以年均14%的速度持续增长,综合经济实力居全国大城市前列。广州是全国重要的工业基地、华南地区的综合性工业制造中心,多年的发展已形成了门类齐全、轻工业较为发达、重工业有一定基础、综合配套能力、科研技术能力和产品开发能力较强的外向型现代工业体系。广州已成为工业基础较雄厚,第三产业发达,国民经济综合协调发展的中心城市。

苏州是我国的特大城市是江苏省的经济、对外贸易、工商业和物流中心,也是重要的文化、艺术、教育和交通中心。苏州坐落于富庶的长江三角洲地区的地理中心,是长三角的中心城市之一。有国家级开发区5个,省级开发区10个,出口加工区6个,保税物流园区3个,2007年全市经济在高平台上继续实现稳定增长,产业发展更趋协调,结构升级调整优化,发展方式有效转变。其中全市实现地区生产总值达5700亿元,按可比价格计算比上年增长16%,其中第三产业增加值1970亿元,比上年增长17.5%。产业结构进一步优化,三次产业的比例为1.7:63.7:34.6,第三产业比重比上年提高1.9个百分点。值得关注的是苏州的城市形象的树立,苏州自有文字记载以来的历史已有4000多年,是全国首批24个历史文化名城之一,悠久的历史文化造就了苏州独特的城市文化形象,苏州现有2个国家历史文化名城,3个中国历史文化名镇,7个江苏省历史文化名镇,还有一大批保存较好的古镇。悠久的历史文化底蕴、先进的科学技术水平、合理的产业结构、高度的对外开放度,这些都是苏州城市竞争力的重要基础。

五、提升城市竞争力的建议

(一)高城市的可持续发展力

城市内部要注意产业梯度,产业布局要合理,合理规划城市建设;在注重发展城市经济的同时不能忽略城市的文化、教育、科技等方面的竞争力。城市不仅是财富的创造中心,同时也是文化,生活重心,因此城市在统筹发展经济文化的同时要实现可持续发展。城市的竞争力的提升,应实现资源开发利用与保护的统一,眼前利益与长远利益的统一,人类社会发展和自然发展的统一,当代人利益和后代人利益的统一。

首先,要求城市必须转变增长方式,实现粗放式向集约式的转变。粗放式的经济增长能耗高、效益差、污染重,而集约式的经济增长则有利于资源的节约,提高经济效益,走循环经济的道路。例如,排名靠后的包头市,是西部重要的重工业基地,矿产资源丰富,蕴藏有稀土、铁、煤炭、铝、金、铌等54种金属铌的储量居全国之首,稀土储量居世界之最,稀土储量不仅巨大而且品位高,资源丰富,但是相关产业链仍处于发展阶段,这必将影响城市的持续发展。其次,要加强制度创新,在先进的制度和法律保障下,促进城市竞争力的进一步

提升。再次,充分发挥政府在可持续发展中的作用,正确的处理好短期与长期,局部与整体,经济增长与社会发展,人与自然协调和谐。

(二)合理对外开放,引进先进技术文化

由于经济一体化的影响国家之间的对立减弱了协作式竞争逐渐成为国际的主流,疆域的概念逐渐淡化,城市更多的承担起经济、社会、和文化发展的重任。以城市为中心的产业聚集,资本聚集,技术和人才聚集,可以促进城市在本国乃至更大的范围内地位的提升,同时会增强城市在所在区域的良性辐射能力。另一方面,全球化的浪潮也在不停的重塑着城市,既给城市带来了机遇,也带来了挑战;因此,合理的对外开放,树立城市的品牌形象是提高城市竞争力的关键之举。

对外开放加快引进技术是加速国民经济发展和推进现代化进程的重要措施。尤其是我国的大部分城市经济文化落后于发达国家,要完成三步走的战略目标,实现现代化,更应积极引进先进技术。当代科学技术门类繁多,发展速度快,国际间技术交流已成为普遍现象。从历史上看,经济技术落后的国家能够在较短的历史时期内迅速赶上甚至超过发达国家,无一不是积极引进国外先进技术,同时敢于创新和善于创新的结果。

首先,对外开放要求城市必须把当地市场与全国市场、国际市场对接起来,准确的进行自身定位,并融入到其中争取获得更为广阔的市场和更多优质资源。其次,政府应制定合理的政策、制度以吸引大量的外资,增加城市的资本实力,同时要保证政策的合理性,公平性,不能为引进外资而忽略甚至牺牲本土企业的发展。例如,苏州作为长三角地区经济、对外贸易、工商业和物流中心,著名的苏州工业园区就是中新合作的典范,园区非常注重投资合作计划实施、经济结构的优化、创新能力的加强以及合作的继续深化等各项工作的协调发展。再次,对外开放要合理运用城市的相对优势,我国是一个发展中国家,城市的人口多,生产力水平有待提高,资金严重短缺,但是我国的劳动力成本相对比较低,部分城市的资源禀赋比较高,因此要合理的规划城市的发展,制定城市的发展战略,加快技术改造、更新设备和调整结构,充分发挥城市的比较优势。

(三)加强基础设施建设

城市基础设施的规模、水平直接影响着城市的产业发展和价值体系的形成,城市基础设施建设质量也影响城市的产品成本和竞争力。基础设施通过影响城市

产业收益回报率 ,进而影响城市聚集人才、技术、资金、资源等要素的能力 ,最终影响城市的产业规模和素质。城市基础设施产业的竞争力将成为城市总体竞争力的重要组成部分。一个城市能不能为企业创造好的投资环境 ,能不能为人才发展提供好的人文环境 ,能不能为经济发展提供数量与质量相统一的基础设施 ,是政府服务的核心。

因此,城市应全面提升城市基础设施信息系统的发展水平 ,要适时地由数字管理向智能化管理发展;在继续扩大交通基础设施建设规模的同时要积极发展、应用高新技术,保证运输安全,提高运输效率,加快智能交通的研究开发和推广应用。广泛吸收国内外先进的科学技术 ,广泛采用先进适用的装备 ,全面提升基础设施建设和发展水平。

在社会主义市场经济条件下,基础设施建设主要应当依靠资本市场,应充分发挥资本市场在基础设施建设中的基础性作用。通过资本市场建立有利于各类基础设施建设企业和项目筹集资金、满足多种投资需求和富有效率的运作体系。借鉴发达国家在基础设施建设立项、招标等过程中的成功经验 ,例如,组织专?人员召开辩论会、听证会及各种讨论会等,并且项目进度对市民开放 ,市民可在相关的会议上提出建议等。

(四)提高城市资源聚集力

一个城市竞争优势的来源关键是该城市产业的竞争优势,而产业的竞争优势很大程度上来源于彼此相关的产业集群。例如,美国的硅谷、印度的班加罗尔、德国的索林根、瑞士的制药业群等。这些地区的就业率、人均收入水平、纳税额、地方经济实力都高于其他地区。产业集群通过集聚效应的获得和释放能量,通过促进产业发展和提升产业竞争力,进而提高城市竞争力。

首先,城市充分发挥城市的优势,重点吸收关键企业,关键是发挥城市的区位优势,挖掘城市的特色资源,形成基于稀缺资源的产业集群。其次,建立大型的专业化市场,通过市场的接近,市场的连接,最终达到生产的集中。例如,可以通过选择几个带动力强、辐射面广的重点企业作为核心企业,围绕核心企业建立产业集群,通过政策的指导相关企业及其配套企业,相对集中来逐步培育产业集群。再次,提高城市的营销能力,树立有特色的,有个性,有文化底蕴、有时代特点的城市形象,这是城市竞争力的软性指标,也是提升竞争力的关键。

(五)加强城市合作,有序竞争

国外大城市群的成功实践证明,一个经济区域要具有强大的国际竞争力,必须形成分工明确、层次清晰的产业群。而目前我国的城市群结构不够合理,例如环渤海经济圈,像北京,天津这样的大城市处于绝对优势,其他城市不能很好的衔接,经济实力相对薄弱,与两大直辖市的落差非常大,同时也说明周边城市对中心城市的支持力相对匮乏,使得整个区域发展很不平衡。

为了有效地把发展城市群战略作为整合城市间合作的驱动力,各城市群要根据资源特征和比较优势,聚焦优势实施竞争战略,通过合理分工协作,增进专业化及深化产业分工。城市群内用主动开展合作竞争战略,在城市群的建设中,引入培育区域合作机制。每个城市利用自己的优势作为合作的基础,例如劳动力、资源、土地等,形成优势互补的局面。

参考文献

[1]迈克尔.波特《竞争论》(美)中心出版社

[2]倪鹏飞《中国城市竞争力报告》2006版社会科学文献出版社

[3]宁越敏、唐礼智城市竞争力的概念和指标体系现代城市研究2001年(88)

[4]于涛方、顾朝林新时期的城市和城市竞争力城市规划汇刊2001年(4)

[5]张庭伟对区域性中心城市内涵的基本界定经济研究参考2002年,(52)

[6]上海市社会科学院国内若干大城市综合竞争力比较研究

上海经济研究 2001(1)

[7]连玉明《中国城市报告》中国时代经济出版社 2004

[8]倪鹏飞中国城市竞争力与基础设施关系的实证研究中国工业经济2002

[9]郝寿义、倪鹏飞中国城市竞争力研究经济科学1998

[10]陈黎明、向书坚、李炳林和谐社会评价指标体系与评价模型及其应用

中南财经政法大学学报 2008年第2期

[11]游家兴如何正确运用因子分析法进行综合评价统计教育 2003年第5期

[12]石忆邵、洪武长江三角洲城市综合竞争力与区域优势分析

城市规划汇刊2002年第1 期

[13]景治中、周加来城市竞争力的影响因素分析现代商贸工业第20 卷

第 1期

[14]张旭亮基于因子分析的浙中城市群城市综合竞争力评价研究

商业经济 2009年第2期

[15]阮平南、宋怡产业集群与城市竞争力研究改革与战略 2007第2期

[16]于涛方、顾朝林、涂英时新时期的城市和城市竞争力

城市规划汇刊 2001 年第4 期

[17]王晓鹏、丁生喜、曹广超、李玲琴中国城市竞争力评价量化模型研究

数理统计与管理 2008年第3期

附录

研究方法-因子分析

因子分析 前言 因子分析方法的实际作用已为广大实际工作所证实。但并非每次运用它都是成功的。有时,特别是针对多维变量所做的因子分析,难以有清晰的解释。因此,有的实际工作者开始怀疑因子分析方法的科学性。但同时,不同的人针对相同的数据所做的因子分析。解释其结果却又不尽相同。有的人通过因子分析能给出问题近乎完美的答案。于是,又有人称因子分析是一种“艺术”因子分析因此也变得神秘起来了。因子分析到底是艺术还是科学呢? 因子分析的统计思想 在实践中,往往收集到的数据是多指标的。各指标之间通常不是独立的,或多或少存在着一定程度的关系。因子分析的目的是通过少数几个变量去描述这众多变量见的协方差关系。这少数几个变量是潜在的,但不能观察的。我们称之为因子。 1以相关为基础 在所收集到的众多变量中,必定存在某些是高度相关的,把这些高度相关的变量组成各组。这样同一组内变量具有高度相关,而与其他的各组变量却只有较小的相关或是不相关。这些组内高度相关的变量可以设想是一个共同的东西在影响着它们而导致高度相关。这个共同的东西称之为公共因子。如前所述,这些公共因子是潜在但不能观测的。 2通过协方差来实现 因子分析是以相关为基础,从协方差或相关阵开始把大部分变异归结为少数几个公共因子所为。把剩余的部分称为特殊因子。 3作用:寻求基本结构、数据化简 通过因子分析,可以用几个较小的有实际意义的因子来反映原来数据的基本结构。例如: 例1:Linden对二战以来奥运会十项全能比赛的得分作了研究,将100米、跳远、铅球、跳高、400米、110米栏、铁饼、撑杆跳、标枪、1500米的成绩归结到短跑速度、爆发性臂力、爆发性腿力、耐力四个方面。 例2:公司面试,从简历、外貌、专业能力、讨人喜欢的能力、自信心、洞察力、诚实、理解力等15个方面进行打分,最后归结外申请者的外露能力、受欢迎程度、工作经验、专业能力这四个方面 通过因子分析,可以用少数几个因子代替原来的变量做回归分析÷据类分析等。 正交因子模型分析 1模型的直观描述

多元数据处理——因子分析法

多元数据处理 ---因子分析方法 多元数据处理主要包括多元随机变量,协方差分析,趋势面分析,聚类分析,判别分析,主成分分析,因子分析,典型相关分析,回归分析以及各个分析方法的相互结合等等。本文主要针对其中的因子分析方法展开了论述,并举了一个因子分析法在我国房地产市场绩效评价中的应用实例。 第一章因子分析方法概述 1.1因子分析的涵义 为了更全面和准确的测量和评估对象的特征,在实际的应用中,我们往往尽可能多的选用特征指标进行系统评估,选取的指标越多,就越能全面、客观的反映评价对象的特征。选取众多指标的同时也带来了统计分析的困难:一、不同的指标,不同重要程度需要赋予不同的权重,而靠主观的评价避免不了一些失误与错误。二、收集到的指标之间可能存在较大的相关性,大量收集指标带来了人力、物力和财力的浪费。而因子分析方法则较好的解决了上述问题。 因子分析[1]是一种多元统计方法,该方法起源于20世纪初Karl Pearson 和Charles Spearman 等人关于心理测试的统计分析,它的核心是用最少的相互独立的因子反映原有变量的绝大部分信息。[2]通过分析事物内部的因果关系来找出其主要矛盾,找出事物内在的基本规律。 因子分析的基本思想是通过变量的相关系数矩阵内部结构的研究,找出能控制所有变量的少数几个随机变量去描述多个变量之间的相关关系,但是,这少数几个随机变量是不可观测的,通常称为因子。然后根据相关性的大小把变量分组,使得同组内的变量之间相关性较高,使不同组内的变量相关性较低[3]。对于所研究的问题就可试图用最少个数的所谓因子的线性函数与特殊因子之和来描述原来观测的每一变量[4]。因子变量的特点:第一,因子变量的数量远小于原指标的数量,对因子变量的分析能够减少分析的工作量;第二,因子变量不是原有变量的简单取舍,而是对原有变量的

(完整版)因子分析法基本原理

1.因子分析法基本原理 在对某一个问题进行论证分析时,采集大量多变量的数据能为我们的研究分析提供更为丰富的信息和增加分析的精确度。然而,这种方法不仅需要巨大的工作量,并且可能会因为变量之间存在相关性而增加了我们研究问题的复杂性。因子分析法就是从研究变量内部相关的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。这样我们就可以对原始的数据进行分类归并,将相关比较密切的变量分别归类,归出多个综合指标,这些综合指标互不相关,即它们所综合的信息互相不重叠。这些综合指标就称为因子或公共因子。 因子分析法的基本思想是将观测变量进行分类,将相关性较高,即联系比较紧密的分在同一类中,而不同类变量之间的相关性则较低,那么每一类变量实际上就代表了一个基本结构,即公共因子。对于所研究的问题就是试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。这样,就能相对容易地以较少的几个因子反映原资料的大部分信息,从而达到浓缩数据,以小见大,抓住问题本质和核心的目的。 因子分析法的核心是对若干综合指标进行因子分析并提取公共因子,再以每个因子的方差贡献率作为权数与该因子的得分乘数之和构造得分函数。因子分析法的数学表示为矩阵:B AF X +=,即: ????? ?? ??++++=++++=++++=++++=p k pk p p p p k k k k k k f f f f x f f f f x f f f f x f f f f x βααααβααααβααααβααααΛΛΛΛΛΛ332211333332321313223232221212113132121111 (k ≤p)………………(1式) 模型中,向量X ()p x x x x ,,,,321Λ是可观测随机向量,即原始观测变量。F ()k f f f f ,,,,321Λ是X ()p x x x x ,,,,321Λ的公共因子,即各个原观测变量的表达式中共同出现的因子,是相互独立的不可观测的理论变量。公共因子的具体含义必须结合实际研究问题来界定。A ()ij α是公共因子F ()k f f f f ,,,,321Λ的系数,称为因子载荷矩阵,ij α(i=1,2,.....,p;j=1,2,....,k)称为因子载荷,是第i 个原有变量在第j 个因子上的负荷,或可将ij α看作第i 个变量在第j 公共因子上的权重。ij α是x i 与f j

(完整版)因子分析法基本原理.docx

1.因子分析法基本原理 在 某一个 行 分析 , 采集大量多 量的数据能 我 的研究分析提供更 丰富的信息和增加分析的精确度。 然而, 种方法不 需要巨大的工 作量,并且可能会因 量之 存在相关性而增加了我 研究 的复 性。 因子分析法就是从研究 量内部相关的依 关系出 , 把一些具有 复 关系的 量 少数几个 合因子的一种多 量 分析方法。 我 就可以 原始的数据 行分 并,将相关比 密切的 量分 , 出多个 合指 , 些 合指 互不相关, 即它 所 合的信息互相不重叠。 些 合指 就称 因子或公共因子。 因子分析法的基本思想是将 量 行分 , 将相关性 高, 即 系比 密的分在同一 中, 而不同 量之 的相关性 低, 那么每一 量 上就代表了一个基本 构, 即公共因子。 于所研究的 就是 用最少个数的不可 的所 公共因子的 性函数与特殊因子之和来描述原来 的每一分 量。 ,就能相 容易地以 少的几个因子反映原 料的大部分信息, 从而达到 数据,以小 大,抓住 本 和核心的目的。 因子分析法的核心是 若干 合指 行因子分析并提取公共因子, 再以每个因子的方差 献率作 数与 因子的得分乘数之和构造得分函数。 因子分析法的数学表示 矩 : X AF B ,即 : x 1 11 f 1 1 2 f 2 1 3 f 3 1k f k 1 x 2 21 f 1 22 f 2 23 f 3 2 k f k 2 x 3 31 f 1 32 f 2 33 f 3 3k f k 3 (k ≤p)?????? (1 式) x p p1 f 1 p 2 f 2 p 3 f 3 pk f k p 模型中,向量 X x 1, x 2 , x 3 , , x p 是可 随机向量,即原始 量。 F f 1 , f 2, f 3 , , f k 是X x 1, x 2 , x 3, , x p 的公共因子,即各个原 量的表达式中 共同出 的因子, 是相互独立的不可 的理 量。 公共因子的具体含 必 合 研究 来 界定。 A ij 是公共因子 F f 1, f 2 , f 3, , f k 的系数,称 因子 荷矩 , ij (i=1,2,.....,p;j=1,2,....,k)称 因子 荷,是第 i 个原有 量在第 j 个 因子上的 荷,或可将 ij 看作第 i 个 量在第 j 公共因子上的 重。 ij 是 x i 与 f j

方法:因子分析法

因子分析基础理论知识 1 概念 因子分析(Factor analysis ):就是用少数几个因子来描述许多指标或因素之间的联系,以较少几个因子来反映原资料的大部分信息的统计学分析方法。从数学角度来看,主成分分析是一种化繁为简的降维处理技术。 主成分分析(Principal component analysis ):是因子分析的一个特例,是使用最多的因子提取方法。它通过坐标变换手段,将原有的多个相关变量,做线性变化,转换为另外一组不相关的变量。选取前面几个方差最大的主成分,这样达到了因子分析较少变量个数的目的,同时又能与较少的变量反映原有变量的绝大部分的信息。 两者关系:主成分分析(PCA )和因子分析(FA )是两种把变量维数降低以便于描述、理解和分析的方法,而实际上主成分分析可以说是因子分析的一个特例。 2 特点 (1)因子变量的数量远少于原有的指标变量的数量,因而对因子变量的分析能够减少分析中的工作量。 (2)因子变量不是对原始变量的取舍,而是根据原始变量的信息进行重新组构,它能够反映原有变量大部分的信息。 (3)因子变量之间不存在显着的线性相关关系,对变量的分析比较方便,但原始部分变量之间多存在较显着的相关关系。 (4)因子变量具有命名解释性,即该变量是对某些原始变量信息的综合和反映。 在保证数据信息丢失最少的原则下,对高维变量空间进行降维处理(即通过因子分析或主成分分析)。显然,在一个低维空间解释系统要比在高维系统容易的多。 3 类型 根据研究对象的不同,把因子分析分为R 型和Q 型两种。 当研究对象是变量时,属于R 型因子分析; 当研究对象是样品时,属于Q 型因子分析。 但有的因子分析方法兼有R 型和Q 型因子分析的一些特点,如因子分析中的对应分析方法,有的学者称之为双重型因子分析,以示与其他两类的区别。 4分析原理 假定:有n 个地理样本,每个样本共有p 个变量,构成一个n ×p 阶的地理数据矩阵 : ?????? ????? ???=np n n p p x x x x x x x x x X ΛM M M M ΛΛ212222111211

因子分析法(自己整理)

因子分析法 1.因子分析法简介: 1)因子分析法的提出 “因子分析”的名称于1931年由Thurstone 首次提出,但它的概念起源于二十世纪初Karl Pearson 和Charles Spearmen 等人关于智力测验的统计分析。近年来,随着电子计算机的高速发展,人们将因子分析方法成功地应用于各个领域,使得因子分析的理论和方法更加丰富。 2)因子分析的定义 因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不可观测的,即不是具体的变量),以较少的几个因子反映原资料的大部分信息。因子分析法(Factor Analysis)就是寻找这些公共因子的模型分析方法,它是在主成分的基础上构筑若干意义较为明确的公因子,以它们为框架分解原变量,以此考察原变量间的联系与区别。 运用这种研究技术,我们可以方便地找出影响消费者购买、消费以及满意度的主要因素是哪些,以及它们的影响力(权重)运用这种研究技术,我们还可以为市场细分做前期分析。 3)与主成分分析的联系 主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用:a,了解数据。(screening the data),b,和cluster analysis一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简化。(reduce dimensionality)d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。 1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。 2、主成分分析的重点在于解释个变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。 3、主成分分析中不需要有假设(assumptions),因子分析则需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子(specific factor)之间也不相关,共同因子和特殊因子之间也不相关。 4、主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不同的因子。 5、在因子分析中,因子个数需要分析者指定(spss根据一定的条件自动设定,只要是特征值大于1的因子进入分析),而指定的因子数量不同而结果不同。在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势。大致说来,当需要寻找潜在的因子,并对这些因子进行解释的时候,更加倾向于使用因子分析,并且借助旋转技术帮助更好解释。而如果想把现有的变

SPSS操作方法:因子分析

实验指导之四 因子分析的SPSS操作方法 以例13.1为例进行因子分析操作。 1.在SPSS的数据编辑窗口(见图1)点击Analysize →Data Reduction →Factor,打开Factor Analysis对话框如图 2. 图1 因子分析操作 图2 Factor Analysis 对话框

将参与因子分析的变量依次选入Variables框中。例13.1中有8个参与因子分析的变量,故都选入变量框内。 2.单击Descriptives 按钮,打开Descriptives对话框如图3所示。 ?Statistics栏,指定输出的统计量。 图3 Descriptives对话框 Univariate descriptives 输出每个变量的基本统计描述; Initial solution 输出初始分析结果。输出主成分变量的相关或协方差矩阵的对角元素。(本例选择) ?Correlation Matrix栏指定输出考察因子分析条件和方法。 Coefficients相关系数矩阵; Significance levels 相关系数假设检验的P值; Determinant 相关系数矩阵行列式的值; KMO and Bartlett′s test of Sphericity KMO和巴特利检验(本例选择) 巴特利检验是关于研究的变量是否适合进行因子分析的检验. 拒绝原假设意味着适合进行因子分析. KMO值等于变量间单相关系数的平方和与单相关系数平方和加上偏相关系数平方和之比, 值越接近1, 意味着变量间的相关性越强,越适合进行因子分分析, KMO值越接近0, 则变量间的相关性越弱. 越不适合进行因子分析. Inverse 相关系数矩阵的逆矩阵; Reproduced 再生相关阵; Anti-image 反映象相关矩阵。 3.单击Extraction 按钮,打开Extraction对话框选项,见图4。

(完整版)SPSS因子分析法-例子解释

因子分析的基本概念和步骤 一、因子分析的意义 在研究实际问题时往往希望尽可能多地收集相关变量,以期望能对问题有比较全面、完整的把握和认识。例如,对高等学校科研状况的评价研究,可能会搜集诸如投入科研活动的人数、立项课题数、项目经费、经费支出、结项课题数、发表论文数、发表专著数、获得奖励数等多项指标;再例如,学生综合评价研究中,可能会搜集诸如基础课成绩、专业基础课成绩、专业课成绩、体育等各类课程的成绩以及累计获得各项奖学金的次数等。虽然收集这些数据需要投入许多精力,虽然它们能够较为全面精确地描述事物,但在实际数据建模时,这些变量未必能真正发挥预期的作用,“投入”和“产出”并非呈合理的正比,反而会给统计分析带来很多问题,可以表现在: 计算量的问题 由于收集的变量较多,如果这些变量都参与数据建模,无疑会增加分析过程中的计算工作量。虽然,现在的计算技术已得到了迅猛发展,但高维变量和海量数据仍是不容忽视的。 变量间的相关性问题 收集到的诸多变量之间通常都会存在或多或少的相关性。例如,高校科研状况评价中的立项课题数与项目经费、经费支出等之间会存在较高的相关性;学生综合评价研究中的专业基础课成绩与专业课成绩、获奖学金次数等之间也会存在较高的相关性。而变量之间信息的高度重叠和高度相关会给统计方法的应用带来许多障碍。例如,多元线性回归分析中,如果众多解释变量之间存在较强的相关性,即存在高度的多重共线性,那么会给回归方程的参数估计带来许多麻烦,致使回归方程参数不准确甚至模型不可用等。类似的问题还有很多。 为了解决这些问题,最简单和最直接的解决方案是削减变量的个数,但这必然又会导致信息丢失和信息不完整等问题的产生。为此,人们希望探索一种更为有效的解决方法,它既能大大减少参与数据建模的变量个数,同时也不会造成信息的大量丢失。因子分析正式这样一种能够有效降低变量维数,并已得到广泛应用的分析方法。 因子分析的概念起源于20世纪初Karl Pearson和Charles Spearmen等人关于智力测验的统计分析。目前,因子分析已成功应用于心理学、医学、气象、地址、经济学等领域,并因此促进了理论的不断丰富和完善。 因子分析以最少的信息丢失为前提,将众多的原有变量综合成较少几个综合指标,名为因子。通常,因子有以下几个特点: ↓因子个数远远少于原有变量的个数 原有变量综合成少数几个因子之后,因子将可以替代原有变量参与数据建模,这将大大减少分析过程中的计算工作量。 ↓因子能够反映原有变量的绝大部分信息 因子并不是原有变量的简单取舍,而是原有变量重组后的结果,因此不会造成原有变量信息的大量丢失,并能够代表原有变量的绝大部分信息。 ↓因子之间的线性关系并不显著 由原有变量重组出来的因子之间的线性关系较弱,因子参与数据建模能够有效地解决变量多重共线性等给分析应用带来的诸多问题。 ↓因子具有命名解释性 通常,因子分析产生的因子能够通过各种方式最终获得命名解释性。因子的命名解

因子分析方法

因子分析法 1. 因子分析(Factor Analysis) 因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较 密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不 可观测的,即不是具体的变量) ,以较少的几个因子反映原资料的大部分信息。运用这种研究技 术,我们可以方便地找岀影响消费者购买、消费以及满意度的主要因素是哪些,以及它们的影响 力(权重)运用这种研究技术,我们还可以为市场细分做前期分析。 因子分析法与其他一些多元统计方法的区别: 2?主成分分析 主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析 来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用:a,了解数据。(screening the data) ,b,和cluster analysis 一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简 化。(reduce dimensionality ) d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。 1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。 2、主成分分析的重点在于解释各变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。 3、主成分分析中不需要有假设(assumpti on s),因子分析则需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子( specific factor)之间也不相关,共同因子和特殊因子之间也不相关。 4、主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,的主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不同的因子。 5、在因子分析中,因子个数需要分析者指定( spss根据一定的条件自动设定,只要是特征 值大于1的因子进入分析),而指定的因子数量不同而结果不同。在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。和主成分分析相比,由于因子分析可以使用旋转技 术帮助解释因子,在解释方面更加有优势。大致说来,当需要寻找潜在的因子,并对这些因子进 行解释的时候,更加倾向于使用因子分析,并且借助旋转技术帮助更好解释。而如果想把现有的 变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息) 来进入后续的分析,则可 以使用主成分分析。当然,这种情况也可以使用因子得分做到。所以这种区分不是绝对的。 总得来说,主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单 独使用:a,了解数据。(screening the data) ,b,和cluster analysis 一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份 发对变量简化。(reduce dimensionality ) d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。

因子分析方法

因子分析法 1.因子分析(Factor Analysis) 因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不可观测的,即不是具体的变量),以较少的几个因子反映原资料的大部分信息。运用这种研究技术,我们可以方便地找出影响消费者购买、消费以及满意度的主要因素是哪些,以及它们的影响力(权重)运用这种研究技术,我们还可以为市场细分做前期分析。 因子分析法与其他一些多元统计方法的区别: 2.主成分分析 主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用:a,了解数据。(screening the data),b,和cluster analysis一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简化。(reduce dimensionality)d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。 1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。 2、主成分分析的重点在于解释各变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。 3、主成分分析中不需要有假设(assumptions),因子分析则需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子(specific factor)之间也不相关,共同因子和特殊因子之间也不相关。 4、主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,的主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不同的因子。 5、在因子分析中,因子个数需要分析者指定(spss根据一定的条件自动设定,只要是特征值大于1的因子进入分析),而指定的因子数量不同而结果不同。在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势。大致说来,当需要寻找潜在的因子,并对这些因子进行解释的时候,更加倾向于使用因子分析,并且借助旋转技术帮助更好解释。而如果想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析。当然,这种情况也可以使用因子得分做到。所以这种区分不是绝对的。 总得来说,主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用:a,了解数据。(screening the data),b,和cluster analysis一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简化。(reduce dimensionality)d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。

SPSS探索性因子分析的过程

S P S S探索性因子分析的 过程 Company Document number:WUUT-WUUY-WBBGB-BWYTT-1982GT

现要对远程学习者对教育技术资源和使用情况进行了解,设计一个李克特量表,如下图所示: 一.因子分析的定义 在现实研究过程中,往往需要对所反映事物、现象从多个角度进行观测。因此研究者往往设计出多个观测变量,从多个变量收集大量数据以便进行分析寻找规律。多变量大样本虽然会为我们的科学研究提供丰富的信息,但却增加了数据采集和处理的难度。更重要的是许多变量之间存在一定的相关关系,导致了信息的重叠现象,从而增加了问题分析的复杂性。 因子分析是将现实生活中众多相关、重叠的信息进行合并和综合,将原始的多个变量和指标变成较少的几个综合变量和综合指标,以利于分析判定。用较少的综合指标分析存在于各变量中的各类信息,而各综合指标之间彼此是不相关的,代表各类信息的综合指标成为因子。因子分析就是用少数几个因子来描述许多指标之间的联系,以较少几个因子反应原资料的大部分信息的统计方法。 二.数学模型 Z为第i个变量的标准化分数;(标准分是一种由原始分出来的,它是用来说明原始分i 在所属的那批分数中的相对位置的。)

m F 为共同因子; m 为所有变量共同因子的数目; i U 为变量i Z 的唯一因素; im α为因子负荷。(也叫因子载荷,统计意义就是第i 个变量与第m 个公共因子的相关 系数,它反映了第i 个变量在第m 个公共因子上的相对重要性也就是第m 个共同因子对第i 个变量的解释程度。) 因子分析的理想情况,在于个别因子负荷im α不是很大就是很小,这样每个变量才能与较少的共同因子产生密切关联,如果想要以最少的共同因素数来解释变量间的关系程度,则i U 彼此间不能有关联存在。 所谓的因子负荷就是因子结构中原始变量与因子分析时抽取出共同因子的相关,即在各个因子变量不相关的情况下,因子负荷im α就是第i 个原有变量和第m 个因子变量间的相关系数,也就是i Z 在第m 个共同因子变量上的相对重要性,因此,im α绝对值越大则公共因子和原有变量关系越强。在因子分析中有两个重要指针:一为“共同性”,二为“特征值”。 所为共同性,也称变量共同度或者公共方差,就是每个变量在每个共同因子的负荷量的平方总和(一横列中所有因子负荷的的平方和),也就是个别变量可以被共同因子解释的变异量百分比,这个值是个别变量与共同因子间多元相关的平方。从共同性的大小可以判断这个原始变量与共同因子间的关系程度。如果大部分变量的共同度都高于,则说明提取出的共同因子已经基本反映了各原始变量80%以上的信息,仅有较少的信息丢失,因子分析效果较好。而各变量的唯一因素就是1减掉该变量共同性的值,就是原有变量不能被因子变量所能解释的部分。 所谓特征值,是每个变量在某一共同因子的因子负荷的平方总和(一直行所有因子

SPSS因子分析法22

实验课:因子分析 实验目的 理解主成分(因子)分析的基本原理,熟悉并掌握SPSS中的主成分(因子)分析方法及其主要应用。 因子分析 一、基础理论知识 1 概念 因子分析(Factor analysis):就是用少数几个因子来描述许多指标或因素之间的联系,以较少几个因子来反映原资料的大部分信息的统计学分析方法。从数学角度来看,主成分分析是一种化繁为简的降维处理技术。 主成分分析(Principal component analysis):是因子分析的一个特例,是使用最多的因子提取方法。它通过坐标变换手段,将原有的多个相关变量,做线性变化,转换为另外一组不相关的变量。选取前面几个方差最大的主成分,这样达到了因子分析较少变量个数的目的,同时又能与较少的变量反映原有变量的绝大部分的信息。 两者关系:主成分分析(PCA)和因子分析(FA)是两种把变量维数降低以便于描述、理解和分析的方法,而实际上主成分分析可以说是因子分析的一个特例。 2 特点 (1)因子变量的数量远少于原有的指标变量的数量,因而对因子变量的分析能够减少分析中的工作量。 (2)因子变量不是对原始变量的取舍,而是根据原始变量的信息进行重新组构,它能够反映原有变量大部分的信息。 (3)因子变量之间不存在显著的线性相关关系,对变量的分析比较方便,但原始部分变量之间多存在较显著的相关关系。 (4)因子变量具有命名解释性,即该变量是对某些原始变量信息的综合和反映。 在保证数据信息丢失最少的原则下,对高维变量空间进行降维处理(即通过因子分析或主成分分析)。显然,在一个低维空间解释系统要比在高维系统容易的多。

3 类型 根据研究对象的不同,把因子分析分为R 型和Q 型两种。 当研究对象是变量时,属于R 型因子分析; 当研究对象是样品时,属于Q 型因子分析。 但有的因子分析方法兼有R 型和Q 型因子分析的一些特点,如因子分析中的对应分析方法,有的学者称之为双重型因子分析,以示与其他两类的区别。 4分析原理 假定:有n 个地理样本,每个样本共有p 个变量,构成一个n ×p 阶的地理数据矩阵 : 当p 较大时,在p 维空间中考察问题比较麻烦。这就需要进行降维处理,即用较少几个 综合指标代替原来指标,而且使这些综合指标既能尽量多地反映原来指标所反映的信息,同时它们之间又是彼此独立的。 线性组合:记x1,x2,…,xP 为原变量指标,z1,z2,…,zm (m ≤p )为新变量指标(主成分),则其线性组合为: Lij 是原变量在各主成分上的载荷 无论是哪一种因子分析方法,其相应的因子解都不是唯一的,主因子解仅仅是无数因子解中之一。 zi 与zj 相互无关; z1是x1,x2,…,xp 的一切线性组合中方差最大者,z2是与z1不相关的x1,x2,…的所有线性组合中方差最大者。则,新变量指标z1,z2,…分别称为原变量指标的第一,第二,…主成分。 Z 为因子变量或公共因子,可以理解为在高维空间中互相垂直的m 个坐标轴。 主成分分析实质就是确定原来变量xj (j=1,2 ,…,p )在各主成分zi (i=1,2,…,m )上的荷载 lij 。 从数学上容易知道,从数学上也可以证明,它们分别是相关矩阵的m 个较大的特征值所对应的特征向量。 ?? ? ??? ????? ???=np n n p p x x x x x x x x x X 2 1 222 21 11211?? ? ?? ? ?+++=+++=+++=p mp m m m p p p p x l x l x l z x l x l x l z x l x l x l z 22112222121212121111?? ? ?? ? ?+++=+++=+++=p mp m m m p p p p x l x l x l z x l x l x l z x l x l x l z 22112222121212121111

因子分析法详解和实例

第 12 章因子分析 12.1 因子分析的理论与方法 12.1.1 因子分析的基本思想 多元统计分析处理的是多变量问题。由于变量较多,增加了分析问题的复杂性。但在实 际问题中,变量之间可能存在一定的相关性,因此,多变量中可能存在信息的重叠。人们自然希望通过克服相关性、重叠性,用较少的变量来代替原来较多的变量,而这种代替可以反映原来多个变量的大部分信息,这实际上是一种“降维”的思想。 因子分析(factor analysis)就是一种降维、简化数据的技术。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个“抽象”的变量来表示其基本的数据结构。这几个抽象的变量被称作“因子”,能反映原来众多变量的主要信息。原始的变量是可观测的显在变量,而因子一般是不可观测的潜在变量。例如,在商业企业的形象评价中,消费者可以通过一系列指标构成的一个评价指标体系,评价百货商场的各个方面的优劣。但消费者真正关心的只是三个方面:商店的环境、商店的服务和商品的价格。这三个方面除了价格外,商店的环境和服务质量,都是客观存在的、抽象的影响因素,都不便于直接测量,只能通过其它具体指标进行间接反映。 因子分析是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法。又比如,在研究区域社会经济发展中,描述社会与经济现象的指标很多,过多的指标容易导致分析过程复杂化。一个合适的做法就是从这些关系错综复杂的社会经济指标中提取少数几个主要因子,每一个主要因子都能反映相互依赖的社会经济指标间共同作用,抓住这些主要因素就可以帮助我们对复杂的社会经济发展问题进行深入分析、合理解释和正确评价。 12.1.2 因子分析的数学模型 因子分析中的公共因子是不可直接观测但又客观存在的共同影响因素,每一个变量都可 以表示成公共因子的线性函数与特殊因子之和,即 1122iiiimmXaFaFaFε=++++L,(1,2,,ip=L) 式中的,,称为公共因子,1FL,2FmFiε 称为的特殊因子。该模型可用矩阵表示 为: iX

因子分析的方法

三.关于中国民航客运量模型建立与研究 为研究我国民航客运量的变化趋势及其成因,我们以民航客运量作为因变量Y,以国民收入,消费额,铁路客运量,民航航线里程,来华旅游入境人数为影响民航客运量的主要因素。Y表示民航客运量(万人),X1表示国民收入(亿元),X2表示消费额(亿元),X3表示铁路客运量(万人),X4表示民航航线里程(万公里),X5表示来华旅游入境人数(万人)。统计数据如下: 现对该数据进行分析如下: 回归分析

(1)从相关阵看出,y与x1,x2,x4,x5的相关系数都在0.9以上,说明所选自变量 与y高度线性相关,用y与自变量作多元线性回归是适当的。 (2)y与x3的相关系数ry3=0.227偏小,P值=0.398,x3是铁路客运量,这说明铁路客运量对民航客运量无显著影响。

(3)由上图知:回归方程为 y=450.909+0.354x1-0.561x2-0.007x3+21.578x4+0.435x5 (4)复相关系数R=0.999,决定系数R*R=0.998,由决定系数看回归方程高度显著。 (5)有方差分析表可知:F=1128.303,P值=0.000,表明回归方程高度显著,说明x1,x2,x3,x4,x5整体上对y有高度显著的线性影响。 (6)回归系数的显著性检验。自变x1,x2,x3,x4,x5对y均有显著影响,其中x3铁路客运量的P值=0.006最大,但仍在1%的显著性水平上对y高度显著,这充分说明在多元线性回归中不能仅凭简单相关系数的大小而决定变量的取舍。 (7)疑问:x2的回归系数为-0.561是负的,x2是消费额,负的回归系数说明与y呈负相关,显然是不合理的!故进一步分析;由关于相关系数分析表知:其原因是自变量之间的共线性(x1是国民收入,x2是消费额,二者的简单相关系数r12=0.9989,高度相关!),故在多重共线性部分作进一步改进。 多重共线性分析

主成分分析与因子分析的主要方法和思想

1.(10分)数据中心化和标准化在回归分析中的意义是什么? 在多元线性回归分析中,因为涉及多个自变量,自变量的单位往往不同,会给分析带来一定的困难,又由于涉及的数据量很大,就可能会以舍入误差而使得计算结果不理想. 1.中心化处理后可以减少一个未知参数,减少了计算的工作量,对手工计算尤为重要. 2.标准化处理后有利于消除量纲不同和数量级的差异所带来的影响,避免不必要的误差. 2.(10分)在实际问题中运用多元线性回归应注意哪些问题? 在实际问题中,人们用复相关系数R来表示回归方程对原有数据拟合程度的好坏,但是拟合优度并不是检验模型优劣的唯一标准,有时为了使模型从结构上有较合理的经济解释,R2等于0.7左右也给回归模型以肯定的态度. 在多元线性回归分析中,我们并不看重简单相关系数,而认为偏相关系数才是真正反映因变量y与自变量x i以及自变量x i与x j的相关性的数量. 用相关系数R2大小来衡量模型的拟合优度,不能仅由R2值很大来推断模型优劣. 在实际应用回归方程进行控制和预测时,给定的x0值不能偏离样本均值太大,如果太大,用回归方程无论是作因素分析还是经济预测,效果都不会理想. 得到实际问题的经验回归方程后,还不能马上用它去作分析和预测,还需运用统计方法对回归方程进行检验. 3.(15分)主成分分析与因子分析的主要方法和思想是什么?两者有何联系与区别? 求解主成分的方法:从协方差阵出发(协方差阵已知),从相关阵出发(相关阵R已知),采用的方法只有主成分法。 一、主成分分析的基本思想 在对某一事物进行实证研究中,为了更全面、准确地反映出事物的特征及其发展规律,人们往往要考虑与其有关系的多个指标,这些指标在多元统计中也称为变量。这样就产

因子分析法

第三章OR「与OEA结合方法下的关键影响因子研究 3.1基于因子分析的数据包络分析方法 科学地评价、分析旅游业上市公司的经营业绩、发展效率、发展规模不仅有 助于上市公司自身寻找差距、挖掘潜力、提高管理水平,而且对整个旅游业经济 的发展都具有重要的现实意义。对于旅游业上市公司的目前国内外研究综合评价 的方法很多,目前国内学者对旅游业上市公司业绩的研究主要集中于旅游业上市 公司的资本结构问题与技术效率关系的问题(许陈生,2007)、旅游业上市公司的 资本结构、盈利能力与规模的研究(朱颖、王杨,2007)、旅游业上市公司的多元 经营与风险控制问题(郑媛媛,2006)上,这些研究主要是采用财务、统计方法 对企业的偿债能力、盈力能力及产品的销售状况等进行分析评价。近来也有学者 利用因子分析(DRF)方法对旅游业上市公司的经营业绩进行综合评价(吴琳 萍,2008)。这些研究在实际运用中遇到的一个问题是,当对同一对象运用多种方法评价时,结论存在差异,以致人们难以据其对客观现实做出准确的判断。 为了解决多方法评价的一致性问题,近年来学术界提出了“组合评价”的研 究思路,即将两种或两种以上评价方法进行综合以实现评价方法的优势互补与补 差补缺,期望由此得到更合理、科学的评价结果。对单一评价方法的组合,可针 对单一评价法的权数进行组合,也可对单一评价法的评价排序结果进行组合。近 年来,不少学者针对数据包络分析(DEA)在权重确定上的优点,提出了层次分 析方法(AHP)、加权灰色关联、模糊综合评价与数据包络分析(DEA)的组合分 析法。但在实际运用中至少存在以下4个问题:①难以保证DEA中的决策单元(DMU)个数大于投入产出指标的2倍;②过多的投入产出指标可能会造成主次不分,从而不能很好地反映评价的目的和评价内容;③投入产出指标间可能存在强 线性关系,从而影响评价质量;④评价的结果以静态刻画、描述为主,不能反映 评价对象在一个指定时间内的变迁情况。基于上述认识,本文提出一种基于DRF、DEA组合评价方法基础上的反映生产有效性动态变迁的组合研究方法,在吸收 D盯、DEA各自优点的基础上对旅游类上市公司生产有效性变迁规律进行研究。(王中昭,2006;陈衍泰,陈国宏,李美娟,2005) 3.2DRF方法 3.2.1因子分析的基本思路 因子分析(FactorAnalysis)是多元统计分析的一个重要分支,它始于1904年 英国心理学家C.Spearman对学生考试成绩的研究。它是利用降维的思想,由研究原始变相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为 少数几个综合因子的统计分析方法,主要目的是浓缩数据,因子分析是多元统计 分析的主干技术之一,其目的在于从大量的自变量中寻找一些适合解释因变量的 公共变量或虚拟变量,基于信息损失最小化原则,将众多原始原变量浓缩成为上 述少数几个因子变量,使得变量具有更高的可解释性(米子川,2002;郭岚,张勇,李志娟,2008)。50年代以来,由于计算机的发展,因子分析在社会学、经济学、管理学等方面得到较为广泛的应用。因子分析的主要作用是: (1)寻求基本结构(Summ盯ization)。在多元统计分析中,我们经常会遇到诸

因子分析步骤范例

因子分析步骤 范例来源:语言研究应用SPSS软件实例大全 某对外汉语培训中心对在该中心学习的外国留学生进行了一项汉语学习动机问卷调查。使用李克特五级式量表。第一级为最不喜欢,第五级为最喜欢。随机抽取18人参加调查。其中—个项目调查的是“内在动机”或称“内在兴趣动机”,了解留学生对汉语语言、文化的兴迎与喜爱。该项目分为六个问题。整理数据如下 一、建立数据集

二、打开Factor analysis主对话框 1. Analyze(分析)—Deta reduction (数据化简)--factor (因素) 2. 所有数据放入variable框内

三、进入Factor analysis主对话框右边的子对话框 (一) Descriptive子对话框 1. 选择Univariables(单变量描述统计量):会输出每个变量的平均数、标准差和观测量 2.选择Initial solution(初步结果):会输出原始分析结果:公因子方差、协方差、各因子的特征值、所占总方差的百分比、累计百分比。这是默认系统,应该保留。 3. Correlation Matrix(相关矩阵)围栏,选项含可选择的相关指标与相关检验:常常选择(1)(4) (1)coeffieient (相关系数),列出各变量间的相关系数矩阵。 (2)Significance level(显著性水平),列出各变量单侧检验的P值。 (3)Determinant(行列式)选项,输出相关系数矩阵的行列式。 (4)KMO and Barlett’s tests of sphericity (开塞-梅耶-欧巴金和巴莱特球性检验)选项(K-Kaiser, M-Meyer, O-Olkin): 列出球性检验的结果,显示因素模型是否合理。 (5)Inverse (逆矩阵):列出相关系数的逆矩阵。 (6)Reproduced (在生相关矩阵),列出因子分析后估计的相关矩阵与残差。

相关主题
文本预览
相关文档 最新文档