当前位置:文档之家› 因子分析模型的建立

因子分析模型的建立

因子分析模型的建立
因子分析模型的建立

因子分析模型的建立标准化管理部编码-[99968T-6889628-J68568-1689N]

基于因子分析模型的居民消费价格指数影响因素分

摘要:由于目前对居民消费价格变动原因的分析指标很多,且指标体系中各指标之间存在着多重共线性,从而影响了分析模型的稳定性,使所得模型中出现了不符合经济学原理的现象。本文采用多元统计分析方法,以2010年居民消费物价水平为例,建立了关于居民消费价格分类指数变动的因子分析模型,研究发现影响居民消费价格指数的主要因素为食品、衣着和家用设备等生活必需品的价格水平,其次为健身等娱乐设施价格和房价水平。关键词:消费价格指数;影响因素;因子分析

一、研究背景

随着社会主义市场经济体制的确立和逐步完善,我国经济总量和综合实力迅速上升,居民的生活水平显着提高,经济和社会都有了较大的发展。相对于过去而言,居民食品方面的消费支出比重在逐渐下降,而在文化娱乐等方面的消费支出比重越来越大。国家发改委在全国物价局长会议上指出,明年要围绕促进经济平稳较快发展这一主线,积极稳妥地推进价格改革,切实改进价格监管,保持价格总水平基本稳定。同时由于影响价格变动的因素日益复杂,价格异常波动的可能性增加。分析影响居民消费价格指数的主要影响因素,改进价格监管,保持价格总水平基本稳定有着重要意义;同时也为产业政策的制定和宏观经济的调控提供了参考。

居民消费价格指数(CPI)是反映与居民生活有关的产品及劳务价格统计出来的物价变动指标,通常作为观察通货膨胀水平的重要指标,在一定程度上也反映出我国居民消费结构的变化。本文通过对2010年全国居民消费价格指数的变化进行因子分析,从而确定出影响全国居民消费物价水平和消费结构变化的主导因素。

二、因子分析模型的建立

因子分析最初是由英国心理学家C.Spearman提出的,是多元统计分析的一个重要分支,其主要目的是浓缩数据。通过对诸多变量的相关性研究,来表示原来变量的主要信息。假设有n个样本,对于多指标问题X=(X1,

X2,...Xk),形成的背景原因是多种多样的,其中共同原因称为公共因子,假设用Fj表示,它们之间是两两正交的;每一个分量Xi又有其特定的原因,称为特殊因子,假设用ei表示,其两两之间互不相关,且只对相应的Xi起作用。同时,F与e相互独立。于是因子分析的数学模型可表示为:Fi叫做公共因子(也称主因子),它们是在各个原观测变量的表达式中都共同出现的因子,是相互独立的不可观测的理论变量。

矩阵A称为因子载荷矩阵。因子的负载矩阵A中第j列元素的平方和,即表示为公共因子F对X的贡献。表示同一公共因子Fj对各个变量所提供的方差贡献率的总和,它是衡量公共因子相对重要性的指标。

有时由于初始因子的负载矩阵综合性太强,各因子的典型变量代表性也不很突出,因而使因子意义含糊不清,不便于对因子进行解释。因此需要通过旋转负载矩阵,使负载尽可能向±1、0的方向靠近。从而降低因子的综合性,凸显其实际意义。

三、居民消费价格指数的因子分析模型求解

根据我国常用的消费资料支出分类方法,选取具有代表性的八个指标,即食品、烟酒、衣着、家庭设备用品、医疗保健和个人用品、交通和通讯、娱乐教育文化用品及服务以及居住,它们在人均生活消费总支出中所占的百分比分别记为X1、X2、X3、X4、X5、X6、X7、X8。表1为我国2010年居民消费价格分类指数的变化,具体数据如表1所示。

表12010年全国居民消费价格分类指数

1、相关系数基本分析

由表1中的数据,利用统计分析软件SPSS,将表1中的数据标准化,然后计算变量间的相关系数,如表2所示,可见,变量间的相关系数处于-1到-0.5和0.5至1之间的数值33个,所以变量之间存在共同因子的可能性很大,可以建立因子分析模型进行相关分析。

表2变量相关系数表

2特征根求解及方差分解

对消费者物价的8个分类指标建立因子分析模型,求得样本相关矩阵R的特征根和贡献率,表3总方差分解表所示,由表3绘制公共因子与特征根的碎石图,如图1所示(横坐标为公因子数,纵坐标为公共因子的特征值)。

表3总方差分解表

由表3可见,其余五个特征值均很小,前三个公共因子对样本方差的贡献和为93.322%,即取3个公共因子包含的信息量占总体信息量的百分比为

93.322%。由图1也可以看出,前三个公共因子变化最大,说明这三个公共因子提供了原始数据8个指标所能表达的足够的信息。所以选择公公因子的个数为3。

图1公共因子与特征根的碎石图

3、因子旋转及因子得分

同时,为防止初始因子负载矩阵不足“简单结构原则”,难以找到因子的实际意义,因此本文采用对负载矩阵进行旋转的方法,以达到使结构简化的目的。方差最大法正交旋转后的因子负载矩阵如表4所示。

表4旋转后的因子负荷系数

三个公共因子对变量的共同度都在80%以上,说明公共因子较好的解释了变量变动的原因。

表5因子得分系数矩阵

(1)因子1:因子1对食品、烟酒、衣着、家庭设备以及医疗保健这五个方面有较大影响,其中影响最大的是食品和烟酒,其次是衣着和家庭设备,其负载值均大于零。直观的说明了随着人们收入的提高,人们扩大对基本生活必需品的消费需求。食品、烟酒、衣着、家庭设备以及医疗保健在消费支出中加大了相应的比重。而且主因子1对8个变量的的方差贡献已达55%之多,说明基本生活必需品价格的上涨是居民消费物价指数上升的最主要原因,要控制通货膨胀,需从因子1代表的基本生活必需品物价水平重点采取措施。

(2)因子2:因子2主要反映医疗保健和个人用品以及文教娱乐服务两方面的变动。反映出居民生活水平的提高,人们的健康意识提升,特别是增加了健身、娱乐等高档消费需求,而身体素质的提升使得对医疗保健的需求相应下降,从而对医疗保健的负载值小于零,这反映了整个国民身体健康状况的提升。

(3)因子3:因子3主要是对居住和交通通讯有较大的影响,反映的是人们对住房需求及交通通讯便利要求的提高,同时房价的居高不下也是居民物价消费指数增加的重要原因。

四、结论

本文主要采用因子分析法进行研究,总的来看,因子分析是一种常用的处理高维数据的多元统计分析方法,是一种探索不易观测或不能观测的潜在因素之间相关关系的技术。因子分析属于描述性分析,它能够保证在数据信息损失最小的前提下,从大规模的原始数据群中迅速的将重要的信息提取出来,把原来具有一定程度相关关系的变量转换为数量较少的由原始变量组合而成的新变量—因子,用它们来代替原始变量,使人们对所研究的问题达到尽可能充分和全面的认识。它的主要作用体现在以下几个方面:

首先,它能够对反映问题不同侧面的众多指标变量进行综合,在保留尽可能多的信息的原则下,对原始数据进行压缩,将高维的数据集合进行降级处理,使数据更加的准确直观,便于我们对问题进行合理的分析。

其次,通过计算因子得分并对因子载荷矩阵进行正交旋转,可以利用公因子对全体指标变量进行分类,探索问题的潜在因素,思考问题的成因,并对问题做出合理的总结。

本文选取2010年全国居民消费价格指数,研究消费价格指数变化的影响因素。考虑到数据的可取性,并综合研究年份的具体情况,选择具有代表性的食品、烟酒、衣着、家庭设备用品、医疗保健和个人用品、交通和通讯、娱乐教育文化用品及服务以及居住这八个指标来构建居民消费价格水平的指标体系,避免了单指标的片面性。通过对居民消费价格指数的因子分析,在八个指标中提取出3个公因子,根据公因子及其相应的方差贡献率计算各因子得分,最终得出随着人民收入的提高,生活水平与质量普遍上升,食品、衣着和家用设备等生活必需品的价格水平仍为主导因素的情况下,健身娱乐等高档消费品价格及房价水平成为影响消费者物价指数的重要因素。

可见因子分析方法是一种有效的多因素分析评价方法,在分析过程中,不仅可以得到综合的评价结果,而且还可以得到每一类因素指标的评价结果。然而,由于指标的选取有一定的局限性,在应用因子分析法对居民消费价格指数进行评价时,有些指标由于数据来源的限制而被排除考虑,可能会影响最终评价的全面性。

中国矿业大学

2010级硕士研究生课程考试试卷

考试科目多元统计分析

考试时间2011年5月

学生姓名林祥燕

学号ZS1070091

所在院系管理学院

任课教师陈权宝

中国矿业大学研究生院培养管理处印制

主成份分析因子分析毕业论文终稿

学科分类号110 黑龙江科技大学 本科学生毕业论文 题目主成分与因子分析对黑龙江 省城市经济发展水平的评价 The principal components and factor analysis of urban economic development level ? evaluation of heilongjiang province 姓名 学号 院(系)理学院 专业、年级数学与应用数学 指导教师 2014年6月12日

摘要 经济是指一个国家国民经济的总称。我们要提高某地方人民的生活水平,要更好更快地发展某个地区,就必须充分了解这个地区现有的经济发展状况。因此,现有的经济发展状况研究对将来的发展有着非常重要的指导意义。 主成分分析也称主分量分析,就是设法将原来指标重新组合成一组新的互相无关的几个综合指标来代替原来指标。因子分析是主成分分析的推广和发展,它也是将具有错综复杂关系的变量综合为数量较少的几个因子,以再现原始变量与因子的相互关系,同时根据不同因子还可以对变量进行分类。主成分分析与因子分析都是多元分析中处理降维的一种统计方法。本文通过学习与查阅相关资料找到黑龙江省12个地级市的10个具有代表性指标,运用spss统计分析软件对这些指标进行主成分分析和因子分析得到特征值、方差贡献率及公共因子等相关数据。并利用这些数据对12个市经济水平划分等级。 关键词主成分分析因子分析经济spss统计分析软件

Abstract Economy refers to the floorboard of the national economy of a country. We will improve the level of a local people's life, to somewhere better and faster development, we must fully understand the current situation of economic development. Therefore, the existing research on the development of future economic development has a very important guiding significance. Principal component analysis (also called principal component analysis, is to try the original index combined into a new set of several comprehensive index instead of the original index has nothing to do with each other, at the same time, according to the actual need to recommend a few less comprehensive response as much as possible the original information of indicators. Is a generalization of the principal component analysis and factor analysis, it is also will have the intricate relationship between variables comprehensive to a small number of several factors, and to recreate the relationship of the original variables and factor, at the same time according to different factors can also categorize variables,. Principal component analysis and factor analysis is a multivariate analysis of a statistical method of dealing with the dimension reduction. In this article, through learning and access to relevant data found nine representative indexes of 12 cities in heilongjiang province, using the SPSS statistical analysis software to the indicators of principal component analysis and factor analysis of the characteristic value, the variance contribution rate and public factor and related data. And using the data of 13 cities economic grade level. Key words Principal component analysis Factor analysis Economic SPSS statistical analysis softwar

基于因子分析的我国城市经济发展状况实证分析

吉林财经大学研究生课程论文 (期末作业) 论文题目基于因子分析的我国经济发展状况实证分析 课程名称多元统计分析与spss软件应用 姓名 xxxxxx 学号 xxxxxxxxxx 专业会计学年级 2014 级 院、所会计学院日期 2015.6.27 (以上内容由研究生本人填写) 教师评阅意见: □95 □90 □85 □80 □75 论文成绩 □70 □65 □60 □60以下 吉林财经大学研究生学院制

基于因子分析的我国经济发展状况实证分析 摘要:选取了2013年我国31个省、直辖市、自治区经济发展的10项指标作为研究对象,运用因子分析的方法,利用spss对数据进行计算,依据因子分析的结果对我国各省的经济发展做出综合评价,得出了这31各省份经济发展状况的综合排名,广东、江苏、山东、浙江、北京排在前5位,是中国各省、直辖市、自治区沿海经济发展较好的地区;甘肃、海南、青海、宁夏、西藏排在后5位,是西部地区经济发展较落后的地区,较为客观反映了中国各省、直辖市、自治区的综合经济实力,为中国各省、直辖市、自治区今后的经济发展提供了理论依据。 关键词:经济发展;因子分析;综合评价;主成分法 一、引言 我国地域辽阔,由于历史、地理位置及经济基础等原因,各地经济发展水平差异很大。改革开放以来,特别是实施西部大开发、振兴东北地区等老工业基地、促进中部地区崛起、鼓励东部地区率先发展的区域发展总体战略以来,各地经济社会发展水平有了很大提高,人民生活也有了很大改善。但区域发展不协调、发展差距拉大的趋势仍未根本改变。本文从我国31 个省市自治区经济的发展视角入手,运用对应分析方法对我国各地区经济发展状况进行统计分析,用以说明我国各地区经济发展不协调的现状。由于衡量各地区经济发展的指标有很多,故选取了比较有代表性的十个指标。 二、相关统计指标与数据的选取 本文运用了因子分析的方法对我国31个省、直辖市、自治区的经济发展状况进行评价。选取了10项经济指标:第一产业增加值(X1);第二产业增加值(X2);第三产业增加值(X3);地方财政预算收入(X4);地方财政预算支出(X5);固定资产投资额(X6);社会消费品零售总额(X7);货物进出口总额(X8);在岗职工平均工资(X9);城乡居民储蓄年末余额(X10)。X2,X3,X4 反映的是经济总量中构成三大产业的不同增加值;X5,X6 反映的是地方财政预算收支;X7 反映的是居民的购买能力;X8反映的是对外贸易;X9,X10反映的是居民的收入与储蓄。本文数据资料来源于《中国统计年鉴》(2013年),具体数据资料见表1。 表1 各地区经济发展状况(2013) 地区X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 北京11.63 293.03 1316.50 3661.11 4173.66 6847.06 8375.10 4289.96 93997.00 23086.41 天津16.85 612.86 846.57 2079.07 2549.21 9130.25 4470.43 1285.02 68864.00 7612.31

因子分析的基本概念和步骤

因子分析的基本概念和步骤 一、因子分析的意义 在研究实际问题时往往希望尽可能多地收集相关变量,以期望能对问题有比较全面、完整的把握和认识。例如,对高等学校科研状况的评价研究,可能会搜集诸如投入科研活动的人数、立项课题数、项目经费、经费支出、结项课题数、发表论文数、发表专著数、获得奖励数等多项指标;再例如,学生综合评价研究中,可能会搜集诸如基础课成绩、专业基础课成绩、专业课成绩、体育等各类课程的成绩以及累计获得各项奖学金的次数等。虽然收集这些数据需要投入许多精力,虽然它们能够较为全面精确地描述事物,但在实际数据建模时,这些变量未必能真正发挥预期的作用,“投入”和“产出”并非呈合理的正比,反而会给统计分析带来很多问题,可以表现在: 计算量的问题 由于收集的变量较多,如果这些变量都参与数据建模,无疑会增加分析过程中的计算工作量。虽然,现在的计算技术已得到了迅猛发展,但高维变量和海量数据仍是不容忽视的。 变量间的相关性问题 收集到的诸多变量之间通常都会存在或多或少的相关性。例如,高校科研状况评价中的立项课题数与项目经费、经费支出等之间会存在较高的相关性;学生综合评价研究中的专业基础课成绩与专业课成绩、获奖学金次数等之间也会存在较高的相关性。而变量之间信息的高度重叠和高度相关会给统计方法的应用带来许多障碍。例如,多元线性回归分析中,如果众多解释变量之间存在较强的相关性,即存在高度的多重共线性,那么会给回归方程的参数估计带来许多麻烦,致使回归方程参数不准确甚至模型不可用等。类似的问题还有很多。 为了解决这些问题,最简单和最直接的解决方案是削减变量的个数,但这必然又会导致信息丢失和信息不完整等问题的产生。为此,人们希望探索一种更为有效的解决方法,它既能大大减少参与数据建模的变量个数,同时也不会造成信息的大量丢失。因子分析正式这样一种能够有效降低变量维数,并已得到广泛应用的分析方法。 因子分析的概念起源于20世纪初Karl Pearson和Charles Spearmen等人关于智力测验的统计分析。目前,因子分析已成功应用于心理学、医学、气象、地址、经济学等领域,并因此促进了理论的不断丰富和完善。 因子分析以最少的信息丢失为前提,将众多的原有变量综合成较少几个综合指标,名为因子。通常,因子有以下几个特点: ↓因子个数远远少于原有变量的个数 原有变量综合成少数几个因子之后,因子将可以替代原有变量参与数据建模,这将大大减少分析过程中的计算工作量。 ↓因子能够反映原有变量的绝大部分信息 因子并不是原有变量的简单取舍,而是原有变量重组后的结果,因此不会造成原有变量信息的大量丢失,并能够代表原有变量的绝大部分信息。 ↓因子之间的线性关系并不显著 由原有变量重组出来的因子之间的线性关系较弱,因子参与数据建模能够有效地解决变量多重共线性等给分析应用带来的诸多问题。 ↓因子具有命名解释性 通常,因子分析产生的因子能够通过各种方式最终获得命名解释性。因子的命名解

论文_因子分析在市场研究中的应用

嘉应学院 本科毕业论文(设计) (2009届) 题目:因子分析在市场研究中的应用 姓名:吴启英 学号: 2050122135 系别:数学系 专业:信息与计算科学 指导老师:张乐 申请学位:学士学位 嘉应学院教务处制

摘要 本文对因子分析的基本理论做了详细的论述与探讨,并对因子分析与其他分析的概念的区别作了比较。文中描述了因子分析的数学模型与意义,并分析了因子分析应用的步骤。在实际市场研究中,运用因子分析法对中国14家上市银行2007年的盈利状况进行了分析。运用SPSS软件,得出了评价上市银行“盈利性综合实力”的三项因子,分别命名为:盈利性因子、投资回报因子和成长性因子。然后通过回归得到14家银行三项因子的得分系数并从银行规模和利润增长模式两个不同的角度进行分析,得到了各样本的综合得分和排名,并从各行具体经营状况的角度进行总评。 关键词:因子分析,因子载荷矩阵,因子旋转,因子得分,利润增长模型

Abstract This article has made the detailed elaboration and the discussion to factorial analysis's elementary theory, and has made the comparison to the factorial analysis with other analysis's concept's difference. In the article described the factorial analysis mathematical model and the significance, and has analyzed the factorial analysis application step. In the actual marketing research, the utilization factor analytic method 2007 profit condition has carried on the analysis to the Chinese 14 on city banks. Using the SPSS software, has obtained in the appraisal the city bank “the profit making synthesis strength” three factors, the distinction naming is: Profit making facto r, investment repayment factor and expanding factor. And then get 14 banks three terms factor score modulus by return and increase pattern different two angles go along analysis from bank scale and profit, have got every synthetical sample book score and row and have carried out an overall appraisal from every concrete business performance of bank angle. Keywords:factor analysis, the factor matrix, the factor rotates , factor score , profit increase model

因子分析模型的建立

基于因子分析模型的居民消费价格指数影响因素分 析 摘要:由于目前对居民消费价格变动原因的分析指标很多,且指标体系中各指标之间存在着多重共线性,从而影响了分析模型的稳定性,使所得模型中出现了不符合经济学原理的现象。本文采用多元统计分析方法,以2010年居民消费物价水平为例,建立了关于居民消费价格分类指数变动的因子分析模型,研究发现影响居民消费价格指数的主要因素为食品、衣着和家用设备等生活必需品的价格水平,其次为健身等娱乐设施价格和房价水平。 关键词:消费价格指数;影响因素;因子分析 一、研究背景 随着社会主义市场经济体制的确立和逐步完善,我国经济总量和综合实力迅速上升,居民的生活水平显着提高,经济和社会都有了较大的发展。相对于过去而言,居民食品方面的消费支出比重在逐渐下降,而在文化娱乐等方面的消费支出比重越来越大。国家发改委在全国物价局长会议上指出,明年要围绕促进经济平稳较快发展这一主线,积极稳妥地推进价格改革,切实改进价格监管,保持价格总水平基本稳定。同时由于影响价格变动的因素日益复杂,价格异常波动的可能性增加。分析影响居民消费价格指数的主要影响因素,改进价格监管,保持价格总水平基本稳定有着重要意义;同时也为产业政策的制定和宏观经济的调控提供了参考。 居民消费价格指数(CPI)是反映与居民生活有关的产品及劳务价格统计出来的物价变动指标,通常作为观察通货膨胀水平的重要指标,在一定程度上也反映出我国居民消费结构的变化。本文通过对2010年全国居民消费价格指数的变化进行因子分析,从而确定出影响全国居民消费物价水平和消费结构变化的主导因素。 二、因子分析模型的建立 因子分析最初是由英国心理学家C.Spearman提出的,是多元统计分析的一个重要分支,其主要目的是浓缩数据。通过对诸多变量的相关性研究,来表示原来变量的主要信息。假设有n个样本,对于多指标问题X=(X1,X2,...Xk),形成的背景原因是多种多样的,其中共同原因称为公共因子,假设用Fj表示,它们之间是两两正交的;每一个分量Xi又有其特定的原因,称为特殊因子,假设用ei表示,其两两之间互不相关,且只对相应的Xi起作用。同时,F与e相互独立。于是因子分析的数学模型可表示为: Fi叫做公共因子(也称主因子),它们是在各个原观测变量的表达式中都共同出现的因子,是相互独立的不可观测的理论变量。

数学建模各种分析报告方法

现代统计学 1.因子分析(Factor Analysis) 因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不可观测的,即不是具体的变量),以较少的几个因子反映原资料的大部分信息。 运用这种研究技术,我们可以方便地找出影响消费者购买、消费以及满意度的主要因素是哪些,以及它们的影响力(权重)运用这种研究技术,我们还可以为市场细分做前期分析。 2.主成分分析 主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用:a,了解数据。(screening the data),b,和cluster analysis一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简化。(reduce dimensionality)d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。 主成分分析和因子分析的区别 1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。 2、主成分分析的重点在于解释个变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。 3、主成分分析中不需要有假设(assumptions),因子分析则需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子(specific factor)之间也不相关,共同因子和特殊因子之间也不相关。 4、主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,的主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不同的因子。 5、在因子分析中,因子个数需要分析者指定(spss根据一定的条件自动设定,只要是特征值大于1的因子进入分析),而指定的因子数量不同而结果不同。在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。 和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势。大致说来,当需要寻找潜在的因子,并对这些因子进行解释的时候,更加倾向于使用因子分析,并且借助旋转技术帮助更好解释。而如果想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析。当然,这中情况也可以使用因子得分做到。所以这中区分不是绝对的。 总得来说,主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用:a,了解数据。(screening the data),b,

因子分析小论文1

案例六 因子分析在党风廉政建设民意测评中的应用 (王学民 编写) 一、 引言 对领导干部的廉洁自律及施政状况进行民意测评是搞好党风廉政建设工作的一个非常重要的环节。在实际工作中这样的民意测评还是比较多见的,这对促进党风好转和廉洁施政具有很好的积极意义。但许多组织民意测评的机构或部门对调查得到的数据结果往往只是进行简单的数据汇总和处理,并未采用更为科学的统计方法对这些资料作进一步加工和分析,这样就使得民意测评结果中所包含的许多有价值的信息未能得到很好、充分的提炼和显现,这是很可惜的。如何对这些调查结果进行有效的统计分析是一个值得研究和探讨的问题,具有理论和实践的意义。这类民意测评的结果具有这样一个共同的特点:许多调查指标之间的相关程度往往较高,即它们所含的信息大量地重复着,因此分析处理这类问题的一个非常值得考虑的方法是采用因子分析方法,将众多的调查指标归因于少数几个因子,从而较好地达到降维的目的。如果该方法成功,则可以对民意测评中反映出的问题得到比较清晰的认识,有利于对领导干部的廉政情况给出一个高度概括的、清楚的评价。 本文以上海财经大学纪委对各院系领导班子所作的民意测评为例,对其调查数据进行因子分析,并根据因子分析的结果对各院系的党风廉正建设状况给出一个有效、直观和清晰的比较分析。 二、数据的预处理 上海财经大学纪委每年都要对各院系的整个领导班子进行民意测评,学校共有七个学院和四个(校级)系。2003年度的民意测评汇总结果经整理后列于表1中,11个院系在表中分别用字母a,b,c,d,e,f,g,h,i,j,k 表示。所有11个测评指标有“好”与“不好”两方面的比例,为了有效地进行因子分析,我们让每个指标“好”的方面比例减去“不好”的方面比例,将其作为该指标的综合值,表明“好”的程度,并分别记为1121,,,x x x ,结果列于表2。

因子分析论文

关键词:因子提取正交旋转因子分析因子得分 1.问题提出 随着我国的经济的发展,人民的生活水平逐渐提高。从而家庭耐用品的拥有量也有所提高。但各省市的拥有量也存在差异。为了准确的把握各省市的情况及其差异。本文采用多变量统计因子分析的方法,对其进行定量分析。以期对各省市的耐用品拥有量的情况有个客观的把握,及反映各省市的经济发展情况。 2.耐用品拥有量指标的选择。 为了更好的反映各省市的耐用品拥有量的情况,且根据当今社会家庭拥有耐用品的档次的不同,可将其分为低,中,高档。从而本文使用2005年统计年鉴的数据。选取了具有代表的三类九个指标: (一):低档消费耐用品:普通电话拥有量(部); (二):中档消费耐用品:电冰箱拥有量(台),彩电拥有量(台),电视机拥有量(台),空调拥有量(台),移动电话拥有量(部); (三):高档奢侈消费耐用品:家用电脑拥有量(台),家用汽车拥有量(辆),摄像机拥有量(台),照相机拥有量(台); 3.各省市耐用品情况分析: 1.本文所采取的定量分析方法: 本文的研究主要采取因子分析方法。因子分析是近些年来颇为流行的多元变量统计方法。它是用较少个数的公共因子的线性函数和特定因子之和来表达原有观测的每个变量,从研究相关矩阵内部的依赖关系出发,把一些具有错综复杂的变量归纳为少数几个综合因子的一种多变量统计分析方法。当这几个公共因子的累计方差和达到85%以上时,就说明这几个公共因子反映了研究问题的大部分信息,而又不相关,信息不重叠。因子分析的数学模型用矩阵的形式表示为:X=AF+E 其中F为公共因子,E为特殊因子。 本文在对数据标准化以后,采取主成分法提取公共因子,并采用方差最大化正旋转。 2.考察原有变量是否适合进行因子分析。 表(一)是原有变量的相关系数距阵。可看到大部分的相关系数都较高,各变量呈较强的线性关系。且表(二)巴特利特球度检验和KMO检验可以看出,k值大于0.7且接近0.8是很适合进行因子分析的。所以原有变量适合进行因子分析。 原有变量的相关系数矩阵 Correlation Matrix 表(一)

数学建模模拟题,图论,回归模型,聚类分析,因子分析等 (48)

第11章第2题 摘要 本题分析4 种化肥和3 个小麦品种对小麦产量的影响,以及二者交互作用对小麦产量的影响,可视为两因素方差分析,即化肥和小麦品种两个因素,4种化肥可看作是化肥的四个不同水平,3个小麦品种也可以看作是小麦品种的三个不同水平。 试验的目的是分析化肥的四个不同水平以及小麦品种的三个不同水平对小麦产量有无显着性影响。 关键词:方差分析显着性化肥种类小麦品种

一.问题重述 为了分析4 种化肥和3 个小麦品种对小麦产量的影响,把一块试验田等分成36个小块,分别对3种种子和四种化肥的每一种组合种植3 小块田,产量如表1所示(单位公斤),问不同品种、不同种类的化肥及二者的交互作用对小麦产量有无显着影响。 二.问题分析 本题意在分析四种化肥和三种小麦品种对小麦产量的影响,以及二者交互作用对小麦产量的影响,为两因素方差分析问题,即化肥和小麦品种两个因素,4种化肥可看作是化肥的四个不同水平,3个小麦品种也可以看作是小麦品种的三个不同水平。通过对这两种因素的不同水平及交互作用的分析,从而分析 4 种化肥和3 个小麦品种对小麦产量的影响。 三.模型假设 1.假设只有化肥种类和小麦品种两个因素,其他因素对试验结果不构成影响。 2.假设不存在数据记录错误。 3.假设每一块试验田本身各项指标相同,不会影响结果。 四.符号说明 数字1,2,3,4——不同的化肥种类 数字1,2,3——不同的小麦品种 五.模型建立 将化肥种类和小麦品种视为两个因素,四种化肥种类看作是化肥种类的四个不同水平,三个小麦品种看作是小麦品种的三个不同水平,将表1的数据进行整理,如表2所示。

六.模型求解 将表2数据导入到spss软件中,进行两因素方差检验,得到结果如下:表3

因子分析例题

因子分析例题 公司内部编号:(GOOD-TMMT-MMUT-UUPTY-UUYY-DTTI-

因子分析 因子分析(Factor Analysis )是主成分分析的推广,它也是从研究相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合变量的一种多变量统计分析方法。 第一节 因子分析的基本思想 首先我们看下面两个实际例子: 例1. 例1. 某企业招聘人才,对每位应聘者进行外貌、申请书的形式、专业能力、 讨人喜欢的能力、自信心、洞察力、诚实、推销本领、经验、积极性、抱负、理解能力、潜在能力、实际能力、适应性等15个方面的考核。这15个方面可归结为应聘者的外露能力、讨人喜欢的能力、经验、专业能力4个方面,每一方面称之为一个公共因子。企业可根据这4个公共因子的情况来衡量应聘者的综合水平。 例2. 例2. 在企业经济效益的评价中,有经济效益的指标体系。通常这个指标体系 有八项指标:固定资产利税率、资金利税率、销售收入利税率、资金利税率、固定资产产值率、流动资金周转天数、万元产值能耗、全员劳动生产率等。这八项指标可概括为盈利能力、资金和人力利用、产值能耗三个方面。这三个方面在企业的生产经营活动中为主要因子,起着支配作用,企业要提高经济效益就要在这三个公共因子方面下功夫。 因子分析的基本思想:是通过变量(或样品)的相关系数矩阵(对样品是相似系数矩阵)内部结构的研究,找出能控制所有变量(或样品)的少数几个随机变量去描述多个变量(或样品)之间的相关(相似)关系,但在这里,这少数几个随机变量是不可观测的,通常称为因子。 因子分析分为两类,即R 型因子分析(对变量作因子分析),Q 型因子分析(对样品作因子分析)。 第二节 第二节 因子分析的数学模型 1.1. 模型(R 型) 设),,,(21p x x x X =为观察到的随机向量,),,,(21m F F F F =是不可观测的向量。 有 即 其中)',,(1p εεε =称作误差或特殊因子。 满足假设: 1)p m ≤ 2)0),cov(=εF , 3)m I F =)var(,),,()var(2 21p diag σσε =。 称i F 为第i 个公共因子,ij a 为因子载荷。 因子分析与主成分的关系:

毕业设计因子分析资料

第八章 因子分析 §8.1 什么是因子分析及基本思想 1904年Charles Spearman 发表一篇著名论文《对智力测验得分进行统计分析》视为因子分析的起点。因子分析的形成和发展有相当长的历史,最早用以研究解决心理学和教育学方面的问题,由于计算量大,又缺少高速计算的设备使因子分析的应用和发展受到很大的限制,甚至停滞了很长时间。后来由于电子计算机的出现,才使因子分析的理论研究和计算问题,有了很大的进展。目前这一方法的应用范围已十分广泛,在经济学、社会学、考古学、生物学、医学、地质学以及体育科学等各个领域都取得了显著的成绩。 1 什么是因子分析 因子分析是主成分分析的推广和发展,它也是将具有错综复杂关系的变量(或样品)综合为数量较少的几个因子,以再现原始变量与因子之间的相互关系,同时根据不同因子还可以对变量进行分类,它也是属于多元分析中处理降维的一种统计方法。 例如,某公司对100名招聘人员的知识和能力进行测试,出了50道题的试卷,其内容包括的面较广,但总的来讲可归纳为六个方面:语言表达能力、逻辑思维能力、判断事物的敏捷和果断程度、思想修养、兴趣爱好、生活常识等,我们将每一个方面称为因子,显然这里所说的因子不同于回归分析中因素,因为前者是比较抽象的一种概念,而后者有着极为明确的实际意义,如人口密度、工业总产值、产量等。 假设100人测试的分数{}100 ,,1, =i X i 可以用上述六个因子表示成线性函数: ,1001,i 662211 =++++=i i i i i F a F a F a X ε 其中61,,F F 表示六个因子,它对所有X i 是共有的因子,通常称为公共因子,它们的系数 61,i i a a 称为因子载荷,它表示第i 个应试人员在六个因子方面的能力。i ε是第i 个应试人 的能力和知识不能被前六个因子包括的部分,称为特殊因子,通常假定),0(~2i i N σε,仔细观察这个模型与回归模型在形式上有些相似,实质很不同。这里的61,,F F 的值未知的, 并且有关参数的统计意义更不一样。因子分析的任务,首先是估计出{} ij a 和方差{} 2 i σ,然 后将这些抽象因子{}i F 赋予有实际背景和因子之间的相互关系,以达到降维和对原始变量进行分类的目的。 因子分析的内容十分丰富,本章仅介绍因子分析常用的两种类型:R 型因子分析(对变量作因子分析)和Q 型因子分析(对样品作因子分析)。 2 基本思想 因子分析的基本思想是通过变量(或样品)的相关系数矩阵(对样品是相似系数矩阵)

因子分析论文

各地区城市市政设施建设情况因子分析 计算B092 王静 【摘要】本文在搜集相关数据的基础上,采用因子分析法,对我国各地区城市市政设施建设情况进行综合评价。 【关键词】因子分析城市市政设施 一、因子分析基本原理 因子分析的形成和发展已经有相当长的历史了,最早用于研究解决心理学和教育学方面的问题,目前这一方法的应用范围已十分广泛,在经济学、社会学、考古学、生物学、医学、地质学,以及体育科学等各个领域都取得了显著的成绩。 因子分析是主成分分析的推广和发展。它的基本思想是通过变量的相关系数矩阵内部结构的研究,找出能控制所有变量的少数几个随机变量去描述多个变量之间的相关关系。但在这里,这少数几个随机变量是不可观测的,通常称为因子。然后根据相关性的大小把变量分组,使得同组内的变量之间相关性较高,但不同组的变量相关性较低。因子分析有一个默认的前提条件就是各变量之间必须有相关性。具体在该条件的判断上, 除了根据专业知识来估计外, 还可以使用KMO统计量和Bartlett’s球型检验加以判定。本文的KMO值为, 各变量之间的相关程度无太大差异, 数据做因子分析效果不错; Bartlett’s球型检验也拒绝了0假设,因此各个变量指标间取值是有关系的。所以样本适合做因子分析。 二、实证分析 1.变量名称

2.数据收集及处理分析 从中国统计年鉴(2005)选取31个省的上述6项数据,应用软件SPSS 进行处理分析。 北京 天津 河北 山西 内蒙古 辽宁 吉林 黑龙江 上海 江苏 浙江 安徽 福建

江西 山东 河南 湖北 湖南 广东 广西 海南 重庆 四川 贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆 表1是6个分析变量的相关系数矩阵表,从表中可以看出这6个变量具有高相关性。

数学建模多元统计分析

实验报告 一、实验名称 多元统计分析作业题。 二、实验目的 (一)了解并掌握主成分分析与因子分析的基本原理和简单解法。 (二)学会使用matlab编写程序进行因子分析,求得特征值、特征向量、载荷矩阵等值。(三)学会使用排序、元胞数组、图像表示最后的结果,使结果更加直观。 三、实验内容与要求

四、实验原理与步骤 (一)第一题: 1、实验原理: 因子分析简介: (1) 1.1 基本因子分析模型 设p维总体x=(x1,x2,....,xp)'的均值为u=(u1,u2,....,u3)',因子分析的一般模型为 x1=u1+a11f1+a12f2+........+a1mfm+ε 1 x2=u2+a21f1+a22f2+........+a2mfm+ε 2 ......... xp=up+ap1f1+fp2f2+..........+apmfm+εp 其中,f1,f2,.....,fm为m个公共因子;εi是变量xi(i=1,2,.....,p)所独有的特殊因子,他们都是不可观测的隐变量。称aij(i=1,2,.....,p;j=1,2,.....,m)为变量xi的公共因子fi上的载荷,它反映了公共因子对变量的重要程度,对解释公共因子具有重要的作用。上式可以写为矩阵形式 x=u+Af+ε

其中A=(aij)pxm 称为因子载荷矩阵;f=(f1,f2,....,fm)'为公共因子向量;ε=(ε1,ε2,.....εp)称为特殊因子向量 (2) 1.2 共性方差与特殊方差 xi的方差var(xi)由两部分组成,一个是公共因子对xi方差的贡献,称为共性方差;一个是特殊因子对xi方差的贡献,称为特殊方差。每个原始变量的方差都被分成了共性方差和特殊方差两部分。 (3) 1.3 因子旋转 因子分析的主要目的是对公共因子给出符合实际意义的合理解释,解释的依据就是因子载荷阵的个列元素的取值。当因子载荷阵某一列上各元素的绝对值差距较大时,并且绝对值大的元素较少时,则该公共因子就易于解释,反之,公共因子的解释就比较困难。此时可以考虑对因子和因子载荷进行旋转(例如正交旋转),使得旋转后的因子载荷阵的各列元素的绝对值尽可能量两极分化,这样就使得因子的解释变得容易。 因子旋转方法有正交旋转和斜交旋转两种,这里只介绍一种普遍使用的正交旋转法:最大方差旋转。这种旋转方法的目的是使因子载荷阵每列上的各元素的绝对值(或平方值)尽可能地向两极分化,即少数元素的绝对值(或平方值)取尽可能大的值,而其他元素尽量接近于0. (4) 1.4 因子得分 在对公共因子做出合理解释后,有时还需要求出各观测所对应的各个公共因子的得分,就比如我们知道某个女孩是一个美女,可能很多人更关心该给她的脸蛋、身材等各打多少分,常用的求因子得分的方法有加权最小二乘法和回归法。 注意:因子载荷矩阵和得分矩阵的区别: 因子载荷矩阵是各个原始变量的因子表达式的系数,表达提取的公因子对原始变量的影响程度。因子得分矩阵表示各项指标变量与提取的公因子之间的关系,在某一公因子上得分高,表明该指标与该公因子之间关系越密切。简单说,通过因子载荷矩阵可以得到原始指标变量的线性组合,如X1=a11*F1+a12*F2+a13*F3,其中X1为指标变量1,a11、a12、a13分别为与变量X1在同一行的因子载荷,F1、F2、F3分别为提取的公因子;通过因子得分矩阵可以得到公因子的线性组合,如F1=a11*X1+a21*X2+a31*X3,字母代表的意义同上。 (5) 1.5 因子分析中的Heywood(海伍德)现象 如果x的各个分量都已经标准化了,则其方差=1。即共性方差与特殊方差的和为1。也就是说共性方差与特殊方差均大于0,并且小于1。但在实际进行参数估计的时候,共性方差

数学建模之因子分析法

因子分析 因子分析就是一种降维、简化数据的技术。它通过研究众多变量之间的部依赖关系,探求观测数据中的基本结构,并用少数几个“抽象”的变量来表示其基本的数据结构。这几个抽象的变量被称作“因子”,能反映原来众多变量的主要信息。原始的变量是可观测的显在变量,而因子一般是不可观测的潜在变量。 1.因子分析法的应用 ①汽车行业业绩评价研究(下载文档), ②上市公司盈利能力及资本结构实证分析, ③生育率影响因素分析。 2.步骤 ①对原始数据进行标准化处理 用12,, ,m x x x 表示因子分析指标的m 个变量,评价对象有n 个,ij a 表示第i 个评价对象对应于第j 个指标的取值。将每个指标值ij a 转化为标准化指标ij a ,即 ,(1,2, ,;1,2, ,)ij j ij j a a i n j m s μ-= == 式中:11n j ij i a n μ==∑,21 1()1n j ij j i s a n μ==--∑ 相应地,标准化指标变量为 ,(1,2, ,)j j j j x x j m s μ-= = ②计算相关系数矩阵R ()ij m m R r ?= 1 ,(,1,2, ,)1 n ki kj k ij a a r i j m n =?= =-∑ 式中:1,ii ij ji r r r ==,ij r 是第i 个指标和第j 指标之间的相关系数。

③计算初等载荷矩阵 解特征方程0=-R I λ,得到特征值(1,2,,)i i m λ=12,0m λλλ≥≥≥≥,再 求出相对应的特征值i λ的特征向量(1,2,,)i u i m =,其中12(,,,)T j j j mj u u u u =, 得到初等载荷矩阵为 11, ,m m u λ?Λ=? ④ 确定主因子的个数()k k m ≤ 一般选取使得累计贡献率11 85%k m i i i i λλ ==≥∑∑的这k 个主因子,对k 个因子载 荷矩阵作旋转,用() 1k Λ表示1Λ的前k 列,T 表示正交矩阵,则得矩阵()21k T Λ=Λ,建立因子模型,即 1111111, . k k m m mk k x F F x F F αααα=++?? ??=++? ⑥计算因子得分,作出综合评价 求出单个因子的得分函数?j F ,用?ij F 表示第i 个样本对第j 个因子的得分估计值,Y 表示原始数据标准化后的矩阵,则总得分为 1??()ij n k k F F YR -?== Λ 例题 我国上市公司赢利能力与资本结构的实证分析已知上市公司的数据见表1 表1 上市公司数据

因子分析数学模型说课材料

因子分析数学模型

因子分析数学模型 1、因子分析看基本思想 因子分析是一种旨在寻找隐藏在多变量数据中,无法直接观察到却影响或支配可观测变量的潜在因子,并估计潜在因子对可观测变量的影响程度,以及潜在因子之间的相关性的一种多元统计分析方法。其基本思想是从分析多变量数据的相关关系入手,找到支配这种相关关系的少数几个相关独立的潜在因子,并通过建立起这些潜在因子与原变量之间的数量关系来预测潜在因子的状态,帮助发现隐藏在原变量之间的某种客观规律性。因子分析和主成分分析都能起到清理多个原始变量内在结构关系的作用,但主成分分子重在综合原始变量信息,而因子分析重在解释原始变量间的关系,是比主成分分析更深入的一种多元统计方法。 因子分析法就是这些潜在因子的数学模型方法,它是在主成分的基础上构筑若干个意义较为明确的潜在因子,以它们为框架分析原变量,以考察原变量间的联系与区别。 2、因子分析的基本原理 3、因子分析的数学模型 假设对n例样品观测了p个指标,即,,…,,得到观测数据。我们的任务就是从一组观测数据出发,通过分析各指标,,…,之间的相关性,找出支配作用的潜在因子,使得这些因子可以解释各个指标之间的相关性。 因子分析模型描述如下: (1)X=(,,…,)是可观测随机变量,均值向量E(X)=0,协方差Cov(X)与相关矩阵R相等,(只要将变量标准化即可实现)。 (2)F=(,,…,)(m<=p)是不可测的向量,其均值E(F)=0,协方差矩阵Cov(F)=1,即向量的各分量是独立的。 (3)e=(,,…,)与F相互独立,且E(e)=0,e的协方差矩阵是对角矩阵,即各分量e之间是相互独立的。 则因子分析的数学模型如下:

人力资源管理五因素分析模型

人力资源管理五因素分析模型 2007-9-23来源:中国人力资源开发网作者:陈谏 在当今企业管理学界研究得最多的领域就是人力资源管理,其实中国从来不缺乏对人管理的先进思想和智慧,古往今来,在历史的长河中涌现了不计其数育才、求才、用才的经典故事,只不过这些故事的经典之处,并非在商业;目前竞争激烈的商业环境中,产品和营销策略被普遍认为是是企业的主要价值,近几年我们通过对人力资源管理的深入研究发现,不容易为竞争者模仿、复制的"人才"和"企业文化",才是独一无二的价值所在。企业的成功,取决于一个具竞争力的优势上,即企业员工的表现。换言之,优秀的专业人才是带领企业创造绩效与价值的关键。企业如何找到适合企业文化、又有能力协助企业成长的人才,是我们人力资源管理工作者最核心的工作之一。人力资源部门必须通盘了解企业未来几年的目标及营运方向,协助企业配合策略规划,订定出切合时宜的人力资源管理模式。 要寻找人力资源管理模式,我们必须先研究人力资源管理的对象,其实,人力资源管理的对象不仅仅是"人",还包括"岗位"、"团队"、"职务簇"、和"关联".对于人的研究,我们大体上会注重于人的素质、人的能力、人的知识、人的业绩、人的价值、人的报酬、人的成本、人的投资等方面,这些信息都是依附在"人"这个活动的载体上,不管是"自然人理论"还是"科学人理论",或者是"职业人理论",都离不开对这些要素的分析与研究。 岗位的定义是大家最熟悉的,让我们忽视的是构成岗位的要素:岗位的目标、岗位的资源、岗位的重要性、岗位的胜任力模型、岗位的发展属性等。 职务簇是具备同样属性要素、但存在量差的岗位集合,同一个职务簇中不同的岗位,存在等级、重要性、目标等的差异。处于相同职务簇的群体,我们会用同样的管理方式去管理,如培训、考核、资源调配、薪酬设计等等。 团队是相对分散的人的集合,有非常多的组合规则,这些规则来源于"人"和"岗位"的属性,

相关主题
文本预览
相关文档 最新文档