基于因子分析的我国工业企业经济效益分析
- 格式:doc
- 大小:424.21 KB
- 文档页数:8
全国30市自治区经济发展水平综合评价——基于因子分析和聚类分析近年来,我国经济发展迅速,全国各地区也呈现出不同程度的经济发展水平。
为了对全国30个市自治区的经济发展水平进行综合评价,基于因子分析和聚类分析的方法被广泛应用。
首先,我们通过因子分析的方法对数据进行降维和综合评价。
因子分析将多个变量综合为少数几个因子,并可以解释这些因子与原始变量之间的关系。
我们选择了GDP总量、人均GDP、产业结构、基础设施建设、外资吸引等指标作为评价经济发展水平的变量。
通过因子分析,我们可以得到几个综合指标,用于评价各个市自治区的经济发展水平。
接着,我们可以利用聚类分析的方法进行分类。
聚类分析是将样本划分为几个相似的类别,每个类别内的样本相似度高,而类别间的相似度较低。
我们可以通过聚类分析得到若干个类别,这些类别可以代表不同的经济发展水平。
通过将市自治区进行分类,可以更加直观地展示各地区之间的差异,也可以为地方政府提供参考。
最后,我们可以将因子分析和聚类分析的结果进行综合。
通过对因子得分和聚类结果的比较,可以得到更加准确的综合评价。
在综合评价的过程中,我们可以进一步分析各个市自治区的优势和劣势,以及存在的问题和潜在的发展机会。
这些分析结果可以为地方政府提供经济发展策略和政策的参考。
在实施全国30市自治区经济发展水平综合评价的过程中,我们需要充分考虑指标的选择和权重的确定。
指标的选择应当代表经济发展的各个方面,权重的确定应当根据实际情况和专家意见综合考虑。
另外,我们需要注意数据的可靠性和准确性,以及分析方法的合理性和可操作性。
总之,基于因子分析和聚类分析的方法可以对全国30市自治区的经济发展水平进行综合评价。
这种方法能够降低数据的维度,提取出关键的因子,并对样本进行分类。
通过综合分析和评价,可以为决策者提供参考,促进经济发展水平的提高。
基于因子分析的我国工业企业经济效益分析1.导言提高企业的经济效益是每个企业的最终目标,对企业的生存和发展都有重要的意义。
可是如何提高经济效益,对不同企业需要用不同的方法。
本文对我国工业企业的经济状况进行分析来比较不同工业企业的经济效益。
通过这种比较,可以找出各行业工业企业的不足,进而进行调整。
2.因子分析因子分析是主成分分析的推广,是利用降维的思想,由研究原始变量相关矩阵或协方差矩阵的内部依赖关系出发,把一些具有错综复杂关系的多个变量归结为少数几个综合因子的一种多元统计分析方法。
它把每个研究变量分解为几个影响因素变量,将每个原始变量分解成两部分因素,一部分是由所有变量共同具有的少数几个公共因子组成的,另一部分是每个变量独自具有的因素,即特殊因子。
因子分析的目的之一,简化变量维数。
即要使因素结构简单化,希望以最少的共同因素(公共因子),能对总变异量作最大的解释,因而抽取得因子愈少愈好,但抽取因子的累积解释的变异量愈大愈好。
在因子分析的公共因子抽取中,应最先抽取特征值最大的公共因子,其次是次大者,最后抽取公共因子的特征值最小,通常会接近0。
2.1因子分析数学模型:p i F a F a F a X i m im i i i ,,,, 212211=++++=ε其中,m F F F ,,, 21称为公共因子,i ε为错误!未找到引用源。
的特殊因子,只对相应的i X 起作用.该模型可用矩阵表示为错误!未找到引用源。
,这里⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡=pm p p m m a a a a a a a a a A 212222111211,⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡⋯⋯=p X X X X 21错误!未找到引用源。
,⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡⋯⋯=p F F F F 21,⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡⋯⋯=p εεεε21错误!未找到引用源。
且满足p m <;公共因子之间、特殊因子之间、公共因子与特殊因子之间都是互不相关的.模型中的矩阵A 称为因子载荷矩阵;ij a 称为因子载荷,是第i 个变量在第j 个因子上的负载.2.2因子分析的适用条件:因子分析的目的是简化数据结构或找出基本的数据结构,因此使用因子分析的前提条件是原始数据各个变量之间应有较强的相关关系[3].在做因子分析前首先要检测数据是否适合做因子分析,除对原始数据的相关矩阵进行检验以便分析是否适合进行因子分析外,还可用以下统计量:(1)巴特莱特球体检验(Bartlett test of sphercity ).统计量从检验整个相关矩阵出发,其零假设为相关矩阵为单位矩阵,如果不能拒绝该假设,说明原始数据不适合进行因子分析.(2)KMO 测度(Kaiser-Meyer-Olkin-Measure of Sampling Adequacy).该测度是从比较原始变量之间的简单相关系数和偏相关系数的相对大小出发,其值变化范围从0到1. 当所有变量之间的偏相关系数的平方和远远小于简单相关系数的平方和时,KMO 值接近1.KMO 值较小时,表明原始变量不适合做因子分析.通常按照以下的标准解释该指标值的大小:0.9及以上,非常好;0.8及以上,好;0.7及以上,一般;0.6及以上,差;0.5及以上,很差;0.5以下,不能接受.2.3因子分析步骤: 1.数据标准化: 由于各因素的量纲不同而导致统计结果与实际情况出现偏差是常见现象。
所以,在做分析之前,我们需要通过消除量纲,即数据标准化,再对标准化的数据进行分析。
这样得到的结果就比较接近实际情况了。
标准化后的变量均值为0,方差为1.2.计算因子载荷阵:本文使用主成分分析法求解因子载荷矩阵: a . 计算样本相关系数矩阵 R .b . 求R 的特征根021≥≥≥≥p λλλ 及对应的标准正交化特征向量p b b b ,,,21 .c . 由于因子数目m 应小于原始变量个数p ,所以根据前m 个特征根和对应的特征向量来估计因子载荷矩阵:()m m b b b A λλλ,,,2211 =. 公共因子j F 的方差贡献是该因子在模型中所有负载的平方和,记为:22221pj j j j a a a V +++=由于数据已经被标准化,所以p 个变量的总方差为p , p V j / 表示第j 个公共因子的方差贡献在所有方差中的比例.当提取出的公共因子的累积方差贡献率达到或超过85 %时,就可以用提取的公共因子代表原来的变量来研究问题. 3.旋转并解释因子:初始因子的综合性太强,难以找出因子的实际意义,因此需要通过旋转坐标轴使负载尽可能向±1 ,0 的方向靠近,从而降低因子的综合性 ,使其实际意义凸现出来.正交旋转方法最常用的方法是最大方差旋转法,使得每个变量仅在一 个公共因子有较高的负载,在其余的公共因子上的载荷比较小,直多达到中等大小.因此在后面的分析中采用了这种方法.旋转完成后, 按照负载绝对值的大小,解释公共因子的实际含义[5].4.计算各公共因子得分:在因子分析模型ε+=AF X 中,如果不考虑特殊因子的影响,当p m =且A 可逆时,可以方便地计算X A F 1-=,即因子得分.但因子分析模型在实际应用中要求p m <, 因此不能精确地计算出因子得分,只能对因子得分进行估计Fˆ.估计因子得分常用的方法为汤姆逊回归法,公式为:X R A F1ˆ-'=其中R 为X 的相关系数矩阵,并称矩阵1-'=R A W 为因子得分系数矩阵[5].5.以提取的各公共因子的方差贡献率占提取公共因子的总方差贡献率的比重作为权重,将各公共因子得分进行加权汇总,计算各样本的综合得分.3. 基于工业企业主要经济效益指标的分析1.选取2009年中国统计年鉴中的“按行业分规模以上工业企业主要经济效益指标”,对不同工业企业进行分析。
利用SPSS 软件,对数据进行处理和分析,得到下面的结果。
2.对数据进行标准化处理,处理后的数据为:…… …… …… …… …… ……标准化后的变量均值为0,方差为1.3.对数据进行Bartlett 检验和KMO 检验,结果见下图:KMO and Bartlett's Test aKaiser-Meyer-Olkin Measure of Sampling Adequacy. .580 Bartlett's Test of SphericityApprox. Chi-Square 65.162df 10 Sig..000a. Based on correlations从上图我们可以看出,KMO的测度值为0.58,Bartlett球体检验的P 值为0.000,基本可以认为该数据对因子分析适用.4.计算特征根和方差贡献率Total Variance ExplainedComponent Initial Eigenvalues Extraction Sums of Squared LoadingsTotal% ofVariance Cumulative % Total% ofVariance Cumulative %1 2.362 47.234 47.234 2.362 47.234 47.2342 1.143 22.859 70.093 1.143 22.859 70.0933 1.006 20.127 90.220 1.006 20.127 90.2204 .277 5.540 95.7605 .212 4.240 100.000由以上特征根与方差贡献率表可以看出:提取三个因子累计方差率超过87.5%,这时已经将原数据中的大部分信息提取出来,因此我们选取三个公因子。
5.公因子命名通过最大方差法旋转,得到旋转后的因子载荷矩阵如下:Rotated Component Matrix aComponent1 2 3Zscore(总资产贡献率) .895 .123 .145Zscore: 资产-.907 .222 -.073Zscore(流动资产周转次数) .011 -.008 .987Zscore(工业成本费用利润) .852 .198 -.277Zscore(产品销售率) .038 .989 -.010Extraction Method: Principal Component Analysis.Rotation Method: Varimax with Kaiser Normalization.a. Rotation converged in 4 iterations.在上图中,我们可以看到因子1在总资产贡献率和工业成本费用利润上有较大载荷阵。
这两个经济因素可以用来衡量工业企业的利润所得,所以把该因子命名为利润因子。
因子2在资产(负债率)和产品销售率上有较大载荷阵。
这个两个因素用来说明企业的产品和资产的运转能力,所以命名为运转因子。
因子3在流动资产周转次数上有较大载荷阵,而周转次数越多,说明企业的流通性越好,所以把该因子命名为流通性因子。
6.因子得分以及排名由软件得到的因子得分系数矩阵为:Component Score Coefficient MatrixComponent1 2 3Zscore(总资产贡献率) .379 .083 .150Zscore: 资产-.399 .244 -.062Zscore(流动资产周转次数) .014 .051 .920Zscore(工业成本费用利润) .353 .130 -.238Zscore(产品销售率) -.028 .920 .051Extraction Method: Principal Component Analysis.Rotation Method: Varimax with Kaiser Normalization.Component Scores.根据上表得到旋转后的因子得分表达式为:F1=0.379x1−0.399x2+0.014x3+0.353x4−0.028x5F2=0.083x1+0.244x2+0.051x3+0.130x4+0.920x5F3=0.150x1−0.062x2+0.920x3−0.238x4+0.051x5根据以上因子表达式可以计算出我国各行业工业企业各公因子上的得分及排名,以提取的各公共因子的方差贡献率占提取公共因子的总方差贡献率的比重作为权重,将各公共因子得分进行加权汇总,作为样本的综合得分.F=λ1λi5i=1F1+λ2λi5i=1F2+λ3λi5i=1F3得分及排名如下:行业F1 因子1排名F2因子2排名F3因子3排名F 综合排名煤炭开采和洗选业0.09228 13 0.198 13 -0.88386 37 -8.90429 19 石油和天然气开采业 1.84951 2 1.87851 3 -0.63778 31 117.4647 2 黑色金属矿采选业0.71586 4 -2.58198 39 -0.49465 27 -35.1637 34 有色金属矿采选业0.79122 3 -1.35666 37 -0.12345 21 3.876333 12 非金属矿采选业0.65595 6 -0.9701 35 0.78925 6 24.69288 6 其他采矿业0.40928 8 -0.54579 32 4.69705 1 101.3918 3 农副食品加工业-0.0558 16 0.13206 17 1.15664 4 23.66236 7 食品制造业0.32429 10 -0.17073 22 0.25188 9 16.48441 8 饮料制造业0.52089 7 -0.49449 31 -0.32005 26 6.858848 10 烟草制品业 4.83192 1 1.74935 4 -0.65834 32 254.9705 1 纺织业-0.47704 29 0.14883 16 0.04031 13 -18.3193 24 纺织服装、鞋、帽制造业0.03048 14 -0.49128 30 0.20241 10 -5.71659 17 皮革、毛皮、羽毛(绒)及其制品业0.1381 12 -0.19725 23 0.41049 7 10.27593 9 木材加工及木、竹、藤、棕、0.39425 9 -0.44145 28 1.17953 3 32.27105 5 家具制造业-0.15678 20 0.1907 14 0.1746 11 0.46791 14 造纸及纸制品业-0.47804 30 0.42025 9 -0.23448 25 -17.6927 23 印刷业和记录媒介的复制0.19677 11 -0.33163 27 -0.51601 28 -8.67195 18 文教体育用品制造业-0.20194 22 0.17053 15 0.12093 12 -3.20645 16 石油加工、炼焦及核燃料加工业-0.03405 15 1.29968 5 1.48942 2 58.07797 4化学原料及化学制品制造业-0.3263 26 -0.21089 24 -0.03572 18 -20.9522 25 医药制造业 0.71001 5 -2.30275 38 -0.76191 34 -34.4362 33 化学纤维制造业 -0.85318 35 1.02639 7 -0.21678 23 -21.2003 26 橡胶制品业 -0.19465 21 0.43739 8 0.03352 14 1.478744 13 塑料制品业 -0.20298 23 -0.29244 26 -0.06899 19 -17.661 22 非金属矿物制品业 -0.06165 17 0.0152 19 0.00308 16 -2.50255 15 黑色金属冶炼及压延加工业 -1.09349 38 0.28851 10 -0.07088 20 -46.4818 37 有色金属冶炼及压延加工业-0.70196 32 -0.00751 20 -0.00051 17 -33.3385 31 金属制品业 -0.30774 24 -0.60037 33 -0.18706 22 -32.0246 30 通用设备制造业 -0.38142 27 -0.04913 21 -0.58786 30 -30.9708 29 专用设备制造业 -0.4449 28 -0.23166 25 -0.8212 35 -42.838 36 交通运输设备制造业 -0.58387 31 0.24361 12 -0.7253 33 -36.6079 35 电气机械及器材制造业 -0.32103 25 -1.16545 36 -0.5539 29 -52.9527 38 通信设备、计算机及其他 -0.7385 33 0.24529 11 -0.22794 24 -33.8631 32 仪器仪表及文化、办公用 -0.12992 19 0.04827 18 -0.85275 36 -22.1963 27 工艺品及其他制造业 -0.06878 18 -0.48921 29 0.01808 15 -14.0677 21 废弃资源和废旧材料回收加工业 -0.9822 37 1.19755 6 0.27335 8 -13.5172 20 电力、热力的生产和供应业-1.22224 39 2.05159 1 0.84127 5 6.097384 11 燃气生产和供应业 -0.86893 36 1.92666 2 -1.32145 38 -23.5983 28 水的生产和供应业-0.7734334-0.7375734-1.3809539-81.186439上表显示了详细的各因子在不同工业行业中的得分及排名,还有综合得分和排名。