多元统计分析课程毕业论文

  • 格式:docx
  • 大小:169.44 KB
  • 文档页数:12

下载文档原格式

  / 12
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

四川理工学院

《多元统计分析课程设计》报告

题目: 中国国有控股工业行业的经济效益评价

学生:雷鹏程何君李西京

曾学成白俊明

专业:统计学

指导教师:柏宏斌

四川理工学院理学院

二零一四年十二月

中国国有控股工业行业的经济效益评价

摘要

本文主要研究了中国国有控股工业行业的经济效益,对反映行业经济效益的总资产贡献率、资产负债率、流动资产周转次数、工业成本费用利润率和产品销售率等五个经济指标进行主成分分析,提取反映行业盈利能力和市场能力的两个综合指标。然后通过因子分析法分析反映经济效益的各指标的内部结构,表明行业经济效益主要由盈利能力和市场能力两个公因子决定。根据各行业在盈利能力上的得分和市场能力上的得分将工业行业分为五类,并对各行业经济效益进行综合评价。然后用聚类分析对综合评价结果进行验证,表明综合评价较为客观合理。最后,本文给出相应的政策建议。

关键字:主成分分析、因子分析、聚类分析。

一、引言

改革开放以来,工业始终是我国经济发展的主要支柱。作为社会主义国家,我国国有及国有控股工业行业掌控着国家工业发展命脉,对国民经济、社会协调发展具有巨大推动作用。因此,考核工业行业的经济效益,对挖掘重点行业和弱势行业,提高整个国有工业企业的经济效益等具有重大的现实意义。企业或行业的经济效益由众多因素来刻

画,目前反映行业经济效益主要有总资产贡献率、资产负债率、流动资产周转次数、工业成本费用利润率和产品销售率等五个经济指标1。这些众多指标虽然能从多方面对行业的经济效益进行全面考察,但也在一定程度增加了分析问题的复杂性。在损失少量信息的前提下,设计一个或少数几个综合指标,并用较少的综合指标对工业经济效益进行分析评价,能够简化问题。此外,挖掘出反映经济效益的众多指标的内在基本结构,有助于指出各行业经济效益的主要决定因素及瓶颈,也有助于对各行业经济效益进行综合评价。

二、文献综述

大量国内文献从灰色系统理论、多元统计分析方法、层次分析法、模糊综合评判法、

数据包络分析法等理论与方法,考察了中国各行业、企业或地区经济效益的研究与综合评价。华中生、梁梁等用模糊聚类方法与数据包络分析分类法考察了合肥工业行业的经济状况,将各工业行业按经济效益的状况分为高、较高、一般、较差和差等五类[1](华中生、梁梁,1995)。王树岭等人利用TOPSIS 模型,对吉林省轻工业17个主要行业的经济效益进行了综合评价与排序,确定出相应的优势行业(王树岭等,1999)。本文以2008年国有及国有控股的主要工业行业为研究对象,通过主成分分析和因子分析法,再次对各工业行业的经济效益进行分析与评价,并结合聚类分析法来验证综合评价的结果。

三、数据来源

反映经济效益的指标较多,不同文献中选取的指标不尽相同。本文采用国家统计局最新公布的五个指标:总资产贡献率、资产负债率、流动资产周转次数、工业成本费用利润率和产品销售率,分别记为1X 至5X 。总资产贡献率(1X )反映企业全部资产的获利能力。资产负债率(2X )既反映企业经营风险的大小,也反映企业利用债权人提供的资金从事经营活动的能力。流动资产周转次数(3X )反映投入工业企业流动资金的周转速度。成本费用利润率(4X )反映企业投入的生产成本及费用的经济效益。产品销售率(5X )反映工业产品已实现销售的程度。选取39个主要工业行业的数据整理如附录表1所示。

四、模型基本理论建立

主成分分析的基本理论

设对某一事物的研究涉及p 个指标,分别用1X ,2X ,…, P X 表示,这p 个指标构成的p 维随机向量为),,(21'=P X X X X 。设随机向量X 的均值为μ,协方差矩阵为∑。

对X 进行线性变换,可以形成新的综合变量,用Y 表示,也就是说,新的综合向量

1

《国家统计年鉴2009年》用这五大指标来反映工业行业的经济效益。

可以由原来的变量线性表示,即满足下式:

由于可以任意地对原始变量进行上述线性变换,由不同的线性变换得到综合变量Y

的统计特征也不尽相同。因此为了取得较好的效果,我们总希望X u Y i i '

=的方差尽可能

大且各i Y 之间相互独立,由于 i i i i u u X u Y ∑'

='=)var()var(,面对任意常数c ,有

i i i u u c X cu ∑'

='2)var(

因此对i u 不加限制时,可以使)var(i Y 任意增大,问题将变得没有意义。我们将线性变换约束在下面的原则之下:

(1)1='

i i u u (p i ,,2,1 =)。

(2)i Y 与j Y 相互无关。(j i ≠;p j i ,,2,1, =)

(3)1Y 是1X ,2X ,…, P X 的所有线性组合中方差最大者;2Y 是与1Y 不相关的1X ,

2X ,…, P X 的所有线性组合中方差最大者;…,p Y 是与1Y ,2Y ,…,1-p Y 不相关的1X ,2X ,…, P X 的所有线性组合中方差最大者。

基于以上这三条原则决定综合变量1Y ,2Y ,…,p Y 分别称为原始变量的第一,第二……

第p 个主成分。其中,各综合变量在总方差所占比重依次递减。在实际研究工作中,通常指挑选前几个方差较大的主成分,从而达到简化系统结构,抓住问题实质的目的。

因子分析的基本理论

设有n 个样品,每个样品观测p 个指标,这些p 个指标之间有较强的相关性。为了方便研究,并消除由观测量纲的差异及数量级不同所造成的影响,将样本的观测数据进行标准化处理,使标准化的变量均值为0,方差为1。为方便,把原始变量及标准后的变量向量均用X 表示,用1F ,2F ,…, m F (m

(X cov =∑ ,且协方差矩阵∑与相关阵R 相等; (2) ),,,(21'=M F F F F (m

I F =)cov(,即向量F 的各分量是相互独立的;

(3) ),,,(21'=P εεεε 与F 相互独立,且0)(=εE ,ε的协方差矩阵ε∑是对角方阵:

εε∑=)cov(=⎥⎥⎥⎥⎦

⎤⎢

⎢⎢

⎢⎣

⎡2222

2

11

pp δδδ 即ε的各分量之间也是相互独立的,则模型: