《统计学》-第10章-习题答案

  • 格式:docx
  • 大小:29.58 KB
  • 文档页数:8

下载文档原格式

  / 8
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1•收集我国31个省(区、市)2007年反映经济发展情况的八项指标的数据,具体采用的指标包括:地区生产总值、工业总产值、固定资产投资、职工平均工资、居民消费水平、货物周转量、居民消费价格指数、商品零售价格指数。并对这八项指标利用主成分分析法进行降维。

数据请见2012ChinaEcoDevp.asv。该数据是2012年我国31个省(区、市)地区生产总值(亿元)、大中型工业资产总值(亿元)、按登记注册类型分全社会固定资产投资(亿元

)、镇私营单位就业人员平均工资(元)、居民消费水平(元)、货物周转量(亿吨公里)、居民消费价格指数、商品零售价格指数这八项指标。

SPSS各选项操作是按照课本中的步骤,此处省。

得到的相关系数矩阵见表1,从表中的数据来看,变量之间存在着较大的相关性,最大的值能达到0.965,所以对该组数据进行主成分分析时有意义的。

表一相关矩阵

按登记

注册类镇私营

地区居

地区生型分全单位就货物周居民消商品零

地区居民消费民消费

水平产总值社会固业人员转量(亿费价格售价格

水平(亿元)定资产平均工吨公里)指数指数

(元)

投资(亿资(元)

(元)

元)

地区居民消费

水平(元)

1.000 .374 .074 .721 .595 1.000 .374 .074 地区居民消费

水平(元)

.374 1.000 .879 .340 .575 .374 1.000 .879 地区居民消费

水平(元)

.074 .879 1.000 .120 .504 .074 .879 1.000 地区居民消费

水平(元)

.721 .340 .120 1.000 .216 .721 .340 .120 地区居民消费

水平(元)

.595 .575 .504 .216 1.000 .595 .575 .504 地区居民消费

水平(元)

.044 -.311 -.389 .090 -.229 .044 -.311 -.389 地区居民消费

水平(元)

-.417 -.112 .007 -.313 -.072 -.417 -.112 .007 地区居民消费

水平(元)

.449 .965 .826 .407 .580 .449 .965 .826

表2是SPSS俞出的一项表格,称为“解释的总方差”。表中的第二列是各个主成分对应的特征值,第三列是各主成分对解释原始变量总方差的贡献率,第四列是时方差的累积贡献率。按照“特征值大于1”的原则,SPSS提取了三个主成分,即表中的前三个主成分。这三

个成分共解释原始变量总方差的84.562%。其中特征值的大小也可以在碎石图(图1)中可

以看出。

表2解释的总方差

成份初始特征值提取平方和载入旋转平方和载入合计方差的% 累积% 合计方差的% 累积% 合计方差的% 累积%

1 3.797 47.458 47.458 3.797 47.458 47.458 3.23

2 40.398 40.398

2 1.682 21.028 68.486 1.682 21.028 68.486 2.099 26.235 66.633

3 1.286 16.076 84.562 1.286 16.076 84.562 1.43

4 17.929 84.562

4 .686 8.580 93.142

5 .324 4.053 97.195

6 .141 1.75

7 98.951

7 .056 .705 99.656

8 .027 .344 100.000

图1碎石图

•1-

主成份的系数并不能直接从 SPSS 的输出结果中找到。根据因子分析与主成份分析的关

系,主成份的系数可以由成份矩阵除以相应的特征值的平方根得到,见表 4。SPSS 输出的成

份矩阵见表3,而相应的特征值已经在表 2中 给出。

表3成份矩阵

提取方法:主成份。

a.已提取了 3个成份。

表4成份系数矩阵

地区居民消费水平(元) 地区生产总值(亿元) 按登记注册类型分全社会固 定资产投资(亿元) 镇私营单位就

业人员平均工 资(元) 货物周转量(亿吨公里) 居民消费价格指数

商品零售价格指数 大中型工业资

产(亿元)

第一主成份中,地区生产总值、固定资产投资值,货物周转量的系数及大中型工业资产比较大,可以 看成是影响一个地区经济发展的生产能力指标;第二主成份中,居民消费水平、平均工资的系数比较大, 那么第二主成份可以看成是影响一个地区经济发展的消费情况;第三主成份主要反映了消费价格指数和商 品零

售价格指数。

则第一主成份=0.3218*地区居民消费水平 +0.4373*地区生产总值+0.4049*按登记注册 类型分全社会固定资产投资 +0.2684*镇私营单位就业人员平均工资 +0.3787*货物周转量-0.1945 *

居民消费价格指数 -0.1611* 商品零售价格指数 +0.4783* 大中型工业资产 ;第二主成份和第三主

成份的 表达式类似。

在计算主成份得分时,要注意对原始的八个变量进行标准化后再代入到上述公式中。

2.对第1题的数据进行因子分析,解释分析结果的经济意义,并比较主成分分析和因子分析的结果。

在进行数据降维的因子分析模块中,因子提取的方法是主成份法,因子载荷矩阵旋转采

用的是最大方差法。表5的“公因子方差”表显示了各个变量的共同度。从表中可以看出,除了"货物周转量”变量外其他变量的共同度都比较高。

表5公因子方差

提取方法:主成份分析

对于因子分析,因子进行了旋转,其旋转之后的方差贡献率见表2的第8-10列。从表中可以看出,经过旋转的因子其方差贡献率发生了改变。但是累积方差贡献率没有变化,这表明旋转后的因子并未对原始数据产生更多的解释,但是旋转后的成份矩阵其值更接近于1或者0。旋转前的成份矩阵见表6,旋转后的成份见表7.

表6成份矩阵

成份矩阵

提取方法:主成份。

a.已提取了3个成份。