当前位置:文档之家› 基于主成分分析的我国城镇居民生活消费支出的研究

基于主成分分析的我国城镇居民生活消费支出的研究

基于主成分分析的我国城镇居民生活消费支出的研究
基于主成分分析的我国城镇居民生活消费支出的研究

基于主成分分析的我国城镇居民生活消费支出的研究

陈忠磊,吴川东,杨礼锚,邓雍,黄廷朗

(20122211012011,62,49,47,12)

摘要:我国城镇居民的消费性支出在逐步提高的同时,不同地区之间的消费水平和支出结构仍存在较大差异。全国各地的城镇居民生活消费的分布规律可以反映近年来在城镇化进行中各地居民的生活水平情况,通过选取相关的消费性支出指标,利用SPSS软件,对2012年我国31个省、市、自治区城镇居民家庭平均每人全年消费性支出的分布规律进行聚类分析和主成分分析,并进行了主成分得分综合排序,找出各地区城镇居民在消费性支出方面存在的差异,并提出相应缩小差异的建议。

关键词:消费性支出;聚类分析;主成分分析;综合评价

近年来,随着我国经济的快速发展,城镇居民的收入不断增加,并且在国家连续出台住房、教育、医疗等各项改革措施和实施“刺激消费、扩大内需、拉动经济增长”经济政策的影响下,我国各地区城镇居民的消费支出也强劲增长,消费结构发生了巨大的变化,结构不合理现象也得到了一定程度的调整。但是,由于各地区的经济发展不平衡及原有经济基础的差异,人民收入水平不同,各地区城镇间的消费性支出结构仍存在着明显差别。为了进一步改善消费结构,正确引导消费,缩小消费性支出的地区差异,提高我国城市居民的消费水平和生活质量,有必要考察我国各地区城镇居民的消费性支出结构之间的异同并进行考察及系统分析研究,以期发现特点和规律,从宏观上把握各地区城镇居民的消费现状和不同地区消费水平的差异,为提高我国各地区消费水平和谐增长提供决策依据。因此客观、准确、有效地分析这些地区差异具有重要的理论和实践指导意义。

为了研究全国各地区城镇居民人均年消费性支出的差异性和相似性,本文选取了全国31个省市自治区的相关数据,基于聚类分析、主成分分析等多元统计分析方法,运用SPSS 软件进行研究。

1主成分分析模型

主成分分析是将多指标化为少数几个综合指标的一种统计方法,是由Pearson提出,后来被Hotelling发展起来的。主成分分析是将数据通过降维技术把多个变量化为少数几个主成分的方法,同时这些变量要尽可能多的表征原变量的数据结构特征而不丢失信息,它们通常表示为原始变量的线性组合。通过主成分分析,可以从事物错综复杂的关系中找出一些主要成分,从而能有效利用大量统计数据进行定量分析,揭示变量之间的内在关系,得到一些对事物特征及发展规律的深层次的启发,把研究工作引向深入。其基本思想是:设法将原来众多具有一定相关性的指标,重新组合成一组新的相互无关的综合指标,并代替原来的指标。利用它们可进行简洁、有效的分析研究,甚至还可借助于图形作直观的分析。主成分分析的基本步骤如下:

设有n个地区,p个消费性支出指标,则数据矩阵为X=(X ij):n×p,其中X ij为第i个地区的第j个消费性支出指标。

(1)各指标数值的大小相差较大(X1值较大,而X4,X5,X7和X8值较小),如果直接使用主成分分析方法,则主成分会过于照顾数值较大的指标(如X1),而对数值较小的指标却照顾不够。为使主成分分析能够均等地对待每一个指标,消除由于数值大小的差异而可能带来的一些不

利影响,需对各指标作标准化处理。即令:

ij *j

ij j

X X X S -=

其中 j X 为第j 个消费性支出指标的样本均值,j S 为第j 个消费性支出指标的样本标准差,j=1, … ,p;i=1,… ,n 。指标X 1,… ,X p 经标准化后,记为*1X ,… ,*p X 。

(2)求出*1X ,… ,*p X 的协方差矩阵,也就是X 1,… ,*p X 的相关矩阵R 。

(3)求R 的特征值及相应的一组正交单位特征向量。

(4)计算累计贡献率,确定主成分个数,使累计贡献率达到一个较高的百分比。给出所使用主成分的符合实际意义的解释。

(5)计算n 个地区的主成分得分,然后根据得分对各地区的消费性支出情况作比较分析[1]。

2 指标的选取

本文以2012年我国各地区城镇居民家庭平均每人全年消费性支出为例,2012年的31个省市的城镇居民家庭人均消费性支出统计中具有代表性的八大指标:食品支出(X1)、衣着支出(X2)、家庭设备用品及服务支出(X3)、医疗保健支出(X4)、交通和通讯支出(X5)、娱乐教育文化服务支出(X6)、居住支出(X7)、杂项商品和服务支出(X8),对我国31个省、直辖市、自治区(除台湾、港澳外)的城镇居民消费结构进行分析,以综合反映和评价各地区城镇居民家庭人均消费性支出。消费结构指居民在生活消费过程中,不同类型消费的比例及其相互之间的配合、替代、制约的关系。就其数量关系来看,消费结构是指在消费过程中不同商品或劳务消费支出占居民总消费支出的比重,反映了一定社会经济条件下人们对各类商品及劳务的需求结构,体现一国或各地区的经济发展水平和居民生活状况。

3 实证分析

3.1数据来源

按照上述的分析,以省为单位,每个省作为一个地区,根据实际情况,选取全国31个省份,运用主成分分析法进行地区消费性支出的实证分析,选取的指标和原始数据均来自统计局资料。根据 2013 年中国统计年鉴, 得到 2012年我国各地区城镇居民人均消费性支出的原始数据资料如附表所示[2]。

3.2对数据标准化,求相关系数矩阵的特征值以及贡献率

按照主成分分析的步骤,在计算机上运用 SPSS16软件,对原始数据进行标准化处理, 以消除量纲的影响,再对标准化后的数据进行降维处理。利用标准化后的数据, 作主成分分析。程序运行结果得到KMO 抽样适度测度值: Over —allMSA=0.796, 大于 0.5, 一般认为此值越大, 做主成分分析的效果越好[3]。经分析得到指标间的相关系数矩阵的特征值和特征值的方差贡献率及其累计方差贡献率如表1所示。

从表1可知,根据特征值大于1的提取方法,变量相关系数矩阵有两个特征值:5.752、1.060,这两个特征值一起解释了变量 X 标准方差的85. 162%(累计贡献率)。这样,对于此项研究的绝大部分要求,前两个因子(不妨设为 f1和 f2)提供了原始数据所能表达出的足够的信息。因此,主成分分析过程相应提取两个主成分:f1、f2。

表1 累计方差贡献率Total Variance Explained

Com pone nt

Initial Eigenvalues

Extraction Sums of Squared

Loadings

Rotation Sums of Squared

Loadings

Total

% of

Variance

Cumulativ

e % Total

% of

Variance

Cumulativ

e % Total

% of

Variance

Cumulativ

e %

1 5.75

2 71.906 71.906 5.752 71.906 71.906 4.835 60.442 60.442

2 1.060 13.255 85.161 1.060 13.255 85.161 1.978 24.719 85.161

3 .59

4 7.419 92.580

4 .219 2.739 95.319

5 .17

6 2.196 97.516

6 .120 1.501 99.016

7 .061 .760 99.777

8 .018 .223 100.000

Extraction Method: Principal Component Analysis.

3.3因子载荷阵以及特征向量矩阵

对提取的两个公共因子 f1、f2,建立原始因子载荷矩阵,同时,为便于对各因子载荷作合理解释,对其进行旋转使其结构简单化。表2即为旋转后的因子载荷阵。

表2 旋转后的因子载荷阵

Rotated Component Matrix a

Component

1 2

X1 .940 .303

X2 .261 .858

X3 .772 .305

X4 .883 .247

X5 .945 .146

X6 .904 .286

X7 .242 .883

X8 .858 .336

Extraction Method: Principal Component Analysis.

Rotation Method: Varimax with Kaiser Normalization.

a. Rotation converged in 3 iterations.

由表2可以看出,第一主成分f1在指标X1, X3, X4,X5, X6, X8上载荷值都很大, 分别为食品、居住、家庭设备用品及服务、交通和通信、教育文化娱乐服务、居住、杂项商品及服务,

因此可定义为基本生活消费因子; f2在指标X2,X7上载荷值大, 可定义为质量型消费因子。综合可以看出, 消费支出的多少主要取决于第一个公因子。

设T1为变量名第二特征向量,T2为变量名第二特征向量。通过SPSS软件,求得特征向量矩阵如表3所示

表3 特征向量矩阵

特征向量T1 T2

X1 0.3919 0.2943

X2 0.1088 0.8334

X3 0.3219 0.2962

X4 0.3682 0.2399

X5 0.3940 0.1418

X6 0.3769 0.2778

X7 0.1009 0.8576

X8 0.3577 0.3264

3.4得分函数模型及各地区因子得分值

根据上述矩阵,则所提取的两个主成分可表示为:

f1=0.3919*ZX1+0.1088*ZX2+0.3219*ZX3+0.3682*ZX4+0.3940*ZX5+0.3769*ZX6+0.1009*Z X7+0.3577*ZX8

f2=0.2943*ZX1+0.8334*ZX2+0.2962*ZX3+0.2399*ZX4+0.1418*ZX5+0.2778*ZX6+0.8576*Z X7+0.3264*ZX8

将各个地区具体的经过标准化后的原始指标值代入得分函数模型, 可以计算得到各地区的主成分得分值。主成分得分值的大小显示了各地区城镇居民在该因子所代表的各项指标上的消费水平高低, 小于零表明其处于平均水平之下。

以各主成分的贡献率占两个主成分的累计贡献率的比重作为权重进行加权汇总,计算各地区的综合测评得分,计算公式如下:Fi= 0. 68f1i+ 0. 32f2i,(i = 1,2,...,31),其中,Fi(i = 1,2,...,31) 为各地区消费支出情况总得分;fji的系数为各主成分的信息贡献率,它是各主成分的方差贡献率与两个主成分的累计贡献率的比值,通过计算得出综合得分F。然后通过比较各地区综合得分的高低,可排出2012年各地区城镇居民消费性支出水平的高低如表4。

表4 各地区综合得分排名

地区f1 f2 F 综合排名

北京 5.15 7.28 5.48 2

天津 2.31 3.47 2.49 5

河北-1.41 -1.44 -1.41 23

山西-1.43 -1.90 -1.50 24

内蒙古 1.50 3.89 1.88 6

辽宁0.55 1.74 0.73 9

吉林-0.28 1.66 0.02 11

黑龙江-1.52 -0.54 -1.37 22

上海 6.03 4.81 5.84 1

江苏 1.64 1.42 1.60 7

浙江 2.80 3.00 2.83 4

安徽-0.69 -0.61 -0.68 14

福建 1.51 -0.05 1.26 8

江西-1.76 -3.02 -1.95 29

山东0.37 0.95 0.46 10

河南-0.80 -0.26 -0.72 16

湖北-1.13 -0.82 -1.08 20

湖南-0.74 -1.29 -0.82 18

广东 3.76 2.10 3.50 3

广西-0.81 -2.38 -1.05 19

海南-1.34 -2.90 -1.58 26

重庆-0.20 0.87 -0.03 12

四川-0.57 -1.50 -0.71 15

贵州-2.07 -3.55 -2.30 30

云南-1.82 -1.83 -1.82 27

西藏-3.35 -5.01 -3.61 31

陕西-0.29 0.36 -0.19 13

甘肃-1.54 -1.35 -1.51 25

青海-1.82 -2.26 -1.89 28

宁夏-0.81 -0.39 -0.75 17

新疆-1.24 -0.46 -1.12 21

3.5聚类分析

根据原始数据, 应用软件SPSS16,采用欧氏距离平方和离差平方和法,对我国31个地区的城镇居民消费结构进行聚类分析,谱系图输出结果如图1所示。

图1 2012年我国城镇居民消费结构聚类分析树形图

从图1可以看出,可选择分类数为3,则得到以下分类结果,如表5所示。

表5 2012年我国城镇居民消费结构分类类别地区

第一类北京、上海、浙江、广东

第二类江苏、福建、天津、内蒙古、辽宁、山东、重庆

第三类黑龙江、甘肃、河北、青海、山西、江西、贵州、西藏、河南、新疆、云南、宁夏、广西、海南、吉林、湖北、安徽、陕西、湖南、四川

4结果分析

由表4的得分及排序结果来进行分析,首先,从反映食品、居住、家庭设备用品及服务、交通和通信、教育文化娱乐服务、其他商品和服务的基本生活消费因子 f1来说,我国31个地区综合消费水平发展极不平衡,得分最高的上海与得分最低的西藏相差9.38分,这与我国各地区整体经济发展水平不同步的实际情况相符合。且除了上海、北京、广东、浙江、天津、江苏、福建、内蒙古、辽宁、山东11个地区的得分大于零,其余三分之二的地区得分都小于零,这说明我国大部分地区城镇居民的基本生活消费水平仍处于全国平均水平之

下,有待进一步提高。其次,从质量型消费因子 f2的得分来看,各地区的排序变化相对 f1比较大,这与各地区城镇居民的消费观念、所处地理位置和条件以及民族习惯等因素有很大关系。

从表5聚类分析的结果可以看出,,我国各类地区城镇居民消费结构的相似性效果较好,且不同类型地区的消费结构有着各自的特点。第一类中的北京、上海、浙江、广东等地区的医疗保健支出、交通和通讯支出、娱乐教育文化服务支出、居住支出等方面都远远高出全国平均水平,综合来看,第一类地区经济较发达,各方面的消费能力都较高。对全国来说,各地区娱乐教育文化服务比重近年来呈现逐渐上升的趋势,这说明国家及各地区对教育的重视程度均有显著提高,并已逐步落实到行为中,初见成效。第二类地区中的样本数量较多,情况较为复杂。其中天津、江苏等地区经济一直较为发达,而福建、内蒙古、辽宁、山东、重庆等地区虽经济发展处于中等水平,但近年来在医疗保健和教育文化娱乐等方面的支出比例明显增大,说明其居民消费结构逐渐合理化,已与很多经济发达地区趋同。第三类地区中,医疗保健支出、娱乐教育文化服务支出、居住支出等指标都基本上低于全国平均水平,这些地区的医疗制度和文化事业的发展的确应该引起国家及地方政府的充分重视,大力提高居民健康水平和生活质量。

综上,各地区综合得分的排序与聚类分析所得结果基本上没有差异,从一定程度上说明所做的分析是正确的和经得起检验的,与各地区的实际经济情况也是相符合的。排名前四位的上海、北京、广东、浙江其经济实力在全国遥遥领先,其消费性支出的综合测评得分远远高出其他地区。这与这些地区均衡的消费结构构成也有很大关系。

5结语

我国各地区城镇居民的消费结构差异很大, 消费性支出水平发展很不平衡。虽然我国城镇居民的人均实际消费性支出的数量在增加, 从一定程度上说明我国城镇居民生活水平的提高, 但各地区之间消费水平的差异很大, 除了北京、上海、浙江等经济比较发达的地区的各因子得分排名均比较稳定, 因而消费结构相对比较平衡外, 很多地区的消费水平和消费结构都有待进一步提高。分析研究各地区城镇居民消费性支出的不同特点,对国家的宏观经济调控和更好地落实扩大内需政策是非常有益的,它有助于政府有的放矢地制定出更合理的政策和减少政策在制定和执行中的盲目性,对我国国民经济的健康发展具有重要意义。

参考文献:

[1]王学民,我国各地区城镇居民消费性支出的分析研究[A].财经研究出版社,2002(1)64-69.

[2]中国统计局.中国统计年鉴( 2013) [M].北京: 中国统计出版社, 2013.

[3]余明江,季丽,胡云霞.我国城镇居民消费性支出的因子分析[B].安徽工业大学学报,2008(4):221-225.

地区X1 X2 X3 X4 X5 X6 X7 X8

北京24045.86 2638.90 1970.94 1610.70 3781.51 3695.98 1658.37 1154.18 天津20024.24 1881.43 1854.22 1151.16 3083.37 2254.22 1556.35 899.87 河北12531.12 1541.99 1502.41 876.10 1723.75 1203.80 1047.28 424.63 山西12211.53 1529.47 1438.88 832.52 1672.29 1506.20 905.88 470.72 内蒙古17717.10 2730.23 1583.56 1242.64 2572.93 1971.78 1354.09 798.68 辽宁16593.60 2042.40 1433.28 1069.65 2323.29 1843.89 1309.62 762.07 吉林14613.53 2044.80 1594.14 871.46 1780.67 1642.70 1447.50 597.00 黑龙江12983.55 1806.92 1336.85 742.22 1462.61 1216.56 1180.67 550.51 上海26253.47 2111.17 1790.48 1906.49 4563.80 3723.74 1016.65 1485.53 江苏18825.28 1915.97 1437.08 1288.42 2689.51 3077.76 1058.11 700.06 浙江21545.18 2109.58 1551.69 1161.39 4133.50 2996.59 1228.02 812.39 安徽15011.66 1540.66 1396.97 811.23 1809.72 1932.74 1142.96 562.44 福建18593.21 1634.21 1753.86 1254.71 2961.78 2104.83 773.22 793.17 江西12775.65 1476.63 1173.91 966.23 1501.34 1487.30 670.71 427.93 山东15778.24 2196.98 1572.35 1125.99 2370.23 1655.91 1005.25 650.21 河南13732.96 1885.99 1190.81 1145.42 1730.35 1525.33 1085.47 562.13 湖北14495.97 1783.41 1371.15 978.26 1476.98 1651.92 1029.55 366.78 湖南14608.95 1624.57 1301.60 1034.30 2084.15 1737.64 918.41 466.65 广东22396.35 1520.59 2099.75 1467.20 4176.66 2954.13 1048.28 871.30 广西14243.98 1146.46 1377.26 1125.39 2088.64 1626.05 883.56 444.06 海南14456.55 864.96 1521.04 777.20 2004.34 1319.54 993.24 420.13 重庆16573.14 2228.76 1177.02 1196.03 1903.24 1470.64 1101.56 625.66 四川15049.54 1651.14 1284.09 1097.93 1946.72 1587.43 772.75 635.62 贵州12585.70 1399.00 1013.53 849.94 1891.03 1396.00 654.53 388.82 云南13883.93 1759.89 973.76 634.09 2264.23 1434.30 939.13 410.35 西藏11184.33 1361.57 845.18 474.69 1387.45 550.48 467.23 580.05 陕西15332.84 1789.06 1322.22 986.82 1788.38 2078.52 1212.44 604.69 甘肃12847.05 1631.40 1287.93 833.15 1575.67 1388.21 1049.65 478.72 青海12346.29 1512.24 1232.39 923.70 1549.76 1097.21 906.14 457.51 宁夏14067.15 1875.70 1193.37 929.01 2110.41 1515.91 1063.09 610.74 新疆13891.72 2031.14 1166.59 950.17 1660.27 1280.81 1027.60 536.24 附表2012年我国各地区城镇居民人均消费性支出资料(元)

各参数含义X1:人均食品支出;X2:人均衣着商品支出;X3:人均居住支出;X4:人均

家庭设备用品及服务支出;X5:人均交通和通信支出;X6:人均文教娱乐支出;X7:人均

医疗保健支出;X8:人均杂项商品和服务支出。

SPSS主成分分析操作步骤,详细的很啊^_^==

SPSS主成分分析操作步骤,详细的很啊^_^ SPSS在调用Factor Analyze过程进行分析时,SPSS会自动对原始数据进行标准化处理,所以在得到计算结果后指的变量都是指经过标准化处理后的变量,但SPSS不会直接给出标准化后的数据,如需要得到标准化数据,则需调用Descriptives过程进行计算。 图表 3 相关系数矩阵

图表 4 方差分解主成分提取分析表 主成分分析在SPSS中的操作应用(3) 图表 5 初始因子载荷矩阵

从图表3可知GDP与工业增加值,第三产业增加值、固定资产投资、基本建设投资、社会消费品零售总额、地方财政收入这几个指标存在着极其显著的关系,与海关出口总额存在着显著关系。可见许多变量之间直接的相关性比较强,证明他们存在信息上的重叠。 主成分个数提取原则为主成分对应的特征值大于1的前m个主成分。注:特征值在某种程度上可以被看成是表示主成分影响力度大小的指标,如果特征值小于1,说明该主成分的解释力度还不如直接引入一个原变量的平均解释力度大,因此一般可以用特征值大于1作为纳入标准。通过图表4(方差分解主成分提取分析)可知,提取2个主成分,即m=2,从图表5(初始因子载荷矩阵)可知GDP、工业增加值、第三产业增加值、固定资产投资、基本建设投资、社会消费品零售总额、海关出口总额、地方财政收入在第一主成分上有较高载荷,说明第一主成分基本反映了这些指标的信息;人均GDP和农业增加值指标在第二主成分上有较高载荷,说明第二主成分基本反映了人均GDP和农业增加值两个指标的信息。所以提取两个主成分是可以基本反映全部指标的信息,所以决定用两个新变量来代替原来的十个变量。但这两个新变量的表达还不能从输出窗口中直接得到,因为“Component Matrix”是指初始因子载荷矩阵,每一个载荷量表示主成分与对应变量的相关系数。用图表5(主成分载荷矩阵)中的数据除以主成分相对应的特征值开平方根便得到两个主成分中每个指标所对应的系数[2]。将初始因子载荷矩阵中的两列数据输入(可用复制粘贴的方法)到数据编辑窗口(为变量B1、B2),然后利用“TransformàCompute Variable”,在Compute Variable对话框中输入“A1=B1/SQR(7.22)” [注:第二主成分SQR后的括号中填1.235],即可得到特征向量A1(见图表6)。同理,可得到特征向量A2。将得到的特征向量与标准化后的数据相乘,然后就可以得出主成分表达式[注:因本例只是为了说明如何在SPSS进行主成分分析,故在此不对提取的主成分进行命名,有兴趣的读者可自行命名]: F 1=0.353ZX 1 +0.042ZX 2 -0.041ZX 3 +0.364ZX 4 +0.367ZX 5 +0.366ZX 6 +0.352ZX 7 +0.364ZX 8+0.298ZX 9 +0.355ZX 10

SPSS进行主成分分析的步骤 图文

主成分分析的操作过程 原始数据如下(部分) 调用因子分析模块(Analyze―Dimension Reduction―Factor),将需要参与分析的各个原始变量放入变量框,如下图所示: 单击Descriptives按钮,打开Descriptives次对话框,勾选KMO and Bartlett’s test of sphericity选项(Initial solution选项为系统默认勾选的,保持默认即可),如下图所示,然后点击Continue按钮,回到主对话框: 其他的次对话框都保持不变(此时在Extract次对话框中,SPSS已经默认将提取公因子的方法设置为主成分分析法),在主对话框中点OK按钮,执行因子分析,得到的主要结果如下面几张表。 ①KMO和Bartlett球形检验结果: KMO为0.635>0.6,说明数据适合做因子分析;Bartlett球形检验的显着性P值为 0.000<0.05,亦说明数据适合做因子分析。 ②公因子方差表,其展示了变量的共同度,Extraction下面各个共同度的值都大于0.5,说明提取的主成分对于原始变量的解释程度比较高。本表在主成分分析中用处不大,此处列出来仅供参考。 ③总方差分解表如下表。由下表可以看出,提取了特征值大于1的两个主成分,两个主成分的方差贡献率分别是55.449%和29.771%,累积方差贡献率是85.220%;两个特征值分别是3.327和1.786。 ④因子截荷矩阵如下: 根据数理统计的相关知识,主成分分析的变换矩阵亦即主成分载荷矩阵U与因子载荷矩阵A以及特征值λ的数学关系如下面这个公式: 故可以由这二者通过计算变量来求得主成分载荷矩阵U。 新建一个SPSS数据文件,将因子载荷矩阵中的各个载荷值复制进去,如下图所示: 计算变量(Transform-Compute Variables)的公式分别如下二张图所示: 计算变量得到的两个特征向量U1和U2如下图所示(U1和U2合起来就是主成分载荷矩阵):所以可以得到两个主成分Y1和Y2的表达式如下: Y1=0.456X1+0.401X2+0.428X3+0.490X4+0.380X5+0.253X6 Y2=-0.367X1+0.322X2-0.323X3-0.303X4+0.453X5+0.602X6 由上面两个表达式,可以通过计算变量来得到Y1、Y2的值。需要注意的是,在计算变量之前,需要对原始变量进行标准化处理,上述Y1、Y2表达式中的X1~X9应为各原始变量的标准分,而不是原始值。(另外需注意,本操作需要在SPSS原始文件中来进行,而不是主成分载荷矩阵的那个SPSS数据表中。) 调用描述统计:描述模块(Analyze-Descriptive Statistics-Descriptives),将各个原始变量放入变量框,并勾选Save standardized values as variables框,如下图所示: 得到各个原始变量的标准分如下图(部分): Z人均GDP即为X1,Z固定资产投资即为X2,其余类推。 调用计算变量模块(Transform-Compute Variables),输入公式如下图所示: 计算出来的主成分Y1、Y2如下图所示:

居民消费水平分析

中国居民人均消费水平的微观现状 居民消费率是衡量居民消费情况的重要经济指标。合理的居民消费率不仅有利于居民消费水平的提高和消费结构的优化升级。也有利于国民经济的良性循环,国居民消费率大大低于世界其他国家或地区,居民消费需求严重不足,其中主要由于传统的消费观念以及居民现有的收入水平等多方面的制约了居民消费率的提高。 虽然近些年来,我国已基本从生存型消费转向发展型、享受型消费,具体体现在:第一,交通通讯消费上升;第二,文化教育消费上升;第三,旅游娱乐消费上升;第四,保健养生消费上升。恩格尔系数越低表明享受型与发展型消费所占比例越大,同时表明某国或者某地区的经济越发达,人民越富裕但是整体上比较世界其他国家及地区来说差距依然很大。 一般认为居民可支配收入越多则消费水平越高,因为收入越多人们渐渐从生存型消费向发展型消费和享受型消费转变,从单一的的食品消费向多元化的精神消费发展。但是影响人们消费水平的还与消费环境及消费习惯有关。因此在居民可支配收入不断增加的同时消费环境以及的人们的消费观念也该跟上经济的高速发展,因为只有在经济不断发展的同时居民消费水平随之提高才能最终促进经济的更快的发展。二者是相互促进的正相关关系。 中国居民消费水平的城乡比较 城镇居民是构成中国消费的主要群体,因为城镇居民有着更高人均收入、更完善的社保体系, 同时城市商品种类的丰富也可以极大程度地满足不同消费者偏好上的差别。不过与城镇相比,乡村居民的消费能力具有更强的抵御经济周期的特征。 从1995年以来我国所经历的两次经济危机(1998年亚洲金融危机,2008年国际金融危机来看,虽然遭遇危机时城镇及农村社会消费品零售总额增速都出现下降,但从城镇与农村增速放缓的程度来看,农村消费增速放缓的程度明显低于城镇;尤其是2008年的国际金融危机,一度使2009年2月的社会消费品零售总额增速下降至11.6%,这是自2007年1月以来的单月最低增速,但县及县以下区域的消费增速依然达到了14.8%,超过城镇地区近5个百分点。

spss进行主成分分析及得分分析

spss进行主成分分析及得分分析 1 将数据录入spss 1. 2 数据标准化:打开数据后选择分析→描述统计→描述,对数据进行标准化,选中将标准化得分另存为变量: 2.3 进行主成分分析:选择分析→降维→因子分析,

3.4设置描述性,抽取,得分和选项:

4.5 查看主成分分析和分析: 相关矩阵表明,各项指标之间具有强相关性。比如指标GDP总量与财政收入、固定资产投资总额、第二产业增加值、第三产业增加值、工业增加值的相关系数较大。这说明他们之间指标信息之间存在重叠,适合采用主成分分析法。(下表非完整呈现)

5.6 由Total Variance Explained(主成分特征根和贡献率)可知,特征根λ1=9.092,特征根λ2=1.150前两个主成分的累计方差贡献率达93.107%,即涵盖了大部分信息。这表明前两个主成分能够代表最初的11个指标来分析河南各个城市经济综合实力的发展水平,故提取前两个指标即可。主成分,分别记作F1、F2。 6.7

指标X1、X2、X3、X4、X5、X6、X7、X8、X9、X10在第一主成分上有较高载荷,相关性强。第一主成分集中反映了总体的经济总量。X11在第二主成分上有较高载荷,相关性强。第二主成分反映了人均的经济量水平。但是要注意: 这个主成分载荷矩阵并不是主成分的特征向量,也就是说并不是主成分1和主成分2的系数,主成分系数的求法是:各自主成分载荷向量除以各自主成分特征值的算术平方根。

7.8 成分得分系数矩阵(因子得分系数)列出了强两个特征根对应的特征向量,即各主要成分解析表达式中的标准化变量的系数向量。故各主要成分解析表达式分别为:F1=0.32ZX11+0.33ZX12+0.31ZX13+0.31ZX14+0.32ZX15+0.32ZX16+0.32ZX17+0.32ZX18+0. 32ZX19+0.21ZX110+0.15ZX111 F2=8.46ZX21+0.02ZX22-0.02ZX23-0.20ZX24-0.23Z25-0.04ZX26-0.15ZX27-0.02ZX28+0.10Z X29+0.47ZX210+0.78ZX211 8.9 主成分的得分是相应的因子得分乘以相应的方差的算术平方根。即:主成分1得分=因子1得分乘以9.092的算术平方根主成分2得分=因子2得分乘以1.150的算术平方根例如郑州:主成分因子=FAC1_1*9.092的算术平方根=3.59386*9.092的算术平方根=10.83,将各指标的标准化数据带入个主成分解析表达式中,分别计算出2个主成分得分(F1、F2),再以个主成分的贡献率为全书对主成分得分进行加权平均,即:H=(82.672*F1+10.497*F2)/93.124,求得主成分综合得分。

城镇居民消费结构SPSS统计分析

应用多元统计论文 题目基于SPSS分析方法的城镇居民消费结构研究院系 年级专业 姓名

基于SPSS分析方法的城镇居民消费结构研究 摘要:2012年11月8日将召开中国共产党的十八大,至2013年3月两会召开和政府换届,这段时间将成为市场演化的重要时间窗口;而在这一时期,我国的宏观经济形势也将会产生相应的变化。近年来,我国经济发展速度加快,居民收入稳定增加,在国家出台的一系列政策后,居民消费支出也开始增长,消费结构显著变化。本文通过数据的SPSS分析对我国城镇居民消费出现的趋势特点进行了总结。 关键词:城镇居民消费描述分析整体拟合分析方差分析 回归分析

一、我国城镇居民消费现状 近些年来,我国的国民经济状况突飞猛进的发展,人民的物质生活水平也日益的提高,并且得到了很大的改善。但是,由于我国各地区各地域的资源、技术、科教水平等基础条件的不同,造成各地区各地域的生产力发展水平有很大差异,因此,各地区各地域的经济发展和城镇居民消费性支出的结构、水平是不相同的。而众所周知,消费是拉动经济增长的主要动力之一,因此消费情况如何对经济发展、人民生活水平有直接的影响。 随着国家政策的不断改革,我国国民经济呈现出高速发展的势头,人民生活水平不断提高。这不仅体现为目前我国城镇居民的人均收入普遍地有所提高,也在城镇居民的家庭消费性支出结构的变化上有所体现。 二、我国居民消费结构的分析 我国居民消费结构有以下几个特点: 第一,食品消费支出比重随收入增加呈现出明显的下降趋势,这与恩格尔定律的表述一致。但最低收入户与最高收入恩格尔系数相差太过悬殊,城镇最低收入户刚刚解决了温饱问题,而最高收入户的生活水平按照恩格尔系数的评价标准早已达到了 富裕型,甚至接近最富裕型; 第二,衣着消费支出比重随收入增加缓慢上升,到高收入户又有所下降,但各收 入组支出比重相差不大。衣着支出比重没有更多的递增且最高收入户的支出比重有所下降,这些都符合恩格尔定律关于衣着消费的引申。随着收入的增加,衣着支出比重呈现先上升后下降的走势; 第三,家庭设备用品及服务、交通通讯、娱乐教育文化服务和杂项商品与服务的支出比重呈逐组上升趋势,说明居民的生活水平随收入的增加而不断提高和改善; 第四,医疗保健支出比重随收入水平提高呈现一种两端高、中间低的走势; 第五,居住支出比重基本上呈先上升后下降的趋势,这与我国居民消费能级不断提升,住宅商品正在越来越成为城镇居民关注的热点是相吻合的,同时与恩格尔定律的引申也是一致的。 另外,调查还表明,进入21世纪以来,随着经济体制改革的深入,国民经济的迅速发展,我国城乡居民的消费水平显著提高,居民的各项支出显著增加。随着消费水平的提高,我国城乡居民消费从注重量的满足到追求质的提高,从以衣食消费为主的生存型到追求生活质量的享受型、发展型,消费质量和消费结构都发生了明显

我国城镇居民人均消费的SPSS统计分析

2013年我国城镇居民人均消费的SPSS统计分析 一、搜集到的2013年我国31个城市城镇居民人均消费水平的数据 数据来源:国家统计局https://www.doczj.com/doc/9e11049269.html,/workspace/index?m=hgnd 二、对数据的基本分析 在数据文件建立好后,通常还需要对待分析的数据进行必要的预加工处理,这是数据分析过程中不可缺少的一个关键环节. (一)、对数据按人均消费(expend)进行降序排列 操作步骤:(1):选择“数据”→“排序个案”菜单项 (2):将“人均消费(expend)”选入“排序依据”列表框,选中“降序”

(3):点击“确认”按钮,生成如下降序排列的数据集 由数据的降序排列可以看出,全国只有上海、北京、广东等九个城市的城镇人均消费在全国城镇人均消费水平以上. (二)、作出人均收入和人均消费的直方图 操作步骤:(1):选择“图形”,打开“图表构建程序”菜单项 (2):从“库”中选择“直方图”将其拉入“图表预览使用数据实例” (3):将变量“地区”设置为x轴,将“人均收入”和“人均消费”设置为y轴 (4):点击“确认”按钮,即生成如下直方图

通过一个复合条形图,可以很明确的发现我国城镇居民生活水平存在很大的地区差异,地区发展很不平衡,从图中的生活消费支出和人均收入来看,北京,上海,浙江这些省市城镇居民消费水平最高,人均收入也是最高的,各省市的城镇居民消费水平差异较大,大多数省份城镇居民人均消费集中在15000元左右. (三)、对数据按照人均消费作出直方图,以统计我国农村人均消费的水平 1、首先对数据分组,分组数目的确定. 按照Sturges 提出的经验公式来确定组数K,K=1+ 2 lg lg n ,计算得组数为6. 2、确定组距组距=(最大值-最小值)/组数=(28155.00-12231.90)/6=2653.85,可近似取值为3000.00元. 操作步骤:(1):选择“转换”→“可视离散化”菜单项,将“人均消费”选入“要离散的变量”列表框中,单击“继续”按钮进入主对话框. (2):单击“生成分割点”按钮,设定分割点数量为6,宽度为3000.00,可见系统会自动会填充第一个分割点的位置为12231.90,单击“应用”返回到主对话框. (3):此时可以看到下部数值标签网格里的“值”列已被自动填充,单击“生成标签”按钮,是标签列也得到自动填充. (4):将离散的变量名设定为expendNew.

一组空气污染数据的主成分分析

一组空气污染数据的主成分分析 【说明】下面的多元统计分析练习题摘自R.A. Johnson等编写的《应用多元统计分析(第五版)》,原书为:Richard A. Johnson and Dean W. Wichern. Applied Multivariate Statistical Analysis(5th Ed). Pearson Education, Inc. 2003。我看的是中国统计出版社(China Statistics Press)2003年发行的影印本。 第一题为原书第1.6题,即第1章的第6题,第二题为原书第8.12题,即第8章的第12题。 第二题用的是第一题的数据。 1 习题 1.6. The data in Table 1.5 are 42 measurements on air-pollution variables recorded at 12:00 noon in the Los Angeles area on different days. (a)Plot the marginal dot diagrams for all the variables. (b)Construct the x, S n, and R arrays, and interpret the entries in R. TABLE 1.5 AIR-POLLUTION DATA Wind (x1)Solar radiation (x2)CO (x3)NO (x4)NO2 (x5)O3 (x6)HC (x7) 8 98 7 2 12 8 2 7 107 4 3 9 5 3 7 103 4 3 5 6 3 10 88 5 2 8 15 4 6 91 4 2 8 10 3 8 90 5 2 12 12 4 9 84 7 4 12 15 5 5 72 6 4 21 14 4 7 82 5 1 11 11 3 8 64 5 2 13 9 4 6 71 5 4 10 3 3 6 91 4 2 12 7 3 7 72 7 4 18 10 3 10 70 4 2 11 7 3 10 72 4 1 8 10 3 9 77 4 1 9 10 3 8 76 4 1 7 7 3 8 71 5 3 16 4 4 9 67 4 2 13 2 3 9 69 3 3 9 5 3

主成分分析计算方法和步骤

主成分分析计算方法和步骤: 在对某一事物或现象进行实证研究时,为了充分反映被研究对象个体之间的差异, 研究者往往要考虑增加测量指标,这样就会增加研究问题的负载程度。但由于各指标都是对同一问题的反映,会造成信息的重叠,引起变量之间的共线性,因此,在多指标的数据分析中,如何压缩指标个数、压缩后的指标能否充分反映个体之间的差异,成为研究者关心的问题。而主成分分析法可以很好地解决这一问题。 主成分分析的应用目的可以简单地归结为: 数据的压缩、数据的解释。它常被用来寻找和判断某种事物或现象的综合指标,并且对综合指标所包含的信息给予适当的解释, 从而更加深刻地揭示事物的内在规律。 主成分分析的基本步骤分为: ①对原始指标进行标准化,以消除变量在数量极或量纲上的影响;②根据标准化后的数据矩阵求出相关系数矩阵 R; ③求出 R 矩阵的特征根和特征向量; ④确定主成分,结合专业知识对各主成分所蕴含的信息给予适当的解释;⑤合成主成分,得到综合评价值。 结合数据进行分析 本题分析的是全国各个省市高校绩效评价,利用全国2014年的相关统计数据(见附录),从相关的指标数据我们无法直接评价我国各省市的高等教育绩效,而通过表5-6的相关系数矩阵,可以看到许多的变量之间的相关性很高。如:招生人数与教职工人数之间具有较强的相关性,教育投入经费和招生人数也具有较强的相关性,教工人数与本科院校数之间的相关系数最高,到达了0.963,而各组成成分之间的相关性都很高,这也充分说明了主成分分析的必要性。 表5-6 相关系数矩阵 本科院校 数招生人数教育经费投入 相关性师生比0.279 0.329 0.252 重点高校数0.345 0.204 0.310 教工人数0.963 0.954 0.896 本科院校数 1.000 0.938 0.881 招生人数0.938 1.000 0.893 教育经费投 0.881 0.893 1.000 入

影响城镇居民消费水平的主要因素分析

对外经济贸易大学 University of International Business and Economics 计量经济学期中作业 影响城镇居民消费水平的 多因素分析 姓名 班级 课序号 小组成员

影响城镇居民消费水平的多因素分析 摘要 城镇居民消费水平是以货币计量表现的城镇居民生活富足程度的一个重要标志,也是城镇居民某个时期的生活消费需要获得满足的程度。本文通过对城镇居民消费水平的变动进行多因素分析,建立以城镇居民消费水平为因变量,以其他可量化影响因素为自变量的多元线性回归模型,从而确定其主要影响因素,并提出提高我国城镇居民消费水平的几点建议。 关键词 城镇居民消费水平城镇居民家庭人均可支配收入人口自然增长率城镇居民储蓄存款年末余额居民消费价格指数 一、问题来源 2008年以来,美国次贷危机席卷全球,我国出口贸易也因此受挫,出口总额从2008年的100394.9亿元下跌到2009年的82029.7亿元,跌幅达18.29%。同年11月,政府启动4万亿投资拉动内需。如何刺激国内消费以拉动经济一时间成为全国热点话题,这引起我们对影响城镇居民消费水平因素的思考。 二、理论来源 根据传统凯恩斯消费理论,消费需求是个人可支配收入的函数,收入水平的高低直接影响居民的消费水平。所以我们选择了城镇居民家庭人均可支配收入作为解释变量X1。 根据凯恩斯模型的乘数理论,投资的增加会引起实际GDP的增加。实际GDP的增加使得可支配收入增加,可支配收入的增加导致的消费支出增加。投资的增长拉动消费增长,又收到消费制约,消费增长促进了投资,投资与消费相互促进,共同拉动经济增长,因而我们选择社会固定资产投资作为解释变量X2。 一国的进出口总额反映了本国与外国的贸易活跃程度。近年进口商品关税不断下调,对我国的居民消费产生了相当影响。考虑到同时引入出口和进口两个又显著关系的变量将导致模型的多重共线性。因此,我们选择进出口总额作为解释变量X3。 居民消费价格指数反映城镇居民购买并用于消费的消费品价格水平的变动 情况,以反映通货膨胀程度。也是影响居民消费的重要因素,因而我们选择居民消费价格指数作为解释变量X4。 随着我国住房制度、教育制度和医疗保健制度改革的不断完善,居民所面临的系统风险与个体风险提高,造成居民未来收入与支出的不确定性大大增加,居民预防性储蓄动机增加。由于居民可支配收入的用途一是消费,一是储蓄,所以居民的储蓄增加将直接影响消费支出。因此,我们选择了年底存款余额作为解释变量X5。 三、模型建立 模型设定为Y=β 0+β 1 X 1 +β 2 X 2 +β 3 X 3 +u i Y——城镇居民家庭消费支出总计(元) X 1 ——城镇居民家庭人均可支配收入(元) X 2 ——全社会固定资产投资(亿元) X 3 ——进出口贸易总和(亿元) X 4 ——城镇居民消费价格指数(1978=100) X 5 ——城乡居民储蓄存款年末余额(亿元)四、相关数据

城乡居民消费水平的研究分析

城乡居民消费水平的分析

————————————————————————————————作者:————————————————————————————————日期:

二00九年各地区城乡居民消费水平的分析 摘要:本文借用SAS分析软件对2009年各地区城乡居民消费水平进行描述统计和回归分析。通过对城乡居民消费水平进行分析,得出农村和城镇都存在最高消费水平与最低消费水平差距较大的情况,农村消费水平偏离平均消费水平的程度小,内部差异较城镇小。主要的步骤:首先对数据进行编程录入,然后做各项分析,通过分析结果得出结论。 关键词:SAS软件农村居民城镇居民居民消费水平内部差异 一、引言 在市场经济条件下,消费活动是经济活动的重点,一切经济活动的目的就是为了满足人们日益增长的消费需求。随着中国经济突飞猛进的发展,城乡居民消费水平差距逐渐增大,地区性差异也特别明显。分别对各地区城镇居民消费水平和农村居民消费水平的分析,从而得出是前者对各地区总消费水平的影响明显还是后者,哪个的相关性更强,对平复城乡差距有一定的意义。 二、样本数据选取 本文选取数据为09年各地区城乡居民消费水平,数据来源于国家统计局网站中国统计年鉴2009。其中y1、x1、x2分别表示全体居民消费水平、农村居民消费水平、城镇居民消费水平。 指标y1 x1 x2 天津市22154 11483 24044 河北省15149 7075 17475 山西省7193 3606 12195 内蒙古自治区6854 3705 10617 辽宁省9668 3999 14784 吉林省10848 4909 14774 黑龙江省8410 4239 12061 上海市7737 4183 10592 江苏省29572 13748 31608 浙江省11993 7147 15965 安徽省15790 8324 21251 福建省6829 3683 11301 江西省10950 6037 15739 山东省6229 3443 10033 河南省10494 5395 16027 湖北省6607 3528 11884 湖南省7791 4137 12080 广东省7929 4154 13000 广西壮族自治区15291 5239 21098 海南省6893 3302 12585 重庆市6695 3447 10215

主成分分析(SPSS)操作详细步骤

主成分分析在SPSS中的操作应用 SPSS在调用Factor Analyze过程进行分析时,SPSS会自动对原始数据进行标准化处理,所以在得到计算结果后指的变量都是指经过标准化处理后的变量,但SPSS不会直接给出标准化后的数据,如需要得到标准化数据,则需调用Descriptives过程进行计算。 图表 3 相关系数矩阵

图表 4 方差分解主成分提取分析表 主成分分析在SPSS中的操作应用(3) 图表 5 初始因子载荷矩阵

从图表3可知GDP与工业增加值,第三产业增加值、固定资产投资、基本建设投资、社会消费品零售总额、地方财政收入这几个指标存在着极其显著的关系,与海关出口总额存在着显著关系。可见许多变量之间直接的相关性比较强,证明他们存在信息上的重叠。 主成分个数提取原则为主成分对应的特征值大于1的前m个主成分。注:特征值在某种程度上可以被看成是表示主成分影响力度大小的指标,如果特征值小于1,说明该主成分的解释力度还不如直接引入一个原变量的平均解释力度大,因此一般可以用特征值大于1作为纳入标准。通过图表4(方差分解主成分提取分析)可知,提取2个主成分,即m=2,从图表5(初始因子载荷矩阵)可知GDP、工业增加值、第三产业增加值、固定资产投资、基本建设投资、社会消费品零售总额、海关出口总额、地方财政收入在第一主成分上有较高载荷,说明第一主成分基本反映了这些指标的信息;人均GDP和农业增加值指标在第二主成分上有较高载荷,说明第二主成分基本反映了人均GDP和农业增加值两个指标的信息。所以提取两个主成分是可以基本反映全部指标的信息,所以决定用两个新变量来代替原来的十个变量。但这两个新变量的表达还不能从输出窗口中直接得到,因为“Component Matrix”是指初始因子载荷矩阵,每一个载荷量表示主成分与对应变量的相关系数。用图表5(主成分载荷矩阵)中的数据除以主成分相对应的特征值开平方根便得到两个主成分中每个指标所对应的系数[2]。将初始因子载荷矩阵中的两列数据输入(可用复制粘贴的方法)到数据编辑窗口(为变量B1、B2),然后利用“TransformàCompute Variable”,在Compute Variable对话框中输入“A1=B1/SQR(7.22)” [注:第二主成分SQR后的括号中填1.235],即可得到特征向量A1(见图表6)。同理,可得到特征向量A2。将得到的特征向量与标准化后的数据相乘,然后就可以得出主成分表达式[注:因本例只是为了说明如何在SPSS进行主成分分析,故在此不对提取的主成分进行命名,有兴趣的读者可自行命名]: F1=0.353ZX1+0.042ZX2-0.041ZX3+0.364ZX4+0.367ZX5+0.366ZX6+0.352ZX7+0.364ZX 8+0.298ZX9+0.355ZX10

主成分分析数据

第五章数据例5-3 100固定资产原值实现值(%)100元固定 资产原值 实现利税 (%) 100元 资金 实现 利税 (%) 100元工 业总产 值实现 利税(%) 100元销售 收入实现 利税(%) 每吨标准 煤实现工 业产值 (元) 每千瓦 时电力 实现工 业产值 (元) 全员劳动 生产率(元 /人.年) 100元流 动资金 实现产 值(元) 北京(1)119.29 30.98 29.92 25.97 15.48 2178 3.41 21006 296.7 天津(2)143.98 31.59 30.21 21.94 12.29 2852 4.29 20254 363.1 河北(3)94.8 17.2 17.95 18.14 9.37 1167 2.03 12607 322.2 山西(4)65.8 11.08 11.06 12.15 16.84 8.82 1.65 10166 284.7 内蒙(5)54.79 9.24 9.54 16.86 6.27 894 1.8 7564 225.4 辽宁(6)94.51 21.12 22.83 22.35 11.28 1416 2.36 13.386 311.7 吉林(7)80.49 13.36 13.76 16.6 7.14 1306 2.07 9400 274.1 黑龙江 (8)75.86 15.82 16.67 20.86 10.37 1267 2.26 9830 267 上海(9)187.79 45.9 39.77 24.44 15.09 4346 4.11 31246 418.6 江苏(10)205.96 27.65 22.58 13.42 7.81 3202 4.69 23377 407.2 浙江(11)207.46 33.06 25.78 15.94 9.28 3811 4.19 22054 385.5 安徽(12)110.78 20.7 20.12 18.69 6.6 1468 2.23 12578 341.1 福建(13)122.76 22.52 19.93 18.34 8.35 2200 2.63 12164 301.2 江西 (14)94.94 14.7 14.18 15.49 6.69 1669 2.24 10463 274.4 山东(15)117.58 21.93 20.89 18.65 9.1 1820 2.8 17829 331.1 河南(16)85.98 17.3 17.18 20.12 7.67 1306 1.89 11247 276.5 湖北(17)103.96 19.5 18.48 18.77 9.16 1829 2.75 15745 308.9 湖南(18)104.03 21.47 21.28 20.63 8.72 1272 1.98 13161 309 广东(19)136.44 23.64 20.83 17.33 7.85 2959 3.71 16259 334 广西(20)100.72 22.04 20.9 21.88 9.67 1732 2.13 12441 296.4 四川(21)84.73 14.35 14.17 16.93 7.96 1310 2.34 11703 242.5 贵州(22)59.05 14.48 14.35 24.53 8.09 1068 1.32 9710 206.7 云南(23)73.72 21.91 22.7 29.72 9.38 1447 1.94 12517 295.8 陕西(24)78.02 13.13 12.57 16.83 9.19 1731 2.08 11369 220.3 甘肃(25)59.62 14.07 16.24 23.59 11.34 926 1.13 13084 246.8 青海(26)51.66 8.32 8.26 16.11 7.05 1055 1.31 9246 176.49 宁夏(27)52.95 8.25 8.82 15.57 6.58 834 1.12 10406 245.4 新疆(28)60.29 11.26 13.14 18.68 8.39 1041 2.9 10983 266 例5-4 厂家编号及指固定资产资金利销售收入资金利固定资流动资万元产全员劳动生

SPSS中主成分分析的基本操作1

SPSS 中主成分分析的基本操作 Xiaowenzi22与pinksss 共同制作 阐述主成分分析法的原理 主成分分析是设法将原来众多具有一定相关性(比如P 个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来P 个指标作线性组合,作为新的综合指标。最经典的做法就是用F 1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(F 1)越大,表示F 1包含的信息越多。因此在所有的线性组合中选取的F 1应该是方差最打的,故称F 1为第一主成分。如果第一主成分不足以代表原来P 个指标的信息,再考虑选取F 2即选第二个线性组合,为了有效地反映原来信息,F 1已有的信息就不需要再出现再F 2中,用数学语言表达就是要求Cov(F 1, F 2)=0,则称F 2为第二主成分,依此类推可以构造出第三、第四,……,第P 个主成分。 主成分模型: F 1=a 11X 11+a 21X 21+……+a p1X p F 2=a 12X 12+a 22X 22+……+a p2X p …… F p =a 1m X 11+a 2m X 22+……+a pm X p 其中a 1i, a 2i, ……,a pi (i=1,……,m)为X 的协差阵Σ的特征值多对应的特征向量,X 1, X 2, ……, X p 是原始变量经过标准化处理的值(因为在实际应用中,往往存在指标的量纲不同,所以在计算之前先消除量纲的影响,而将原始数据标准化)。 A=(ij a )m p ×=(,1α,2α…,m α),i i i R αλα=, R 为相关系数矩阵, i i αλ、是相应的特征值和单位特征向量, 1λ≥2λ≥…≥p λ≥0 上述方程组要求: 1、a 21i +a 22i +……+a 2pi =1 (i=1,……,m) 2、m I A A =′ (A=(ij a )m p ×=(,1α,2α…,m α),A 为正交矩阵) 3、Cov(F i ,F j )=ij i δλ, =01 ij δj i j i ≠= 操作步骤: 一、 数据标准化

主成分分析的计算步骤

样本观测数据矩阵为: ?????? ? ??=np n n p p x x x x x x x x x X ΛM M M M ΛΛ212222111211 第一步:对原始数据进行标准化处理 )var(*j j ij ij x x x x -= ),,2,1;,,2,1(p j n i ΛΛ== 其中 ∑==n i ij j x n x 1 1 21 )(11)var(j n i ij j x x n x --=∑= ),,2,1(p j Λ= 第二步:计算样本相关系数矩阵 ?????? ????????=pp p p p p r r r r r r r r r R ΛM ΛM M ΛΛ212222111211 为方便,假定原始数据标准化后仍用X 表示,则经标准化处理后的数据的相关系数为: tj n t ti ij x x n r ∑=-=1 11 ),,2,1,(p j i Λ= 第三步:用雅克比方法求相关系数矩阵R 的特征值(p λλλΛ21,)和相应的特征向量()p i a a a a ip i i i ΛΛ2,1,,,21==。 第四步:选择重要的主成分,并写出主成分表达式 主成分分析可以得到p 个主成分,但是,由于各个主成分的方差是递减的,包含的信息量也是递减的,所以实际分析时,一般不是选取p 个主成分,而是根据各个主成分累计贡献率的大小选取前k 个主成分,这里贡献率就是指某个主成分的方差占全部方差的比重,实际也就是某个特征值占全部特征值合计的比重。即

贡献率=∑=p i i i 1λ λ 贡献率越大,说明该主成分所包含的原始变量的信息越强。主成分个数k 的选取,主要根据主成分的累积贡献率来决定,即一般要求累计贡献率达到85%以上,这样才能保证综合变量能包括原始变量的绝大多数信息。 另外,在实际应用中,选择了重要的主成分后,还要注意主成分实际含义解释。主成分分析中一个很关键的问题是如何给主成分赋予新的意义,给出合理的解释。一般而言,这个解释是根据主成分表达式的系数结合定性分析来进行的。主成分是原来变量的线性组合,在这个线性组合中个变量的系数有大有小,有正有负,有的大小相当,因而不能简单地认为这个主成分是某个原变量的属性的作用,线性组合中各变量系数的绝对值大者表明该主成分主要综合了绝对值大的变量,有几个变量系数大小相当时,应认为这一主成分是这几个变量的总和,这几个变量综合在一起应赋予怎样的实际意义,这要结合具体实际问题和专业,给出恰当的解释,进而才能达到深刻分析的目的。 第五步:计算主成分得分 根据标准化的原始数据,按照各个样品,分别代入主成分表达式,就可以得到各主成分下的各个样品的新数据,即为主成分得分。具体形式可如下。 ?????? ? ??nk n n k k F F F F F F F F F ΛM M M M ΛΛ212222111211 第六步:依据主成分得分的数据,则可以进行进一步的统计分析 其中,常见的应用有主成份回归,变量子集合的选择,综合评价等。

影响我国居民消费水平的因素分析及对策建议

摘要:消费水平是一定时期内整个社会用于生活消费和服务的规模和水平,消费水平在一定程度上反映了居民的生活质量。研究影响居民消费的因素具有较强的经济意义。本文基于1987——2012年数据,选取了国内生产总值、城乡居民可支配收入、农村居民纯收入、人口自然增长率和居民消费价格指数五个因素,建立计量经济学模型,进行了单因素分析、多因素分析、多重共线性检验、异方差性检验,分析了以上五个因素对居民消费水平的影响,目的在于说明各因素之间的相互关系,为国家政策的制定和实施提供参考意见。 关键词:消费水平;影响因素;模型分析 一、引言 改革开放以来,我国经济飞速发展,人民生活水平不断提高,居民消费水平也不断增长。消费水平是一定时期内整个社会用于生活消费和服务的规模和水平,消费水平在一定程度上反映了居民的生活质量。研究影响居民消费的因素具有较强的经济意义。本文选取国内生产总值、城乡居民可支配收入、农村居民纯收入、人口自然增长率和居民消费价格指数五个因素,以分析影响居民消费水平的因素为目的,建立线性计量经济模型,进行了相关的内容的分析。 二、影响我国居民消费水平的因素理论分析 对影响消费的主要因素的研究,已经有大量的经济学家和学者做了充分的研究。国外学术界有两种主要不同的理论观点:一种是凯恩斯主义消费函数,强调现期消费主要取决于现期收入,随着可支配收入增加,消费也增加。这种消费理论主要强调用收入来解释消费。他指出,在其他条件不变的条件下,消费者是完全理性的人,消费者的主要经济行为是储蓄和消费,而且消费将随着收入的增减而增减,但消费的变化幅度小于收入的变化幅度,再者,边际消费倾向小于平均消费倾向,边际消费倾向变化率为负值,即随着收入的增加,用于消费的支出占收入的比重减小,边际消费倾向是递减的,他指出的是消费增长与收入增长之间是一种非比例关系。 另一种是面向未来的消费函数,强调消费对一生总财富的依赖,以及储蓄在稳定消费中的作用——莫迪利阿尼的生命周期理论强调为退休后的生活而储蓄的重要性;弗里德曼的持久收入假说强调储蓄在稳定高收入年份和低收入年份之间消费的作用,他强调的是持久性收入影响消费支出,而暂时性收入对消费支出的影响是通过对持久收入的影响而发生的,它的

全国城镇居民消费支出影响因素的实证分析(1)

全国城镇居民消费支出影响因素的实证分析 【摘要】消费是社会再生产的重要环节,涉及到社会经济诸多方面,研究影响消费的因素,对认识社会经济有着重要的作用。本文考察城镇居民家庭人均可支配收入、人均GDP、收入差距、物价水平、老年人口抚养比、社会保障和恩格尔系数几个因素对全国城镇居民消费支出的影响。为了避免了多重共线性问题,利用SPSS通过主成分分析方法,构造出与原始变量的相关性很强,而他们相互之间相关性很低的新变量,然后采用回归分析方法,最终得出城镇居民家庭人均可支配收入、人均GDP、收入差距、社会保障和消费支出成正比,物价水平、恩格尔系数与消费支出成反比。 【关键词】消费支出影响因素主成分分析回归分析 根据经典的消费决定理论,收入是消费的来源和基础,是影响消费的最重要因素,提高可支配收入就可提高消费支出,从而促进实体经济的发展。据藏旭恒(1994年)的研究,从1952年到1978年,城镇居民的平均消费倾向高达0.95以上。这是由于当时的收入水平是非常低的,所以大部分的收入用于维持基本生活消费,很显然储蓄动机是不足的。本文研究1995年以后全国城镇居民消费支出,1995年以后,我国经济已经发生了重大的变化,居民的消费水平逐渐提高,消费方式趋于多元化,消费结构也发生了重大的变化。如何有效的刺激消费需求,成了政府部门和学者关心的问题。然而只有对影响消费的因素有深刻的了解,才能制定相应的刺激政策。 一、变量的选取,数据来源和模型选择 1,人均GDP。人均国内生产总值。是衡量各国人民生活水平的一个标准。人均GDP 越高,表示消费支出水平越高;人均GDP越低,表示消费支出水平越低。 2,城镇居民家庭人均可支配收入。一般而言,居民可支配收入与消费支出呈密切的正相关关系。随着收入的增加,消费水平会逐步提高。根据国民经济恒等式,收入主要用于收费和储蓄,因此,收入水平是影响消费的重要因素。我们小组选取1995年以后全国城镇居民消费支出的序时数据来量化城镇居民家庭人均可支配收入的这一影响因素。 3,收入差距。城市居民人均可支配收入较高,高收入者的平均消费倾向较低;农村的人均可支配收入较低,而低收入者的平均消费倾向较高。因而,均衡的消费有助于消费者水平提高。该研究的收入差距用全国的城市居民人均可支配收入与农村居民人均可支配收入的比值来表示,比值越大,收入差距越大。 4,老年人口抚养比。理论上,抚养比会与消费支出会呈现负相关的关系。因为老年人口需要其他家庭成员创造的财富(用于生存、接受教育和培养劳动技能)。老年人虽然丧失了劳动能力,但同样需要消费其他家庭成员创造的财富。 5,恩格尔系数。当食物支出金额不变的条件下,总支出金额与恩格尔系数成反比。所以,恩格尔系数增加,即消费支出减少;恩格尔系数减少,即消费支出增加。 6,居民消费价格指数。一般的,消费支出与居民消费价格指数呈负相关关系。物价的相助变动会引起消费者购买量的显著变动(这种商品的需求弹性正常)。并且,人们对价格的变动会做出自己的预期,根据自己的预期改变消费支出决策。如果预期价格水平上涨,消费者为避免将来消费支出损失,会增加当期的消费支出;如果预期价格水平下降,消费者为会减少当期的消费支出,增加储蓄。 7,社会保障业城镇固定资产投资建设总规模。健全的社会养老保险和失业保险等神会保障制度是社会的稳定器,能增强居民生活的安全感,减少由于预防性动机的货币需求,从而增加居民消费。由于农村的社会的社会保障制度不完善,选用人均医疗支出来反映这方面对消费需求的影响。

相关主题
文本预览
相关文档 最新文档