运用聚类分析法对我国农村居民人均纯收入的评估
- 格式:doc
- 大小:31.50 KB
- 文档页数:3
中国各地区农业现代化发展综合评价分析作者:郭雨萱来源:《现代经济信息》 2018年第6期摘要:农业是我国的弱势产业,“三农问题”制约着我国现代化建设。
农业现代化是指将传统农业转化成现代农业的过程和手段。
加大农业现代化的发展进程,是扭转农业弱质低效局面的根本出路。
本文利用2017年统计年鉴的数据,运用因子分析和聚类分析的方法得出我国各地区农业现代化发展情况相应的结论,我国各地区农业现代化存在着地区内部不协调与地区之间不协调的状况,并有针对性地提出了相关政策性建议。
关键词:农业现代化;因子分析;聚类分析中图分类号:F320.1文献识别码:A文章编号:1001-828X(2018)009-0-01一、引言我国成功加入WTO后,农业面临更加严峻的冲击和挑战。
由于农业现代化有利于解决农业的社会效益较高与经济效益较低之间的矛盾,提高农业比较效率,增加农民收入;有利于弱化生产总量与市场需求成反比的矛盾,带领广大农民参与市场活动,循序渐进的实现农业产销市场化、现代化;农业经营的时代化有利于减少农业与工业、商业和服务业的差别和农村、城镇与大中城市的差别加速剩余的农村劳动力向城市转移,特别是向中、小城市的转移,加速城乡体制机制改革、成功落实城乡总体一体化的战略布局。
因此,加大农业现代化发展进程,是扭转农业弱质低效局面的根本出路。
二、中国各地区农业现代化发展综合评价分析(一)农业现代化综合评价本文根据农业现代化的定义为基本原则构建指标体系,选取十七个指标构建指标体系以充分反映各地区农业现代化发展水平进程。
运用spss进行因子分析,提取三个公共因子,如表1。
表1 指标分类统计表高载荷指标意义f1 化肥施用量农业投入水平因子农作物播种面积农业机械总动力有效灌溉面积农村农户投资总额农业水事务财政投入除涝面积f2 农村人均纯收入农村居民生活质量水平因子农村人均消费支出农村人口比重f3 土地生产率农村居民生活环境水平因子湿地占辖域面积比重森林覆盖率为了进一步研究全国31个省市在每个因子上的具体表现情况,运用回归的方法估计因子得分系数矩阵,并根据因子得分系数矩阵分别计算出31组数据在以上三个公共因子上的得分情况。
基于因子分析和聚类分析对全国地区的经济发展水平的评估学院:理学院专业:统计学学号:姓名:指导老师:2013年4月25日摘要中国正处于经济发展的时期,但仍有部分经济发展速度过慢的地区,为了提出相关政策对这些地区的经济发展水平进行改善,通过因子分析,聚类分析对全国所有地区的经济发展水平,进行分类,针对属于不同类的地区实行不同的相关经济政策。
为国家制定相关政策提供了数据依据。
关键字:城市经济发展水平;因子分析;聚类分析;分类;引言:全国经济发展是由各地区的经济发展一起带动起来的,因此各地的经济发展水平的速度是与国家的发展水平成正比的,而对于全国各地区经济发展水平研究的比较少,通过经验以及一些试验可以知道经济发展水平基本与人均进出口总额,人均财政收入,各个产业的发展,环境保护,教育支出,废物处理比率,人均日生活用水量,各地区人均GDP ,地区生产总值,地区生产总指数,居民消费总指数这些数据有关,使用spss 对这些数据进行因子分析与聚类分析。
也即是在因子分析的基础上进行聚类量化的评估。
找出这些地区的发展水平差距所在。
1 因子分析的基本思想1.1 因子分析的基本出发点将原始指标综合成较少的指标,这些指标能够反映原始指标的绝大部分信息(方差),这些综合指标之间没有相关性。
1.2 因子变量的特点(1)这些综合指标称为因子变量,是原变量的重造;(2)个数远远少于原变量个数,但可反映原变量的绝大部分方差; (3)不相关性; (4)可命名解释性。
1.3 因子分析的基本步骤(1)确认待分析的原始变量是否适合作因子分析; (2)构造因子变量;(3)利用旋转方法使因子变量具有可解释性; (4)计算每个样本的因子变量得分。
1.4 因子分析的数学模型数学模型(x i 为标准化的原始变量;F i 为因子变量;k<p )111112213311221122223322331132233333112233..................k k k k k k p p p p pk k px a f a f a f a f x a f a f a f a f x a f a f a f a f x a f a f a f a f εεεε⎧=+++++⎪=+++++⎪⎪=+++++⎨⎪⎪=+++++⎪⎩ 也可以矩阵的形式表示为:X=AF+ε2、因子分析实验过程首先将数据导入spss中,进行Dimension Reduction中的Factor进行分析,选取所有需要分析的变量即是经济发展水平基本与人均进出口总额,人均财政收入,各个产业的发展,环境保护,教育支出,废物处理比率,人均日生活用水量,各地区人均GDP,地区生产总值,地区生产总指数,居民消费总指数进入Variables 窗口。
多元统计分析论文——城镇居民人均全年家庭收入来源学院:统计学院专业:统计专业班级:11级统计二班学号:。
姓名:城镇居民平均每人全年家庭收入来源浅析摘要:随着经济的发展,我国城镇居民的收入水平和消费水平的结构也发生了很大变化,人民生活水平的提高和消费的增加对于实现国民经济又好又快发展、正确处理好内需和外需的关系至关重要。
于是,我就城镇居民人均收入方面的数据作了分析,大致讨论了一下现今为止人民的收入水平以收入来源。
本文主要运用聚类分析法,主成分分析法,因子分析法三种多元统计分析方法对2012年我国城镇居民平均每人全年家庭收入来源进行剖析。
根据不同分类方法得出不同的分析结果,从而从不同角度分析我国城镇居民人均全年收入水平的主要差异以及导致这些差异出现的原因,并最终就三种统计分析方法的结果对我国目前城镇居民平均每人全年家庭收入来源的状况进行客观的综合概述。
关键字:城镇居民人均全年家庭收入聚类分析法主成分分析法因子分析法一. 引言在日常生活过程中,我们常常遇到一些计算量大,分析工作复杂度高的数据分析工作,为了能够更加简便地进行数据分析,在此给大家介绍几种多元统计分析的方法。
本文主要运用了SPSS软件,并使用聚类分析法、主成分分析法和因子分析法对2012年我国城镇居民人均全年家庭收入情况进行了统计分析。
二. 原始数据录入如下:三. 聚类分析聚类分析是研究“物以类聚”的一种方法。
聚类分析是应用最广泛的一种分类技术,它把性质相近的个体归为一类,使得同一类中的个体具有高度的同质性,不同类之间的个体具有高度的异质性。
聚类分析的职能是建立一种分类方法,它是将一批样品或变量,按照它们在性质上的相似程度进行分类。
通常我们用距离来度量样品之间的相似程度,用相似系数来度量变量之间的相似程度。
1.参与聚类的样本总量表Case Processing Summary(a)a Squared Euclidean Distance Undefined error #14704 - Cannot open tex通过观察上表,我们可以看出,在整个聚类过程中,描述我国城镇居民人均全年家庭收入来源状况的31个样品都参与了聚类分析过程,没有遗失或未参与的样品。
基于层次聚类分析的我国居民收入状况地区比较分析摘要:在国家统计局关于居民收入的统计指标基础上,采用层次聚类分析对我国各地区居民收入的状况进行了比较分析,并得出各主要聚类群。
在此基础上认为目前我国居民还是以工薪收入为主,各地区其他收入方面均有不同情况。
关键词:层次聚类分析居民收入地区比较一、引言目前,深化收入分配制度改革,增加城乡居民收入是我国综合实力发展所要解决的一个非常重要的问题。
党的十七大报告中明确指出:“逐步提高居民收入在国民收入分配中的比重,提高劳动报酬在初次分配中的比重。
着力提高低收入者收入,逐步提高扶贫标准和最低工资标准,建立企业职工工资正常增长机制和支付保障机制。
创造条件让更多群众拥有财产性收入。
保护合法收入,调节过高收入,取缔非法收入。
扩大转移支付,强化税收调节,打破经营垄断,创造机会公平,整顿分配秩序,逐步扭转收入分配差距扩大趋势。
”为此,我们非常有必要按照居民收入的不同种类将收入状况趋同的地区进行分类,以找到解决当前面临的增加居民收入的突破口。
二、模型选择层次聚类分析是一种多元数理统计方法。
它并没有事先设定样本分类的标准,而是通过对样本和变量数据的不同特征指标值进行差异程度计算,根据变量或样本间不同的差异程度大小重新结合分类,产生一个更有效的分类。
其优点在于可以对分类变量进行聚类,提供的距离测量方法和结果表示方法也非常丰富。
它的实现过程如下:1.由于本文所选用数据存在极大的量纲,所以必须进行无量纲化处理。
2.将各组数据作为独立的一类(设为n类),按照所定义的距离计算各数据点之间的距离,形成一个距离阵。
3.将距离最近的两组数据并为一类,从而形成n-1个类别,计算新产生的类别与其他各个类别之间的距离或者相似度,形成新的距离阵。
这种方法的思想来自于方差分析,使用该方法的目的是使得各个类别间的样本量尽可能接近。
4.按照与第二步相同的原则,再将距离最接近的两个类别合并,一直重复该步骤直到所有数据被合并为一个类别为止。
对我国各地经济发展水平进行聚类分析对我国各地经济发展水平进行聚类分析摘要:区域经济协调发展对于一个国家的长期发展具有深远的战略影响。
本文根据《中国统计年鉴》选用人均GDP、居民消费水平、人均进出口总额等指标,采用聚类的方法对我国各地区经济进行聚类,并根据结果分析特点,得出具有现实意义的结果,以供有关部门参考。
关键字:聚类分析区域经济发展水平分类国家经济发展不仅要看总体GDP的高速的增长,应考虑到居民生活水平、各个产业的发展情况、人民收入等各个方面。
同时,各地区经济水平的协调发展更是不可忽视的一方面,了解区域发展情况,并对其进行分类对我国经济发展战略的制定等具有重要而深远的意义。
聚类分析就是根据事物的某方面特征把他们划分为若干小类,使得隶属同一类的个体具有较高的相似度或类似的性质,而不属于同一类的个体具有较低的相似度的分析过程【1】。
在地区经济发展水平的分析中,可以利用聚类分析的方法,根据一定的具有代表性的指标将不同的地区进行分类。
从而制定相应的发展策略。
一区域经济水平策聚类分析的指标选择及所所选数据反映地区经济发展状况的指标种类多样,所以所选的指标不仅要有明确的社会和经济意义,而且要能代表地区经济发展水平的某一个方面。
指标选择要有代表性和针对行,本文根据经济发展状况选用了八个指标进行聚类分析,各地人均GDP用以代表各地区经济的总体发展状况,第一二三产业人均GDP用以代表各地不同产业的发展水平,人均进出口总额用以表示各地区的对外贸易情况,居民消费水平用以表示各地居民的生活水平,在岗职工平均工资用以反映地区职工工资水平,人均财政收入用以反映地区公共建设投资能力等。
本文根据《中国统计年鉴》对2008年各地区降级指标数据的统计,直接引用其中指标或根据其中相关指标换算获取所需指标,如下表:表1二中国各地区经济发展水平的聚类分析(一)聚类方法概述在进行聚类分析时本文采用K-means聚类方法,K-means聚类方法又被称为逐个修改法。
第1章前言根据影响农村居民家庭人均消费支出的因素的理论观点,本文旨在通过2010年我国各地区农村居民家庭从事农业经营人均纯收入、农村居民家庭其它来源人均纯收入对农村居民家庭人均消费支出的影响进行实证的分析。
通过建立理论模型,并收集相关数据,利用Eviews软件对计量模型进行参数估计和检验并加以修正,得到影响农村居民家庭人均消费支出的重要因素为农村居民家庭其它来源人均纯收入。
最后,对所得结果作出经济意义分析。
影响农村居民家庭人均消费支出的因素:农村居民家庭其它来源人均纯收入。
农村人均纯收入除从事农业经营的收入外,还包括从事其他产业的经营收入以及工资性收入、财产收入和转移支付收入等。
我们将其收入全部包含在农村居民家庭其它来源人均纯收入内。
即农村居民家庭其它来源人均纯收入为农村居民家庭总纯收入减去农村居民家庭从事农业经营人均纯收入后的其他收入总额。
随着时代发展,可以发现农村居民家庭其它来源人均纯收入对消费支出的影响能力逐渐增强。
农村居民不再只依靠农业经营收入为家庭的主要经济来源,而越来越重视除农业经营以外的其它经济收入方式。
同时,农村居民家庭人均消费支出受农村居民其它来源人均收入的影响比农村居民家庭从事农业经营人均纯收入的影响更大。
即农村居民家庭其它来源人均纯收入越多,其消费支出水平越高;反之,消费支出水平越低。
第2章中国农村居民家庭人均消费支出与纯收入建模本文选取了中国2010年各地区农村居民家庭从事农业经营的人均纯收入、其它来源人均纯收入这2个因素进行分析。
(表一)2010年各地区农村居民家庭人均支出与纯收入2.1 计量经济模型的建立为了研究中国各地区农村居民家庭人均消费支出与各地区农村居民家庭从事农业经营的人均收入、其它来源人均纯收入之间的关系,建立下述的模型:Y=C+β1X1+β2X2+u其中:Y:2010年农村居民家庭人均消费支出X1:2010年农村居民家庭从事农业经营人均纯收入X2:2010年农村居民家庭其它来源人均纯收入βi:为待定参数u:为随机扰动项C:为常数项2.2 模型求解和检验利用Eviews软件,分别用最小二乘法回归分析,并针对其中的多重共线性、异方差和自相关进行统计检验,最后进行修正再来估计参数。
论我国农村居民人均收入数据统计与分析之方法摘要为研究我国分配制度在各省市地区农村的差异性和相似性,在收集了我国2010年31个省市自治区农村居民家庭平均每人现金收入的数据的基础上,采取了两种分析方法,即聚类分析和主成分分析,通过两种方法的比较,可以看到农村地区的收入分配格局所发生的改变。
关键词收入来源;地理环境;聚类分析;主成分分析1逻辑起点:各地区农村居民家庭平均每人现金收入指标的确定农村居民的收入来源是各种各样的,随着改革开放以及中国加入WTO。
为了拉动农村经济的发展,很多农村地区都进行了招商引资,也有很多农村青年外工务工。
而由于地理环境的不同,各地区的农作物也是不一样的。
并且在不同地区,农民生活的环境及思想差异也很大,有的地区城市人民收入水平很高,但并不意味着它的农村人均收入也很高,所以我选取了七个指标,这七个指标很大程度上包括了农民收入的主要来源,即工资性收入(x1),农业收入(X2),林业收入(x3),牧业收入(X4),渔业收入(x5),财产性收入(X6),转移性收入(x7)。
2路径与选择:我国农村居民人均收入数据统计与分析之方法思考1)多元统计分析技术。
我们现在以2008年一季度各地区农村居民家庭平均每人现金收入为例,来说明多元统计分析在实际经济领域的应用。
其中涉及到上文列举的七个与农民生活息息相关的指标,接下来我们首先采用聚类分析方法进行分析。
2)聚类分析方法。
首先我们通过SPSS软件用聚类的方法将这31个省市和地区分成三类,我们可以很清楚地看到哪些省市地区的农村人均收入水平是差不多的,所得聚类结果如下:表1为观测值处理综合,从该表中我们可以看出,31个省市和地区样本都进入了聚类分析,因为原数据表中并没有缺损。
另外还有一个变量的类归属情况表,由于本例中样本较多(共31个),得到的变量的类归属情况表占用很大空间,所以在此我不引用该表,而是运用语言进行捕述。
从我们收集到的原始数据可以看出,上海单独被聚为一类。
运用聚类分析法对我国农村居民人均纯收入的评估
摘要:根据2009年我国各地区农村居民人均纯收入的数据,运用聚类分析法进行分析,并使用SAS统计软件对数据进行处理,将我国各地区分为高等、中等和低等收入地区3类,然后对低等收入地区再次进行高等、中等、低等的分类。对我国农村居民人均纯收入进行分析和评估具有一定的可靠性和实用价值,旨在为国家制定各地区农村的财政投入政策提供了一定的依据。
关键词:聚类分析法;农村居民人均纯收入;评估
Cluster Analysis of Per-capita Income of Rural Residents in China
Abstract: According to the data of per-capita income of Chinese rural residents in 2009,all of the regions were divided into 3 classes(lower-income areas,middle-income areas and high-income areas) by clustering method and the statistical software SAS. Then the lower-income regions were again divided into the same 3 classes as above. The positive meaning for the central government to make fiscal policy and to estimate farmers’ income level was provided.
Key words: cluster analysis; per-capita income of the rural residents; evaluation
我国属于农业大国,全国大部分人口都是农民,因此,对农村居民收入进行统计分析是关系到国泰民安的重要研究项目之一。到目前为止,对农村居民收入已有很多方面的研究,如收入来源等。本研究主要对全国各地区农村居民人均纯收入进行了分类和评估,运用聚类分析法将全国31个地区(省、直辖市和自治区)按照其农村居民人均纯收入分为高等、中等和低等3类,由于低收入类所涵盖的地区偏多,故又将其分为高等、中等和低等3类[1]。本研究运用SAS统计软件中的类平均聚类法以及快速聚类法分别对原始数据进行了分析,并得到了预期的结果[2]。所用数据来源于《中国统计年鉴》[3]。
1 聚类分析模型简介
聚类分析又称群分析,它是研究对样品或指标进行分类的一种多元统计方法。通过对观测数据所进行的分析处理,选定一种度量个体接近程度的统计量,确定分类数目,建立一种分类方法,并按接近程度对观测对象给出合理的分类。
聚类分析法主要有系统聚类法、动态聚类法、最优分割法和模糊聚类法等。本研究使用系统聚类法的类平均法及动态聚类法对数据进行了处理[4]。
1.1 类平均法
类平均法所采用的类间距离为:
动态聚类法又称为逐步聚类法,其基本思想是开始先粗略地分一下类,然后按照各种最优原则修改不合理的分类,直至分类趋于比较合理为止,这样就形成了一个最终的分类结果。
2 实证分析
2.1 2009年我国各地区农村居民人均纯收入的聚类分析
本研究采用SAS软件中的CLUSTER过程进行系统聚类分析。将原始数据进行处理后,再利用SAS软件,通过计算机的计算,用类平均聚类法分析所得到的聚类谱系图如图1所示[5]。
2.2 聚类结果分析
根据图1可以将全国各地区初步分为以下3类。第一类:北京、上海;第二类:天津、江苏、浙江、广东;第三类:河北、湖南、山西、安徽、重庆、四川、广西、宁夏、江西、湖北、河南、辽宁、福建、山东、贵州、甘肃、青海、陕西、云南、西藏、内蒙古、黑龙江、吉林、海南、新疆。
从表1中的动态聚类结果可以得到:第一类属于农村居民人均纯收入的高收入地区,第二类属于中等收入地区,第三类属于低等收入地区。3类地区人均工资性收入、人均家庭经营性收入、人均财产性收入及人均转移性收入分别如下:①第一类4项收入分别为:8 671.00、590.17、932.81和2 288.96元,人均纯收入合计为12 482.94元。②第二类4项收入分别为:5 090.15、3 869.56、487.90和559.70元,人均纯收入合计为10 007.31元。③第三类4项收入分别为:461.49、3 069.57、121.26和230.77元,人均纯收入合计为3 883.09元。
再次利用动态聚类法进行分析,将低等收入地区又按照高等、中等和低等分为以下3类[6]。第一类:河北,辽宁,福建,江西,山东,河南,湖北,湖南;第二类:内蒙古,吉林,黑龙江,海南,新疆;第三类:山西,安徽,广西,重庆,四川,贵州,云南,西藏,陕西,甘肃,青海,宁夏。第一类属于收入比较高的地区,第二类属于中等收入地区,第三类属于收入比较低的地区。3类地区的人均工资性收入、人均家庭经营性收入、人均财产性收入及人均转移性收入分别为:①第一类4项收入分别为:2 678.35、3 330.18、199.93和471.71元,人均纯收入合计为6 680.17元。②第二类4项收入分别为:869.02、3 436.75、290.86和669.29元,人均纯收入合计为5 265.92元。③第三类4项收入分别为:1 428.46、1 570.16、92.60和346.32元,人均纯收入合计为3 437.54元(表2)。
3 小结
从以上结果可以看出:①农村居民人均纯收入高的地区与人均纯收入低的地区之间的差别比较大,在对全国所有地区按照人均纯收入进行初次分类的结果中可以看出,收入高的北京、上海地区比收入较低的河北、湖南等地区的人均纯收入要
高8 599.85元,充分体现了我国贫富差距比较大的现实情况;②在低等收入地区中,山西、安徽、广西、重庆、四川、贵州、云南、西藏、陕西、甘肃、青海、宁夏12个地区尤其低,这与这些地区所处的地理环境及所拥有的资源等因素有关;③从收入比较高的北京、上海等地区的情况可以看出,一个地区的农村居民家庭收入与该地区的工业、商业以及整个地区的繁华程度等有关。
运用聚类分析法对我国农村居民人均纯收入进行分析和评估具有一定的可靠性和实用价值,希望此分析能为国家制定各地区农村的财政投入政策提供了一定的依据。
参考文献:
[1]高惠璇. 应用多元统计分析[M].北京:北京大学出版社,2005.217-262.
[2] 王平,赵人可,彭朝晖. 运用聚类分析法对我国企业信贷风险的评估与预测[J]. 数学理论与应用,2010,30(1):92-97.
[3] 中华人民共和国国家统计局.中国统计年鉴(2010)[M].北京:中国统计出版社,2010.
[4] 崔洪梅,姚凯文.基于聚类分析的工程移民收入水平恢复评价[J]. 水力发电,2010,36(12):1-3.
[5] 赵晓葵. 基于聚类分析的青海藏区社会经济发展水平评价研究[J]. 青海师范大学学报(自然科学版),2010(4):8-11.
[6] 王成,王继顺. 基于因子分析与聚类分析的学生成绩综合评价[J]. 甘肃联合大学学报(自然科学版),2011,25(1):26-30.。