关于二十个家庭的收入与消费分析(spss)
- 格式:doc
- 大小:171.50 KB
- 文档页数:8
SPSS论文题目:各地区城镇居民家庭人均消费性支出分析摘要:我国各地区的经济发展水平存在着较大的差异。
本文运用SPSS软件分析方法对我国各地区城镇居民消费性支出进行分析研究,研究表明:各地区城镇居民消费性支出的差异主要是由两方面引起的,首先是地区的经济发展水平,我国东部、中部和西部地区的消费水平存着较大差异;其次是由地区气候因素引起的消费倾向,我国南北地区明显有别。
关键字:SPSS,消费支出,分析数据:我国地域辽阔,各地区的经济发展很不平衡,各地区城镇间的消费性支出存在着较大的差异,而且由于多种因素的影响,这种差异呈现加速扩大的态势。
如何客观、准确、有效地分析这些差异,具有重要的理论和实践意义。
消费性支出的指标有许多,如果直接从诸多指标来分析各地区的差异,那未分析的结果很可能将是繁杂和不得要领的,很难给出直观有效的结论。
如果仅用消费性总支出这个指标,则显得太粗糙,丢失的有用信息太多,不能较充分地反映各地区的消费差异。
那么,如何能使得所作的分析研究即不繁杂又不损失太多的信息呢?这正是本文所要解决的问题。
居民消费支出:是指城乡居民个人和家庭用于生活消费以及集体用于个人消费的全部支出。
包括购买商品支出以及享受文化服务和生活服务等非商品支出。
对于农村居民来说,还包括用于生活消费的自给性产品支出。
集体用于个人的消费指集体向个人提供的物品和劳务的支出;不包括各种非消费性的支出。
其形式是通过居民平均每人全年消费支出指标来综合反映城乡居民生活消费水平。
消费支出特点明显:食品价格上涨使恩格尔系数有所回升;居住支出快速增长;家庭设备消费较快增长;汽车消费热点突出;义务教育负担减轻;衣着和医疗保健支出低速增长。
Descriptive Statistics此表描述了所统计的数据。
Statistics上述数据为用SPSS软件所作出的均值、方差、标准、峰度、偏度差等等数据,还有运用SPSS软件的回归分析、单一样本T检验所得到的数据和曲线图。
SPSS案例分析实例(消费习惯)用商品、礼品、消费者类型从4个不同权重下分别作中心趋势的粗略最大似然确定数。
二.均值比较检验分析与T 检验1.均值比较检验分析对年龄、家庭月收入、购物场所、购物频率、自用商品、礼品、消费者类型的均值比较检验分析如表2-1,、2-2所示表2-1Case Processin g Summary30100.0%0.0%30100.0%30100.0%0.0%30100.0%30100.0%0.0%30100.0%30100.0%0.0%30100.0%30100.0%0.0%30100.0%30100.0%0.0%30100.0%30100.0%0.0%30100.0%30100.0%0.0%30100.0%30100.0%0.0%30100.0%30100.0%0.0%30100.0%30100.0%.0%30100.0%年龄 * 1,男;2女婚否 * 1,男;2女交通状况 * 1,男;2女家庭成员数量 * 1,男;2女家庭月收入 * 1,男;2女购物频率 * 1,男;2女购物场所 * 1,男;2女自用商品 * 1,男;2女礼品 * 1,男;2女消费者类型 * 1,男;2女固定商场购买 * 1,男;2女NPercentN PercentNPercent IncludedExcluded Total Cases表 2-2Report2.14 1.71 2.86 1.86 2.14 2.14 1.71 1.86 1.71 2.29 1.5777777777777.900.488.900.900.900.900.488.690.488.951.5352.00 2.003.00 2.00 2.00 2.00 2.00 2.00 2.00 2.00 2.00111111111113243332324221322212131.810.238.810.810.810.810.238.476.238.905.286-.353-1.230-1.569.353-.353-.353-1.230.174-1.230.863-.374-1.817-.8404.287-1.817-1.817-1.817-.840.336-.840 1.245-2.8001.83 1.70 3.13 2.04 1.83 1.78 1.74 3.57 4.00 3.48 1.432323232323232323232323.778.470.869.767.834.736.449.992 1.279 1.831.5072.00 2.00 3.00 2.00 2.00 2.00 2.00 4.00 4.00 3.00 1.00111111111113243332556221322214451.605.221.755.589.696.542.202.984 1.636 3.352.257.324-.911-.725-.076.352.376-1.167-.503-1.427.135.282-1.220-1.291-.074-1.223-1.475-.975-.709.703 1.094-1.390-2.1131.90 1.70 3.07 2.00 1.90 1.87 1.73 3.17 3.47 3.20 1.473030303030303030303030.803.466.868.788.845.776.450 1.177 1.502 1.730.5072.00 2.00 3.00 2.00 2.00 2.00 2.00 3.00 4.00 3.00 1.00111111111113243332556221322214451.645.217.754.621.714.602.202 1.385 2.257 2.993.257.188-.920-.812.000.198.242-1.112-.209-.487.440.141-1.406-1.242.337-1.355-1.585-1.261-.824-.586-1.369-1.094-2.127Mean NStd. Dev iation Median Minimum Maximum Range Variance Skewness Kurtosis Mean NStd. Dev iation Median Minimum Maximum Range Variance Skewness Kurtosis Mean NStd. Dev iation Median Minimum Maximum Range Variance Skewness Kurtosis1,男;2女12Total年龄婚否交通状况家庭成员数量家庭月收入购物频率购物场所自用商品礼品消费者类型固定商场购买从图中可以看出,男性样本数为7,年龄的均值为2.14,中位数为2.0,交通状况的均值为2.86,中位数为3.00,家庭月收入的均值为2.14,中位数为2.0,购物场所的均值为2.14,中位数为2.0,购物频率的均值为2.14,中位数为2.0,购物频率的均值为1.71,中位数为2.0,自用商品的均值为1.86,中位数为2.0;礼品的均值为1.71,中位数为2.0,消费者类型的均值为2.29,中位数为2.00.2.单样本T 检验月收入与全国平均月收入2.5的比较,购物频率与全国平均购物频率2.5比较如表2-3、2-4所示表2-3One-Sample Statistics30 1.90.845.154301.87.776.142家庭月收购物频率NMean d. Deviatio Std. ErrorMean从图中可知,调查的样本总数为30,家庭月收入的中位数为1.90,购物频率的中位数是1.87。
对农民人均生活收入及消费支出的统计分析论文摘要: spss在经济、管理、医学及心理学等方面的研究起着很重要的作用,在我国的国民经济问题中,增加农民收入是我国扩大内需的关键,通过运用SPSS分析方法对我国农民的收入及消费支出进行了各种分析, 以便能够更好地了解我国农村居民的收入结构和消费结构与消费行为等。
关键词:农民生活收入消费支出线性回归分析一、引言今年以来,全国上下认真贯彻落实科学发展观,以农业增产、农民增收为目的,加大各项惠农政策措施落实力度,多措并举做好农村劳动力转移就业工作,克服金融危机和严重干旱等自然灾害带来的不利影响,使全市农村经济保持了稳定发展的良好态势,农民现金收入持续增长,生活消费水平继续提高。
我国是一个农业大国,至今仍有9亿农村人口,占全国人口总数的70%,农民是我国最大的群体,农村消费能力的提升直接关系到国民经济的全局。
从农村市场看,中国有近六成人口生活在农村。
农村城镇化的进程对经济增长的带动作用是非常明显的,世界上还没有哪个国家有规模如此巨大的城镇化。
农村居民的收入虽然低于城市居民,但是基数巨大,且农村人口的收入也在稳定增长。
随着经济的发展,我国农民的收入水平和消费水平的结构也发生了很大变化,农民生活水平的提高和消费的增加对于实现国民经济又好又快发展、正确处理好内需和外需的关系至关重要。
但从总体来看,农民消费水平仍然较低,调查显示有的地区都不及城市居民人均消费支出的三分之一。
而且消费结构不合理,局限于食品类等生存基本需求品,消费在衣着装饰等方面的极少。
而影响农民消费水平的根本原因是农民的收入。
农民生活消费支出主要包括食品、衣着、医疗卫生、教育文化、家庭设备、交通等方面,本文只挑选了四种典型的消费支出作为代表来分析农村居民的消费结构。
二、对多元数据因子分析及及结果解释2、下表是要进行处理的31个省市的农村居民消费相关的原始数据三、家庭总收入分析1、农村家庭总收入单线图,农村家庭总收入逐年增加。
SPSS对于居民收入水平的数据分析随着时代的发展,生产力水平的不断提高,我国居民的收入水平也在稳步提高,通过对30个省市自治区居民收入的各项指标进行因子分析,聚类分析等,得到各省之间的收入对比,以及找出哪些指标可以比较充分的说明它的整体情况。
我们共选择了12个指标:X1劳动者报酬、X2家庭营业收入、X3转移性收入、X4财产性收入、X5食品支出、X6衣着支出、X7居住支出、X8家庭设备及服务支出、X9医疗保健支出、X10交通和通讯支出、X11文教娱乐用品和服务支出、X12其他商品及服务支出。
一.因子分析:⑴.首先,我们需要检验一下数据是否适合做因子分析,即进行KMO检验:由上表可知,KMO值为0.771,大于0.6,所以数据适合做因子分析。
⑵.SPSS得出因子提取和因子旋转的结果:由上表可知,较大的三个因子变量的方差特征值为8.063,1.170,0.810。
它们的累计贡献率达到了83.689%。
⑶.将这三个特征值建立因子载荷阵,如左下图所示:将得到的因子载荷阵实行方差最大的正交旋转,得正交因子阵,如右上图所示。
由表知,第一个主因子可以比较充分的说明除了家庭营业收入和交通和通讯支出以外的的各项指标,而第二个主因子表达了家庭营业收入和医疗保健支出这两个指标,第三个主因子只体现了交通和通讯支出。
综上可得,这三个主因子涵盖了所有指标,所以SPSS成功的帮助我们将12个指标降围成这三个指标。
我们命名X1-X9为A因子,X10-X11为B因子,X12为C因子。
⑷.由下图可看出,右侧下方的指标非常密集,这个就是由第一个主因子表示的,右侧上方的两个指标由第二个主因子表达,而左侧的一个较孤立跟其他指标有很明显的距离的指标,则由第三个主因子表示。
载荷散点图很直观的向我们表达了这三个主因子的选取。
⑸.由下图,可得因子得分函数:Component Score Coefficient MatrixComponent1 2 3劳动者报酬.245 -.241 -.089 家庭营业收入-.300 .859 .007转移性收入.166 -.187 .187财产性收入.038 .050 .255食品支出.085 .063 .110衣着支出.135 .008 -.140 居住支出.157 -.047 -.095 家庭设备及服务支出.216 -.172 -.068 医疗保健支出-.055 .425 -.168 交通和通讯支出-.073 -.056 .815文教娱乐用品和服务支出.096 .047 .049其他商品及服务支出.128 .007 -.007⑹. 最后一部分,因子变量的协方差矩阵,由下表可知,各因子之间是不相关的,符合要求。
基于SPSS的全国城镇居民消费水平差异分析全国城镇居民消费水平差异分析是对全国不同城镇居民的消费水平进行比较和分析的研究。
本文将使用SPSS软件来进行统计分析和数据可视化,以便更好地理解全国城镇居民消费水平的差异。
一、数据收集和整理我们需要收集全国各城镇的消费水平数据。
可以通过调查问卷、官方统计数据或者是公开发布的数据来获得这些数据。
收集到的数据应包括以下几个方面的指标:人均可支配收入、食品消费支出、非食品消费支出、居住消费支出、交通通信消费支出、教育文化娱乐消费支出、医疗保健消费支出等。
然后,我们需要将收集到的数据整理成适合SPSS分析的形式。
可以使用Excel软件来整理数据,将不同城镇的数据分别放在不同的列中,并为每个指标添加适当的标签。
二、数据描述和概括统计在进行数据分析之前,首先需要对数据进行描述和概括统计。
可以使用SPSS软件中的“描述统计”功能来计算每个指标的平均值、标准差、最小值、最大值等。
这些统计指标可以帮助我们更好地了解数据的分布情况。
三、差异分析接下来,我们可以使用SPSS软件中的t检验或者方差分析等方法来比较不同城镇之间的消费水平差异。
在进行差异分析之前,需要对数据进行正态性检验和方差齐性检验。
正态性检验可以通过SPSS软件中的“相关-一样本Kolmogorov-Smirnov检验”来进行。
当样本满足正态分布假设时,我们可以使用t检验来比较两个城镇之间的差异。
如果样本不满足正态分布假设,我们可以使用方差分析来比较多个城镇之间的差异,即在因变量中考虑城镇这个分类变量,并进行多个分类的方差分析。
在SPSS软件中,可以使用“分组统计”功能来进行方差分析。
四、数据可视化数据可视化是对分析结果进行直观展示和解释的重要步骤。
可以使用SPSS软件中的图表功能来生成不同城镇消费水平的柱状图、折线图、箱线图等图形,以便更好地比较和展示数据的差异。
还可以根据需要生成散点图、气泡图等,将不同城镇的消费水平与其他指标(如居住面积、教育水平等)进行关联分析,以探索不同因素对消费水平的影响。
对各地区城镇居民消费水平主要影响因素的浅析摘要:改革开放以来,随着我国经济的飞速发展,人民生活水平不断提高,居民消费水平也不断增长。
由于居民消费在社会经济生活中具有重要作用,研究居民消费的影响因素具有较强的经济意义。
虽然我国整体的居民消费水平呈增长的趋势,但是,在各个地区的增长速度却不尽相同。
本文希望运用SPSS软件,通过分析全国31个省、直辖市的相关数据,建立相关的回归模型;再通过回归分析找出各个因素的影响力水平的大小,以其为根据原因提出解决建议。
关键词:居民消费水平收入消费价格指数影响因素SPSS分析引言:近年来,随着我国经济的不断发展,我国的经济地位在国际上不断地得以巩固,国内生产总值一举超越日本成为世界第二。
与此同时,各地区城镇居民平均每人全年家庭收入也发生了变化,各地区居民消费价格指数也波动起伏,带动了各地区城镇居民消费水平的变化。
所以说,观察并发现这几个变量间的关系具有重大意义,我们可以发现过去存在的问题,避免同样的问题在未来还会出现,让国民经济健康发展,让人民的生活水平以及质量得以提高。
一、各个概念解释1、居民消费水平居民消费水平是指居民在物质产品和劳务的消费过程中,对满足人们生存、发展和享受需要方面所达到的程度。
通过消费的物质产品和劳务的数量和质量反映出来。
居民消费水平是指居民在物质产品和劳务的消费过程中,对满足人们生存、发展和享受需要方面所达到的程度。
它主要通过消费的物质产品和劳务的数量和质量来反映。
城镇居民消费水平是专门反应城镇地区居民对满足人们生存、发展和享受需要方面所达到的程度。
2、城镇居民人均可支配收入城镇居民人均可支配收入是指反映居民家庭全部现金收入能用于安排家庭日常生活的那部分收入。
它是家庭总收入扣除交纳的所得税、个人交纳的社会保障费以及调查户的记账补贴后的收入。
主要包括工资性收入、经营性收入、财产性收入、转移性收入的总和,不包括出售财物和借贷收入。
3、居民消费价格指数消费物价指数英文缩写为CPI,是根据与居民生活有关的产品及劳务价格统计出来的物价变动指标,通常作为观察通货膨胀水平的重要指标。
天津理工大学中环信息学院课程设计课程名称:SPSS统计分析设计题目:用SPSS软件对全国农村居民人均收入与消费的统计进行分析姓名:薛存莲学号: 10080065系别:经济与管理系专业班级: 10信管2班开始日期: 2012 年 5 月 20 日完成日期 2012 年 6 月 20 日指导教师:赵飞燕成绩评定等级(分数)全国农村居民人均收入与消费的统计【摘要】本文运用多元线性回归方法及基础理论,通过建立回归模型的基本过程和借助于SPSS及SAS统计软件,建立我国全国农村居民人均收入与全国人均消费支出的初步模型与优化模型。
分析农民人均纯收入和生活消费支出的关系,从中寻求影响农民消费水平的主要因素,并量化其影响程度。
结果表明:收入是影响农村居民消费支出的主要因素,不同收入来源对消费水平影响不同,工资性收入和家庭经营性收入对其影响较小但较为稳定,财产性收入和转移性收入的影响较大但不稳定,高收入阶层收入的增加对消费影响较小,中低收入阶层收入的增加对消费影响较大,但收入较低和最低阶层消费则有其特殊性。
对此,应千方百计增加农民收入,重点提高中低收入阶层农民收入,不断开拓农村新的消费热点,以促进农村经济的快速发展。
农村居民人均纯收入是农村居民纯收入按照农村住户人口平均的纯收入水平。
它反映的是全国或一个地区农村居民的平均收入水平。
农村居民人均纯收入是一个年度核算指标。
农村居民纯收入是农村住户当年从各个来源得到的总收入相应地扣除有关费用性支出后的收入总和。
农村居民家庭总收入包括工资性收入、家庭经营收入、财产性收入、转移性收入。
近年来,中国农村居民人均收入和消费水平呈逐年提高、增长速度加快的趋势,但与城镇居民相比,消费和收入水平仍存在较大差距,应当从提高农村居民收入水平、健全社会保障程度等角度进一步提高农村居民生活水平。
关键词:人均收入与消费,一元回归的分析,相关性分析目录第一章问题研究的背景及意义 (3)第二章研究的相关理论 (3)第三章数据及分析 (4)3.1描述性统计分析 (4)3.2统计图的绘制 (5)3.3均值比较 (6)第四章相关性分析 (7)第五章一元回归的分析. . . . . . . . . . . . . . . . . . . 7 第六章时间序列的曲线估计. . . . . . . . . . . . . . . . . 10 第七章总论. . . . . . . . . . . . . . . . . . . . . . . . 12一、问题研究的背景及意义农村居民消费结构是衡量农村居民生活水平的一个重要指标,我国是农业大国,农村居民是一个庞大的消费群体。
农村居民家庭纯收入和消费支出的多元回归分析我国农村经济体制改革所取得的快速发展给农民带来了真正的实惠,居民的收入和消费水平有了较大幅度的提高。
由于地区间经济发展的不平衡、自然条件以及消费观念等因素的影响,农村居民家庭不同的消费支出对纯收入的影响存在较大差异,如何客观、合理、准确地分析各个消费指标对纯收入的影响情况,具有重要的理论和现实意义。
因此,笔者应用多元统计分析原理对我国农村居民家庭纯收入和消费支出问题进行了多元回归分析。
1 数据来源、变量和原始数据数据来源于《西藏统计年鉴2008》提供的2007年各省(区、市)人民生活、居民消费价格分类指数。
把生活消费的8大支出:食品( X1) 、烟酒及用品( X2) 、衣着( X3) 、家庭设备用品及服务( X4) 、医疗保健和个人用品( X5) 、交通和通信( X6) 、娱乐教育文化( X7) 、居住( X8)作为自变量,纯收入( Y)作为因变量,得到原始数据表1(略去其他部分只显示部分数据)。
2 计量统计结果2. 1线性回归分析线性回归分析是研究因变量和自变量之间变动比例关系的一种方法,一般数学模型为y =β0 +β1X1 +β2 X2 + ⋯ +βp X p+ε, 其中,βi ( i = 1, 2, ⋯, p)为待估参数, xi 为观测值,ε为服从标准正态分布N (0, 1)的随机变量。
现以8个消费支出为自变量、纯收入为因变量,利用SPSS统计分析软件建立多元线性回归模型。
y = 200 066.3511 - 273.3943X1+ 76.5605X2+61.8698X3+ 43.2543X4- 626.348 2X6 - 481.2846X7- 462.4837X8 (1)如表2所示,诊断每个自变量所受多重共线性影响大小的指标V IF (膨胀系数)不大,表明各自变量之间的多重共线效应不明显,表3的结果也反映了这点。
注: b0 , b1 , ⋯, b8 (回归系数)分别表示参数β0 ,β 1 , ⋯,β8 的最小二乘估计。
家庭收入与消费状况的理财分析进入二十一世纪以来,我国经济飞速发展,人民生活水平日益提高,家庭的可支配收入不断增长,家庭理财成为当前的热门话题。
如何做好家庭理财,这是一门复杂的学问。
本文针对二十个家庭的收入与消费支出情况进行比较,谈谈自己对家庭理财的一些看法。
首先运用一元线性回归分析方法分析二十个家庭的收入与消费的关系下面是二十个家庭收入与消费的基本情况(X表示收入、Y表示消费)在运用一元回归分析时,我们设得到的一元回归方程式为Y=α+βx,下面是我们通过模型分析来分别判定模型是否合适及合适时的α、β值并求出一元回归方程式。
1-1模型综述表模型综述表分别给出了判定系数R=0.993和判定系数的平方为0.986和调整后的判定系数0.985。
当调整后的判定系数大于等于0.8时,说明回归方程的拟合效果很好。
而在此例中调整后的判定系数为0.985远远高于所要求的拟合效果的判定系数,所以此回归方程的模型较好。
1-2方差分析表在方差分析表中分别给出了回归项、残差、平方和、自由度(DF)、均方、F值和对应的尾概率值。
在本例中尾概率值Sig.=0.000,可以得出回归方程是非常显著的。
1-3 系数分析表在系数分析表中,模型栏下面的常量表示的是常数项系数的估计,就是对α值的估计。
X项表示的就是对回归系数β的估计。
其中统计量值(t)检验了尾概率值Sig=0.000是通过的。
所以求的的回归系数值就是Sig为0.000时所对应的x=0.899。
而确定了回归系数β值后,就可以找到所对应的α值0.847。
即所求的的一元回归线性方程为Y=0.847+0.899x。
也就是收入与消费的关系是呈Y=0.847+0,899x的一元线性关系。
根据以上的回归分析,我们可以看出,一个家庭的收入和消费是呈一定的相关关系的。
一般情况下是是收入越高,消费的支出越大,而在消费支出较大这一部分家庭中可以加强理财观念二、运用聚类分析的方法对二十个家庭的收入和消费水平进行分类下面是二十个家庭的收入和消费的情况(x表示收入,y表示消费)2-1凝聚状态表图2-1为凝聚状态表,表的第一列是聚类分析的步骤号,可以看出一共进行了19次聚类。
SPSS统计分析案例专业:经济学姓名:000 学号:00000000一、我国城镇居民现状近年来,我国宏观经济形势发生了重大变化,经济发展速度加快,居民收入稳定增加,在国家连续出台住房、教育、医疗等各项改革措施和实施“刺激消费、扩大内需、拉动经济增长”经济政策的影响下,全国居民的消费支出也强劲增长,消费结构发生了显著变化,消费结构不合理现象得到了一定程度的改善。
本文通过相关数据分析总结出了我国城镇居民消费呈现富裕型、娱乐教育文化服务类消费攀升的趋势特点。
二、我国居民消费结构的横向分析第一,食品消费支出比重随收入增加呈现出明显的下降趋势,这与恩格尔定律的表述一致。
但最低收入户与最高收入恩格尔系数相差太过悬殊,城镇最低收入户刚刚解决了温饱问题,而最高收入户的生活水平按照恩格尔系数的评价标准早已达到了富裕型,甚至接近最富裕型。
第二,衣着消费支出比重随收入增加缓慢上升,到高收入户又有所下降,但各收入组支出比重相差不大。
衣着支出比重没有更多的递增且最高收入户的支出比重有所下降,这些都符合恩格尔定律关于衣着消费的引申。
随着收入的增加,衣着支出比重呈现先上升后下降的走势。
事实上,在当前的价格水平和服装业的发展水平下,城镇居民的穿着是有一定限度的,而且居民对衣着的需求也不是无限膨胀的,即使收入水平继续提高,也不需要将更大的比例用于购买服饰用品了。
第三,家庭设备用品及服务、交通通讯、娱乐教育文化服务和杂项商品与服务的支出比重呈逐组上升趋势,说明居民的生活水平随收入的增加而不断提高和改善。
第四,医疗保健支出比重随收入水平提高呈现一种两端高、中间低的走势。
这是因为医疗保健支出作为生活必须支出,不论页脚内容1居民生活水平高低,都要将一定比例的收入用于维持自身健康,而且由于医疗制度改革,加重了个人负担的同时,也减小了旧制度可能造成的不同行业、不同体制下居民医疗保健支出的差别,因而不同收入等级的居民在医疗保健支出比重上差别不大。
家庭收入与消费状况的理财分析进入二十一世纪以来,我国经济飞速发展,人民生活水平日益提高,家庭的可支配收入不断增长,家庭理财成为当前的热门话题。
如何做好家庭理财,这是一门复杂的学问。
本文针对二十个家庭的收入与消费支出情况进行比较,谈谈自己对家庭理财的一些看法。
首先运用一元线性回归分析方法分析二十个家庭的收入与消费的关系下面是二十个家庭收入与消费的基本情况(X表示收入、Y表示消费)
在运用一元回归分析时,我们设得到的一元回归方程式为Y=α+βx,下面是我们通过模型分析来分别判定模型是否合适及合适时的α、β
值并求出一元回归方程式。
1-1 模型综述表
模型综述表分别给出了
判定系数R=0.993和判定系数的平方为0.986和调整后的判定系数0.985。
当调整后的判定系数大于等于0.8时,说明回归方程的拟合效果很好。
而在此例中调整后的判定系数为0.985远远高于所要求的拟合效果的判定系数,所以此回归方程的模型较好。
1-2 方差分析表
Anova b
模型 平方和 df
均方
F
Sig. 1
回归 2179.716 1 2179.716 1262.637 .000a
残差 31.074 18 1.726 总计
2210.790
19
a. 预测变量: (常量), X 。
b. 因变量: Y
在方差分析表中分别给出了回归项、残差、平方和、自由度(DF )、均方、F 值和对应的尾概率值。
在本例中尾概率值Sig.=0.000,可以
模型汇总b
模型 R R 方 调整 R 方
标准 估计的误
差 1
.993a
.986
.985
1.3139
a. 预测变量: (常量), X 。
b. 因变量: Y
得出回归方程是非常显著的。
1-3 系数分析表
系数a
模型非标准化系数标准系数
t Sig.
B 的 96.0% 置信区
间
B 标准误差试用版下限上限
1 (常量) .847 .703 1.204 .244 -.710 2.404
X .899 .025 .993 35.534 .000 .843 .955 a. 因变量: Y
在系数分析表中,模型栏下面的常量表示的是常数项系数的估计,就是对α值的估计。
X项表示的就是对回归系数β的估计。
其中
统计量值(t)检验了尾概率值Sig=0.000是通过的。
所以求的的回
归系数值就是Sig为0.000时所对应的x=0.899。
而确定了回归系数
β值后,就可以找到所对应的α值0.847。
即所求的的一元回归线性
方程为Y=0.847+0.899x。
也就是收入与消费的关系是呈
Y=0.847+0,899x的一元线性关系。
根据以上的回归分析,我们可以看出,一个家庭的收入和消费
是呈一定的相关关系的。
一般情况下是是收入越高,消费的支出越大,而在消费支出较大这一部分家庭中可以加强理财观念
二、运用聚类分析的方法对二十个家庭的收入和消费水平进行分类
下面是二十个家庭的收入和消费的情况(x表示收入,y表示消费)
2-1凝聚状态表
聚类表
阶
群集组合
系数
首次出现阶群集
下一阶群集 1 群集 2 群集 1 群集 2
1 1 20 4.840 0 0 10
2 4 14 5.000 0 0 12
3 3 12 5.410 0 0 8
4 8 18 5.840 0 0 13
5 6 11 7.610 0 0 15
6 5 10 8.410 0 0 11
7 2 17 8.840 0 0 13
8 3 13 9.605 3 0 16
9 15 19 12.240 0 0 14
10 1 16 13.620 1 0 14
11 5 7 15.005 6 0 16
12 4 9 15.340 2 0 15
13 2 8 39.920 7 4 17
14 1 15 47.670 10 9 17
15 4 6 52.812 12 5 18
16 3 5 87.850 8 11 19
17 1 2 181.314 14 13 18
18 1 4 434.159 17 15 19
19 1 3 882.262 18 16 0
图2-1为凝聚状态表,表的第一列是聚类分析的步骤号,可以看出一共进行了19次聚类。
第二列和第三列表示的是哪两个家庭进行了合并。
第四列是聚类时两个样品间的距离,可以看出距离最近的样品先聚类。
第五列和第六列表示某步聚类时,时样品还是类参与了合并。
第七列表示本部的聚类结果在下面聚类的第几步用到。
如表格的第一行中所示,表示的是第一个样品和第二十个样品先聚类,样品间的距离为4.84,这个聚类结果到第十步用到。
第二行表示第4个样品和第十四个样品聚类,样品间距离为5,这个聚类结果到第十二步会用到。
其他行的含义类似。
最后经过了19次的聚类,所有样品聚成一个大类。
2-2垂直冰柱图
垂直冰柱图中的第一列表示类的数目,从图中的比例来可以得出总的类数目为19,就是指样品聚类成19类。
通过冰柱图的冰柱长度来看可以明确的看到7、10、5、13、12、3属于一类,其他的样品则属于另一类。
冰柱图的优点就在于清楚明了,容易观察到结果。
2-3 树状图
* * * * * * * * * * * * * * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * * * * * * * * * * * * * *
Dendrogram using Average Linkage (Between Groups)
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
1 1 -+
20 20 -+-+
16 16 -+ +-------+
15 15 -+-+ |
19 19 -+ +-------------+
8 8 -+ | |
18 18 -+---------+ |
2 2 -+ +-----------------------+
17 17 -+ | |
6 6 -+-+ | |
11 11 -+ +---------------------+ |
4 4 -+ | |
14 14 -+-+ |
9 9 -+ |
3 3 -+ |
12 12 -+---+ |
13 13 -+ +-------------------------------------------+
5 5 -+ |
10 10 -+---+
7 7 -+
树状图是将实际比例的距离按比例调整到0-25的范围内,用逐级连线的方式连接距离相近的样品和类,直至成为一大类。
从上图中可以看出,20个样品最适合分成两类。
从3开始可以将下面的六个样品分成一大类。
2-4保存的分析结果
上图显示的是指定分成两类后系统聚类分析保存的结果。
可以更加清晰的看到将20个家庭的消费和收入情况分成了两类。
进而对两类家庭做更深一步的分析。