SPSS实验报告模板总结模板计划模板线性回归曲线估计
- 格式:doc
- 大小:163.50 KB
- 文档页数:9
实验名称:公共政策中的回归分析实验目的:明确公共政策分析中回归分析方法的主要用途,了解回归分析的基本方法实验方法:SPSS中的一元线性回归分析、非线性回归分析、多元线性回归分析和因子分析等。
数据来自于《2009年国家统计局第二次统计》年份GDP(亿元)城乡居民人民币储蓄存款(亿元)能源生产总量(万吨标准煤)货物进出口总额(亿元)1990.00 18667.80 7119.60 103922.00 5560.10 1991.00 21781.50 9244.90 104844.00 7225.80 1992.00 26923.50 11757.30 107256.00 9119.60 1993.00 35333.90 15203.50 111059.00 11271.00 1994.00 48197.90 21518.80 118729.00 20381.90 1995.00 60793.70 29662.30 129034.00 23499.90 1996.00 71176.60 38520.80 133032.00 24133.80 1997.00 78973.00 46279.80 133460.00 26967.20 1998.00 84402.30 53407.50 129834.00 26849.70 1999.00 89677.10 59621.80 131935.00 29896.20 2000.00 99214.60 64332.40 135048.00 39273.20 2001.00 109655.20 73762.40 143875.00 42183.60 2002.00 120332.70 86910.70 150656.00 51378.20 2003.00 135822.80 103617.70 171906.00 51378.20 2004.00 159878.30 119555.40 196648.00 70483.50 2005.00 184937.40 141051.00 216219.00 95539.10 2006.00 216314.40 161587.30 232167.00 116921.80 2007.00 265810.30 172534.20 247279.00 140971.40 2008.00 314045.40 217885.40 260552.00 166740.20 2009.00 340506.90 260771.70 274618.00 150648.10实验一探究GDP和能源生产总量之间的线性关系1.GDP和能源生产总量的散点图位置如下点击分析—回归—线性回归,得到如下数据;输入/移去的变量(b)a 已输入所有请求的变量。
回归分析实验内容:基于居民消费性支出与居民可支配收入的简单线性回归分析【研究目的】居民消费在社会经济的持续发展中有着重要的作用。
影响各地区居民消费支出的因素很多,例如居民的收入水平、商品价格水平、收入分配状况、消费者偏好、家庭财产状况、消费信贷状况、消费者年龄构成、社会保障制度、风俗习惯等等。
为了分析什么是影响各地区居民消费支出有明显差异的最主要因素,并分析影响因素与消费水平的数量关系,可以建立相应的经济模型去研究。
【模型设定】我们研究的对象是各地区居民消费的差异。
由于各地区的城市与农村人口比例及经济结构有较大差异,现选用城镇居民消费进行比较。
模型中被解释变量Y选定为“城市居民每人每年的平均消费支出”。
从理论和经验分析,影响居民消费水平的最主要因素是居民的可支配收入,故可以选用“城市居民每人每年可支配收入”作为解释变量X,选取2010年截面数据。
1、实验数据表1:2010年中国各地区城市居民人均年消费支出和可支配收入数据来源:《中国统计年鉴》2010年2、实验过程作城市居民家庭平均每人每年消费支出(Y)和城市居民人均年可支配收入(X)的散点图,如图1:从散点图可以看出居民家庭平均每人每年消费支出(Y)和城市居民人均年可支配收入(X)大体呈现为线性关系,所以建立如下线性模型:Y=a+bX表2模型汇总b模型R R方调整R方标准估计的误差1 .965a.932 .930 877.29128a.预测变量:(常量),可支配收入X(元)。
b.因变量:消费性支出Y(元)表3相关性表4系数a3、结果分析表2模型汇总:相关系数为0.965,判定系数为0.932,调整判定系数为0.930,估计值的标准误877.29128表3是相关分析结果。
消费性支出Y与可支配收入X相关系数为0.965,相关性很高。
表4是回归分析中的系数:常数项b=704.824,可支配收入X 的回归系数a=0.668。
a的标准误差为0.034,回归系数t的检验值为19.921,P值为0,满足95%的置信区间,可认为回归系数有显著意义。
【精品】SPSS统计实验报告多元线性回归分析
本文旨在通过多元线性回归分析,深入研究X、Y、Z三个变量之间的关系,以探究这三个变量对结果的影响。
本实验中样本数量为100人,本文采用SPSS22.0计算软件进行多元线性回归分析,统计计算结果如下:
(一)检验变量X、Y、Z三个变量是否有关:
Sig.=.633。
结果显示,该值大于0.05,表明X、Y、Z三者之间没有显著统计关系;
(二)确定拟合模型:
以X、Y、Z三个变量回归拟合,得出模型为:y=1.746+0.660X+0.783Y+0.430Z。
(三)检验回归模型的有效性:
1. 回归系数的统计量检验
模型的R方为.668,该值表明,X、Y、Z三个自变量可以解释本回归模型的67.0%的变化量;
2.F检验
结果显示,f分数为20.670,Sig.=.000,结果显示,f分数小于阈值0.05,因此可以接受回归模型;
检验结果显示,当其他X、Y、Z三个自变量的条件不变的情况下,X、Y、Z三个自变量对Y的影响是有显著性的。
综上所述,本文使用SPSS22.0计算软件进行多元线性回归分析,探究X、Y、Z三个变量之间的关系。
结果显示,X、Y、Z三者之间没有显著统计关系;拟合模型为:
y=1.746+0.660X+0.783Y+0.430Z;最后,证实X、Y、Z三个自变量对Y的影响是有显著性的。
运用S P S S建立多元线性回归模型并进行检验副本集团标准化工作小组 #Q8QGGQT-GX8G08Q8-GNQGJ8-MHHGN#计量经济学实验报告一.实验目的:1、学习和掌握用SPSS做变量间的相关系数矩阵;2、掌握运用SPSS做多元线性回归的估计;3、用残差分析检验是否存在异常值和强影响值4、看懂SPSS估计的多元线性回归方程结果;5、掌握逐步回归操作;6、掌握如何估计标准化回归方程7、根据输出结果书写方程、进行模型检验、解释系数意义和预测;二.实验步骤:1、根据所研究的问题提出因变量和自变量,搜集数据。
2、绘制散点图和样本相关阵,观察自变量和因变量间的大致关系。
3、如果为线性关系,则建立多元线性回归方程并估计方程。
4、运用残差分析检验是否存在异常值点和强影响值点。
5、通过t检验进行逐步回归。
6、根据spss输出结果写出方程,对方程进行检验(拟合优度检验、F检验和t检验)。
7、输出标准化回归结果,写出标准化回归方程。
8、如果通过检验,解释方程并应用(预测)。
三.实验要求:研究货运总量y与工业总产值x1,农业总产值x2,居民非商品支出x3,之间的关系。
详细数据见表:(1)计算出y,x1,x2,x3的相关系数矩阵。
(2)求y关于x1,x2,x3的三元线性回归方程(3)做残差分析看是否存在异常值。
(4)对所求方程拟合优度检验。
(5)对回归方程进行显着性检验。
(6)对每一个回归系数做显着性检验。
(7)如果有的回归系数没有通过显着性检验,将其剔除,重新建立回归方程,在做方程的显着性检验和回归系数的显着性检验。
(8)求标准化回归方程。
(9)求当x1=75,x2=42,x3=时y。
并给出置性水平为99%的近似预测区间。
(10)结合回归方程对问题进行一些基本分析。
四.绘制散点图或样本相关阵相关性货运总量工业总产值农业总产值居民非商品支出货运总量Pearson 相关性 1 .556 .731*.724*显着性(双侧).095 .016 .018 N 10 10 10 10工业总产值Pearson 相关性.556 1 .155 .444 显着性(双侧).095 .650 .171 N 10 11 11 11农业总产值Pearson 相关性.731*.155 1 .562 显着性(双侧).016 .650 .072 N 10 11 11 11居民非商品支出Pearson 相关性.724*.444 .562 1 显着性(双侧).018 .171 .072N 10 11 11 11*. 在水平(双侧)上显着相关。
上,看哪种模型拟合效果更好从拟合优度(Rsq 即R2)来看,QUA,CUB,POW 效果较好(因为其Rsq 值较大),于是就选QUA,CUB,POW来进行。
重新进行上面的过程,只选以上三种模型。
3、实验结果:Model Summary and Parameter EstimatesDependent Variable:远视率EquationModel Summary Parameter EstimatesRSquare F df1 df2 Sig。
Constant b1 b2 b3Linear。
674 22。
7101 11 .001 74.006—4。
768Logarith mic .793 42.251 1 11 。
000 156。
773-57.574Inverse。
883 83.244 1 11 。
000 -40。
567 615.321Quadrati c .94382。
1142 10 .000 192.085-26.567。
908Cubic.959 69。
5383 9 .000 290.851—54。
7173.398 —。
069Compound。
794 42.445 1 11 .000 308。
120 .731Power.861 68.413 1 11 .000 49462.724—3。
638S .877 78.119 1 11 .000 -1。
502 37.175Growth.794 42。
4451 11 。
000 5。
730 —。
314Exponen tial .79442。
4451 11 。
000 308.120 -.314Logistic 。
794 42.445 1 11 。
000 .003 1。
369The independent variable is 年龄.分析:可以用Cubic拟合曲线图的拟合效果最好.第四题:棉花单株在不同时期的成铃数(y)与初花后天数(x)存在非线性的关系,假设这一非线性关系可用Gompertz模型表示:y=b1*exp(-b2*exp(—b3*x))。
中国计量学院现代科技学院实验报告实验课程:应用统计学实验名称:回归分析班级:学号:姓名:实验日期: 2012.05.23 实验成绩:指导教师签名:一.实验目的一元线性回归简单地说是涉及一个自变量的回归分析,主要功能是处理两个变量之间的线性关系,建立线性数学模型并进行评价预测。
本实验要求掌握一元线性回归的求解和多元线性回归理论与方法。
二.实验环境中国计量学院现代科技学院机房310三.实验步骤与内容1打开应用统计学实验指导书,新建excel表地区供水管道长度(公里)全年供水总量(万平方米)北京15896 128823 天津6822 64537 河北10771.2 160132 山西5669.3 77525 内蒙古5635.5 59276 辽宁21999 280510 吉林6384.9 159570 黑龙江9065.9 153387 上海22098.8 308309 江苏36632.4 380395 浙江24126.9 235535 安徽7389.4 204128 福建6270.4 118512 江西5094.7 143240 山东26073.9 259782 河南11405.6 185092 湖北15668.6 257787 湖南9341.8 262691 广东35728.8 568949 广西6923.1 134412 海南1726.7 20241 重庆6082.7 71077 四川12251.3 165632 贵州3275.3 45198 云南5208.5 52742 西藏364.9 5363陕西4270 73580甘肃5010 62127青海893 14390宁夏1538.2 22921新疆3670.2 766852.打开SPSS,将数据导入3.打开分析,选择回归分析再选择线性因变量选全年供水总量,自变量选供水管道长度统计里回归系数选估计,再选择模型拟合按继续再按确定会出来分析的结果对以上结果进行分析:(1)回归方程为:y=28484.712+11.610X(X是自变量供水管道长度,Y是因变量全年供水总量)(2)检验1)拟合效果检验根据表2可知,R2=0.819,即拟合效果好,线性成立。
《数据剖析实务与事例实验报告》曲线预计学号: 204班级: 2013应用统计姓名:日期: 2 0 1 4–12–7数学与统计学学院一、实验目的1.正确理解曲线回归剖析的方法原理。
2.认识怎样将实质线性关系模型转变为线性关系模型进行回归剖析。
3.娴熟掌握曲线预计的 SPSS操作。
4.掌握成立适合曲线模型的判断依照。
5.掌握怎样利用曲线回归方程进行展望。
6.培育运用多曲线预计解决身旁实质问题的能力。
二、准备知识1.非线性模型的基本内容变量之间的非线性关系能够区分为实质线性关系和实质非线性关系。
所谓实质线性关系是指变量关系形式上固然呈非线性关系,但能够经过变量转变为线性关系,并可最后进行线性回归剖析,成立线性模型。
实质非线性关系是指变量之间不单形式上体现非线性关系,并且也没法经过变量转变为线性关系,最后没法进行线性回归剖析,成立线性模型。
本实验针对实质线性模型进行。
下边介绍本次实验波及到的可线性化的非线性模型,所用的变换既有自变量的变换,也有因变量的变换。
乘法模型:y x1 x2 x3此中,,,都是未知参数,是乘积随机偏差。
对上式两边取自然对数获得ln y ln ln x1 ln x 2 ln x3 ln上式拥有一般线性回归方程的形式,因此用多元线性回归的方法来办理。
然而,一定重申指出的是,在求置信区间和做有关试验时,一定是ln : N (0, 2 I n ) ,而不是: N( 0, 2 I n), 所以查验以前,要先查验ln 能否知足这个假定。
三、实验内容已有好多学者考证了能源花费与经济增添的因果关系,证了然能源花费是促使经济增添的原由之一。
也有众多学者利用 C-D 生产函数考证了劳动和资本对经济增添的影响机理。
所有这些研究都很少将劳动、资本、和能源成立在一个模型中来研究三个要素对经济增添的作用方向和作用大小。
现从我国能源花费、全社会固定财产投资和就业人员的实质出发,假定生产技术水平在短期能不会发生较大变化,经济增添、全社会固定财产投资、就业人员、能源花费能够分别采纳国内生产总值、全社会固定财产投资总量、就业总人数、能源花费总量进行权衡,并假定经济增添与能源花费、资本和劳动力的关系均知足 C-D 生产函数。
问题中的 C-D 生产函数为:Y AK L E式中: Y 为 GDP,权衡总产出; K 为全社会固定财产投资,权衡资本投入量;L 为就业人数,权衡劳动投入量; E 为能源花费总量,权衡能源投入量; A,,,为未知参数。
依据C-D 函数的假定,一般情况,,均在0和1之间,但当,,中有负数时,说明这类投入量的增添,反而会惹起GDP的降落,当,,中出现大于1的值时,说明这类投入量的增添会惹起GDP成倍增添,这在经济学现象中都是存在的。
以我国 1985—2004 年的有关数据成立了SPSS数据集,拜见“”。
请以此数据集为基础预计生产函数中的未知参数。
四、实验步骤及结果剖析1.确立非线性回归模型的种类有上述剖析过程确立要成立的回归模型为:Y AK L E式中, Y 为自变量, K,L,E 为解说变量, A 为常数项。
2.经过变换将非线性方程转变为线性方程将原回归模型两遍同时取对数:ln Y ln A ln K ln L ln E得:y c x1x2x3式中, y ln Y, c ln A, x1ln K , x2ln L, x3ln E。
选择【变换】—【计算变量】,对所有数据取对数达成数据的办理,过程及结果以下列图:3.进行初步线性回归剖析(选入所有变量)用最小二乘法成立回归方程由非线性模型转变为线性模型后,即可依照成立多元线性回归模型的步骤进行操作,求得回归方程表达式。
(1)选择【剖析】→【回归】→【线性】,弹出“线性回归”对话框。
将 lnY 选入“因变量”框, lnk 到 lnE 选入“自变量”框。
注意,能够经过点击“上一张”与“下一张”按钮切换,选择不一样的自变量建立模型,每个模型中能够对不同的自变量采纳不一样的方法进行回归。
“方法”下拉框中有5 个选项,此处先选择“进入”,即所选变量所有强前进入回归模型。
(2)点击“统计量”按钮,选择输出各样常用鉴别统计量,本事例选择“估计”、“模型拟合度”、“描绘性”、“共线性诊疗”,以及残差中的“Durbin-Watson ”查验和“个案诊疗” 。
获得以下结果:由模型汇总表,R2, R20.989 ,拟合优度很强。
统计量 DW=,该查验用于判断相邻残差序列的有关性,其判断标准以下:DW<d L,以为残差序列存在正的一阶自有关;d u<DW<4-d U,以为残差序列间不存在一阶自有关; DW>4-d L,以为残差序列间存在负的一阶自有关;d L<DW<d U或4-d U<DW<4-L d时,没法确立残差序列能否存在自有关。
本例中,k=4,n=21( k 为解说变量的数量,包含常数项, n 是察看值的数量)时, 5%的上下界: dL=,dU=。
有DW d l,以为残差序列存在一阶自有关。
由方差剖析表,统计量F=,p 值小于,以为方程在95%的置信水平下是明显的。
可是, t (21 3 1) 变量lnK、lnL、常量lnA的t值均大于,所以这几个变量对方程的影响都很明显,而变量lnE的t值很小且p值显然大于且回归系数为零,说明该变量对方程影响不明显,回归模型是无效的。
4.除去模型中变量的共线性(逐渐回归)“共线性统计量”中,容忍度Tolerance 越靠近于 0,表示复共线性越强,越靠近于 1,复共线性越弱。
而方差膨胀因子VIF 的值越靠近于 1,解说变量间的多重共线性越弱,假如VIF 的值大于或等于10,说明一个解说变量与其余解释变量之间有严重的多重共线性。
本例中,变量lnK 和 lnE 的 VIF 值都大于 10,说明它们与其余解说变量之间有严重的多重共线性,不切合经典假定,需要修正。
经过以上结果剖析,采纳逐渐回归的方法来除去变量之间的多重共线性。
重复以上步骤重新成立回归方程,将【进入】替代为【逐渐】以下列图所示:获得以下结果:从上表能够看出经过逐渐回归剔除去了变量 lnE, 整个模型的拟合优度上涨,调整 R 方从上涨至。
方差膨胀因子 VIF 值均小于 10,多重共线性已除去。
T 查验的概率显然小于说明变量对模型的影响明显。
而此时 DW值并未有显然改变,残差序列仍旧存在一阶自有关。
此时采纳数据变换的方法来除去残差的自有关。
5.除去残差的自有关关于自有关的办理方法,其基本思想是经过一些数学转变,对数据进行办理,除去数据的自有关性,在对参数进行预计。
当偏差序列的自有关系数已知,且 1 时,采纳差分法,即利用增量数据来取代原有的样本数据成立方程。
当偏差序列的自有关系数未知时,先求处自有关系数,再经过频频迭代法除去来自有关。
我们知道 DW与之间的近似关系:μDW 2(1 )此中:由于 DW=,代入上式很显然得出不为1,所以此处不可以用差分而采纳迭代的方法除去自有关性。
这里先求出lny 的一元线性回归方程:ln y0.655ln K 0.782ln L 中的残差 e i,i=1,,n,将残差代入以下公式:n 1 (ei e1,n 1)(ei 1e2,n)r i 11 n 1n(e i e1,n 1) 2 (e i 1 e2, n 1 )2i 1 i 1此中1 n 1 1 ne i , e2,n 1 e ie1,n 1n 1 i 1 n 1 i 2残差序列代入上式求的一阶自有关系数r再令:y* y i 1 ry i , x i* x i 1 rx i ,i 1,...,n 1用 EXCEL达成数据的迭代获得新的数据,这里用Y1 代表原来的 lnY , K1 代表原来的 lnK ,L1 代表原来的 lnL 。
并导入到 SPSS中,重复以上步骤对新的数据进行回归剖析。
得出结果的:数据经过一次迭代此后 DW的值有显然增添,查表 k=3,n=20(k 为解说变量的数量,包含常数项,n 是察看值的数量)时,5%的上下界:dL=,dU=。
有d u<DW<4-d U,以为残差序列间不存在一阶自有关。
此时获得新的回归方程:Y10.610K 16.残差正态性查验点击“绘制”按钮,将“ ZRESID”选入 Y 轴,“ZPRED”选入 X 轴,绘制散点图,并在“标准化残差图”中选择“直方图” ,输出带有正态曲线的标准化残差的直方图。
点击“保留”按钮,在对话框中保留一些统计量的值,此事例在“展望值”框中选择“未标准化”,在“残差”框中选择“未标准化” ,在“展望区间”框中选择“均值”和“单值” 。
其余不变,点击【持续】→【确立】。
输出结果以下列图:上边操作已输出残差的直方图,还能够经过【剖析】→【描绘统计】→【P-P 图】和【剖析】→【描绘统计】→【 Q-Q图】输出正态散布的 P-P 图、 Q-Q图,若散点环绕图中所给斜线有规律的散布,则能够以为所检测变量听从正态散布。
P-P 图Q-Q 图从以上图形能够初步以为该模型的残差听从正态散布。
进一步进行K-S 检验。
选择【剖析】→【非参数查验】→【旧对话框】→【1- 样本 K-S 查验】,弹出“单样本 Kolmogorov-Smirnov 查验”窗口,将未标准化残差选入变量框,K-S 查验输出结果K-S 查验统计量为,查验概率 p 值为,大于,能够以为在 95%的置信水平下,该模型的残差听从正态散布。
7.残差的其余查验(1)异方差查验:依据回归剖析输出的标准化残差的散点图,初步判断能否存在异方差,但此种判断方法较主观,且不简单判断。
进一步用 Spearman等级有关查验剖析能否存在异方差。
第一对未标准化残差取绝对值,点击【变换】→【计算变量】,弹出“计算变量”窗口,“目标变量”输入“abs”,“数学表达式”输入“abs(RES_1)”,选择【剖析】→【有关】→【双变量】,将 abs、所有回归变量及未标准化展望值选入变量框中,【有关系数】栏选择“ Spearman”,点击确立。
Spearman 有关系数表p 值察看系数表的“ abs”行,发现未标准化展望值与残差绝对值的有关性为大于,说明该模型的残差不存在的异方差问题。
五、实验总结依据上述剖析,采纳逐渐回归法获得最后确立的回归方程:Y1此中Y1 ln y i 1 r ln y iK1 ln k i 1 r ln k iL1 ln l i 1 r ln l i , i 1,..., n 1代入上式得回归方程为:ln y i 1r ln y i0.610(ln k i 1r ln k i ) 0.920(ln l i 1ln l i ) (i=1,2,,21)将上式同时取以 e 为底数进行指数变换获得非线性模型中的实质线性关系的方程:y i 1e k i 1li 1ry i k i l i依据所建的回归方程能够看出社会固定财产投资(K)和劳动力( L)对 GDP 增添的影响较显然,而能源的花费(E) 对经济的增添没有显然影响。