立用多元线性回归研究国家婴儿死亡率与妇女文盲率之间的关系讲解--实用.docx
- 格式:docx
- 大小:95.42 KB
- 文档页数:9
多元线性回归模型案例分析——中国人口自然增长分析一·研究目的要求中国从1971年开始全面开展了计划生育,使中国总和生育率很快从1970年的5.8降到1980年2.24,接近世代更替水平。
此后,人口自然增长率(即人口的生育率)很大程度上与经济的发展等各方面的因素相联系,与经济生活息息相关,为了研究此后影响中国人口自然增长的主要原因,分析全国人口增长规律,与猜测中国未来的增长趋势,需要建立计量经济学模型。
影响中国人口自然增长率的因素有很多,但据分析主要因素可能有:(1)从宏观经济上看,经济整体增长是人口自然增长的基本源泉;(2)居民消费水平,它的高低可能会间接影响人口增长率。
(3)文化程度,由于教育年限的高低,相应会转变人的传统观念,可能会间接影响人口自然增长率(4)人口分布,非农业与农业人口的比率也会对人口增长率有相应的影响。
二·模型设定为了全面反映中国“人口自然增长率”的全貌,选择人口增长率作为被解释变量,以反映中国人口的增长;选择“国名收入”及“人均GDP”作为经济整体增长的代表;选择“居民消费价格指数增长率”作为居民消费水平的代表。
暂不考虑文化程度及人口分布的影响。
从《中国统计年鉴》收集到以下数据(见表1):表1 中国人口增长率及相关数据设定的线性回归模型为:1222334t t t t t Y X X X u ββββ=++++三、估计参数利用EViews 估计模型的参数,方法是:1、建立工作文件:启动EViews ,点击File\New\Workfile ,在对话框“Workfile Range ”。
在“Workfile frequency ”中选择“Annual ” (年度),并在“Start date ”中输入开始时间“1988”,在“end date ”中输入最后时间“2005”,点击“ok ”,出现“Workfile UNTITLED ”工作框。
其中已有变量:“c ”—截距项 “resid ”—剩余项。
多元线性回归的原理和应用1. 原理介绍多元线性回归是一种统计分析方法,用于研究多个自变量与一个因变量之间的关系。
它是线性回归分析的一种拓展,可以同时考虑多个自变量对因变量的影响。
多元线性回归的基本原理可以通过以下公式表示:**Y = β0 + β1X1 + β2X2 + … + βn*Xn + ε**其中,Y表示因变量,X1、X2、…、Xn表示自变量,β0、β1、β2、…、βn表示自变量的系数,ε表示误差项。
多元线性回归通过最小二乘法来估计自变量的系数,使得预测值与实际观测值之间的平方误差最小化。
通过最小二乘法的计算,可以得到自变量的系数估计值,进而可以进行预测和解释因变量的变化。
2. 应用领域多元线性回归在各个领域都有广泛的应用,以下列举了一些常见的应用领域:2.1 经济学多元线性回归在经济学中是一个重要的工具,可以用于研究不同变量对经济发展的影响。
例如,可以通过多元线性回归来分析GDP增长率与投资、消费、出口等变量之间的关系,并进一步预测未来的经济发展趋势。
2.2 市场营销在市场营销领域,多元线性回归可以用于研究市场需求的影响因素。
通过分析不同的市场变量(如产品价格、广告投入、竞争对手的行为等),可以预测市场需求的变化,并制定相应的营销策略。
2.3 医学研究多元线性回归在医学研究中也有广泛的应用。
例如,可以使用多元线性回归来研究不同的遗传、环境和生活方式因素对人体健康的影响。
通过分析这些因素,可以预测患病风险并制定相应的预防措施。
2.4 社会科学多元线性回归在社会科学领域中被广泛应用,用于研究各种社会现象。
例如,可以使用多元线性回归来研究教育、收入、职业等因素对犯罪率的影响,并进一步分析这些因素的相互关系。
2.5 工程与科学研究多元线性回归在工程和科学研究中也有一定的应用。
例如,在工程领域中可以使用多元线性回归来研究不同因素对产品质量的影响,并优化生产过程。
在科学研究中,多元线性回归可以用于分析实验数据,探索不同变量之间的关系。
如何理解和使用多元线性回归分析多元线性回归分析是一种统计分析方法,用于探索自变量与因变量之间的关系。
它基于线性假设,假设自变量和因变量之间存在线性关系,并通过最小二乘法估计未知参数。
多元线性回归可以同时考虑多个自变量对因变量的影响,相比于一元线性回归,具有更多的灵活性和应用场景。
以下是关于多元线性回归分析的理解和使用。
一、理解多元线性回归分析:1.模型表达:多元线性回归模型可以表示为:Y=β0+β1X1+β2X2+...+βnXn+ε,其中Y是因变量,X1~Xn是自变量,β0~βn是回归系数,ε是误差项。
2.线性假设:多元线性回归假设自变量和因变量之间的关系是线性的,即因变量的期望值在给定自变量的条件下是一个线性函数。
3.参数估计:根据最小二乘法原理,通过使残差平方和最小化来估计回归系数。
最小二乘估计量是使得残差平方和最小的回归系数。
4.假设检验:在多元线性回归中,常用的假设检验包括回归系数的显著性检验、模型整体的显著性检验和多重共线性检验等。
二、使用多元线性回归分析:1.确定研究目标:明确研究目标,确定自变量和因变量。
了解问题背景、变量间关系,并结合实际情况选择合适的方法进行分析。
2.数据收集与整理:收集需要的数据,包括自变量和因变量的观测值。
对数据进行验证和清洗,排除缺失值、异常值等。
3.变量选择:根据研究目标和变量间的相关性,进行自变量的筛选。
可以通过相关分析、方差膨胀因子(VIF)等指标来评估自变量间的共线性。
4.模型建立与估计:根据选定的自变量和因变量,使用统计软件进行模型建立和回归系数的估计。
多元线性回归可以通过扩展一元线性回归的方法来计算。
5.模型诊断与改善:对建立的模型进行诊断,检验残差的正态性、独立性、同方差性等假设。
若存在违反假设的情况,则需要考虑进一步改善模型。
6.模型解释与预测:解释回归系数的含义,明确变量间的关系。
利用模型进行预测和决策,对未知因变量进行估计和预测。
7.模型评价与报告:评估模型的拟合程度,包括R方、调整R方、残差分析等指标。
实验二:多元线性回归分析一.实验目的熟练应用EViews软件作多元线性回归分析。
二.实验主题立用多元线性回归分析研究国家婴儿死亡率与妇女文盲率之间的关系。
三.实验内容1、先验的预期CM和各个变量之间的关系。
2、做CM对FLR的回归,得到回归结果。
3、做CM对FLR和PGNP的回归,得到回归结果。
4、做CM对FLR,PGNP和TFR的回归结果,并给出ANOVA。
5、根据各种回归结果,选择哪个模型?为什么?6、如果回归模型(4)是正确的模型,但却估计了(2)或(3),会有什么后果?7、假定做了(2)的回归,如何决定增加变量PGNP和TFR?使用了哪种检验?给出必要的计算结果。
四.实验报告要求:1、问题提出2、指标选择3、数据选择4、数据处理5、数据分析6、建立模型以及模型检验 7、报告结论 8、实验总结1、问题提出一个国家的婴儿死亡率关系到一个国家的未来发展,反映了国家人民的健康水平与国家的发展水平,这一指标也是政府采取相关政策的一个重要依据。
在社会学中,一个国家的婴儿死亡率与妇女的文盲率之间存在一定的相关关系,但这两个指标之间存在着怎样的关系,为此,我们利用统计数据对这一问题进行实证分析。
2、指标选择我们选取一个国家的婴儿死亡率CM,女性识字率FLR进行分析。
考虑到影响婴儿死亡率的因素较复杂,尤其是经济发展状况、总生育率等也会对其产生重要影响,考虑到实验的准确性,同时研究人均GNP(PGNP)和总生育率(TFR)对婴儿死亡率的影响。
预期:1)预期CM与FLR存在负相关关系。
一方面,女性受教育程度越高,其知识越丰富,自我保护意识和能力就越强,则更善于保护自己和婴儿;另一方面,女性教育程度越高,其就业机会与收入获得途径就越多,可以更好的保障自己和婴儿的生活。
因此,我们预期FLR的提高会导致CM降低。
2)预期CM与PGNP存在负相关关系。
人均GNP的提高使人们的物质生活水平得到提高,改善了人民、食、住、行等诸方面的条件,特别是使人们摄取的营业素增加,营养素结构合理,从而增加人们的体质;使人们从繁重的体力劳动和恶劣的工作环境中解脱出来,有充足的精力和时间来关心自己及其后代的身体健康,提高生活质量。
实验二:多元线性回归分析一.实验目的熟练应用EViews软件作多元线性回归分析。
二.实验主题立用多元线性回归分析研究国家婴儿死亡率与妇女文盲率之间的关系。
三.实验内容1、先验的预期CM和各个变量之间的关系。
2、做CM对FLR的回归,得到回归结果。
3、做CM对FLR和PGNP的回归,得到回归结果。
4、做CM对FLR,PGNP和TFR的回归结果,并给出ANOVA。
5、根据各种回归结果,选择哪个模型?为什么?6、如果回归模型(4)是正确的模型,但却估计了(2)或(3),会有什么后果?7、假定做了(2)的回归,如何决定增加变量PGNP和TFR?使用了哪种检验?给出必要的计算结果。
四.实验报告要求:1、问题提出2、指标选择3、数据选择4、数据处理5、数据分析6、建立模型以及模型检验 7、报告结论 8、实验总结1、问题提出一个国家的婴儿死亡率关系到一个国家的未来发展,反映了国家人民的健康水平与国家的发展水平,这一指标也是政府采取相关政策的一个重要依据。
在社会学中,一个国家的婴儿死亡率与妇女的文盲率之间存在一定的相关关系,但这两个指标之间存在着怎样的关系,为此,我们利用统计数据对这一问题进行实证分析。
2、指标选择我们选取一个国家的婴儿死亡率CM,女性识字率FLR进行分析。
考虑到影响婴儿死亡率的因素较复杂,尤其是经济发展状况、总生育率等也会对其产生重要影响,考虑到实验的准确性,同时研究人均GNP(PGNP)和总生育率(TFR)对婴儿死亡率的影响。
预期:1)预期CM与FLR存在负相关关系。
一方面,女性受教育程度越高,其知识越丰富,自我保护意识和能力就越强,则更善于保护自己和婴儿;另一方面,女性教育程度越高,其就业机会与收入获得途径就越多,可以更好的保障自己和婴儿的生活。
因此,我们预期FLR的提高会导致CM降低。
2)预期CM与PGNP存在负相关关系。
人均GNP的提高使人们的物质生活水平得到提高,改善了人民、食、住、行等诸方面的条件,特别是使人们摄取的营业素增加,营养素结构合理,从而增加人们的体质;使人们从繁重的体力劳动和恶劣的工作环境中解脱出来,有充足的精力和时间来关心自己及其后代的身体健康,提高生活质量。
回归分析---多元线性回归模型【实验目的与要求】熟练使用Eviews软件进行计量分析,理解多元线性回归模型及最小二乘法估计的基本原理。
【实验内容】1、多元线性回归模型参数估计(回归、显示残差图、学会看输出结果,列写估计式)。
2、多元线性回归的模型检验3、多元线性回归模型的模型选择4、多元线性回归模型的预测【实验步骤】------创建工作文件在主菜单上依次单击File→New→Workfile(见图3-1),选择数据类型编辑及录入所需数据,建立相关工作文件CM 、FLR 、PGNP 、TFR----------根据散点图先验预期CM和各个变量之间的关系:在group01数组窗口工具条上Views的下拉菜单中选择Graph--Scatter答:散点图显示,CM(婴儿死亡率)和FLR(女性文盲率)二者存在线性关系。
二者呈正相关,由此推断:女性受教育水平越高,婴儿死亡率越低。
散点图显示,CM(婴儿死亡率)和PGNP(人均GNP)二者不存在线性关系。
散点图显示,CM (婴儿死亡率)和TFR (总生育率)二者存在线性关系。
---------做CM 对FLR 的回归得到如下回归结果:从方程eq02的工具栏中,点击View/Representations,也可以得到目标方程的表达式,如下图所示:669.0)000.0)(000.0()209.11)(584.21()213.0)(225.12(39.286.2632==-==-=∧R CM p t se FLR(1)通过t检验,说明从总体上来看,FLR对CM的影响是否显著,并说明FLR前的回归系数的涵义。
答:(1)对回归系数的解释:女性文盲率每提高一个单位,婴儿死亡率将平均降低2.39个单位。
从上述回归结果可以看出,解释变量FLR的t统计量绝对值为11.209,通过检验。
表明女性文盲率对婴儿死亡率的影响是显著的。
从总体上来看,FLR对CM的影响显著。
(2)对于此方程,通过了t检验是否还要再进行总体方程是否存在线性关系的F检验?为什么?答:(2)对于此方程,通过了t检验还要再进行F检验。
多元线性回归模型资料讲解多元线性回归模型第三章多元线性回归模型基本要求:1、理解多元线性回归模型的定义2、理解多元线性回归模型的假定3、掌握参数估计的计算4、理解参数统计性质第一节多元线性回归模型及假定一、多元线性回归模型许多经济现象往往要受多个因素的影响,研究被解释变量受多个解释变量的影响,就要利用多元回归模型。
多元线性回归模型与一元线性回归模型基本类似,只不过解释变量由一个增加到两个以上,被解释变量Y 与多个解释变量k X X X ,,,21 之间存在线性关系。
假定被解释变量Y 与多个解释变量k X X X ,,,21 之间具有线性关系,是解释变量的多元线性函数,称为多元线性回归模型。
即k k X X X Y 22110(3-1)其中Y 为被解释变量,(1,2,,)j X j k L 为k 个解释变量,(0,1,2,,)j j k L 为1k 个未知参数,为随机误差项。
被解释变量Y 的期望值与解释变量k X X X ,,,21 的线性方程为:01122()k k E Y X X X L (3-2)称为多元总体线性回归方程,简称总体回归方程。
对于n 组观测值),,2,1(,,,,21n i X X X Y ki i i i ,其方程组形式为:01122,(1,2,,)i i i k ki i Y X X X i n L L(3-3) 即nkn k n n n k k k k X X X Y X X X Y X X X Y 2211022222121021121211101 其矩阵形式为n Y Y Y 21=kn n nk k X X X X X X X X X212221212111111k 210+n 21 即Y X βμ(3-4) 其中1n Y n Y Y Y 21为被解释变量的观测值向量; )1(k n Xkn n nk k X X X X X X X X X212221212111111为解释变量的观测值矩阵;(1)1k βk 210为总体回归参数向量;1nμn 21为随机误差项向量。
多元线性回归模型案例分析中国人口自然增长分析一•研究目的要求中国从1971年开始全面开展了计划生育,使中国总和生育率很快从1970年的5.8降到1980年2.24接近世代更替水平。
此后,人口自然增长率(即人口的生育率)很大程度上与经济的发展等各方面的因素相联系,与经济生活息息相关,为了研究此后影响中国人口自然增长的主要原因,分析全国人口增长规律,与猜测中国未来的增长趋势, 需要建立计量经济学模型。
影响中国人口自然增长率的因素有很多,但据分析主要因素可能有:(1)从宏观经济上看,经济整体增长是人口自然增长的基本源泉;(2)居民消费水平,它的高低可能会间接影响人口增长率。
⑶文化程度,由于教育年限的高低,相应会转变人的传统观念,可能会间接影响人口自然增长率(4)人口分布,非农业与农业人口的比率也会对人口增长率有相应的影响。
二•模型设定为了全面反映中国“人口自然增长率”的全貌,选择人口增长率作为被解释变量,以反映中国人口的增长;选择“国名收入”及“人均GDP”作为经济整体增长的代表;选择“居民消费价格指数增长率”作为居民消费水平的代表。
暂不考虑文化程度及人口分布的影响。
从《中国统计年鉴》收集到以下数据(见表1):表1 中国人口增长率及相关数据年份人口自然增长率国民总收入 居民消费价格指数增长人均GDP (%)(亿元)率(CPI ) %(元)1988 15.73 15037 18.8 1366 1989 15.04 17001 18 1519 1990 14.39 18718 3.1 1644 1991 12.98 21826 3.4 1893 1992 11.6 26937 6.4 2311 1993 11.45 35260 14.7 2998 1994 11.21 48108 24.1 4044 1995 10.55 59811 17.1 5046 1996 10.42 70142 8.3 5846 1997 10.06 78061 2.8 6420 1998 9.14 83024 -0.8 6796 1999 8.18 88479 -1.4 7159 2000 7.58 98000 0.4 7858 2001 6.95 108068 0.7 8622 2002 6.45 119096 -0.8 9398 2003 6.01 135174 1.2 10542 2004 5.87 159587 3.9 12336 2005 5.89 184089 1.8 14040 20065.382131321.516024设定的线性回归模型为:三、估计参数利用EViews 估计模型的参数,1、建立工作文件:启动 EViews ,点击File\New\Workfile ,在对 话框“Workfile Range ” 在 “ Workfile frequency ” 中选择 “Annual ”(年 度),并在“ Start date’中输入开始时间“ 1988”在“end date’中输 入最后时间“ 2005”,点击“ ok ”出现“ Workfile UNTITLED ”工作 框。
多元线性回归案例多元线性回归是一种统计分析方法,用于研究自变量与因变量之间的关系。
它可以帮助我们理解多个自变量对因变量的影响,并预测因变量的数值。
在本文中,我们将通过一个实际的案例来介绍多元线性回归的应用。
假设我们想要研究一个人的身高与体重之间的关系,同时考虑年龄和性别对这种关系的影响。
我们收集了一组数据,包括个体的身高、体重、年龄和性别。
我们希望利用这些数据建立一个多元线性回归模型,来预测一个人的体重。
首先,我们需要对数据进行分析和处理。
我们可以计算身高、体重、年龄和性别之间的相关系数,来初步了解它们之间的关系。
然后,我们可以利用散点图来观察变量之间的分布情况,以及可能存在的异常值或者离群点。
接下来,我们可以利用多元线性回归模型来建立身高、年龄和性别对体重的预测模型。
在建立模型之前,我们需要进行变量选择,选择那些对体重有显著影响的自变量。
然后,我们可以利用最小二乘法来估计模型的参数,得到回归方程。
在得到回归方程之后,我们可以进行模型的诊断和检验。
我们可以利用残差分析来检验模型的拟合优度,以及模型是否满足多元线性回归的假设。
如果模型不符合要求,我们可以进行适当的变换或者调整,来改善模型的拟合效果。
最后,我们可以利用建立的多元线性回归模型来进行预测。
我们可以输入新的个体数据,来预测其体重,并对预测结果进行评估和验证。
如果模型的预测效果不理想,我们可以考虑进行模型的改进或者调整。
总之,多元线性回归是一种强大的统计分析方法,可以帮助我们理解和预测多个自变量对因变量的影响。
通过本文的案例介绍,相信读者对多元线性回归有了更深入的理解,也能够更好地应用它来解决实际问题。
希望本文能够对读者有所帮助,谢谢阅读!。
实验二:多元线性回归分析一.实验目的熟练应用 EViews 软件作多元线性回归分析。
二.实验主题立用多元线性回归分析研究国家婴儿死亡率与妇女文盲率之间的关系。
三.实验内容1、先验的预期CM和各个变量之间的关系。
2、做 CM对 FLR的回归,得到回归结果。
3、做 CM对 FLR和 PGNP的回归,得到回归结果。
ANOVA。
4、做 CM对 FLR, PGNP和 TFR 的回归结果,并给出5、根据各种回归结果,选择哪个模型?为什么?6、如果回归模型(4)是正确的模型,但却估计了(2)或( 3),会有什么后果?7、假定做了(2)的回归,如何决定增加变量PGNP和 TFR?使用了哪种检验?给出必要的计算结果。
四.实验报告要求 :1 、问题提出2、指标选择 3 、数据选择4 、数据处理5、数据分析6、建立模型以及模型检验7 、报告结论8 、实验总结1、问题提出一个国家的婴儿死亡率关系到一个国家的未来发展,反映了国家人民的健康水平与国家的发展水平,这一指标也是政府采取相关政策的一个重要依据。
在社会学中,一个国家的婴儿死亡率与妇女的文盲率之间存在一定的相关关系,但这两个指标之间存在着怎样的关系,为此,我们利用统计数据对这一问题进行实证分析。
2、指标选择我们选取一个国家的婴儿死亡率CM,女性识字率FLR 进行分析。
考虑到影响婴儿死亡率的因素较复杂,尤其是经济发展状况、总生育率等也会对其产生重要影响,考虑到实验的准确性,同时研究人均GNP(PGNP)和总生育率(TFR)对婴儿死亡率的影响。
预期:1)预期 CM与 FLR存在负相关关系。
一方面,女性受教育程度越高,其知识越丰富,自我保护意识和能力就越强,则更善于保护自己和婴儿;另一方面,女性教育程度越高,其就业机会与收入获得途径就越多,可以更好的保障自己和婴儿的生活。
因此,我们预期FLR 的提高会导致CM降低。
2)预期 CM与 PGNP存在负相关关系。
人均GNP的提高使人们的物质生活水平得到提高,改善了人民、食、住、行等诸方面的条件,特别是使人们摄取的营业素增加,营养素结构合理,从而增加人们的体质;使人们从繁重的体力劳动和恶劣的工作环境中解脱出来,有充足的精力和时间来关心自己及其后代的身体健康,提高生活质量。
因此,我们预期 PGNP 的提高会导致 CM 降低。
3)预期CM与 TFR存在正相关关系。
总生育率直接或间接地影响着婴儿死亡率,总生育率提高,人口数量上升,人均人均受教育程度等一系列人均享受的权利和福利都会有所下降。
因此,我们预期GNP,TFR 的提高会导致 CM 降低。
3、数据选择考虑到实验结果的普遍性,我们选择世界各地区64 个国家的各项指标数据作为样本进行研究分析。
数据由老师提供,详细数据见表1序号婴儿死亡率 CM女性识字率 FLR人均 GNP(PGNP)总生育率 TFR 1128371870 6.66220422130 6.153202163107.00419765570 6.25596762050 3.81620926200 6.44717045670 6.19824029300 5.89924111120 5.89 105555290 2.36 1175871180 3.93 1212955900 5.99 1324931730 3.50 141653111507.41 1594771160 4.21 1696801270 5.00 1714830580 5.27 189869660 5.21 1916143420 6.50 20118471080 6.12 2126917290 6.19 2218935270 5.05 2312658560 6.16 2412814240 1.80 2516729240 4.75 2613565430 4.10 27107873020 6.66 28726314207.28 29128494208.12 30276319830 5.23 3115284420 5.79 3222423530 6.50 331425086407.173410462350 6.6035287312307.003641661620 3.913731211190 6.703877882090 4.203914222900 5.434026222230 6.504121512140 6.254224693307.10431913110107.1044182193007.004537881730 3.464610335780 5.664767851300 4.824814378930 5.00498385690 4.7450223332008.495124019450 6.505231221280 6.505312794430 1.69545283270 3.2555794313407.17566188670 3.525716828410 6.095828954370 2.8659121411310 4.8860115621470 3.896118645300 6.906247853630 4.106317845220 6.0964142675607.20表14.数据处理表1 中的实验数据可直接应用于研究分析,无需经过其他处理。
5.数据分析1、观察表 1 数据,婴儿死亡率 CM,女性识字率 FLR,人均 GNP( PGNP)和总生育率(TFR)中,不存在与现实意义不相符的数据,因此可以拿来进行问题的研究。
2、通过 EViews 软件分析进行相关分析:1) CM 与 FLR 的相关性320 280240200M160 C12080FLR CM FLR 1.000000 -0.818285 CM -0.818285 1.000000表 240020*********图 1FLR由散点图(图1)和相关系数(表2)知,这两组数据的相关性较高,且CM与 FLR之间存在负相关关系。
2) CM与 PGNP的相关性320280240200M160 CPGNP CM PGNP1.000000-0.407697120CM-0.407697 1.000000 8040表 304,0008,00012,00016,00020,000PGNP图 2由散点图(图2)和相关系数(表3)知,这两组数据有一定的相关性,且CM与 PGNP之间存在负相关关系。
3) CM与 TFR的相关性PGNP CM320 280 240PGNPCM1.000000 -0.407697200M160C1208040-0.407697 1.000000表 4123456789图 3TFR由散点图(图3)和相关系数(表3)知,这两组数据具有一定的相关性,且CM与 TFR 之间存在正相关关系。
通过相关分析可以发现,CM与 FLR 之间存在负相关关系,与PGNP之间存在负相关关系,与 TFR之间存在正相关关系。
6. 建立模型以及模型检验1、分别做出 CM对 FLR、CM对 FLR和 PGNP以及 CM对 FLR,PGNP和 TFR进行回归分析,建立回归模型2、分别对各个模型进行检验,包括经济检验及统计检验3.给出 CM对 FLR, PGNP和 TFR回归结果的ANOVA 6. 1 CM对 FLR的回归模型建立及检验(1)建立回归模型根据图1,建立如下线性模型:CM i0 1 FLR i i得出回归结果如下Dependent Variable: CMMethod: Least SquaresDate: 04/15/16Time: 11:44Sample: 1 64Included observations: 64Variable Coefficient Std. Error t-Statistic Prob.FLR-2.3904960.213263-11.209170.0000C263.863512.2249921.583950.0000R-squared0.669590Mean dependent var141.5000Adjusted R-squared0.664261S.D. dependent var75.97807Dependent Variable: CMS.E. of regression44.02399Akaike info criterion10.43810Sum squared resid120163.0Schwarz criterion10.50556Log likelihood-332.0191Hannan-Quinn criter.10.46468F-statistic125.6455Durbin-Watson stat 2.314744Prob(F-statistic)0.000000回归方程式: CM 2.390496 * FLR263.8635其中: Se=(0.213263)(12.22499)t=(-11.20917)(21.58395)p(0.0000)(0.0000)R20.669590 F 125.6455( 2)模型检验CM 对 FLR 的回归模型的检验经济检验:斜率值为- 2.390496 ,说明女性识字率(FLR) 与婴儿死亡率( CM)负相关,且在其他条件不变的情况下女性识字率(FLR)增加1%,可导致婴儿死亡率(CM)减少 2.390496% 。
统计检验:( 1)拟合优度检验:拟合度 R2=0.669590, 说明所建模型整体上对样本数据还不算很好,即解释变量CM对 FLR 的大部分差异作出了解释,但可能还有其他因素影响婴儿死亡率。
(2)t 检验:变量β 1 和β 2 的原假设与备择假设为:H0:β0=0,β1≠ 0; H0:β1=0,β1≠ 0。
查表可得,在5%的显著水平下,自由度为n-2=64-2=62的 t 的临界值为 2.000 。
因为计算得到的β的估计值的t值21.58395>2.000,所以拒绝原假设H :β=0,β1的估计值000的 t 值 -11.20917<-2.000,所以拒绝原假设H :β =0。
这说明在95%的置信水平下,解释01变量女性识字率 (FLR) 通过了显著性检验,即解释变量女性识字率(FLR) 对婴儿死亡率( CM)有显著影响。
6.2 CM 对 FLR 和 PGNP的回归模型建立及检验( 1)建立回归模型根据图 2,建立如下线性模型:CM i01 FLR i2 PGNP i i 得出回归结果如下:Dependent Variable: CMMethod: Least SquaresDate: 04/15/16Time: 11:49Sample: 1 64Included observations: 64Variable Coefficient Std. Error t-Statistic Prob.C263.641611.5931822.741090.0000FLR-2.2315860.209947-10.629270.0000PGNP-0.0056470.002003-2.8187030.0065R-squared0.707665Mean dependent var141.5000Adjusted R-squared0.698081S.D. dependent var75.97807S.E. of regression41.74780Akaike info criterion10.34691Sum squared resid106315.6Schwarz criterion10.44811Log likelihood-328.1012Hannan-Quinn criter.10.38678F-statistic73.83254Durbin-Watson stat 2.186159Prob(F-statistic)0.000000回归方程式: CM 2.231586 * FLR0.005647 * PGNP263.6416其中:Se(0.209947)(0.002003)(11.59318 )t( 10.62927)( 2.818703)(22.74109)p(0.0000)(0.0065)(0.0000)R20.707665F73.83254( 2)模型检验经济检验:所估计参数β 1 和β 2 的估计值均为负数,说明女性识字率(FLR) 和人均GNP(PGNP)与婴儿的死亡率( CM)负相关,与预期假设相同。