当前位置:文档之家› 回归分析测试题

回归分析测试题

回归分析测试题
回归分析测试题

1.下列说法中错误的是( )

A .如果变量 x 与 y 之间存在着线性相关关系,则我们根据试验数据得到的点 (i=1 , 2, 3,?, n )将散布在一条直线附近

B .如果两个变量 x 与 y 之间不存在线性相关关系,那么根据试验数据不能写出一个线

性方程。

C .设 x ,y 是具有线性相关关系的两个变量,且回归直线方程是 ,则 叫回 归系数

D .为使求出的回归直线方程有意义,可用线性相关性检验的方法判断变量

x 与 y 之间

是否存在线性相关关系

2.在一次试验中,测得( x , y )的四组值分别是( 1,2),(2,3),( 3,4),

(4,5), 则 y 与 x 之间的回归直线方程是( )

A .

B .

C .

D .

3.回归直线 必过点( )

A .(0,0)

B .

C .

D .

4.在画两个变量的散点图时,下面叙述正确的是( ) A .预报变量在 轴上,解释变量在 轴上 B .解释变量在 轴上,预报变量在 轴上 C .可以选择两个变量中任意一个变量在

轴上

D .可以选择两个变量中任意一个变量在 轴上

5.两个变量相关性越强,相关系数 r ( )

6.若散点图中所有样本点都在一条直线上,解释变量与预报变量的相关系数为(

7.一位母亲记录了她儿子

到 岁的身高,数据如下表:

由此她建立了身高与年龄的回归模型 ,她用这个模型预测儿子

岁时的身高,

测试题

A .越接近于 0

B .越接近于 1

C .越接近于- 1

D .绝对值越接近 1

A .0

B .1

C .- 1

D .- 1 或 1

则下面的叙述正确的是()

A.她儿子10 岁时的身高一定是145.83

B .她儿子10 岁时的身高在145.83 以上

C.她儿子10 岁时的身高在145.83 左右

D .她儿子10 岁时的身高在145.83 以下

8.两个变量有线性相关关系且正相关,则回归直线方程中,的系数()

A.B.C.

能力提升:

9.一个工厂在某年每月产品的总成本y(万元)与该月产量x(万件)之间有如下数据:x 1.08 1.12 1.19 1.28 1.36 1.48 1.59 1.68 1.80 1.87 1.98 2.07

y 2.25 2.37 2.40 2.55 2.64 2.75 2.92 3.03 3.14 3.26 3.36 3.50 1)画出散点图;

2)求每月产品的总成本y 与该月产量x 之间的回归直线方程。

10.某工业部门进行一项研究,分析该部分的产量与生产费用之间的关系,从这个工业部门内随机抽选了10 个企业作样本,有如下资料:

产量x(千件)40 42 48 55 65 79 88 100 120 140 生产费用y(千元)150 140 160 170 150 162 185 165 190 185 1)计算x 与y 的相关系数;

2)对这两个变量之间是否线性相关进行相关性检验;

3)设回归直线方程为,求系数,。

综合探究:

11.一只红铃虫的产卵数y 和温度x 有关。现收集了7 对观测数据列于表中,试建立y 与x 之间的回归方程。

温度x /℃21 23 25 27 29 32 35

产卵数y/个7 11 21 24 66 115 325

参考答案:

基础达标:

1.B

尽管两个变量x 与y 之间不存在线性相关关系,但是由试验数据仍可求出回归直线方程中的和,从而可写出一个回归直线方程。

2.A

由回归直线经过样本点的中心,由题中所给出的数据,将

代入中适合,故选A 。

3.D

回归直线,必然经过样本点的中心,其坐标为,故选D 。

4.B

5.D

6.B

7.C

8.A

9.解析:

(1)画出的散点图如图所示:

2),

,,

所以所求回归直线方程为。

10.解析:

1)制表:

,,,即x 与y 的相关系数r≈ 0.808。

2)因为,所以可以认为x 与y 之间具有很强的线性相关关系。

3),。

综合探究:

11.解析:

散点图如图所示:

由散点图可以看出:这些点分布在某一条指数函数的图象的周围。现在,问题变为

如何估计待定参数c1 和c2,我们可以通过对数变换把指数关系变为线性关系。

令,则变换后样本点应该分布在直线(,)的

周围。

这样,就可以利用线性回归模型来建立y 和x 之间的非线性回归方程了。

由题中所给数据经变换后得到如下的数据表及相应的散

点图

x 21 23 25 27 29 32 35

z 1.946 2.398 3.045 3.178 4.190 4.745 5.784

由图可看出,变换后的样本点分布在一条直线的附近,因此可以用线性回归方程来拟合。

计算得,,,。

设所示的线性回归方程为,

则有

得到线性回归方程,

因此红铃虫的产卵数对温度的非线性回归方程为。总结升华:

(1)在散点图中,样本点并没有分布在某个带状区域内,因此两个变量不呈线性相关关系,所以不能

直接利用线性回归方程来建立两个变量之间的关系。根据已有的函数知识,可以发现样本点分布

在一条指数函数曲线的周围,其中c1和c2 是待定参数。

(2)选择适当的非线性回归方程。然后通过变量代换,将非线性回归方程化为线性回归方程,并由此

来确定非线性回归方程中的未知参数。

(3)由散点图来挑选一种跟数据拟合得最好的函数时,往往有

回归分析

撰稿吕宝珠审稿谷丹责编:严春梅

课程标准的要求

回归分析的基本思想及其初步应用:

(1)理解回归分析是对具有相关关系的两个变量进行统计分析的一种常用的方法;理解解释变量与预报变量的相关关系是一种非确定性关系;

(2)能读或画出两个变量的散点图,并能根据散点图来粗略判断两个变量是否线性相关;

(3)理解线性回归模型;

(4)理解样本相关系数是衡量两个变量之间线性相关性强弱的参数的意义,了解样本相关系数的具体

计算公式.

(5)了解解释变量和随机变量的组合效应的含义及表示总的效应的参数:总偏差平方和;了解样本的数据点和它在回归直线上相应位置的残差是随机误差的效应的意义及随机误差的

效应(即各个样

本的各个点的随机误差的效应的平方和)的参数:残差平方和;了解表示解释变量效应的参数:

回归平方和;了解刻画回归效果的相关指数的含义及计算公式。

(有关计算公式只要求了解含义,不须记忆下来,考试时会给出相关公式的).(6)了解残差分析的方法及意义,会读或会作残差图.

重点和难点分析

回归分析的基本思想及其初步应用。

内容精讲

1.相关关系:

当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系

相关关系与函数关系的异同点如下:

相同点:均是指两个变量的关系。

不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间

的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系.

2.回归分析:

一元线性回归分析:对具有相关关系的两个变量进行统计分析的方法叫做回归分析。通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性。

对于线性回归分析,我们要注意以下几个方面:

(1)回归分析是对具有相关关系的两个变量进行统计分析的方法。两个变量具有相关关系是回归分析

的前提。

(2)散点图是定义在具有相关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,

在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析。

(3)求回归直线方程,首先应注意到,只有在散点图大至呈线性时,求出的回归直线方程才有实际意

义,否则,求出的回归直线方程毫无意义。

3.散点图:

表示具有相关关系的两个变量的一组数据的图形叫做散点图.散点图形象地反映了各对

数据的密切程度。粗略地看,散点分布具有一定的规律。

4. 回归直线

设所求的直线方程为,其中a、b 是待定系数.

相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析。

5.相关系数:相关系数是因果统计学家皮尔逊提出的,对于变量y与x 的一组观测值,把

=

叫做变量y 与x 之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度.

6.相关系数的性质:

≤ 1,且越接近1,相关程度越大;且越接近0,相关程度越小.

7.显著性水平:显著性水平是统计假设检验中的一个概念,它是公认的小概率事件的概率值。

它必须在每一次统计检验之前确定。

8.显著性检验:

由显著性水平和自由度查表得出临界值,显著性水平一般取0.01 和0.05,自由度为n-2,其中n是数据的个数在“相关系数检验的临界值表” 查出与显著性水平0.05 或0.01 及自由度n-2(n 为观测值组数)相应的相关数临界值r0.05 或r0.01;例如n=7时,r0.05

=0.754,r0.01=0.874 求得的相关系数r和临界

值r

线性相关的,当≤r0.05或r0.01,认为线性关系不显著。

典型例题:

X 1.08 1.12 1.19 1.28 1.36 1.48 1.59 1.68 1.80 1.87 1.98 2.07

Y 2.25 2.37 2.40 2.55 2.64 2.75 2.92 3.03 3.14 3.26 3.36 3.50 1)画出散点图;

2)检验相关系数r 的显著性水平;

3)求月总成本y与月产量x 之间的回归直线方程解析:

i 1 2 3 4 5 6 7 8 9 10 11 12 x i 1.08 1.12 1.19 1.28 1.36 1.48 1.59 1.68 1.80 1.87 1.98 2.07 y i 2.25 2.37 2.40 2.55 2.64 2.75 2.92 3.03 3.14 3.26 3.36 3.50 x i y i 2.43 2.264 2.856 3.264 3.590 4.07 4.643 5.090 5.652 6.096 6.653 7.245

,,,,

1)画出散点图:

0.05 比较,若r>r0.05,上面y与x是

1.一个工厂在某年里每月产品的总成本y(万元)与该月产量x(万件)之间由

2)

计算 a , b ,得 b ≈1.215, ,

∴回归直线方程为:

2.在 7块并排、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,

得数据如下(单位:

施化肥量 x 15 20 25 30 35 40 45 水稻产量 y

330

345

365

405

445

450

455

1)画出散点图;

在“相关系数检验的临界值表”查出与显著性水平

0.05 及自由度 12- 2=10 相应的

相关数临界值

r

0.05=0.576 <0.997891, 这说明每月产品的总

成本 间存在线性相

y

万元)与该月产量 x (万件)之

关关系。

3)设回归直线方程

利用

3)设回归直线方程 ,利用

2)检验相关系数 r 的显著性水平;

3)求月总成本 y 与月产量 x 之间的回归直线方程。 解析: 1)画出散点图如下:

2

)检验相关系数

r 的显著性水平: i 1 2 3 4 5 6 7 x i 15 20 25 30 35 40 45 y i 330 345 365 405 445 450 455 x i y i

4950

6950

9125

12150

15575

18000

20475

, , , ,

在“相关系数检验的临界值表”查出与显著性水平 0.05 及自由度 7- 2=5 相应的相

关数临界值

r 0.05=0.754<0.9733,这说明水稻产量与施化肥量之间存在线性相关关系。

计算a,b,得

a=399.3-4.75×30≈257,则回归直线方程

3.已知某地每单位面积菜地年平均使用氮肥量xkg 与每单位面积蔬菜年平均产量之间的关系有如下数据:

1)求x 与y 之间的相关系数,并检验是否线性相关;

2)若线性相关,求蔬菜产量y 与使用氮肥量之间的回归直线方程,并估计每单位面

积施肥150kg 时,每单位面积蔬菜的年平均产量。

分析:(1)使用样本相关系数计算公式来完成;(2)查表得出显著性水平0.05 与自由度15-2 相应的相关系数临界比较,若则线性相关,否则不线性相关。

解析:(1)列出下表,并用科学计算器进行有关计算:

,,

,,

故蔬菜产量与放用氮肥量的相关系数

由于n=15,故自由度15-2=13 。

0.05 及自由度13 相关系数临界值

由相关系数检验的临界值表查出与显著水平

则,从而说明蔬菜产量与氮肥量之间存在着线性相关关系。

2)设所求的回归直线方程为

∴回归直线方程为

点评:求解两个变量的相关系数及它们的回归直线方程的计算量较大,

需要细心、谨慎地计算。如果会使用含统计的科学计算器,能简单得到,,,

这些量,也就无需有制表这一步,直接算出结果就行了。另外,利用计算机中有关

应用程序也可以对这些数据进行处理。

4.假设关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:

若由资料可知对呈线性相关关系。试求:

1)线性回归方程;2)估计使用年限为10 年时,维修费用是多少?

分析:本题为了降低难度,告诉了y 与x 间呈线性相关关系,目的是训练公式的使用。解析:

1)列表如下:

∴线性回归方程为:。

(2)当x=10 时,(万元)

即估计使用10 年时维修费用是12.38 万元。

点评:本题若没有告诉我们y与x 间是呈线性相关的,应首先进行相关性检验。如果本身两个变量不具备线性相关关系,或者说它们之间相关关系不显著时,即使求出回归方程也是没有意义的,而且其估计与预测也是不可信的

回归分析测试题-21页文档资料

测试题 1.下列说法中错误的是() A.如果变量x与y之间存在着线性相关关系,则我们根据试验数据得到的点(i=1,2,3,…, n)将散布在一条直线附近B.如果两个变量x与y之间不存在线性相关关系,那么根据试验数据不能写出一个线性方程。 C.设x,y是具有线性相关关系的两个变量,且回归直线方程是,则叫回归系数 D.为使求出的回归直线方程有意义,可用线性相关性检验的方法判断变量x与y之间是否存在线性相关关系 2.在一次试验中,测得(x,y)的四组值分别是(1,2),(2,3),(3,4),(4,5),则y与 x之间的回归直线方程是() A.B. C.D. 3.回归直线必过点() A.(0,0)B. C. D. 4.在画两个变量的散点图时,下面叙述正确的是() A.预报变量在轴上,解释变量在轴上 B.解释变量在轴上,预报变量在轴上 C.可以选择两个变量中任意一个变量在轴上 D.可以选择两个变量中任意一个变量在轴上 5.两个变量相关性越强,相关系数r() A.越接近于0 B.越接近于1 C.越接近于-1 D.绝

对值越接近1 6.若散点图中所有样本点都在一条直线上,解释变量与预报变量的相关系数为() A.0 B.1 C.-1 D.-1或1 7.一位母亲记录了她儿子3到9岁的身高,数据如下表: 年龄(岁)3456789 身高(94.8104.2108.7117.8124.3130.8139.0由此她建立了身高与年龄的回归模型,她用这个模型预测儿子10岁时的身高, 则下面的叙述正确的是() A.她儿子10岁时的身高一定是145.83 B.她儿子10岁时的身高在145.83以上 C.她儿子10岁时的身高在145.83左右 D.她儿子10岁时的身高在145.83以下 8.两个变量有线性相关关系且正相关,则回归直线方程中, 的系数() A.B.C.D. 能力提升: 9.一个工厂在某年每月产品的总成本y(万元)与该月产量x(万件)之间有如下数据:

1回归分析测试题

回归分析测试题 A 卷 一、 选择题: 1.炼钢时钢水的含碳量和冶炼时间有( ) A.确定性关系 B.相关关系 C.函数关系 D.无任何关系 2.对相关性的描述正确的是( ) A .相关性是一种因果关系 B .相关性是一种函数关系 C .相关性是变量和变量之间带有随机性的关系 D .以上都不正确 3.∑=n i i i y x 1等于( ) A.121)(y x x x n +++ B.121)(x y y y n +++ C. ++2211y x y x D.n n y x y x y x +++ 2211 4.设有一个回归方程为x y 5.22-=,则变量x 增加一个单位时( ) A .y 平均增加2.5个单位 B.y 平均增加2个单位 C.y 平均减少2.5个单位 D.y 平均减少2个单位 5.x 与y 之间的线性回归方程a bx y +=必定过( ) A.(0,0)点 B.(0,x )点 C.(0,y ) D.(y x ,) 6.某化工厂为预测某产品的回收率y ,需要研究它和原料有效成分含量x 之间的相关关系,现取了8对观测值,计算得 528 1 =∑=i i x , 2288 1 =∑=i i y ,

4788 1 2=∑=i i x ,18498 1 =∑=i i i y x ,则y 和x 的回归方程是( ) A.x y 62.247.11+= B.x y 62.247.11+-= C.62.247.11+=x y D.x y 62.247.11-= 7.线性回归方程a bx y +=有一组独立的观测数据),(11y x ,),(,),,(22n n y x y x ,则系数b 的值为( ) A. ∑∑==---n i i n i i i y y y y x x 1 2 1 )() )(( B. ∑∑==--n i i n i i i x y y x x 1 21 ) )(( C. ∑∑==---n i i n i i i x x y y x x 1 21 )() )(( D. ∑∑==--n i i n i i y y x x 12 12 )()( 8.已知x 、y 之间的一组数据: 则y 和x 的线性回归方程 a bx y +=必过点( ) A .(2,2) B.(1.5, 0) C. (1, 2) D.(1.5, 4) 二、填空题: 9.线性回归方程a bx y +=中,b 的意义是 . 10.有下列关系:(1)人的年龄和他(她)拥有的财富之间的关系;(2)曲线上的点和该点的坐标之间的关系;(3)苹果的产量和气候之间的关系;(4)森林中的同一种树木,其断面直径和高度之间的关系;(5)学生和他(她)的学号之间的关系.其中有相关关系的是 . 11.若施化肥量x 和水稻产量y 的回归直线方程为2505+=x y , 当施化肥量为80kg 时,预计的水稻产量为 . 12.已知线性回归方程{}),19,13,7,5,1(455.1∈+=x x y 则=y . 13.对于线性回归方程25775.4+=x y ,当28=x 时,y 的估计值是 . 三、解答题: 14.为了研究三月下旬的平均气温(x C 0)和四月二十号前棉花害虫化蛹高峰 x 0 1 2 3 y 1 3 5 7

高考试题 回归分析,独立性检验

回归分析与独立性检验 1.高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级中的排名情况如下图所示,甲、乙、丙为该班三位学生. 从这次考试成绩看, ①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是 ; ②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是 . 2.根据下面给出的2004年至2013年我国二氧化碳年排放量(单位:万吨)柱形图,以下结论中不正确的是( ) A .逐年比较,2008年减少二氧化碳排放量的效果最显着 B .2007年我国治理二氧化碳排放显现成效 C .2006年以来我国二氧化碳年排放量呈减少趋势 D .2006年以来我国二氧化碳年排放量与年份正相关 3.为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 根据上表可得回归直线方程???y bx a =+ ,其中???0.76,b a y bx ==- ,据此估计,该社区一户收入为15万元家庭年支出为( )] A .11.4万元 B .11.8万元 C .12.0万元 D .12.2万元 4.在画两个变量的散点图时,下面哪个叙述是正确的 ( ) A .预报变量在x 轴上,解释变量在y 轴上 B .解释变量在x 轴上,预报变量在 y 轴上 C .可以选择两个变量中任意一个变量在x 轴上 D .可以选择两个变量中任意一个变量在y 轴上 5 2004年 2005年 2006年 2007年 2008年 2009年 2010年 2011年 2012年 2013年

根据以上数据,则 ( ) A .种子经过处理跟是否生病有关 B .种子经过处理跟是否生病无关 C .种子是否经过处理决定是否生病 D .以上都是错误的 6.变量x 与y 具有线性相关关系,当x 取值16,14,12,8时,通过观测得到y 的值分别为11,9,8,5,若在实际问题 中,y 的预报最大取值是10,则x 的最大取值不能超过 ( ) A .16 B .17 C .15 D .12 7.在研究身高和体重的关系时,求得相关指数≈2 R ___________,可以叙述为“身高解释了64%的体重变化,而随机 误差贡献了剩余的36%”所以身高对体重的效应比随机误差的效应大得多。 8.下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图 (I )由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (II )建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量。 参考数据: 7 1 9.32i i y ==∑,7 1 40.17i i i t y ==∑, 7 2 1 () 0.55i i y y =-=∑, 7≈2.646. 参考公式:相关系数1 2 2 1 1 ()() ()(y y)n i i i n n i i i i t t y y r t t ===--= --∑∑∑, 回归方程 y a bt =+ 中斜率和截距的最小二乘估计公式分别为: 9.某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图. 根据该折线图,下列结论错误的是 A .月接待游客量逐月增加 B .年接待游客量逐年增加 C .各年的月接待游客量高峰期大致在7,8月 D .各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳 10.为了研究某班学生的脚长x (单位:厘米)和身高 y (单位:厘米)的关系,从该班随机抽取10名学生,根据测 量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为???y bx a =+.已知10 1 225i i x ==∑,10 1 1600i i y ==∑,?4b =.该班某学生的脚长为24,据此估计其身高为 (A )160 (B )163 (C )166 (D )170 11.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg )某频率分布直方图如下: (1) 设两种养殖方法的箱产量相互独立,记A 表示事件:“旧养殖法的箱产量低于50kg, 新养殖法的箱产量不低

回归分析模拟试题分解

(1)根据给定的模型,考察当x趋向于无穷大时y的变化,确定参数C0的初始值; (2)求给定的模型关于参数C0、C1、C2的导数; (3)若取参数的初始值C0=100,C1=4to7搜索步长0.1,C2=3to5搜索步长0.1,利用高斯-牛顿迭代法进行参数估计,得到结果如下: 请写出完成该运算的SAS程序(数据集sta7)、拟合所得的模型,计算所得的相关指数R2。Data its_4; Input x y@@; Cards; 1 0.5 2 2.5 3 3.5 4 24 5 54.7 6 82.1 7 94.8

8 96.2 9 96.4 ; ________________________________ Proc qplot; Plot y*x=’*’/grtd; Run; ______________________________ Proc nlin; Paras c0=100 c1=3 to 6 by 0.02 c2=3 to 6 by 0.02; Model y=c0-c0/(1+(x/c2)**c1); Run; 多重共线性对回归参数的估计有何影响? 1.对参数的估计值不精确,也不稳定。样本观测值稍有变动,增加或减少解释变量都会使参数估计值发生较大变化,甚至出现符号错误,从而不能正确反映解释变量对被解释变量的影响。 2.参数估计的标准差较大,使参数的显著性t检验增加了接受原假设的可能,从而舍去对被解释变量有显著影响的解释变量。 主成分回归的思想和分析步骤: 有偏估计的方法:参数的有偏估计方法有岭回归、主成分回归和偏最小二乘。 主成分回归的思想和方法: (1)主成分回归是利用主成分分析的思想,在损失信息很少的前提下把原变量利用正交旋转变化转化为较少个数的主成分(综合指标),计算样品在所选主成分上的得分,将原因变量对原来各分析样品主成分得分进行回归,并将各主成分分别对原自变量进行回归后再代入原因变量对主成分的回归方程就得到主成分回归方程。 (2)分析步骤: 1.求原自变量集的相关系数矩阵及其特征值和相应的标准正交特征向量; 2.按从大到小排列特征值,以累计方差贡献率>=85%选取前面较大的若干个特征值,利用其相应的特征向量构成主成分; 3.计算各样品在所选主成分上的得分; 4.利用原因变量对所选主成分得分进行回归,各主成分分析对原自变量进行回归并将所得的回归结果代入原因变量对所选主成分的回归方法既得结果 该方法的主要用途是消除自变量间的多重共线性,它与回归参数的普通最小二重估计的主

应用回归分析,第8章课后习题参考答案

第8章 非线性回归 思考与练习参考答案 8.1 在非线性回归线性化时,对因变量作变换应注意什么问题? 答:在对非线性回归模型线性化时,对因变量作变换时不仅要注意回归函数的形式, 还要注意误差项的形式。如: (1) 乘性误差项,模型形式为 e y AK L αβε =, (2) 加性误差项,模型形式为y AK L αβ ε = + 对乘法误差项模型(1)可通过两边取对数转化成线性模型,(2)不能线性化。 一般总是假定非线性模型误差项的形式就是能够使回归模型线性化的形式,为了方便通常省去误差项,仅考虑回归函数的形式。 8.2为了研究生产率与废料率之间的关系,记录了如表8.15所示的数据,请画出散点图,根据散点图的趋势拟合适当的回归模型。 表8.15 生产率x (单位/周) 1000 2000 3000 3500 4000 4500 5000 废品率y (%) 5.2 6.5 6.8 8.1 10.2 10.3 13.0 解:先画出散点图如下图: 5000.00 4000.003000.002000.001000.00x 12.00 10.00 8.006.00 y

从散点图大致可以判断出x 和y 之间呈抛物线或指数曲线,由此采用二次方程式和指数函数进行曲线回归。 (1)二次曲线 SPSS 输出结果如下: Model Summ ary .981 .962 .942 .651 R R Square Adjusted R Square Std. E rror of the Estimate The independent variable is x. ANOVA 42.571221.28650.160.001 1.6974.424 44.269 6 Regression Residual Total Sum of Squares df Mean Square F Sig.The independent variable is x. Coe fficients -.001.001-.449-.891.4234.47E -007.000 1.417 2.812.0485.843 1.324 4.414.012 x x ** 2 (Constant) B Std. E rror Unstandardized Coefficients Beta Standardized Coefficients t Sig. 从上表可以得到回归方程为:72? 5.8430.087 4.4710y x x -=-+? 由x 的系数检验P 值大于0.05,得到x 的系数未通过显著性检验。 由x 2的系数检验P 值小于0.05,得到x 2的系数通过了显著性检验。 (2)指数曲线 Model Summ ary .970 .941 .929 .085 R R Square Adjusted R Square Std. E rror of the Estimate The independent variable is x.

高考试题回归分析,独立性检验

高考试题回归分析,独 立性检验 TTA standardization office【TTA 5AB- TTAK 08- TTA 2C】

回归分析与独立性检验 1.高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级中的排名情况如下图所示,甲、乙、丙为该班三位学生. 从这次考试成绩看, ①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是 ; ②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是 . 2.根据下面给出的2004年至2013年我国二氧化碳年排放量(单位:万吨)柱形图,以下结论中不正确的是( ) A .逐年比较,2008年减少二氧化碳排放量的效果最显着 B .2007年我国治理二氧化碳排放显现成效 C .2006年以来我国二氧化碳年排放量呈减少趋势 D .2006年以来我国二氧化碳年排放量与年份正相关 3.为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 根据上表可得回归直线方程???y bx a =+ ,其中???0.76,b a y bx ==- ,据此估计,该社区一户收入为15万元 家庭年支出为( )] A .万元 B .万元 C .万元 D .万元 4.在画两个变量的散点图时,下面哪个叙述是正确的 ( ) A .预报变量在x 轴上,解释变量在y 轴上 B .解释变量在x 轴上,预报变量在 y 轴上 C .可以选择两个变量中任意一个变量在x 轴上 D .可以选择两个变量中任意一个变量在y 轴上 5 2004年 2005年 2006年 2007年 2008年 2009年 2010年 2011年 2012年 2013年

西南财经_计量经济学期末试题

西南财经大学2007 - 2008 学年第一学期 各专业本科 2005 级(三年级一学期)学号评定成绩(分)学生姓名担任教师 《计量经济学》期末闭卷考试题 (下述一 - 四题全作计100分,两小时完卷) 考试日期: 试题全文: 一、单选题答案 二、多选题答案

一、 单项选择题(每小题1分,共30分) 1、以下模型中属于线性回归模型是( ) A. 212()i i i E Y X X ββ=+ B. 1()i i i E Y X β= C. 212()i i i E Y X X ββ=+ D. 12 i i i X Y u ββ=+ + 2、半对数模型01ln Y X ααμ=++中,参数1α的含义是( ) A . X 的绝对量发生一定变动时,引起因变量Y 的相对变化率 B .Y 关于X 的弹性 C .X 的相对变化,引起Y 的期望值绝对量变化 D .Y 关于X 的边际变化 3、在模型12233t t t t Y X X u βββ=+++的回归分析结果报告中,设F 统计量对应p 值为 F p ,给定显著性水平0.05α=,则下列说法正确是表明( ) A 、若F p α<,解释变量2t X 对t Y 的影响是显著的 B 、若F p α≥,解释变量2t X 和3t X 对t Y 的联合影响是显著的 C 、若F p α< ,则解释变量2t X 和3t X 对t Y 的影响均不显著 D 、以上说法均不对 4、对被解释变量Y 个别值作的区间预测,不具有的特点是( ) A. 对Y 的预测区间是随F X 的变化而变化的 B. 对Y 的预测区间上下限与样本容量有关 C. 对Y 的预测区间只决定于随机扰动i u 的方差 D. 对Y 的预测区间不仅受抽样波动影响,而且还受随机扰动项的影响 5、对多元线性回归方程的显著性检验,所用的F 统计量可表示为( )

应用回归分析填空题和答案

应用回归分析:填空 (1) 回归分析是处理变量间_______关系的一种数理统计方法,若变量间具有线性关系,则称相应的回归分析为____________;若变量间不具有线性关系,就称相应的回归分析为___________________。 (2) 现代统计学中研究统计关系的两个重要分支是_________和_____________。 (3) 回归模型的建立是基于回归变量的样本统计数据,常用的样本数据分为___ ___________________和______________________。 (4) 回归模型通常应用于______________________、____________________和_____________________等方面。 (5) 最小二乘法的基本特点是使回归值与_________________________平方和为最小,最小二乘法的理论依据是___________________________。 (6) 多元线性回归模型ε β += X Y ,回归参数β的最小二乘估计为 β ?=_________________________。 (7) 设线性回归模型参数向量β(p+1维)的最小二乘估计为β?,c 为p+1维常数向量,则______________是____________的最小方差线性无偏估计。 (8) 在线性回归分析中,最小二乘估计的性质有______________; _____ _____________和____________________等。 (9) 多元线性回归模型n i x x y i ip p i i ,,2,1,110 =++++=εβββ,误差项 ()n i i ,,2,1, =ε需满足的markov Gauss -假设为: (a):________________________________________; (b):________________________________________; (c):_________________________________________。 (10) 对回归方程做显著性检验时,可以用P 值代替检验统计量值,作出拒绝或接受原假设的决定:当P_______α时,接受0H ;当P________α时,拒绝0H 。 (11) 在p 元线性回归中,确定随机变量y 与自变量12,,,p x x x 间是否有线性

计量经济学期末试题

一、判断正误(20分) 1. 随机误差项i u 和残差项i e 是一回事。( F ) 2. 给定显著性水平a 及自由度,若计算得到的t 值超过临界的t 值,我们将接受零假设( F ) 3. 利用OLS 法求得的样本回归直线t t X b b Y 21?+=通过样本均值点),(Y X 。( T ) 4. 判定系数ESS TSS R =2 。( F ) 5. 整个多元回归模型在统计上是显著的意味着模型中任何一个单独的变量均是统计显著的。( F ) 6. 双对数模型的2R 值可以与对数线性模型的相比较,但不能与线性对数模型的相比较。( T ) 7. 为了避免陷入虚拟变量陷阱,如果一个定性变量有m 类,则要引入m 个虚拟变量。( F ) 8. 在存在异方差情况下,常用的OLS 法总是高估了估计量的标准差。( T ) 9. 识别的阶条件仅仅是判别模型是否可识别的必要条件而不是充分条件。( T ) 10. 如果零假设H 0:B 2=0,在显著性水平5%下不被拒绝,则认为B 2一定是0。 ( F ) 六、什么是自相关?杜宾—瓦尔森检验的前提条件和步骤是什么?(15分) 解:自相关,在时间(如时间序列数据)或者空间(如在截面数据中)上按顺序排列的序列的各成员之间存在着相关关系。在计量经济学中指回归模型中随机扰动项之间存在相关关系。用符号表示: ()j i u u E u u j i j i ≠≠=0),cov( 杜宾—瓦尔森检验的前提条件为: (1)回归模型包括截距项。 (2)变量X 是非随机变量。 (3)扰动项t u 的产生机制是 表示自相关系数),11(1≤≤-+=-ρρt t t v u u 上述这个描述机制我们称为一阶自回归模型,通常记为AR(1)。 (4)在回归方程的解释变量中,不包括把因变量的滞后变量。即检验对于自回归模型是不使用的。 杜宾—瓦尔森检验的步骤为: (1)进行OLS 的回归并获得e t 。 (2)计算d 值。 (3)给定样本容量n 和解释变量k 的个数,从临界值表中查得d L 和d U 。 (4)根据相应的规则进行判断。 一、判断正误(20分) 1. 回归分析用来处理一个因变量与另一个或多个自变量之间的因果关系。( F ) 2. 拟合优度R 2的值越大,说明样本回归模型对总体回归模型的代表性越强。( T )

应用回归分析试卷

1、对于一元线性回归01(1,2,...,)i i i y x i n ββε=++=,()0i E ε=,2 var()i εσ=, cov(,)0()i j i j εε=≠,下列说法错误的是 (A)0β,1β的最小二乘估计0?β,1 ?β 都是无偏估计; (B)0β,1β的最小二乘估计0?β,1?β对1y ,2y ,...,n y 是线性的; 2、在回归分析中若诊断出异方差,常通过方差稳定化变化对因变量进行变换. 如果误差方差与因变量y 的期望成正比,则可通过下列哪种变换将方差常数化 (A) 1 y ; (C) ln(1)y +;(D)ln y . 3、下列说法错误的是 (A)强影响点不一定是异常值; (B)在多元回归中,回归系数显着性的t 检验与回归方程显着性的F 检验是等价的; (C)一般情况下,一个定性变量有k 类可能的取值时,需要引入k-1个0-1型自变量; (D)异常值的识别与特定的模型有关. 4、下面给出了4个残差图,哪个图形表示误差序列是自相关的 (A) (C) 5 应用回归分析试题(一) (C)0β,1β的最小二乘估计0?β,1 ?β之间是相关的; (D)若误差服从正态分布,0β,1β的最小二乘估计和极大似然估计是不一样的.

(A) (B) (C) (D) 二、填空题(每空2分,共20分) 1、考虑模型y X βε=+,2var()n I εσ=,其中:X n p '?,秩为p ',2 0σ>不一定 已知,则?β =__________________, ?var()β=___________,若ε服从正态分布,则 22 ?()n p σ σ'-:___________,其中2?σ 是2σ的无偏估计. 2、下表给出了四变量模型的回归结果: 则残差平方和=_________,总的观察值个数=_________,回归平方和的自由度=________. 3、已知因变量y 与自变量1x ,2x ,3x ,4x ,下表给出了所有可能回归模型的AIC 值,则最优子集是_____________________. 4、在诊断自相关现象时,若0.66DW =,则误差序列的自相关系数ρ的估计值=_____ ,若存在自相关现象,常用的处理方法有迭代法、_____________、科克伦-奥克特迭代法. 5、设因变量y 与自变量x 的观察值分别为12,,...,n y y y 和12,,...,n x x x ,则以* x 为折点的 折线模型可表示为_____________________. 三、(共45分)研究货运总量y (万吨)与工业总产值1x (亿元)、农业总产值2x (亿元)、居民非商品支出3x (亿元)的线性回归关系.观察数据及残差值i e 、学生化残差i SRE 、

回归分析练习题及参考答案

1 下面是7个地区2000年的人均国生产总值(GDP)和人均消费水平的统计数据: 地区人均GDP/元人均消费水平/元 22460 11226 34547 4851 5444 2662 4549 7326 4490 11546 2396 2208 1608 2035 求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。 (2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。 (3)求出估计的回归方程,并解释回归系数的实际意义。 (4)计算判定系数,并解释其意义。 (5)检验回归方程线性关系的显著性(0.05 α=)。 (6)如果某地区的人均GDP为5000元,预测其人均消费水平。 (7)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。 解:(1) 可能存在线性关系。 (2)相关系数:

(3)回归方程:734.6930.309 y x =+ 回归系数的含义:人均GDP没增加1元,人均消费增加0.309元。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规排版。 系数(a) 模型非标准化系数标准化系数 t 显著性B 标准误Beta 1 (常量)734.693 139.540 5.265 0.003 人均GDP(元)0.309 0.008 0.998 36.492 0.000 a. 因变量: 人均消费水平(元)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% (4) 模型汇总 模型R R 方调整 R 方标准估计的误 差 1 .998a.996 .996 247.303 a. 预测变量: (常量), 人均GDP。 人均GDP对人均消费的影响达到99.6%。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规排版。 模型摘要 模型R R 方调整的 R 方估计的标准差 1 .998(a) 0.996 0.996 247.303 a. 预测变量:(常量), 人均GDP(元)。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

应用回归分析,第7章课后习题参考答案

第7章岭回归 思考与练习参考答案 7.1 岭回归估计是在什么情况下提出的? 答:当自变量间存在复共线性时,|X’X|≈0,回归系数估计的方差就很大,估计值就很不稳定,为解决多重共线性,并使回归得到合理的结果,70年代提出了岭回归(Ridge Regression,简记为RR)。 7.2岭回归的定义及统计思想是什么? 答:岭回归法就是以引入偏误为代价减小参数估计量的方差的一种回归方法,其统计思想是对于(X’X)-1为奇异时,给X’X加上一个正常数矩阵 D, 那么X’X+D接近奇异的程度就会比X′X接近奇异的程度小得多,从而完成回归。但是这样的回归必定丢失了信息,不满足blue。但这样的代价有时是值得的,因为这样可以获得与专业知识相一致的结果。 7.3 选择岭参数k有哪几种方法? 答:最优 是依赖于未知参数 和 的,几种常见的选择方法是: 岭迹法:选择 的点能使各岭估计基本稳定,岭估计符号合理,回归系数没有不合乎经济意义的绝对值,且残差平方和增大不太多;

方差扩大因子法: ,其对角线元 是岭估计的方差扩大因子。要让 ; 残差平方和:满足 成立的最大的 值。 7.4 用岭回归方法选择自变量应遵循哪些基本原则? 答:岭回归选择变量通常的原则是: 1. 在岭回归的计算中,我们通常假定涉及矩阵已经中心化和标准化了,这样可以直接比较标准化岭回归系数的大小。我们可以剔除掉标准化岭回归系数比较稳定且绝对值很小的自变量; 2. 当k值较小时,标准化岭回归系数的绝对值并不很小,但是不稳定,随着k的增加迅速趋近于零。像这样岭回归系数不稳定、震动趋于零的自变量,我们也可以予以剔除; 3. 去掉标准化岭回归系数很不稳定的自变量。如果有若干个岭回归系数不稳定,究竟去掉几个,去掉那几个,要根据去掉某个变量后重新进行岭回归分析的效果来确定。

计量经济学期末考试试卷集(含答案)-梁瑛提供

计量经济学试题一答案 一、判断题(20分) 1. 线性回归模型中,解释变量是原因,被解释变量是结果。(F ) 2.多元回归模型统计显著是指模型中每个变量都是统计显著的。(F ) 3.在存在异方差情况下,常用的OLS 法总是高估了估计量的标准差。(F ) 4.总体回归线是当解释变量取给定值时因变量的条件均值的轨迹。(Y ) 5.线性回归是指解释变量和被解释变量之间呈现线性关系。 (F ) 6.判定系数2 R 的大小不受回归模型中所包含的解释变量个数的影响。( F ) 7.多重共线性是一种随机误差现象。 (F ) 8.当存在自相关时,OLS 估计量是有偏的并且也是无效的。 ( F ) 9.在异方差的情况下, OLS 估计量误差放大的原因是从属回归的2 R 变大。( F ) 10.任何两个计量经济模型的2 R 都是可以比较的。 ( F ) 二. 简答题(10) 1.计量经济模型分析经济问题的基本步骤。(4分) 答: 1)经济理论或假说的陈述 2) 收集数据 3)建立数理经济学模型 4)建立经济计量模型 5)模型系数估计和假设检验 6)模型的选择 7)理论假说的选择 8)经济学应用 2.举例说明如何引进加法模式和乘法模式建立虚拟变量模型。 (6分) 答案:设Y 为个人消费支出;X 表示可支配收入,定义 210t D ?=? ?2季度其他31 t D ?=??3季度其他 1 40 D t ?=? ?4季度其他 如果设定模型为 12233445t t t t t t Y B B D B D B D B X u =+++++ 此时模型仅影响截距项,差异表现为截距项的和,因此也称为加法模型。

回归分析练习题(有答案)

1.1回归分析的基本思想及其初步应用 一、选择题 1. 某同学由x 与y 之间的一组数据求得两个变量间的线性回归方程为y bx a =+,已知:数据x 的平 均值为2,数据 y 的平均值为3,则 ( ) A .回归直线必过点(2,3) B .回归直线一定不过点(2,3) C .点(2,3)在回归直线上方 D .点(2,3)在回归直线下方 2. 在一次试验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则Y 与X 之间的回归直线方程为( )A . y x 1=+ B . y x 2=+ C . y 2x 1=+ D. y x 1=-3. 在对两个变量x ,y 进行线性回归分析时,有下列步骤: ①对所求出的回归直线方程作出解释; ②收集数据(i x 、i y ) ,1,2i =,…,n ; ③求线性回归方程; ④求未知参数; ⑤根据所搜集的数据绘制散点图 如果根据可行性要求能够作出变量,x y 具有线性相关结论,则在下列操作中正确的是( ) A .①②⑤③④ B .③②④⑤① C .②④③①⑤ D .②⑤④③① 4. 下列说法中正确的是( ) A .任何两个变量都具有相关关系 B .人的知识与其年龄具有相关关系 C .散点图中的各点是分散的没有规律 D .根据散点图求得的回归直线方程都是有意义的 5. 给出下列结论: (1)在回归分析中,可用指数系数2 R 的值判断模型的拟合效果,2 R 越大,模型的拟合效果越好; (2)在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好; (3)在回归分析中,可用相关系数r 的值判断模型的拟合效果,r 越小,模型的拟合效果越好; (4)在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高. 以上结论中,正确的有( )个. A .1 B .2 C .3 D .4 6. 已知直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A.y 平均增加1.5个单位 B.y 平均增加2个单位 C.y 平均减少1.5个单位 D. y 平均减少2个单位 7. 下面的各图中,散点图与相关系数r 不符合的是( )

统计学期末考试试卷及答案

统计学期末综合测试 一、单项选择题(每小题 分,共 ?分) 、社会经济统计的数量特点表现在它是( )。 ?一种纯数量的研究 ?从事物量的研究开始来认识事物的质 从定性认识开始以定量认识为最终目的 ?在质与量的联系中,观察并研究社会经济现象的数量方面 、欲使数量指标算术平均法指数的计算结果、经济内容与数量指标综合法指数相同,权数应是( )。 ? 00p q ? 11p q ? 01p q ? 10p q 、如果你的业务是销售运动衫,哪一种运动衫号码的度量对你更为有用( )。 ?均值 ?中位数 ?众数 ?四分位数 、某年末某地区城市人均居住面积为 ?平方米,标准差为 平方米,乡村人均居住面积为 平方米,标准差为 ? ?平方米,则该地区城市和乡村居民居住面积的离散程度( )。 ? 乡村较大 ?城市较大 城市和乡村一样 ?不能比较 、某厂某种产品生产有很强的季节性,各月计划任务有很大差异,今年 月超额完成计划 , 月刚好完成计划, 月超额完成 ?,则该厂该年一季度超额完成计划( )。 ? ? ?? ?无法计算 、基期甲、乙两组工人的平均日产量分别为 件和 ?件,若报告期两组工人的平均日产

量不变,乙组工人数占两组工人总数的比重上升,则报告期两组工人总平均日产量( )。 ?上升 ?下降 ? 不变 ?可能上升也可能下降 、同一数量货币,报告期只能购买基期商品量的 ?,是因为物价( )。 ?上涨 ??? ?上涨 ? ?下跌 ? ?下跌 ??? 、为消除季节变动的影响而计算的发展速度指标为( )。 ?环比发展速度 ?年距发展速度 ?定基发展速度 ?平均发展速度 、计算无关标志排队等距抽样的抽样误差,一般采用( )。 ?简单随机抽样的误差公式 ?分层抽样的误差公式 等距抽样的误差公式 ?整群抽样的误差公式 、我国统计调查方法体系改革的目标模式是以( )为主体。 ?抽样调查 ? 普查 ? 统计报表 ? 重点调查 ?、设总体分布形式和总体方差都未知,对总体均值进行假设检验时,若抽取一个容量为 ?的样本,则可采用( )。 ? ?检验法 ? ?检验法 ?2 检验法 ? ?检验法 、要通过移动平均法消除季节变动得到趋势值,则移动平均项数( )。 ?应选择奇数 ? 应和季节周期长度一致 应选择偶数 ?可取 或 ?、回归估计标准差的值越小,说明( )。 ? 平均数的代表性越好 ? 平均数的代表性

应用回归分析测试题

一 选择题 1、对于一元线性回归01+(1,2,,)i i i y x i n ββε=+= ,()0i E ε=,2 var()i εσ=, cov(,)0(i j)i j εε=≠,下列说法错误的( BC ) (A) 01ββ,的最小二乘估计01 ??ββ,都是无偏估计; (B) 01ββ,的最小二乘估计01??ββ,对12,,n y y y ,是线性的; (C) 01ββ,的最小二乘估计01 ??ββ,之间是相关的; (D) 若误差服从正态分布,01ββ,的最小二乘估计和极大似然估计是不一样的. 2、下列说法错误的是 ( B ) (A)强影响点不一定是异常值; (B)在多元回归中,回归系数显著性的t 检验与回归方程显著性的F 检验是等价的; (C)一般情况下,一个定性变量有k 类可能的取值时,需要引入k-1个0-1型自变量; (D)异常值的识别与特定的模型有关. 3、在对两个变量x ,y 进行线性回归分析时,有下列步骤: ①对所求出的回归直线方程作出解释; ②收集数据{(x ,y )},i=1,2,,n i i ; ③求线性回归方程; ④求未知参数; ⑤根据所搜集的数据绘制散点图。 如果根据可行性要求能够作出变量,x,y 具有线性相关结论,则在下列操作中正确的是( D ) A .①②⑤③④ B .③②④⑤① C .②④③①⑤ D .②⑤④③① 4、下列说法中正确的是(B ) A.任何两个变量都具有相关关系 ; B.人的知识与其年龄具有相关关系 ; C .散点图中的各点是分散的没有规律 ; D .根据散点图求得的回归直线方程都是有意义的。 5、下面的各图中,散点图与相关系数r 不符合的是( B )

应用回归分析试题二

应用回归分析试题(二) 一、选择题 1. 在对两个变量x , y 进行线性回归分析时,有下列步骤: ①对所求出的回归直线方程作出解释;②收集数据(X i 、),1,2,…, n ;③ 求线性回归方程;④求未知参数; ⑤根据所搜集的数据绘制 散点图。 如果根据可行性要求能够作出变量x ,y 具有线性相关结论,则在下列 操作中正确的是(D ) A .①②⑤③④ B .③②④⑤① C .②④③①⑤ D .②⑤④③① 2. 下列说法中正确的是(B ) A .任何两个变量都具有相关关系 B .人的知识与其年龄具有相关关系 C .散点图中的各点是分散的没有规律 D .根据散点图求得的回归直线方程都是有意义的 3. 下面的各图中,散点图与相关系数r 不符合的是(B ) \ 4 yi i .? — |

5. 在画两个变量的散点图时,下面哪个叙述是正确的 (B ) (A) 预报变量在x 轴上,解释变量在y 轴上 (B) 解释变量在x 轴上,预报变量在y 轴上 (C) 可以选择两个变量中任意一个变量在 X 轴上 (D) 可以选择两个变量中任意一个变量 二、 填空题 m 丄 1. y 关于m 个自变量的所有可能回归方程有-一1个。 2. H 是帽子矩阵,贝S tr(H)=p+1。 3. 回归分析中从研究对象上可分为一元和多元。 4. 回归模型的一般形式是 y ° 1X 1 2X 2 p X p 。 5. Cov(e) 2(l H) (e 为多元回归的残差阵)。 三、 叙述题 1.引起异常值消除的方法(至少5个)? 答案:异常值消除方法: (1) 重新核实数据; (2) 重新测量数据; (3) 删除或重新观测异常值数据; (4) 增加必要的自变量; 则正确的叙述是(D ) A .身咼一定是145.83cm C .身高低于145.00cm B .身高超过146.00cm D .身高在145.83cm 左右

应用回归分析,第4章课后习题参考答案.

第4章违背基本假设的情况 思考与练习参考答案 4.1 试举例说明产生异方差的原因。 答:例4.1:截面资料下研究居民家庭的储蓄行为 Y i=β0+β1X i+εi 其中:Y i表示第i个家庭的储蓄额,X i表示第i个家庭的可支配收入。 由于高收入家庭储蓄额的差异较大,低收入家庭的储蓄额则更有规律性,差异较小,所以εi的方差呈现单调递增型变化。 例4.2:以某一行业的企业为样本建立企业生产函数模型 Y i=A iβ1K iβ2L iβ3eεi 被解释变量:产出量Y,解释变量:资本K、劳动L、技术A,那么每个企业所处的外部环境对产出量的影响被包含在随机误差项中。由于每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。这时,随机误差项ε的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。 4.2 异方差带来的后果有哪些? 答:回归模型一旦出现异方差性,如果仍采用OLS估计模型参数,会产生下列不良后果: 1、参数估计量非有效 2、变量的显著性检验失去意义 3、回归方程的应用效果极不理想 总的来说,当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。 4.3 简述用加权最小二乘法消除一元线性回归中异方差性的思想与方法。 答:普通最小二乘估计就是寻找参数的估计值使离差平方和达极小。其中每个平方项的权数相同,是普通最小二乘回归参数估计方法。在误差项等方差不相关的条件下,普通最小二乘估计是回归参数的最小方差线性无偏估计。然而在异方差

的条件下,平方和中的每一项的地位是不相同的,误差项的方差大的项,在残差平方和中的取值就偏大,作用就大,因而普通最小二乘估计的回归线就被拉向方差大的项,方差大的项的拟合程度就好,而方差小的项的拟合程度就差。由OLS 求出的仍然是的无偏估计,但不再是最小方差线性无偏估计。所以就是:对较大的残差平方赋予较小的权数,对较小的残差平方赋予较大的权数。这样对残差所提供信息的重要程度作一番校正,以提高参数估计的精度。 加权最小二乘法的方法: 4.4简述用加权最小二乘法消除多元线性回归中异方差性的思想与方法。 答:运用加权最小二乘法消除多元线性回归中异方差性的思想与一元线性回归的类似。多元线性回归加权最小二乘法是在平方和中加入一个适当的权数i w ,以调整各项在平方和中的作用,加权最小二乘的离差平方和为: ∑=----=n i ip p i i i p w x x y w Q 1211010)( ),,,(ββββββ (2) 加权最小二乘估计就是寻找参数p βββ,,,10 的估计值pw w w βββ?,,?,?10 使式(2)的离差平方和w Q 达极小。所得加权最小二乘经验回归方程记做 22011 1 ???()()N N w i i i i i i i i Q w y y w y x ββ===-=--∑∑22 __ 1 _ 2 _ _ 02 222 ()() ?()?1 11 1 ,i i N w i i i w i w i w w w w w kx i i i i m i i i m i w x x y y x x y x w kx x kx w x σβββσσ==---=-= = ===∑∑1N i =1 1表示=或

相关主题
文本预览
相关文档 最新文档