第二章(简单线性回归模型)2-5答案(可编辑修改word版)
- 格式:docx
- 大小:12.49 KB
- 文档页数:1
2.2 简单线性回归模型参数的估计一、判断题1.使用普通最小二乘法估计模型时,所选择的回归线使得所有观察值的残差和达到最小。
(F)2.随机扰动项和残差项是一回事。
(F )3.在任何情况下OLS 估计量都是待估参数的最优线性无偏估计。
(F )4.满足基本假设条件下,随机误差项i μ服从正态分布,但被解释变量Y 不一定服从正态分 布。
( F )5.如果观测值i X 近似相等,也不会影响回归系数的估计量。
( F )二、单项选择题1.设样本回归模型为i 01i i ˆˆY =X +e ββ+,则普通最小二乘法确定的iˆβ的公式中,错误的是( D )。
A .()()()i i 12i X X Y -Y ˆX X β--∑∑= B .()i i i i 122i i n X Y -X Y ˆn X -X β∑∑∑∑∑=C .i i 122iX Y -nXY ˆX -nX β∑∑= D .i i i i 12x n X Y -X Y ˆβσ∑∑∑= 2.以Y 表示实际观测值,ˆY 表示回归估计值,则普通最小二乘法估计参数的准则是使( D )。
A .i i ˆY Y 0∑(-)=B .2i i ˆY Y 0∑(-)=C .i i ˆY Y ∑(-)=最小D .2i i ˆY Y ∑(-)=最小 3.设Y 表示实际观测值,ˆY 表示OLS 估计回归值,则下列哪项成立( D )。
A .ˆYY = B .ˆY Y = C .ˆY Y = D .ˆY Y = 4.用OLS 估计经典线性模型i 01i i Y X u ββ+=+,则样本回归直线通过点( D )。
A .X Y (,)B . ˆX Y (,)C .ˆX Y (,)D .X Y (,) 5.以Y 表示实际观测值,ˆY表示OLS 估计回归值,则用OLS 得到的样本回归直线i 01iˆˆˆY X ββ+=满足( A )。
A .i i ˆY Y 0∑(-)=B .2i i Y Y 0∑(-)= C . 2i i ˆY Y 0∑(-)= D .2i i ˆY Y 0∑(-)=6.按经典假设,线性回归模型中的解释变量应是非随机变量,且( A )。
第二章课后答案2.11)设回归模型为: 01i i i Y X u ββ=++其中,Y 为国内生产总值,i X 为地方预算内财政收入对回归模型的参数进行估计,根据回归结果得:i Y = -3.611151+ 0.134582iX (4.161790) (0.003867)t = (-0.867692) (34.80013)2r =0.991810 F=1211.049 S.E.=7.532484 DW=2.0516402)斜率系数的经济意义:国内生产总值每增加1亿元,地方预算内财政收入平均增加0.315亿元。
3)由以上模型可看出,X 的参数估计的t 统计量远大于2,说明GDP 对地方财政收入确有显著影响。
模型在的可决系数为0.991810,说明GDP 解释了地方财政收入变动的99%,模型拟合程度较好。
4)预测点预测:若2005年GDP 为3600亿元,2005年的财政收入预测值为480.884。
区间预测:由X 、Y 的描述统计结果得: 22(1)587.269(121)3793733.66i x x n σ=-=⨯-=∑22()(3600-917.5874)7195337.357f X X -==取α=0.05,f Y 平均值置信度95%的预测区间为:/2f Y t α f X =3600时,480.884 2.228⨯7.5325⨯ 23.61476991 即,2005年财政收入的平均值预测区间为:480.884 23.34796 (457.2692, 504.4988)f Y 个别值置信度95%的预测区间为:/2f Y t α f X =3600,480.884 2.228⨯7.5325⨯ 28.97079 2005年财政收入的个别值预测区间为:480.884 28.97079 (451.91321,509.8548)2.2令Y 为利润额,X 为研究与发展经费研究与发展经费与利润额的相关系数表:设回归模型为:01i i i Y X u ββ=++其中i Y 为利润额,i X 为研究与发展经费。
2.4 回归系数的区间估计和假设检验一、判断题1.如果零假设H 0:B 2=0,在显著性水平5%下不被拒绝,则认为B 2一定是0。
(F )2.k β的置信度为()α-1的置信区间指真实参数落入该区间的概率是()α-1。
(F)3.假设检验为单侧检验还是双侧检验本质上取决于备择假设的形式。
(F )4.回归系数的显著性检验是用来检验解释变量对被解释变量有无显著解释能力的检验。
(T )二、单项选择题1.对回归模型i i 10i u X Y ++=ββ进行检验时,通常假定i u 服从( C )。
A .()2i 0N σ, B .()2n t - C .()20N σ, D .()n t2.用一组有30个观测值的样本估计模型i i 10i u X Y ++=ββ,在0.05的显著性水平下对1β的显著性作检验,则1β显著地不等于零的条件是其统计量大于( D )。
A .()30t 050. B .()30t 0250.) C .()28t 050. D .()28t 0250. 3.回归模型i i i u X Y ++=10ββ中,关于检验010=β:H 所用的统计量)ˆ(ˆ111βββVar -,下列说法正确的是( D )。
A .服从)(22-n χB .服从)(1-n tC .服从)(12-n χ D .服从)(2-n t 4.用一组有30个观测值的样本估计模型后,在0.05的显著性水平上对的显著性作检验,则显著地不等于零的条件是其统计量大于等于( C ) A. B. C. D. 三、简答题1.当α给定后,回归系数2β的置信区间是什么样的?答:总体方差2σ已知时,置信区间为⎥⎥⎦⎤⎢⎢⎣⎡+-∑∑2i 22i2x z xz σβσβˆ,ˆ;总体方差2σ未知则使用2n e 2i2-=∑σˆ估计2σ:①样本容量充分大时,统计量仍服从正态,则置信区间为t t 01122t t t t y b b x b x u =+++1b t 1b t )30(05.0t )28(025.0t )27(025.0t )28,1(025.0F⎥⎥⎦⎤⎢⎢⎣⎡+-∑∑2i 22i 2x z x z σβσβˆˆ,ˆˆ;②样本容量较小时,统计量服从t 分布,则置信区间为⎥⎥⎦⎤⎢⎢⎣⎡+-∑∑2i 222i22x t xt σβσβααˆˆ,ˆˆ 。
第二章一元线性回归分析思考与练习参考答案2.1 一元线性回归有哪些基本假定?答:假设1解释变量X是确定性变量,丫是随机变量;假设2、随机误差项&具有零均值、同方差和不序列相关性:E( i)=0 i=1,2,…,n2Var (i)=, i=1,2, …,nCov( E £)=0 i 工j i,j= 1,2, …,nCov(X i, i )=0 i=1,2, …,n假设4、&服从零均值、同方差、零协方差的正态分布2i~N(0, ~)i=1,2,…,n2.2考虑过原点的线性回归模型Y i= 0X i+ i i=1,2,…,nn nQ e 八(Y i -Y?)2八(Y i -?i X i)2i』i=1得: f?=M羊Xi)X^0n' (X i Y i)i dn' (X i2)i =1i d2.3 证明(2.27 式),工e i =0 ,工eXi=0。
n nQ=S:(丫-Y?)2=迟(Y i —(f?°+f?X i))2 证明: 1 1其中:丫?=児+叹e=Y-丫?即: I ^(A+AA;-l;) = 0|V^o+/?rVj-T;)A;= 0^e =0 ,乞eX i=0假设3、随机误差项&与解释变量X之间不相关:误差 $ (i=1,2,解:…)n仍满足基本假定。
求仪的最小二乘估计2.4回归方程E (Y ) = 00+ 3X 的参数①,妆的最小二乘估计与最大似然估计在什么条件下等价?给出证明。
答:由于 £ 厂N(0, ~2)i=1,2,…,n所以 Y i =场 + 0X + £~N ( [3D + [3iX i , o 2) 最大似然函数:1 nL( 0, i ,;「2)=二爲 f i (Y i ) =(2=2)』/2exp{——2、 [Y i -( o i o ,X i )]2}2 ynLn{L( o , i ,二2)}= -:帕(2二2)-2、 M -( o i o ,X i )]222<r y使得Ln (L )最大的况,瞬就是肉,0的最大似然估计值。
2.5 回归模型预测一、判断题1.fY ˆ是对个别值f Y 的点估计。
(F ) 2.预测区间的宽窄只与样本容量n 有关。
(F )3.fY ˆ对个别值f Y 的预测只受随机扰动项的影响。
(F ) 4.一般情况下,平均值的预测区间比个别值的预测区间宽。
(F )5.用回归模型进行预测时,预测普通情况和极端情况的精度是一样的。
(F )二、单项选择题1.某一特定的X 水平上,总体Y 分布的离散度越大,即2σ越大,则( A )。
A .预测区间越宽,精度越低B .预测区间越宽,预测误差越小C 预测区间越窄,精度越高D .预测区间越窄,预测误差越大2.在缩小参数估计量的置信区间时,我们通常不采用下面的那一项措施(D )。
A.增大样本容量nB. 预测普通情形而非极端情形C.提高模型的拟合优度D.提高样本观测值的分散度三、多项选择题1.计量经济预测的条件是(ABC )A .模型设定的关系式不变B .所估计的参数不变C.解释变量在预测期的取值已作出预测 D .没有对解释变量在预测期的取值进行过预测 E .无条件2.对被解释变量的预测可以分为(ABC )A.被解释变量平均值的点预测B.被解释变量平均值的区间预测C.被解释变量的个别值预测D.解释变量预测期取值的预测四、简答题1.为什么要对被解释变量的平均值以及个别值进行区间预测?答:由于抽样波动的存在,用样本估计出的被解释变量的平均值fY ˆ与总体真实平均值()f f X Y E 之间存在误差,并不总是相等。
而用fY ˆ对个别值f Y 进行预测时,除了上述提到的误差,还受随机扰动项的影响,使得总体真实平均值()f f X Y E 并不等于个别值f Y 。
一般而言,个别值的预测区间比平均值的预测区间更宽。
2.分别写出()f f X Y E 和f Y 的置信度为α-1的预测区间。
答:()f f X Y E :()⎪⎪⎪⎭⎫ ⎝⎛-+±∑22f 2f i x X X n 1t Y σαˆˆ;f Y :()⎪⎪⎪⎭⎫ ⎝⎛-++±∑22f 2f i x X X n 11t Y σαˆˆ。
2.1回归分析与回归函数一、判断题1. 总体回归直线是解释变量取各给定值时被解释变量条件期望的轨迹。
(T )2. 线性回归是指解释变量和被解释变量之间呈现线性关系。
( F )3. 随机变量的条件期望与非条件期望是一回事。
(F )4、总体回归函数给出了对应于每一个自变量的因变量的值。
(F )二、单项选择题1.变量之间的关系可以分为两大类,它们是( A )。
A .函数关系与相关关系B .线性相关关系和非线性相关关系C .正相关关系和负相关关系D .简单相关关系和复杂相关关系2.相关关系是指( D )。
A .变量间的非独立关系B .变量间的因果关系C .变量间的函数关系D .变量间不确定性的依存关系3.进行相关分析时的两个变量( A )。
A .都是随机变量B .都不是随机变量C .一个是随机变量,一个不是随机变量D .随机的或非随机都可以4.回归分析中定义的( B )。
A.解释变量和被解释变量都是随机变量B.解释变量为非随机变量,被解释变量为随机变量C.解释变量和被解释变量都为非随机变量D.解释变量为随机变量,被解释变量为非随机变量5.表示x 和y 之间真实线性关系的总体回归模型是( C )。
A .01ˆˆˆt t Y X ββ=+B .01()t t E Y X ββ=+C .01t t t Y X u ββ=++D .01t t Y X ββ=+6.一元线性样本回归直线可以表示为( C )A .i i X Y u i 10++=ββ B. i 10X )(Y E i ββ+=C. i i e X Y ++=∧∧i 10ββ D. i 10X i Y ββ+=∧7.对于i 01i i ˆˆY =X +e ββ+,以ˆσ表示估计标准误差,r 表示相关系数,则有( D)。
A .ˆ0r=1σ=时,B .ˆ0r=-1σ=时,C .ˆ0r=0σ=时,D .ˆ0r=1r=-1σ=时,或8.相关系数r 的取值范围是( D )。
第二章 简单线性回归模型一、单项选择题:1、回归分析中定义的( B )。
A 、解释变量和被解释变量都是随机变量B 、解释变量为非随机变量,被解释变量为随机变量C 、解释变量和被解释变量都为非随机变量D 、解释变量为随机变量,被解释变量为非随机变量2、最小二乘准则是指使( D )达到最小值的原则确定样本回归方程。
A 、1ˆ()n t t t Y Y =-∑B 、1ˆn t t t Y Y =-∑C 、ˆmax t t Y Y -D 、21ˆ()n t t t Y Y =-∑ 3、下图中“{”所指的距离是( B )。
A 、随机误差项i 、ˆiY 的离差 4、参数估计量ˆβ是i Y 的线性函数称为参数估计量具有( A )的性质。
A 、线性 B 、无偏性 C 、有效性 D 、一致性5、参数β的估计量βˆ具备有效性是指( B )。
A 、0)ˆ(=βVarB 、)ˆ(βVar 为最小C 、0ˆ=-ββD 、)ˆ(ββ-为最小6、反映由模型中解释变量所解释的那部分离差大小的是( B )。
A 、总体平方和B 、回归平方和C 、残差平方和D 、样本平方和7、总体平方和TSS 、残差平方和RSS 与回归平方和ESS 三者的关系是( B )。
A 、RSS=TSS+ESSB 、TSS=RSS+ESSC 、ESS=RSS-TSSD 、ESS=TSS+RSS8、下面哪一个必定是错误的( C )。
A 、 i i X Y 2.030ˆ+= ,8.0=XY r B 、 i i X Y 5.175ˆ+-= ,91.0=XY r C 、 i i X Y 1.25ˆ-=,78.0=XY r D 、 i i X Y 5.312ˆ--=,96.0-=XY r9、产量(X ,台)与单位产品成本(Y ,元/台)之间的回归方程为ˆ356 1.5Y X =-,这说明( D )。
A 、产量每增加一台,单位产品成本增加356元B 、产量每增加一台,单位产品成本减少1.5元C 、产量每增加一台,单位产品成本平均增加356元D 、产量每增加一台,单位产品成本平均减少1.5元10、回归模型i i i X Y μββ++=10,i = 1,…,25中,总体方差未知,检验010=β:H 时,所用的检验统计量1ˆ11ˆβββS -服从( D )。
应用回归分析_第2章课后习题参考答案1. 简答题1.1 什么是回归分析?回归分析是一种统计建模方法,用于研究自变量与因变量之间的关系。
它通过建立数学模型,根据已知的自变量和因变量数据,预测因变量与自变量之间的关系,并进行相关的推断和预测。
1.2 什么是简单线性回归和多元线性回归?简单线性回归是指只包含一个自变量和一个因变量的回归模型,通过拟合一条直线来描述两者之间的关系。
多元线性回归是指包含多个自变量和一个因变量的回归模型,通过拟合一个超平面来描述多个自变量和因变量之间的关系。
1.3 什么是残差?残差是指回归模型中,观测值与模型预测值之间的差异。
在回归分析中,我们希望最小化残差,使得模型与观测数据的拟合效果更好。
1.4 什么是拟合优度?拟合优度是用来评估回归模型对观测数据的拟合程度的指标。
一般使用R方(Coefficient of Determination)来表示拟合优度,其值范围为0到1,值越接近1表示模型拟合效果越好。
2. 计算题2.1 简单线性回归假设我们有一组数据,其中X为自变量,Y为因变量,如下所示:X Y13253749511我们想要建立一个简单线性回归模型,计算X与Y之间的线性关系。
首先,我们需要计算拟合直线的斜率和截距。
根据简单线性回归模型的公式Y = β0 + β1*X,我们可以通过最小二乘法计算出斜率和截距的估计值。
首先,计算X和Y的均值:mean_x = (1 + 2 + 3 + 4 + 5) / 5 = 3mean_y = (3 + 5 + 7 + 9 + 11) / 5 = 7然后,计算X和Y的方差:var_x = ((1-3)^2 + (2-3)^2 + (3-3)^2 + (4-3)^2 + (5-3)^2) / 5 = 2var_y = ((3-7)^2 + (5-7)^2 + (7-7)^2 + (9-7)^2 + (11-7)^2) / 5 = 8接下来,计算X和Y的协方差:cov_xy = ((1-3) * (3-7) + (2-3) * (5-7) + (3-3) * (7-7) + (4-3) * (9-7) + (5-3) * (11-7)) / 5 = 4根据最小二乘法的公式:β1 = cov_xy / var_x = 4 / 2 = 2β0 = mean_y - β1 * mean_x = 7 - (2 * 3) = 1因此,拟合直线的方程为:Y = 1 + 2X。
一元线性回归模型习题与答案一元线性回归模型习题与答案第二章一元线性回归模型习题与答案1、为什么模型中要引入随机扰动项?2、令kids表示一名妇女生育孩子的数目,educ表示该妇女接受过教育的年数。
生育率对教育年数的简单回归模型为:kids 0 1educ(1)随机扰动项包含什么样的因素?它们可能与教育水平相关吗?(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。
3、已知回归模型E N ,式中E为某类公司一名新员工的起始薪金(元),N为所受教育水平(年)。
随机扰动项的分布未知,其他所有假设都满足。
(1)从直观及经济角度解释和。
满足线性、无偏性及有效性吗?简单陈述理由。
和(2)OLS估计量(3)对参数的假设检验还能进行吗?简单陈述理由。
2.69 0.48X,其中,Y表示墨西哥的咖啡消费量4、假定有如下的回归结果:Ytt(每天每人消费的杯数),X表示咖啡的零售价格(单位:美元/杯),t表示时间。
问:(1)这是一个时间序列回归还是横截面序列回归?做出回归线。
(2)如何解释截距的意义?它有经济含义吗?如何解释斜率?(3)能否求出真实的总体回归函数?(4)根据需求的价格弹性定义:弹性=斜率__/Y,依据上述回归结果,你能求出对咖啡需求的价格弹性吗?如果不能,计算此弹性还需要其他什么信息?5、选择一个经济问题,建立一元线性回归模型,利用EViews 软件进行回归分析,写出详细的分析步骤。
6、令Y表示一名妇女生育孩子的生育率,X表示该妇女接受教育的年数。
生育率对教育年数的简单回归模型为:Y 0 1X (1)随机干扰项包含什么样的因素?他们可能与教育水平相关吗?(2)上述简单回归分析能够揭示教育对生育率在其它条件不变下的影响吗?请解释?Y ,使用美国36年的年度7、对于人均存款与人均收入之间的关系式Sttt数据,得到如下估计模型(括号内为标准差)384.105 0.067Y Stt(151.105)(0.011)R 0.538(1)的经济解释是什么?(2) 和的符号是什么?为什么?(3)你对于拟合优度的看法?2答:1、随机扰动项是模型中表示其它多种因素的综合影响。
一、判断题
2.5 回归模型预测
1. Y
ˆf 是对个别值Y f 的点估计。
(F ) 2.预测区间的宽窄只与样本容量 n 有关。
(F )
3. Y ˆf 对个别值Y f
的预测只受随机扰动项的影响。
(F ) 4.一般情况下,平均值的预测区间比个别值的预测区间宽。
(F )
5.用回归模型进行预测时,预测普通情况和极端情况的精度是一样的。
(F )
二、单项选择题
1. 某一特定的 X 水平上,总体 Y 分布的离散度越大,即
2 越大,则( A )。
A. 预测区间越宽,精度越低 B .预测区间越宽,预测误差越小
C 预测区间越窄,精度越高
D .预测区间越窄,预测误差越大
2. 在缩小参数估计量的置信区间时,我们通常不采用下面的那一项措施(D )。
A. 增大样本容量 n B. 预测普通情形而非极端情形
C.提高模型的拟合优度
D.提高样本观测值的分散度 三、多项选择题
1. 计量经济预测的条件是(ABC )
A. 模型设定的关系式不变 B .所估计的参数不变
C.解释变量在预测期的取值已作出预测
D .没有对解释变量在预测期的取值进行过预测
E .无条件
2. 对被解释变量的预测可以分为(ABC )
A. 被解释变量平均值的点预测
B.被解释变量平均值的区间预测
C.被解释变量的个别值预测
D.解释变量预测期取值的预测 四、简答题
1. 为什么要对被解释变量的平均值以及个别值进行区间预测?
答:由于抽样波动的存在,用样本估计出的被解释变量的平均值Y
ˆf 与总体真实平均值 E (Y f X f 之间存在误差,并不总是相等。
而用Y ˆf 对个别值Y f 进行预测时,除了上述 提到的误差,还受随机扰动项的影响,使得总体真实平均值 E (Y f X f
并不等于个别值 Y f 。
一般而言,个别值的预测区间比平均值的预测区间更宽。
2. 分别写出 E (
Y f X f 和Y f 的置信度为1 -的预测区间。
⎛ 1 (X - X )2 ⎫ ⎛ 1 (X - X )2 ⎫ 答: E (
Y X : Y ˆ ± t ˆ
+ f ⎪ ; Y : Y ˆ ± t ˆ 1 + + f ⎪ 。
f f f n ⎝ 2 x 2 ⎪ i ⎭ f f n ⎝ 2 x 2 ⎪ i ⎭ ∑ ∑。