多元线性回归模型
一、单项选择题
1.在由30n =的一组样本估计的、包含3个解释变量的线性回归模型中,计算得多重决定系
数为,则调整后的多重决定系数为( D )
A. B. C. 下列样本模型中,哪一个模型通常是无效
的(B )
A. i C (消费)=500+i I (收入)
B. d i Q (商品需求)=10+i I (收入)+i P (价格)
C. s i Q (商品供给)=20+i P (价格)
D. i Y (产出量)=0.6i L (劳动)0.4i K (资本)
3.用一组有30个观测值的样本估计模型01122t t t t y b b x b x u =+++后,在的显着性水平上对
1b 的显着性作t 检验,则1b 显着地不等于零的条件是其统计量t 大于等于( C )
A. )30(05.0t
B. )28(025.0t
C. )27(025.0t
D. )28,1(025.0F
4.模型
t t t u x b b y ++=ln ln ln 10中,1b 的实际含义是( B )
A.x 关于y 的弹性
B. y 关于x 的弹性
C. x 关于y 的边际倾向
D. y 关于x 的边际倾向 5、在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明
模型中存在( C )
A.异方差性
B.序列相关
C.多重共线性
D.高拟合优度
6.线性回归模型01122......t t t k kt t y b b x b x b x u =+++++ 中,检验0:0(0,1,2,...)
t H b i k ==时,所用的统计量
服从( C )
(n-k+1) (n-k-2)
(n-k-1) (n-k+2)
7. 调整的判定系数 与多重判定系数
之间有如下关系( D )
A.2
211n R R n k -=-- B. 22111
n R R n k -=--- C. 2211(1)1n R R n k -=-+-- D. 2211(1)1n R R n k -=---- 8.关于经济计量模型进行预测出现误差的原因,正确的说法是( C )。
A.只有随机因素
B.只有系统因素
C.既有随机因素,又有系统因素 、B 、C 都不对
9.在多元线性回归模型中对样本容量的基本要求是(k 为解释变量个数):( C )
A n ≥k+1
B n C n ≥30 或n ≥3(k+1) D n ≥30 10、下列说法中正确的是:( D ) A 如果模型的2R 很高,我们可以认为此模型的质量较好 B 如果模型的2R 较低,我们可以认为此模型的质量较差 C 如果某一参数不能通过显着性检验,我们应该剔除该解释变量 D 如果某一参数不能通过显着性检验,我们不应该随便剔除该解释变量 11.半对数模型μ ββ++=X Y ln 10中,参数1β的含义是( C )。 A .X 的绝对量变化,引起Y 的绝对量变化 B .Y 关于X 的边际变化 C .X 的相对变化,引起Y 的期望值绝对量变化 D .Y 关于X 的弹性 12.半对数模型μββ++=X Y 10ln 中,参数1β的含义是( A )。 的绝对量发生一定变动时,引起因变量Y 的相对变化率 关于X 的弹性 的相对变化,引起Y 的期望值绝对量变化 关于X 的边际变化 13.双对数模型μ ββ++=X Y ln ln 10中,参数1β的含义是( D )。 的相对变化,引起Y 的期望值绝对量变化 关于X 的边际变化 的绝对量发生一定变动时,引起因变量Y 的相对变化率 关于X 的弹性 二、多项选择题 1.将非线性回归模型转换为线性回归模型,常用的数学处理方法有( ) A.直接置换法 B.对数变换法 C.级数展开法 D.广义最小二乘法 E.加权最小二乘法 2.在模型i i i X Y μββ++=ln ln ln 10中( ABCD ) A. Y 与X 是非线性的 B. Y 与1β是非线性的 C. Y ln 与1β是线性的 D. Y ln 与X ln 是线性的 E. Y 与X ln 是线性的 3.对模型01122t t t t y b b x b x u =+++进行总体显着性检验,如果检验结果总体线性关系显着, 则有( BCD ) A. 120b b == B. 120,0b b ≠= C. 120,0b b =≠ D. 120,0b b ≠≠ E. 120 b b =≠ 4. 剩余变差是指( ACDE ) A.随机因素影响所引起的被解释变量的变差 B.解释变量变动所引起的被解释变量的变差 C.被解释变量的变差中,回归方程不能做出解释的部分 D.被解释变量的总变差与回归平方和之差 E.被解释变量的实际值与回归值的离差平方和 5.回归变差(或回归平方和)是指( BCD ) A. 被解释变量的实际值与平均值的离差平方和 B. 被解释变量的回归值与平均值的离差平方和 C. 被解释变量的总变差与剩余变差之差 D. 解释变量变动所引起的被解释变量的变差 E. 随机因素影响所引起的被解释变量的变差 3.设k 为回归模型中的参数个数(包括截距项),则总体线性回归模型进行显着性检验时所 用的F 统计量可表示为()。 A.)1()()?(22-∑--∑k e k n Y Y i i B. )()1()?(22k n e k Y Y i i -∑--∑ C.)()1() 1(22k n R k R --- D. )1()(122---k R k n R )( E. )1()1() (22---k R k n R 7.在多元线性回归分析中,修正的可决系数2R 与可决系数2R 之间()。 A.2R <2R B.2R ≥2R C.2R 只能大于零 D.2R 可能为负值 三、名词解释 偏回归系数;回归变差、剩余变差;多重决定系数、调整后的决定系数、偏相关系数 名词解释答案 1.偏回归系数: 2.回归变差:简称ESS,表示由回归直线(即解释变量)所解释的部分,表示x 对y 的线性影响。 3.剩余变差:简称RSS ,是未被回归直线解释的部分,是由解释变量以外的因素造成的影响。 4.多重决定系数:在多元线性回归模型中,回归平方和与总离差平方和的比值,也就是在被解释变量的总变差中能由解释变量所解释的那部分变差的比重,我们称之为多重决定系数,仍用R 2表示。 5.调整后的决定系数:又称修正后的决定系数,记为2R ,是为了克服多重决定系数会随着解释变量的增加而增大的缺陷提出来的, 其公式为:22/(1)1()/(1)t t e n k R y y n --=---∑∑。 6.偏相关系数:在Y 、X 1、X 2三个变量中,当X 1 既定时(即不受X 1的影响),表示Y 与X 2之间相关关系的指标,称为偏相关系数,记做 2.1Y R 。 四、简答 1.给定二元回归模型:01122t t t t y b b x b x u =+++,请叙述模型的古典假定。 解答:(1)随机误差项的期望为零,即()0t E u =。(2)不同的随机误差项之间相互独立,即cov(,)[(())(()]()0t s t t s s t s u u E u E u u E u E u u =--==。(3)随机误差项的方差与t 无关,为一个常数,即2 var()t u σ=。即同方差假设。(4)随机误差项与解释变量不相关,即cov(,)0(1,2,...,)jt t x u j k = =。通常假定jt x 为非随机变量,这个假设自动成立。(5)随机 误差项t u 为服从正态分布的随机变量,即2(0,)t u N σ:。(6)解释变量之间不存在多重共 线性,即假定各解释变量之间不存在线性关系,即不存在多重共线性。 2.在多元线性回归分析中,为什么用修正的决定系数衡量估计模型对样本观测值的拟合优度 解答:因为人们发现随着模型中解释变量的增多,多重决定系数2R 的值往往会变大,从而增加了模型的解释功能。这样就使得人们认为要使模型拟合得好,就必须增加解释变量。但是,在样本容量一定的情况下,增加解释变量必定使得待估参数的个数增加,从而损失自由度,而实际中如果引入的解释变量并非必要的话可能会产生很多问题,比如,降低预测精确度、引起多重共线性等等。为此用修正的决定系数来估计模型对样本观测值的拟合优度。 3.修正的决定系数2R 及其作用。 解答:2 22 /11()/1t t e n k R y y n --=---∑∑,其作用有:(1)用自由度调整后,可以消除拟合优度评价中解释变量多少对决定系数计算的影响;(2)对于包含解释变量个数不同的模型,可以用调整后的决定系数直接比较它们的拟合优度的高低,但不能用原来未调整的决定系数来比较。 4.常见的非线性回归模型有几种情况 解答:常见的非线性回归模型主要有: (1) 对数模型01ln ln t t t y b b x u =++ (2) 半对数模型01ln t t t y b b x u =++或01ln t t t y b b x u =++ (3) 倒数模型01 01111y b b u b b u x y x =++=++或 (4) 多项式模型2012...k k y b b x b x b x u =+++++ (5) 成长曲线模型包括逻辑成长曲线模型101t b t K y b e -=+和Gompertz 成长曲线模型01t K b b t y e += 5.观察下列方程并判断其变量是否呈线性,系数是否呈线性,或都是或都不是。 ①t t t u x b b y ++=310 ②t t t u x b b y ++=log 10 ③ t t t u x b b y ++=log log 10 ④t t t u x b b y +=)/(10 解答:①系数呈线性,变量非线性;②系数呈线性,变量非呈线性;③系数和变量均为非线性;④系数和变量均为非线性。 6. 观察下列方程并判断其变量是否呈线性,系数是否呈线性,或都是或都不是。 ①t t t u x b b y ++=log 10 ②t t t u x b b b y ++=)(210 ③ t t t u x b b y +=)/(10 ④t b t t u x b y +-+=)1(110 解答:①系数呈线性,变量非呈线性;②系数非线性,变量呈线性③系数和变量均为非线性;④系数和变量均为非线性。 五、计算和分析题 1.根据某地1961—1999年共39年的总产出Y 、劳动投入L 和资本投入K 的年度数据,运用普通最小二乘法估计得出了下列回归方程: ,DW= 式下括号中的数字为相应估计量的标准误。 (1)解释回归系数的经济含义; (2)系数的符号符合你的预期吗为什么 解答:(1)这是一个对数化以后表现为线性关系的模型,lnL 的系数为意味着资本投入K 保持不变时劳动—产出弹性为 ;lnK 的系数为意味着劳动投入L 保持不变时资本—产出弹性为. (2)系数符号符合预期,作为弹性,都是正值。 2.某计量经济学家曾用1921~1941年与1945~1950年(1942~1944年战争期间略去)美国国内消费C和工资收入W、非工资-非农业收入P、农业收入A的时间序列资料,利用普通最小二乘法估计得出了以下回归方程: ) 09.1()66.0()17.0()92.8(121.0452.0059.1133.8?A P W Y +++= 37.10795 .02==F R 式下括号中的数字为相应参数估计量的标准误。试对该模型进行评析,指出其中存在的问题。 解答:该消费模型的判定系数95.02=R ,F统计量的值37.107=F ,均很高,表明模型 的整体拟合程度很高。 计算各回归系数估计量的t 统计量值得:91.092.8133.80=÷=t ,10.617.0059.11=÷=t 69.066.0452.02=÷=t ,11.009.1121.03=÷=t 。除1t 外,其余T 值均很小。工资收入W的系数t 检验值虽然显着,但该系数的估计值却过大,该值为工资收入对消费的边际效应,它的值为意味着工资收入每增加一美元,消费支出增长将超过一美元,这与经济理论和生活常识都不符。另外,尽管从理论上讲,非工资—非农业收入与农业收入也是消费行为的重要解释变量,但二者各自的t 检验却显示出它们的效应与0无明显差异。这些迹象均表明模型中存在严重的多重共线性,不同收入部分之间的相互关系掩盖了各个部分对解释消费行为的单独影响。 3.计算下面三个自由度调整后的决定系数。这里,2R 为决定系数,n 为样本数目,k 为解释变量个数。 (1)20.752R n k = =8 = (2)20.353R n k = =9 = (3)20.955R n k = =31 = 解答: (1)221811(1)1(10.75)0.651821 n R R n k --=--=-?-=---- (2)2911(10.35)0.04931 R -=-?-=--- (3)23111(10.95)0.943151 R -=-?-=-- 4.设有模型01122t t t t y b b x b x u =+++,试在下列条件下: ①121b b += ②12b b =。分别求出1b ,2b 的最小二乘估计量。 解答:当121b b +=时,模型变为20112()t t t t t y x b b x x u -=+-+,可作为一元回归模型来对待1221221221212()()()() ()(())t t t t t t t t t t t t n x x y x x x y x b n x x x x -----=---∑∑∑∑∑ 当12b b =时,模型变为0112()t t t t y b b x x u =+++,同样可作为一元回归模型来对待12121221212()()()(())t t t t t t t t t t n x x y x x y b n x x x x +-+=+-+∑∑∑∑∑ 5.假设要求你建立一个计量经济模型来说明在学校跑道上慢跑一英里或一英里以上的人数,以便决定是否修建第二条跑道以满足所有的锻炼者。你通过整个学年收集数据,得到两个可能的解释性方程: 方程A :3215.10.10.150.125?X X X Y +--= 75.02 =R 方程B :4 217.35.50.140.123?X X X Y -+-= 73.02 =R 其中:Y ——某天慢跑者的人数 1X ——该天降雨的英寸数 2X ——该天日照的小时数 3X ——该天的最高温度(按华氏温度) 4X ——第二天需交学期论文的班级数 请回答下列问题:(1)这两个方程你认为哪个更合理些,为什么 (2)为什么用相同的数据去估计相同变量的系数得到不同的符号 解答:(1)第2个方程更合理一些,,因为某天慢跑者的人数同该天日照的小时数应该是正相关的。 (2)出现不同符号的原因很可能是由于2X 与3X 高度相关而导致出现多重共线性的缘故。从生活经验来看也是如此,日照时间长,必然当天的最高气温也就高。而日照时间长度和第二天需交学期论文的班级数是没有相关性的。 6.假定以校园内食堂每天卖出的盒饭数量作为被解释变量,盒饭价格、气温、附近餐厅的盒饭价格、学校当日的学生数量(单位:千人)作为解释变量,进行回归分析;假设不管是否有假期,食堂都营业。不幸的是,食堂内的计算机被一次病毒侵犯,所有的存储丢失,无法恢复,你不能说出独立变量分别代表着哪一项!下面是回归结果(括号内为标准差): i i i i i X X X X Y 43219.561.07.124.286.10?-+++= () 63.02 =R 35=n 要求:(1)试判定每项结果对应着哪一个变量 (2)对你的判定结论做出说 解答:(1)1i x 是盒饭价格,2i x 是气温,3i x 是学校当日的学生数量,4i x 是附近餐厅的盒饭价格。 (2)在四个解释变量中,附近餐厅的盒饭价格同校园内食堂每天卖出的盒饭数量应该是负相关关系,其符号应该为负,应为4i x ;学校当日的学生数量每变化一个单位,盒饭相应的变化数量不会是或者,应该是小于1的,应为3i x ;至于其余两个变量,从一般经验来看, 被解释变量对价格的反应会比对气温的反应更灵敏一些,所以1i x 是盒饭价格,2i x 是气温。