2一元线性回归模型
- 格式:doc
- 大小:291.50 KB
- 文档页数:7
第二章 一元线性回归模型2.1 一元线性回归模型的基本假定有一元线性回归模型(统计模型)如下, y t = β0 + β1 x t + u t上式表示变量y t 和x t 之间的真实关系。
其中y t 称被解释变量(因变量),x t 称解释变量(自变量),u t 称随机误差项,β0称常数项,β1称回归系数(通常未知)。
上模型可以分为两部分。
(1)回归函数部分,E(y t ) = β0 + β1 x t ,(2)随机部分,u t 。
图2.1 真实的回归直线这种模型可以赋予各种实际意义,居民收入与支出的关系;商品价格与供给量的关系;企业产量与库存的关系;身高与体重的关系等。
以收入与支出的关系为例。
假设固定对一个家庭进行观察,随着收入水平的不同,与支出呈线性函数关系。
但实际上数据来自各个家庭,来自同一收入水平的家庭,受其他条件的影响,如家庭子女的多少、消费习惯等等,其出也不尽相同。
所以由数据得到的散点图不在一条直线上(不呈函数关系),而是散在直线周围,服从统计关系。
“线性”一词在这里有两重含义。
它一方面指被解释变量Y 与解释变量X 之间为线性关系,即另一方面也指被解释变量与参数0β、1β之间的线性关系,即。
1ty x β∂=∂,221ty β∂=∂0 ,1ty β∂=∂,2200ty β∂=∂2.1.2 随机误差项的性质随机误差项u t 中可能包括家庭人口数不同,消费习惯不同,不同地域的消费指数不同,不同家庭的外来收入不同等因素。
所以在经济问题上“控制其他因素不变”是不可能的。
随机误差项u t 正是计量模型与其它模型的区别所在,也是其优势所在,今后咱们的很多内容,都是围绕随机误差项u t 进行了。
回归模型的随机误差项中一般包括如下几项内容: (1)非重要解释变量的省略,(2)数学模型形式欠妥, (3)测量误差等,(4)随机误差(自然灾害、经济危机、人的偶然行为等)。
2.1.3 一元线性回归模型的基本假定通常线性回归函数E(y t ) = β0 + β1 x t 是观察不到的,利用样本得到的只是对E(y t ) =β0 + β1 x t 的估计,即对β0和β1的估计。
第二章一元线性回归模型计量经济学在对经济现象建立经济计量模型时,大量地运用了回归分析这一统计技术,本章和下一章将通过一元线性回归模型、多元线性回归模型来介绍回归分析的基本思想。
第一节回归分析的几个基本问题回归分析是经济计量学的主要工具,下面我们将要讨论这一工具的性质。
一、回归分析的性质(一)回归释义回归一词最先由F •加尔顿(Francis Galt on )提出。
加尔顿发现,虽然有一个趋势,父母高,儿女也高:父母矮,儿女也矮,但给定父母的身高,儿女辈的平均身高却趋向于或者“回归” 到全体人口的平均身高。
或者说,尽管父母双亲都异常高或异常矮,而儿女的身高则有走向人口总体平均身高的趋势(普遍回归规律)。
加尔顿的这一结论被他的朋友K •皮尔逊(Karl pearson)证实。
皮尔逊收集了一些家庭出身1000多名成员的身高记录,发现对于一个父亲高的群体,儿辈的平均身高低于他们父辈的身高,而对于一个父亲矮的群体,儿辈的平均身高则高于其父辈的身高。
这样就把高的和矮的儿辈一同“回归”到所有男子的平均身高,用加尔顿的话说,这是“回归到中等” 。
回归分析是用来研究一个变量(被解释变量Explained variable或因变量Dependent variable 与另一个或多个变量(解释变量Explanatory variable或自变量Independent variable之间的关系。
其用意在于通过后者(在重复抽样中)的已知或设定值去估计或预测前者的(总体)均值。
下面通过几个简单的例子,介绍一下回归的基本概念。
例子1.加尔顿的普遍回归规律。
加尔顿的兴趣在于发现为什么人口的身高分布有一种稳定性,我们关心的是,在给定父辈身高的条件下找出儿辈平均身高的变化。
也就是一旦知道了父辈的身高,怎样预测儿辈的平均身高。
为了弄清楚这一点,用图 1.1 表示如下图 1.1 对应于给定父亲身高的儿子身高的假想分布图 1.1 展示了对应于设定的父亲身高, 儿子在一个假想人口总体中的身高分布, 我们不难发现,对应于任一给定的父亲身高, 相对应都有着儿子身高的一个分布范围,同时随着父亲身高的增加,儿子的平均身高也增加,为了清楚起见,在1.1散点图中勾画了一条通过这些散点的直线,以表明儿子的平均身高是怎样随着父亲的身高增加而增加的。
第二章 一元线性回归模型一、单项选择题1、表示x 与y 之间真实线性关系的是【 】A tt x y 10ˆˆˆββ+= B E t t x y 10)(ββ+= C t t t u x y ++=10ββ D t t x y 10ββ+=2、参数β的估计量βˆ具备有效性是指【 】 A Var(βˆ)=0 B Var(βˆ)为最小 C (βˆ-β)=0 D (βˆ-β)为最小 3、对于ii i e x y ++=10ˆˆββ,以σˆ表示估计标准误差,i y ˆ表示回归值,则【 】 A σˆ=0时,)ˆ(i iyy -∑=0 B σˆ=0时,2)ˆ(i i y y -∑=0 C σˆ=0时,)ˆ(i iyy-∑为最小 D σˆ=0时,2)ˆ(i i y y -∑为最小 4、设样本回归模型为i i i e x y ++=10ˆˆββ,则普通最小二乘法确定的iβˆ的公式中,错误的是【 】 A∑∑---=21)())((ˆx x y y x x ii iβ B ∑∑∑∑∑--=221)(ˆi ii i i i x x n y x y x n βC ∑∑-⋅-=221)(ˆx n x y x n y x ii i β D 21ˆxii i i y x y x n σβ∑∑∑-=5、对于ii i e x y ++=10ˆˆββ,以σˆ表示估计标准误差,r 表示相关系数,则有【 】 A σˆ=0时,r =1 B σˆ=0时,r =-1 C σˆ=0时,r =0 D σˆ=0时,r =1 或r =-1 6、产量(x ,台)与单位产品成本(y , 元/台)之间的回归方程为yˆ=356-1.5x ,这说明【 】A 产量每增加一台,单位产品成本增加356元B 产量每增加一台,单位产品成本减少1.5元C 产量每增加一台,单位产品成本平均增加356元D 产量每增加一台,单位产品成本平均减少1.5元7、在总体回归直线E x y10)ˆ(ββ+=中,1β表示【 】 A 当x 增加一个单位时,y 增加1β个单位 B 当x 增加一个单位时,y 平均增加1β个单位 C 当y 增加一个单位时,x 增加1β个单位 D 当y 增加一个单位时,x 平均增加1β个单位8、对回归模型t t t u x y ++=10ββ进行统计检验时,通常假定t u 服从【 】 A N (0,2i σ) B t(n-2) C N (0,2σ) D t(n)9、以y 表示实际观测值,y ˆ表示回归估计值,则普通最小二乘法估计参数的准则是使【 】A )ˆ(i iyy -∑=0 B 2)ˆ(i iyy-∑=0 C)ˆ(i iyy-∑为最小 D 2)ˆ(i iyy-∑为最小 10、设y 表示实际观测值,yˆ表示OLS 回归估计值,则下列哪项成立【 】 A yˆ=y B y ˆ=y C yˆ=y D y ˆ=y 11、用普通最小二乘法估计经典线性模型t t t u x y ++=10ββ,则样本回归线通过点【 】A (x ,y )B (x ,y ˆ)C (x ,yˆ) D (x ,y ) 12、以y 表示实际观测值,yˆ表示回归估计值,则用普通最小二乘法得到的样本回归直线 ii x y 10ˆˆˆββ+=满足【 】 A )ˆ(i iyy -∑=0 B 2)ˆ(y yi-∑=0 C2)ˆ(i iyy-∑=0 D 2)(y yi-∑=013、用一组有30个观测值的样本估计模型t t t u x y ++=10ββ,在0.05的显著性水平下对1β的显著性作t 检验,则1β显著地不等于零的条件是其统计量t 大于【 】A 05.0t (30)B 025.0t (30)C 05.0t (28)D 025.0t (28) 14、已知某一直线回归方程的判定系数为0.64,则解释变量与被解释变量间的相关系数为【 】 A 0.64 B 0.8 C 0.4 D 0.32 15、相关系数r 的取值范围是【 】A r ≤-1B r ≥1C 0≤ r ≤1D -1≤ r ≤1 16、判定系数2R 的取值范围是【 】A 2R ≤-1 B 2R ≥1 C 0≤2R ≤1 D -1≤2R ≤1 17、某一特定的x 水平上,总体y 分布的离散度越大,即2σ越大,则【 】 A 预测区间越宽,精度越低 B 预测区间越宽,预测误差越小 C 预测区间越窄,精度越高 D 预测区间越窄,预测误差越大 18、在缩小参数估计量的置信区间时,我们通常不采用下面的那一项措施【 】 A 增大样本容量 n B 提高置信水平C 提高模型的拟合优度D 提高样本观测值的分散度19、对于总体平方和TSS 、回归平方和RSS 和残差平方和ESS 的相互关系,正确的是【 】 A TSS>RSS+ESS B TSS=RSS+ESS C TSS<RSS+ESS D TSS 2=RSS 2+ESS 2二、多项选择题1、一元线性回归模型t t t u x y ++=10ββ的经典假设包括【 】 A 0)(=t u E B 2)(σ=t u Var (常数) C 0),cov(=j i u u D t u ~N(0,1) E x 为非随机变量,且0),cov(=t t u x2、以y 表示实际观测值,yˆ表示回归估计值,e 表示残差,则回归直线满足【 】 A 通过样本均值点(x ,y ) B∑∑=ttyy ˆC 0),cov(=t t e xD 2)ˆ(t tyy-∑=0 E0)ˆˆ(2=-∑yyt3、以带“∧”表示估计值,u 表示随机误差项,如果y 与x 为线性相关关系,则下列哪些是正确的【 】A t t x y 10ββ+=B t t t u x y ++=10ββC t t t u x y ++=10ˆˆββD t t t u x y ++=10ˆˆˆββE tt x y 10ˆˆˆββ+= 4、以带“∧”表示估计值,u 表示随机误差项,e 表示残差,如果y 与x 为线性相关关系,则下列哪些是正确的【 】A t t x y E 10)(ββ+=B t t x y 10ˆˆββ+=C t t t e x y ++=10ˆˆββD t t t e x y ++=10ˆˆˆββE tt x y E 10ˆˆ)(ββ+= 5、回归分析中估计回归参数的方法主要有【 】 A 相关系数法 B 方差分析法 C 最小二乘估计法 D 极大似然法 E 矩估计法6、用普通最小二乘法估计模型t t t u x y ++=10ββ的参数,要使参数估计量具备最佳线性无偏估计性质,则要求:【 】A 0)(=t u EB 2)(σ=t u Var (常数)C 0),cov(=j i u uD t u 服从正态分布E x 为非随机变量,且0),cov(=t t u x7、假设线性回归模型满足全部基本假设,则其参数估计量具备【 】 A 可靠性 B 合理性C 线性D 无偏性E 有效性 8、普通最小二乘直线具有以下特性【 】A 通过点(x ,y )B y y=ˆ C0=∑ieD∑2ie=0 E ),cov(i i e x =09、对于线性回归模型t t t u x y ++=10ββ,要使普通最小二乘估计量具备线性、无偏性和有效性,则模型必须满足:【 】A 0)(=t u EB 2)(σ=t u Var (常数)C 0),cov(=j i u uD t u 服从正态分布E x 为非随机变量,且0),cov(=t t u x10、由回归直线tt x y 10ˆˆˆββ+=估计出来的t y ˆ值【 】 A 是一组估计值 B 是一组平均值 C 是一个几何级数 D 可能等于实际值 E 与实际值y 的离差和等于零11、反应回归直线拟合优度的指标有【 】 A 相关系数 B 回归系数C 样本决定系数D 回归方程的标准误差E 剩余变差(或残差平方和)12、对于样本回归直线tt x y 10ˆˆˆββ+=,回归平方和可以表示为(2R 为决定系数)【 】 A2)ˆ(y y t -∑ B 221)(ˆx x t-∑β C ))((ˆ1y y x xt t--∑β D 22)(y y R t -∑E22)ˆ()(yy y y t t---∑∑ 13、对于样本回归直线tt x y 10ˆˆˆββ+=,σˆ为估计标准差,下列决定系数2R 的算式中,正确的有【 】A∑∑--22)()ˆ(y yy y tt B 1-∑∑--22)()ˆ(y y y y tt tC∑∑--2221)()(ˆy y x x t tβ D∑∑---21)())((ˆy y y y x x t t t βE 1-∑--22)()2(ˆy y n t σ14、下列相关系数的算式中,正确的是【 】 Ayx yx xy σσ⋅- Byx t tn y y x x σσ∑--))((Cyx y x σσ),cov( D∑∑∑----22y y(())(())ttt tx xy y x xE∑∑∑--⋅-2222yn yxn xyx n yx tttt三、判断题1、随机误差项u i 与残差项e i 是一回事。
( )2、总体回归函数给出了对应于每一个自变量的因变量的值。
( )3、线性回归模型意味着因变量是自变量的线性函数。
( )4、在线性回归模型中,解释变量是原因,被解释变量是结果。
( )5、在实际中,一元回归没什么用,因为因变量的行为不可能仅由一个解释变量来解释。
( )四、计算与分析题1、试将下列非线性函数模型线性化: (1) S 型函数 y=1/(x e -+10ββ+u);(2) Y=1βsinx+2βcosx+3βsin2x+4βcos2x+u 。
2、对下列模型进行适当变换化为标准线性模型: (1) y=0β+1βx 1+2β21x+u ; (2) Q=A ue L K βα; (3) Y=exp(0β+1βx+u); (4) Y=)](exp[1110u x ++-+ββ。
3、假设A 先生估计消费函数(用模型i i i u Y C ++=βα表示),并获得下列结果:i iY C 81.015ˆ+=t =(3.1) (18.7) n=19; 2R =0.98 括号里的数字表示相应参数的t 值,请回答以下问题: (1) 利用t 值经验假设:β=0(取显著水平为5%) (2) 确定参数统计量的标准方差;(3) 构造β的95%的置信区间,这个区间包括0吗?4、你的朋友将不同年度的债券价格作为该年利率(在相等的风险水平下)的函数,估计出的简单方程如下:ii X Y 78.44.101ˆ-= 其中:i Y =第i 年美国政府债券价格(每100美元债券)i X =第i 年联邦资金利率(按百分比)。