第五章 一元线性回归
- 格式:ppt
- 大小:635.50 KB
- 文档页数:74
第五章 异方差二、简答题1.异方差的存在对下面各项有何影响? (1)OLS 估计量及其方差; (2)置信区间;(3)显著性t 检验和F 检验的使用。
2.产生异方差的经济背景是什么?检验异方差的方法思路是什么?3.从直观上解释,当存在异方差时,加权最小二乘法(WLS )优于OLS 法。
4.下列异方差检查方法的逻辑关系是什么? (1)图示法 (2)Park 检验 (3)White 检验5.在一元线性回归函数中,假设误差方差有如下结构:()i i i x E 22σε=如何变换模型以达到同方差的目的?我们将如何估计变换后的模型?请列出估计步骤。
三、计算题1.考虑如下两个回归方程(根据1946—1975年美国数据)(括号中给出的是标准差):t t t D GNP C 4398.0624.019.26-+=e s :(2.73)(0.0060) (0.0736)R ²=0.999t t t GNP D GNP GNP C ⎥⎦⎤⎢⎣⎡-+=⎥⎦⎤⎢⎣⎡4315.06246.0192.25 e s : (2.22) (0.0068)(0.0597)R ²=0.875式中,C 为总私人消费支出;GNP 为国民生产总值;D 为国防支出;t 为时间。
研究的目的是确定国防支出对经济中其他支出的影响。
(1)将第一个方程变换为第二个方程的原因是什么?(2)如果变换的目的是为了消除或者减弱异方差,那么我们对误差项要做哪些假设? (3)如果存在异方差,是否已成功地消除异方差?请说明原因。
(4)变换后的回归方程是否一定要通过原点?为什么? (5)能否将两个回归方程中的R ²加以比较?为什么?2.1964年,对9966名经济学家的调查数据如下:资料来源:“The Structure of Economists’ Employment and Salaries”, Committee on the National Science Foundation Report on the Economics Profession, American Economics Review, vol.55, No.4, December 1965.(1)建立适当的模型解释平均工资与年龄间的关系。
第五章 假设检验与一元线性回归分析 习题详解解:这是检验正态总体数学期望μ是否为提出假设:0.32:,0.32:10≠=μμH H由题设,样本容量6n =, 21.12=σ,1.121.10==σ,所以用U 检验当零假设H 0成立时,变量:)1,0(~61.10.320N X n X U -=-=σμ 因检验水平05.0=α,由05.0}|{|=≥λU P ,查表得96.1=λ 得到拒绝域: 96.1||≥u计算得: 6.31)6.318.310.326.310.306.32(61=+++++⨯=x89.061.10.326.310-=-=-=n x u σμ因 0.89 1.96u =<它没有落入拒绝域,于是不能拒绝H 0,而接受H 0,即可以认为0.32=μ,所以可以认为这批机制砖的平均抗断强度μ显着为32.0kg/cm 2。
解:这是检验正态总体数学期望μ是否大于10提出假设:10:,10:10>≤μμH H 即:10:,10:10>=μμH H由题设,样本容量5n =,221.0=σ,1.01.020==σ,km x 万1.10=,所以用U 检验当零假设H 0成立时,变量:)1,0(~51.010N X n X U -=-=σμ 因检验水平05.0=α,由05.0}{='≥λU P ,查表得64.1'=λ 得到拒绝域: 64.1≥u 计算得: 24.251.0101.100=-=-=n x u σμ 因 2.24 1.64u =>它落入拒绝域,于是拒绝零假设 H 0,而接受备择假设H 1,即可认为10>μ所以可以认为这批新摩托车的平均寿命μ有显者提高。
解:这是检验正态总体数学期望μ是否小于240提出假设:240:,240:10<≥μμH H即:240:,240:10<=μμH H由题设,样本容量6n =,6252=σ,256250==σ,220=x ,所以用U 检验当零假设H 0成立时,变量:)1,0(~625240N X n X U -=-=σμ 因检验水平05.0=α,由05.0}{='-≤λU P ,查表得64.1'=λ 得到拒绝域: 64.1-≤u 计算得:959.16252402200-=-=-=n x u σμ 因 1.959 1.64u =-<-它落入拒绝域,于是拒绝H 0,而接受H 1,即可以认为240<μ 所以可以认为今年果园每株梨树的平均产量μ显着减少。
一元线性回归方程
一元线性回归方程:当直线方程Y'=a+bx的a和b确定时,即为一元回归线性方程。
一元线性回归方程反映一个因变量与一个自变量之间的线性关系
一元线性回归方程反映一个因变量与一个自变量之间的线性关系,当直线方程Y'=a+bx的a和b确定时,即为一元回归线性方程。
经过相关分析后,在直角坐标系中将大量数据绘制成散点图,这些点不在一条直线上,但可以从中找到一条合适的直线,使各散点到这条直线的纵向距离之和最小,这条直线就是回归直线,这条直线的方程叫作直线回归方程。
注意:一元线性回归方程与函数的直线方程有区别,一元线性回归方程中的自变量X对应的是因变量Y的一个取值范围。
1. 根据提供的n对数据在直角坐标系中作散点图,从直观上看有无成直线分布的趋势。
即两变量具有直线关系时,才能建立一元线性回归方程。
2. 依据两个变量之间的数据关系构建直线回归方程:Y=a+bx。
简单线性回归(Simple linear regression)也称为一元线性回归,是分析一个自变量(x)与因变量(y)之间线性关系的方法,它的目的是拟合出一个线性函数或公式来描述x与y之间的关系。
§2.4 一元线性回归的模型检验一、经济意义检验。
二、在一元回归模型的统计检验主要包括如下几种检验1、拟合优度检验(R2检验;2、自变量显著性检验(t检验;3、残差标准差检验(SE检验。
•主要检验模型参数的符号、大小和变量之间的相关关系是否与经济理论和实际经验相符合。
一、经济意义检验i•二、统计检验•回归分析是要通过样本所估计的参数来代替总体的真实参数,或者说是用样本回归线代替总体回归线。
•尽管从统计性质上已知,如果有足够多的重复抽样,参数的估计值的期望(均值就等于其总体的参数真值,但在一次抽样中,估计值不一定就等于该真值。
那么,在一次抽样中,参数的估计值与真值的差异有多大,是否显著,这就需要进一步进行统计检验。
1、拟合优度检验拟合优度检验:对样本回归直线与样本观测值之间拟合程度的检验。
度量拟合优度的指标:判定系数(可决系数R2(1、总离差平方和的分解已知由一组样本观测值(X i ,Y i ,通过估计得到如下样本回归直线ii X Y 10ˆˆˆββ+=i i i i i i i y e Y Y Y Y Y Y y ˆˆ(ˆ(+=-+-=-=总离差平方和的分解ii X Y 10ˆˆˆββ+=ˆ(ˆY Y y i i -=i i i i i i i ye Y Y Y Y Y Y y ˆˆ(ˆ(+=-+-=-=Y 的i 个观测值与样本均值的离差由回归直线解释的部分回归直线不能解释的部分离差分解为两部分之和总离差平方和的分解公式:TSS=RSS+ESS,TSS 总离差平方和,ESS 为回归平方和,RSS 为残差平方和.((((((((0ˆˆˆ,0.0ˆˆ(ˆ(ˆˆ(2ˆˆ: 1022222222ˆˆˆˆˆˆ=+===-=-=--+=+=-+-=-+--+-=-+-=-=∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑ii i i i i ii i i i i i i i i i i i i i i i i i i i i i X e e Y e e e Y Y e Y Y e Y Y ESS RSS y e Y Y Y Y TSS Y Y Y YY Y Y YY Y Y Y Y Y Y Y ββ而因为证明TSS=ESS+RSSY的观测值围绕其均值的总离差(total variation可分解为两部分:一部分来自回归线(ESS,另一部分则来自随机部分(RSS。
从统计学看线性回归(1)——⼀元线性回归⽬录1. ⼀元线性回归模型的数学形式2. 回归参数β0 , β1的估计3. 最⼩⼆乘估计的性质 线性性 ⽆偏性 最⼩⽅差性⼀、⼀元线性回归模型的数学形式 ⼀元线性回归是描述两个变量之间相关关系的最简单的回归模型。
⾃变量与因变量间的线性关系的数学结构通常⽤式(1)的形式:y = β0 + β1x + ε (1)其中两个变量y与x之间的关系⽤两部分描述。
⼀部分是由于x的变化引起y线性变化的部分,即β0+ β1x,另⼀部分是由其他⼀切随机因素引起的,记为ε。
该式确切的表达了变量x与y之间密切关系,但密切的程度⼜没有到x唯⼀确定y的这种特殊关系。
式(1)称为变量y对x的⼀元线性回归理论模型。
⼀般称y为被解释变量(因变量),x为解释变量(⾃变量),β0和β1是未知参数,成β0为回归常数,β1为回归系数。
ε表⽰其他随机因素的影响。
⼀般假定ε是不可观测的随机误差,它是⼀个随机变量,通常假定ε满⾜:(2)对式(1)两边求期望,得E(y) = β0 + β1x, (3)称式(3)为回归⽅程。
E(ε) = 0 可以理解为ε对 y 的总体影响期望为 0,也就是说在给定 x 下,由x确定的线性部分β0 + β1x 已经确定,现在只有ε对 y 产⽣影响,在 x = x0,ε = 0即除x以外其他⼀切因素对 y 的影响为0时,设 y = y0,经过多次采样,y 的值在 y0 上下波动(因为采样中ε不恒等于0),若 E(ε) = 0 则说明综合多次采样的结果,ε对 y 的综合影响为0,则可以很好的分析 x 对 y 的影响(因为其他⼀切因素的综合影响为0,但要保证样本量不能太少);若 E(ε) = c ≠ 0,即ε对 y 的综合影响是⼀个不为0的常数,则E(y) = β0 + β1x + E(ε),那么 E(ε) 这个常数可以直接被β0 捕获,从⽽变为公式(3);若 E(ε) = 变量,则说明ε在不同的 x 下对 y 的影响不同,那么说明存在其他变量也对 y 有显著作⽤。