5第五章 一元线性回归的假设检验解析
- 格式:ppt
- 大小:681.50 KB
- 文档页数:66
第五章 异方差二、简答题1.异方差的存在对下面各项有何影响? (1)OLS 估计量及其方差; (2)置信区间;(3)显著性t 检验和F 检验的使用。
2.产生异方差的经济背景是什么?检验异方差的方法思路是什么?3.从直观上解释,当存在异方差时,加权最小二乘法(WLS )优于OLS 法。
4.下列异方差检查方法的逻辑关系是什么? (1)图示法 (2)Park 检验 (3)White 检验5.在一元线性回归函数中,假设误差方差有如下结构:()i i i x E 22σε=如何变换模型以达到同方差的目的?我们将如何估计变换后的模型?请列出估计步骤。
三、计算题1.考虑如下两个回归方程(根据1946—1975年美国数据)(括号中给出的是标准差):t t t D GNP C 4398.0624.019.26-+=e s :(2.73)(0.0060) (0.0736)R ²=0.999t t t GNP D GNP GNP C ⎥⎦⎤⎢⎣⎡-+=⎥⎦⎤⎢⎣⎡4315.06246.0192.25 e s : (2.22) (0.0068)(0.0597)R ²=0.875式中,C 为总私人消费支出;GNP 为国民生产总值;D 为国防支出;t 为时间。
研究的目的是确定国防支出对经济中其他支出的影响。
(1)将第一个方程变换为第二个方程的原因是什么?(2)如果变换的目的是为了消除或者减弱异方差,那么我们对误差项要做哪些假设? (3)如果存在异方差,是否已成功地消除异方差?请说明原因。
(4)变换后的回归方程是否一定要通过原点?为什么? (5)能否将两个回归方程中的R ²加以比较?为什么?2.1964年,对9966名经济学家的调查数据如下:资料来源:“The Structure of Economists’ Employment and Salaries”, Committee on the National Science Foundation Report on the Economics Profession, American Economics Review, vol.55, No.4, December 1965.(1)建立适当的模型解释平均工资与年龄间的关系。
线性回归模型的经典假定及检验、修正一、线性回归模型的基本假定1、一元线性回归模型一元线性回归模型是最简单的计量经济学模型,在模型中只有一个解释变量,其一般形式是Y =β0+β1X 1+μ其中,Y 为被解释变量,X 为解释变量,β0与β1为待估参数,μ为随机干扰项。
回归分析的主要目的是要通过样本回归函数(模型)尽可能准确地估计总体回归函数(模型)。
为保证函数估计量具有良好的性质,通常对模型提出若干基本假设。
假设1:回归模型是正确设定的。
模型的正确设定主要包括两个方面的内容:(1)模型选择了正确的变量,即未遗漏重要变量,也不含无关变量;(2)模型选择了正确的函数形式,即当被解释变量与解释变量间呈现某种函数形式时,我们所设定的总体回归方程恰为该函数形式。
假设2:解释变量X 是确定性变量,而不是随机变量,在重复抽样中取固定值。
这里假定解释变量为非随机的,可以简化对参数估计性质的讨论。
假设3:解释变量X 在所抽取的样本中具有变异性,而且随着样本容量的无限增加,解释变量X 的样本方差趋于一个非零的有限常数,即∑(X i −X ̅)2n i=1n→Q,n →∞ 在以因果关系为基础的回归分析中,往往就是通过解释变量X 的变化来解释被解释变量Y 的变化的,因此,解释变量X 要有足够的变异性。
对其样本方差的极限为非零有限常数的假设,旨在排除时间序列数据出现持续上升或下降的变量作为解释变量,因为这类数据不仅使大样本统计推断变得无效,而且往往产生伪回归问题。
假设4:随机误差项μ具有给定X 条件下的零均值、同方差以及无序列相关性,即E(μi|X i)=0Var(μi|X i)=σ2Cov(μi,μj|X i,X j)=0, i≠j随机误差项μ的条件零均值假设意味着μ的期望不依赖于X的变化而变化,且总为常数零。
该假设表明μ与X不存在任何形式的相关性,因此该假设成立时也往往称X为外生性解释变量随机误差项μ的条件同方差假设意味着μ的方差不依赖于X的变化而变化,且总为常数σ2。
Chapter 5Regression with a Single Regressor: Hypothesis Tests andConfidence Intervals 一元线性回归:假设检验和置信区间假设检验和置信区间概述 • 当知道 OLS 估计量的样本分布,就可以对β1 进行假设检 验,以及求取其置信区间。
本章内容将涉及以下问题: Also, we will cover some loose ends about regression: • 当 X 是二元回归变量情形 • 异方差(Heteroskedasticity)和同方差( homoskedasticity) • OLS 估计量的有效性 • t 统计量在假设检验中的应用2回顾z 根据样本数据了解总体回归线斜率的有关信息的步骤如 下:1. 界定关注研究对象。
2. 在一定假设为前提,得到估计量的样本分布。
3. 估计样本分布的离散程度,即计算出 OLS 估计量的标准误差(SE)。
4. 用估计量βˆ1得到点估计,结合标准误差进行假设检验和构造置信区间。
3研究对象:β1Yi = β0 + β1Xi + ui, i = 1,…, n β1 = ΔY/ΔX最小二乘假设:1. E(u|X = x) = 0.2. (Xi,Yi), i =1,…,n, 为 i.i.d.3. 不大可能存在异常值 (E(X4) < ∞, E(Y4) < ∞.βˆ1 的抽样分布为: 当上述最小二乘假设成立时,若 n 为大样本, βˆ1近似服从:βˆ1~N⎛ ⎜β1,⎝σ2 vnσ4 X⎞ ⎟,其中vi=(Xi–μX)ui⎠4关于某个回归系数的检验要根据样本数据检验一个关于斜率真值的假设,例如β1 = 0,步骤为: z 原假设对应双边备择假设为:H0: β1 = β1,0 ;. H1: β1 ≠ β1,0 原假设含义为假设总体斜率β1 的真值为某个具体值β1,0z 原假设对应单边备择假设为: H0: β1 = β1,0 ; H1: β1 < β1,05一般方法:计算 t 统计量,计算 p 值(或者与 N(0,1)的临界值 进行比较)• 一般形式:t=估计量 -假设值 估计量的标准误差• 对于检验 Y 的均值 :t = Y − μY ,0 sY / n• 对于检验 β1,t=βˆ1 − β1,0 SE ( βˆ1 ),其中 SE(βˆ1)为βˆ1的标准误差σ βˆ1 的估计值,是βˆ1抽样分布 的标准差。
第五章 双变量回归:区间估计与假设检验5.1 引言我们首先简要复习概率统计中关于假设检验的内容.1.假定随机变量X 有概率密度函数(PDF )θθ),,(x f 为分布参数。
从总体中抽取样本可得到参数估计为θˆ(如0.5,或1.2等),这是通过样本所得到的是参数的点估计,而真正的θ 一般是未知的,问题在于:估计量θˆ是否与总体真值或某个特定的或假设的*θ相等即*ˆθθ=,如假定*θ为总体真值,而样本是从总体中随机抽取,由此,接受*ˆθθ=就意味着我们的样本是来自于对应的总体,于是检验假设*θθ=,就是回答这一类问题。
用术语表示,对于原假设H 0:*θθ=,与之相对立的称为备选假设,记为H A :*θθ≠,显然,这种原假设和备选假设为简单的相等和不相等,称为复合(备)假设,因为拒绝原假设不能回答是*θθ>还是*θθ<,而类似于*θθ=对*θθ>称为简单假设。
于是对于所得到的估计量,我们以上的假设表述为H 0:*θθ= H A :*θθ≠ (5.1)要检验这种原对备选假设,必须使用样本信息,构造一个合适的统计量,并且原假设下这种统计量的抽样分布必须已知。
最后,为检验H 0对H A ,我们首先应所选定一个显著性水平,根据统计量的抽样分布而查对应的临界值表而得到相应的临界值,若所计算的统计量值小于这一临界值,或者说统计量值落入接受(原假设)域,则不拒绝H 0,否则拒绝H 0而倾向于接受备选假设H A 。
2.置信区间法。
思想: 对于样本X i , ,i =1,2,…,n , 来自于正态总体),(2σμN ,且相互独立, 构造一个基于样本信息的区间,使总体分布参数(以均值为例)以较大的可能性落入这一区间. 则这一区间为置信区间. 根据中心极限定理,有)/,(~2n N X σμ 置信区间构造的思想是,对于X 的正态分布,建立它的一个100(1-α)的置信区间,使这一区间包含了μ的置信水平(概率)为100(1-α)。
一元线性回归分析摘要:一元线性回归分析是一种常用的预测和建模技术,广泛应用于各个领域,如经济学、统计学、金融学等。
本文将详细介绍一元线性回归分析的基本概念、模型建立、参数估计和模型检验等方面内容,并通过一个具体的案例来说明如何应用一元线性回归分析进行数据分析和预测。
1. 引言1.1 背景一元线性回归分析是通过建立一个线性模型,来描述自变量和因变量之间的关系。
通过分析模型的拟合程度和参数估计值,我们可以了解自变量对因变量的影响,并进行预测和决策。
1.2 目的本文的目的是介绍一元线性回归分析的基本原理、建模过程和应用方法,帮助读者了解和应用这一常用的数据分析技术。
2. 一元线性回归模型2.1 模型表达式一元线性回归模型的基本形式为:Y = β0 + β1X + ε其中,Y是因变量,X是自变量,β0和β1是回归系数,ε是误差项。
2.2 模型假设一元线性回归模型的基本假设包括:- 线性关系假设:自变量X与因变量Y之间存在线性关系。
- 独立性假设:每个观测值之间相互独立。
- 正态性假设:误差项ε服从正态分布。
- 同方差性假设:每个自变量取值下的误差项具有相同的方差。
3. 一元线性回归分析步骤3.1 数据收集和整理在进行一元线性回归分析之前,需要收集相关的自变量和因变量数据,并对数据进行整理和清洗,以保证数据的准确性和可用性。
3.2 模型建立通过将数据代入一元线性回归模型的表达式,可以得到回归方程的具体形式。
根据实际需求和数据特点,选择适当的变量和函数形式,建立最优的回归模型。
3.3 参数估计利用最小二乘法或最大似然法等统计方法,估计回归模型中的参数。
通过最小化观测值与回归模型预测值之间的差异,找到最优的参数估计值。
3.4 模型检验通过对回归模型的拟合程度进行检验,评估模型的准确性和可靠性。
常用的检验方法包括:残差分析、显著性检验、回归系数的显著性检验等。
4. 一元线性回归分析实例为了更好地理解一元线性回归分析的应用,我们以房价和房屋面积之间的关系为例进行分析。
§5.2 一元线性回归中的假设检验和预测一元线性回归中的假设检验(1)假设检验的必要性①上一节推导出的回归系数的最小二乘估计(5.1-8)式,对Y x ,的任何一组数据),21(),(n ,,i y ,x i i =均适用,即使Y x ,之间毫无关系。
如果这样,求得的回归直线方程就没有任何意义。
因此,求得回归直线后还需要检验Y x ,之间是否真的有统计线性相关关系——一元线性回归的模型检验。
②回归系数10β,β的最小二乘估计∧∧10β,β只是由Y x ,的n 对观测值),21(),(n ,,i y ,x i i =求得的,此估计值到底在什么程度上适于Y x ,之间的真正关系?因此,需对参数是否取为其估计值作假设检验——一元线性回归的参数检验。
(2)一元线性回归的模型检验为对Y x ,之间满足一元正态线性回归模型:⎩⎨⎧++=)(~210ζ0,N εx ββY ε )315(-.这一假设的合理性进行严格的检验,需要检验三点:①在x 的各取值点处,Y 都服从正态分布,期望值依赖于x ,且方差都相同;②在x 的各取值点处,Y 的期望是x 的线性函数;③在x 的各取值点处,相应的Y 是相互独立的。
可见,进行完全的严格检验并不容易。
而引起线性回归不显著的原因主要有以下三点:①除变量x 外,还有其它重要变量影响Y 的取值,故当x 取定时,Y 不能服从正态分布;②Y x ,之间不是线性相关关系,而是某种非线性相关关系;③Y 的取值根本与x 的取值无关。
在上述情况之一出现时,若对Y x ,配以线性回归模型,均会有0β1=,即ε+=0βY . 因此,对线性回归模型显著性的检验可以简化处理为对 0β:H 10=是否成立的检验。
方法如下:①作假设0β:H 0β:H 1110≠↔= ②检验统计量及其分布由定理 5.1.3知:)2(~--∧∧n t L ζββxx *11 ,故当 0H 成立时有)2(0-=∧∧n t ~L ζβT H xx *1以此为检验统计量,且由Y x ,的一组观测值),21(),(n ,,i y ,x i i =可以求得T的观测值。