第二节 一元线性回归分析
- 格式:doc
- 大小:455.04 KB
- 文档页数:6
一元线性回归分析摘要:一元线性回归分析是一种常用的预测和建模技术,广泛应用于各个领域,如经济学、统计学、金融学等。
本文将详细介绍一元线性回归分析的基本概念、模型建立、参数估计和模型检验等方面内容,并通过一个具体的案例来说明如何应用一元线性回归分析进行数据分析和预测。
1. 引言1.1 背景一元线性回归分析是通过建立一个线性模型,来描述自变量和因变量之间的关系。
通过分析模型的拟合程度和参数估计值,我们可以了解自变量对因变量的影响,并进行预测和决策。
1.2 目的本文的目的是介绍一元线性回归分析的基本原理、建模过程和应用方法,帮助读者了解和应用这一常用的数据分析技术。
2. 一元线性回归模型2.1 模型表达式一元线性回归模型的基本形式为:Y = β0 + β1X + ε其中,Y是因变量,X是自变量,β0和β1是回归系数,ε是误差项。
2.2 模型假设一元线性回归模型的基本假设包括:- 线性关系假设:自变量X与因变量Y之间存在线性关系。
- 独立性假设:每个观测值之间相互独立。
- 正态性假设:误差项ε服从正态分布。
- 同方差性假设:每个自变量取值下的误差项具有相同的方差。
3. 一元线性回归分析步骤3.1 数据收集和整理在进行一元线性回归分析之前,需要收集相关的自变量和因变量数据,并对数据进行整理和清洗,以保证数据的准确性和可用性。
3.2 模型建立通过将数据代入一元线性回归模型的表达式,可以得到回归方程的具体形式。
根据实际需求和数据特点,选择适当的变量和函数形式,建立最优的回归模型。
3.3 参数估计利用最小二乘法或最大似然法等统计方法,估计回归模型中的参数。
通过最小化观测值与回归模型预测值之间的差异,找到最优的参数估计值。
3.4 模型检验通过对回归模型的拟合程度进行检验,评估模型的准确性和可靠性。
常用的检验方法包括:残差分析、显著性检验、回归系数的显著性检验等。
4. 一元线性回归分析实例为了更好地理解一元线性回归分析的应用,我们以房价和房屋面积之间的关系为例进行分析。
计量经济学第二章一元线性回归模型第二章一元线性回归模型第一节一元线性回归模型及其古典假定第二节参数估计第三节最小二乘估计量的统计特性第四节统计显著性检验第五节预测与控制第一节回归模型的一般描述(1)确定性关系或函数关系:变量之间有唯一确定性的函数关系。
其一般表现形式为:一、回归模型的一般形式变量间的关系经济变量之间的关系,大体可分为两类:(2.1)(2)统计关系或相关关系:变量之间为非确定性依赖关系。
其一般表现形式为:(2.2)例如:函数关系:圆面积S =统计依赖关系/统计相关关系:若x和y之间确有因果关系,则称(2.2)为总体回归模型,x(一个或几个)为自变量(或解释变量或外生变量),y为因变量(或被解释变量或内生变量),u为随机项,是没有包含在模型中的自变量和其他一些随机因素对y的总影响。
一般说来,随机项来自以下几个方面:1、变量的省略。
由于人们认识的局限不能穷尽所有的影响因素或由于受时间、费用、数据质量等制约而没有引入模型之中的对被解释变量有一定影响的自变量。
2、统计误差。
数据搜集中由于计量、计算、记录等导致的登记误差;或由样本信息推断总体信息时产生的代表性误差。
3、模型的设定误差。
如在模型构造时,非线性关系用线性模型描述了;复杂关系用简单模型描述了;此非线性关系用彼非线性模型描述了等等。
4、随机误差。
被解释变量还受一些不可控制的众多的、细小的偶然因素的影响。
若相互依赖的变量间没有因果关系,则称其有相关关系。
对变量间统计关系的分析主要是通过相关分析、方差分析或回归分析(regression analysis)来完成的。
他们各有特点、职责和分析范围。
相关分析和方差分析本身虽然可以独立的进行某些方面的数量分析,但在大多数情况下,则是和回归分析结合在一起,进行综合分析,作为回归分析方法的补充。
回归分析(regression analysis)是研究一个变量关于另一个(些)变量的具体依赖关系的计算方法和理论。
第二节一元线性回归分析本节主要内容:回归是分析变量之间关系类型的方法,按照变量之间的关系,回归分析分为:线性回归分析和非线性回归分析。
本节研究的是线性回归,即如何通过统计模型反映两个变量之间的线性依存关系.回归分析的主要内容:1.从样本数据出发,确定变量之间的数学关系式;2.估计回归模型参数;3.对确定的关系式进行各种统计检验,并从影响某一特定变量的诸多变量中找出影响显著的变量。
一、一元线性回归模型:一元线性模型是指两个变量x、y之间的直线因果关系。
理论回归模型:理论回归模型中的参数是未知的,但是在观察中我们通常用样本观察值估计参数值,通常用分别表示的估计值,即称回归估计模型:回归估计模型:二、模型参数估计:用最小二乘法估计:【例3】实测某地四周岁至十一岁女孩的七个年龄组的平均身高(单位:厘米)如下表所示某地女孩身高的实测数据建立身高与年龄的线性回归方程。
根据上面公式求出b0=80。
84,b1=4。
68。
三.回归系数的含义(2)回归方程中的两个回归系数,其中b0为回归直线的启动值,在相关图上变现为x=0时,纵轴上的一个点,称为y截距;b1是回归直线的斜率,它是自变量(x)每变动一个单位量时,因变量(y)的平均变化量。
(3)回归系数b1的取值有正负号。
如果b1为正值,则表示两个变量为正相关关系,如果b1为负值,则表示两个变量为负相关关系。
[例题·判断题]回归系数b的符号与相关系数r的符号,可以相同也可以不同.( )答案:错误解析:回归系数b的符号与相关系数r的符号是相同的=a+bx,b<0,则x与y之间的相关系数( )[例题·判断题]在回归直线yca。
r=0 b.r=1 c。
0<r〈1 d.—1<r〈0答案:d解析:b〈0,则x与y之间的相关系数为负即—1〈r〈0[例题·单选题]回归系数和相关系数的符号是一致的,其符号均可用来判断现象( )a。
线性相关还是非线性相关 b.正相关还是负相关c。
第二节一元线性回归分析
本节主要内容:
回归是分析变量之间关系类型的方法,按照变量之间的关系,回归分析分为:线性回归分析和非线性回归分析。
本节研究的是线性回归,即如何通过统计模型反映两个变量之间的线性依存关系。
回归分析的主要内容:
1.从样本数据出发,确定变量之间的数学关系式;
2.估计回归模型参数;
3.对确定的关系式进行各种统计检验,并从影响某一特定变量的诸多变量中找出
影响显著的变量。
一、一元线性回归模型:
一元线性模型是指两个变量x、y之间的直线因果关系。
理论回归模型:
理论回归模型中的参数是未知的,但是在观察中我们通常用样本观察值估计参数值,通常用分别表示的估计值,即称回归估计模型:
回归估计模型:
二、模型参数估计:
用最小二乘法估计:
【例3】实测某地四周岁至十一岁女孩的七个年龄组的平均身高(单位:厘米)如下表所示
某地女孩身高的实测数据
建立身高与年龄的线性回归方程。
根据上面公式求出b0=80.84,b1=4.68.
三.回归系数的含义
(2)回归方程中的两个回归系数,其中b0为回归直线的启动值,在相关图上变现为x=0时,纵轴上的一个点,称为y截距;b1是回归直线的斜率,它是自变量(x)每变动一个单位量时,因变量(y)的平均变化量。
(3)回归系数b1的取值有正负号。
如果b1为正值,则表示两个变量为正相关关系,如果b1为负值,则表示两个变量为负相关关系。
[例题·判断题]回归系数b的符号与相关系数r的符号,可以相同也可以不同。
()
答案:错误
解析:回归系数b的符号与相关系数r的符号是相同的
[例题·判断题]在回归直线y c=a+bx,b<0,则x与y之间的相关系数()
a.r=0
b.r=1
c.0<r<1
d.-1<r<0
答案:d
解析:b<0,则x与y之间的相关系数为负即-1<r<0
[例题·单选题]回归系数和相关系数的符号是一致的,其符号均可用来判断现象()
a.线性相关还是非线性相关
b.正相关还是负相关
c.完全相关还是不完全相关
d.单相关还是复相关
答案:b
解析:回归系数和相关系数的符号是一致的,其符号均可用来判断现象正相关还是负相关
四.回归方程的评价与检验:
当我们得到一个实际问题的经验回归方程后,还不能马上就进行分析与预测等应用,在应用之前还需要运用统计方法对回归方程进行评价与检验。
进行评价与检验主要是基于以下理由:第一,在利用样本数据估计回归模型时,首先是假设变量y与x之间存在着线性关系,但这种假设是否存在需要进行检验;第二,估计的回归方程是否真正描述了变量y与x之间的统计规律性,y 的变化是否通过模型中的解释变量去解释需要进行检验等。
一般进行检验的内容有:
1.经济意义的检验:
利用相关的经济学原理及我们所积累的丰富的经验,对所估计的回归方程的回归系数进行分析与判断,看其能否得到合理的解释。
2.回归方程的统计检验:
包括回归方程的显著性检验(f检验)和对回归系数的检验(t检验)。
(1)线性回归方程的显著性检验——f检验
线性回归方程的显著性检验即方差分析检验法,它是对所有参数感兴趣的一种显著性检验。
其检验步骤为:
第一步:提出假设。
原假设
备择假设
第二步:构造f统计量
在h
成立的条件下,有:
第二自由度为n-2,其中n为样本容量。
(2)回归系数的显著性检验——t检验
回归系数的显著性检验是检验解释变量x对因变量y 的影响是否显著。
首先:提出假设。
原假设
备择假设
如果h0成立,则因变量y对解释变量x之间并没有真正的线性关系,即x的变化对y并没有显著的线性影响。
其次:计算检验统计量t,并得出对应的概率值(伴随概率)。
检验统计量:(为回归系数的标准差)
最后:根据伴随概率进行判断:如果伴随概率(sig.值)小于我们事先确定的显著性水平时,拒绝原假设,接受备择假设,即解释变量x对y的线性效果显著。
否则,不能拒绝原假设,认为x对y的线性效果不显著。
一元线性回归分析时,由于只有一个解释变量,因此t检验与f检验的结果是一致的。
3.回归方程的评价——拟合程度分析:
拟合程度是指估计的回归方程是否很接近因变量,即估计的精确度。
而估计的精确度如何取决于回归方程对观测数据的拟合程度。
最常用的指标就是——判定系数。
1.判定系数
判定系数是用来说明回归方程对观测数据拟合程度的一个度量值,以一元线性回归方程为例,若各观测值数据(x i,y i)在坐标系上形成的散点都落在一条直线上,那么这条直线就是对数据的完全拟合,直线充分代表了各个点,此时,用x估计y是没有误差的。
各观测点越是紧密围绕直线,说明直线对观测数据的拟合程度越好,判定系数越高,反之则越差,判定系数越小。
总变差平方和=回归平方和+残差平方和
判定系数的取值范围在【0,1】,=1时,拟合是完全的,即所有观测值都在直线上。
若x与y无关,x完全无助于解释y的变差,此时,则=0.可见,越接近于1,表明回归平方和占总变差平方和的比重越大,回归直线与各观测点越接近,回归直线的拟合程度就越好。
反之,越接近0,回归直线的拟合程度越差。
2.估计标准误差
估计标准误差是残差平方和的均方根,用表示。
其计算公式为:
从实际意义看,反映了用估计的回归方程预测因变量y时预测误差的大小,越小,说明根据回归方程进行预测也就越准确;若各观测点全部落在直线上,则=0,此时用自变量来预测因变量是没有误差的。
可见也从另一个角度说明了回归直线的拟合程度。
[例题·单选题]评价回归直线方程拟合优度如何的指标有()
a.回归系数b
b.直线截距a
c.判定系数r2
d.相关系数r
答案:c
[例题·单选题]关于估计标准误差,下列说法正确的是( )
a.估计标准误差数值越大,说明回归直线的代表性越大
b. 估计标准误差数值越大,说明回归直线的代表性越小
c. 估计标准误差数值越大,说明回归直线的实用价值越大
d. 估计标准误差数值越大,说明回归直线的实用价值越小
答案:b
解析:估计标准误差是残差平方和的均方根,用表示。
其计算公式为。
从实际意义看,反映了用估计的回归方程预测因变量y时预测误差的大小,越小,说明根据回归方程进行预测也就越准确
[例题·单选题]估计标准误差的作用是表明()
a.回归方程的代表性
b.样本的变异程度
c.估计值与实际值的平均误差
d.样本指标的代表性
e.总体的变异程度
答案:ac。