第03章基本回归模型
- 格式:ppt
- 大小:993.00 KB
- 文档页数:89
第三章 一元线性回归模型一、预备知识(一)相关概念对于一个双变量总体,若由基础理论,变量和变量之间存在因果),(i i x y x y 关系,或的变异可用来解释的变异。
为检验两变量间因果关系是否存在、x y 度量自变量对因变量影响的强弱与显著性以及利用解释变量去预测因变量x y x ,引入一元回归分析这一工具。
y 将给定条件下的均值i x i yi i i x x y E 10)|(ββ+=(3.1)定义为总体回归函数(PopulationRegressionFunction,PRF )。
定义为误差项(errorterm ),记为,即,这样)|(i i i x y E y -i μ)|(i i i i x y E y -=μ,或i i i i x y E y μ+=)|(i i i x y μββ++=10(3.2)(3.2)式称为总体回归模型或者随机总体回归函数。
其中,称为解释变量x (explanatory variable )或自变量(independent variable );称为被解释y 变量(explained variable )或因变量(dependent variable );误差项解释μ了因变量的变动中不能完全被自变量所解释的部分。
误差项的构成包括以下四个部分:(1)未纳入模型变量的影响(2)数据的测量误差(3)基础理论方程具有与回归方程不同的函数形式,比如自变量与因变量之间可能是非线性关系(4)纯随机和不可预料的事件。
在总体回归模型(3.2)中参数是未知的,是不可观察的,统计计10,ββi μ量分析的目标之一就是估计模型的未知参数。
给定一组随机样本,对(3.1)式进行估计,若的估计量分别记n i y x i i ,,2,1),,( =10,),|(ββi i x y E 为,则定义3.3式为样本回归函数^1^0^,,ββi y ()i i x y ^1^0^ββ+=n i ,,2,1 =(3.3)注意,样本回归函数随着样本的不同而不同,也就是说是随机变量,^1^0,ββ它们的随机性是由于的随机性(同一个可能对应不同的)与的变异共i y i x i y x 同引起的。
回归方程回归模型
回归方程是用来描述自变量和因变量之间关系的数学模型。
回
归模型是建立在统计学原理和假设之上的,用于预测和解释因变量
与一个或多个自变量之间的关系。
回归方程通常采用线性模型的形式,即因变量与自变量之间的
关系可以用直线表示。
线性回归方程的一般形式为,Y = β0 +
β1X1 + β2X2 + ... + βnXn + ε,其中Y表示因变量,X1、
X2、...、Xn表示自变量,β0、β1、β2、...、βn表示回归系数,ε表示误差项。
回归方程的目标是通过最小化误差项来估计回归系数,使得回
归方程能够最好地拟合样本数据。
拟合程度可以通过回归模型的拟
合优度指标(如R方值)来评估。
回归模型的应用非常广泛。
它可以用于预测因变量的取值,例
如根据房屋的面积、位置等自变量来预测房屋的价格。
此外,回归
模型还可以用于解释因变量与自变量之间的关系,例如研究教育水
平对收入的影响。
需要注意的是,回归模型的建立需要满足一些假设前提,如线性关系、常态分布、误差项的独立性和同方差性等。
如果这些前提不满足,可能会导致回归模型的拟合效果不佳或结果不可靠。
总结起来,回归方程是描述自变量和因变量关系的数学模型,回归模型是基于统计学原理和假设的预测和解释工具。
它的应用广泛,但需要满足一些假设前提。
回归模型的要素
回归模型是一种统计分析方法,用于建立变量之间的关系模型。
它基于变量之间的线性关系假设,并通过拟合数据来估计模型参数。
回归模型包含以下要素:
1. 因变量(Dependent Variable):也称为被解释变量或目标变量,它是我们想要预测或解释的变量。
2. 自变量(Independent Variables):也称为解释变量或预测变量,它们是用来解释或预测因变量的变量。
回归模型可以包含一个或多个自变量。
3. 线性关系(Linear Relationship):回归模型假设因变量与自变量之间存在线性关系,即自变量的变化对因变量的影响是线性的。
4. 残差(Residuals):在回归模型中,残差是指观测值与模型预测值之间的差异。
回归模型的目标是通过最小化残差的平方和来找到最佳拟合线。
5. 模型参数(Model Parameters):回归模型的参数是用来描述自变量与因变量之间关系的数值。
在线性回归模型中,参数表示自变量对因变量的影响程度。
6. 截距(Intercept):截距是回归模型中的常数项,表示在自变量为零时,因变量的预测值。
它反映了因变量在没有自变量影响时的基准水平。
通过确定回归模型的要素,并进行数据拟合和参数估计,我
们可以使用回归模型来预测或解释因变量的变化。
一、研究背景2020年,由于疫情原因,我国跨境电商得到大幅度的发展。
据海关统计,截至2020年年底,我国跨境电商进出口总额已经达到1.69万亿元,同比2019年增长了31.1%,占同年进出口总额的5.25%,GDP 总量的1.66%。
跨境电商已经成为我国经济运行中一个重要组成部分。
与传统的对外贸易相比,跨境电商准入门槛低,且交易方便,贸易范围更加广泛,越来越多的资金开始涌入跨境电商行业。
同时,唐红涛、成凯的研究表明,跨境电商综试区的设立推动了城市居民消费的升级,且居民可支配收入的提高有利于消费升级。
因此,本文基于相关研究提出了跨境电商综试区城市设立能够推动城镇居民人均可支配收入提高的假设,并利用33个城市2006—2018年共13年的面板数据来对这个假设进行实证分析。
二、实证设计(一)模型选择本文将跨境电商综试区的设立作为一次准自然实验,根据跨境电商综试区设立的时间、地点的差异,采用双重差分法来估计跨境电商综试区对我国城市居民收入的影响。
基本回归模型如下:Y it =β0+β1du it ·dt it +City t +year i +β2C it +λ0其中下标i 和t 分别代表城市和年份,被解释变量Y it 表示城镇居民人均可支配收入;核心解释变量duit ·dt it 为虚拟变量,处理组城市取du=1,控制组城市取du=0,跨境电商综试区设立之前d t =0,跨境电商综试区设立之后d t =1;City it 表示城市固定效应,如城市的地理位置、要素禀赋等不随时间变化的因素;year it 为年份固定效应,去除特定年份对城镇居民人均可支配收入造成影响的因素;C it 为其他控制变量;λ0为随机干扰项。
系数β1表示跨境电商综试区的设立对城镇居民人均可支配收入的影响,当β1大于0并显著时,表明跨境电商综试区的设立对城镇居民人均可支配收入的增长有着显著的正向影响;当β1小于0且显著时,表明跨境电商综试区的设立显著地阻碍了城镇居民人均可支配收入的增长;当β1不显著时,表明跨境电商综试区的设立对城镇居民人均可支配收入的增长没有什么显著影响。