第1章 一元线性回归模型(双变量回归分析:一些基本概念)..
- 格式:ppt
- 大小:701.00 KB
- 文档页数:25
第六讲 一元线性回归在客观世界中, 普遍存在着变量之间的关系.数学的一个重要作用就是从数量上来揭示、表达和分析这些关系。
而变量之间关系, 一般可分为确定的和非确定的两类. 确定性关系可用函数关系表示, 而非确定性关系则不然.例如, 人的身高和体重的关系、人的血压和年龄的关系、某产品的广告投入与销售额间的关系等, 它们之间是有关联的,但是它们之间的关系又不能用普通函数来表示。
我们称这类非确定性关系为相关关系。
具有相关关系的变量虽然不具有确定的函数关系,但是可以借助函数关系来表示它们之间的统计规律,这种近似地表示它们之间的相关关系的函数被称为回归函数。
回归分析是研究两个或两个以上变量相关关系的一种重要的统计方法。
在实际中最简单的情形是由两个变量组成的关系。
考虑用下列模型表示)(x f Y =. 但是,由于两个变量之间不存在确定的函数关系,因此必须把随机波动考虑进去,故引入模型如下ε+=)(x f Y其中Y 是随机变量,x 是普通变量,ε是随机变量(称为随机误差)。
回归分析就是根据已得的试验结果以及以往的经验来建立统计模型,并研究变量间的相关关系,建立起变量之间关系的近似表达式,即经验公式,并由此对相应的变量进行预测和控制等。
本节主要介绍一元线性回归模型估计、检验以及相应的预测和控制等问题。
一、引例为了研究某一化学反应过程中温度x 对产品得率Y 的影响. 测得数据如下:89857874706661545145%/190180170160150140130120110100/i i y C x 温度温度试研究这些数据所蕴藏的规律性.二、一元线性回归模型一般地,当随机变量Y 与普通变量x 之间有线性关系时, 可设εββ++=x Y 10, (1)),,0(~2σεN 其中10,ββ为待定系数。
设),(,),,(),,(2211n n Y x Y x Y x 是取自总体),(Y x 的一组样本,而),(,),,(),,(2211n n y x y x y x 是该样本的观察值,在样本和它的观察值中的n x x x ,,,21 是取定的不完全相同的数值,而样本中的n Y Y Y ,,,21 在试验前为随机变量,在试验或观测后是具体的数值,一次抽样的结果可以取得n 对数据),(,),,(),,(2211n n y x y x y x ,则有i i i x y εββ++=10, n i ,,2,1 = (2)其中n εεε,,,21 相互独立。
第一节 两变量线性回归模型一.模型的建立1.数理模型的基本形式y x αβ=+ (2.1)这里y 称为被解释变量(dependent variable),x 称为解释变量(independent variable)注意:(1)x 、y 选择的方法:主要是从所研究的问题的经济关系出发,根据已有的经济理论进行合理选择。
(2)变量之间是否是线性关系可先通过散点图来观察。
2.例如果在研究上海消费规律时,已经得到上海城市居民1981-1998年期间的人均可支配收入和人均消费性支出数据(见表1),能否用两变量线性函数进行分析?表1.上海居民收入消费情况年份 可支配收入 消费性支出 年份 可支配收入 消费性支出 1981 636.82 585 1990 2181.65 1936 1982 659.25 576 1991 2485.46 2167 1983 685.92 615 1992 3008.97 2509 1984 834.15 726 1993 4277.38 3530 1985 1075.26 992 1994 5868.48 4669 19861293.24117019957171.91586819871437.09128219968158.746763 19881723.44164819978438.896820 19891975.64181219988773.168662.一些非线性模型向线性模型的转化一些双变量之间虽然不存在线性关系,但通过变量代换可化为线性形式,这些双变量关系包括对数关系、双曲线关系等。
例3-2 如果认为一个国家或地区总产出具有规模报酬不变的特征,那么采用人均产出y与人均资本k的形式,该国家或者说地区的总产出规律可以表示为下列C-D生产函数形式y Akα=(2.2)也就是人均产出是人均资本的函数。
能不能用两变量线性回归模型分析这种总量生产规律?3.计量模型的设定 (1)基本形式:y x αβε=++ (2.3) 这里ε是一个随机变量,它的数学期望为0,即(2.3)中的变量y 、x 之间的关系已经是不确定的了。