第八章 双变量回归与相关
- 格式:ppt
- 大小:290.00 KB
- 文档页数:41
双变量回归与相关两变量间的关系1、确定性关系:函数2、不确定性关系:回归关系或相关关系现实生活中,许多现象之间有相互联系,然而并不像函数那样是确定性关系。
例如:身高与体重、体温与脉搏、年龄与医疗费用等。
在这些有关系的现象中,它们之间联系的程度和性质也各不相同。
有些变量间关系密切,有些不密切;有些是因果关系,有的只是伴随关系。
直线(线性)回归(Linear regression)“regression”一词的来源F Galton的研究为了研究父亲与成年儿子身高之间的关系,卡尔.皮尔逊测量了1078对父子的身高。
把1078对数字表示在坐标上,如图。
用水平轴X上的数代表父亲身高,垂直轴Y上的数代表儿子的身高,1078个点所形成的图形是一个散点图。
它的形状象一块橄榄状的云,中间的点密集,边沿的点稀少,其主要部分是一个椭圆。
*为了描述两变量之间的关系,首先在直角坐标系上描述这些点,这一组点集称为散点图(scatter diagram )图1078对父子身高间的关系直线回归分析就是用来描述一个变量(Y)如何依赖于另一个变量(X)的统计方法。
dependent variable(应变量,Y) independent variable(自变量,X)回归方程直线回归的任务就是要找出因变量(Y)随自变量(X)变化的直线方程,该方程叫做直线回归方程。
式中的是由自变量X 推算应变量Y 的估计值。
a 是回归直线在Y 轴上的截距,称为常数项(constant),即X=0时的Y 值;b 为回归直线的斜率,称为回归系数(reg. Coeff.),即表示当X 每改变一个单位时,Y 平均变动b 个单位。
ˆY a bX=+ˆY求偏导数得正规方程组22ˆ()i Q e Y y ==-∑∑2[()]Y a bX =-+∑min →00Q aQ b∂=∂∂=∂最小二乘法(least square method, LS):使各散点到直线的纵向距离的平方和最小。