《3.2 回归分析》教案

  • 格式:doc
  • 大小:232.50 KB
  • 文档页数:5

下载文档原格式

  / 5
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《3.2 回归分析》教案

教学目标:

(1)通过实例引入线性回归模型,感受产生随机误差的原因;

(2)通过对回归模型的合理性等问题的研究,渗透线性回归分析的思想和方法;

(3)能求出简单实际问题的线性回归方程.

教学重难点:

线性回归模型的建立和线性回归系数的最佳估计值的探求方法.

教学过程:

一.问题情境

1. 情境:对一作直线运动的质点的运动过程观测了8次,得到如下表所示的数据,试估计当x=9时的位置y的值.

先作散点图,如下图所示:

从散点图中可以看出,样本点呈直线趋势,时间x与位置观测值y之间有着较好的线性关系.因此可以用线性回归方程来刻画它们之间的关系.根据线性回归的系数公

式,

1

22

1

()

n

i i

i

n

i

i

x y nx y

b

x n x

a y bx

=

=

-

⎪=

⎨-

=-

⎪⎩

可以得到线性回归方为 3.5361 2.1214

y x

=+,所以当9

x=时,由线性回归方程可以估

计其位置值为 22.6287

y=

2.问题:在时刻9x =时,质点的运动位置一定是22.6287cm 吗? 二.学生活动

思考,讨论:这些点并不都在同一条直线上,上述直线并不能精确地反映x 与y 之间的关系,y 的值不能由x 完全确定,它们之间是统计相关关系,y 的实际值与估计值之间存在着误差.

三.建构数学

1.线性回归模型的定义:

我们将用于估计y 值的线性函数a bx +作为确定性函数;

y 的实际值与估计值之间的误差记为ε,称之为随机误差;

将y a bx ε=++称为线性回归模型. 说明:(1)产生随机误差的主要原因有: ①所用的确定性函数不恰当引起的误差; ②忽略了某些因素的影响; ③存在观测误差.

(2)对于线性回归模型,我们应该考虑下面两个问题: ①模型是否合理(这个问题在下一节课解决); ②在模型合理的情况下,如何估计a ,b ? 2.探求线性回归系数的最佳估计值:

对于问题②,设有n 对观测数据(,)i i x y (1,2,3,,)i n = ,根据线性回归模型,对于每一个

i x ,对应的随机误差项()i i i y a bx ε=-+,我们希望总误差越小越好,即要使21

n

i i ε=∑越小越好.

所以,只要求出使2

1

(,)()

n

i

i

i Q y x αββα==

--∑取得最小值时的α,β值作为a ,b 的估计值,

记为 a

,b . 注:这里的i ε就是拟合直线上的点(),i i x a bx +到点(),i i i P x y 的距离.

用什么方法求 a

,b ? 最小二乘法.

利用最小二乘法可以得到 a

,b 的计算公式为 1

122211()()()()n n i i i i i i n n i i i i x x y y x y nx y b x x x n x a y bx

====⎧

---⎪

⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑ ,

其中11n i i x x n ==∑,1

1n

i i y y n ==∑

由此得到的直线 y a bx =+ 就称为这n 对数据的回归直线,此直线方程即为线性回归方程.其中 a ,b 分别为a ,b 的估计值, a 称为回归截距,b 称为回归系数, y 称为回归值.

在前面质点运动的线性回归方程 3.5361 2.1214y x =+中, 3.5361a

=, 2.1214b = . 3. 线性回归方程 y a bx =+ 中 a ,b 的意义是:以 a 为基数,x 每增加1个单位,y 相应地平均增加b

个单位; 4. 化归思想(转化思想)

在实际问题中,有时两个变量之间的关系并不是线性关系,这就需要我们根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数.下面列举出一些常见的曲线方程,并给出相应的化为线性回归方程的换元公式.

(1)b y a x =+

,令'y y =,1

'x x

=,则有''y a bx =+. (2)b y ax =,令'ln y y =,'ln x x =,'ln a a =,则有'''y a bx =+. (3)bx y ae =,令'ln y y =,'x x =,'ln a a =,则有'''y a bx =+. (4)b x

y ae =,令'ln y y =,1

'x x

=

,'ln a a =,则有'''y a bx =+. (5)ln y a b x =+,令'y y =,'ln x x =,则有''y a bx =+. 四.数学运用

例 1.下表给出了我国从1949年至1999年人口数据资料,试根据表中数据估计我国

2004年的人口数.

下面的数据表:

作出11个点构成的散点图,

由图可知,这些点在一条直线附近,可以用线性回归模型y a bx ε=++来表示它们之间的关系.