最小二乘估计
教学目标:1、掌握最小二乘法的思想
2、能根据给出的线性回归方程系数公式建立线性回归方程 教学重点:最小二乘法的思想
教学难点:线性回归方程系数公式的应用 教学过程
回顾:上节课我们讨论了人的身高与右手一拃长之间的线性关系,用了很多种方法来刻画这种线性关系,但是这些方法都缺少数学思想依据。 问题1、用什么样的线性关系刻画会更好一些?
想法:保证这条直线与所有点都近(也就是距离最小)。 最小二乘法就是基于这种想法。
问题2、用什么样的方法刻画点与直线的距离会方便有效?
设直线方程为y=a+bx ,样本点A (x i ,y i ) 方法一、点到直线的距离公式 1
2++-=b a
y bx d i i
方法二、()[]2
i
i
bx a y +-
显然方法二能有效地表示点A 与直线y=a+bx 的距离,而且比方法一更方便计算,所以我们用它来表示二者之间的接近程度。 问题3、怎样刻画多个点与直线的接近程度?
例如有5个样本点,其坐标分别为(x 1,y 1),(x 2,y 2),(x 3,y 3),(x 4,y 4),(x 5,y 5)与直线y=a+bx 的接近程度:
()[]()[]()[]()[]()[]
2
552
442
332
22
2
1
1
bx a y bx a y bx a y bx a y
bx a y +-++-++-++-++- 从而我们可以推广到n 个样本点:(x 1,y 1),(x 2,y 2),…(x n ,y n )与直线y=a+bx 的接近程度:
()[]()[]()[]2
2
22
2
1
1
n n bx a y bx a y
bx a y +-+++-++-
使得上式达到最小值的直线y=a+bx 就是我们所要求的直线,这种方法称为最小二乘法
问题4、怎样使()[]()[]()[]2
2
222
11n n bx a y bx a y bx a y +-+++-++- 达到
最小值?
先来讨论3个样本点的情况
设有3个点(x 1,y 1),(x 2,y 2),(x 3,y 3),则由最小二乘法可知直线y=a+bx 与这3个点的接近程度由下面表达式刻画:
()[]()[]()[]2
3
3
2
2
2
2
1
1
bx a y bx a y bx a y +-++-++-…………………①
整理成为关于a 的一元二次函数)a (f ,如下所示:
()()()[]()()()2
332
222
11332211223bx y bx y bx y bx y bx y bx y a a )a (f -+-+-+-+-+--=
()[]
()()()2
332
222
11223bx y bx y bx y x b y a a -+-+-+--=
利用配方法可得
()[]()()()()
2
2
332
222
11
2
33x b y bx y bx y bx y
x
b y a )a (f ---+-+-+--= 从而当x b y a -=时,使得函数)a (f 达到最小值。 将x b y a -=代入①式,整理成为关于b 的一元二次函数()b g
,
(
)()()[]
--+-+-=22
32
22
1b x x x x x x )b (g
()()()()()()[]
+--+--+--y y x x y y x x y y x x b 33
21
2
1
1
2
()()()[]2
3
2221y y y y y y -+-+-
同样使用配方法可以得到,当
()(
)()()()()()()()
2
3
2
2
2
1
332211
x x x x x x y
y x x y y x x y y x x b -+-+---+--+--=
2
2
32
22
133221133x
x x x xy y x y x y x -++-++=
时,使得函数()b g
达到最小值。
从而得到直线y=a+bx 的系数a ,b ,且称直线y=a+bx 为这3个样本点的线性回归方程。
用同样的方法我们可以推导出n 个点的线性回归方程的系数:
2
2
2
22
12211x
n x x x xy n y x y x y x b n n n -+++-+++=
∑∑==--=
n
i i
n
i i
i
x
n x xy
n y x 1
2
2
1
x b y a -=
其中n
y y y y ,n x x x x
n
n +++=+++=
21
21 由x b y a -=我们知道线性回归直线y=a+bx 一定过()y ,x 。
例题与练习
例1 在上一节练习中,从散点图可以看出,某小卖部6天卖出热茶的杯数(y )与当天气温(x )之间是线性相关的。数据如下表
(1)试用最小二乘法求出线性回归方程。
(2)如果某天的气温是-3 o C ,请预测可能会卖出热茶多少杯。 解:(1)先画出其散点图
可以求得
557576481.a ,.b ≈-≈
则线性回归方程为
y =57.557-1.648x
(2)当某天的气温是-3 o C 时,卖出热茶的杯数估计为:
()63501623648155757≈=-?-...
练习1 已知x ,y 之间的一组数据如下表,则y 与x 的线性回归方程y=a+bx 必经过点 ( D )
(A)(2,2)(B)(1.5,0)(C)(1,2)(D)(1.5,4)
线性回归方程为:x ..y 5040+=
小结
1、 最小二乘法的思想
2、 线性回归方程的系数:
2
2
2
22
12211x
n x x x xy n y x y x y x b n n n -+++-+++=
∑∑==--=
n
i i
n
i i
i
x
n x xy
n y x 1
2
2
1
x b y a -=
作业:P60 习题1-8 第1题