- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
i1
a ybx
以上公式的推导较复杂,故不作推导,但它
的原理较为简单:即各点到该直线的距离的平方
和最小,这一方法叫最小. 二乘法。
17
求解线性回归问题的步骤:
1.列表( xi,yi,xi yi ),画散点图.
2.计算:
n
n
x, y, xi2, xi yi
i1
i1
3.代入公式求a,b 4.列出直线方程
Q ( y 1 b x 1 a ) 2 ( y 2 b x 2 a ) 2 . . . ( y n b x n a ) 2
取得最小值时,就称 yˆ bxa为拟合
这n对数据的线性回归方程,该方程所表
示的直线称为回归直. 线
15
.
Q(y1bx1a)2(y2bx2a)2...(ynbxna)2
1286
.
11
把b看作常数,那么Q是关于a的二次函数记为f(a)
f (a) 6a2 (140b460)a1286b2 3820b10172 6(a2 140b460 a...........) 6 6(a 70b230)2 ........... 6
当a 70b230时,f (a)取最小值 6
所以,我们用类似于估计平均数时的 思想,考虑离差的平方和
Q(a,b)(26ba20)2(18ba24)2
(13ba34)2(10ba38)2
(4ba50)2(ba64)2
1286b26a2140ab3820b460a10172
.
9
Q (a, b) 是直线 yˆ bxa与各散点
在垂直方向(纵轴方向)上的距离的平
相关关系—变量之间有一定的联 系,但不能完全的用函数来表达. 一般 来说,身高越高,体重越重,但不能用一 个函数来严格地表示身高与体重之间 的关系.(非确定性关系)
.
3
问题:举一两个现实生活中的问题,问题所涉及的
变量之间存在一定的相关关系。
例:(1)父母的身高与子女身高之间的关系
(2)商品销售收入与广告支出经费之间的关系 (3)粮食产量与施肥量之间的关系
f(b) 1286b 2 (140a 3820)b 6a 2 460a 10172
1286(b2 140a 3820 b ...........) 1286
1286(b 70a 1910 )2 ........... 1286
当 b 70a 1910 时 , f (b)取 最 小 值
相关关系与函数关系的异同点:
相同点:均是指两个变量的关系. 不同点:函数关系是一种确定的关系;
相关关系是一种非确定关系.
.
4
问题:
某小卖部为了了解热茶销售量与气温 之间的关系,随机统计并制作了某6天 卖出热茶的杯数与当天气温的对照表:
气温 /0C
26
18
13
10
4
-1
杯数 20 24 34 38 50 64
.
13
线性相关关系:
像这样能用直线方程 yˆ bxa
近似表示的相关关系叫做线性相关关系.
如果散点图中的点分布从整体 上看大致在一条直线附近我们就称 这两个变量之间具有线性相关关系
.
ห้องสมุดไป่ตู้
14
线性回归方程: 一般地,设有n个观察数据如下:
x x1 x2 x3 … xn
y y 1 y 2 y 3 … y n 当a,b使
如果某天的气温是-50C,你能根据这些 数据预测这天小卖部卖出热茶的杯数吗?
.
5
为了了解热茶销量与
气温的大致关系,我们
以横坐标x表示气温,
纵坐标y表示热茶销量,
建立直角坐标系.将表
中数据构成的6个数对
表示的点在坐标系内
标出,得到下图。今
后我们称这样的图为
散点图(scatterplot).
.
6
选择怎样的直线近似地表示热茶销量与气 温之间的关系? 我们有多种思考方案: (1)选择能反映直线变化的两个点,例如取
.
18
例题1:下表为某地近几年机动车辆数与交通 事故数的统计资料,请判断机动车辆数与交 通事故数之间是否具有线性相关关系,求出 线性回归方程;如果不具有线性相关关系,说明 理由.
的点,应使得该直线与散点图中的点最接近
那么,怎样衡量直线 yˆ bxa 与图中六
个点的接近程度yˆ 呢?
我们将表中给出的自变量 x 的六个值
代入直线方程,得到相应的六个值:
2 6 b a , 1 8 b a , 1 3 b a , 1 0 b a , 4 b a , b a
它们与表中相应的实际. 值应该越接近越好8.
线性回归方程
.
1
问题引入:
有些教师常说:“如果你的数学成绩好,那 么你的物理学习就不会有什么大问题” 按照这种 说法,似乎学生的物理成绩与数学成绩之间也存 在着某种关系。你如何认识它们之间存在的关系?
数学成绩
物理成绩
学习兴趣
学习时间
其他因素
结论:变量之间除了函数关.系外,还有
。2
变量之间的关系
函数关系---变量之间是一种确定 性的关系.如:圆的面积S和半径r之间 的关系.
.
12
当
b a
70a 1
70b
1910 286 230 6
时
,
Q(
a
,
b
)
取
最
小
值
解
得
b
a
1 .6 4 7 7 5 7 .5 5 6 8
,
所 求 直 线 方 程 为 yˆ 1 .6 4 7 7 x 5 7 .5 5 6 8
当 x 5时 , yˆ 6 6
故 当 气 温 为 50C时 , 热 茶 销 量 约 为66杯 。
方和,可以用来衡量直线 yˆ bxa
与图中六个点的接近程度,所以,设法
取 a , b 的值,使 Q (a, b) 达到最小值.
这种方法叫做最小平方法(又称最小 二乘法) .
.
10
Q(a,b)
1286b2 6a2 140ab 3820b 460a 10172
把 a看 作 常 数 , 那 么 Q是 关 于 b的 二 次 函 数 记 为 f(b)
(4,50),(18,24)这两点的直线;
(2)取一条直线,使得位于该直线一侧和 另一侧的点的个数基本相同;
(3)多取几组点,确定几条直线方程,再分 别算出各条直线斜率、截距的平均值,作为 所求直线的斜率、截距;
………………
怎样的直线最好呢? .
7
建构数学
1.最小二乘法:
用方程为 yˆ bxa的直线拟合散点图中
n
n
n
n
n
yi22b xiyi2a yi b2 xi22ab xina2
i1
i1
i1
i1
i1
.
16
类似地,我们可以推得,求回归
方程 yˆ bxa 中系数a,b的一般公式:
n
n
xi yi nxy (xi x)(yi y)
b
i1 n
xi2
2
nx
i1
n
(xi x)2
,
i1