高中数学第一章统计1.8最小二乘法教案北师大版必修3
- 格式:doc
- 大小:212.50 KB
- 文档页数:4
学案 必修三 第一章第八节 最小二乘法一、学习目标1.掌握最小二乘法的思想2.能根据给出的线性回归方程系数公式建立线性回归方程 二、重点、难点重点:最小二乘法的思想难点:线性回归方程系数公式的应用 三、课前预习1、用什么样的线性关系刻画会更好一些?2、用什么样的方法刻画点与直线的距离会方便有效?3、怎样刻画多个点与直线的接近程度?4、怎样使()[]()[]()[]2222211n n bx a y bx a y bx a y +-+++-++- 达到最小值?5.求回归直线方程的思想方法观察散点图的特征,发现各点大致分布在一条直线的附近,思考:类似图中的直线可画几条?四、堂中互动【教师点拨】求线性回归方程,通常是用计算器来完成的.在有的计算器中,可通过直接按键的得出线性回归方程的系数.如果用一般的科学计算器进行计算,则要先列出相应的表格,有了表格中的那些相关数据,线性回归方程中的系数也就很容易求出来了.(另:线性回归方程^y a bx =+中,1221,ni ii nii x y nxyb a y bx xnx==-==--∑∑)例1 在上一节练习中,从散点图可以看出,某小卖部6天卖出热茶的杯数(y )与当天气温(x )之间是线性相关的。
数据如下表(1) 试用最小二乘法求出线性回归方程。
(2) 如果某天的气温是-3 oC ,请预测可能会卖出热茶多少杯。
点评:了解最小二乘法的概念,熟记求线性回归方程公式.五、即学即练1.正常情况下,年龄在18岁到38岁的人们,体重y (kg )依身高x (cm )的回归方程为y=0.72x-58.5。
张红红同学不胖不瘦,身高1米78,他的体重应在 kg 左右。
2.已知x ,y 之间的一组数据如下表,则y 与x 的线性回归方程y=a+bx 必经过点( )3.某连锁经营公司所属5个零售店某月的销售额和利润额资料如下表:(1) 画出销售额和利润额的散点图;(2) 若销售额和利润额具有相关关系,计算利润额y 对销售额x 的回归直线方程。
2019-2020年高中数学第一章统计最小二乘估计第一课时教案北师大版必修3教学目标:1、掌握最小二乘法的思想2、能根据给出的线性回归方程系数公式建立线性回归方程 教学重点:最小二乘法的思想教学难点:线性回归方程系数公式的应用 教学过程回顾:上节课我们讨论了人的身高与右手一拃长之间的线性关系,用了很多种方法来刻画这种线性关系,但是这些方法都缺少数学思想依据。
问题1、用什么样的线性关系刻画会更好一些?想法:保证这条直线与所有点都近(也就是距离最小)。
最小二乘法就是基于这种想法。
问题2、用什么样的方法刻画点与直线的距离会方便有效?设直线方程为y=a+bx ,样本点A (x i ,y i ) 方法一、点到直线的距离公式 方法二、显然方法二能有效地表示点A 与直线y=a+bx 的距离,而且比方法一更方便计算,所以我们用它来表示二者之间的接近程度。
问题3、怎样刻画多个点与直线的接近程度?例如有5个样本点,其坐标分别为(x 1,y 1),(x 2,y 2),(x 3,y 3),(x 4,y 4),(x 5,y 5)与直线y=a+bx 的接近程度:()[]()[]()[]()[]()[]255244233222211bx a y bx a y bx a y bx a y bx a y +-++-++-++-++- 从而我们可以推广到n 个样本点:(x 1,y 1),(x 2,y 2),…(x n ,y n )与直线y=a+bx 的接近程度:()[]()[]()[]2222211n n bx a y bx a y bx a y +-+++-++-使得上式达到最小值的直线y=a+bx 就是我们所要求的直线,这种方法称为最小二乘法 问题4、怎样使()[]()[]()[]2222211n n bx a y bx a y bx a y +-+++-++- 达到最小值?先来讨论3个样本点的情况设有3个点(x 1,y 1),(x 2,y 2),(x 3,y 3),则由最小二乘法可知直线y=a+bx 与这3个点的接近程度由下面表达式刻画:()[]()[]()[]233222211bx a y bx a y bx a y +-++-++-…………………①整理成为关于a 的一元二次函数,如下所示:()()()[]()()()233222211332211223bx y bx y bx y bx y bx y bx y a a )a (f -+-+-+-+-+--=()[]()()()233222211223bx y bx y bx y x b y a a -+-+-+--=利用配方法可得()[]()()()()2233222211233x b y bx y bx y bx yxb y a )a (f ---+-+-+--=从而当时,使得函数达到最小值。
2021年高中数学第一章统计最小二乘估计第二课时教案北师大版必修3一、教学目标:经历用不同估算方法描述两个变量线性相关的过程。
知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。
二、教学重难点:重点:了解最小二乘法的思想并利用此思想借助电子表格求出回归方程。
教学内容的难点:对最小二乘法的数学思想和回归方程的理解教学实施过程中的难点:根据给出的线性回归方程的系数公式建立线性回归方程。
三、教学方法:动手操作,合作交流。
四、教学过程:(一)、利用最小二乘法推导回归系数公式。
回顾上节课:师:我们现在来求距离和。
怎么求?生:利用点到直线的距离公式师生共同:只要求出使距离和最小的、b即可。
但是,我们知道点到直线的距离公式计算复杂。
怎么办呢?以样本数据点A为例,可以看出:按照一对一的关系,直角边AC越小,斜边AB越小,当AC无限小时,AB跟AC可近似看作相等。
求麻烦,不妨求生: 师:它表示自变量x 取值一定时,纵坐标的偏差。
假设我们已经得到两个具有线性相关关系的变量的一组数据:……。
当自变量取(=1,2,……,n )时,可以得到(=1,2,……,n ),它与实际收集到的之间的偏差是(=1,2,……,n )这样用n 个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的。
总的偏差为,偏差有正有负,易抵消,所以采用绝对值,由于带绝对值计算不方便所以换成平方,222221122331ˆ()()()()()ni i n n i Q y yy bx a y bx a y bx a y bx a ==-=--+--+--+⋅⋅⋅+--∑现在的问题就归结为:当,b 取什么值时Q 最小。
将上式展开、再合并,就可以得到可以求出Q 取最小值时1122211()()()nnii ii i i nn iii i xx y y xy n x yb xx xn xa yb x====---==--=-∑∑∑∑(其中,)推导过程用到偏差的平方,由于平方又叫二乘方,所以这种使“偏差的和”最小的方法叫“最小二乘法”。
1 1.8最小二乘估计 本节教材分析 一、三维目标 1、知识与技能 (1) 掌握最小二乘法的思想; (2) 能根据给出的线性回归方程系数公式建立线性回归方程. 2、过程与方法 本节的学习,应该让学生通过实际问题去理解回归分析的必要性,明确回归分析的基本思想,从散点图中点的分布上我们发现直接求回归直线方程存在明显的不足,从中引导学生去发现解决问题的新思路—进行回归分析,进而介绍残差分析的方法和利用R的平方来表示解释变量对于预报变量变化的贡献率,从中选择较为合理的回归方程,最后是建立回归模型基本步骤. 3、情感态度与价值观 通过本节课的学习,首先让显示了解回归分析的必要性和回归分析的基本思想,明确回归分析的基本方法和基本步骤,培养我们利用整体的观点和互相联系的观点,来分析问题,进一步加强数学的应用意识,培养学生学好数学、用好数学的信心.加强与现实生活的联系,以科学的态度评价两个变量的相关系.教学中适当地增加学生合作与交流的机会,多从实际生活中找出例子,使学生在学习的同时.体会与他人合作的重要性,理解处理问题的方法与结论的联系,形成实事求是的严谨的治学态度和锲而不舍的求学精神.培养学生运用所学知识,解决实际问题的能力. 二、教学重点:最小二乘法的思想及线性回归方程系数公式的应用 三、教学难点:线性回归方程系数公式的应用 四、教学建议 最小二乘法的思想在理论上和实际应用中都是非常重要的.本节一开始从上一节课讨论的问题切入,提出用什么样的线性关系刻画会得到更好的问题,引发学生进行思考.教学时,学生可能会想到用点到直线的距离来进行刻画,教师可进行引导,这样做从想法上是非常直观与直接的,但是最主要的问题是处理上远远没有用最小二乘法的思想来得简单. 进而,教科书介绍了最小二乘法估计的思想.教学时,教师要讲清楚最小二乘法所考察的距离与点到直线的距离的区别,以免产生误解与错误. 新课导入设计 导入一 某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对照表: 气温/℃ 26 18 13 10 4 -1
杯数 20 24 34 38 50 64 如果某天的气温是-5 ℃,你能根据这些数据预测这天小卖部卖出热茶的杯数吗?为解决这个问题我们接着学习两个变量的线性相关——回归直线及其方程. 导入二 我们知道函数能很好的表示两个变量之间的关系,那么两个线性相关的变量之间的关系,我们可不可以用函数来刻画呢?
教学过程 一、问题情境 1.情境: 客观事物是相互联系的过去研究的大多数是因果关系,但实际上更多存在的是一种非 2
因果关系比如说:某某同学的数学成绩与物理成绩,彼此是互相联系的,但不能认为数学是“因”,物理是“果”,或者反过来说事实上数学和物理成绩都是“果”,而真正的“因”是学生的理科学习能力和努力程度所以说,函数关系存在着一种确定性关系但还存在着另一种非确定性关系——相关关系 2.问题: 某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对照表:
气温/0C 26 18 13 10 4 1
杯数 20 24 34 38 50 64 如果某天的气温是50C,你能根据这些数据预测这天小卖部卖出热茶的杯数吗? 二、学生活动 为了了解热茶销量与气温的大致关系,我们以横坐标x表示气温,纵坐标y表示热茶销量,建立直角坐标系,将表中数据构成的6个数对所表示的点在坐标系内标出,得到下图,今后我们称这样的图为散点图(scatterplot). 从右图可以看出.这些点散布在一条直线的附近,故可用一个线性函数近似地表示热茶销量与气温之间的关系. 选择怎样的直线近似地表示热茶销量与气温之间的关系? 我们有多种思考方案: (1)选择能反映直线变化的两个点,例如取(4,50),(18,24)这两点的直线; (2)取一条直线,使得位于该直线一侧和另一侧的点的个数基本相同; (3)多取几组点,确定几条直线方程,再分别算出各条直线斜率、截距的平均值,作为所求直线的斜率、截距; 怎样的直线最好呢? 三、建构数学 1.最小二乘法: 用方程为ˆybxa的直线拟合散点图中的点,应使得该直线与散点图中的点最接近。那么,怎样衡量直线ˆybxa与图中六个点的接近程度呢? 我们将表中给出的自变量x的六个值带入直线方程,得到相应的六个ˆy的值: 26,18,13,10,4,babababababa.这六个值与表中相应的实际值应该越接近越好.所以,我们用类似于估计平均数时的思想,考虑离差的平方和 2222
2222
(,)(2620)(1824)(1334)(1038)(450)(64)12866140382046010172Qabbababababababaabba (,)Qab是直线ˆybxa与各散点在垂直方向(纵轴方向)上的距离的平方和,可以用来衡量直线ˆybxa与图中六个点的接近程度,所以,设法取,ab的值,使(,)Qab达到最小值.这种方法叫做最小二乘法 (又称最小平方法) .
先把a看作常数,那么Q是关于b的二次函数.易知,当140382021286ab时, Q取得
最小值.同理, 把b看作常数,那么Q是关于a的二次函数.当14046012ba时, Q取得
最小值.因此,当14038202128614046012abba时,Q取的最小值,由此解得1.6477,57.5568ba.所求直线方程为ˆ1.647757.5568yx.当5x时,ˆ66y,故当气温为50C时,热 3
茶销量约为66杯. 2.线性相关关系: 像能用直线方程ˆybxa近似表示的相关关系叫做线性相关关系. 3.线性回归方程: 一般地,设有n个观察数据如下: x 1x
2x
3x „ nx
y 1y 2y
3y „ ny
当,ab使2221122()()...()nnQybxaybxaybxa取得最小值时,就称ˆybxa
为拟合这n对数据的线性回归方程,该方程所表示的直线称为回归直线.
上述式子展开后,是一个关于,ab的二次多项式,应用配方法,可求出使Q为最小值时的,ab的值.即
1112211()()()nnniiiiiiinniiiinxyxybnxxaybx
,(*) niixnx11, niiyny11
四、数学运用 1.例题: 例1. 下表为某地近几年机动车辆数与交通事故数的统计资料,请判断机动车辆数与交通事故数之间是否有线性相关关系,如果具有线性相关关系,求出线性回归方程;如果不具有线性相关关系,说明理由. 机动车辆数x/千台 95 110 112 120 129 135 150 180 交通事故数y/千件 6.2 7.5 7.7 8.5 8.7 9.8 10.2 13
解:在直角坐标系中画出数据的散点图,直观判断散点在一条直线附近,故具有线性相关关系.计算相应的数据之和: 88882
11111031,71.6,137835,9611.7iiiiiiiiixyxxy
,
将它们代入()式计算得0.0774,1.0241ba, 所以,所求线性回归方程为0.07741.0241yx. 2.练习: (1)下列两个变量之间的关系哪个不是函数关系( D ) A.角度和它的余弦值 B.正方形边长和面积 C.正n边形的边数和它的内角和 D.人的年龄和身高 (2)给出施化肥量对水稻产量影响的试验数据: 施化肥量x 15 20 25 30 35 40 45 水稻产量y 330 345 365 405 445 450 455 (1)画出上表的散点图;(2)求出回归直线并且画出图形 解:(1)散点图(略). (2)表中的数据进行具体计算,列成以下表格 i 1 2 3 4 5 6 7 xi 15 20 25 30 35 40 45 yi 330 345 365 405 445 450 455 xiyi 4950 6900 9125 12150 15575 18000 20475
3.399,30yx,777221117000,1132725,87175iiiiiiixyxy 4
故可得到 2573075.43.399,75.430770003.399307871752ab 从而得回归直线方程是^4.75257yx.(图形略) 五、回顾小结: 1.对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数,ab
的计算公式,算出,ab.由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误.求线性回归方程的步骤:计算平均数yx,;计算iiyx与的积,求iiyx;计算2ix;将结果代入公式求a;用 xayb求b;写出回归方程