最小二乘估计量教学文稿
- 格式:ppt
- 大小:213.00 KB
- 文档页数:5
§8最小二乘估计整体设计教学分析教科书通过思考交流引入了最小二乘法,进一步提出了线性回归方程,在探索用多种方法确定线性回归直线的过程中,向学生展示创造性思维的过程,帮助学生理解最小二乘法的思想.通过气温与饮料销售量的例子及随后的思考,使同学们了解利用线性回归方程解决实际问题的全过程,体会线性回归方程作出的预测结果的随机性和并且可能犯的错误.进一步,教师可以利用计算机模拟和多媒体技术,直观形象地展示预测结果的随机性和规律性.三维目标经历用不同估算方法描述两个变量线性相关的过程.了解最小二乘法的思想,能根据给出的线性回归方程的系数公式建立线性回归方程.重点难点教学重点:求线性回归方程,以及线性回归分析.教学难点:确定线性回归系数.课时安排1课时教学过程导入新课思路 1.客观事物是相互联系的,过去研究的大多数是因果关系,但实际上更多存在的是一种非因果关系.比如说:某某同学的数学成绩与物理成绩,彼此是互相联系的,但不能认为数学是“因”,物理是“果”,或者反过来说.事实上,数学成绩和物理成绩都是“果”,而真正的“因”是学生的理科学习能力和努力程度.所以说,函数关系存在着一种确定性关系,但还存在着另一种非确定性关系——相关关系.为表示这种相关关系,我们接着学习两个变量的线性相关——回归直线及其方程.思路2.某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖决这个问题,我们接着学习两个变量的线性相关——回归直线及其方程.推进新课新知探究提出问题1.画散点图的步骤是什么?2.正、负相关的概念是什么?3.什么是线性相关?4.观察下面人体的脂肪含量百分比和年龄的散点图,当人的年龄增加时,体内脂肪含量到底是以什么方式增加的呢?图15.什么叫作回归直线?6.如何求回归直线的方程?什么是最小二乘法?7.利用计算机如何求线性回归方程?活动:学生回顾,再思考或讨论,教师及时提示指导.讨论结果:1.建立相应的平面直角坐标系,将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫作散点图.2.如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.3.如果所有的样本点都落在某一直线附近,变量之间就有线性相关的关系.4.大体上来看,随着年龄的增加,人体中脂肪含量的百分比也在增加,呈正相关的趋势,我们可以从散点图上来进一步分析.5.从散点图上可以看出,这些点大致分布在通过散点图中心的一条直线附近.如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫作回归直线.如果能够求出这条回归直线的方程(简称回归方程),那么我们就可以比较清楚地了解年龄与体内脂肪含量的相关性.就像平均数可以作为一个变量的数据的代表一样,这条直线可以作为两个变量具有线性相关关系的代表.6.从散点图上可以发现,人体的脂肪含量百分比和年龄的对应点,大致分布在通过散点图中心的一条直线附近.那么,我们应当如何具体求出这个回归方程呢?有的同学可能会想,我可以采用测量的方法,先画出一条直线,测量出各点与它的距离,然后移动直线,到达一个使距离的和最小的位置,测量出此时直线的斜率和截距,就可得到回归方程了.但是,这样做可靠吗?有的同学可能还会想,在图中选择这样的两点画直线,使得直线两侧的点的个数基本相同.同样地,这样做能保证各点与此直线在整体上是最接近的吗?还有的同学会想,在散点图中多取几组点,确定出几条直线的方程,再分别求出各条直线的斜率、截距的平均数,将这两个平均数当成回归方程的斜率和截距.同学们不妨去实践一下,看看这些方法是不是真的可行?(学生讨论:1.选择能反映直线变化的两个点.2.在图中放上一根细绳,使得上面和下面点的个数相同或基本相同.3.多取几组点对,确定几条直线方程.再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距.)教师:分别分析各方法的可靠性.如图2、图3、图4:图2 图3图4上面这些方法虽然有一定的道理,但总让人感到可靠性不强.实际上,求回归方程的关键是如何用数学的方法来刻画“从整体上看,各点与此直线的距离最小”.人们经过长期的实践与研究,已经得出了计算回归方程的斜率与截距的一般公式⎩⎨⎧ b =x 1y 1+x 2y 2+…+x n y n -n x y x 21+x 22+…+x 2n -n x 2,a =y -b x .其中,x =x 1+x 2+…+x n n ,y =y 1+y 2+…+y n n . ①这样得到的直线方程y =a +bx 称为线性回归方程,a ,b 是线性回归方程的系数. 推导以上公式的计算比较复杂,这里不作推导.但是,我们可以解释一下得出它的原理. 假设我们已经得到两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),且所求回归方程是y =a +bx ,其中a ,b 是待定参数.当变量x 取x i (i =1,2,…,n )时可以得到y =a +bx i (i =1,2,…,n ),它与实际收集到的y i 之间的偏差是y i -y =y i -(a +bx i )(i =1,2,…,n ).图5这样,用这n 个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的.由于(y i-y )可正可负,为了避免相互抵消,可以考虑用∑i =1n|y i -y |来代替,但由于它含有绝对值,运算不太方便,所以改用Q =(y 1-bx 1-a )2+(y 2-bx 2-a )2+…+(y n -bx n -a )2②来刻画n 个点与回归直线在整体上的偏差.这样,问题就归结为:当a ,b 取什么值时Q 最小,即总体偏差最小.经过数学上求最小值的运算,a ,b 的值由公式①给出.通过求②式的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫作最小二乘法(method of least square).7.见课本本节信息技术应用中利用计算机求线性回归方程的具体操作步骤.应用示例思路1在上一节练习中,从散点图可以看出,某小卖部6天卖出热茶的杯数(y )与当天气温(x )(2)如果某天的气温是-3 ℃,请预测这天可能会卖出热茶多少杯.解:(1)作出上述数据的散点图,如图6.从散点图中可以看出,表中的两个变量是线性相关的.图6先列表求出x =35,y =115,其他数据如下表:进而,可以求得b =1 910-6×3×31 286-6×353×353≈-1.648, a ≈57.557.于是,线性回归方程为y =57.557-1.648x .(2)由上面的最小二乘法估计得出的线性回归方程知,当某天的气温是-3 ℃时,卖出热茶的杯数估计为57.557-1.648×(-3)=62.501≈63.变式训练系,请说明理由;(2)如果具有线性相关关系,求出线性回归方程.解:(1)在直角坐标系中画出数据的散点图,如图7.图7直观判断散点在一条直线附近,故具有线性相关关系.(2)计算得b≈0.077 4,a=-1.024 1,故所求线性回归方程为y=-1.024 1+0.077 4x.思路2(2)求出回归直线的方程.解:(1)画出的散点图如图8.图8(2)计算得b≈4.75,a≈257.从而得所求回归直线方程是y=257+4.75x.变式训练1.一个车间为了规定工时定额,需要确定加工零件所花费的时间.为此进行了10次试验,请判断y与x是否具有线性相关关系,如果y与x具有线性相关关系,求线性回归方程.解:在直角坐标系中画出数据的散点图,如图9.图9直观判断散点在一条直线附近,故具有线性相关关系.由测得的数据表可知:b≈0.668,a=y-b x≈54.96.因此,所求线性回归方程为y=a+bx=54.96+0.668x.(2)求出回归直线的方程.解:(1)画出的散点图如图10.图10(2)x=110(45+42+46+48+42+35+58+40+39+50)=44.50,y=110(6.53+6.30+9.52+7.50+6.99+5.90+9.49+6.20+6.55+8.72)=7.37.设回归直线方程为y=a+bx,则b=0.175,a=y-b x=-0.418,故所求回归直线的方程为y=-0.418+0.175x.点评:对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数a,b的计算公式,算出a,b.由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误,求线性回归方程的步骤:计算平均数x,y;计算x i与y i的积,求∑x i y i;计算∑x2i;将结果代入公式求b;用a=y-b x求a;写出回归直线方程. 知能训练1.下列两个变量之间的关系哪个不是函数关系( ).A.角度和它的余弦值B.正方形边长和面积C.正n边形的边数和它的内角和D.人的年龄和身高答案:D2.三点(3,10),(7,20),(11,24)的线性回归方程是( ).A.y=5.75-1.75x B.y=1.75+5.75xC.y=1.75-5.75x D.y=5.75+1.75x答案:D3(1)线性回归方程y=a+bx的回归系数a,b;(2)估计使用年限为10年时,维修费用是多少?答案:(1)b=1.23,a=0.08;(2)12.38.4.我们考虑两个表示变量x与y之间的关系的模型,δ为误差项,模型如下:模型1:y=6+4x;模型2:y=6+4x+e.(1)如果x=3,e=1,分别求两个模型中y的值;(2)分别说明以上两个模型是确定性模型还是随机模型.解:(1)模型1:y=6+4x=6+4×3=18;模型2:y=6+4x+e=6+4×3+1=19.(2)模型1中相同的x值一定得到相同的y值,所以是确定性模型;模型2中相同的x 值,因δ的不同,所得y值不一定相同,且δ为误差项是随机的,所以模型2是随机模型.5(2)用最小二乘法估计求线性回归方程;(3)计算此时Q(a,b)和Q(2,0.2)的值,并作比较.图11解:(1)画出的散点图如图11.(2)计算得b≈0.196 2,a≈1.816 6,因此所求线性回归方程为y=1.816 6+0.196 2x.(3)Q(1.816 6,0.196 2)≈5.171,Q(2,0.2)≈7.0,由此可知,求得的a=1.816 6,b =0.916 2是函数Q(a,b)取最小值的a,b值.拓展提升某调查者从调查中获知某公司近年来科研费用支出(X i)与公司所获得利润(Y i)的统计资料如下表:i i解:设线性回归模型直线方程为Y i=β0+β1X i,因为X=∑X in=306=5,Y=∑Y in=1806=30,求解参数β0,β1的估计值为β1=2,β0=20,所以利润(Y i)对科研费用支出(X i)的线性回归模型直线方程为Y i=20+2X i.课堂小结1.求线性回归方程.2.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.作业习题1—8 2,3.设计感想本节课在上节课的基础上,利用实例分析了散点图的分布规律,推导出了线性回归直线的方程的求法,并利用回归直线的方程估计可能的结果,本节课讲得较为详细,实例较多,便于同学们分析比较.思路1和思路2的例题对知识进行了巩固和加强,另外,本节课通过选取一些学生特别关心的身边事例,对学生进行思想情操教育、意志教育和增强学生的自信心,以使其养成良好的学习态度.备课资料相关关系的强与弱我们知道,两个变量x ,y 正(负)相关时,它们就有相同(反)的变化趋势,即当x 由小变大时,相应的y 有由小(大)变大(小)的趋势,因此可以用回归直线来描述这种关系.与此相关的一个问题是:如何描述x 和y 之间的这种线性关系的强弱?例如,物理成绩与数学成绩正相关,但数学成绩能够在多大程度上决定物理成绩?这就是相关强弱的问题,类似的还有吸烟与健康的负相关强度、父母身高与子女身高的正相关强度、农作物的产量与施肥量的正相关强度等.统计中用相关系数r 来衡量两个变量之间线性关系的强弱.若相应于变量x 的取值x i ,变量y 的观测值为y i (1≤i ≤n ),则两个变量的相关系数的计算公式为r =∑i =1n x i -xy i -y ∑i =1n x i -x2∑i =1ny i -y 2. 不相同的相关性可以从散点图上直观地反映出来.图12(1)反映了变量x ,y 之间很强的线性相关关系,而图12(2)中的两个变量的线性相关程度相对较弱.对于相关系数r ,首先值得注意的是它的符号.当r 为正时,表明变量x ,y 正相关;当r 为负时,表明变量x ,y 负相关.反映在散点图上,图12(1)中的变量x ,y 正相关,这时的r 为正;图12(2)中的变量x ,y 负相关,这时的r 为负.另一个值得注意的是r 的大小.统计学认为,对于变量x ,y ,如果r ∈[-1,-0.75],那么负相关很强;如果r ∈[0.75,1],那么正相关很强;如果r ∈(-0.75,-0.30]或r ∈[0.30,0.75),那么相关性一般;如果r ∈[-0.25,0.25],那么相关性较弱.反映在散点图上,图12(1)的r =0.97,这些点有明显的从左下角到右上角沿直线分布趋势,这时用线性回归模型描述两个变量之间的关系效果很好;图12(2)的r =-0.85,这些点也有明显的从左上角到右下角沿直线分布趋势.这时用线性回归模型描述两个变量之间的关系也有好的效果.(1) (2)图12你能试着对自己身边的某个问题,确定两个变量,通过收集数据,计算相关系数,然后分析一下能否用线性回归模型来拟合它们之间的关系吗?(设计者:张云芳)11。
2017-2018学年高中数学第一章统计8 最小二乘估计教学案北师大版必修3编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2017-2018学年高中数学第一章统计 8 最小二乘估计教学案北师大版必修3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2017-2018学年高中数学第一章统计 8 最小二乘估计教学案北师大版必修3的全部内容。
8 最小二乘估计预习课本P46~51,思考并完成以下问题(1)什么是散点图?(2)曲线拟合的定义是什么?(3)具备什么特征的两个变量是线性相关的?(4)具备什么特征的两个变量是非线性相关的?(5)具备什么特征的两个变量是不相关的?错误!1.散点图在考虑两个变量的关系时,为了对变量之间的关系有一个大致的了解,通常将变量所对应的点描出来,这些点就组成了两个变量之间的一个图,通常称这种图为变量之间的散点图.2.相关关系(1)曲线拟合:从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样的近似过程称为曲线拟合.(2)线性相关和非线性相关:若两个变量x和y的散点图中,所有点看上去都在一条直线附近波动,则称这两个变量是线性相关的,而若所有点看上去在某条曲线(不是一条直线)附近波动,则称此相关为非线性相关.(3)不相关:如果所有点在散点图中没有显示任何关系,则称变量间是不相关的.[点睛]两个变量具有相关关系和两个变量之间是函数关系是不同的.错误!1.判断正误.(正确的打“√",错误的打“×")(1)变量之间只有函数关系,不存在相关关系.( )(2)两个变量之间产生相关关系的原因受许多不确定的随机因素的影响.( )(3)需要通过样本来判断变量之间是否存在不同关系.( )(4)相关关系是一种因果关系,具有确定性.( )答案:(1)× (2)√ (3)√(4)×2.观察下列各图形:其中两个变量x,y具有相关关系的是( )A.①②B.①④C.③④ﻩD.②③解析:选C 由图可知,③中各点分布在某条直线周围,④中各点分布在某条曲线周围,因此③④中的两个变量具有相关关系.3.命题:①路程与时间、速度的关系是相关关系;②同一物体的加速度与作用力是函数关系;③产品的成本与产量之间的关系是函数关系;④圆的周长与面积的关系是相关关系;⑤广告费用与销售量之间的关系是相关关系.其中,正确的命题序号是________.答案:②⑤相关关系的概念[典例]①正方体的表面积与棱长之间的关系;②一块农田的水稻产量与施肥量之间的关系;③家庭的收入与支出之间的关系;④某户家庭用电量与水费之间的关系.其中是相关关系的为( )A.①②ﻩ B.③④C.②④ﻩD.②③[解析]①正方体的表面积与棱长之间的关系是确定的函数关系;④某户家庭用电量与水费之间无任何关系.②③中,都是非确定的关系,但自变量取值一定时,因变量的取值带有一定的随机性.[答案] D利用变量间相关关系的概念判断量与量之间的关系时,一般是看当一个变量的值一定时,另一个变量是否带有确定性,两个变量之间的关系具有确定关系——函数关系;两个变量之间的关系具有随机性、不确定性——相关关系.[活学活用]1.下列变量之间的关系不是相关关系的是( )A.已知二次函数y=ax2+bx+c,其中a,c是已知常数,取b为自变量,因变量是这个函数的判别式Δ=b2-4acB.光照时间和果树亩产量C.某种农作物的亩产量与施肥量D.父母身高和子女身高的关系解析:选AB、C、D均为相关关系,A为函数关系.2.有下列关系:①人的寿命与他(她)每天坐着的时间之间的关系;②曲线上的点与该点关于原点的对称点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其断面直径与高度之间的关系.其中,具有相关关系的是________.解析:利用相关关系的概念进行判断,②中两变量的关系是一种确定性关系.答案:①③④散点图[典例] y(单位:万元)之间有如下的统计数据:x2345y18273235(1)请画出上表数据的散点图;(2)观察散点图,判断y与x是否具有线性相关关系.[解] (1)散点图如下:(2)由图知,所有数据点接近直线排列,因此认为y与x有线性相关关系.判断两个变量具有相关关系的方法(1)根据直观感觉判断,这时要用到已有的知识或生活、学习中的经验等.(2)根据散点图判断,这时要由两个变量相应值的对应关系,作出散点图,通过观察散点图中变量的对应点是否分布在某条曲线的周围判定这两个变量是否具有相关关系. [活学活用]两对变量A和B,C和D的取值分别对应如表1和表2,画出散点图,判断它们是否有相关关系;若具有相关关系,说出它们相关关系的区别.表1A261813104-1B202434385064表2C05101520253035D541.67602.66672。
《最小二乘估计》◆教材分析教材通过思考交流引入了最小二乘估计,进一步提出了线性回归方程。
教材再探索用多种方法确定线性回归直线的过程中,向学生展示创造性思维的过程,帮助学生理解最小二乘法的思想,通过实例使学生了解利用线性回归方程解决实际问题的全过程,体会线性回归方程作出的预测结果的随机性,并且可能犯的错误。
进一步的,教师可以利用计算机模拟和多媒体技术,直观形象地展示预测结果的随机性和规律性。
◆教学目标【知识与能力目标】了解最小二乘法的思想,能根据给出的线性回归方程的系数公式建立线性回归方程。
【过程与方法目标】经历用不同的估算方法来描述两个变量线性相关的过程,能根据得到的近似直线进行简单的估计。
【情感态度价值观目标】体会现实生活中大量存在着具有相关关系的两个量,感受统计与日常生活的密切联系。
◆教学重难点◆【教学重点】求线性回归方程,以及线性回归分析。
【教学难点】确定线性回归方程的系数。
◆课前准备◆电子课件调整、相应的教具带好、熟悉学生名单、电子白板要调试好。
◆教学过程一、导入部分高二某班学生每周用于数学学习的时间x(单位:h)与数学成绩y(单位:分)之间有如下数据:x24 15 23 19 16 11 20 16 17 13 y92 79 97 89 64 47 83 68 71 59 某同学每周用于数学学习的时间为18h,试预测该生数学成绩。
设计意图:从生活实际切入,激发了学生的学习兴趣,又为新知作好铺垫。
二、研探新知,建构概念1.电子白板投影出上面实例。
2.教师组织学生分组讨论:先让学生分析,师生一起归纳。
2021年高中数学第一章统计最小二乘估计第二课时教案北师大版必修3一、教学目标:经历用不同估算方法描述两个变量线性相关的过程。
知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。
二、教学重难点:重点:了解最小二乘法的思想并利用此思想借助电子表格求出回归方程。
教学内容的难点:对最小二乘法的数学思想和回归方程的理解教学实施过程中的难点:根据给出的线性回归方程的系数公式建立线性回归方程。
三、教学方法:动手操作,合作交流。
四、教学过程:(一)、利用最小二乘法推导回归系数公式。
回顾上节课:师:我们现在来求距离和。
怎么求?生:利用点到直线的距离公式师生共同:只要求出使距离和最小的、b即可。
但是,我们知道点到直线的距离公式计算复杂。
怎么办呢?以样本数据点A为例,可以看出:按照一对一的关系,直角边AC越小,斜边AB越小,当AC无限小时,AB跟AC可近似看作相等。
求麻烦,不妨求生: 师:它表示自变量x 取值一定时,纵坐标的偏差。
假设我们已经得到两个具有线性相关关系的变量的一组数据:……。
当自变量取(=1,2,……,n )时,可以得到(=1,2,……,n ),它与实际收集到的之间的偏差是(=1,2,……,n )这样用n 个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的。
总的偏差为,偏差有正有负,易抵消,所以采用绝对值,由于带绝对值计算不方便所以换成平方,222221122331ˆ()()()()()ni i n n i Q y yy bx a y bx a y bx a y bx a ==-=--+--+--+⋅⋅⋅+--∑现在的问题就归结为:当,b 取什么值时Q 最小。
将上式展开、再合并,就可以得到可以求出Q 取最小值时1122211()()()nnii ii i i nn iii i xx y y xy n x yb xx xn xa yb x====---==--=-∑∑∑∑(其中,)推导过程用到偏差的平方,由于平方又叫二乘方,所以这种使“偏差的和”最小的方法叫“最小二乘法”。
第四章 最小二乘法与组合测量§1概述最小二乘法是用于数据处理和误差估计中的一个很得力的数学工具。
对于从事精密科学实验的人们来说,应用最小乘法来解决一些实际问题,仍是目前必不可少的手段。
例如,取重复测量数据的算术平均值作为测量的结果,就是依据了使残差的平方和为最小的原则,又如,在本章将要用最小二乘法来解决一类组合测量的问题。
另外,常遇到用实验方法来拟合经验公式,这是后面一章回归分析方法的内容,它也是以最小二乘法原理为基础。
最小二乘法的发展已经经历了200多年的历史,它最先起源于天文和大地测量的需要,其后在许多科学领域里获得了广泛应用,特别是近代矩阵理论与电子计算机相结合,使最小二乘法不断地发展而久盛不衰。
本章只介绍经典的最小二乘法及其在组合测量中的一些简单的应用,一些深入的内容可参阅专门的书籍和文献。
§2最小二乘法原理最小二乘法的产生是为了解决从一组测量值中寻求最可信赖值的问题。
对某量x 测量一组数据n x x x ,,,21 ,假设数据中不存在系统误差和粗大误差,相互独立,服从正态分布,它们的标准偏差依次为:n σσσ ,,21记最可信赖值为x ,相应的残差x x v i i -=。
测值落入),(dx x x i i +的概率。
dx v P i i ii )2exp(2122σπσ-=根据概率乘法定理,测量n x x x ,,,21 同时出现的概率为n i ii ni i dx v P P )]()(21exp[)2(12∑-∏=∏=σπσ 显然,最可信赖值应使出现的概率P 为最大,即使上式中页指数中的因子达最小,即∑=iii Min v 22σ权因子:22o i i w σσ=即权因子i w ∝21iσ,则2[]i i wvv wv Min ==∑再用微分法,得最可信赖值x11ni ii nii w xx w===∑∑ 即加权算术平均值这里为了与概率符号区别,以i ω表示权因子。