推荐K12高中数学第2章统计2.4线性回归方程互动课堂学案苏教版必修3
- 格式:doc
- 大小:252.50 KB
- 文档页数:8
高中数学第二章统计2.4 线性回归方程(1)教案苏教版必修3 编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高中数学第二章统计2.4 线性回归方程(1)教案苏教版必修3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高中数学第二章统计2.4 线性回归方程(1)教案苏教版必修3的全部内容。
2。
4 线性回归方程(1)教学目标:1。
通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系;2. 在两个变量具有线性相关关系时,会在散点图中作出线性直线,会用线性回归方程进行预测;3。
知道最小二乘法的含义,知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程,了解(线性)相关系数的定义.教学重点:散点图的画法,回归直线方程的求解方法.教学难点:回归直线方程的求解方法.教学方法:引导发现、合作探究.教学过程:一、创设情景,揭示课题客观事物是相互联系的.过去研究的大多数是因果关系,但实际上更多存在的是一种非因果关系.比如说:某某同学的数学成绩与物理成绩,彼此是互相联系的,但不能认为数学是“因”,物理是“果”,或者反过来说事实上数学和物理成绩都是“果”,而真正的“因”是学生的理科学习能力和努力程度.所以说,函数关系存在着一种确定性关系,但还存在着另一种非确定性关系--相关关系.二、学生活动提出问题:两个变量之间的常见关系有几种?(1)确定性的函数关系,变量之间的关系可以用函数表示;(2)相关关系,变量之间有一定的联系,但不能完全用函数来表示.说明:不要认为两个变量间除了函数关系,就是相关关系,事实是,两个变量间可能毫无关系.比如地球运行的速度与某个人的行走速度就可认为没有关系.某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对照表:如果某天的气温是5-0C,你能根据这些数据预测这天小卖部卖出热茶的杯数吗?为了了解热茶销量与气温的大致关系,我们以横坐标x表示气温,纵坐标y表示热茶销量,建立直角坐标系,将表中数据构成的6个数对所表示的点在坐标系内标出,得到下图,今后我们称这样的图为散点图(scatterplot)。
2019-2020年高中数学 2.4《线性回归方程》学案 苏教版必修3【目标引领】1.学习目标:了解非确定性关系中两个变量的统计方法;掌握散点图的画法及在统计中的作用,掌握 回归直线方程的求解方法。
2.学法指导:①求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实标意义.否则,求出的回归直线方程毫无意义.因此,对一组数据作线性回归分析时,应先看其散点图是否成线性.②求回归直线方程,关键在于正确地求出系数a 、b ,由于求a 、b 的计算量较大,计算时仔细谨慎、分层进行,避免因计算产生失误.③回归直线方程在现实生活与生产中有广泛的应用.应用回归直线方程可以把非确定性问题转化成确定性问题,把“无序”变为“有序”,并对情况进行估测、补充.因此,学过回归直线方程以后,应增强学生应用回归直线方程解决相关实际问题的意识.【教师在线】1.解析视屏:1.相关关系的概念在实际问题中,变量之间的常见关系有两类:一类是确定性函数关系,变量之间的关系可以用函数表示。
例如正方形的面积S 与其边长之间的函数关系(确定关系);一类是相关关系,变量之间有一定的联系,但不能完全用函数来表达。
例如一块农田的水稻产量与施肥量的关系(非确定关系)相关关系:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系。
相关关系与函数关系的异同点:相同点:均是指两个变量的关系。
不同点:函数关系是一种确定关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系。
2.求回归直线方程的思想方法观察散点图的特征,发现各点大致分布在一条直线的附近,思考:类似图中的直线可画几条?引导学生分析,最能代表变量x 与y 之间关系的直线的特征:即n 个偏差的平方和最小,其过程简要分析如下:设所求的直线方程为,其中a 、b 是待定系数。
2017-2018学年高中数学第2章统计 2.4线性回归方程教学案苏教版必修3(1)编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2017-2018学年高中数学第2章统计 2.4线性回归方程教学案苏教版必修3(1))的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2017-2018学年高中数学第2章统计 2.4 线性回归方程教学案苏教版必修3(1)的全部内容。
2.4 错误!预习课本P74~75,思考并完成以1.变量间有哪些常见关系?2.什么叫散点图?怎样作出散点图?3。
什么叫线性回归方程?错误!1.变量间的常见关系(1)函数关系:变量之间的关系可以用函数表示,是一种确定性关系.(2)相关关系:变量之间有一定的联系,但不能完全用函数来表达.[点睛]函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系,如试验田的施肥量x与水稻的产量y.当自变量x每取一确定值时,因变量y的取值带有一定的随机性,即还受其他环境因素的影响.2。
散点图(1)概念:将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中,用来表示两个变量的一组数据的图形叫做散点图.(2)作法:建立平面直角坐标系,用横坐标表示一个变量,用纵坐标表示另一个变量,将给出的数据所表示的点在坐标系内描出,即可得到散点图.[点睛]对于散点图要注意以下几点.①若所有的样本点都落在某一函数曲线上,则变量间具有函数关系.②若所有的样本点都落在某一函数曲线附近,则变量间就具有相关关系.③若散点图中的点的分布没有什么规律,则这两变量之间不具有相关关系,它们之间是相互独立的.3.线性相关关系能用直线错误!=bx+a近似表示的相关关系叫线性相关关系.4.线性回归方程(1)概念:设有n对观察数据如下:当a,b使Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(y n-bxn-a)2取得最小值时,就称方程错误!=bx+a为拟合这n对数据的线性回归方程,该方程所表示的直线称为回归直线.(2)用回归直线进行数据拟合的一般步骤①作出散点图,判断散点是否在一条直线附近.②如果散点在一条直线附近,用公式错误!求出a,b,并写出线性回归方程.错误!1.下列各组变量是相关关系的是________.(1)电压U与电流I;(2)圆面积S与半径R;(3)粮食产量与施肥量;(4)广告费支出与商品销售额.解析:(1)(2)中两个变量间是函数关系,(3)(5)中两个变量之间有关系,但不能用函数表达,是相关关系.答案:(3)(4)2.5名学生的化学和生物成绩如下表所示:判断化学和生物成绩之间是否具有相关关系________(填“具有”“不具有").答案:具有[典例]在下列各个量与量的关系中:①正方体的表面积与棱长之间的关系;②某同学的数学成绩和物理成绩之间的关系;③家庭的收入与支出之间的关系;④某户家庭用电量与水费之间的关系.其中是相关关系的为________________.[解析] ①正方体的表面积与棱长之间的关系是确定的函数关系;④某户家庭用电量与水费之间无任何关系.②③中,都是非确定的关系,但自变量取值一定时,因变量的取值带有一定的随机性.[答案]②③判断两个变量是否具有相关关系,主要有两种方法:一是根据相关关系的定义进行判断,看这两个变量是否具有不确定性.二是利用散点图,看散点图中的点是否都落在某一函数曲线附近.[活学活用]关于人体的脂肪含量(百分比)与年龄关系的研究中,得到如下一组数据:年龄2327394145495053脂肪9。
2.4线性回归方程(1)教学目标(1)通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系;(2)在两个变量具有线性相关关系时,会在散点较长中作出线性直线,会用线性回归方程进行预测;(3)知道最小二乘法的含义,知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程,了解(线性)相关系数的定义.教学重点散点图的画法,回归直线方程的求解方法.教学难点回归直线方程的求解方法.教学过程一、问题情境1.情境:客观事物是相互联系的过去研究的大多数是因果关系,但实际上更多存在的是一种非因果关系学是“因”,物理是“果”,或者反过来说事实上数学和物理成绩都是“果”,而真正的“因”是学生的理科学习能力和努力程度所以说,函数关系存在着一种确定性关系但还存在着另一种非确定性关系——相关关系2.问题:某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的气温/0C 26 18 13 10 4 1-杯数20 24 34 38 50 64-C,你能根据这些数据预测这天小卖部卖出热茶的杯数吗?如果某天的气温是5二、学生活动为了了解热茶销量与气温的大致关系,我们以横坐标x表示气温,纵坐标y表示热茶销量,建立直角坐标系,将表中数据构成的6个数对所表示的点在坐标系内标出,得到下图,今后我们称这样的图为散点图(scatterplot).从右图可以看出.这些点散布在一条直线的附近,故可用一个线性函数近似地表示热茶销量与气温之间的关系.选择怎样的直线近似地表示热茶销量与气温之间的关系?我们有多种思考方案:(1)选择能反映直线变化的两个点,例如取(4,50),(18,24)这两点的直线;(2)取一条直线,使得位于该直线一侧和另一侧的点的个数基本相同;(3)多取几组点,确定几条直线方程,再分别算出各条直线斜率、截距的平均值,作为所求直线的斜率、截距;………………怎样的直线最好呢?三、建构数学1.最小平方法:=+的直线拟合散点图中的点,应使得该直线与散点图中的点最接近。
2.4 线性回归方程1.理解线性回归的基本思想和方法,体会变量之间的相关关系.(难点)2.会画出数据的散点图,并会通过散点图判断这组数据是否具有线性关系.(重点) 3.会求数据的线性回归方程,并根据线性回归方程做出合理的判断.(重点、难点)[基础·初探]教材整理1 变量间的关系阅读教材P 74的内容,并完成下面的问题.1.变量间的关系关系.确定性函数表示,是一种函数函数关系:变量之间的关系可以用(1)来表达.函数,但不能完全用一定的联系相关关系:变量之间有(2)2.散点图横坐的取值作为x 是否有相关关系,常将y 与x 统计数表中,为了更清楚地看出从一个,这样的图形…),1,2,3=i )(i y ,i x (,在直角坐标系中描点纵坐标的相应取值作为y ,将标叫做散点图.判断正误:(1)相关关系是一种不确定关系,而函数关系是一种确定关系.( )(2)商品的销售收入与广告支出经费是函数关系.( )(3)散点图越集中,则相关关系越强.( )【解析】 (1)√.由函数关系及相关关系的定义知正确.(2)×.是相关关系,而不是确定关系,故错误.(3)×.只有当散点图呈规律性分布时才具有相关关系.故错误.【答案】 (1)√ (2)× (3)×教材整理2 线性回归方程阅读教材P 75~P 76“例1”上边的内容,并完成下列问题.1.线性相关关系拟合a +bx =y ^,我们用直线一条直线的附近如果散点图中点的分布从整体上看大致在叫做线性相关关系.相关关系近似表示的a +bx =y ^散点图中的这些点,像这样能用直线 2.线性回归方程设有n 对观察数据如下:=y ^时,就称最小值取得2)a -n bx -n y (+…+2)a -2bx -2y (+2)a -1bx -1y(=Q 使b ,a 当bx +a 为拟合这n 对数据的线性回归方程,该方程所表示的直线称为回归直线.3.用回归直线进行数据拟合的一般步骤附近;一条直线是否在散点作出散点图,判断(1)(2)如果散点在一条直线附近,用公式⎩⎪⎨⎪⎧b =∑i =1nxiyi -∑i =1nx∑i =1nyn ∑i =1n x2i -∑i =1n xa =y --b x-或求出a ,b ,并写出线性回归方程.填空:(1)有一个线性回归方程为y ^=2-1.5x ,则变量x 增加一个单位时,y 平均________1.5个单位.(填“增加”或“减少”)【解析】 ∵b =-1.5,∴x 每增加一个单位时y 减少1.5个单位.【答案】 减少(2)过(3,10),(7,20),(11,24)三点的回归直线方程是________.【解析】 代入系数公式得b =1.75,a =5.75.代入直线方程.求得y ^=5.75+1.75x .。
2.4 线性回归方程 1整体设计教材分析在实际问题中,变量之间关系有两类:一类是确定性关系,变量之间关系可以用函数表示.例如,正方形面积S与边长a之间就是确定性关系,可以用函数s=a2表示.还有一类是非确定性关系,例如“学生数学成绩与物理成绩之间关系〞“粮食产量与施肥量之间关系〞“商品销售额与广告费支出之间关系〞“人体脂肪百分比与年龄之间关系〞等贴近学生实际问题,它不能由一个变量数值准确地确定另一个变量数值.像这种自变量取一定值时,因变量取值带有一定随机性,这样两个变量之间关系,我们称之为相关关系.“线性回归方程〞这一节是为了帮助我们了解变量之间相关关系,使学生学会区别变量之间函数关系与变量相关关系,从而到达正确判断实际生活中两个变量之间相关关系并会作出变量相关关系散点图;通过散点图直观性,看各点是否在某条直线附近摆动来为判断两个变量之间相关关系打下坚实根底.通过对人体脂肪百分比与年龄之间关系散点图分析,引入描述两个变量之间关系线性回归方程〔模型〕,使学生通过探索用多种方法确定线性回归直线,学会类比寻求新突破方法,体会最小二乘法思想,掌握计算回归方程斜率与截距方法,求出回归直线方程.通过典型求解,强化回归思想建立,理解回归直线与观测数据关系. 通过引导学生感受生活中实际问题转化为数学问题,学会类比寻求新突破方法,体会最小二乘法思想,培养学生创新精神,不断收取信息,学会用统计知识对实际问题进展数学分析.通过课堂目标检测到达强化所学知识点,提高学生对现代化教学工具应用能力.三维目标1.通过实例,使学生感受到现实世界中变量之间除了函数关系外,还存在着虽无确定函数关系,但却有一定关联性相关关系,相关关系是一种非确定性关系.2.通过收集实际问题中两个有关联变量数据作出散点图,直观认识变量间相关关系.3.经历用不同估算方法描述两个变量线性相关过程,运用最小二乘法思想,发现可用线性回归方程近似地表示两个具有相关关系变量之间关系,并能根据给出线性回归方程系数公式建立线性回归方程.重点难点教学重点:1.会区别变量之间函数关系与变量相关关系;会举例说明现实生活中变量之间相关关系.2.会作散点图,并由此对变量间关系作出直观判断,会求回归直线.教学难点:1.对变量之间相关关系理解;变量之间函数关系与变量相关关系区别.2.了解最小二乘法思想,能根据给出线性回归方程系数公式建立回归方程.课时安排2课时教学过程第1课时导入新课〔多媒体播放四个问题,组织学生分析、思考〕问题1:将汽油以均匀速度注入桶里,注入时间t与注入油量y 如下表:从表里数据得出油量y与时间t之间函数关系式为________________.问题2:圆面积S与半径r之间函数关系式为________________.问题3:小麦产量y千克每亩与施肥量x千克每亩之间关系如下表:从表里数据能得出小麦产量y与施肥量x之间函数关系式吗?问题4:人体重y与身高x之间有什么关系呢?分析问题1:因为是以均匀速度注入桶里,所以注入油量y与注入时间t成正比例关系,由表格数据知,注入油量y与注入时间t之间函数关系式为y=2x(x≥0).因为是实际问题,所以要特别注意自变量取值范围要有实际意义.分析问题2:这是大家熟悉面积公式,所以圆面积S与半径r之间函数关系式为S=πr2(r>0).第1、2两个问题中变量间函数关系是确定,在我们现实生活,两个变量之间存在确定性关系是极少,而两个变量之间存在不确定性关系是很普遍,那么问题3中两个变量之间是确定性函数关系,还是不确定性关系呢?学生甲分析问题3:此问中两个变量之间是确定性函数关系,设为y=kx+b,当x=10时,函数值y为420;当x=20时,函数值y 为440,代入可得函数关系式为y=2x+400(x≥0).学生乙:学生甲答复是错误,假设函数关系式为y=20x+400(x≥0),当x=30时,函数值为460,而不是470.但是可以感觉到施肥量越大,小麦产量就越高.教师分析:从表格里容易发现施肥量越大,小麦产量就越高.但是,施肥量并不是影响小麦产量唯一因素,小麦产量还与土壤质量、降雨量、田间管理等诸多因素影响有关,更何况当施肥量超出一定范围时,还会造成小麦倒塌,以致颗粒无收.这时两个变量之间就不是确定性函数关系,那么这两个变量之间终究是什么关系呢?这就是我们本节课所要研究问题——变量之间相关关系.(引入新课,书写课题)推进新课新知探究由学生举出现实生活中相关关系例子,教师归纳概念!1.变量之间有一定联系,但不能完全用函数来表达,即当自变量一定时,因变量取值带有一定随机性两个变量之间关系称为相关关系.相关关系是非随机变量与随机变量之间关系,函数关系是两个非随机变量之间关系,是一种因果关系,而相关关系不一定是因果关系,所以相关关系与函数关系不同,其变量具有随机性,因此相关关系是一种非确定性关系〔有因果关系,也有伴随关系〕.通过上述三个问题请学生思考相关关系与函数关系有什么区别与联系?相关关系与函数关系异同点如下:一样点:均是指两个变量关系.不同点:函数关系是一种确定关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间关系,这种关系是两个非随机变量关系;而相关关系是非随机变量与随机变量关系.注意:问题3中小麦产量是在土壤质量、降雨量、田间管理等诸多变量共同作用下结果,本节课只研究其中两个主要变量之间相关关系.我们只能得出经历性结论:施肥量越大,小麦产量就越高.但是经历再丰富,也容易犯经历性错误.施肥量过大,反而容易造成粮食减产.由学生解决问题4, 人体重y与身高x之间是一种非确定关系相关关系,因为,一般说来,身高越高,体重就越重,而无法写出具体函数关系.应用例如例1 某班学生在一次数学测验与物理测验中,学号1到20学生成绩如下表:从表里数据你能得出什么样经历性结论呢?分析:即是考虑两门学科成绩之间是否具有一定相关关系.解:数学成绩好同学那么物理成绩就好,反之,数学成绩差同学那么物理成绩就差.点评:注意,只是问“得出什么样经历性结论〞,并不完全绝对.例2 下面提供四个问题,让各组同学共同探究:第一小组探究问题是:调查一下本组所有成员视力与各自学习成绩关系.第二小组探究问题是:商品销售额与广告费支出之间关系.第三小组探究问题是:调查一下本组所有成员身高与各自体重之间关系.第四小组探究问题是:气温上下与空调销售量间关系.分析:根据变量相关关系讨论.解:第一小组:通过对本组所有成员调查我们得到结论是:学习成绩好同学视力都不太好,都佩带了近视眼镜,但是,我们发现这个结论对我们全班来说就不成立,例如,我们班第一名同学视力却是很棒,所以我们只能说学习成绩好同学视力一般都不太好,人视力还与用眼卫生习惯、遗传因素等有密切关系.第二小组:通过本组所有成员共同探讨,我们得到结论是:商品销售额与广告费支出之间有密切关系,但商品销售额不仅与广告费支出多少有关,还与商品质量、居民收入以及售后效劳质量等诸多因素有关.第三小组:通过对本组所有成员调查我们得到结论是:身材高同学体重一般来说大多都比拟大,但是,人体重还与饮食习惯、遗传因素等有密切关系.第四小组:通过本组所有成员共同探讨,我们得到结论是:气温上下与空调销售量之间有密切关系,但空调销售量不仅与气温上下有关,还与空调质量、居民收入以及售后效劳质量等诸多因素有关.点评:通过此例使学生养成考虑问题要多方面思考习惯.例3 以下两个变量之间关系哪个不是函数关系〔〕解析:利用变量函数关系与相关关系解决问题.角度与它余弦值是一个确定函数关系y=cosx;正方形边长与面积:s=a2;正n边形边数与它内角与:s=(n-2)×180°,而人年龄与身高具有相关关系.答案:D点评:函数关系是一种确定关系,而相关关系是一种非确定关系;函数关系是自变量与因变量之间关系,这种关系是两个非随机变量关系,而相关关系是非随机变量与随机变量关系.例4 “强将手下无弱兵〞可以理解为将军本领越高,他手下士兵本领也越高.那么,将军本领与士兵本领成什么相关关系?你能举出更多描述生活中两个变量相关关系成语吗?分析:这是与生活、生产、工作、学习息息相关相关关系,语言功底好同学更显优势.解:此题与“名师出高徒〞相对应.另外举例有:水涨船高.点评:此题加强了与其他学科联系,学生会对数学很有亲切感.知能训练1.在一次对人体脂肪含量与年龄关系研究中,研究人员获得了一组样本数据:根据上述数据,人体脂肪含量与年龄之间有怎样关系?2.某小卖部为了了解热茶销售量与气温之间关系,随机统计并制作了某6天卖出热茶杯数与当天气温比照表:根据上述数据,气温与热茶销售量之间有怎样关系?解答:1.观察表中数据,大体上来看,随着年龄增加,人体中脂肪百分比也在增加.2.观察表中数据,大体上来看,气温越高,卖出去热饮杯数越少.点评:使学生学会全面考察现实生活中变量之间相关关系,并为下一节课作铺垫.课堂小结(让学生进展小结,帮助他们回忆反思、归纳概括.)1.变量之间相关关系;2.变量之间函数关系与变量相关关系区别;3.学会全面考察现实生活中变量之间相关关系.作业阅读、预习课本中本节下一局部内容.举出生活中具有相关关系例子.设计感想通过生活中存在相关关系一些典型事例,如“学生数学成绩与物理成绩之间关系〞“粮食产量与施肥量之间关系〞“商品销售额与广告费支出之间关系〞等贴近学生实际问题,介绍与函数关系不同两个变量之间相关关系,在教学设计时,通过复习变量之间函数关系引出变量相关关系,由熟悉到生疏过程便于学生理解,同时分成四个小组同学共同探究以下四个问题:〔1〕调查一下本组所有成员视力与各自学习成绩关系;〔2〕商品销售额与广告费支出之间关系;〔3〕调查一下本组所有成员身高与各自体重之间关系;〔4〕气温上下与空调销售量间关系.通过讨论来强化学生对所学内容理解.。
2.4 线性回归方程学 习 目 标核 心 素 养1.了解两个变量之间的相关关系并与函数关系比较. 2.会作散点图,并利用散点图判断两个变量之间是否具有线性相关关系.3.能根据给出的线性回归方程系数公式建立线性回归方程,并能由回归方程对总体进行预测、估计.(重点、难点)通过对已有数量的分析、运算培养学生数据分析、数学运算的核心素养.1.变量之间的两类常见关系在实际问题中,变量之间的常见关系有如下两类:一类是确定性函数关系,变量之间的关系可以用函数表示.另一类是相关关系,变量之间有一定的联系,但不能完全用函数表示.2.相关关系的分类相关关系分线性相关和非线性相关两种. 3.线性回归方程系数公式能用直线方程y ^=bx +a 近似表示的相关关系叫做线性相关关系,该方程叫线性回归方程.给出一组数据(x 1,y 1),(x 2,y 2),…, (x n ,y n ),线性回归方程中的系数a ,b 满足⎩⎪⎨⎪⎧b =n ∑i =1n x i y i -⎝ ⎛⎭⎪⎪⎫∑i =1n x i ⎝ ⎛⎭⎪⎪⎫∑i =1n y i n ∑i =1nx 2i -⎝ ⎛⎭⎪⎪⎫∑i =1n x i2,a =y -b x .上式还可以表示为⎩⎪⎨⎪⎧b =∑i =1nx i y i-n x -y -∑i =1n x 2i -n x 2=∑i =1n(x i-x )(y i-y )∑i =1n(x i-x )2,a =y -b x .1.有下列关系:①人的年龄与其拥有的财富之间的关系; ②曲线上点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一树木,其横截面直径与高度之间的关系; ⑤学生与其学号之间的关系. 其中具有相关关系的是________. ①③④ [②⑤为确定关系不是相关关系.]2.下面四个散点图中点的分布状态,直观上判断两个变量之间具有线性相关关系的是________.③ [散点图①中的点无规律的分布,范围很广,表明两个变量之间的相关程度很小;②中所有的点都在同一条直线上,是函数关系;③中点的分布在一条带状区域上,即点分布在一条直线的附近,是线性相关关系;④中的点也分布在一条带状区域内,但不是线性的,而是一条曲线附近,所以不是线性相关关系,故填③.]3.工人工资y (元)依劳动生产率x (千元)变化的线性回归方程为y ^=50+80x ,下列判断正确的是________.①劳动生产率为1 000元时,工资为130元; ②劳动生产率提高1 000元时,工资提高80元; ③劳动生产率提高1 000元时,工资提高130元; ④当月工资为250元时,劳动生产率为2 000元.② [回归直线斜率为80,所以x 每增加1,y ^增加80,即劳动生产率提高1 000元时,工资提高80元.]4.下表是广告费用与销售额之间的一组数据:广告费用(千元) 1 4 6 10 14 销售额(千元)1944405253销售额y (千元)与广告费用x (千元)之间有线性相关关系,回归方程为y ^=2.3x +a (a 为常数),现要使销售额达到6万元,估计广告费用约为________千元.15 [x =7,y =41.6,则a =y -2.3x =41.6-2.3×7=25.5. 当y =6万元=60千元时,60=2.3x +25.5,解得x =15(千元).]变量间相关关系的判断【例1】 在下列两个变量的关系中,具有相关关系的是________. ①正方形边长与面积之间的关系;②作文水平与课外阅读量之间的关系;③人的身高与年龄之间的关系;④降雪量与交通事故发生率之间的关系.②④[两变量之间的关系有两种:函数关系与带有随机性的相关关系.①正方形的边长与面积之间的关系是函数关系.②作文水平与课外阅读量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.③人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而他们不具备相关关系.④降雪量与交通事故的发生率之间具有相关关系.]1.函数关系是一种确定的关系,而相关关系是非随机变量与随机变量的关系.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.2.准确理解变量间的相关关系是解答本题的关键.要准确区分两个变量间的相关关系和函数关系,事实上,现实生活中相关关系是处处存在的,从某种意义上讲,函数关系可以看作一种理想的关系模型,而相关关系是一种普遍的关系.两者区别的关键点是“确定性”还是“不确定性”.1.下列两个变量中具有相关关系的是________(填写相应的序号).①正方体的棱长和体积;②单产为常数时,土地面积和总产量;③日照时间与水稻的亩产量.③[正方体的棱长x和体积V存在着函数关系V=x3;单产为常数a公斤/亩,土地面积x(亩)和总产量y(公斤)之间也存在着函数关系y=ax.日照时间长,则水稻的亩产量高,这只是相关关系,应选③.]2.下列命题:①任何两个变量都具有相关关系;②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系;④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.其中正确的命题为________.③④⑤[两个变量不一定是相关关系,也可能是确定性关系,故①错误;圆的周长与该圆的半径具有函数关系,故②错误;③④⑤都正确.]散点图的画法及应用学生A B C D E学科数学8075706560物理7066686462利用散点图判断它们是否具有线性相关关系?如果有线性相关关系,是正相关还是负相关?思路点拨:本题涉及两个变量(数学成绩与物理成绩),以x轴表示数学成绩、y轴表示物理成绩,可得相应的散点图,再观察散点图得出结论.[解] 把数学成绩作为横坐标,把相应的物理成绩作为纵坐标,在平面直角坐标系中描点(x i,y i)(i=1,2,…,5).从图中可以直观地看出数学成绩和物理成绩具有线性相关关系,且当数学成绩减小时,物理成绩也由大变小,即它们正相关.1.判断两个变量x和y之间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果图上发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.如果变量的对应点分布没有规律,我们就可以认为这两个变量不具有相关关系.2.正相关、负相关线性相关关系又分为正相关和负相关.正相关是指两个变量具有相同的变化趋势,即从整体上来看,一个变量会随另一个变量变大而变大.从散点图上看,因变量随自变量的增大而增大,图中的点分布在左下角到右上角的区域.负相关是指两个变量具有相反的变化趋势,即从整体上来看,一个变量会随另一个变量变大而变小.从散点图上看,因变量随自变量的增大而减小,图中的点分布在左上角到右下角的区域.提醒:画散点图时应注意合理选择单位长度,避免图形过大或偏小,或者是点的坐标在坐标系中画不准,使图形失真,导致得出错误结论.3.如图是两个变量统计数据的散点图,判断两个变量之间是否具有相关关系?思路点拨:观察图中点的分布情况作出判断.从散点图上看,点的分布散乱无规律,故不具有相关关系.[解] 不具有相关关系,因为散点散乱地分布在坐标平面内,不呈线形.4.有个男孩的年龄与身高的统计数据如下:思路点拨:描点(1,78),(2,87),(3,98),(4,108),(5,115),(6,120).观察点的分布,作出判断.[解] 作出散点图如图:由图可见,具有线性相关关系,且是正相关.线性回归方程的求法及应用【例3】 某产品的广告支出x (单位:万元)与销售收入y (单位:万元)之间有下表所对应的数据.广告支出x /万元 1 2 3 4 销售收入y /万元12284256(1)画出表中数据的散点图;(2)求出y 对x 的回归直线方程y ^=bx +a ,并解释b 的意义; (3)若广告费为9万元,则销售收入约为多少万元? 思路点拨:画散点图→列表处理数据→计算x ,y ,n ∑i =14x 2i ,∑i =14x i y i →计算b →计算a →线性回归方程→销售收入[解] (1)散点图如图.(2)观察散点图可知各点大致分布在一条直线附近,列出下列表格,以便计算回归系数a ,B .序号 xyx 2y 2xy1 1 12 1 144 12 2 2 28 4 784 563 3 42 9 1 764 126 4 4 56 16 3 136 224 ∑10138305 828418于是x =52,y =692,∑i =14x 2i =30,∑i =14y 2i =5 828,∑i =14x i y i =418,代入公式得,b =∑i =14x i y i -4xy∑i =14x 2i -4x 2=418-4×52×69230-4×⎝ ⎛⎭⎪⎫522=735,a =y -b x =692-735×52=-2.故y 对x 的回归直线方程为y ^=735x -2,其中回归系数b =735,它的意义是:广告支出每增加1万元,销售收入y 平均增加735万元.(3)当x =9万元时,y ^=735×9-2=129.4(万元),即若广告费为9万元,则销售收入约为129.4万元. 1.求样本数据的线性回归方程,可按下列步骤进行: 第一步,计算平均数x ,y ;第二步,求和∑i =1nx i y i ,∑i =1nx 2i ;第三步,计算b =∑i =1n (x i -x )(y i -y)∑i =1n(x i -x)2=∑i =1nx i y i -n xy∑i =1nx 2i -n x 2,a =y -b x ;第四步,写出线性回归方程y ^=bx +A .2.对于任意一组样本数据,利用上述公式都可以求得“回归方程”,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得的“回归方程”是没有实际意义的.因此,对一组样本数据,应先作散点图,在具有线性相关关系的前提下再求回归方程.提醒:(1)对一组数据进行线性回归分析时,应先画出其散点图,判断变量之间是否线性相关,再由系数a ,b 的计算公式,计算出a ,b ,由于计算量较大,在计算时应借助计算器,仔细计算,以防出现错误.(2)为了方便,常制表对应算出x i y i ,x 2i ,以便于求和.(3)研究变量间的相关关系,求得回归直线方程能帮助我们发现事物发展的一些规律,估计、预测某些数据,为我们的判断和决策提供依据.5.如图是我国2012年至2018年生活垃圾无害化处理量(单位:亿吨)的折线图. 注:年份代码1-7分别对应年份2012-2018.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2018年我国生活垃圾无害化处理量.参考数据:∑ 7i =1y i =9.32,∑7i =1t i y i =40.17,∑ 7i =1(y i -y )2=0.55,7≈2.646.参考公式:相关系数r =∑ni =1 (t i -t )(y i -y )∑ ni =1(t i -t )2∑ ni =1(y i -y )2,回归方程y ^=a +bt 中斜率和截距的最小二乘估计公式分别为b =∑ ni =1 (t i -t )(y i -y )∑ ni =1(t i -t )2,a =y --b t . 思路点拨:(1)利用相关系数的大小――→确定y 与t 的线性相关程度 (2)求出回归方程→利用方程进行估计[解] (1)由折线图中的数据和附注中的参考数据得 t =4,∑ 7i =1(t i -t )2=28,∑ 7i =1(y i -y )2=0.55,∑ 7i =1(t i -t )(y i -y )=∑ 7i =1t i y i -t ∑7i =1y i =40.17-4×9.32=2.89,∴r ≈ 2.890.55×2×2.646≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当大,从而可以用线性回归模型拟合y 与t 的关系.(2)由y =9.327≈1.331及(1)得b =∑ 7i =1(t i -t )(y i -y )∑ 7i =1 (t i -t )2=2.8928≈0.103. a =y -b t ≈1.331-0.103×4≈0.92.所以y 关于t 的回归方程为y ^=0.92+0.10t .将2016年对应的t =9代入回归方程得y ^=0.92+0.10×9=1.82. 所以预测2020年我国生活垃圾无害化处理量约为1.82亿吨.1.本节课的重点是会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系,能根据给出的线性回归方程系数公式建立线性回归方程.难点是了解相关关系、线性相关、回归直线的概念.2.本节课要掌握以下几类问题 (1)准确区分相关关系与函数关系.(2)会利用散点图判断两个变量间的相关关系. (3)掌握用线性回归方程估计总体的一般步骤.1.在如图所示的四个散点图中,两个变量具有相关性的是( ) A .①②B .①④C .②③D .②④D [由图可知①中变量间是一次函数关系,不是相关关系;②中的所有点在一条直线附近波动,是线性相关的;③中的点杂乱无章,没有什么关系;④中的所有点在某条曲线附近波动,是非线性相关的.故两个变量具有相关性的是②④.]2.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得线性回归方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423; ②y 与x 负相关且y ^=-3.476x +5.648; ③y 与x 正相关且y ^=5.437x +8.493; ④y 与x 正相关且y ^=-4.326x -4.578. 其中一定不正确的结论的序号有( ) A .①③ B .①④ C .②③D .②④B [由正、负相关性的定义知①④一定不正确.]3.某工厂生产某种产品的产量x (吨)与相应的生产能耗y (吨标准煤)有如下几组样本数据:的斜率为0.7,则这组样本数据的线性回归方程是________.y ^=0.7x +0.35 [∵x =3+4+5+64=4.5,y =2.5+3+4+4.54=3.5,∴a =y -b x =3.5-0.7×4.5=0.35. ∴线性回归方程为y ^=0.7x +0.35.]4.2019年元旦前夕,某市统计局统计了该市2018年10户家庭的年收入和年饮食支出的统计资料如下表:(2)若某家庭年收入为9万元,预测其年饮食支出.(参考数据:∑i =110x i y i =117.7,∑i =110x 2i =406)思路点拨:按照求线性回归方程的一般步骤,求出线性回归方程,再根据回归方程作出预测.[解] (1)依题意可计算得:x =6,y =1.83,x 2=36,x y =10.98,又∵∑i =110x i y i =117.7,∑i =110x 2i =406,∴b =∑i =110x i y i -10xy∑i =110x 2i -10x 2≈0.17,a =y -b x =0.81,∴y ^=0.17x +0.81.∴所求的线性回归方程为y ^=0.17x +0.81. (2)当x =9时,y ^=0.17×9+0.81=2.34(万元),可估计大多数年收入为9万元的家庭每年饮食支出约为2.34万元.。
2018版高中数学第二章统计2.4 线性回归方程学案苏教版必修3 编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2018版高中数学第二章统计2.4 线性回归方程学案苏教版必修3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2018版高中数学第二章统计2.4 线性回归方程学案苏教版必修3的全部内容。
2.4 线性回归方程1.理解线性回归的基本思想和方法,体会变量之间的相关关系.(难点)2.会画出数据的散点图,并会通过散点图判断这组数据是否具有线性关系.(重点)3.会求数据的线性回归方程,并根据线性回归方程做出合理的判断.(重点、难点)[基础·初探]教材整理1 变量间的关系阅读教材P74的内容,并完成下面的问题.1.变量间的关系(1)函数关系:变量之间的关系可以用函数表示,是一种确定性函数关系.(2)相关关系:变量之间有一定的联系,但不能完全用函数来表达.2.散点图从一个统计数表中,为了更清楚地看出x与y是否有相关关系,常将x的取值作为横坐标,将y的相应取值作为纵坐标,在直角坐标系中描点(x i,y i)(i=1,2,3,…),这样的图形叫做散点图.判断正误:(1)相关关系是一种不确定关系,而函数关系是一种确定关系.( )(2)商品的销售收入与广告支出经费是函数关系.( )(3)散点图越集中,则相关关系越强.()【解析】(1)√。
由函数关系及相关关系的定义知正确.(2)×.是相关关系,而不是确定关系,故错误.(3)×。
只有当散点图呈规律性分布时才具有相关关系.故错误.【答案】(1)√(2)×(3)×教材整理2 线性回归方程阅读教材P75~P76“例1”上边的内容,并完成下列问题.1.线性相关关系如果散点图中点的分布从整体上看大致在一条直线的附近,我们用直线错误!=bx+a拟合散点图中的这些点,像这样能用直线错误!=bx+a近似表示的相关关系叫做线性相关关系.2.线性回归方程设有n对观察数据如下:x x1x2x3…x ny y1y2y3…y n当a,b使Q112222n n2取得最小值时,就称错误!=bx+a为拟合这n对数据的线性回归方程,该方程所表示的直线称为回归直线.3.用回归直线进行数据拟合的一般步骤(1)作出散点图,判断散点是否在一条直线附近;(2)如果散点在一条直线附近,用公式错误!或求出a,b,并写出线性回归方程.填空:(1)有一个线性回归方程为错误!=2-1.5x,则变量x增加一个单位时,y平均________1.5个单位.(填“增加”或“减少”)【解析】∵b=-1。
2.4 线性回归方程(1)教学目标:1. 通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系;2. 在两个变量具有线性相关关系时,会在散点图中作出线性直线,会用线性回归方程进行预测;3. 知道最小二乘法的含义,知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程,了解(线性)相关系数的定义.教学重点:散点图的画法,回归直线方程的求解方法.教学难点:回归直线方程的求解方法.教学方法:引导发现、合作探究.教学过程:一、创设情景,揭示课题客观事物是相互联系的.过去研究的大多数是因果关系,但实际上更多存在的是一种非因果关系.比如说:某某同学的数学成绩与物理成绩,彼此是互相联系的,但不能认为数学是“因”,物理是“果”,或者反过来说事实上数学和物理成绩都是“果”,而真正的“因”是学生的理科学习能力和努力程度.所以说,函数关系存在着一种确定性关系,但还存在着另一种非确定性关系——相关关系.二、学生活动提出问题:两个变量之间的常见关系有几种?(1)确定性的函数关系,变量之间的关系可以用函数表示;(2)相关关系,变量之间有一定的联系,但不能完全用函数来表示.说明:不要认为两个变量间除了函数关系,就是相关关系,事实是,两个变量间可能毫无关系.比如地球运行的速度与某个人的行走速度就可认为没有关系.某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对照表:-0C,你能根据这些数据预测这天小卖部卖出热茶的杯数吗?如果某天的气温是5为了了解热茶销量与气温的大致关系,我们以横坐标x表示气温,纵坐标y表示热茶销量,建立直角坐标系,将表中数据构成的6个数对所表示的点在坐标系内标出,得到下图,今后我们称这样的图为散点图(scatterplot).从下图可以看出,这些点散布在一条直线的附近,故可用一个线性函数近似地表示热茶销量与气温之间的关系.选择怎样的直线近似地表示热茶销量与气温之间的关系?我们有多种思考方案:(1)选择能反映直线变化的两个点,例如取(4,50),(18,24)这两点的直线;(2)取一条直线,使得位于该直线一侧和另一侧的点的个数基本相同;(3)多取几组点,确定几条直线方程,再分别算出各条直线斜率、截距的平均值,作为所求直线的斜率、截距;……怎样的直线最好呢?三、建构数学1.最小平方法:=+的直线拟合散点图中的点,应使得该直线用方程为ˆy bx a=+与图中六与散点图中的点最接近.那么,怎样衡量直线ˆy bx a个点的接近程度呢?我们将表中给出的自变量x的六个值带入直线方程,得到相应的六个ˆy的值:26,18,13,10,4,b a b a b a b a b a b a +++++-+.这六个值与表中相应的实际值应该越接近越好.所以,我们用类似于估计平均数时的思想,考虑离差的平方和222222(,)(2620)(1824)(1334)(1038)(450)(64)Q a b b a b a b a b a b a b a =+-++-++-++-++-+-+- 21286b =26140382046010172a ab b a ++--+说明: (,)Q a b 是直线ˆybx a =+与各散点在垂直方向(纵轴方向)上的距离的平 方和,可以用来衡量直线ˆybx a =+与图中六个点的接近程度,所以,设法取,a b 的 值,使(,)Q a b 达到最小值.这种方法叫做最小平方法(又称最小二乘法)(method of least square ).先把a 看作常数,那么Q 是关于b 的二次函数.易知,当140382021286a b -=-⨯时, Q取得最小值.同理, 把b 看作常数,那么Q 是关于a 的二次函数.当14046012b a -=-时, Q 取得最小值.因此,当14038202128614046012a b b a -⎧=-⎪⎪⨯⎨-⎪=-⎪⎩时,Q 取的最小值,由此解得 1.6477,57.5568b a ≈-≈.所求直线方程为ˆ 1.647757.5568y x =-+.当5x =- 时,ˆ66y≈,故当气温为5-0C 时,热茶销量约为66杯. 2.线性相关关系:像这样能用直线方程ˆybx a =+近似表示的相关关系叫做线性相关关系(liner correlation).3.线性回归方程:一般地,设有n 个观察数据如下:当,a b 使2221122()()...()n n Q y bx a y bx a y bx a =--+--++--取得最小值时,就称ˆybx a =+为拟合这n 对数据的线性回归方程(linear regression equation ),该方程所表示的直线称为回归直线.上述式子展开后,是一个关于,a b 的二次多项式,应用配方法,可求出使Q 为最小值时的,a b 的值.即结论:1112211()()()n n ni i i i i i i n ni i i i n x y x y b n x x a y bx=====⎧-⎪=⎪⎨-⎪⎪=-⎪⎩∑∑∑∑∑,(*) ∑==n i i x n x 11, ∑==ni i y n y 11 说明:公式(*)的推导比较复杂,这里不作要求. 四、数学运用例题 下表为某地近几年机动车辆数与交通事故数的统计资料,请判断机动 车辆数与交通事故数之间是否有线性相关关系,如果具有线性相关关系,求出线 性回归方程;如果不具有线性相关关系,说明理由.解:在直角坐标系中画出数据的散点图,直观判断散点在一条直线附近,故具有线性相关关系.计算相应的数据之和:8888211111031,71.6,137835,9611.7ii i i i i i i i xy x x y ========∑∑∑∑,将它们代入(*)式计算得0.0774, 1.0241b a ≈=-, 所以,所求线性回归方程为0.0774 1.0241y x =-.巩固深化,反馈矫正:1.下面是我国居民生活污水排放量的一组数据(单位:103t )试分别估计1996年和2004年我国居民生活污水排放量. 2.一个工厂在某年里每月产品的总成本y(单位:万元)与月产量(单位:万件)之间有如下一组数据:(1)画出散点图; (2)求线性回归方程. 五、归纳整理,整体认识1.对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数,a b 的计算公式,算出,a b .由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误.2.求线性回归方程的步骤:①计算平均数y x ,;②计算i i y x 与的积,求∑iiyx ;③计算∑2ix;④将结果代入公式求a ;⑤用 x a y b -=求b ;⑥写出回归方程。
2.4 线性回归方程名师导航三点剖析一、变量之间关系在实际问题中,变量之间关系有两类:一类是确定性关系,变量之间关系可以用函数表示.例如,正方形面积S与边长a之间就是确定性关系,可以用函数S=a2表示.在实际问题中,变量之间关系除了确定性函数关系之外,还有一种非确定性关系.例如:商品销售收入与广告支出经费之间关系.我们不可否认商品销售收入与广告支出经费之间有着密切联系,但商品销售收入不仅与广告支出多少有关,还与商品质量、居民经济状况等因素有关.再如:粮食产量与施肥量之间关系.在一定范围内,施肥量越大,粮食产量就越高.但是,施肥量并不是决定粮食产量唯一因素,因为粮食产量还要受到土壤质量、降雨量、田间管理水平等因素影响.又如人身高与体重之间关系、人年龄与血压之间关系等,这些变量之间存在着密切关系,但它不能由一个变量数值准确地确定另一个变量数值.像这种自变量取一定值时,因变量取值带有一定随机性,这样两个变量之间关系,我们称之为相关关系.从某种意义上讲,函数关系可以看作是一种理想关系模型,而相关关系那么是一种非常普遍关系.研究与学习相关关系不仅可以使我们能够处理更为广泛数学问题,还可以使我们对函数关系认识上升到一个新高度.在现实生活中,存在大量相关关系,所以,寻找变量之间相关关系很有必要.在此,统计在其中发挥着非常重要作用.在相关关系中,变量关系不是完全确定,而是带有不确定性.这就需要通过收集大量数据(有时通过调查,有时通过试验),在对数据进展统计分析,发现其中规律,才能对它们之间关系作出判断.二、散点图在考虑相关关系中两个量关系时,为了对变量之间关系有一个大致了解,我们通常将变量所对应点描出来,这些点就组成了具有相关关系变量之间一组数据图形,通常称这种图为变量之间散点图.通过具有相关关系两个量散点图我们可以对这两个变量间关系有一个大致了解.例如:在7块并排、形状大小一样试验田上进展施化肥量对水稻产量影响试验,得到如下表所示一组数据(单位:kg).将表中各对数据在平面直角坐标系中描点,即可得到该组数据散点图,如图6-12所示:图6-12由图可发现,图中各点大致分布在一条直线附近.三、最小二乘法、线性回归方程1.最小二乘法由施化肥量对水稻产量影响试验所得到散点图可发现,图中各点,大致分布在一条直线y=a+bx 附近.故可用一个线性函数近似表示施化肥量与水稻产量之间关系.这种线性关系可以用多种方法来进展刻画,那么用什么样线性关系刻画会更好一些呢?有一个非常直观想法,一个好线性关系要保证这条直线与所有点都近.如果有n 个点:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),可以用下面表达式来刻画这些点与直线y=a+bx 接近程度:[y 1-(a+bx 1)]2+[y 2-(a+bx 2)]2+…+[y n -(a+bx n )]2.使得上式到达最小值直线y=a+bx 就是我们所要求直线,这种方法称为最小二乘法. 2.线性回归方程通过收集现实生活中两个有关联变量数据作出散点图,如果所有散点分布成或近似成一条直线,我们说这两个变量有线性关系(否那么就说两个变量不具有线性关系),然后运用最小二乘法思想,用一条直线来拟合两个变量之间关系:y=a+bx.要求所有点相对于该直线偏差平方与尽可能到达最小.我们把y=a+bx 称作线性回归方程,其中求线性回归方程一般步骤:(1)根据两组数据计算;,,,,,x ∑∑∑∑====n1i i i n1i 2i n1i i n1i i y x x y x y (2)代入(*)计算求a 、b 值; (3)代入y=a+bx.一般情况下,求线性回归方程可借助计算器与计算机来完成.问题探究问题1:在一次对人体脂肪含量与年龄关系研究中,研究人员获得了一组样本数据:人体脂肪含量与年龄之间关系根据上述数据,人体脂肪含量与年龄之间有怎样关系?探究:观察表中数据,大体上来看,随着年龄增加,人体中脂肪百分比也在增加.为了确定这一关系细节,我们需要进展数据分析.我们假设人年龄影响体内脂肪含量,于是,按照习惯,以x轴表示年龄,以y轴表示脂肪含量,得到相应散点图(如图6-13所示).图6-13从散点图我们可以看出,年龄越大,体内脂肪含量越高,图中点趋势说明两个变量之间确实存在一定关系,这个图支持了我们从数据表中得出结论.经计算可得到回归直线回归方程为yˆ=0.577x-0.448. 问题2:一般地,(x,y)n 组观察数据:x x 1 x 2 x 3 … x n yy 1y 2y 3…y n回归直线方程为y=a+bx ,那么直线y=a+bx 恒过定点是什么? 探究:由线性回归方程推导,可知方程系数a 、b 满足条件:x b ,x x n y x y x n b ni i n i i ni i ni i ni i i ---=∑∑∑∑∑=====y -a )())((2112111.由此不难发现,点(x ,y )坐标满足直线y=a+bx 方程.所以,由点与直线位置关系可得点(x ,y )在直线y=a+bx 上,即直线y=a+bx 恒过点(x ,y ).这里x =n1∑=ni i x 1,y =n1. 精题精讲例1.有一个同学家开了一个小卖部,他为了研究气温对热饮销售影响,经过统计,得到一个卖出热饮杯数与当天气温比照表: 摄氏温度/℃-547 12 15 19 23 27 31 36热饮杯数 1561513212813011610489 93 76 54(1)画出散点图;(2)从散点图中发现气温与热饮销售杯数之间关系一般规律; (3)求回归方程;(4)如果某天气温是2℃,预测这天卖出热饮杯数.思路解析根据所给数据,作出散点图,判断散点是否在一条直线附近;如果散点在一条直线附近,用公式(*)求出a、b,写出线性回归方程.答案:(1)散点图如图6-14所示:图6-14(2)从图中看到,各点散布在从左上角到右下角区域里,因此,气温与热饮销售杯数之间成负相关,即气温越高,卖出去热饮杯数越少.(3)从散点图可以看出,这些点大致分布在一条直线附近,因此,可用公式(*)求出回归方程系数.利用计算器容易求得回归方程yˆ=-2.352x+147.767.(4)当x=2时,yˆ=143.063.因此,某天气温为2℃时,这天大约可以卖出143杯热饮.例2.为研究某市家庭年平均收入与年平均生活支出关系,该市统计调查队随机调查了10个家庭,得数据如下:求回归直线方程.思路解析答案:列表.故可求得.y ,,,,x ni n n 17.27x 7.22y 88.32x 42.1102.14y 72.1102.171i i 1i 2i 1i 2i =======∑∑∑===∴b=0.833,a=-0.013.∴回归直线方程为y=0.833x -0.013.例3.随机调查了某地区10个商店建筑面积x(km 2)与年销售额y(百万元)样本如下: (1)求y 关于x 线性回归方程;(2)假设线性关系存在,那么对于一个拥有10 000m 2商店来说,它年销售额为多少? 思路解析答案:(1)列表.∴x=10×169.6=16.96,y=10×99.3=9.93.∴=3 174.9,=5 968.4,=1 822.79.∴ ∴y=0.48x+1.75.(2)当x=10时,y=6.55.∴年销售额约为655万元.绿色通道此题反映了生活中普遍存在商店面积与年销售额之间联系,并根据已有数据得出线性回归方程.这是一类日常生活中经常出现问题.商店面积与年销售额之间存在着线性相关关系,根据相关数据我们求出它们之间线性回归方程.利用该方程得出年销售额也只是一种估计.。
2.4 线性回归方程互动课堂疏导引导1.变量之间的关系在实际问题中,变量之间的常见关系的有两类:一类是确定性的函数关系;另一类是变量间有一定的联系,但不能完全用函数来表达,它们的关系带有随机性,我们说这两个变量具有相关关系.疑难疏引(1)对相关关系的理解应当注意以下几点:其一是相关关系与函数关系不同,因为函数关系是一种非常确定的关系,而相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.而函数关系可以看成是两个非随机变量之间的关系.因此,不能把相关关系等同于函数关系.其二是函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.例如,有人发现,对于在校儿童,鞋的大小与阅读能力有很强的相关关系.然而,学会新词并不能使脚变大,而是涉及到第三个因素——年龄.当儿童长大一些,他们的阅读能力会提高,而且由于长大,脚也变大.其三是在现实生活中存在着大量的相关关系,如何判断和描述相关关系,统计学发挥着非常重要的作用.变量之间的相关关系带有不确定性,这需要通过收集大量的数据,对数据进行统计分析,发现规律,才能作出科学的判断.(2)在考虑相关关系中的两个量的关系时,为了对变量之间的关系有一个大致的了解,我们通常将变量所对应的点描出来,这些点就组成了具有相关关系的变量之间的一组数据的图形,通常称这种图为变量之间的散点图.根据散点图中变量的对应点的离散程度,我们也可以准确地判断两个变量是否具有相关关系.散点图中变量的对应点如果分布在某条直线的周围,我们就可以得出结论,这两个变量具有相关关系.如果变量的对应点分布没有规律,我们就可以得出结论:这两个变量不具有相关关系.案例1 下列关系中,带有随机性相关关系的是____________.①正方形的边长与面积之间的关系②水稻产量与施肥量之间的关系③人的身高与年龄之间的关系④降雪量与交通事故的发生率之间的关系【探究】两变量之间的关系有两种:函数关系与带有随机性的相关关系.①正方形的边长与面积之间的关系是函数关系.②水稻产量与施肥量之间不是严格的函数关系,但是具有相关性,因而是相关关系.③人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而他们不具相关关系.④降雪量与交通事故的发生率之间具有相关关系.答案:②④规律总结准确理解变量间的相关关系是解答本题的关键.要准确区分两变量间相关关系和函数关系,事实上,现实生活中相关关系是到处存在的,从某种意义上讲,函数关系可以看作一种理想关系模型,而相关关系是一种普遍的关系.两者区别的关键点是“确定性”还是“随机性”.【探究】涉及两个变量:数学成绩与物理成绩,可以以数学成绩为自变量,考查因变量物理成绩的变化趋势.以x 轴表示数学成绩,y 轴表示物理成绩,可得相应的散点图. 由散点图(上图)可见,两者之间具有相关关系.规律总结 判断变量之间有无相关关系,一种常用的简便可行的方法是绘散点图,散点图是由数据点分布构成,是分析研究两个变量相关关系的重要手段.从散点图中,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量是线性相关的. 2.最小二乘法(最小平方法)、线性回归方程 (1)线性相关关系如果散点图中,相应于具有相关关系的两个变量所有观察值的数据点分布在一条直线的附近,我们称这两个变量之间具有线性相关关系.也就是说能用直线方程yˆ=bx+a 近似表示的相关关系叫线性相关关系. (2)最小二乘法(最小平方法)如果n 个点:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),可以用下面的表达式来刻画这些点与直线y=a+bx 的接近程度:[y 1-(a+bx 1)]2+[y 2-(a+bx 2)]2+…+[y n -(a+bx n )]2.就是我们所要求的直线,这种方法称为最小二乘法. a 、b 满足:,反映贴近程度的数据是:离差的平方和,即总离差Q=∑=ni 1(y i -a-bx i )2.这样,回归直线就是所有直线中Q 取最小值的那一条.这样使“离差平方和为最小”的方法,叫做最小二乘法.(最小平方法)(2)利用最小二乘法求回归系数a 、b 时,是将离差的平方和Q 转化为关于a 或b 的二次函数,利用二次函数知识求得的.(3)借助散点图,可以直观地看出两个变量之间是否具有相关关系.用最小二乘法思想建立的回归直线方程,能定量地描述两个变量的关系.回归系数a 和b,刻画了两个变量之间的变化趋势.利用回归直线,可以对问题进行预测,由一个变量的变化去推测另一个变量的变化.(4)求线性回归方程的一般步骤: ①根据两组数据计算x ,y ,∑=ni 1x i ,∑=ni 1y i ,∑=ni 12i x,∑=n i 1∑=ni 1x i y i ;②代入(*)计算求a 、b 的值;③代入yˆ=a+bx. 一般情况下,求线性回归方程可借助计算器和计算机来完成.另外,回归系数可简化为:b=∑∑==--ni ini iixn xy x n yx 1221,a=y -b x ,这里x=n1∑=ni 1x i ,y=n1∑=ni 1y i(2)求出y 对x 的回归直线方程;(3)若广告费为9万元,则销售收入约为多少万元?【探究】只有散点图大致表现为线性时,求回归直线方程才有实际意义. 【解析】(1)散点图如下:(2)观察散点图可知各点大致分布在一条直线附近,列出下列表格,以备计算a 、b.于是x =125,y =269,∑=41i 2i x =30,∑=41i 2i y =5 828,∑=41i xy i =418,代入公式得:b=∑∑==--41224144i ii ix x y x xy=573)25(4302692544182=⨯-⨯⨯-, a=y -b x =573269-×25=-2. 故y 对x 的回归直线方程为yˆ=573x-2,其中回归系数b=573,它的意义是:广告支出每增加1万元,销售收入y 平均增加573万元.(3)当x=9万元时,y ˆ=573×9-2=129.4万元. 即广告费为9万元,则销售收入为129.4万元.规律总结 (1)对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数a 、b 的计算公式,算出a 、b,由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误.(2)在利用公式:b=∑∑==--412241i ii ixn xy x n xy来计算回归系数时,为了方便常制表对应出x i y i ,2i x ,以利于求和.(3)研究变量间的相关关系,求得回归直线方程能帮助发现事物发展的一些规律,补充积累资料的不足,估计预测某些数据,为我们的判断和决策提供依据. 活学巧用1.下列两变量中具有相关关系的是( ) A.正方体的体积与边长B.匀速行驶的车辆的行驶距离与时间C.人的身高与体重D.人的身高与视力解析:选C.本题主要考查变量间的相关性,其中A,B 均为函数关系,D 则无相关关系. 答案:C2.下列各关系中不属于相关关系的是( ) A.产品成本与生产数量 B.球的表面积与体积 C.家庭的支出与收入 D.人的年龄与体重解析:球的表面积与体积之间是函数关系,不属于相关关系,选B. 答案:B3.下列关系属于负相关的是( ) A.父母的身高与子女身高的关系B.农作物产量与施肥量的关系C.吸烟与健康的关系D.数学成绩与物理成绩的关系解析:吸烟有害健康,因此,吸烟与健康之间的关系属于负相关.答案:C4.下列两个变量之间的关系哪个不是函数关系()A.圆的半径和它的面积B.正方形边长和它的面积C.正n边形的边数和顶点角度之和D.期中考试数学成绩与复习时间的投入量解析:期中考试数学成绩与复习时间的投入量是相关关系而不是函数关系.答案:D5.“名师出高徒”可以解释为教师的水平越高,学生的水平也越高.那么,教师的水平与学生的水平成什么相关关系?你能举出更多的描述生活中的两个变量相关关系的成语吗?解析:“名师出高徒”的意思是说有名的教师一定能教出高明的徒弟,通常情况下,高水平的教师有很大趋势教出高水平的学生,所以,教师的水平与学生的水平成正相关关系,生活中这样的成语很多,如“龙生龙,凤生凤,老鼠的孩子会打洞” .6.现随机抽取某校10名学生在入学考试中的数学成绩x与入学后的第一次数学成绩y,数据如下:问这10名学生的两次数学考试成绩是否具有相关关系?解析:应用散点图分析.两次数学考试成绩散点图如下图所示.由散点图可以看出两个变量的对应点集中在一条直线的周围,且y随x的变大而变大,具有正相关关系.因此,这10名学生的两次数学考试成绩具有相关关系.7.变量y与x之间的回归方程()A.表示y与x之间的函数关系B.表示y和x之间的不确定性关系C.反映y和x之间真实关系的形式D.反映y与x之间的真实关系达到最大限度的吻合解析:回归直线是与数据点最贴近的直线,y与x之间的回归方程,反映了y与x之间的真实关系达到最大限度的吻合.答案:D8.设有一个回归方程yˆ=2-1.5x,当变量x增加一个单位时()A.y平均增加1.5个单位B.y 平均增加2个单位C.y 平均减少1.5个单位D.y 平均减少2个单位解析:'ˆy=2-1.5(x+1)=2-1.5x-1.5=y ˆ-1.5. 答案:C9.线性回归方程表示的直线yˆ=a+bx 必定过( ) A.(0,0)点 B.(x ,0)点 C.(0, y )点 D.(x ,y )点 解析:回归直线函数a 、b 有公式a=y -b x ,即y=a+b x ∴直线yˆ=a+bx 必定过(x ,y )点. 答案:D10.回归直线方程的系数a,b 的最小二乘估计a,b,使函数Q (a,b )最小,Q 函数指( ) A.∑=ni 1(y i -a-bx i )2B.∑=ni 1|y i -a-bx i |C.(y i -a-bx i )2D.|y i -a-bx i |解析:Q=(y 1-bx 1-a)2+(y 2-bx 2-a)2+…+(y n -bx n -a)2=∑=ni 1(y i -bx i -a)2.答案:A11.观测两相关变量得如下数据: x y -1 -9 -2 -7 -3 -5 -4 -3 -5 -1 5 1 3 5 4 3 2 7 1 9则两变量间的回归直线方程是( ) A.y=21x-1 B.y=x C.y=2x+31D.y=x+1 解析:由线性回归方程系数的求解公式,易得b=∑∑==--101221011010i ii iixxy x yx =1,a=y -b x =0.∴线性回归方程为y=x. 答案:B(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线;(3)据(2)的结果估计当房屋面积为150 m 2时的销售价格. 解析:(1)数据对应的散点图如下图所示:(2)x =51∑=51i x i =109,∑=51i (x i -x )2=1 570,y =23.2,∑=51i (x i -x )(y i -y )=311.2.设所求回归直线方程为yˆ=bx+a,则 bˆ=∑∑==---51251)())((i ii i ix xy y x x=15702.311≈0.198 2, aˆ=y -b x =23.2-109×0.198 2≈1.596 2. 故所求回归直线方程为yˆ=-0.198 2x+1.596 2. (3)据(2),当x=150 m 2时,销售价格的估计值为:y ˆ=0.198 2×150+1.596 2=31.326 2(万元).13.为研究某市家庭年平均收入与年平均生活支出的关系,该市统计调查队随机调查了10个求回归直线方程.∴b=0.833,a=-0.013.∴回归直线方程为y=0.833x-0.013.。