高中数学人教a版选修2-3:3.1 回归分析的基本思想及其初步应用含解析
- 格式:doc
- 大小:196.00 KB
- 文档页数:11
第四课时教学目标 知识与技能通过典型案例的探究,进一步了解回归分析的基本思想和求回归方程的步骤. 过程与方法通过对回归模型的选择,使学生进一步体会建立回归模型的步骤,体会各个步骤的功能和重要性.情感、态度与价值观通过案例的分析,培养学生的探索精神,提高对数据的处理能力,并且使学生了解回归分析在生活实际中的应用,增强数学的应用意识,提高学习兴趣.重点难点 教学重点:掌握在解决实际问题的过程中寻找更好的模型的方法,总结求回归方程的步骤,会用合适的方法进行模型分析.教学难点:如何根据散点图选择合适的回归模型并对其拟合效果进行检验. 教学过程引入新课(2)若体重超过相同身高男性体重平均值的1.2倍为偏胖,低于平均值的0.8为偏瘦,那么这个地区一名身高为175 cm ,体重为82 kg 的在校男生的体重是否正常?学生活动:合作交流,探讨方案并计算检验. 学情预测:方案一:计算相关系数r≈0.96>0.75,故y 与x 之间具有很强的线性相关性.设y 与x 之间的回归方程为y ^=b ^x +a ^,则b ^=∑i =112x i y i -12x y∑i =112x 2i -12x2≈0.431 9,a ^ =y -b ^x ≈-25.679,故回归方程为:y ^=0.431 9x -25.679. 当x =175时,y ^≈55.15.因为55.15×1.2=66.18<82,故这名男生偏胖. 方案二:画出散点图如图所示:由表中数据可得z 与x 之间的回归直线方程为z ^=0.693+0.020x ,则有 y ^=e 0.693+0.020x.当x =175时,y ^≈66.22,由于66.22×1.2=79.464<82,所以这名男生偏胖.设计目的:复习回归分析的基本步骤,让学生体会回归思想在实际问题中的应用,在操作过程中锻炼学生的数据处理能力.探究新知提出问题:虽然两种解法的结论是一致的,但分析过程同学们可以发现,两种解法中求得的体重平均值是不同的,试分析两种模型哪种更合适?学生活动:讨论交流.学情预测:可能学生会出现争论:一种观点:原因出在选取的回归模型不同,从散点图上观察,选取指数型模型可能更好,得到的答案可信度可能更高.另一种观点:计算x与y的相关系数可得:r≈0.96>0.75,显示具有很强的线性相关性,故采用线性回归模型不会出错.提出问题:怎样来评判这两种解法呢?学生活动:分组合作,讨论解决的方法.学情预测:可以求相关指数、计算残差平方和或画残差图来分析两种模型的拟合效果.对于方案1:残差平方和约为:190.424,相关指数:R21≈0.93,残差图:对于方案2:残差平方和约为:33.8,相关指数:R22≈0.988,残差图:通过图形可以发现,方案二在数据拟合效果上更好,故应该采用方案二的结论.设计目的:通过对问题的探讨,让学生回顾学过的比较回归模型拟合效果的方法,体会在进行回归分析时方程类型合理选取的重要性.理解新知提出问题:通过对上面问题的分析,同学们觉得进行线性回归分析时,确定完变量后是计算线性相关系数还是画散点图?学生活动:学生分组讨论.学情预测:应该是先画散点图,根据散点图判断出回归方程的类型进行求解,当根据图形无法确定哪种方程形式更合理时,可多设出几个方程分别求出,再根据残差分析和计算相关指数来比较回归方程的拟合效果,选择拟合效果最好的方程进行预测.教师:残差分析的作用不光在于比较回归模型的拟合效果,它还有一个重要的作用,就是通过残差样本点的分布,还可以发现样本点收集过程中的错误,有利于纠正采集中的错误.提出问题:同学们自己能否把回归分析的步骤补充完整.学生活动:分组讨论,合作交流.学情预测:(1)确定变量;(2)画散点图;(3)分析回归模型类型;(4)求回归方程;(5)分析拟合效果.设计目的:让学生整理回归分析的基本步骤,进一步明确每一个步骤的作用和重要性.运用新知例1通常一个人的身高越高,他的脚就越大,为了调查这一问题,对9名高三男生的身高和脚长进行测量,得到如下数据:(单位:cm)(2)如果一名学生的身高为185 cm,估计他的脚长.思路分析:先画出散点图,根据散点图确定回归模型的类型,然后求y与x之间的回归方程并进行预测.解:(1)根据上表中的数据,作出散点图.由图可以看出,身高与脚长之间的总体趋势成一条直线,即它们线性相关,因此可用线性回归模型来拟合,设线性回归模型为y ^ =b ^ x +a ^,由图中数据可求得回归方程为:y ^=0.163x -2.037.(2)当x =185时,y ^≈28.1,即当一名学生的身高185 cm 时,估计他的脚长为28.1 cm. 【变练演编】例2下表是1957年美国旧轿车价格的调查资料,以x 表示轿车的使用年数,y 表示相应的年均价格,求y 关于x 的方程.思路分析:根据散点图,判断回归方程的类型,当不能确定时,就多选择几个进行比较选择.解:画出散点图:根据样本点的分布规律,若选择线性回归模型,可设方程为y ^=b ^x +a ^,由图中数据可求得回归方程为:y ^=-255.14x +2 371.5,计算相关指数R 21=0.876 3.若选择指数型回归方程模型,可设为y ^=c 1ec 2x ,于是令z =lny ,变换后的数据:由图可知各点基本位于一条直线附近,由上表中数据可得线性回归模型为z ^=8.165-0.298x ,因此旧轿车的平均价格对使用年数的非线性回归模型为:y ^=e 8.165-0.298x计算相关指数R 22=0.992 4,因为R 22>R 21,故非线性回归模型y ^=e 8.165-0.298x的拟合效果更好.所以y 关于x 的方程应为y ^=e 8.165-0.298x.设计意图:进一步体会回归分析思想的应用,熟悉求回归方程的基本步骤.【达标检测】1.某化工厂为预测某产品的回收率y ,需要研究它和原料有效成分含量之间的相关关系.现取了8对观测值,计算得:∑i =18x i =52,∑i =18y i =228,∑i =18x 2i =478,∑i =18x i y i =1 849,则y 与x 的回归直线方程是( )A.y ^=11.47+2.62x B.y ^=-11.47+2.62x C.y ^=2.62x +11.47x D.y ^=11.47-2.62x2.相关的一组数据如下表所示,它们的线性回归方程为y ^=0x +1.5,则当解释变量x =1时,预测变量yA.1.5 B .1.3 C .1.4 D .1.55对于授课天数与分数是否存在回归直线,下列说法正确的是( ) A .一定存在 B .可能存在也可能不存在 C .一定不存在 D .以上都不正确 答案:1.A 2.A3.A 解析:作出散点图进行直观分析,也可以求出相关系数进行判断,答案选A. 课堂小结师生回顾课堂内容,由学生进行小结: 1.建立回归模型的基本步骤: 2.如何选择合适的回归模型:3.如何将非线性回归模型转化为线性回归模型. 补充练习 【基础练习】1.散点图在回归分析中的作用是( )A .查找个体个数B .比较个体数据大小关系C .探究个体分类D .粗略判断变量是否相关2.设两个变量x 和y 之间具有线性相关关系,它们的相关系数是r ,y 关于x 的回归直线的斜率是b ,纵截距是a ,那么必有( )A .b 与r 的符号相同B .a 与r 的符号相同C .b 与r 的符号相反D .a 与r 的符号相反3.一组观察值(x 1,y 1),(x 2,y 2),…,(x n ,y n )之间满足y i =a +bx i +e i (i =1,2,…,n),若e i 恒为0,则R 2为__________.答案或提示:1.D 2.A3.1 解析:e i =0, i =1ne 2i =0,R2=1,其实此时随机误差e 为0,即没有误差,y 与x是确定的函数关系.所以答案为1. 【拓展练习】求y 对x 的线性回归方程,并检验回归方程的显著性.解:x ≈0.543,y ≈20.74,∑7i =1x 2i =2.595,∑7i =1y 2i =3 094.72,∑7i =1x i y i =85.45. ∴b ^=85.45-7×0.543×20.742.595-7×(0.543)2≈12.46,a ^ =20.74-12.46×0.543≈13.97,∴所求回归直线方程为y ^=13.97+12.46x. 利用相关系数检验是否显著:∑7i =1x i y i -7x y ≈6.62,∑7i =1x 2i -7x 2≈0.531,∑7i =1y 2i -7y 2≈83.69, ∴r≈0.993,由于r >0.75,故钢线碳含量对于电阻的效应线性相关关系显著.设计说明本节课以问题创设情境引发矛盾,并引导学生分析矛盾产生的原因,以问题为主线,展开对建立回归方程各个步骤的分析,引导学生认识各个步骤的重要性,结合实际问题,以引起学生的重视.在问题的解决过程中,注意引导学生合作交流,以培养学生的团队合作精神,并让学生利用计算器进行分析验证,提高学生对数据的处理能力.由于本节课是建立在前三节课的基础上,故本节课定位于一节习题课,重点是对前三节内容的梳理和总结,帮助学生形成一个清晰的知识结构,强化回归思想的应用意识.备课资料(此栏目可参考:http://www.zhyh,org/?action=copyright!show&id=1829)如何利用Excel软件求回归模型的方程以及相关指数R2.Excel软件是一款功能强大的数据处理软件,利用软件中自带的功能,不但可以画出散点图,还可以根据数据轻松求出回归方程和相关指数R2,现举例说明:试建立y与x之间的回归方程.第一步:选中表格中的数据,粘贴到Excel中第二步:选中Excel中的数据第三步:单击菜单栏的插入——图表再在图表选项中选择散点图单击完成,得到如图所示的散点图第四步:右键单击散点图中的样本点选择:添加趋势线,选择不同的回归类型单击:选项勾选:显示公式和显示R平方值,单击确定从图中就可以得到回归方程和相关指数了.(设计者:杨雪峰)。
教学设计3.1 回归分析的基本思想及其初步应用错误!教材分析1.教材的地位和作用高中新课程中增加了有关统计学初步的内容,先后出现在必修3和选修12(文科)、选修23(理科)中.《数学3(必修)》中的“统计”一章,给出了运用统计的方法解决问题的思路.“线性回归分析”是其介绍的一种分析、整理数据的方法.在这一部分中,学习了如何画散点图、利用最小二乘法的思想、利用计算器求回归直线方程、利用回归直线方程进行预报等内容.然而在大量的实际问题中,两个变量不一定都呈线性相关关系,它们可能呈指数关系或对数关系等非线性关系,本节就是在学习了如何建立线性回归模型的基础上,探索如何建立非线性关系的回归模型.通过本节的学习,使学生了解回归分析的必要性和回归分析的基本思想,明确回归分析的基本方法和基本步骤,学会以科学的态度评价两个变量的相互关系,培养学生运用所学内容解决实际问题的能力.2.课时划分《回归分析的基本思想及其初步应用》的教学分四个课时完成.第一课时:介绍线性回归模型的数学表达式,解释随机误差项产生的原因,使学生能正确理解回归方程的预报结果;第二课时:从相关系数、相关指数和残差分析角度探讨回归模型的拟合效果,以及建立回归模型的基本步骤;第三课时:介绍两个变量非线性相关关系;第四课时:回归分析的应用.第一课时教学目标知识与技能通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.过程与方法让学生经历数据处理的过程,培养他们对数据的直观感觉,体会统计方法的特点,认识统计方法的应用;通过使用转化后的数据,利用计算器求相关指数,使学生体会使用计算器处理数据的方法.情感、态度与价值观从实际问题中发现已有知识的不足,激发好奇心、求知欲;通过寻求有效的数据处理方法,开阔学生的思路,培养学生的探索精神和转化能力;通过案例的分析,使学生了解回归分析在生活实际中的应用,增强数学“取之生活,用于生活”的意识,提高学习兴趣.重点难点教学重点:理解回归分析的基本思想,掌握求回归直线方程的步骤以及对随机误差e的认识.教学难点:掌握利用回归分析的基本思想处理实际问题的方法,理解随机误差的来源和对预报变量的影响.错误!错误!“名师出高徒"这句谚语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?活动设计:学生独立思考回答问题.学情预测:学生可能会说“有名气的老师不一定能教出厉害的学生".教师提问:为什么?学情预测:两者之间有一定的关系,但不是必然关系,即名师也不一定出高徒,二者之间是相关关系.设计意图:复习两个变量之间的关系,为线性分析做好铺垫.提出问题:我们知道函数关系是一种确定性关系,而相关关系是一种非确定性关系.上面所提的“名师"与“高徒"之间的关系就是相关关系.那么,在一般情况下,人的身高与体重之间是什么关系?试设计一个方案,来分析某大学女大学生的身高与体重之间的关系,并以此为依据来预报身高172 cm的女大学生的体重.学生活动:学生独立思考,小组合作交流讨论.活动结果:可以采用统计的方法解决这一问题,先采用随机抽样的方法,从在校女大学生中抽取样本,记录其身高和体重,然后通过所得数据建立线性回归模型,并根据所得模型来预报身高为172 cm女生的体重.其步骤:收集数据→作散点图→求回归直线方程→利用方程进行预报.设计目的:合理设计问题,使学生进一步掌握用统计方法解决问题的基本步骤:提出问题、收集数据、分析整理数据、进行预测或决策.错误!若从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:。
3.1 回归分析的基本思想及其初步应用课前导引问题导入函数关系是一种确定性关系,而相关关系则是一种非确定性关系.回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.本节我们将在数学3模块的基础上进一步讨论回归分析的基本思想及初步应用.知识预览1.样本点的中心对于一但具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),我们知道其回归方程的截距和斜率的最小二乘估计公式分别有:x b y aˆˆ-= b ˆ=∑∑==---n i i n i i i x xy y x x 121)())(( 其中∑==ni i x n x 11 ∑==ni i y n y 11 (y ,∞)称为____________注:回归直线过样本点的中心.2.线性回归模型y=bx+a+e这里a 和b 为模型的未知参数,e 是y 与y =bx+a 之间的误差.通常e 为随机变量,称为随机误差,它的均值E (e )=0,方差D (e )=σ2>0.这样线性回归模型的完整表达式为: ⎩⎨⎧==++=2)(,0)(σe D e E e a by y (3) 说明:在线性回归模型(3)中,随机误差e 的方差σ2越小,通过回归直线y =bx+a 预报真实值y 的精度越高.随机误差是引起预报值yˆ与真实值y 之间的误差的原因之一,其大小取决于随机误差的方差.另一方面,由于公式(1)和(2)中aˆ和b ˆ为截距和斜率的估计值,它们与真实值a 和b 之间也存在误差,这种误差是引起预报值yˆ与真实值y 之间误差的另一个原因. 3.残差(residual)i e ˆ=y i -i y ˆ=y i -i x b ˆ-a ˆ,i=1,2,…,n,i eˆ称为相应于点(x i ,y i )的残差.类比样本方差估计总体方差的思想,可以用2ˆσ= ∑=-=-n i i Q n e n 1221ˆ21(a ˆ,b ˆ)(n >2)作为σ2的估计量,其中a ˆ和b ˆ由公式(1)(2)给出,Q (a ˆ,b ˆ)称为残差平方和(residual sum of squares).可以用2ˆσ衡量回归方程的预报精度.通常,2ˆσ越小,预报精度越高. 4.残差分析在研究两个变量间的关系时,首先要根据散点图来精略判断它们是否线性相关,是否可以用线性回归模型来拟合数据.然后,可以通过残差 1ˆe,2ˆe ,…,n e ˆ 来判断模型拟合的效果,判断原始数据中是否存在可疑数据.这方面的分析工作称为残差分析.5.残差图我们可以利用图形来分析残差特性.作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图.下图是以样本编号为横坐标的残差图.从图中可以看出,第1个样本点和第6个样本点的残差比较大,需要确认在采集这两个样本点的过程中是否有人为的错误.如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数据;如果数据采集没有错误,则需要寻找其他的原因.另外,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适.这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.另外,我们还可以用相关指数R 2来刻画回归的效果,其计算公式是:R 2=1-∑∑==--ni i n i i i y y y y 1212)()ˆ(. 显然,R 2取值越大,意味着残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中,R 2表示解释变量对于预报变量变化的贡献率.R 2越接近于1,表示回归的效果越好(因为R 2越接近于1,表示解释变量和预报变量的线性相关性越强).如果对某组数据可能采取几种不同的回归方程进行回归分析,也可以通过比较几个R 2,选择R 2大的模型作为这组数据的模型.6.建立回归模型的基本步骤(1)确定研究对象,明确哪个变量是解释变量的散点图,观察它们之间的关系(如是否存在线性关系等);(2)画出确定好的解释变量和预报变量,哪个变量是预报变量;(3)由经验确定回归方程的类型(如我们观察到数据呈现线性关系,则选用线性回归方程y=bx+a);(4)按一定规则估计回归方程中的参数(如最小二乘法);(5)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性等等);若存在异常,则检查数据是否有误,或模型是否合适等.7.比较拟合效果的基本步骤对于给定的样本点(x 1,y 1),(x 2,y 2),…,(x n ,y n ),两个含有未知参数的模型)1(y =f(x,a)和)2(y =g(x,b),其中a 和b 都是未知参数.可以按如下的步骤来比较它们的拟合效果:(1)分别建立对应于两个模型的回归方程)1(ˆy=f(x,a ˆ)与)2(ˆy =g(x,b ˆ),其中a ˆ和b ˆ分别是参数a 和b 的估计值;(2)分别计算两个回归方程的残差平方和)ˆ(ˆ1)1()1(∑=-=n i i i y y Q 2与21)2()2()ˆ(ˆ∑=-=ni i i y y Q ;(3)若)2()1(ˆˆQ Q<,则)1(ˆy =f(x,a ˆ)的效果比)2(ˆy =g(x,b ˆ)的好;反之, )1(ˆy =f(x,a ˆ)的效果不如)2(ˆy=g(x, b ˆ)的好.。
回归分析1.回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫作回归直线.求回归直线方程的一般步骤:作出散点图(由样本点是否呈条状分布来判断两个量是否具有线性相关关系),若存在线性相关关系→②求回归系数→③写出回归直线方程,并利用回归直线方程进行预测说明.2.回归分析:对具有相关关系的两个变量进行统计分析的一种常用方法.建立回归模型的基本步骤是:①确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;②画好确定好的解释变量和预报变量的散点图,观察它们之间的关系(线性关系).③由经验确定回归方程的类型.④按一定规则估计回归方程中的参数(最小二乘法);⑤得出结论后在分析残差图是否异常,若存在异常,则检验数据是否有误,后模型是否合适等.3.利用统计方法解决实际问题的基本步骤:①提出问题;②收集数据;③分析整理数据;④进行预测或决策.4.残差变量e 的主要来源:①用线性回归模型近似真实模型(真实模型是客观存在的,通常我们并不知道真实模型到底是什么)所引起的误差.可能存在非线性的函数能够更好地描述y 与x 之间的关系,但是现在却用线性函数来表述这种关系,结果就会产生误差.这种由于模型近似所引起的误差包含在e 中.②忽略了某些因素的影响.影响变量y 的因素不只变量x 一个,可能还包含其他许多因素(例如在描述身高和体重关系的模型中,体重不仅受身高的影响,还会受遗传基因、饮食习惯、生长环境等其他因素的影响),但通常它们每一个因素的影响可能都是比较小的,它们的影响都体现在e 中.③观测误差.由于测量工具等原因,得到的y 的观测值一般是有误差的(比如一个人的体重是确定的数,不同的秤可能会得到不同的观测值,它们与真实值之间存在误差),这样的误差也包含在e 中.上面三项误差越小,说明我们的回归模型的拟合效果越好.名师要点解析例1研究某灌溉渠道水的流速与水深之间的关系,测得一组数据如下:(1)求y对x的回归直线方程;(2)预测水深为1.95m时水的流速是多少?【分析】本题考查如何求回归直线的方程,可先把有关数据用散点图表示出来,若这些点大致分布在通过散点图中心的一条直线附近,说明这两个变量线性相关,从而可利用我们学过的最小二乘估计思想及计算公式求得线性回归直线方程.【解】(1)由于问题中要求根据水深预报水的流速,因此选取水深为解释变量,流速为预报变量,作散点图:由图容易看出,x与y之间有近似的线性关系,或者说,可以用一个回归直线方程来反映这种关系.由计算器求得.对x的回归直线方程为.(2)由(1)中求出的回归直线方程,把x=1.95代入,易得。
1 【优化方案】2013-2014学年高中数学 3.1 回归分析的基本思想及其初步应用能力提升(含解析)新人教A 版选修2-31.如果某地的财政收入x 与支出y 满足线性回归方程y =bx +a +e (单位:亿元),其中b =0.8,a=2,|e |≤0.5,如果今年该地区财政收入为10亿元,则年支出预计不会超过( )A .10亿B .9亿C .10.5亿D .9.5亿解析:选C.∵x =10时,y =0.8×10+2+e =10+e ,又∵|e |≤0.5,∴y ≤10.5.2.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量(单位:千箱)与单位成本(单位:元)的资料进行线性回归分析,结果如下:x =72,y =71,∑i =16x 2i =79,∑i =16x i y i =1 481. 则销量每增加1 000箱,单位成本下降________元.解析:由题意知b ^=1 481-6×72×7179-6×⎝⎛⎭⎫722≈-1.818 2, a ^=71-(-1.818 2)×72≈77.36,y ^=-1.818 2x +77.36,销量每增加1千箱,则单位成本下降1.818 2元.答案:1.818 23.为了研究某种细菌繁殖的个数随时间x 变化的情况,收集如下数据:天数x (天) 1 2 3 4 5 6繁殖个数y (个) 6 12 25 49 95 190(1)(2)观察散点图是否可用曲线y =c 1e c 2x 拟合,描述解释变量与预报变量之间的关系. 解:(1)作出散点图,如图所示:(2)由散点图可以看出样本点分布在一条指数型函数y =c 1e c 2x 曲线的周围,于是令z =ln y ,则x 1 2 3 4 5 6z 1.79 2.48 3.22 3.89 4.55 5.25由计算得z ^=0.69x +1.115,则有y ^=e 0.69x +1.115.。
课堂探究探究一 求线性回归直线方程(1)散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析.(2)求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.【典型例题1】某商场经营一批进价是30元/件的小商品,在市场试验中发现,此商品的销售单价x (x 取整数)元与日销售量y 台之间有如下关系(1)y 与x (方程的斜率保留一个有效数字)(2)设经营此商品的日销售利润为P 元,根据(1)写出P 关于x 的函数关系式,并预测当销售单价x 为多少元时,才能获得最大日销售利润.解:(1)散点图如图所示,从图中可以看出这些点大致分布在一条直线附近,因此两个变量线性相关.设回归直线为y ^=b ^x +a ^,由题知x =42.5,y =34, 则求得b ^=∑i =14(x i -x )(y i -y )∑i =14(x i -x )2=-370125≈-3. a ^=y -b ^x =34-(-3)×42.5=161.5.∴y ^=-3x +161.5.(2)依题意有P =(-3x +161.5)(x -30) =-3x 2+251.5x -4 845=-3⎝⎛⎭⎫x -251.562+251.5212-4 845. ∴当x =251.56≈42时,P 有最大值,约为426.即预测当销售单价为42元时,才能获得最大日销售利润.规律总结 先根据所给数据画出散点图,判断y 与x 是否具有线性相关关系,在此基础上利用回归方程系数的有关公式,求出相应的系数,然后结合函数知识求出日销售利润最大时的销售单价.探究二 线性回归分析解答本类题目应先通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图或相关指数R 2来分析函数模型的拟合效果,在此基础上,借助回归方程对实际问题进行分析.【典型例题2】在一段时间内,某种商品的价格x 元和需求量y 件之间的一组数据为:且知x 与y 解:x =15×(14+16+18+20+22)=18,y =15×(12+10+7+5+3)=7.4,∑i =15x 2i =142+162+182+202+222=1 660, ∑i =15y 2i =122+102+72+52+32=327,∑i =15x i y i =14×12+16×10+18×7+20×5+22×3=620,∴b ^=∑i =15x i y i -5x y∑i =15x 2i -5x 2=620-5×18×7.41 660-5×182=-4640=-1.15. ∴a ^=7.4+1.15×18=28.1,∴回归直线方程为y ^=-1.15x +28.1. 列出残差表为∴∑i =15(y i -y i ^)2=0.3,∑i =15(y i -y )2=53.2,R 2=1-∑i =15(y i -y i ^)2∑i =15(y i -y )2≈0.994.故R 2≈0.994,说明拟合效果较好.规律总结 “相关指数R 2、残差图”在回归分析中的作用:(1)相关指数R 2是用来刻画回归效果的,由R 2=1-∑i =1n(y i -y i ^)2∑i =1n(y i -y )2可知R 2越大,意味着残差平方和越小,也就是说模型的拟合效果就越好.(2)残差图也是用来刻画回归效果的,判断依据是:残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合精度越高, 回归方程预报精度越高.探究三 求非线性回归方程非线性回归问题有时并不给出经验公式,这时我们可以画出已知数据的散点图.把它与必修模块数学1中学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量置换,把问题化为线性回归分析问题,使之得到解决.【典型例题3】假设关于某设备的使用年限x 和支出的维修费用y (万元),有如下表的统计资料:若由资料知y (1)线性回归方程y ^=b ^x +a ^.(2)估计使用年限为10年时,维修费用是多少? (3)计算总偏差平方和、残差平方和及回归平方和.(4)求R 2并说明模型的拟合效果. 解:(1)将已知条件制成下表设回归方程为y =b x +a ,于是有b ^=∑i =15x i y i -5x y∑i =15x 2i -5x 2=112.3-5×4×590-5×42=1.23,a ^=y -b ^ x =5-1.23×4=0.08,所以线性回归方程是y ^=1.23x +0.08.(2)当x =10时,y ^=1.23×10+0.08=12.38, 即估计使用10年时维修费用是12.38万元. (3)总偏差平方和:∑i =15(y i -y )2=15.78,残差平方和:y 1^=2.46+0.08=2.54,y 2^=3.77,y 3^=5,y 4^=6.23,y 5^=7.46,∑i =15(y i -y i ^)2=0.651,回归平方和:15.78-0.651=15.129.(4)R 2=1-∑i =15(y i -y i ^)2∑i =15(y i -y )2=1-0.65115.78≈0.958 7,模型的拟合效果较好,使用年限解释了95.87%的维修费用支出. 规律总结 把非线性回归问题转化为线性回归问题,拓展了解题思路. 探究四 易错辨析易错点 残差平方和与相关指数的理解不清致误【典型例题4】对两个变量y 和x 进行回归分析,得到一组样本数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则下列说法中不正确的是( )A .由样本数据得到的回归方程y ^=b ^x +a ^必过样本点的中心(x ,y ) B .残差平方和越小的模型,拟合的效果越好C .用相关指数R 2来刻画回归效果,R 2的值越小,说明模型的拟合效果越好D .若变量y 和x 之间的相关系数r =-0.936 2,则变量y 和x 之间具有线性相关关系 错解:B错因分析:对残差平方和和相关指数R 2理解错误.正解:R 2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好. 答案:C。
学业分层测评
(建议用时:45分钟)
[学业达标]
一、选择题
1.为了研究变量x和y的线性相关性,甲、乙两人分别利用线性回归方法得到回归直线l1和l2,已知两人计算过程中x-,y-分别相同,则下列说法正确的是( )
A.l1与l2一定平行
B.l1与l2重合
C.l1与l2相交于点(x-,y-)
D.无法判断l1和l2是否相交
【解析】回归直线一定过样本点的中心(x-,y-),故C正确.
【答案】 C
2.甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R2分别如下表:
哪位同学建立的回归模型拟合效果最好?( )
A.甲B.乙C.丙D.丁
【解析】相关指数R2越大,表示回归模型的拟合效果越好.
【答案】 A
3.对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是( )
【解析】用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高.
【答案】 A
4.对于指数曲线y=ae bx,令U=ln y,c=ln a,经过非线性化回归分析后,可转化的形式为( )
A.U=c+bx B.U=b+cx
C.y=c+bx D.y=b+cx
【解析】由y=ae bx得ln y=ln(ae bx),∴ln y=ln a+
ln e bx,
∴ln y=ln a+bx,∴U=c+bx.故选A.
【答案】 A
5.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如表所示:
则y 对x 的线性回归方程为( ) A.y
^=x -1 B.y ^=x +1 C.y ^=88+1
2
x D.y
^=176 【解析】 设y 对x 的线性回归方程为y
^=b ^x +a ^,
因为b ^=-2×(-1)+0×(-1)+0×0+0×1+2×1(-2)2+22=12,a ^=176-12×176
=88,所以y 对x 的线性回归方程为y ^
=1
2
x +88.
【答案】 C 二、填空题
6.甲、乙、丙、丁四位同学各自对A ,B 两变量的线性相关性进行分析,并用回归分析的方法分别求得相关指数R 2与残差平方和Q(a
^,b ^)如下表:
则能体现A ,B 两个变量有更强的线性相关性的为________.
【解析】 丁同学所求得的相关指数R 2最大,残差平方和Q(a ^,b ^)最小.此
时A ,B 两变量线性相关性更强.
【答案】 丁。