高二数学《1.1回归分析的基本思想及其初步应用》教案 文
- 格式:doc
- 大小:329.00 KB
- 文档页数:4
回归分析的基本思想及其初步应用教学设计
【教学目标】
在《数学③(必修)》之后,学生已经学习了两个变量之间的相关关系,包括画散点图,最小二乘法求回归直线方程等内容.在人教A版选修1-2第一章第一节“回归分析的基本思想及其初步应用”这一节中进一步介绍回归分析的基本思想及其初步应用.这部分内容《教师用书》共计4课时,第一课时:介绍线性回归模型的数学表达式,解释随机误差项产生的原因,使学生能正确理解回归方程的预报结果,并能从残差分析角度讨论回归模型的拟合效果;第二课时:从相关系数、相关指数角度探讨回归模型的拟合效果,以及建立回归模型的基本步骤;第三课时:介绍两个变量非线性相关关系;第四课时:回归分析的应用. 本节课是第一课时的内容.
1、知识目标
认识随机误差;认识残差
2、能力目标
(1)会使用电脑画散点图、求回归直线方程;
(2)能正确理解回归方程的预报结果.
3、情感目标
通过本节课的学习,加强数学与现实生活的联系,以科学的态度评价两个变量的相关性,理解处理问题的方法,形成严谨的治学态度和锲而不舍的求学精神.培养学生运用所学知识,解决实际问题的能力.教学中适当地利用学生合作与交流,使学生在学习的同时,体会与他人合作的重要性.
【教学重点】回归分析的基本方法、随机误差e的认识、残差
【教学难点】回归分析的基本方法
【教学方法】启发式教学法
【教学手段】多媒体辅助教学【教学过程设计】。
1.1回归分析的基本思想及其初步应用(第1课时)教案教材:人民教育出版社A版选修1-2第2页到第4页【教学目标】在《数学③(必修)》之后,学生已经学习了两个变量之间的相关关系,包括画散点图,最小二乘法求回归直线方程等内容.在人教A版选修1-2第一章第一节“回归分析的基本思想及其初步应用”这一节中进一步介绍回归分析的基本思想及其初步应用.这部分内容《教师用书》共计4课时,第一课时:介绍线性回归模型的数学表达式,解释随机误差项产生的原因,使学生能正确理解回归方程的预报结果;第二课时:从相关系数、相关指数和残差分析角度探讨回归模型的拟合效果,以及建立回归模型的基本步骤;第三课时:介绍两个变量非线性相关关系;第四课时:回归分析的应用. 本节课是第一课时的内容.1、知识目标认识随机误差;2、能力目标(1)会使用函数计算器求回归方程;(2)能正确理解回归方程的预报结果.3、情感目标通过本节课的学习,加强数学与现实生活的联系,以科学的态度评价两个变量的相关性,理解处理问题的方法,形成严谨的治学态度和锲而不舍的求学精神.培养学生运用所学知识,解决实际问题的能力.教学中适当地利用学生合作与交流,使学生在学习的同时,体会与他人合作的重要性.【教学重点】随机误差e的认识【教学难点】随机误差的来源和对预报变量的影响【教学方法】启发式教学法【教学手段】多媒体辅助教学【教学流程】【教学过程设计】【教学反思】通过本节课的教学实践,我再次体会到什么是由“关注知识”转向“关注学生”,在教学过程中,注意到了由“给出知识”转向“引起活动”,由“完成教学任务”转向“促进学生发展”,课堂上的真正主人应该是学生.一堂好课,师生一定会有共同的、积极的情感体验.本节课的教学中,知识点均是学生通过探索“发现”的,学生充分经历了探索与发现的过程.教学中没有以练习为主,而是定位在知识形成过程的探索,注重数学的思想性,如统计思想、随机观念、函数思想、数形结合的思想方法等,引导学生体验数学中的理性精神,加强数学形式下的思考和推理.几点注明:1、复习引入时教师做示范——提供5组身高与体重的数据,用Excel展示如何画散点图、用最小二乘法求线性回归方程.随机抽样并列表如下:2、计算机做散点图的步骤如下:(1)进入Excel软件操作界面,在A1,B1分别输入“身高”和“体重”,在A,B 列输入相应的数据.(2)点击“图表向导”图标,进入“图表类型”对话框,选择“标准类型”中的“XY散点图”,单击“下一步”.(3)在“图表向导”中的“图表数据源”对话框中,选择“系列”选项,单击“添加”按钮添加系列1,在“X值”栏中输入身高所在数据区域,在“Y值”栏中输入体重所在数据区域,单击“下一步”.(4)进入“图表向导”中的图表选项对话框,对图表的一些属性进行设置. (5)单击“完成”按钮.注:也可以直接使用我们提供的文件来给学生演示,相对节约课堂时间.。
1.1回归分析的基本思想及其初步应用(第1课时)教案教材:人民教育出版社A版必修3授课教师:中卫市第一中学俞清华【教学目标】在《数学③(必修)》之后,学生已经学习了两个变量之间的相关关系,包括画散点图,最小二乘法求回归直线方程等内容.在人教A版选修1-2第一章第一节“回归分析的基本思想及其初步应用”这一节中进一步介绍回归分析的基本思想及其初步应用.这部分内容《教师用书》共计4课时,第一课时:介绍线性回归模型的数学表达式,解释随机误差项产生的原因,使学生能正确理解回归方程的预报结果;第二课时:从相关系数、相关指数和残差分析角度探讨回归模型的拟合效果,以及建立回归模型的基本步骤;第三课时:介绍两个变量非线性相关关系;第四课时:回归分析的应用. 本节课是第一课时的内容.1、知识与技能目标认识随机误差;2、过程与方法目标(1)会使用函数计算器求回归方程;(2)能正确理解回归方程的预报结果.3、情感、态度、价值观通过本节课的学习,加强数学与现实生活的联系,以科学的态度评价两个变量的相关性,理解处理问题的方法,形成严谨的治学态度和锲而不舍的求学精神.培养学生运用所学知识,解决实际问题的能力.教学中适当地利用学生合作与交流,使学生在学习的同时,体会与他人合作的重要性.【教学重点】随机误差e的认识【教学难点】随机误差的来源和对预报变量的影响【教学方法】启发式教学法【教学手段】多媒体辅助教学【教学流程】【教学过程设计】.几点注明:1、复习引入时教师做示范——提供5组身高与体重的数据,用Excel展示如何画散点图、用最小二乘法求线性回归方程.随机抽样并列表如下:2、计算机做散点图的步骤如下:(1)进入Excel软件操作界面,在A1,B1分别输入“身高”和“体重”,在A,B 列输入相应的数据.(2)点击“图表向导”图标,进入“图表类型”对话框,选择“标准类型”中的“XY散点图”,单击“下一步”.(3)在“图表向导”中的“图表数据源”对话框中,选择“系列”选项,单击“添加”按钮添加系列1,在“X值”栏中输入身高所在数据区域,在“Y值”栏中输入体重所在数据区域,单击“下一步”.(4)进入“图表向导”中的图表选项对话框,对图表的一些属性进行设置. (5)单击“完成”按钮.注:也可以直接使用我们提供的文件来给学生演示,相对节约课堂时间.3、学生使用函数计算器求回归方程的过程如下:MODE SHIFT CLR =1 13 , DT 165 49 ,DT17565, DT 165 58 , DT 157 51 , DT 170 53 SHIFT CLRSHIFTCLR2==1 (进入回归计算模式)(清除统计存储器)(输入五组数据)所以回归方程为 yˆ0.673x-56.79 (计算参数a) (计算参数b)(学生还会使用更先进的计算器)4、课堂使用的数据如下高二女生前15组数据列表:高二女生中间15组数据列表:高二女生后15组数据列表:课本P2例题1 女大学生8组数据列表:例1.1.1回归分析的基本思想及其初步应用(第1课时)教案说明教材:人民教育出版社A版必修3授课教师:中卫市第一中学俞清华1、设计理念《数学课程标准》明确指出:有效的数学学习活动不能单纯地模仿与记忆,动手实践、自主探索与合作交流,可以促进学生自主、全面、可持续的发展,是学生学习数学的重要方式.为使教学真正做到以学生为本,我对教材P2—P3的知识进行了适当地重组和加工,力求给学生提供研究、探讨的时间与空间,让学生充分经历“做数学”的过程,促使学生在自主中求知,在合作中获取,在探究中发展.2、授课内容的数学本质与教学目标定位回归分析,是一种从事物因果关系出发进行预测的方法.操作中,是在掌握大量观察数据的基础上,利用数理统计方法建立因变量与自变量之间的回归关系函数表达式(称回归方程式),预测今后事物发展的趋势.然而,所建立的回归方程与样本点的分布之间还存在有差异,这一差异就是我们本节课学习的主要内容:随机变量.3、学习本课内容的基础以及应用本课内容安排在《数学3(必修)》之后,学生已经学习了两个变量之间的相关关系,包括画散点图,会利用最小二乘法求回归直线方程等内容.以此为基础,进一步讨论一元线性回归模型,分析产生模型中随机误差项的原因,从而让学生了解线性回归模型与函数模型之间的区别与联系,体会统计思维与确定性思维的区别与联系.通过本节课的学习,为后继课程了解偏差平方和分解思想和相关指数的含义、了解相关指数R2和模型拟合的效果之间的关系、了解残差图的作用,体会什么是回归分析、回归分的必要性,都起到铺垫作用.在本节课的教学中,学生使用了函数计算器,教师则利用电脑Excel表格完成对数据的整理,需要学生有一定的动手能力.4、学习本课内容时容易了解与容易误解的地方由于学生对必修3中的线性回归知识已经熟悉,会抽取样本、会画散点图、会利用最小二乘法求出线性回归方程,所以本节课学生容易了解:(1)从散点图看出,样本点呈条状分布,体重与身高具有线性相关关系,因此可以用线性回归方程来近似刻画它们之间的关系.(2)可以发现样本点并不完全落在回归方程上,有随机误差存在.(3)容易理解由一条回归方程预测到的身高172cm的女生体重不是都一样,它只是一个平均值.在学习过程中,相对不易理解的地方有:(1)对于随机误差的来源,学生是能够从样本的个体差异上来理解的,但是对于由用线性回归模型近似真实模型所引起的误差,学生理解还是有一定困难的.(2)随机误差对预报变量的影响,学生从感性上很好理解,当然是随机误差越小越好.但是从理性上认识,怎样从数据上刻画出随机误差是否变小了呢?学生还有困难.5、本节课的教法特点以及预期效果分析5.1 改造创新教师通过分析教材和学生认知规律,创造性地使用教材,做到既重视教材,更重视学生.具体说来有以下改造:(1)创设生活情景.利用学生的“体检经验”设置问题,既没有脱离课本例题1的相关内容,又能激发学生对数学的亲切感,引发学生看个究竟的冲动,兴趣盎然地投入学习.(2)充分体现随机观念.课本上仅仅希望利用8组数据就要学生体会到统计的思想和后继课程中回归分析的必要性,实在是为难学生了.在本课教学设计学生操作时强调“增多数据,加强比较”. 帮助学生体会“不同事件(如课本例1女大学生和高二女生)”,则统计结果不同、“同一事件(如都是高二女生),采样不同结果也不同”的基本事实.(3)教师的作用. 在这节课里,教师在学生操作结束后,利用更多数据的操作,形成一个与学生结果的对比,这一操作与展示为学生创造了新的思维增长点,引领学生进入更深层领悟.5.2 问题性本课教学以问题引导学习活动,通过恰时恰点地提出问题,提好问题,给学生提问的示范,使他们领悟发现和提出问题的艺术,引导他们更加主动和有兴趣地学,逐步培养学生的问题意识,孕育创新精神.例如,在“结果的分析”中的问题4、“预测出的体重值都不同,那么它还有参考价值吗?”目的是让学生充分认识随机误差e的来源和对预报变量的影响,而这一问题的提出,立刻吸引学生细细体会随机观念,同时激发出学生的好奇心,提升深入探求的欲望.5.3 合作、探究的学习方式本节课的合作学习体现在两个方面:除了体现在每个小组内部成员之间,还体现在整堂课的教学结构上.小组成员内部提倡“不同的人作不同的事”,面对不同分组,学生可以自主选择的不同工作,动手带动动脑,遇到小的问题,通过探讨和帮助,能做到“学生的问题由学生自己解决”,促进对某一问题更清晰的认识,还能感受到团结合作的好处与必要.同时,每个小组的劳动成果共同构成课堂教学需要的多条回归方程,组与组之间的合作推动整节课的比较与区分得以实现.5.4教学手段本课积极将数学课程与信息技术进行整合,采用多种技术手段,特点主要体现如下:(1)以PPT 为操作平台,界面活泼,操作简单,能有效支持多种其它技术;(2)教师用Excel图表展示,直观形象,节约时间,帮助学生顺利完成学习内容;(3)学生使用函数计算器动手操作,求出回归方程.本课预期:(1)学生可以很好地复习使用函数计算器求回归方程,虽然在要求学生自己操作前教师有一个示例,但是还是会有一少部分人不会使用,所以在教学前要有一定的思想准备,和必要措施.(2)在分析各个组的预测结果为什么有差异时,由于个体经验不同,对问题的挖掘深度产生不同,这时教师的启发引导可能会十分必要,不能完全由学生漫无目的的“讨论”,使学生活动流于形式.(3)“结果分析”前,由学生展示操作成果,这些结果已经够用来说明问题,教师不要急于参与.在“结果分析”的第4个问题中引入教师利用电脑求出的由45 组数据得到的回归方程,让学生再一次通过比较得到新的思考点——怎样知道自己模拟的回归方程身高变化对体重变化影响有多大呢?这样会使学生自然而然渴望进一步了解相关回归分析的知识,为后继课程做好伏笔.对于体现本节课承上启下的作用,可能更好一些.6 教学反思通过本节课的教学实践,我再次体会到什么是由“关注知识”转向“关注学生”,在教学过程中,注意到了由“给出知识”转向“引起活动”,由“完成教学任务”转向“促进学生发展”,课堂上的真正主人应该是学生.一堂好课,师生一定会有共同的、积极的情感体验.本节课的教学中,知识点均是学生通过探索“发现”的,学生充分经历了探索与发现的过程.教学中没有以练习为主,而是定位在知识形成过程的探索,注重数学的思想性,如统计思想、随机观念、函数思想、数形结合的思想方法等,引导学生体验数学中的理性精神,加强数学形式下的思考和推理。
第一章 统计案例1.1回归分析的基本思想及其初步应用(一) 教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用. 教学重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法-相关指数和残差分析.教学难点:解释残差变量的含义,了解偏差平方和分解的思想.教学过程:一、复习准备:1. 提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?2. 复习:函数关系是一种确定性关系,而相关关系是一种非确定性关系. 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据→作散点图→求回归直线方程→利用方程进行预报.二、讲授新课:1. 教学例题:的体重. (分析思路→教师演示→学生整理)第一步:作散点图第二步:求回归方程第三步:代值计算 ② 提问:身高为172cm 的女大学生的体重一定是60.316kg 吗?不一定,但一般可以认为她的体重在60.316kg 左右.③ 解释线性回归模型与一次函数的不同事实上,观察上述散点图,我们可以发现女大学生的体重y 和身高x 之间的关系并不能用一次函数y bx a =+来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画身高和体重的关系). 在数据表中身高为165cm 的3名女大学生的体重分别为48kg 、57kg 和61kg ,如果能用一次函数来描述体重与身高的关系,那么身高为165cm 的3名女在学生的体重应相同. 这就说明体重不仅受身高的影响还受其他因素的影响,把这种影响的结果e (即残差变量或随机变量)引入到线性函数模型中,得到线性回归模型y bx a e =++,其中残差变量e 中包含体重不能由身高的线性函数解释的所有部分. 当残差变量恒等于0时,线性回归模型就变成一次函数模型. 因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.2. 相关系数:相关系数的绝对值越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义.3. 小结:求线性回归方程的步骤、线性回归模型与一次函数的不同.第二课时。
§1.1.1回归分析的基本思想及其初步应用(三)1. 通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用;2. 通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法..重点:通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法.难点:了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较.【知识链接】(预习教材P4~ P7,找出疑惑之处)复习1:求线性回归方程的步骤复习2:作函数2x=+的图像y x0.25y=和2【学习过程】※学习探究探究任务:如何建立非线性回归模型?实例一只红铃虫的产卵数y和温度x有关,现收集了7组观测数据列于下表中,试建立y与x之间的y个(1)根据收集的数据,做散点图上图中,样本点的分布没有在某个区域,因此两变量之间不呈关系,所以不能直接用线性模型.由图,可以认为样本点分布在某一条指数函数曲线bx a y e +=的周围(,a b 为待定系数).对上式两边去对数,得ln y =令ln ,z y =,则变换后样本点应该分布在直线 y 和x 的非线性回归方程.i i由上表中的数据得到回归直线方程z =因此红铃虫的产卵数y 和温度x 的非线性回归方程为※ 典型例题例1一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据列于下表中,y 个 (散点图如由图,可以认为样本点集中于某二次曲线234y c x c =+的附近,其中12,c c 为待定参数)试建立y 与x 之间的回归方程.思考:评价这两个模型的拟合效果.小结:利用线性回归方程探究非线性回归问题,可按“作散点图→建模→确定方程”这三个步骤进行. 其关键在于如何通过适当的变换,将非线性回归问题转化成线性回归问题.【学习反思】※ 学习小结利用线性回归方程探究非线性回归问题,可按“作散点图→建模→确定方程”这三个步骤进行.※ 知识拓展非线性回归问题的处理方法:1、 指数函数型bx a y e +=① 函数bx a y e +=的图像:② 处理方法:两边取对数得ln ln()bx ay e +=,即ln y bx a =+.令ln ,z y =把原始数据(x,y )转化为(x,z ),再根据线性回归模型的方法求出,b a .2、对数曲线型ln y b x a =+① 函数ln y b x a =+的图像② 处理方法:设ln x x '=,原方程可化为y bx a '=+再根据线性回归模型的方法求出,a b .3、2y bx a =+型处理方法:设2x x '=,原方程可化为y bx a '=+,再根据线性回归模型的方法求出,a b .※ 自我评价 你完成本节导学案的情况为( ).A. 很好B. 较好C. 一般D. 较差※ 当堂检测(时量:5分钟 满分:10分)计分:1. 两个变量 y 与x 的回归模型中,求得回归方程为0.232x y e -=,当预报变量10x =时( ).A. 解释变量30y e -=B. 解释变量y 大于30e -C. 解释变量y 小于30e -D. 解释变量y 在30e -左右2. 在回归分析中,求得相关指数20.89R =,则( ).A. 解释变量解对总效应的贡献是11%B. 解释变量解对总效应的贡献是89%C. 随机误差的贡献是89%D. 随机误差的贡献是0.89%3. 通过12,,,n e e e 来判断模拟型拟合的效果,判断原始数据中是否存在可疑数据,这种分析称为( ).A .回归分析B .独立性检验分析C .残差分析 D. 散点图分析4.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线bx a y e +=的周围,令ln z y =,求得回归直线方程为0.25 2.58z x =-,则该模型的回归方程为 .5. 已知回归方程0.5ln ln 2y x =-,则100x =时,y 的估计值为 .x 变化,繁殖的个数,收集数据如下:(1)用天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图;(2)试求出预报变量对解释变量的回归方程.。
教学方案精美句子1、善思则能“从无字句处读书”。
读沙漠,读出了它坦荡豪放的胸怀;读太阳,读出了它普照万物的无私;读春雨,读出了它润物无声的柔情。
读大海,读出了它气势磅礴的豪情。
读石灰,读出了它粉身碎骨不变色的清白。
2、幸福幸福是“临行密密缝,意恐迟迟归”的牵挂;幸福是“春种一粒粟,秋收千颗子”的收获. 幸福是“采菊东篱下,悠然见南山”的闲适;幸福是“奇闻共欣赏,疑义相与析”的愉悦。
幸福是“随风潜入夜,润物细无声”的奉献;幸福是“夜来风雨声,花落知多少”的恬淡。
幸福是“零落成泥碾作尘,只有香如故”的圣洁。
幸福是“壮志饥餐胡虏肉,笑谈渴饮匈奴血”的豪壮。
幸福是“先天下之忧而忧,后天下之乐而乐”的胸怀。
幸福是“人生自古谁无死,留取丹心照汗青”的气节。
3、大自然的语言丰富多彩:从秋叶的飘零中,我们读出了季节的变换;从归雁的行列中,我读出了集体的力量;从冰雪的消融中,我们读出了春天的脚步;从穿石的滴水中,我们读出了坚持的可贵;从蜂蜜的浓香中,我们读出了勤劳的甜美。
4、成功与失败种子,如果害怕埋没,那它永远不能发芽。
鲜花,如果害怕凋谢,那它永远不能开放。
矿石,如果害怕焚烧(熔炉),那它永远不能成钢(炼成金子)。
蜡烛,如果害怕熄灭(燃烧),那它永远不能发光。
航船,如果害怕风浪,那它永远不能到达彼岸。
5、墙角的花,当你孤芳自赏时,天地便小了。
井底的蛙,当你自我欢唱时,视野便窄了。
笼中的鸟,当你安于供养时,自由便没了。
山中的石!当你背靠群峰时,意志就坚了。
水中的萍!当你随波逐流后,根基就没了。
空中的鸟!当你展翅蓝天中,宇宙就大了。
空中的雁!当你离开队伍时,危险就大了。
地下的煤!你燃烧自己后,贡献就大了6、朋友是什么?朋友是快乐日子里的一把吉它,尽情地为你弹奏生活的愉悦;朋友是忧伤日子里的一股春风,轻轻地为你拂去心中的愁云。
朋友是成功道路上的一位良师,热情的将你引向阳光的地带;朋友是失败苦闷中的一盏明灯,默默地为你驱赶心灵的阴霾。
1.1回归分析的基本思想及其初步应用(教师用书独具)●三维目标1.知识与技能通过典型案例的探究,了解回归分析的基本思想,会对两个变量进行回归分析,明确解决回归模型的基本步骤,并对具体问题进行回归分析以解决实际应用问题.了解最小二乘法的推导,解释残差变量的含义,了解偏差平方和分解的思想,了解判断刻画模型拟合效果的方法——相关指数和残差分析.掌握利用计算器求线性回归直线方程参数及相关系数的方法.2.过程与方法通过收集数据作散点图,分析散点图,求回归直线方程,分析回归效果,利用方程进行预报.3.情感、态度与价值观培养学生利用整体的观点和互相联系的观点来分析问题,进一步加强数学的应用意识,培养学生学好数学、用好数学的信心,加强与现实生活的联系,以科学的态度评价两个变量的相互关系.●重点难点重点:回归分析的基本方法、随机误差e的认识、残差图的概念、用残差及R2来刻画线性回归模型的拟合效果.难点:回归分析的基本方法、残差概念的理解及拟合效果的判定、非线性回归向线性回归的转化.教学时要以残差分析为重点,突出残差表和R2的计算,通过举例说明相关关系与确定性关系的区别,说明回归分析的必要性及其方法.借助例题使学生掌握作散点图、求回归直线方程的方法,通过作残差图、计算R2让学生掌握拟合效果的判断方法.对于非线性回归问题重点在如何转换,引导学生分析总结转化方法和技巧,从而化解难点.(教师用书独具)●教学建议本节课建议教师采取探究式教学,把“关注知识”转向“关注学生”,在教学过程中,把“给出知识”的过程转变为“引起活动,让学生探究知识的过程”,把“完成教学任务”转向“促进学生发展”,让学生成为课堂上的真正主人.在教学中,知识点可由学生通过探索“发现”,让学生充分经历探索与发现的过程,并引导学生积极解决探索过程中发现的问题.教学中不要以练习为主,而是定位在知识形成过程的探索,例题的解答也要由学生探讨、教师点拨,共同完成.要注重数学的思想性,如统计思想、随机观念、函数思想、数形结合的思想方法等,引导学生体验数学中的理性精神,加强数学形式下的思考和推理能力.●教学流程创设问题情境,引出问题,引导学生探讨,从而引出回归分析、线性回归模型、刻画回归效果的有关概念及解决方法.利用填一填的形式,使学生自主学习本节基础知识,并反馈了解,对理解有困难的概念加以讲解.引导学生在学习基础知识的基础上分析回答例题1的问题,并总结规律方法,完成变式训练.引导学生分析例题2,根据图中的数据计算系数,求出回归方程,列出残差表,求出R2并判断拟合效果,完成变式训练.完成当堂双基达标,巩固所学知识及应用方法,并进行反馈矫正.归纳整理,进行课堂小结,整体认识本节所学知识,强调重点内容和规律方法.通过老师启发引导,完成例题3,并要求学生借鉴例题3的解法完成变式训练.引导学生分析例题3,让学生作出散点图,观察相关性,引出问题,即如何使问题转化为相关关系并用线性回归分析二者关系.【问题导思】一台机器由于使用时间较长,生产的零件有一些会有缺陷.按不同转速生产出有缺陷的零件的统计数据如下:1.【提示】2.从散点图中判断x 和y 之间是否具有相关关系? 【提示】 有.3.若转速为10转/秒,能否预测机器每小时生产缺陷的零件件数? 【提示】 可以.根据散点图作出一条直线,求出直线方程后可预测. (1)回归直线方程: y ^=b ^x +a ^,其中:b ^=∑i =1nx i -xy i -y∑i =1nx i -x2,a ^=y -b ^x ,x =1n ∑i=1n x i ,y =1n ∑i =1ny i . (2)变量样本点中心:(x ,y ),回归直线过样本点的中心.(3)线性回归模型:y =bx +a +e ,其中e 称为随机误差,a 和b 是模型的未知参数,自变量x 称为解释变量,因变量y 称为预报变量.R 2=1-∑i =1ny i -y ^i2∑i =1ny i -y2,R 2表示解释变量对预报变量变化的贡献率,R 2越接近于1,表示回归的效果越好①线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归方程y ^=b ^x +a ^,可以估计和观测变量的取值和变化趋势;④因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.其中正确命题的个数是( )A .1B .2C .3D .4【思路探究】 可借助于线性相关概念及性质逐一作出判断.【自主解答】 ①反映的正是最小二乘法思想,故正确.②反映的是画散点图的作用,也正确.③解释的是回归方程y ^=b ^x +a ^的作用,故也正确.④是不正确的,在求回归方程之前必须进行相关性检验,以体现两变量的关系.【答案】 C1.解答例1中④时,必须明确具有线性相关关系的两个变量间才能求得一个线性回归方程,否则求得的方程无实际意义.因此必须先进行线性相关性判断,后求线性回归方程.2.回归分析的过程:(1)随机抽取样本,确定数据,形成样本点;(2)由样本点形成散点图,判断是否具有线性相关关系;(3)由最小二乘法确定线性回归方程; (4)由回归方程观察变量的取值及变化趋势.关于变量y 与x 之间的回归直线方程叙述正确的是( ) A .表示y 与x 之间的一种确定性关系 B .表示y 与x 之间的相关关系 C .表示y 与x 之间的最真实的关系D .表示y 与x 之间真实关系的一种效果最好的拟合【解析】 回归直线方程能最大可能地反映y 与x 之间的真实关系,故选项D 正确. 【答案】 D求y 关于x【思路探究】 回归模型拟合效果的好坏可以通过计算R 2来判断,其值越大,说明模型的拟合效果越好.【自主解答】 x =15(14+16+18+20+22)=18,y =15(12+10+7+5+3)=7.4,∑i =15x 2i =142+162+182+202+222=1 660, ∑i =15x i y i =14×12+16×10+18×7+20×5+22×3=620,所以b ^=∑i =15x i y i -5x y∑i =15x 2i -5x 2=620-5×18×7.41 660-5×182=-1.15,a ^=7.4+1.15×18=28.1,所以所求回归直线方程是y ^=-1.15x +28.1.列出残差表:所以∑i =15(y i -y ^i )2=0.3,∑i =15(y i -y )2=53.2,R 2=1-∑i =15y i -y ^i2∑i =15y i -y2≈0.994,所以回归模型的拟合效果很好.1.回归直线方程能定量地描述两个变量的关系,系数a ^,b ^刻画了两个变量之间的变化趋势,其中b ^表示x 变化一个单位时,y 的平均变化量.利用回归直线可以对问题进行预测,由一个变量的变化去推测另一个变量的变化.2.线性回归分析中:(1)残差平方和越小,预报精确度越高.(2)相关指数R 2取值越大,说明模型的拟合效果越好.某运动员训练次数与运动成绩之间的数据关系如下:(1)(2)求出线性回归方程;(3)作出残差图,并说明模型的拟合效果; (4)计算R 2,并说明其含义.【解】 (1)作出该运动员训练次数(x )与成绩(y )之间的散点图,如图所示.(2)可求得x =39.25,y =40.875,∑i =18x 2i =12 656,∑i =18y 2i =13 731,∑i =18x i y i =13 180,∴b ^=∑i =18x i -xy i -y∑i =18x i -x2=∑i =18x i y i -8x y∑i =18x 2i -8x 2≈1.041 5,a ^=y -b ^x =-0.003 875,∴线性回归方程为y ^=1.041 5x -0.003 875. (3)作残差图如图所示,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适. (4)相关指数R 2=0.985 5.说明了该运动员的成绩的差异有98.55%的可能性是由训练次数引起的.(1)作出x (2)建立x 与y 的关系,预报回归模型并计算残差; (3)利用所得模型,预报x =40时y 的值.【思路探究】 (1)画出散点图或进行相关性检验,确定两变量x 、y 是否线性相关.由散点图得x 、y 之间的回归模型.(2)进行拟合,预报回归模型,求回归方程.【自主解答】 (1)作出散点图如图,从散点图可以看出x 与y 不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线y =c 1e c 2x 的周围,其中c 1、c 2为待定的参数.(2)对两边取对数把指数关系变为线性关系,令z =ln y ,则有变换后的样本点应分布在直线z =bx +a ,a =ln c 1,b =c 2的周围,这样就可以利用线性回归模型来建立y 与x 之间的非线性回归方程了,数据可以转化为:求得回归直线方程为z =0.272x -3.849, ∴y ^=e 0.272x -3.849. 残差如下表:两个变量不具有线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型,如y =c 1e c 2x ,我们可以通过对数变换把指数关系变为线性关系,令z =ln y ,则变换后样本点应该分布在直线z =bx +a (a =ln c 1,b =c 2)的周围.有一个测量水流量的实验装置,测得试验数据如下表:【解】 由表中测得的数据可以作出散点图,如图.观察散点图中样本点的分布规律,可以判断样本点分布在某一条曲线附近,表示该曲线的函数模型是Q =m ·h n(m ,n 是正的常数).两边取常用对数,则lg Q =lg m +n ·lg h .令y =lg Q ,x =lg h ,那么y =nx +lg m ,即为线性函数模型y =bx +a 的形式(其中b =n ,a =lg m ).由下面的数据表,用最小二乘法可求得b ^≈2.509 7,a ^=-0.707 7,所以n ≈2.51,m ≈0.196.没有理解相关指数R 2的意义而致误关于x 与y 有如下数据:为了对x 、y 两个变量进行统计分析,现有以下两种线性模型:甲模型y ^=6.5x +17.5,乙模型y ^=7x +17,试比较哪一个模型拟合的效果更好.【错解】 ∵R 21=1-∑i =15y i -y ^i2∑i =15y i -y2=1-1551 000=0.845.R 22=1-∑i =15y i -y ^i2∑i =15y i -y2=1-1801 000=0.82.又∵84.5%>82%,∴乙选用的模型拟合的效果更好.【错因分析】 没有理解R 2的意义是致错的根源,用相关指数R 2来比较模型的拟合效果,R 2越大,模型的拟合效果越好,并不是R 2越小拟合效果更好.【防范措施】 R 2=1-∑i =1ny i -y ^i2∑i =1ny i -y2,R 2越大,残差平方和越小,从而回归模型的拟合效果越好.在线性回归模型中,R 2表示解释变量对于预报变量变化的贡献率,R 2越接近1,表示回归的效果越好(因为R 2越接近1,表示解释变量和预报变量的线性相关性越强).从根本上理解R 2的意义和作用,就可防止此类错误的出现.【正解】 R 21=1-∑i =15y i -y ^i2∑i =15y i -y2=1-1551 000=0.845,R 22=1-∑i =15y i -y ^i2∑i =15y i -y2=1-1801 000=0.82,84.5%>82%,所以甲模型拟合效果更好.1.在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据.然后,可以通过残差e ^1,e ^2,…,e ^n 来判断模型拟合的效果,判断原始数据中是否存在可疑数据.这方面的分析工作称为残差分析.2.我们还可以用相关指数R 2来反映回归的效果,其计算公式是:R 2=1-∑i =1ny i -y ^i2∑i =1ny i -y2.显然,R 2取值越大,意味着残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中,R 2表示解释变量对于预报变量变化的贡献率.1.已知x 和y 之间的一组数据则y 与x 的线性回归方程y ^=b x +a 必过点( ) A .(2,2) B .(32,0)C .(1,2)D .(32,4)【解析】 ∵x =14(0+1+2+3)=32,y =14(1+3+5+7)=4,∴回归方程y ^=b ^x +a ^必过点(32,4).【答案】 D2.(2013·青岛高二检测)在下列各组量中:①正方体的体积与棱长;②一块农田的水稻产量与施肥量;③人的身高与年龄;④家庭的支出与收入;⑤某户家庭的用电量与电价.其中量与量之间的关系是相关关系的是( )A .①②B .②④C .③④D .②③④【解析】 ①是函数关系V =a 3;⑤电价是统一规定的,与用电量有一定的关系,但这种关系是确定的关系.②③④中的两个量之间的关系都是相关关系,因为水稻的产量与施肥量在一定范围内是正比、反比或其他关系,并不确定;人的身高一开始随着年龄的增加而增大,之后则不变化或降低,在身高增大时,也不是均匀增大的;家庭的支出与收入有一定的关系,在一开始,会随着收入的增加而支出也增加,而当收入增大到一定的值后,家庭支出趋向于一个常数值,也不是确定关系.【答案】 D3.下列命题正确的有________.①在线性回归模型中,e 是bx +a 预报真实值y 的随机误差,它是一个可观测的量; ②残差平方和越小的模型,拟合的效果越好; ③用R 2来刻画回归方程,R 2越小,拟合的效果越好;④在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,若带状区域宽度越窄,说明拟合精度越高,回归方程的预报精度越高.【解析】 对于①随机误差e 是一个不可观测的量,③R 2越趋于1,拟合效果越好,故①③错误.对于②残差平方和越小,拟合效果越好,同理当残差点比较均匀地落在水平的带状区域时,拟合效果越好,故②④正确.【答案】 ②④4.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据:(1)(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测技改后生产100吨甲产品比技改前少消耗多少吨标准煤.(参考数值:3×2.5+4×3+5×4+6×4.5=66.5) 【解】 (1)如下图.(2)∑i =14x i y i =3×2.5+4×3+5×4+6×4.5=66.5,x =3+4+5+64=4.5,y =2.5+3+4+4.54=3.5, ∑i =14x 2i =32+42+52+62=86. b ^=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7, a ^=y -b ^x =3.5-0.7×4.5=0.35,因此,所求的线性回归方程为y ^=0.7x +0.35.(3)根据回归方程预测,现在生产100吨产品消耗的标准煤的数量为0.7×100+0.35=70.35(吨),故耗能减少了90-70.35=19.65(吨标准煤).一、选择题1.在画两个变量的散点图时,下面叙述正确的是( ) A .预报变量在x 轴上,解释变量在y 轴上 B .解释变量在x 轴上,预报变量在y 轴上 C .可以选择两个变量中任意一个变量在x 轴上 D .可以选择两个变量中任意一个变量在y 轴上【解析】 结合线性回归模型y =bx +a +e 可知,解释变量在x 轴上,预报变量在y 轴上,故选B.【答案】 B2.(2013·泰安高二检测)在回归分析中,相关指数R 2的值越大,说明残差平方和( ) A .越大 B .越小 C .可能大也可能小D .以上均错【解析】 ∵R 2=1-∑i =1ny i -y ^i2∑i =1ny i -y2,∴当R 2越大时,∑i =1n(y i -y ^i )2越小,即残差平方和越小.【答案】 B3.设变量y 对x 的线性回归方程为y ^=2-2.5x ,则变量x 每增加一个单位时,y 平均( )A .增加2.5个单位B .增加2个单位C .减少2.5个单位D .减少2个单位【解析】 回归直线的斜率b ^=-2.5,表示x 每增加一个单位,y 平均减少2.5个单位. 【答案】 C4.(2012·湖南高考)设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确...的是( ) A .y 与x 具有正的线性相关关系 B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg【解析】 由于线性回归方程中x 的系数为0.85,因此y 与x 具有正的线性相关关系,故A 正确.又线性回归方程必过样本中心点(x ,y ),因此B 正确.由线性回归方程中系数的意义知,x 每增加1 cm ,其体重约增加0.85 kg ,故C 正确.当某女生的身高为170 cm 时,其体重估计值是58.79 kg ,而不是具体值,因此D 不正确.【答案】 D5.在判断两个变量y 与x 是否相关时,选择了4个不同的模型,它们的相关指数R 2分别为:模型1的相关指数R 2为0.98,模型2的相关指数R 2为0.80,模型3的相关指数R 2为0.50,模型4的相关指数R 2为0.25.其中拟合效果最好的模型是( )A .模型1B .模型2C .模型3D .模型4【解析】 相关指数R 2能够刻画用回归模型拟合数据的效果,相关指数R 2的值越接近于1,说明回归模型拟合数据的效果越好.【答案】 A 二、填空题6.在研究身高和体重的关系时,求得相关指数R 2≈________,可以叙述为“身高解释了64%的体重变化,而随机误差贡献了剩余的36%”,所以身高对体重的效应比随机误差的效应大得多.【解析】 结合相关指数的计算公式R 2=1-∑i =1ny i -y ^i2∑i =1ny i -y2可知,当R 2=0.64时,身高解释了64%的体重变化.【答案】 0.647.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.【解析】 以x +1代x ,得y ^=0.254(x +1)+0.321,与y ^=0.254x +0.321相减可得,年饮食支出平均增加0.254万元.【答案】 0.2548.已知回归直线的斜率的估计值为 1.23,样本点的中心为(4,5),则回归直线方程是________.【解析】 由斜率的估计值为1.23,且回归直线一定经过样本点的中心(4,5),可得y ^-5=1.23(x -4),即y ^=1.23x +0.08. 【答案】 y ^=1.23x +0.08 三、解答题9.某省2013年的阅卷现场有一位质检老师随机抽取5名学生的总成绩和数学成绩(单位:分)如下表所示:(1)(2)对x 与y 作回归分析;(3)求数学成绩y 对总成绩x 的回归直线方程;(4)如果一个学生的总成绩为500分,试预测这个学生的数学成绩. 【解】 (1)散点图如图所示:(2)x =2 0125,y =3395,∑5 i =1x 2i =819 794, ∑5i =1y 2i =23 167,∑5i =1x i y i =137 760. ∴r =错误! ·错误!)=错误!≈0.989. 因此可以认为y 与x 有很强的线性相关关系.(3)回归系数b ^=∑5i =1x i y i -5 x y∑5i =1x 2i -5x2=0.132 452,a ^=y -b ^x =14.501 315.∴回归方程为y ^=0.132 452x +14.501 315.(4)当x =500时,y ^≈81.即当一个学生的总成绩为500分时,他的数学成绩约为81分. 10.(2012·福建高考)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y =bx +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)【解】 (1)由于x =16(8+8.2+8.4+8.6+8.8+9)=8.5,y =16(90+84+83+80+75+68)=80,又b =-20,所以a =y -b x =80+20×8.5=250,从而回归直线方程为y ^=-20x +250. (2)设工厂获得的利润为L 元,依题意得L =x (-20x +250)-4(-20x +250)=-20x 2+330x -1 000 =-20(x -8.25)2+361.25.当且仅当x =8.25时,L 取得最大值.故当单价定为8.25元时,工厂可获得最大利润.11.在关于人的脂肪含量(百分比)和年龄的关系的研究中,研究人员获得了一组数据如下表:(2)求相关指数R 2,并说明其含义; (3)给出37岁时人的脂肪含量的预测值.【解】 (1)散点图如图所示.由散点图可知样本点呈条状分布,脂肪含量与年龄有比较好的线性相关关系,因此可以用线性回归方程来刻画它们之间的关系.设线性回归方程为y ^=b ^x +a ^,则由计算器算得b ^≈0.576,a ^≈=-0.448, 所以线性回归方程为y ^=0.576x -0.448. (2)残差平方和: ∑i=114e ^2i =∑i =114(y i -y ^i )2≈37.78.总偏差平方和:∑i =114(y i -y -)2≈644.99.R 2=1-37.78644.99≈0.941. R 2≈0.941,表明年龄解释了94.1%的脂肪含量变化.(3)当x =37时,y ^=0.576×37-0.448≈20.9,故37岁时人的脂肪含量约为20.9%.(教师用书独具)为研究重量x (单位:克)对弹簧长度y (单位:厘米)的影响,对不同重量的6个物体进行测量,数据如下表所示:(1)(2)求出R 2; (3)进行残差分析.【思路探究】 (1)由表作出散点图,求出系数值,即可写出回归方程. (2)列出残差表,计算R 2,由R 2的值判断拟合效果. (3)由(2)中残差表中数值,进行回归分析. 【自主解答】 (1)散点图如图.x =16(5+10+15+20+25+30)=17.5, y =16(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487,∑i =16x 2i =2 275,∑i =16x i y i =1 076.2.计算得,b ^≈0.183,a ^≈6.285, 所求线性回归方程为y ^=6.285+0.183x . (2)列表如下:所以∑i =16(y i -y ^i )2≈0.013 18,∑i =16(y i -y )2=14.678 4.所以,R 2=1-0.013 1814.678 4≈0.999 1,回归模型的拟合效果较好.(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与拉力成线性关系.建立回归模型的基本步骤: (1)确定解释变量和预报变量;(2)画散点图,观察是否存在线性相关关系; (3)确定回归方程的类型,如y =bx +a ; (4)按最小二乘法估计回归方程中的参数;(5)得结果后分析残差图是否异常,若存在异常,则检查数据是否有误,或模型是否合适.假设关于某设备的使用年限x (年)和所支出的维修费用y (万元)有关的统计资料如下表所示.若由资料知y (1)线性回归方程y ^=b ^x +a ^的回归系数a ^、b ^; (2)求相关指数R 2;(3)估计使用年限为10年时,维修费用是多少? 【解】 (1)由已知数据制成下表.由此可得x =4,y =5,21 b ^=∑i =15 x i -xy i -y∑i =15 x i -x 2=1.23, a ^=y -b ^x =5-1.23×4=0.08,∴y ^=1.23x +0.08.(2)R 2=1-∑i =15 y i -y ^i2∑i =15 y i -y 2=1-0.65115.78≈0.958 7. (3)回归直线方程为y ^=1.23x +0.08,当x =10(年)时,y ^=1.23×10+0.08=12.38(万元),即估计使用10年时维修费用是12.38万元.。
高中数学选修1-2《回归分析基本思想及其初步应用》教案Teaching plan of 1-2 "basic idea of regression analysis and its p reliminary application" as an elective course in high school mat hematics高中数学选修1-2《回归分析基本思想及其初步应用》教案前言:数学是研究数量、结构、变化、空间以及信息等概念的一门学科,从某种角度看属于形式科学的一种,在人类历史发展和社会生活中,数学发挥着不可替代的作用,是学习和研究现代科学技术必不可少的基本工具。
本教案根据数学课程标准的要求和教学对象的特点,将教学诸要素有序安排,确定合适的教学方案的设想和计划、并以启迪发展学生智力为根本目的。
便于学习和使用,本文档下载后内容可按需编辑修改及打印。
教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.教学重点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.教学难点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.教学过程:一、复习准备:1.由例1知,预报变量(体重)的值受解释变量(身高)或随机误差的影响.2.为了刻画预报变量(体重)的变化在多大程度上与解释变量(身高)有关?在多大程度上与随机误差有关?我们引入了评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.二、讲授新课:1.教学总偏差平方和、残差平方和、回归平方和:(1)总偏差平方和:所有单个样本值与样本均值差的平方和,即 .残差平方和:回归值与样本值差的平方和,即 .回归平方和:相应回归值与样本均值差的平方和,即 .(2)学习要领:①注意、、的区别;②预报变量的变化程度可以分解为由解释变量引起的变化程度与残差变量的变化程度之和,即 ;③当总偏差平方和相对固定时,残差平方和越小,则回归平方和越大,此时模型的拟合效果越好;④对于多个不同的模型,我们还可以引入相关指数来刻画回归的效果,它表示解释变量对预报变量变化的贡献率. 的值越大,说明残差平方和越小,也就是说模型拟合的效果越好.2.教学例题:例2 关于与有如下数据:2 4 5 6 830 40 60 50 70为了对、两个变量进行统计分析,现有以下两种线性模型:,,试比较哪一个模型拟合的效果更好.分析:既可分别求出两种模型下的总偏差平方和、残差平方和、回归平方和,也可分别求出两种模型下的相关指数,然后再进行比较,从而得出结论.-------- Designed By JinTai College ---------。
1.1回归分析的基本思想及其初步应用(第三课时)课型:新授 执笔:张一为 时间:2007-3-3学号:__________ 姓名:_____________教学目标:1.由“散点图”选择适当的数据模型,以拟合两个相关变量。
虽然任何两个变量的观测数据都可以用线性回归模型来拟合,但不能保证这种拟合模型对数据的拟合效果最好。
为更好地刻画两个变量之间的关系,要根据观测数据的特点来选择回归模型。
2.通过探究使学生认识到:有些 线性模型非线性模型转换−−→− ,即借助于线性回归模型研究呈非线性关系的两个变量之间的关系:⎩⎨⎧⇒⇒归模型来拟合数据作变换,在利用线性回区域分布在一个曲线状带形合数据;选用线性回归模型来拟区域分布在一个直线状带形散点图 ①如模型为:12ln 1212lnc x c z lnc x c lny e c y z y x c +=−−−−→−+=−−−→−==转换:令取自然对数②如模型为:212212c t c y c x c y t x +=−−−−→−+==转换:令3.初步体会不同模型拟合数据的效果。
计算不同模型的相关指数,通过比较相关指数的大小来比较不同模型的拟合效果。
(这只是模型比较的一种方法,还有其他方法。
)教学重点:体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法。
教学难点:了解常用函数的图像特点,选择不同的模型建模,并通过比较相关指数(如“残差平方和”)对不同的模型进行比较优劣。
教学过程:1.回忆:建立模型的基本步骤;2.新课: (例2)①背景分析,画散点图;②观察散点图,分析解释变量与预报变量更可能是什么函数关系;③建立数学模型;④转换:将非线性模型通过变换转化成线性模型;⑤对数据进行变换后,对新数据建立线性模型,求出回归方程;⑥再转换:转化为原来变量的模型(方程),并计算相关指数(“残差平方和”或R 2),比较两个不同模型的拟合效果。
第二课时 1.1回归分析的基本思想及其初步应用(二)教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用. 教学重点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和. 教学难点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和. 教学过程: 一、复习准备:1.由例1知,预报变量(体重)的值受解释变量(身高)或随机误差的影响.2.为了刻画预报变量(体重)的变化在多大程度上与解释变量(身高)有关?在多大程度上与随机误差有关?我们引入了评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和. 二、讲授新课:1. 教学总偏差平方和、残差平方和、回归平方和:(1)总偏差平方和:所有单个样本值与样本均值差的平方和,即21()ni i SST y y ==-∑.残差平方和:回归值与样本值差的平方和,即21()ni i i SSE y y ==-∑.回归平方和:相应回归值与样本均值差的平方和,即21()ni i SSR y y ==-∑.(2)学习要领:①注意i y 、i y 、y 的区别;②预报变量的变化程度可以分解为由解释变量引起的变化程度与残差变量的变化程度之和,即222111()()()nnni i i i i i i y y y y y y ===-=-+-∑∑∑;③当总偏差平方和相对固定时,残差平方和越小,则回归平方和越大,此时模型的拟合效果越好;④对于多个不同的模型,我们还可以引入相关指数22121()1()nii i n ii yy R yy ==-=--∑∑来刻画回归的效果,它表示解释变量对预报变量变化的贡献率. 2R 的值越大,说明残差平方和越小,也就是说模型拟合的效果越好. 2. 教学例题:例2 关于x 与Y 有如下数据:为了对x 、Y 两个变量进行统计分析,现有以下两种线性模型: 6.517.5y x =+,717y x =+,试比较哪一个模型拟合的效果更好.分析:既可分别求出两种模型下的总偏差平方和、残差平方和、回归平方和,也可分别求出两种模型下的相关指数,然后再进行比较,从而得出结论.(答案:52211521()155110.8451000()i iiiiy yRy y==-=-=-=-∑∑,221R=-521521()18010.821000()i iiiiy yy y==-=-=-∑∑,84.5%>82%,所以甲选用的模型拟合效果较好.)3. 小结:分清总偏差平方和、残差平方和、回归平方和,初步了解如何评价两个不同模型拟合效果的好坏.。
第一章 统计案例 1.1回归分析的基本思想及其初步应用(一) 第一课时 教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用. 指数和残差分析. 教学难点:解释残差变量的含义,了解偏差平方和分解的思想. 教学过程: 一、复习准备: 1. 提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关? 2. 复习:函数关系是一种确定性关系,而相关关系是一种非确定性关系. 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据作散点图求回归直线方程利用方程进行预报. 二、讲授新课: 1. 教学例题: ① 例1 从某大学中随机选取8名女大学生,其身高和体重数据如下表所示: 编 号 1 2 3 4 5 6 7 8 身高/cm 165 165 157 170 175 165 155 170
体重/kg 48 57 50 54 64 61 43 59 求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重. (分析思路教师演示学生整理)
第一步:作散点图 第二步:求回归方程 第三步:代值计算 ② 提问:身高为172cm的女大学生的体重一定是60.316kg吗? 不一定,但一般可以认为她的体重在60.316kg左右. ③ 解释线性回归模型与一次函数的不同 事实上,观察上述散点图,我们可以发现女大学生的体重y和身高x之间的关系并不能用一次函数ybxa来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画身高和体重的关系). 在数据表中身高为165cm的3名女大学生的体重分别为48kg、57kg和61kg,如果能用一次函数来描述体重与身高的关系,那么身高为165cm的3名女在学生的体重应相同. 这就说明体重不仅受身高的影响还受其他因素的影响,把这种影响的结果e(即残差变量或随机变量)引入到线性函数模型中,得到线性回归模型ybxae,其中残差变量e中包含体重不能由身高的线性函数解释的所有部分. 当残差变量恒等于0时,线性回归模型就变成一次函数模型. 因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式. 2. 相关系数:相关系数的绝对值越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义. 3. 小结:求线性回归方程的步骤、线性回归模型与一次函数的不同. 备课人:张颖 岳新霞 王莉 时间:2013-2-21。地点西教学楼三楼办公室 1.1回归分析的基本思想及其初步应用(二) 第二课时 教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用. 教学重点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和. 教学难点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和. 教学过程: 一、复习准备: 1.由例1知,预报变量(体重)的值受解释变量(身高)或随机误差的影响. 2.为了刻画预报变量(体重)的变化在多大程度上与解释变量(身高)有关?在多大程度上与随机误差有关?我们引入了评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和. 二、讲授新课: 1. 教学总偏差平方和、残差平方和、回归平方和:
(1)总偏差平方和:所有单个样本值与样本均值差的平方和,即21()niiSSTyy.
残差平方和:回归值与样本值差的平方和,即21()niiiSSEyy. 回归平方和:相应回归值与样本均值差的平方和,即21()niiSSRyy. (2)学习要领:①注意iy、iy、y的区别;②预报变量的变化程度可以分解为由解释变量引起的变化程度与残差变量的变化程度之和,即222111()()()nnniiiiiiiyyyyyy;③当总偏差平方和相对固定时,残差平方和越小,则回归平方和越大,此时模型的拟合效
果越好;④对于多个不同的模型,我们还可以引入相关指数22121()1()niiiniiyyRyy来刻画回归的效果,它表示解释变量对预报变量变化的贡献率. 2R的值越大,说明残差平方和越小,也就是说模型拟合的效果越好. 2. 教学例题: 例2 关于x与Y有如下数据: x 2 4 5 6 8
y 30 40 60 50 70
为了对x、Y两个变量进行统计分析,现有以下两种线性模型:6.517.5yx,717yx,试比较哪一个模型拟合的效果更好.
分析:既可分别求出两种模型下的总偏差平方和、残差平方和、回归平方和,也可分别求出两种模型下的相关指数,然后再进行比较,从而得出结论.
(答案:52211521()155110.8451000()iiiiiyyRyy,221R521521()18010.821000()iiiiiyyyy,84.5%>82%,所以甲选用的模型拟合效果较好.) 3. 小结:分清总偏差平方和、残差平方和、回归平方和,初步了解如何评价两个不同模型拟合效果的好坏. 备课人:张颖 岳新霞 王莉 时间:2013-2-21。地点西教学楼三楼办公室 1.1回归分析的基本思想及其初步应用(三) 第三课时 教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用. 教学重点:通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法. 教学难点:了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较. 教学过程: 一、复习准备: 1. 给出例3:一只红铃虫的产卵数y和温度x有关,现收集了7组观测数据列于下表中,试建立y与x之间的回归方程. 温度/xC 21 23 25 27 29 32 35 产卵数/y个 7 11 21 24 66 115 325
(学生描述步骤,教师演示) 2. 讨论:观察右图中的散点图,发现样本点并没有分布在某个带状区域内,即两个变量不呈线性相关关系,所以不能直接用线性回归方程来建立两个变量之间的关系. 二、讲授新课: 1. 探究非线性回归方程的确定: ① 如果散点图中的点分布在一个直线状带形区域,可以选线性回归模型来建模;如果散点图中的点分布在一个曲线状带形区域,就需选择非线性回归模型来建模. ② 根据已有的函数知识,可以发现样本点分布在某一条指数函数曲线y=2C1exC的周围(其中12,cc是待定的参数),故可用指数函数模型来拟合这两个变量. ③ 在上式两边取对数,得21lnlnycxc,再令lnzy,则21lnzcxc,而z与x间的关系如下: X 21 23 25 27 29 32 35 z 1.946 2.398 3.045 3.178 4.190 4.745 5.784 观察z与x的散点图,可以发现变换后样本点分布在一条直线的附近,因此可以用线性回归方程来拟合. ④ 利用计算器算得3.843,0.272ab,z与x间的线性回归方程为
0.2723.843zx,因此红铃虫的产卵数对温度的非线性回归方程为
0.2723.843xye.
⑤ 利用回归方程探究非线性回归问题,可按“作散点图建模确定方程”这三个步骤进行. 其关键在于如何通过适当的变换,将非线性回归问题转化成线性回归问题. 2. 小结:用回归方程探究非线性回归问题的方法、步骤. 三、巩固练习: 为了研究某种细菌随时间x变化,繁殖的个数,收集数据如下: 天数x/天 1 2 3 4 5 6 繁殖个数y/个 6 12 25 49 95 190 (1)用天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图; (2)试求出预报变量对解释变量的回归方程.(答案:所求非线性回归方程为0.691.112ˆy=ex.) 备课人:张颖 岳新霞 王莉 时间:2013-2-22。地点西教学楼三楼办公室
1.1回归分析的基本思想及其初步应用(四) 第四课时 教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用. 教学重点:通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法,了解可用残差分析的方法,比较两种模型的拟合效果. 教学难点:了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较. 教学过程: 一、复习准备: 1. 提问:在例3中,观察散点图,我们选择用指数函数模型来拟合红铃虫的产卵数y和温度x间的关系,还可用其它函数模型来拟合吗? 2. 讨论:能用二次函数模型234ycxc来拟合上述两个变量间的关系吗?(令2tx,则
34yctc,此时y与t间的关系如
下: 观察y与t的散点图,可以发现样本点并不分布在一条直线的周围,因此不宜用线性回归方程来拟合它,即不宜用二次曲线234ycxc来拟合y与x之间的关系. )小结:也就是说,我们可以通过观察变换后的散点图来判断能否用此种模型来拟合. 事实上,除了观察散点图以外,我们也可先求出函数模型,然后利用残差分析的方法来比较模型的好坏. 二、讲授新课: 1. 教学残差分析:
① 残差:样本值与回归值的差叫残差,即iiieyy. ② 残差分析:通过残差来判断模型拟合的效果,判断原始数据中是否存在可疑数据,这方面的分析工作称为残差分析. ③ 残差图:以残差为横坐标,以样本编号,或身高数据,或体重估计值等为横坐标,作出的图形称为残差图. 观察残差图,如果残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,模型拟合精度越高,回归方程的预报精度越高. 2. 例3中的残差分析: 计算两种模型下的残差
一般情况下,比较两个模型的残差比较困难(某些样本点上一个模型的残差的绝对值比另一个模型的小,而另一些样本点的情况则相反),故通过比较两个模型的残差的平方和的大小来判断模型的拟合效果. 残差平方和越小的模型,拟合的效果越好. 由于两种模型下的残差平方和分别为1450.673和15448.432,故选用指数函数模型的拟合效果远远优于选用二次函数模型. (当然,还可用相关指数刻画回归效果) 3. 小结:残差分析的步骤、作用 三、巩固练习:练习:教材P13 第1题
t 441 529 625 729 841 1024 1225
y 7 11 21 24 66 115 325