北师大版选修1-2:1.1.1回归分析--教学设计一、二、三
- 格式:doc
- 大小:642.59 KB
- 文档页数:22
word 格式整理参考资料 学习帮手 第一章 统计案例§1.1.1回归分析预习案【学习目标】1. 理解并掌握用回归分析处理两个变量之间的不确定关系的统计方法。
2. 了解回归分析的意义。
3. 以极度的热情,自动自发、如痴如醉,投入到学习中,充分享受学习的快乐。
【使用说明与学法指导】1. 课前(前一天晚自习)自学课本并完成导学案,要求限时完成,书写规范;2. 带“★”的C 层可以选做,带“★★”的B,C 层可以选做.3. 自主探究先行一步,遇到难以理解的地方先做好标记,然后再通过小组讨论解决,如果小组不能解决的问题第二天在课堂上讨论解决。
一、预习自学: 基础知识梳理 问题导引知识点一:两个变量的关系与回归分析函数关系是一种 关系,而相关关系是一种 关系。
回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。
知识点二:线性回归方程1.求线性回归直线方程的步骤:(1) 作出散点图,将问题所给的数据在平面直角坐标系中描点,这样表示出的具有相关关系的两个变量的一组数据的图形就是散点图,从散点图中我们可以看出样本点是否呈条状分布,来判断两个量是否具有线性相关关系;(2) 求回归系数a ,b ,其中∑∑∑∑====--=---=n i i n i i i n i i n i i i xn x y x n y x x xy y x x b 121121)())((,x b y a -= (3) 写出回归直线方程a bx y +=,并用回归直线方程进行预测。
2. 回归直线a bx y +=过点),(y x ,这个点称为样本的中心.【预习自测】(大约10分钟,包括预习自学)1. 设有一个回归方程为22.5y x ∧=-,当变量x 增加一个单位时,( ) A 、y 平均增加2.5个单位 B 、y 平均增加2个单位C 、y 平均减少2.5个单位D 、y 平均减少2个单位2. 在一次试验中,测得),(y x 的四组数据值为(1,2),(2,3),(3,4),(4,5),则y 与x 之间的线性回归方程为 ( ) A.1+=x y B.2+=x y C.12+=x y D.1-=x y3.为研究变量x 和y 的线性相关性,甲、乙二人分别作了研究,利用线性回归方法得到回归直线方程1l 和2l ,两人计算知x 相同,y 也相同,下列正确的是( )A. 1l 与2l 一定平行B. 1l 与2l 相交于点),(y xC.1l 与2l 重合D. 无法判断1l 和2l 是否相交【我的疑惑】(将在预习中不能理解的问题写下来,供课堂上处理)1.2.3.。
§回归分析.回归分析.相关系数.可线性化的回归分析.了解回归分析的思想和方法.(重点).掌握相关系数的计算和判断线性相关的方法.(重点).了解常见的非线性回归模型转化为线性回归模型的方法.(难点)[基础·初探]教材整理回归分析阅读教材~“练习”以上部分,完成下列问题.设变量对的线性回归方程为=+,由最小二乘法知系数的计算公式为:===\(\()),\(=)\()-\()),=-.某产品的广告费用与销售额的统计数据如下表:售额为( ) 【导学号:】.万元.万元.万元.万元【解析】==,==,∴=-=-×=,∴回归方程为=+,∴当=时,=×+=,故选.【答案】教材整理相关系数阅读教材“练习”以下至“练习”以上部分,完成下列问题..相关系数的计算假设两个随机变量的数据分别为(,),(,),…,(,),则变量间线性相关系数===..相关系数与线性相关程度的关系()的取值范围为;[-]()值越大,误差越小,变量之间的线性相关程度越高;()值越接近,误差越大,变量之间的线性相关程度越.低.相关性的分类()当时,两个变量正相关;>()当<时,两个变量负相关;()当时,两个变量线性不相关.=判断(正确的打“√”,错误的打“×”)()两个变量的相关系数>,则两个变量正相关.( )()两个变量的相关系数越大,它们的相关程度越强.( )()若两个变量负相关,那么其回归直线的斜率为负.( )【答案】()√()×()√教材整理可线性化的回归分析阅读教材~“练习”以上部分,完成下列问题..非线性回归分析对不具有线性相关关系的两个变量做统计分析,通过变量代换,转化为线性回归模型..非线性回归方程。
例谈回归分析的应用在解许多实际应用问题时,运用回归分析的基本思想,通过构建回归模型去刻画解释变量与预报变量的关系,并利用模型,对解释变量的某个值去预测相应预报变量的某个值,从而使问题得到解决.建立回归模型解实际问题的步骤是:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系;(3)由经验确定回归方程的类型,即拟合直线或拟合曲线;(4)按一定规则估计回归方程中的参数,从而求出拟合直线或拟合曲线的函数关系式;(5)利用函数关系式,根据条件对所给问题进行预测和控制,以便为决策提供依据.下面举例说明.例1某商场经营一批进价是30元/台的小商品,在市场试验中发现,此商品的销售单价x元与日销售量y台之间有如下关系:(1)y与x是否具有线性相关关系?如果具有线性相关关系,求出回归直线方程;(2)设经营此商品的日销售利润为P元,根据(1)写出P关于x的函数关系式并预测当销售单价x为多少元时,才能获得最大日销售利润.解析:(1)散点图如右图所示,并从图中可以看出,这些点大致分布在一条直线附近,因此两个变量线性相关.设回归直线为ˆy bx a=+,则由公式求得3a=.b-≈,161.5∴ˆ3161.5=-+;y x(2)依题意有2=-+-=-+-,(3161.5)(30)3251.54845P x x x x∴当251.5426x =≈时,P 有最大值约为426. 即预测销售单价为42元时,才能获得最大日销售利润.点评:本题主要考查构建线性回归模型在解决实际问题中的应用. 例2 某国从1790年至1950年人口数据资料:试利用上述资料预测该国1980年的人口数(假设该国政治、社会、经济环境稳定,且人口数相对于时间是连续的).分析:以x 轴代表年度,y 轴代表人口数,建立直角坐标系,画出散点图(略),并观察散点图可以发现,从1890年以后散点近似分布在一条直线上;而从散点图的整体趋势来看,也可以认为散点近似分布在一条抛物线上,故可采用线性回归模型拟合,或采用二次函数模型拟合.解法一:由散点图可以看出,1890年以后散点大致分布在一条直线上,设线性回归直线方程为ˆybx a =+,由公式求得 1.4852747.025b a -≈,≈, 即ˆ 1.48582747.025yx =-. ∴当1980x =时,6194.85910y =⨯,即1980年该国人口预测为194.859百万人.解法二:从散点的整体趋势看,散点近似分布在一条以直线1790x =为对称轴,以点(1790,3.929)为顶点的抛物线上,再任意选一点(1890,62.948)确定抛物线方程为20.0059(1790) 3.929y x =-+.∴当1980x =时,6216.91910y =⨯,即该国人口预测为216.919百万人. 点评:本题主要考查重视对信息、图表的分析,提取,加工和处理能力.两种解法,由于考虑问题和观察角度不同,所得到结论和答案也不相同,线性回归模型是在依据部分已知数据的基础上作出的,因此精确度比较差;而二次函数模型是根据全部已知数据的分布趋势拟合的,因而有较高的精确度.当然,同学们可以进一步利用回归分析的方法,通过利用相关指数2R来比较两个模型的拟合效果.。
庐山区一中高效课堂导学案北师大版数学选修1-2 第一章 统计案例 §1回归分析§1.1.1 回归分析(总第1课时)主编:查道强 审核:柯愈勇 审批:【预习案】学习目标:1、知识与技能:通过对统计案例的探究,会对两个随机变量进行线性回归分析。
2、过程与方法:学生通过实例分析学习最小二乘法,及其求解回归方程。
3、情感态度与价值观:(1)进一步树立数形结合的思想。
(2)进一步体会构建模型的作用。
教学重点:散点图的画法,回归直线方程的求解方法。
教学难点:回归直线方程的求解方法。
使用说明&学法指导:1、用15分钟左右时间,阅读探究课本P1-P6的内容,熟记基础知识,自主高效学习,提升自己的阅读理解能力。
2、完成教材助读设置的问题,然后结合课本的基础知识例题,完成预习自测题。
3、将预习中不能解决的问题标记出来,并写到后面“我的疑问”处。
(一)相关知识——知识储备,学以致用请同学们回顾前面所学知识对下面的问题做出回答:问题1:现实生活中两个变量间的关系有哪些呢?问题2:相关关系与函数关系有怎样的不同?问题3:对于线性相关的两个变量用什么方法来刻划之间的关系呢?问题4:你知道最小二乘法吗?(二)教材助读——精心阅读,仔细思考1、必修课程中,我们已经会用最小二乘法求变量之间的线性回归方程。
假设样本点为112233(,),(,),(,),(,)n n x y x y x y x y …,,设线性回归方程为 ,我们的想法就是要求a,b ,使这n 个点与直线 的“距离”平方之和 。
2、在统计中,我们使用 表示一组数据123,,,,n x x x x …的平均值,即 。
为了简化表示,我们引进求和符号,记作 。
3、1()n ii x x =-=∑ 。
1()ni i y y =-=∑ 。
4、____________________________________xx xy yy l l l ===5、线性回归方程y a bx =+,其中b=a=(三)预习自测——自我检测,自我完善自测题体现一定的基础性,又有一定的思维含量,只有“细心才对,思考才会”。
1.1 回归分析-北师大版选修2-3教案一、教学目标1.理解回归分析的基本概念。
2.掌握最小二乘法求解一元线性回归方程的方法。
3.能够利用回归分析解决实际问题。
4.培养学生运用数学知识分析问题和解决问题的能力。
二、教学重点1.回归分析的定义和基本原理。
2.最小二乘法求解一元线性回归方程的步骤。
3.运用回归分析解决实际问题。
三、教学难点1.最小二乘法求解一元线性回归方程的方法。
2.运用回归分析解决实际问题的能力。
四、教学方法1.讲授法2.示例法3.练习法五、教学资源1.北师大版选修2-3教材2.教学投影仪3.计算器六、教学过程6.1 导入1.引入回归分析的概念,让学生了解回归分析的应用场景。
2.引入最小二乘法的基本概念。
3.引入一元线性回归方程的概念。
6.2 讲授1.讲解回归分析的定义和基本原理。
2.讲解最小二乘法求解一元线性回归方程的步骤。
6.3 示例演练1.通过一个实际问题,示范如何利用回归分析解决问题。
2.带领学生一步一步跟随示例演练。
6.4 训练1.提供多个实际问题,让学生自己运用回归分析解决问题。
2.提供必要的支持和指导。
6.5 总结1.回顾回归分析的基本概念和最小二乘法求解方法。
2.总结回归分析的应用场景和作用。
七、课后作业1.完成教材相关思考题和练习题。
2.自选一道实际问题,利用回归分析解决。
3.总结回归分析的基本原理、方法和应用场景。
八、教学评估1.教师检查学生完成的练习和作业情况。
2.教师记录课堂表现优秀的学生,有针对性地给予表扬或加分。
九、教学反思经过这次教学,我发现学生对于最小二乘法和一元线性回归方程的理解还比较浅,需要在教学时细化概念,加强示范和练习,以便他们更好地吸收掌握。
此外,针对应用场景的演示需更丰富,让学生在现实问题上获得更多的直观感受。
1.1回归分析自学目标(1)通过实例引入线性回归模型,感受产生随机误差的原因;(2)通过对回归模型的合理性等问题的研究,渗透线性回归分析的思想和方法;(3)能求出简单实际问题的线性回归方程.重点,难点线性回归模型的建立和线性回归系数的最佳估计值的探求方法.学习过程一.问题情境1.情境:对一作直线运动的质点的运动过程观测了8次,得到如下表所示的数据,试估计当x=9时的位置y的值.时刻x/s1*******位置观测值5.547.5210.0211.7315.6916.1216.9821.06y/cm根据《数学3(必修)》中的有关内容,解决这个问题的方法是:先作散点图,如下图所示:从散点图中可以看出,样本点呈直线趋势,时间x与位置观测值y之间有着较好的线性关系.因此可以用线性回归方程来刻画它们之间的关系.根据线性回归的系数公式,1221()ni i i ni i x y nx y b x n x a y bx==⎧-⎪⎪=⎪⎨-⎪⎪=-⎪⎩∑∑ 可以得到线性回归方为 3.5361 2.1214y x =+,所以当9x =时,由线性回归方程可以估计其位置值为22.6287y =2.问题:在时刻9x =时,质点的运动位置一定是22.6287cm 吗? 二.学生活动思考,讨论:这些点并不都在同一条直线上,上述直线并不能精确地反映x 与y 之间的关系,y 的值不能由x 完全确定,它们之间是统计相关关系,y 的实际值与估计值之间存在着误差. 三.建构数学1.线性回归模型的定义:我们将用于估计y 值的线性函数a bx +作为确定性函数;y 的实际值与估计值之间的误差记为ε,称之为随机误差;将y a bx ε=++称为线性回归模型.说明:(1)产生随机误差的主要原因有:①所用的确定性函数不恰当引起的误差; ②忽略了某些因素的影响; ③存在观测误差.(2)对于线性回归模型,我们应该考虑下面两个问题: ①模型是否合理(这个问题在下一节课解决); ②在模型合理的情况下,如何估计a ,b ? 2.探求线性回归系数的最佳估计值:对于问题②,设有n 对观测数据(,)iix y (1,2,3,,)i n =,根据线性回归模型,对于每一个ix ,对应的随机误差项()ii i y a bx ε=-+,我们希望总误差越小越好,即要使21ni i ε=∑越小越好.所以,只要求出使21(,)()ni i i Q y x αββα==--∑取得最小值时的α,β值作为a ,b 的估计值,记为a ,b .注:这里的iε就是拟合直线上的点(),iix a bx +到点(),iiiP x y 的距离.用什么方法求a ,b ?回忆《数学3(必修)》“2.4线性回归方程”P71“热茶问题"中求a ,b 的方法:最小二乘法.利用最小二乘法可以得到a ,b 的计算公式为1122211()()()()nni i iii i nni ii i x x y y x ynx yb x x xn x a y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑,[来源:Z #xx #k 。
word 整理版学习参考资料探究案学始于疑----我思考,我收获二、合作探究(大约15分钟,包括小组讨论与展示)探究一:回归分析概念辨析例1:在下列说法中正确命题的个数是 ( )①回归分析就是有样本点去寻找一条直线方程,刻画这些样本点之间的关系的数学方法; ②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示; ③通过线性回归方程a bx y += 及其回归系数分析b ,可以估计和预测变量的取值和变化趋势④因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验。
A.1 B.2 C.3 D.4探究二:线性回归分析例2:对于x 与y 有如下观测数据:x 18 25 30 39 41 42 49 32 y356788910(1)画出散点图(2)求出y 对x 的回归直线方程;(3)根据回归直线方程,预测y=20时x 的值。
【探究小结】1.会用散点图判断两个变量的关系是否可以用线性关系。
知道只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程是毫无意义的;2.会利用线性回归方程预测当x 取某一个值时y 的估计值。
【当堂检测】(大约10分钟)1. 下表是x 与y 之间的一组数据,则y 关于x 的线性回归直线必过点 ( )x 0 1 2 3 y1357A.(2,2)B.(1.5,2)C.(1,2)D.(1.5,4)★★2.某产品的广告费用x 与销售额y 的统计数据如表:广告费用x (万元)4 2 35 销售额y (万元)49263954根据上表可得回归方程a bx y += 中的b 为9.4,据此模型预报广告费用为6万元时销售额为 万元。
【我的收获】(反思静悟,体验成功)【课堂小结】1.知识方面:①掌握用回归分析处理两个变量之间的不确定关系的统计方法 ②了解回归分析的意义2.数学思想方法:回归的基本思想 【温馨提示】请同学们完成《全程学习导与练》的训练案。
一道回归分析题的思维拓展与延伸一、回归分析的大体步骤:(1) 画出两个变量的散点图.(2) 求回归直线方程.(3) 用回归直线方程进行预报.下面咱们通过案例,进一步学习、拓展与延伸回归分析的大体思想及其应用.二、举例:例1. 从某大学中随机选取 8 名女大学生,其身高和体重数据如表编号 1 2 3 4 5 6 7 8身高/cm 165 165 157 170 175 165 155 170体重/kg 48 57 50 54 64 61 43 59求按照女大学生的身高预报体重的回归方程,并预报一名身高为 172 cm 的女大学生的体重.解:由于问题中要求按照身高预报体重,因此选取身高为自变量 x ,体重为因变量 y .作散点图,如下图从图中能够看出,样本点呈条状散布,身高和体重有比较好的线性相关关系,因此能够用线性回归方程来近似刻画它们之间的关系.按照公式:=-(1)a y bx121()()()n i i i n ii x x y y b x x ==--=-∑∑ (2) 其中1111,n ni i i i x x y y n n ====∑∑,(,x y )成为样本点的中心. 能够取得ˆˆ0.849,85.712ba ==-. 于是取得回归方程084985.712y x =-.因此,对于身高172 cm 的女大学生,由回归方程能够预报其体重为 084917285.71260.316y =⨯-= ( kg ) .ˆ0.849b=是斜率的估量值,说明身高 x 每增加1个单位时,体重y 就增加 位,这表明体重与身高具有正的线性相关关系.三.思维拓展与延伸1.如何描述它们之间线性相关关系的强弱?在必修 3 中,咱们介绍了用相关系数;来衡量两个变量之间线性相关关系的方式.本相关系数的具体计算公式为()()ni ix x y y r --=∑. 当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r 的绝对值越接近1,表明两个变量的线性相关性越强;r 的绝对值接近于0时,表明两个变量之间几乎不存在线性相关关系.通常,当r 的绝对值大于0. 75 时以为两个变量有很强的线性相关关系.在本例中,能够计算出r =0. 798.这表明体重与身高有很强的线性相关关系,从而也表明咱们成立的回归模型是成心义的.2.如何理解y 与y ~间的误差 显然,身高172cm 的女大学生的体重不必然是60. 316 kg ,但一般能够以为她的体重接近于60 . 316 kg .如下图中的样本点和回归直线的彼此位置说明了这一点.由于所有的样本点不共线,而只是散布在某一条直线的周围,所以身高和体重的关系可用下面的线性回归模型来表示:y bx a e =++这里a 和b 为模型的未知参数,e 是y 与y bx a =+之间的误差.通常e 为随机变量,称为随机误差,它的均值 E(e )=0,方差D (e )=2()D e σ=>0 .如此线性回归模型的完整表达式为:2,()0,().y bx a e E e D e σ=++⎧⎨==⎩ (3) 在线性回归模型(3)中,随机误差e 的方差护越小,通过回归直线y bx a =+ 预报真实值y 的精度越高.随机误差是引发预报值y 与真实值 y 之间的误差的原因之一,大小取决于随机误差的方差.另一方面,由于公式(1)和(2)中a 和b 为截距和斜率的估量值,它们与真实值a 和b 之间也存在误差,这种误差是引发预报值y 与真实值y 之间误差的另一个原因.3. 产生随机误差项e 的原因是什么?一个人的体重值除受身高的影响外,还受许多其他因素的影响.例如饮食适应、是不是喜欢运动、气宇误差等.事实上,咱们无法明白身高和体重之间的确切关系是什么,这里只是利用线性回归方程来近似这种关系.这种近似和上面提到的影响因素都是产生随机误差 e 的原因.因为随机误差是随机变量,所以能够通过那个随机变量的数字特征来刻画它的一些整体特征.均值是反映随机变量取值平均水平的数字特征,方差是反映随机变量集中于均值程度的数字特征,而随机误差的均值为0,因此能够用方差2σ来衡量随机误差的大小.4.用身高预报体重时,需要注意哪些问题?需要注意下列问题:(1).回归方程只适用于咱们所研究的样本的整体.例如,不能用女大学生的身高和体重之间的回归方程,描述女运动员的身高和体重之间的关系.一样,不能用生长在南方多雨地域的树木的高与直径之间的回归方程,描述北方干旱地域的树木的高与直径之间的关系.(2).咱们所成立的回归方程一般都有时刻性.例如,不能用 20 世纪80 年代的身高体重数据所成立的回归方程,描述此刻的身高和体重之间的关系.(3).样本取值的范围会影响回归方程的适用范围.例如,咱们的回归方程是由女大学生身高和体重数据成立的,那么用它来描述一个人幼儿时期的身高和体重之间的关系就不适当(即在回归方程中,解释变量 x 的样本的取值范围为[155cm,170cm〕,而用那个方程计算 x-70cm 时的y值,显然不适合.)(4).不能期望回归方程取得的预报值就是预报变量的精准值.事实上,它是预报变量的可能取值的平均值.。
例析回归分析思想1、相关性查验相关性查验是统计中的假设查验,按照公式计算r 的值。
当|r|越接近于1,相关程度越强;当|r|越接近于0,相关程度越弱,具体步骤: (1)假设x 与y 不具有线性相关关系。
(2)按照小频率查表得出r 的一个临界值05.0r 。
(3)按照公式计算出样本相关系数r 的值。
(4)统计推断,若|r|>05.0r ,具有线性相关关系;若|r|≤05.0r ,不具有线性相关关系。
2、线性回归分析一般情形下,在尚未判定两个变量之间是不是具有线性相关关系的情形下,应先进行相关性查验,在确认具有线性相关关系后,再求回归直线方程。
回归分析的一般步骤为:(1)从一组数据动身,求出两个变量的相关系数r ,肯定二者之间是不是具有线性相关关系。
(2)若是具有线性相关关系,求出回归方程∧∧∧+=a x b y ,其中∧a 是常数项,∧b 是回归系数。
(3)按照回归方程,由一个变量的值,预测或控制另一个变量的值。
下面通过例题加以分析:例1、在10年期间,一城市居民的年收入与某种商品的销售额之间的关系有如下数据: 第几年12 3 4 5 城市居民年收入x (亿元) 某商品销售额y (万元) 第几年67 8 9 10 城市居民年收入x (亿元) 某商品销售额y (万元)(1)画出散点图;(2)若是散点图中的各点大致散布在一条直线的周围,求y 与x 之间的回归直线方程。
解:(1)散点图如图所示:(2) i1 2 3 4 5 6 7 8 9 10 i xy ix i y i805 9331558 1638 189223461.39,37==y x∑=1012i ix=,∑=1012i i y =15857,∑=101i i i y x =)10)(10(102101221012101y y x x yx yx r i ii i i i i --⋅-=∑∑∑====)1.391015857)(97.371067.14663(1.3997.37109.1520222⨯-⨯-⨯⨯-952.0≈。
“教材分析与导入设计”
1.1.1回归分析
本节教材分析
课本通过这个例子回归用最小二乘法求两个变量(肱骨长度和股骨长度)之间的线性回归
方程的方法,并利用所求得的线性回归方程预测当股骨长度为50cm时肱骨的长度.让学生通过这个实例明白回归方程的求解步骤及原理,以及如何运用最小二乘法如何处理两个变量.
三维目标
1. 知识与技能:通过对统计案例的探究,会对两个随机变量进行线性回归分析.
2. 过程与方法:学生通过实例分析学习最小二乘法,及其求解回归方程.
3.情感.态度与价值观:(1)进一步树立数形结合的思想.(2)进一步体会构建模型的作用.
教学重点:散点图的画法,回归直线方程的求解方法.
教学难点:回归直线方程的求解方法..
教学建议:本节课主要通过实例回归用最小二乘法求两个变量之间的线性回归方程.教学时应引导学生阅读,再结合阅读基础讲解最小二乘法的推导原理,并强调求回归方程的具体解题步骤,让学生明白回归方程的求解用途.
新课导入设计
导入一:(复习导入) 在必修课程中,我们已经学习了最小二乘法,并会建立变量之间的线性回归方程.引导学生阅读教材,然后完成知识点的填充.
导入二:(直接导入)本节课我们在必修课的基础上,来学习利用最小二乘法来求解回归方程,下面我通过具体的实例来分析说明.。
回归分析的基本思想及其初步应用【教学目标】:(1)知识与技能:了解回归模型的选择;进一步理解非线性模型通过变换转化为线性回归模型;体会不同模型拟合数据的效果。
(2)过程与方法:从实例出发,求出相应的回归直线方程,从中也找出存在的不足,从而有进行回归分析的必要性,通过学习相关指数,用相关指数来刻画回归的效果,进而归纳出回归分析的一般步骤,并对具体问题进行回归分析,用于解决实际问题。
(3)情感态度与价值观:任何事物都是相对的,但又有一定的规律性,我们只要从实际出发,不断探求事物的内在联系,就会找出其中的规律性,形成解决实际问题的方法和能力。
【教学重点】:1.加深体会有些非线性模型通过变换可以转化为线性回归模型;2.了解在解决问题的过程中寻找更好的模型的方法。
【教学难点】:1.了解常用函数的图像特点,选择不同的模型建模;2.通过比较相关指数对不同的模型进行比较。
教学过程问题导学一、求线性回归方程活动与探究1某工厂1~8月份某种产品的产量与成本的统计数据见下表:以产量为x,成本为y.(1)画出散点图;(2)y与x是否具有线性相关关系?若有,求出其回归方程.迁移与应用1.(2013海南海口模拟)在一次试验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则y与x之间的回归直线方程为()A.=x+1 B.=x+2C.=2x+1 D.=x-12.某商场经营一批进价是30元/台的小商品,在市场试验中发现,此商品的销售单价x(x取整数)元与日销售量y台之间有如下关系:(1)y与x是否具有线性相关关系?如果具有线性相关关系,求出回归直线方程.(方程的斜率精确到个位)(2)设经营此商品的日销售利润为P元,根据(1)写出P关于x的函数关系式,并预测当销售单价x为多少元时,才能获得最大日销售利润.(1)散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析.(2)求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.二、线性回归分析活动与探究2某运动员训练次数与运动成绩之间的数据关系如下:(1)作出散点图;(2)求出线性回归方程;(3)作出残差图,并说明模型的拟合效果;(4)计算R2,并说明其含义.迁移与应用1.某产品的广告费用x与销售额y的统计数据如下表:根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为()A.63.6万元B.65.5万元C.67.7万元D.72.0万元2.在一段时间内,某种商品的价格x(元)和需求量y(件)之间的一组数据为:且知x与y具有线性相关关系,求出y对x的回归直线方程,并说明拟合效果的好坏.“相关指数R2、残差图”在回归分析中的作用:(1)相关指数R2是用来刻画回归效果的,由R2=1-可知R2越大,意味着残差平方和越小,也就是说模型的拟合效果就越好.(2)残差图也是用来刻画回归效果的,判断依据是:残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合精度越高,回归方程预报精度越高.三、非线性回归分析活动与探究3下表为收集到的一组数据:(1)作出x与y的散点图,并猜测x与y之间的关系;(2)建立x与y的关系,预报回归模型并计算残差;(3)利用所得模型,预报x=40时y的值.迁移与应用1.在彩色显影中,由经验知形成染料光学密度y与析出银的光学密度x由公式y=e b xA(b<0)表示,现测得试验数据如下:则y对x的回归方程是__________.2.在一次抽样调查中测得样本的5个样本点,数值如下表:试建立y与x之间的回归方程.非线性回归问题有时并不给出经验公式,这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量置换,把问题化为线性回归分析问题,使之得到解决.[答案] 课前·预习导学 【预习导引】1.(1)确定性 非确定性 (2)相关 (3) =1221ni ii n i i x ynx yx nx==--∑∑ -样本点的中心 (4)随机误差 解释变量 预报变量 预习交流1 D2.y i -bx i -a y i -i y i -x i -3.1- 解释变量 预报变量 1预习交流2 提示:散点图可以说明变量间有无线性相关关系,只能粗略地说明两个变量之间关系的密切程度,而相关指数R 2能精确地描述两个变量之间的密切程度.预习交流3 提示:(1)回归方程只适用于所研究的样本的总体. (2)所建立的回归方程一般都有时间性. (3)样本的取值范围会影响回归方程的适用范围.(4)不能期望回归方程得到的预报值就是预报变量的精确值.事实上,它是预报变量的可能取值的平均值.课堂·合作探究 【问题导学】活动与探究1 思路分析:画出散点图,观察图形的形状得x 与y 是否具有线性相关关系.把数值代入回归系数公式求回归方程.解:(1)由表画出散点图,如图所示.(2)从上图可看出,这些点基本上散布在一条直线附近,可以认为x 和y 线性相关关系显著,下面求其回归方程,首先列出下表.=6.85,=157.25.∴=81822188i ii ii x yx yxx ==--∑∑=≈22.17, =-=157.25-22.17×6.85≈5.39,故线性回归方程为=22.17x +5.39. 迁移与应用 1.A [解析]方法一:==,==.故===1,=-=-=1.因此,=x+1,故选A.方法二:也可由回归直线方程一定过点(,),即,代入验证可排除B,C,D.故应选A.2.[解析](1)散点图如图所示,从图中可以看出这些点大致分布在一条直线附近,因此两个变量线性相关.设回归直线为=x+,由题知=42.5,=34,则求得==≈-3.=-=34-(-3)×42.5=161.5.∴=-3x+161.5.(2)依题意有P=(-3x+161. 5)(x-30)=-3x2+251.5x-4 845=-32+-4 845.∴当x=≈42时,P有最大值,约为426.即预测销售单价为42元时,能获得最大日销售利润.活动与探究2思路分析:先画出散点图,确定是否具有线性相关关系,求出回归方程,再求出残差,确定模型的拟合的效果和R2的含义.[解析](1)作出该运动员训练次数(x)与成绩(y)之间的散点图,如图所示,由散点图可知,它们之间具有线性相关关系.(2) =39.25,=40.875,=12 656,=13 731,y i=13 180,i∴==≈1.041 5,=-=-0.003 875,∴线性回归方程为=1.041 5x-0.003 875.(3)作残差图如图所示,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适.(4)计算得相关指数R2≈0.985 5,说明了该运动员的成绩的差异有98.55%是由训练次数引起的.迁移与应用1.B[解析]∵=-=-9.4×=9.1,∴回归方程为=9.4x +9.1.令x =6,得=9.4×6+9.1=65.5(万元). 2.[解析]=×(14+16+18+20+22)=18,=×(12+10+7+5+3)=7.4,521ii x=∑=142+162+182+202+222=1 660,521ii y=∑=122+102+72+52+32=327,i y i =14×12+16×10+18×7+20×5+22×3=620,∴=51522155i ii ii x yx y xx ==--∑∑===-1.15.∴=7.4+1.15×18=28.1,∴回归直线方程为=-1.15x +28.1. 列出残差表为:∴(y i -i )2=0.3, (y i -)2=53.2,R 2=1-≈0.994.故R 2≈0.994说明拟合效果较好.活动与探究3 思路分析:先由数值表作出散点图,然后根据散点的形状模拟出近似函数,进而转化为线性函数,由数值表求出回归函数.[解析](1)作出散点图如图,从散点图可以看出x 与y 不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线21e c x y c =的周围,其中c 1,c 2为待定的参数.(2)对两边取对数把指数关系变为线性关系,令z =ln y ,则有变换后的样本点应分布在直线z =bx +a ,a =ln c 1,b =c 2的周围,这样就可以利用线性回归模型来建立y 与x 之间的非线性回归方程了,数据可以转化为:求得回归直线方程为=0.272x -3.849,∴=e 0.272x -3.849.残差(3)当x =40时,y =e 0.272x -3.849≈1 131.迁移与应用 1.$0.151.73e xy -= [解析]由题给的经验公式y =e b x A ,两边取自然对数,便得ln y =ln A +.与线性回归直线方程相对照,只要取u =,v =ln y ,a =ln A ,就有v =a +bu ,这是v 对u 的线性回归方程.对此我们已经掌握了一套相关性检验,求a 与回归系数b 的方法.题目所给数据经变量置换u =,v =ln y 变成如下表所示的数据:|r |≈0.998>0.75,故v与u之间具有很强的线性相关关系,求回归直线方程是有意义的.由表中数据可得≈-0.15,≈0.55,即=0.55-0.15u.把u与v换回原来的变量x与y,即u=,v=ln y,故ln =0.55-,即=0.150.55e x-=e0.550.15e x-≈0.151.73e x-.这就是y对x的回归曲线方程.2.[解析]画出散点图如图所示.根据散点图可知y与x近似地呈反比例函数关系,设y=,令t=,则y=kt,原数据变为:由置换后的数值表作散点图如下:由散点图可以看出y与t呈近似的线性相关关系.列表如下:所以=1.55,=7.2.所以=≈4.134 4,=-≈0.8.所以=4.134 4t+0.8.所以y与x的回归方程是=+0.8.当堂检测1.(2012湖南高考,理4)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为$y =0.85x-85.71,则下列结论中不正确的是()A.y与x具有正的线性相关关系B.回归直线过样本点的中心(x,y)C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg[答案]D[解析]D选项中,若该大学某女生身高为170 cm,则可断定其体重约为0.85×170-85.71=58.79(kg).故D不正确.3.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y对x的线性回归方程为()A.y=x-1 B.y=x+1C .y =88+12xD .y =176[答案]C[解析]法一:由线性回归直线方程过样本中心(176,176),排除A ,B[答案],结合选项可得C 为正确[答案].法二:将表中的五组数值分别代入选项验证,可知y =88+12x最适合.3.在两个变量y 与x 的回归模型中,分别选择了4个不同的模型.通过计算得R 2的值如下,其中拟合效果最好的模型是( )A .模型1的R 2为0.98B .模型2的R 2为0.80C .模型3的R 2为0.50D .模型4的R 2为0.25 [答案]A[解析]R 2越接近于1,则该模型的拟合效果就越好,精度越高.4.若对于变量y 与x 的10组统计数据的回归模型中,R 2=0.95,又知残差平方和为120.53,那么101i =∑(y i -y )2的值为______.[答案]2 410.6[解析]依题意有0.95=1-1021120.53()ii y y =-∑,所以1021()ii yy =-∑=2 410.6.4. 假设关于某设备的使用年限x (年)和所支出的维修费用y (万元)有如下的统计数据.若由此资料可知y 对x 呈线性相关关系,试求: (1)回归直线方程;[解析]由题表中数据列成下表:于是51522215112.35451.2390545i ii ii x y x ybxx ==--⨯⨯===-⨯-∑∑$,$a=y -bx $=5-1.23×4=0.08, 所以回归直线方程为$y=bx $+$a =1.23x +0.08.(2)估计使用年限为10年时,维修费用为多少? [答案]当x =10时,$y=1.23×10+0.08=12.38(万元),估计使用10年时的维修费用为12.38万元. 课堂小结:(学生总结) 板书设计:(略) 教后记:。
第1课时回归分析1.会对两个变量的相关关系进行分析、判断.2.了解回归分析的基本思想,会对两个变量的具体问题进行回归分析.3.掌握运用最小二乘法建立回归模型的基本步骤和方法.重点:熟练掌握回归分析,建立回归模型,求各相关指数的步骤.难点:如何求回归直线方程以及对相关系数r的理解和运用.我们每个人都有自己的身高和体重,那么如果把身高和体重分别作为变量,它们能够构成函数关系吗?问题1:散点图在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.问题2:相关关系与线性回归相关关系:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系称为相关关系.相关关系分为线性相关和非线性相关.函数关系中的两个变量间是一种确定性关系,相关关系是一种非确定性关系.线性回归:对具有相关关系的两个变量进行统计分析的一种常用方法.问题3:线性相关系数r=称为两个变量数据(x i,y i)(i=1,2,…,n)的线性相关系数.r用来刻画两个变量的线性回归效果:当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关;r的绝对值越接近于0 时,表明两个变量之间越不存在线性相关关系.问题4:线性回归分析的步骤对于一组具有线性相关关系的数据:(x1,y1),(x2,y2),…,(x n,y n).(1) 画散点图:看散点图是否呈条状分布.(2) 求回归直线方程(最小二乘法):b=, =x i,=y i,其中(,)为样本中心点,回归直线方程必经过样本中心点(,),得a=-b ;(3) 得出相关结论:回归直线方程为y=a+bx ,利用回归直线方程进行预测.“一只蝴蝶在巴西扇动翅膀,有可能会在美国的德克萨斯州引起一场龙卷风.”这就是洛伦兹1979年12月在华盛顿的“美国科学促进会”上的一次演讲中提出的“蝴蝶效应”.这次演讲给人们留下了极其深刻的印象.从此以后,所谓“蝴蝶效应”之说就不胫而走,名声远扬.“蝴蝶效应”之所以令人着迷、令人激动、发人深省,不但在于其大胆的想象力和迷人的美学色彩,而且在于其深刻的科学内涵和内在的哲学魅力.1.下列关系不属于相关关系的是( ).A.父母的身高与子女的身高B.人的身高与体重C.居民的收入与消费D.正方体的表面积和体积【解析】相关关系是一种非确定性关系,而D项是确定的关系,为函数关系,故选D.【答案】D2.设两个变量x与y之间具有线性相关关系,相关系数是r,回归方程为y=a+bx,那么必有( ).A.b与r符号相同B.a与r符号相同C.b与r符号相反D.a与r符号相反【解析】因为b与r的分母均为正,且分子相同,所以b与r同号.【答案】A3.某医院用光电比色检验尿汞时,得到尿汞含量x(毫克/升)与消化系数y的一组数据如下表:。
§1 回归分析1.1 回归分析1.2 相关系数1.3 可线性化的回归分析1.了解回归分析的思想和方法.(重点)2.掌握相关系数的计算和判断线性相关的方法.(重点)3.了解常见的非线性回归模型转化为线性回归模型的方法.(难点)[基础·初探]教材整理1 回归分析阅读教材P 3~P 6“练习”以上部分,完成下列问题.设变量y 对x 的线性回归方程为y =a +bx ,由最小二乘法知系数的计算公式为:b ===,a =-b .lxy lxx n∑i =1(xi -x )(yi -y )n∑i =1(xi -x )2n∑i =1xiyi -nx yn∑i =1x 2i -nx 2y x 某产品的广告费用x 与销售额y 的统计数据如下表:广告费用x (万元)4235销售额y (万元)49263954根据上表可得回归方程y =bx +a 中的b 为9.4,据此模型预报广告费用为6万元时,销售额为( ) 【导学号:67720000】A .63.6万元B .65.5万元C .67.7万元D .72.0万元【解析】 ==3.5,==42,∴a =-b =42-9.4×3.5=9.1x 4+2+3+54y 49+26+39+544y x ,∴回归方程为y =9.4x +9.1,∴当x =6时,y =9.4×6+9.1=65.5,故选B .【答案】 B教材整理2 相关系数阅读教材P 6“练习”以下至P 9“练习”以上部分,完成下列问题.1.相关系数r 的计算假设两个随机变量的数据分别为(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则变量间线性相关系数r ==lxy lxxlyy n∑i =1(xi -x )(yi -y )n∑i =1(xi -x )2n∑i =1(yi -y )2.n∑i =1xiyi -nx yn∑i =1x 2i -nx 2n∑i =1y 2i -ny 22.相关系数r 与线性相关程度的关系(1)r 的取值范围为[-1,1];(2)|r |值越大,误差Q 越小,变量之间的线性相关程度越高;(3)|r |值越接近0,误差Q 越大,变量之间的线性相关程度越低.3.相关性的分类(1)当r >0时,两个变量正相关;(2)当r <0时,两个变量负相关;(3)当r =0时,两个变量线性不相关.判断(正确的打“√”,错误的打“×”)(1)两个变量的相关系数r >0,则两个变量正相关.( )(2)两个变量的相关系数越大,它们的相关程度越强.( )(3)若两个变量负相关,那么其回归直线的斜率为负.( )【答案】 (1)√ (2)× (3)√教材整理3 可线性化的回归分析阅读教材P 9~P 13“练习”以上部分,完成下列问题.1.非线性回归分析对不具有线性相关关系的两个变量做统计分析,通过变量代换,转化为线性回归模型.2.非线性回归方程曲线方程曲线图形变换公式变换后的线性函数y =ax b(a =1,b >0) (a =1,b <0)c =ln av =ln x u =ln yu =c +b v y =a e bx(a >0,b >0) (a >0,b <0)c =ln au =ln yu =c +bx曲线方程曲线图形变换公式变换后的线性函数y =a e b x(a >0,b >0) (a >0,b <0)c =ln av =1x u =ln y u =c +b vy =a +b ln x(b >0) (b <0)v =ln xu =yu =a +b v下列数据x ,y 符合哪一种函数模型( )x 12345678910y22.6933.383.63.844.084.24.3A .y =2+x B .y =2e x13C .y =2eD .y =2+ln x 1x 【解析】 分别将x 的值代入解析式判断知满足y =2+ln x .【答案】 D[质疑·手记]预习完成后,请将你的疑问记录,并与“小伙伴们”探讨交流:疑问1:___________________________________________解惑:_____________________________________________________疑问2:_____________________________________________________解惑:_____________________________________________________疑问3:_____________________________________________________解惑:___________________________________________[小组合作型],变量间的相关关系及判定 (1)对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图111①,对变量u,v有观测数据(u i,v i)(i=1,2,…,10),得散点图111②.由这两个散点图可以判断( )图111A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关(2)(2016·上饶高二检测)两个变量x,y与其线性相关系数r有下列说法:①若r>0,则x增大时,y也随之相应增大;②若r<0,则x增大时,y也相应增大;③若r=1或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上,其中正确的有( )A.①② B.②③C.①③D.①②③(3)有五组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩;③某人每日吸烟量和其身体健康情况;④正方形的边长和面积;⑤汽车的重量和百公里耗油量.其中两个变量成正相关的是( )A.①③B.②④C.②⑤D.④⑤【精彩点拨】 可借助于线性相关概念及性质作出判断.【自主解答】 (1)由这两个散点图可以判断,变量x 与y 负相关,u 与v 正相关,故选C .(2)根据两个变量的相关性与其相关系数r 之间的关系知,①③正确,②错误,故选C .(3)其中①③成负相关关系,②⑤成正相关关系,④成函数关系,故选C .【答案】 (1)C (2)C (3)C1.线性相关系数是从数值上来判断变量间的线性相关程度,是定量的方法.与散点图相比较,线性相关系数要精细得多,需要注意的是线性相关系数r 的绝对值小,只是说明线性相关程度低,但不一定不相关,可能是非线性相关.2.利用相关系数r 来检验线性相关显著性水平时,通常与0.75作比较,若r >0.75,则线性相关较为显著,否则为不显著.[再练一题]1.下列两变量中具有相关关系的是( )A .正方体的体积与边长B .人的身高与体重C .匀速行驶车辆的行驶距离与时间D .球的半径与体积【解析】 选项A 中正方体的体积为边长的立方,有固定的函数关系;选项C 中匀速行驶车辆的行驶距离与时间成正比,也是函数关系;选项D 中球的体积是π与半径的立方相乘,有固定函数关系.只有选项B 中人的身高与体43重具有相关关系.【答案】 B,求线性回归方程 (2016·九江高二检测)某服装商场为了了解毛衣的月销售量y (件)与月平均气温x (℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:月平均气温x (℃)171382月销售量y (件)24334055(1)算出线性回归方程y =bx +a (a ,b 精确到0.1);(2)气象部门预测下个月的平均气温约为6 ℃,据此估计该商场下个月毛衣的销售量.【精彩点拨】 (1)可利用公式求解;(2)把月平均气温代入回归方程求解.【自主解答】 (1)由散点图易判断y 与x 具有线性相关关系.=(17+13+8+2)÷4=10,x =(24+33+40+55)÷4=38,y x i y i =17×24+13×33+8×40+2×55=1 267,∑4i =1x =526,∑4i =12ib =∑4i =1xiyi -4x y ∑4i =1x 2i -4x 2=1 267-4×10×38526-4×102≈-2.01,a =-b ≈38-(-2.01)×10=58.1,y x 所以线性回归方程为y =-2.01x +58.1.(2)气象部门预测下个月的平均气温约为6 ℃,据此估计,该商场下个月毛衣的销售量为y=-2.01x +58.1=-2.01×6+58.1≈46(件).1.回归分析是定义在具有相关关系的两个变量基础上的,因此,在做回归分析时,要先判断这两个变量是否相关,利用散点图可直观地判断两个变量是否相关.2.利用回归直线,我们可以进行预测.若回归直线方程y =a +bx ,则x =x 0处的估计值为y 0=a +bx 0.3.线性回归方程中的截距a 和斜率b 都是通过样本估计而得到的,存在着误差,这种误差可能导致预报结果的偏差,所以由线性回归方程给出的是一个预报值而非精确值.4.回归直线必过样本点的中心点.[再练一题]2.某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得到下表数据:x681012y 2356(1)请画出上表数据的散点图(要求:点要描粗);(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y =bx +a ;(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力. 【导学号:67720001】【解】 (1)如图:(2)x i y i =6×2+8×3+10×5+12×6=158,∑ni =1==9,x 6+8+10+124==4,y 2+3+5+64x =62+82+102+122=344,∑ni =12i b ===0.7,158-4×9×4344-4×921420a =-b =4-0.7×9=-2.3,y x 故线性回归方程为y =0.7x -2.3.(3)由(2)中线性回归方程知当x =9时,y =0.7×9-2.3=4,预测记忆力为9的同学的判断力约为4.[探究共研型],可线性化的回归分析探究1 如何解答非线性回归问题?【提示】 非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图像作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决.其一般步骤为:探究2 已知x和y之间的一组数据,则下列四个函数中,模拟效果最好的为哪一个?x123y3 5.9912.01①y=3×2x-1; ②y=log2x;③y=4x; ④y=x2.【提示】 观察散点图中样本点的分布规律可判断样本点分布在曲线y=3×2x-1附近.所以模拟效果最好的为①. 某地区不同身高的未成年男性的体重平均值如下表:身高x(cm)60708090100110体重y(kg) 6.137.909.9912.1515.0217.50身高x(cm)120130140150160170体重y(kg)20.9226.8631.1138.8547.2555.05(1)试建立y与x之间的回归方程;(2)如果一名在校男生身高为168 cm,预测他的体重约为多少?【精彩点拨】 先由散点图确定相应的拟合模型,再通过对数变换将非线性相关转化为线性相关的两个变量来求解.【自主解答】 (1)根据表中的数据画出散点图,如下:由图看出,这些点分布在某条指数型函数曲线y=c1e c2x的周围,于是令z=ln y,列表如下:x60708090100110z 1.81 2.07 2.30 2.50 2.71 2.86x120130140150160170z 3.04 3.29 3.44 3.66 3.86 4.01作出散点图,如下:由表中数据可求得z与x之间的回归直线方程为z=0.693+0.020x,则有y=e0.693+0.020x.(2)由(1)知,当x =168时,y =e 0.693+0.020×168≈57.57,所以在校男生身高为168 cm ,预测他的体重约为57.57 kg.两个变量不具有线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型,如y =c 1e c 2x ,我们可以通过对数变换把指数关系变为线性关系,令z =ln y ,则变换后样本点应该分布在直线z =bx +a (a =ln c 1,b =c 2)的周围.[再练一题]3.在一次抽样调查中测得样本的5个样本点,数据如下表:x 0.250.5124y1612521试建立y 与x 之间的回归方程.【解】 作出变量y 与x 之间的散点图如图所示.由图可知变量y 与x 近似地呈反比例函数关系.设y =,令t =,则y =kt .由y 与x 的数据表可得y 与t 的数据表:kx 1x t 4210.50.25y1612521作出y 与t 的散点图如图所示.由图可知y 与t 呈近似的线性相关关系.又=1.55,=7.2,i y i =94.25,=21.312 5,t y 5∑i =1t 5∑i =1t2i b =5∑i =1tiyi -5ty5∑i =1t 2i -5t 2=≈4.134 4,94.25-5×1.55×7.221.312 5-5×1.552a =-b =7.2-4.134 4×1.55≈0.8,y t ∴y =4.134 4t +0.8.所以y 与x 的回归方程是y =+0.8.4.134 4x[构建·体系]1.下列结论正确的是( )①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.A.①② B.①②③C.①②④D.①②③④【解析】 函数关系和相关关系的区别是前者是确定性关系,后者是非确定性关系,故①②正确;回归分析是对具有相关关系的两个变量进行统计分析的一种方法,故③错误,④正确.【答案】 C2.下表是x和y之间的一组数据,则y关于x的线性回归方程必过点( )x1234y1357A.(2,3) B.(1.5,4)C.(2.5,4) D.(2.5,5)x y【解析】 线性回归方程必过样本点的中心(,),即(2.5,4),故选C.【答案】 C3.对具有线性相关关系的变量x和y,由测得的一组数据求得回归直线的斜率为6.5,且恒过(2,3)点,则这条回归直线的方程为________.x y【解析】 由题意知=2,=3,b=6.5,所以y xa=-b=3-6.5×2=-10,即回归直线的方程为y=-10+6.5x.【答案】 y=-10+6.5x4.部门所属的10个工业企业生产性固定资产价值与工业增加值资料如下表(单位:百万元):固定资33566789910产价值工业增15172528303637424045加值根据上表资料计算的相关系数为________.【解析】 ==6.6.x 3+3+5+6+6+7+8+9+9+1010==31.5.y 15+17+25+28+30+36+37+42+40+4510所以r =≈0.991 8.【答案】 0.991 85.(2015·重庆高考)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份20102011201220132014时间代号t 12345储蓄存款y (千亿元)567810(1)求y 关于t 的回归方程y =bt +a ;(2)用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款.附:回归方程y =bt +a 中,b =,a =-b .n∑i =1tiyi -n t yn∑i =1t 2i -n t 2y t 【解】 (1)列表计算如下:i t i y i t 2i t i y i 12345123455678101491625512213250∑153655120这里n =5,=i ==3,=i ==7.2.t 1n n ∑i =1t155y 1n n∑i =1y365又l tt =-n 2=55-5×32=10,n∑i =1t2i t l ty =i y i -n =120-5×3×7.2=12,n∑i =1tt - y - 从而b ===1.2,ltyltt 1210a =-b =7.2-1.2×3=3.6,y t 故所求回归方程为y =1.2t +3.6.(2)将t =6代入回归方程可预测该地区2015年的人民币储蓄存款为=1.2×6+3.6=10.8(千亿元).y^我还有这些不足:(1)______________________________________________________(2) ______________________________________________________我的课下提升方案:(1) ______________________________________________________(2) ____________________________________________学业分层测评(一) (建议用时:45分钟)[学业达标]一、选择题1.为了考查两个变量x 和y 之间的线性相关性,甲、乙两名同学各自独立地做了10次试验和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2.已知两个人在试验中发现对变量x的观测数据的平均数都为s,对变量y 的观测数据的平均数都为t,那么下列说法中正确的是( )A.直线l1和l2都过点(s,t)B.直线l1和l2相交,但交点不一定是(s,t)C.直线l1和l2必平行D.直线l1和l2必重合x y【解析】 线性回归方程y=bx+a恒过点(,),故直线l1和l2都过点(s,t).【答案】 A2.已知人的年龄x与人体脂肪含量的百分数y的回归方程为y=0.577x-0.448,如果某人36岁,那么这个人的脂肪含量( ) A.一定是20.3%B.在20.3%附近的可能性比较大C.无任何参考数据D.以上解释都无道理【解析】 将x=36代入回归方程得y=0.577×36-0.448≈20.3.由回归分析的意义知,这个人的脂肪含量在20.3%附近的可能性较大,故选B.【答案】 B3.关于回归分析,下列说法错误的是( )A.回归分析是研究两个具有相关关系的变量的方法B.线性相关系数可以是正的或负的C.回归模型中一定存在随机误差D.散点图反映变量间的确定关系【解析】 用散点图反映两个变量间的关系时,存在误差,故D错误.【答案】 D4.某学校开展研究性学习活动,某同学获得一组试验数据如下表:x 1.9934 5.1 6.12y 1.5 4.047.51218.01对于表中数据,现给出下列拟合曲线,其中拟合程度最好的是( )A .y =2x -2 B .y =x(12)C .y =log 2xD .y =(x 2-1)12【解析】 代入检验,当x 取相应的值时,所得y 值与已知数据差的平方和最小的便是拟合程度最高的.【答案】 D5.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都有直线y =x +112上,则这组样本数据的样本相关系数为( )A .-1B .0C .D .112【解析】 所有点均在直线上,则样本相关系数最大即为1,故选D .【答案】 D 二、填空题6.回归分析是处理变量之间________关系的一种数量统计方法.【解析】 回归分析是处理变量之间相关关系的一种数量统计方法.【答案】 相关7.已知某个样本点中的变量x ,y 线性相关,相关系数r <0,则在以(,)x y 为坐标原点的坐标系下的散点图中,大多数的点都落在第________象限.【解析】 ∵r <0时b <0,∴大多数点落在第二、四象限.【答案】 二、四8.某中学期中考试后,对成绩进行分析,从某班中选出5名学生的总成绩和外语成绩如下表: 学生学科 12345总成绩(x )482383421364362外语成绩(y )7865716461则外语成绩对总成绩的回归直线方程是________.【解析】 ∵==402.4,x 482+383+421+364+3625==79.8,y 78+65+71+64+615∴b =(482-402.4)(78-79.8)+…+(362-402.4)(61-79.8)(482-402.4)2+…+(362-402.4)2≈0.132,∴a =79.8-0.132×402.4=14.5,∴方程为y =0.132x +14.5.【答案】 y =0.132x +14.5三、解答题9.(2016·包头高二检测)关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:x 23456y2.23.85.56.57.0若由资料可知y 对x 呈线性相关关系.试求:(1)线性回归方程;(a =y -b x-,b =n∑i =1xiyi -n x- y -n∑i =1x 2i -nx 2)(2)估计使用年限为10年时,维修费用是多少?【解】 (1)==4,x 2+3+4+5+65==5,y 2.2+3.8+5.5+6.5+7.05=90,i y i =112.3,5∑i =1x2i 5∑i =1xb ===1.23.5∑i =1xiyi -5x- y -5∑i =1x 2i -5x 2112.3-5×4×590-5×42于是a =-b =5-1.23×4=0.08.y x 所以线性回归方程为y =1.23x +0.08.(2)当x =10时,y =1.23×10+0.08=12.38(万元),即估计使用10年时维修费用是12.38万元.10.某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对比表.气温/℃261813104-1杯数202434385064画出散点图并判断热茶销售量与气温之间是否具有线性相关关系.【解】 画出散点图如图所示.=(26+18+13+10+4-1)≈11.7,x 16=(20+24+34+38+50+64)≈38.3,y 16x i y i =26×20+18×24+13×34+10×38+4×50-1×64=1 910,x =262+182+132+102+42+(-1)2=1 286,2i y =202+242+342+382+502+642=10 172,2i 由r =,可得r ≈0.97.由于r 的值接近于1,所以x 与y 具有很强的线性相关关系.[能力提升]1.(2016·安徽皖南八校联考)某同学在研究性学习中,收集到某制药厂今年前5个月甲胶囊生产产量(单位:万盒)的数据如下表所示:x (月份)12345y (万盒)55668若x ,y 线性相关,线性回归方程为y =0.7x +a ,则估计该制药厂6月份生产甲胶囊产量为( )A .8.1万盒B .8.2万盒C .8.9万盒D .8.6万盒【解析】 由题意知=3,=6,则a =-0.7=3.9,x y y x ∴x =6时,y =8.1.【答案】 A2.已知x 与y 之间的几组数据如下表:x 123456y21334假设根据上表数据所得线性回归直线方程为y =bx +a .若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( ) 【导学号:67720002】A .b >b ′,a >a ′B .b >b ′,a <a ′C .b <b ′,a >a ′D .b <b ′,a <a ′【解析】 由(1,0),(2,2)求b ′,a ′.b ′==2,2-02-1a ′=0-2×1=-2.求b ,a 时,i y i =0+4+3+12+15+24=58,6∑i =1x=3.5,=,x y 136=1+4+9+16+25+36=91,6∑i =1x2i ∴b ==,58-6×3.5×13691-6×3.5257a =-×3.5=-=-,136571365213∴b <b ′,a >a ′.【答案】 C3.(2016·江西吉安高二检测)已知x ,y 的取值如下表所示,由散点图分析可知y 与x 线性相关,且线性回归方程为y =0.95x +2.6,那么表格中的数据m 的值为________.x 0134y2.24.34.8m【解析】 ==2,==,把(,x 0+1+3+44y 2.2+4.3+4.8+m411.3+m 4x -)代入回归方程得=0.95×2+2.6,解得m =6.7.y- 11.3+m 4【答案】 6.74.某商店各个时期的商品流通率y (%)和商品零售额x (万元)资料如下:x 9.511.513.515.517.5y 6 4.64 3.2 2.8x 19.521.523.525.527.5y2.52.42.32.22.1散点图显示出x 与y 的变动关系为一条递减的曲线.经济理论和实际经验都证明,流通率y 决定于商品的零售额x ,体现着经营规模效益,假定它们之间存在关系式:y =a +.试根据上表数据,求出a 与b 的估计值,并估计商品bx 零售额为30万元时的商品流通率.【解】 设u =,则y ≈a +bu ,得下表数据:1x u 0.105 30.087 00.074 10.064 50.057 1y 6 4.64 3.2 2.8u 0.051 30.046 50.042 60.039 20.036 4y2.52.42.32.22.1进而可得n =10,≈0.060 4,=3.21,u y u -102≈0.004 557 3,∑10 i =12i u i y i -10 ≈0.256 35,10∑i =1uu y b ≈≈56.25,0.256 350.004 557 3a =-b ·≈-0.187 5,y u 所求的回归方程为y =-0.187 5+.56.25x当x=30时,y=1.687 5,即商品零售额为30万元时,商品流通率约为1.687 5%.。
回归分析——借助图形计算器探究两个变量之间的关系【案例背景】本次实验是探究式实验,适用于北师大版高中数学教材?选修 1—2? 第一章第一节,学生在?必修3?已经学习完了统计内容〔相关性与最小二乘估计〕,学生会画散点图,并利用散点图直观认识变量间的相关关系,并且会用最小二乘法建立变量之间的线性回归方程。
本节课是在此根底上,对统计知识进一步稳固深化,学生除了会用之前学的知识画散点图判断相关性求回归方程,而且还会接触信息手段—图形计算器作出散点图求出线性回归方程,对变量进行预测。
【实验目标】〔1〕通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系;〔2〕在两个变量具有线性相关关系时,会在散点较长中作出线性直线,会用线性回归方程进行预测;〔3〕知道最小二乘法的含义,知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程;〔4〕能利用图形计算器作出散点图,并根据给出的数据求出线性回归方程。
【实验工具】 Caio f-CG2021计算器,DELL电脑。
【实验形式】小组合作探究。
【实验准备】技术准备:需掌握 Caio f-CG2021计算器“计算模块〞,“统计模块〞的功能。
知识准备:会画散点图并利用散点图直观认识变量间的相关关系,会用最小二乘法建立变量之间的线性回归方程。
【实验过程】探究1:观看视频?真正男子汉2?中的一个片段,引发思考:身高与体重之间有什么关系。
猜测1:身高与体重之间成正相关。
任务1:为了验证猜测,统计全班同学的身高与体重。
任务2:根据全班同学的身高与体重,作出散点图,判断两者的关系。
任务3:根据数据,利用公式求出线性回归方程。
〔由于全班数据较多,学生作出来的散点图要花费一定时间,而且不一定标准。
在求回归方程时,计算的值时,运算量非常大。
〕探究2:如何快速作出更加标准的散点图呢?可不可以减少一点的运算量呢?猜测2:有没有什么软件或者移动终端可以办到呢?图形计算器可以办到。
精美句子1、善思则能“从无字句处读书”。
读沙漠,读出了它坦荡豪放的胸怀;读太阳,读出了它普照万物的无私;读春雨,读出了它润物无声的柔情。
读大海,读出了它气势磅礴的豪情。
读石灰,读出了它粉身碎骨不变色的清白。
2、幸福幸福是“临行密密缝,意恐迟迟归”的牵挂;幸福是“春种一粒粟,秋收千颗子”的收获. 幸福是“采菊东篱下,悠然见南山”的闲适;幸福是“奇闻共欣赏,疑义相与析”的愉悦。
幸福是“随风潜入夜,润物细无声”的奉献;幸福是“夜来风雨声,花落知多少”的恬淡。
幸福是“零落成泥碾作尘,只有香如故”的圣洁。
幸福是“壮志饥餐胡虏肉,笑谈渴饮匈奴血”的豪壮。
幸福是“先天下之忧而忧,后天下之乐而乐”的胸怀。
幸福是“人生自古谁无死,留取丹心照汗青”的气节。
3、大自然的语言丰富多彩:从秋叶的飘零中,我们读出了季节的变换;从归雁的行列中,我读出了集体的力量;从冰雪的消融中,我们读出了春天的脚步;从穿石的滴水中,我们读出了坚持的可贵;从蜂蜜的浓香中,我们读出了勤劳的甜美。
4、成功与失败种子,如果害怕埋没,那它永远不能发芽。
鲜花,如果害怕凋谢,那它永远不能开放。
矿石,如果害怕焚烧(熔炉),那它永远不能成钢(炼成金子)。
蜡烛,如果害怕熄灭(燃烧),那它永远不能发光。
航船,如果害怕风浪,那它永远不能到达彼岸。
5、墙角的花,当你孤芳自赏时,天地便小了。
井底的蛙,当你自我欢唱时,视野便窄了。
笼中的鸟,当你安于供养时,自由便没了。
山中的石!当你背靠群峰时,意志就坚了。
水中的萍!当你随波逐流后,根基就没了。
空中的鸟!当你展翅蓝天中,宇宙就大了。
空中的雁!当你离开队伍时,危险就大了。
地下的煤!你燃烧自己后,贡献就大了6、朋友是什么?朋友是快乐日子里的一把吉它,尽情地为你弹奏生活的愉悦;朋友是忧伤日子里的一股春风,轻轻地为你拂去心中的愁云。
朋友是成功道路上的一位良师,热情的将你引向阳光的地带;朋友是失败苦闷中的一盏明灯,默默地为你驱赶心灵的阴霾。
回归分析的基本思想及其初步应用
【教学目标】
1、知识与技能目标
认识随机误差;
2、过程与方法目标
(1)会使用函数计算器求回归方程;
(2)能正确理解回归方程的预报结果.
3、情感、态度、价值观
通过本节课的学习,加强数学与现实生活的联系,以科学的态度评价两个变量的相关性,理解处理问题的方法,形成严谨的治学态度和锲而不舍的求学精神.培养学生运用所学知识,解决实际问题的能力.教学中适当地利用学生合作与交流,使学生在学习的同时,体会与他人合作的重要性.
【教学重点】随机误差e的认识
【教学难点】随机误差的来源和对预报变量的影响
【教学方法】启发式教学法
【教学手段】多媒体辅助教学
【教学过程设计】。
1.1.1回归分析教学目标(1)通过实例引入线性回归模型,感受产生随机误差的原因;(2)通过对回归模型的合理性等问题的研究,渗透线性回归分析的思想和方法; (3)能求出简单实际问题的线性回归方程. 教学重点,难点线性回归模型的建立和线性回归系数的最佳估计值的探求方法. 教学过程 一.问题情境1. 情境:对一作直线运动的质点的运动过程观测了8次,得到如下表所示的数据,试估计当x=9时的位置y 的值.根据《数学3(必修)》中的有关内容,解决这个问题的方法是: 先作散点图,如下图所示:从散点图中可以看出,样本点呈直线趋势,时间x 与位置观测值y 之间有着较好的线性关系.因此可以用线性回归方程来刻画它们之间的关系.根据线性回归的系数公式,1221()n i i i nii x y nx y b x n x a y bx==⎧-⎪⎪=⎪⎨-⎪⎪=-⎪⎩∑∑可以得到线性回归方为 3.5361 2.1214y x =+,所以当9x =时,由线性回归方程可以估计其位置值为 22.6287y =2.问题:在时刻9x =时,质点的运动位置一定是22.6287cm 吗? 二.学生活动思考,讨论:这些点并不都在同一条直线上,上述直线并不能精确地反映x 与y 之间的关系,y 的值不能由x 完全确定,它们之间是统计相关关系,y 的实际值与估计值之间存在着误差. 三.建构数学1.线性回归模型的定义:我们将用于估计y 值的线性函数a bx +作为确定性函数;y 的实际值与估计值之间的误差记为ε,称之为随机误差;将y a bx ε=++称为线性回归模型. 说明:(1)产生随机误差的主要原因有:①所用的确定性函数不恰当引起的误差; ②忽略了某些因素的影响; ③存在观测误差.(2)对于线性回归模型,我们应该考虑下面两个问题: ①模型是否合理;②在模型合理的情况下,如何估计a ,b ? 2.探求线性回归系数的最佳估计值:对于问题②,设有n 对观测数据(,)i i x y (1,2,3,,)i n = ,根据线性回归模型,对于每一个i x ,对应的随机误差项()i i i y a bx ε=-+,我们希望总误差越小越好,即要使21nii ε=∑越小越好.所以,只要求出使21(,)()niii Q y x αββα==--∑取得最小值时的α,β值作为a ,b 的估计值,记为 a,b . 注:这里的i ε就是拟合直线上的点(),i i x a bx +到点(),i i i P x y 的距离.用什么方法求 a,b ?回忆利用最小二乘法可以得到 a,b 的计算公式为 1122211()()()()n ni i i i i i n n i i i i x x y y x y nx y b x x x n x a y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑ , 其中11n i i x x n ==∑,11ni i y y n ==∑由此得到的直线 y a bx =+ 就称为这n 对数据的回归直线,此直线方程即为线性回归方程.其中 a ,b 分别为a ,b 的估计值, a 称为回归截距,b 称为回归系数, y 称为回归值.在前面质点运动的线性回归方程 3.5361 2.1214y x =+中,3.5361a =, 2.1214b = . 3. 线性回归方程 y abx =+ 中 a ,b 的意义是:以 a 为基数,x 每增加1个单位,y 相应地平均增加b个单位; 4. 化归思想(转化思想)在实际问题中,有时两个变量之间的关系并不是线性关系,这就需要我们根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数.下面列举出一些常见的曲线方程,并给出相应的化为线性回归方程的换元公式. (1)b y a x =+,令'y y =,1'x x=,则有''y a bx =+. (2)by ax =,令'ln y y =,'ln x x =,'ln a a =,则有'''y a bx =+.(3)bxy ae =,令'ln y y =,'x x =,'ln a a =,则有'''y a bx =+.(4)b xy ae =,令'ln y y =,1'x x=,'ln a a =,则有'''y a bx =+. (5)ln y a b x =+,令'y y =,'ln x x =,则有''y a bx =+. 四.数学运用 典例分析例1.下表给出了我国从1949年至1999年人口数据资料,试根据表中数据估计我国2004年的人口数.【解析】为了简化数据,先将年份减去1949,并将所得值用x 表示,对应人口数用y 表示,得到下面的数据表:作出11个点(),x y 构成的散点图,由图可知,这些点在一条直线附近,可以用线性回归模型y a bx ε=++来表示它们之间的关系. 根据公式(1)可得14.453,527.591.b a ⎧≈⎪⎨≈⎪⎩ 这里的 ,ab 分别为,a b 的估 计值,因此线性回归方程 为 527.59114.453y x =+由于2004年对应的55x =,代入线性回归方程 527.59114.453y x =+可得 1322.506y =(百万),即2004年的人口总数估计为13.23亿. 例2. 某地区对本地的企业进行了一次抽样调查,下表是这次抽查中所得到的各企业的人均资本x (万元)与人均产出y (万元)的数据:(1)设y 与x 之间具有近似关系by ax ≈(,a b 为常数),试根据表中数据估计a 和b 的值;(2)估计企业人均资本为16万元时的人均产出(精确到0.01).分析:根据x ,y 所具有的关系可知,此问题不是线性回归问题,不能直接用线性回归方程处理.但由对数运算的性质可知,只要对by ax ≈的两边取对数,就能将其转化为线性关系. 解(1)在by a x≈的两边取常用对数,可得lg lg lg y a b x ≈+,设lg y z =,lg a A =,lg x X =,则z A bX ≈+.相关数据计算如图327--所示.仿照问题情境可得A ,b 的估计值 A ,b分别为 0.2155,1.5677,A b ⎧=-⎪⎨=⎪⎩ 由 lg 0.2155a =-可得 0.6088a≈,即a ,b 的估计值分别为0.6088和1.5677. (2)由(1)知 1.5670.6088y x =.样本数据及回归曲线的图形如图328--(见书本102P页)当16x =时, 1.56770.60881647.01y =⨯≈(万元),故当企业人均资本为16万元时,人均产值约为47.01万元. 五.回顾小结:1. 线性回归模型y a bx ε=++与确定性函数y a bx =+相比,它表示y 与x 之间是统计相关关系(非确定性关系)其中的随机误差ε提供了选择模型的准则以及在模型合理的情况下探求最佳估计值 a,b 的工具; 2. 线性回归方程 y abx =+ 中 a ,b 的意义是:以 a 为基数,x 每增加1个单位,y 相应地平均增加b个单位; 3.求线性回归方程的基本步骤.教学设计二【教学目标】 1、知识与技能目标认识随机误差; 2、过程与方法目标(1)会使用函数计算器求回归方程; (2)能正确理解回归方程的预报结果.3、情感、态度、价值观通过本节课的学习,加强数学与现实生活的联系,以科学的态度评价两个变量的相关性,理解处理问题的方法,形成严谨的治学态度和锲而不舍的求学精神.培养学生运用所学知识,解决实际问题的能力.教学中适当地利用学生合作与交流,使学生在学习的同时,体会与他人合作的重要性.【教学重点】随机误差e的认识【教学难点】随机误差的来源和对预报变量的影响 【教学方法】 启发式教学法 【教学手段】多媒体辅助教学【教学过程设计】教学设计三【学情分析】:教学对象是高二理科学生,学生已经初步学会用最小二乘法建立线性回归模型的知识,并能用所学知识解决一些简单的实际问题。
回归分析是数理统计中的重要内容,在教学中,要结合实例进行相关性检验,理解只有两个变量相关性显著时,回归方程才具有实际意义。
在起点低的班级中注重让学生参与实践,结合画图表的方法整理数据,鼓励学生通过收集数据,经历数据处理的过程,从而认识统计方法的特点,达到学习的目的。
【教学目标】:(1)知识与技能:回忆线性回归模型与函数模型的差异,理解用最小二乘法求回归模型的步骤,了解判断两变量间的线性相关关系的强度——相关系数。
(2)过程与方法:本节内容先从大学中女大学生的甚高和体重之间的关系入手,求出相应的回归直线方程。
(3)情感态度与价值观:从实际问题中发现自己已有知识的不足之处,激发学生的好奇心和求知欲,培养学生不满足于已有知识,勇于求知的良好个性品质,引导学生积极进取。
【教学重点】:1.了解线性回归模型与函数模型的差异;2.了解两变量间的线性相关关系的强度——相关系数。
【教学难点】:1.了解两变量间的线性相关关系的强度——相关系数;2.了解线性回归模型与一次函数模型的差异。
【教学过程设计】:②列表求出相关的量,并求出线性回归方程代入公式有848.025.16582187745.5425.165872315ˆ22121≈⨯-⨯⨯-=--=∑∑==x n xyx n yx bni ini ii712.8525.165849.05.54ˆ-=⨯-=-=x b y a所以回归方程为712.85849.0ˆˆˆ-=+=x x b a y③利用回归方程预报身高172cm 的女大学生的体重约为多少?当172=x 时,()kg y316.60712.85172849.0ˆ=-⨯= 引导学生复习总结求线性回归方程的步骤:第一步:作散点图—→第二步:求回归方程—→第三步:代值计算1. 设有一个回归方程为x y5.22ˆ-=,则变量x 增加一个单位时,则( C ) A .y 平均增加5.2个单位 B .y 平均增加2个单位 C .y 平均减少5.2个单位 D .y 平均减少2个单位 2. 在画两个变量的散点图时,下面哪个叙述是正确的( B )A .预报变量在x 轴上,解释变量在y 轴上B .解释变量在x 轴上,预报变量在y 轴上C .可以选择两个变量中任意一个变量在x 轴上D .可以选择两个变量中任意一个变量在y 轴上 3. 已知x 与y 之间的一组数据:与x 的线性回归方程为a x b yˆˆˆ+=必过( D ) 则yA .(2,2)点B .(1.5,0)点C .(1,2)点D .(1.5,4)点4. 已知两个相关变量x 与y 具有线性相关关系,当x 取值1,2,3,4时,通过观测得到y的值分别为1.2,4.9,8.1,12.8,这组样本点的中心是( D ) A .(2,4.9) B .(3,8.1) C .(2.5,7) D .(2.5,6.75)5. 一位母亲记录了儿子3—9岁的身高,数据(略),由此建立的身高与年龄的回归模型为y=7.19x+73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是( C ) A .身高一定是145.83cm B .身高在145.83cm 以上 C .身高在145.83cm 左右D .身高在145.83cm 以下6. 在一次实验中,测得(x ,y )的四组值分别是A (1,2)、B (2,3)、C (3,4)D (4,5),则y 与x 之间的回归直线方程为( A )A .1ˆ+=x yB .2ˆ+=x yC .12ˆ+=x yD . 1ˆ-=x y 7. 有下列关系:⑴人的年龄与其拥有的财富之间的关系;⑵曲线上的点与该点的坐标之间的关系;⑶苹果的产量与气候之间的关系;⑷森林中的同一树木,其横截面直径与高度之间的关系;⑸学生与其学号之间的关系。