6.示范教案(2.3.2--两个变量的线性相关)
- 格式:doc
- 大小:353.00 KB
- 文档页数:9
人教版高中必修3(B版)2.3.2 两个变量的线性相关教学设计1. 教学目标1.了解什么是两个变量的线性相关。
2.掌握用散点图和回归分析判断两个变量间是否存在线性相关。
3.能够利用Excel进行数据的处理和线性回归模型的建立。
4.能够分析不同变量间的线性相关性并进行实际应用。
2. 教学重点1.掌握用散点图和回归分析判断两个变量间是否存在线性相关。
2.理解和掌握线性回归模型的建立方法。
3.实际应用场景中的变量分析。
3. 教学工具1.教师用PPT进行幻灯片的展示。
2.学生使用Excel进行数据处理。
3.学生使用PPT或者报告进行结果汇报。
4. 教学步骤4.1 引入1.利用课件引入什么是线性相关性,同时列出场景案例。
2.让学生思考实际用途,如何帮助决策。
4.2 教学内容1.通过教学案例和数据,帮助学生发现两个变量之间存在的线性关系,将数据进行散点图的展示。
2.利用线性回归方法求出变量间的关系,并进行解释分析,同时重点帮助学生理解回归线和残差。
3.在Excel中模拟数据,并进行线性回归模型的建立,帮助学生掌握模型参数的估计与推断,同时展示数据处理过程。
4.通过网络或者其他途径获得实际数据,并进行数据处理和线性回归分析,展示关键参数和线性回归模型的评估。
4.3 练习和应用1.让学生利用Excel进行数据录入和线性回归模型的建立,同时进行结果展示。
2.让学生分组,进行数据收集处理和建模,完成案例分析和报告撰写,同时进行展示和交流。
4.4 总结1.整理本次课程的重点知识点,巩固学生的掌握程度。
2.引导学生思考如何将所学知识应用到更广泛的场景中。
5. 教学资源1.教材:人教版高中必修3(B版)2.网络课件和视频资源:参考相关资源如慕课网、Coursera等。
6. 教学评估1.观察学生课前预习和课堂参与状况。
2.课堂能力训练:教师提供练习题目并进行课堂答题,加深学生对所学知识点的理解,同时检验学会程度。
3.课堂小组作业和课外大作业的评估:教师通过查看学生PPT报告和答辩情况进行交流和评估。
2.3.2-两个变量的线性相关一、教学目标1、知识与技能目标:利用散点图判断线性相关关系,了解最小二乘法的思想及2回归方程系数公式的推导过程,利用电子表格求出回归直线的方程并对实际问题进行分析和预测,通过实例加强对回归直线方程含义的理解2 、过程与方法目标:①通过自主探究体会数形结合、类比、及最小二乘法的数学思想方法。
②通过动手操作培养学生观察、分析、比较和归纳能力,引出利用计算机等现代化教学工具的必要性。
3、情感、态度与价值观目标:类比函数的表示方法,使学生理解变量间的相关关系,增强应用回归直线方程对实际问题进行分析和预测的意识。
利用计算机让学生动手操作,合作交流激发学生的学习兴趣。
二、教学重点、难点重点:利用散点图直观认识两个变量之间的线性相关关系,了解最小二乘法的思想并利用此思想借助电子表格求出回归方程。
教学内容的难点:对最小二乘法的数学思想和回归方程的理解教学实施过程中的难点:根据给出的线性回归方程的系数公式建立线性回归方程。
三、教学媒体设计本节课涉及大量数据计算及分析,用传统方法很难突破,故我主要采用电子表格和几何画板,通过学生动手操作、教师动画演示、师生合作交流来突出重点、突破难点。
学生学习效果有明显提高。
四、教学设计(一)、创设情境导入新课1、相关关系的理解师:我们曾经研究过两个变量之间的函数关系:一个自变量对应着唯一的一个函数值,这两者之间是一种确定关系。
生活中的任何两个变量之间是不是只有确定关系呢?让学生举例,教师总结如:生:不是。
师:能否举出反例?比如,年龄与身高。
生:身高与体重生:教师水平与学生成绩。
生:网速与下载文件所需时间师:不妨以教师水平与学生成绩为例,学生成绩与教师水平有关吗?生:有,一般来说,教师水平越高,学生成绩越好师:即“名师出高徒”,名师一定出高徒吗?生:不一定。
师:即学生成绩与教师水平之间存在着某种联系,但又不是必然联系,对于学生成绩与教师水平之间的这种不确定关系,我们称之为相关关系。
2.3.2 两个变量的线性相关(第一课时)(新授课)一、教学目标:明确事物间的相互联系。
认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系,并利用散点图直观体会这种相关关系。
二、教学重点与难点重点:利用散点图直观认识两个变量之间的线性关系.难点:作散点图和理解两个变量的正相关和负相关。
三、教学过程:(一)引入1. 人的身高和体重之间的关系?2. 学生设计一个统计问题,并指出问题涉及的总体是什么,所涉及的变量是什么.(二)讲授新课:1、散点图(1)例题:在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:年龄23 27 38 41 45 49 50脂肪9.5 17.8 21.2 25.9 27.5 26.3 28.2年龄53 54 56 57 58 60 61脂肪29.6 30.2 31.4 30.8 33.5 35.2 34.6分析数据:大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加。
我们可以作散点图来进一步分析。
(2)散点图的概念:将各数据在平面直角坐标中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图。
(1.如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.2.如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系。
3. 如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系)(3)正相关与负相关概念:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关。
如果散点图中的点散布在从左上角到右下角的区域内,称为负相关。
(注:散点图的点如果几乎没有什么规则,则这两个变量之间不具有相关关系)(4)讨论:你能举出一些生活中的变量成正相关或负相关的例子吗?(比如高学历高收入现象)(三)课堂练习:一个工厂为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次调查,收集数据如下:零件数10 20 30 40 50 60 70 80 90 100加工时间62 68 75 81 89 95 102 108 115 1221. 画出散点图。
两个变量的线性相关教案第一章:引言1.1 学习目标了解两个变量线性相关的概念掌握散点图在表示两个变量关系中的应用1.2 教学内容介绍两个变量线性相关的概念解释散点图在表示两个变量关系中的应用1.3 教学活动引入两个变量线性相关的概念,让学生初步了解通过实际例子,展示散点图在表示两个变量关系中的应用1.4 作业完成练习题,让学生巩固两个变量线性相关的概念第二章:线性相关性的判断2.1 学习目标学会判断两个变量之间的线性相关性掌握线性相关的判定方法2.2 教学内容介绍判断两个变量之间线性相关性的方法解释线性相关的判定方法2.3 教学活动通过实际例子,展示如何判断两个变量之间的线性相关性解释线性相关的判定方法,让学生能够运用到实际问题中2.4 作业完成练习题,让学生巩固判断两个变量之间线性相关性的方法第三章:线性回归方程的求解3.1 学习目标学会求解线性回归方程掌握线性回归方程的求解方法3.2 教学内容介绍线性回归方程的概念解释线性回归方程的求解方法3.3 教学活动通过实际例子,展示如何求解线性回归方程解释线性回归方程的求解方法,让学生能够运用到实际问题中3.4 作业完成练习题,让学生巩固线性回归方程的求解方法第四章:线性回归方程的应用4.1 学习目标学会应用线性回归方程解决实际问题掌握线性回归方程在实际问题中的应用方法4.2 教学内容介绍线性回归方程在实际问题中的应用解释线性回归方程的应用方法4.3 教学活动通过实际例子,展示如何应用线性回归方程解决实际问题解释线性回归方程的应用方法,让学生能够运用到实际问题中4.4 作业完成练习题,让学生巩固线性回归方程在实际问题中的应用方法5.1 学习目标掌握线性回归方程的求解与应用方法5.2 教学内容提出拓展问题,引导学生深入思考5.3 教学活动提出拓展问题,引导学生深入思考线性相关知识的应用5.4 作业完成练习题,让学生巩固本章所学内容回答拓展问题,展示学生对线性相关知识的深入理解第六章:相关系数的概念与计算6.1 学习目标理解相关系数的概念学会计算线性相关系数6.2 教学内容介绍相关系数的概念及其取值范围解释如何计算线性相关系数(皮尔逊相关系数)6.3 教学活动通过实际例子,解释相关系数的概念使用计算器或软件演示如何计算线性相关系数6.4 作业完成练习题,让学生巩固相关系数的概念及计算方法第七章:非线性关系的处理7.1 学习目标理解非线性关系与线性关系的区别学会处理非线性关系7.2 教学内容解释非线性关系的概念介绍处理非线性关系的方法,如多项式回归、逻辑回归等7.3 教学活动通过实际例子,展示非线性关系的特征介绍处理非线性关系的方法和工具7.4 作业完成练习题,让学生理解非线性关系及其处理方法第八章:线性回归模型的评估8.1 学习目标学会评估线性回归模型的有效性掌握评估线性回归模型的常用方法8.2 教学内容介绍评估线性回归模型的指标,如均方误差(MSE)、决定系数(R²)等解释如何使用这些指标来评估模型的有效性8.3 教学活动通过实际例子,展示如何评估线性回归模型的有效性介绍常用的评估方法和工具8.4 作业完成练习题,让学生掌握评估线性回归模型的方法和指标第九章:多重线性回归分析9.1 学习目标理解多重线性回归的概念学会进行多重线性回归分析9.2 教学内容介绍多重线性回归的概念和应用场景解释如何进行多重线性回归分析9.3 教学活动通过实际例子,展示多重线性回归的应用使用统计软件演示如何进行多重线性回归分析9.4 作业完成练习题,让学生理解多重线性回归的概念和应用第十章:案例分析与实践10.1 学习目标能够将线性回归模型应用于实际问题学会分析实际问题中的线性关系10.2 教学内容分析实际问题,确定变量之间的关系应用线性回归模型解决实际问题10.3 教学活动分析一个实际问题,引导学生识别变量之间的线性关系指导学生应用线性回归模型解决问题10.4 作业完成案例分析报告,让学生将线性回归模型应用于实际问题讨论案例中的发现和解决方法,展示学生对线性回归模型的深入理解重点和难点解析一、线性相关性的判断学生可能难以理解如何准确判断两个变量之间的线性相关性。
2.3.两个变量的线性相关-人教A版必修三教案
一、知识点概述
本节主要介绍两个变量之间的线性相关性的概念和判断方法。
通过本节学习,学生应该能够掌握以下知识点:
1.什么是两个变量之间的线性相关性。
2.判断两个变量之间是否存在线性相关关系的方法。
3.相关系数的定义及其计算方法。
4.相关系数的含义及其应用。
二、教学重难点分析
本节主要教学重点为相关系数的定义及其计算方法,以及相关系数的含义及其应用。
教学难点在于如何理解两个变量之间的线性相关性及其判断方法。
三、教学过程设计
3.1 导入新知识
通过实验或者案例介绍两个变量之间的线性相关性的概念,引导学生思考两个变量之间的关系及其表现形式。
3.2 讲解相关系数的定义及其计算方法
介绍相关系数的定义及其计算方法,包括协方差和标准差的计算方法,以及相关系数的计算公式。
3.3 案例分析
通过案例讲解如何使用相关系数判断两个变量之间的相关性,引导学生掌握相关系数的应用方法。
3.4 思考扩展
通过问题的提出和分组讨论,引导学生思考两个变量之间的线性相关性和非线性相关性的区别,以及相关系数的局限性。
四、教学反思
通过本节课程的学习,学生应该已经掌握了相关系数的基本概念及其应用方法,并能够在实际问题中运用相关系数进行分析和判断。
教师应该及时检查学生的学习效果,针对学生掌握情况进行巩固和强化。
同时,教师还应多组织实际应用情境、案例和练习,加强学生对知识点的理解和掌握。
2.3.2两个变量的线性相关教学目标:经历用不同估算方法描述两个变量线性相关的过程。
知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。
教学重点:经历用不同估算方法描述两个变量线性相关的过程。
知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。
教学过程:1.回顾上节课的案例分析给出如下概念: (1)回归直线方程 (2)回归系数2.最小二乘法3.直线回归方程的应用(1)描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系(2)利用回归方程进行预测;把预报因子(即自变量x )代入回归方程对预报量(即因变量Y )进行估计,即可得到个体Y 值的容许区间。
(3)利用回归方程进行统计控制规定Y 值的变化,通过控制x 的范围来实现统计控制的目标。
如已经得到了空气中NO 2的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中NO 2的浓度。
4.应用直线回归的注意事项(1)做回归分析要有实际意义;(2)回归分析前,最好先作出散点图; (3)回归直线不要外延。
5.实例分析: 某调查者从调查中获知某公司近年来科研费用支出(i X )与公司所获得利润(i Y )的统计资料如下表:i X i Y 要求估计利润(i Y )对科研费用支出(i X )的线性回归模型。
解:设线性回归模型直线方程为:i i X Y 10ˆˆˆββ+=因为:5630===∑n XX i306180===∑nYY i现利用公式(Ⅰ)、(Ⅱ)、(Ⅲ)求解参数10的估计值:23006009001200540060003020061803010006)(ˆ2221==--=-⨯⨯-⨯=--=∑∑∑∑∑i i i i i i X X n Y X Y X n β 205230ˆˆ10=⨯-=-=X Y ββ∑∑--=-=22110)(ˆˆˆX n X YX n Y X X Y ii i βββ 205230ˆˆ10=⨯-=-=X Y ββ25010056200305610002==⨯-⨯⨯-=∑∑---=-=2110)())((ˆˆˆX X Y Y X X X Y ii iβββ 205230ˆˆ10=⨯-=-=X Y ββ250100==所以:利润(i Y )对科研费用支出(i X )的线性回归模型直线方程为:i i X Y 220ˆ+=6、求直线回归方程,相关系数和作图,这些EXCEL 可以方便地做到。
高中数学 2.3.2 两个变量的线性相关教案新人教B版必修3整体设计教学分析由于用具体的例子来解释线性回归容易理解,所以建议以实际例子引入,让学生用散点图直观认识两个变量的相关关系,让学生尝试找到最佳的近似直线.值得注意的是:求回归直线方程,通常是用计算器来完成的,在很多函数型科学计算器中,可通过直接按键得出线性回归方程的系数,教科书中给出了操作过程,而如果要用一般的科学计算器进行计算,则要先列出相应的表格.三维目标1.经历用不同估算方法描述两个变量线性相关的过程,会建立线性回归方程.2.能利用回归方程估计变量的值,提高学生解决问题的能力.3.通过对数据的分析,增强学生的社会实践能力.重点难点教学重点:会求线性回归方程,并进行线性回归分析,体会最小二乘法的思想.教学难点:用最小二乘法求线性回归方程.课时安排1课时教学过程导入新课思路1.根据一组观测到的数据确定变量x与y之间是线性相关关系,如果x取一个值,那么怎样估计变量y的值呢?教师点出课题.思路2.如果散点图中各点在一条直线附近,那么这两个变量具有线性相关关系,那么怎样求出这条直线方程呢?教师点出课题.推进新课新知探究提出问题①变量x与y的散点图如下图所示,如果近似成线性关系的话,请画出一条直线来近似地表示这种线性关系.②同学们也可以自己尝试制定标准来画出近似直线,关键在于这一标准是否合理,是否能够得到最佳的近似直线(最优拟合直线).③怎样确定a与b呢?④写出求回归直线方程的算法.讨论结果:①根据不同的标准,可以画出不同的直线来近似表示这种线性相关关系,比如可以连接最左侧点和最右侧点得到一条直线(图1),或者让画出的直线上方的点和下方的点数目相等(图2)。
图1 图2②由图可见,所有数据点都分布在一条直线附近.显然这样的直线还可以画出许多条,而我们希望找出其中的一条,它能最好地反映x 与Y 之间的关系.换言之,我们要找出一条直线,使这条直线“最贴近”已知的数据点.记此直线方程为y ^=a +bx①这里在y 的上方加记号“Y”,是为了区分Y 的实际值y ,表示当x 取值x i (i =1,2,…,6)时,Y 相应的观察值为y i ,而直线上对应于x i 的纵坐标是y ^i =a +bx i .①式叫做Y 对x 的回归直线方程,b 叫做回归系数,要确定回归直线方程①,只要确定a 与回归系数b.③下面我们来研究回归直线方程的求法,设x ,Y 的一组观察值为(x i ,y i ) i =1,2,…,n ,且回归直线方程为y ^=a +bx.当x 取值x i (i =1,2,…,n)时,Y 的观察值为y i ,差y i -y ^i (i =1,2,…,n)刻画了实际观察值y i 与回归直线上相应点纵坐标之间的偏离程度,如下图所示.我们希望这n 个离差构成的总离差越小越好,才能使所找的直线很贴近已知点.一个自然的想法是把各个离差加起来作为总离差.可是,由于离差有正有负,直接相加会相互抵消,这样就无法反映这些数据点的贴近程度,即这个总离差不能用n 个离差之和∑i =1n(y i -y ^i )来表示,通常是用离差的平方和,即Q =∑i =1n(y i -a -bx i )2作为总离差,并使之达到最小.这样,回归直线就是所有直线中Q 取最小值的那一条.由于平方又叫二乘方,所以这种使“离差平方和为最小”的方法,叫做最小二乘法.用最小二乘法求回归直线方程中的a ,b 有下面的公式:b ^=∑i =1nx i y i -n xy∑i =1nx 2i -n x 2,a ^=y -b ^x ,其中a ,b 的上方加“y”,表示是由观察值按最小二乘法求得的估计值,b ^也叫回归系数,a ^,b ^求出后,回归直线方程就建立起来了.④算法: S1S2 计算a ^,b ^的值.b ^=∑i =1nx i y i -n xy∑i =1nx 2i -n x 2,a ^=y -b ^x , S3 写出回归直线方程y ^=a ^x +b ^.应用示例思路1试用最小二乘法求出线性回归方程.解:从散点图中可以看出,表中的两个变量是线性相关的.先列表求出x =353,y =1153,其他数据如下表.进而,可以求得b ^=1 910-6×353×11531 286-6×353×353≈-1.648,a ^=y -b ^x ≈57.557.于是,线性回归方程为y ^=57.557-1.648x.点评:利用a ^=y -b ^x 求得a ^的值,则有y =b ^x +a ^,所以求得的线性回归方程y ^=b ^x +a ^必过点(x ,y ).例2在某种产品表面进行腐蚀刻线试验,得到腐蚀深度Y与腐蚀时间x之间相应的一组观察值如下表:(2)求Y对x的回归直线方程;(结果保留到小数点后3位数字)(3)试预测腐蚀时间为100 s时腐蚀深度是多少.分析:利用回归直线方程预测腐蚀时间为100 s时腐蚀深度.解:(1)散点图如下图.(2)根据公式②求腐蚀深度Y 对腐蚀时间x 的回归直线方程的步骤如下: Ⅰ.先把数据列成表.序号 x Y x 2xy 1 5 6 25 30 2 10 10 100 100 3 15 10 225 150 4 20 13 400 260 5 30 16 900 480 6 40 17 1 600 680 7 50 19 2 500 950 8 60 23 3 600 1 380 9 70 25 4 900 1 750 10 90 29 8 100 2 610 11 120 46 14 400 5 520 ∑51021436 75013 910Ⅱ.计算a ^,b ^的值.由上表分别计算x ,y 的平均数得x =51011,y =21411.代入公式②得(注意:不必把x ,y 化为小数,以减小误差)b ^=13 910-11×51011×2141136 750-11×510112≈0.304 3≈0.304a ^=21411-0.304 3×51011≈5.346.Ⅲ.写出回归直线方程.腐蚀深度Y 对腐蚀时间x 的回归直线方程为 y ^=0.304x +5.346.这里的回归系数b ^=0.304,它的意义是:腐蚀时间x 每增加一个单位(s),深度Y 平均增加0.304个单位(μm).(3)根据上面求得的回归直线方程,当腐蚀时间为100 s 时,y ^=0.304×100+5.346=35.86(μm),即腐蚀深度大约是35.86 μm.点评:利用回归直线方程可以对总体进行预测,值得注意的是得出的回归直线方程并不思路2例1给出施化肥量对水稻产量影响的试验数据:(1)画出上表的散点图;(2)求出回归直线的方程. 解:(1)散点图如下图.(2)计算得b ^≈4.75,a ^≈257.从而得回归直线方程是y ^=257+4.75x.直观判断散点在一条直线附近,故具有线性相关关系.由测得的数据表可知:=b ^x +a ^=54.96+0.668x.2设对变量x ,Y 有如下观察数据:使用函数型计算器求Y 对x 的回归直线方程.(结果保留到小数点后3位数字) 解:按键MODE 3 1(进入线性回归计算状态)SHIFT CLR 1 =(将计算器存储器设置成初始状态)151, 40 DT 152 , 41 DT 153 , 41 DT 154 , 41.5 DT 156, 42 DT 157 ,42.5DT 158 , 43 DT 160 , 44 DT 160, 45 DT 162 , 45 DT 163 , 46 DT 164 , 45.5 DT 继续按下表按键SHIFT SVAR 1 = -27.75938967 SHITF SVAR2 =0.449530516即 a ^≈-27.759,b ^≈0.450.所以Y 对x 的回归直线方程为y ^=0.450x -27.759. 变式训练下表为某地近几年机动车辆数与交通事故数的统计资料. 机动车辆数x/千台 95110112120129135150180交通事故数Y/千件6.27.5 7.78.5 8.79.8 10.2 13(1)请判断机动车辆数与交通事故数之间是否有线性相关关系,如果不具有线性相关关系,请说明理由;(2)如果具有线性相关关系,求出线性回归方程.解:(1)在直角坐标系中画出数据的散点图,如下图.直观判断散点在一条直线附近,故具有线性相关关系. (2)计算得b ^≈0.077 4,a ^=-1.024 1,所以,所求线性回归方程为y ^=-1.024 1+0.077 4x.知能训练1.已知10只狗的血球体积及红血球数的测量值如下: 血球体积x/mL 45424648423558403950红血球数Y/百6.53 6.30 9.527.50 6.99 5.90 9.49 6.20 6.558.72(2)求出回归直线的方程.(1)画出数据的散点图;(2)用最小二乘法估计求线性回归方程. 参考答案:1.解:(1)散点图如下图所示.(2)x =110(45+42+46+48+42+35+58+40+39+50)=44.50, y =110(6.53+6.30+9.52+7.50+6.99+5.90+9.49+6.20+6.55+8.72)=7.37. 设回归直线方程为y ^=a ^+b ^x ,则b ^=0.175,a ^=y -b ^x =-0.418, 所以所求回归直线的方程为y ^=-0.418+0.175x. 2.解:(1)散点图如下图.(2)计算得b ^≈0.196 2,a ^≈1.816 6,所以,线性回归方程为y ^=1.816 6+0.196 2x.拓展提升某调查者从调查中获知某公司近年来科研费用支出x 与公司所获得利润Y 的统计资料如下表:科研费用支出x 与利润Y 统计表 单位:万元年份 科研费用支出 利润 19985 31 199911 40 20004 30 20015 34 20023 25 20032 20 合计 30 180要求估计利润Y 对科研费用支出x 的线性回归模型.解:设线性回归模型直线方程为y ^=a ^+b ^x ,因为x =306=5,y =1806=30, 求解a ^、b ^的估计值:b ^=2,a ^=20.所以利润Y 对科研费用支出x 的线性回归模型直线方程为y ^=20+2x.课堂小结1.求线性回归方程.2.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.作业本节练习B 1、2.设计感想本节课在上节课的基础上,利用实例分析了散点图的分布规律,推导出了线性回归直线的方程的求法,并利用回归直线的方程估计可能的结果,本节课讲得较为详细,实例较多,便于同学们分析比较.本节课通过选取一些学生特别关心的身边事例,对学生进行思想情操教育、意志教育,使其养成良好的学习态度.备课资料相关关系的强与弱我们知道,两个变量x 、y 正(负)相关时,它们就有相同(反)的变化趋势,即当x 由小变大时,相应的y 有由小(大)变大(小)的趋势,因此可以用回归直线来描述这种关系.与此相关的一个问题是:如何描述x 和y 之间的这种线性关系的强弱?例如,物理成绩与数学成绩正相关,但数学成绩能够在多大程度上决定物理成绩?这就是相关强弱的问题,类似的还有吸烟与健康的负相关强度、父母身高与子女身高的正相关强度、农作物的产量与施肥量的正相关强度等.统计中用相关系数r 来衡量两个变量之间线性关系的强弱.若相应于变量x 的取值x i ,变量y 的观测值为y i (1≤i≤n),则两个变量的相关系数的计算公式为r =∑i =1nx i -x y i -y ∑i =1nx i -x 2∑i =1ny i -y 2.不相同的相关性可以从散点图上直观地反映出来.图(1)反映了变量x、y之间很强的线性相关关系,而图(2)中的两个变量的线性相关程度很弱.对于相关系数r,首先值得注意的是它的符号.当r为正时,表明变量x、y正相关;当r为负时,表明变量x、y负相关.反映在散点图上,图(1)中的变量x、y正相关,这时的r为正;图(2)中的变量x、y负相关,这时的r为负.另一个值得注意的是r的大小.统计学认为,对于变量x、y,如果r∈[-1,-0.75],那么负相关很强;如果r∈[0.75,1],那么正相关很强;如果r∈(-0.75,-0.30]或r∈[0.30,0.75),那么相关性一般;如果r∈[-0.25,0.25],那么相关性较弱.反映在散点图上,图(1)的r=0.97,这些点有明显的从左下角到右上角沿直线分布趋势,这时用线性回归模型描述两个变量之间的关系效果很好;图(2)的r=-0.85,这些点也有明显的从左上角到右下角沿直线分布趋势.这时用线性回归模型描述两个变量之间的关系也有好的效果.你能试着对自己身边的某个问题,确定两个变量,通过收集数据,计算相关系数,然后分析一下能否用线性回归模型来拟合它们之间的关系吗?图(1) 图(2)。
2.3.2 两个变量的线性相关一、教学目标1.通过实例引入线性回归模型,感受产生随机误差的原因;2.通过对回归模型的合理性等问题的研究,渗透线性回归分析的思想和方法; 3.能求出简单实际问题的线性回归方程。
二、教学重点,难点线性回归模型的建立和线性回归系数的最佳估计值的探求方法。
三、教学过程探究一:求线形回归方程例1:下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据x3 4 5 6 y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程a x b yˆˆˆ+=; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:3×2.5+4×3+5×4+6×4.5=66.5) 解(1)略。
由学生自己完成。
(2)由对照数据,计算得:5.6641=∑=ii i yx 8665432222412=+++=∑=i ix5.4=x ,7.05.44865.35.445.66ˆ2=⨯-⨯⨯-=b; 35.05.47.05.3ˆˆ=⨯-=-=x b y a所求的回归方程为35.07.0+=x y(3) 当100=x , 35.7035.07.0100=+⨯=y 吨,预测生产100吨甲产品的生产能耗比技改前降低9070.3519.65-=(吨)反思:讨论:这些点并不都在同一条直线上,上述直线并不能精确地反映x与y之间的关系,y的值不能由x完全确定,它们之间是统计相关关系,y的实际值与估计值之间存在着误差.对于上述问题,设有n对观测数据()),,3,2,1(,niyxii⋅⋅⋅=,根据线性回归模型,对于每一个ix,对应的随机误差项()iiibxay+-=ε,我们希望总误差越小越好,即要使∑=nii12ε越小越好.所以,只要求出()()21,∑=--=niiixyQαββα取得最小值时的βα,值作为ba,,的估计值,记为baˆ,ˆ。
2.3变量间的相关关系(2)(教学设计)2.3.2-2两个变量的线性相关——回归直线教学目标:1、知识与技能(1)知道最小二乘法和回归分析的思想;.(2)能根据线性回归方程系数公式建立线性回归方程或根据给出的数据应用图形计算器建立线性回归方程;(3)通过改变同一问题下样本点的选择进而对照回归方程的差异,体会随机思想;(4)利用回归方程预测,体现用“确定关系研究相关关系”的回归思想.2、过程与方法发现随机变量存在规律,经历用不同估算方法描述两个变量线性相关关系和线性回归分析过程,借助图形计算器得出回归直线,在以上过程中体会随机思想,增强应用数学知识和信息技术解决实际问题的意识.3、情感与价值观通过合作学习,养成倾听别人意见和建议的良好习惯.教学重点、难点:重点:(1)知道最小二乘法和回归分析的思想;(2)能根据给出的线性回归方程的系数公式建立线性回归方程.难点:(1)用数学符号刻画出“从整体上看,各点与此直线上的点的偏差”的表达方式;(2)建立回归思想.教学过程:(一)创设情景、导入课题1、相关关系的概念;2、相关关系与函数关系的异同点:;3、在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图;4、成正相关和负相关的两个相关变量的散点图分别有什么特点?5、探究:观察人体的脂肪含量百分比和年龄的样本数据的散点图,这两个相关变量成正相关.我们需要进一步考虑的问题是,当人的年龄增加时,体内脂肪含量到底是以什么方式增加呢?(板书课题)(二)师生互动、新课讲解讨论:有些散点图中的点是杂乱分布的,有些散点图中的点的分布有一定的规律性,年龄和人体脂肪含量的样本数据的散点图中的点的分布有什么特点?(见课本P86)这些点大致分布在一条直线附近.如果散点图中的点的分布,从整体上看大致在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做回归直线.并根据回归方程对总体进行估计.如果能够求出这条回归直线的方程(简称回归方程),那么我们就可以比较清楚地了解年龄与体内脂肪含量的相关性.讨论:1、每个同学画的直线相同吗?2、你认为回归直线有很多条吗?3、你可以求出直线方程吗?大家的建议都有一定的道理,但总让人感到可靠性不强.问题1 回归直线与散点图中各点的位置用数学的方法来刻画应具有怎样的关系? 从整体上看,各点与此直线最接近,距离最小. 问题2你能解释这句话的含义吗?讨论:对一组具有线性相关关系的样本数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),设其回归方程为a bx y +=,可以用哪些数量关系来刻画各样本点与回归直线的接近程度?我们可以用点(x i ,y i )与这条直线上横坐标为x i 的点之间的距离来刻画点(x i ,y i )到直线的远近.()),,3,2,1(n i a bx y i i =+-为了从整体上反映n 个样本数据与回归直线的接近程度,你认为选用哪个数量关系来刻画比较合适? 用这n 个距离之和来刻画各点到直线的“整体距离”是比较合适的,即可以用()∑=+-ni iia bx y 1表示各点到直线a bx y +=的“整体距离”.由于绝对值使得计算不方便,在实际应用中人们更喜欢用()()()2222211a bx y a bx y a bx y Q n n --++--+--=这样,问题就归结为:当a ,b 取什么值时Q 最小?即点到直线a bx y +=的“整体距离”最小.这样通过求此式的最小值而得到回归直线的方法,即使得一半数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.根据有关数学原理推导,a ,b 的值由下列公式给出()()()∑∑∑∑--=---====221121xn xy x n yx xxyy x xb ini iini ini i i=x ba-y根据最小二乘法的思想和此公式,利用计算器或计算机可以方便的求得年龄和人体脂肪含量的样本数据的回归方程.以Excel软件为例,用散点图来建立表示人体的脂肪含量与年龄的相关关系的线性回归方程,具体步骤如下:⑴在Excel中选定表示人体的脂肪含量与年龄的相关关系的散点图,在菜单中选定“图表”中的“添加趋势线”选项,弹出“添加趋势线”对话框“.⑵单击“类型”标签,选定“趋势预测/回归分析类型”中的“线性”选项,单击“确定”按钮,得到回归直线.⑶双击回归直线,弹出“趋势线格式”对话框.单击“选项”标签,选定“显示公式”,最后单击“确定”按钮,得到回归直线的回归方程.(三)讲练结合,巩固提高1试一试:将表中的年龄作为x代入上述方程,看看得出的数值与真实数值之间的关系,从中你体会到什么?利用回归直线,我们可以进行预测.类型一线性相关的概念例1以下是某地搜集到的新房屋的销售价格和房屋面积的数据:解散点图如下:由上图可看出,销售价格与房屋面积这两个变量是正相关.反思与感悟如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,呈递增趋势,是正相关;反之为负相关.跟踪训练1一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:(1)(2)关于加工零件的个数与加工时间,你能得出什么结论?解 (1)散点图如下:(2)加工零件的个数与所花费的时间具有正的线性相关关系.类型二 回归方程的求法例2 下表为某地近几年机动车辆数与交通事故数的统计资料.(1) (2)如果具有线性相关关系,求出回归方程.解 (1)在平面直角坐标系中画出数据的散点图,如下图.直观判断散点在一条直线附近,故具有线性相关关系. (2)计算相应的数据之和:∑i =18x i =1 031,∑i =18y i =71.6,∑i =18x 2i =137 835,∑i =18x i y i =9 611.7, x =128.875,y =8.95将它们代入公式计算得b ^≈0.077 4,a ^≈-1.024 9,所以,所求回归方程为y ^=0.077 4x -1.024 9.跟踪训练2 以下是某地搜集到的新房屋的销售价格y 和房屋的面积x 的数据:(1)(2)求回归方程,并在散点图中加上回归直线. 解 (1)数据对应的散点图如图所示:(2)x =15∑i =15x i =109,y =23.2,∑i =15x 2i =60 975,∑i =15x i y i =12 952. 设所求回归方程为y ^=b ^x +a ^,则b ^=∑i =15x i y i -5x y∑i =15x 2i -5x2≈0.196 2,a ^=y -b ^x =23.2-109×0.196 2=1.814 2,故所求回归方程为y ^=0.196 2x +1.814 2. 回归直线如(1)中图所示.类型三 回归方程的应用例3 有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:(1)(2)从散点图中发现气温与热饮销售杯数之间有什么关系; (3)求回归方程;(4)如果某天的气温是2℃,预测这天卖出的热饮杯数;(5) 气温为2℃时,小卖部一定能够卖出143杯左右热饮吗?为什么? 解 (1)散点图如图所示:(2)从上图看到,各点散布在从左上角到右下角的区域里,因此,气温与热饮销售杯数之间呈负相关,即气温越高,卖出去的热饮杯数越少.(3)从散点图可以看出,这些点大致分布在一条直线的附近,因此,可用公式求出回归方程的系数.利用计算器容易求得回归方程y ^=-2.352x +147.767.(4)当x =2时,y ^=143.063.因此,某天的气温为2℃时,这天大约可以卖出143杯热饮.(5)小卖部不一定能够卖出143杯左右热饮,原因如下:①回归方程中的截距和斜率都是通过样本估计出来的,存在误差,这种误差可以导致预测结果的偏差.②即使截距和斜率的估计没有误差,也不可能百分之百地保证对应于x 的预报值,能够与实际值y 很接近.我们不能保证点(x ,y )落在回归直线上,甚至不能百分之百地保证它落在回归直线的附近. 跟踪训练3 有人统计了同一个省的6个城市某一年的人均国民生产总值(即人均GDP)和这一年各城市患白血病的儿童数,如下表:(1)(2)通过计算可知这两个变量的回归方程为y ^=23.25x +102.15,假如一个城市的人均GDP 为12万元,那么可以断言,这个城市患白血病的儿童一定超过380人,请问这个断言是否正确? 解 (1)散点图如下:根据散点图可以看出,在6个点中,虽然第一个点离这条直线较远,但其余5个点大致分布在这条直线的附近,所以这两个变量具有线性相关关系.(2)上述断言是错误的,将x =12代入y ^=23.25x +102.15得y ^=23.25×12+102.15=381.15>380,但381.15是对该城市人均GDP 为12万元的情况下所作的一个估计,该城市患白血病的儿童可能超过380人,也可能低于380人.参考公式:()()()1122211n ni i i i i i n ni ii i x x y y x y nx y b x x x nx a y bx====⎧---⎪⎪==⎨--⎪⎪=-⎩∑∑∑∑) (四)小结1、求样本数据的线性回归方程的步骤;2、回归方程被样本数据惟一确定,各样本点大致分布在回归直线附近.对同一个总体,不同的样本数据对应不同的回归直线,所以回归直线也具有随机性.3、对一组样本数据,应先作散点图,在具有线性相关关系的前提下再求回归方程.如果一组数据不具有线性相关关系,即不存在回归直线,那么所得的“回归方程”是没有实际意义的. (五)分层作业1.工人月工资(元)依劳动生产率(千元)变化的回归方程为y ^=60+90x ,下列判断正确的是( ) A.劳动生产率为1千元时,工资为50元 B.劳动生产率提高1千元时,工资提高150元 C.劳动生产率提高1千元时,工资约提高90元 D.劳动生产率为1千元时,工资为90元 答案 C解析 因工人月工资依劳动生产率变化的回归方程为y ^=60+90x ,当x 由a 提高到a +1时,y ^2-y ^1=60+90(a +1)-60-90a =90.2.已知x 与y 之间的几组数据如下表:假设根据上表数据所得回归直线方程y ^=b x +a ,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′B.b ^>b ′,a ^<a ′C.b ^<b ′,a ^>a ′ D.b ^<b ′,a ^<a ′答案 C解析 b ′=2,a ′=-2,由公式b ^=∑i =16(x i -x )(y i -y )∑i =16(x i -x )2求得,b ^=57,a ^ =y -b ^ x =136-57×72=-13, ∴b ^<b ′,a ^>a ′.选C.3.回归直线方程y ^=b ^x +a ^必过( ) A.点(0,0) B.点(x ,0) C.点(0,y ) D.点(x ,y )答案 D解析 回归直线必过样本点的中心.4.设一个回归方程为y ^=3+1.2x ,则变量x 增加一个单位时( ) A.y 平均增加1.2个单位 B.y 平均增加3个单位 C.y 平均减少1.2个单位 D.y 平均减少3个单位 答案 A解析 回归直线的斜率代表y 随x 的变化率.5.若对某个地区人均工资x 与该地区人均消费y 进行调查统计得y 与x 具有相关关系,且回归方程为y ^=0.7x +2.1(单位:千元),若该地区人均消费水平为10.5,则估计该地区人均消费额占人均工资收入的百分比约为( ) A.70% B.84% C.87.5% D.89.5% 答案 C解析 设该地区人均工资收入为y , 则y =0.7x +2.1,当y =10.5时,x =10.5-2.10.7=12. 10.512×100%=87.5%.6.期中考试后,某校高三(9)班对全班65名学生的成绩进行分析,得到数学成绩y 对总成绩x 的回归方程为y ^=6+0.4x .由此可以估计:若两个同学的总成绩相差50分,则他们的数学成绩相差的分数大约为( ) A.0.4 B.6 C.20 D.50 答案 C解析 令两人的总成绩分别为x 1,x 2. 则对应的数学成绩估计为y ^1=6+0.4x 1,y ^2=6+0.4x 2,所以|y ^1-y ^2|=|0.4(x 1-x 2)|=0.4×50=20.7.对具有线性相关关系的变量x ,y 有一组观测数据(x i ,y i )(i =1,2,…,8),其回归方程是y ^=13x +a ,且x 1+x 2+x 3+…+x 8=2(y 1+y 2+y 3+…+y 8)=6,则实数a 的值是( ) A.116 B.18 C.14 D.12答案 B解析 依题意可知,样本点的中心为(34,38),则38=13×34+a ,解得a =18.8.对于下列表格所示的五个散点,已知求得的线性回归方程为y ^=0.8x -155.则实数m 的值为( ) A.8 B.8.2 C.8.4 D.8.5 答案 A解析 依题意得x =15×(196+197+200+203+204)=200,y =15×(1+3+6+7+m )=17+m 5,因为回归直线必经过样本点中心,所以17+m5=0.8×200-155,解得m =8,选A.9.某工厂生产某种产品的产量x (吨)与相应的生产能耗y (吨标准煤)有如下几组样本数据:0.7,则这组样本数据的回归直线的方程是____________.答案 y ^=0.7x +0.35解析 ∵x =3+4+5+64=4.5,y =2.5+3+4+4.54=3.5, ∴a ^=y -b ^x =3.5-0.7×4.5=0.35.∴回归直线的方程为y ^=0.7x +0.35.10.现有5组数据A (1,3)、B (2,4)、C (4,5)、D (3,10)、E (10,12),去掉________组数据后,剩下的4组数据的线性相关性最大. 答案 D解析 在散点图中,点的分布越接近回归直线,两个变量的相关性越大.11.某数学老师身高176 cm ,他爷爷、父亲和儿子的身高分别是173 cm 、170 cm 和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为__________cm. 答案 185解析 根据题中所提供的信息,可知父亲与儿子的对应数据可列表如下:x =173,y =176,∴b ^=∑i =13(x i -x )(y i -y )∑i =13(x i -x )2=3×6(-3)2+32=1,a ^=y -b ^x =176-173=3, ∴回归方程为y ^=x +3,从而可预测他孙子的身高为182+3=185(cm).12.某公司的广告费支出x (单位:万元)与销售额y (单位:万元)之间有下列对应数据:资料显示y 与x 成线性相关关系.根据上表提供的数据得到回归方程y ^=b ^x +a ^中的b ^=6.5,预测销售额为115万元时约需________万元广告费. 答案 15解析 x =2+4+5+6+85=5, y =30+40+60+50+705=50. 因为回归方程必过样本点的中心(5,50),代入y ^=6.5x +a ^,得a ^=17.5,所以y ^=6.5x +17.5,当y ^=115时,x =15.13.一台机器由于使用时间较长,生产的零件有一些会缺损,按不同转速生产出来的零件有缺损的统计数据如下表:(1)作出散点图;(2)如果y 与x 成线性相关关系,求出回归方程;(3)若实际生产中,允许每小时的产品中有缺损的零件最多为10个,那么,机器的运转速度应控制在什么范围? 解 (1)根据表中的数据画出散点图如图:(2)设回归方程为y ^=b ^x +a ^,并列表如下:x =12.5,y =8.25,∑i =14x 2i =660,∑i =14x i y i =438,∴b ^=438-4×12.5×8.25660-4×12.52≈0.73,a ^=8.25-0.73×12.5=-0.875,∴y ^=0.73x -0.875.(3)令0.73x -0.875≤10,解得x ≤14.9≈15. 故机器的运转速度应控制在15转/秒内.备用题:1.下表提供了某厂节能降耗技术改造后在生产A 产品过程中记录的产量x (吨)与相应的生产能耗y (吨)的几组对根据上表提供的数据,求出y 关于的线性回归方程为0.70.35y x =+,则表中t 的值( A )A . 3B . 3.15C .3.5D . 4.52.【2012高考湖南文5】设某大学的女生体重y (单位:kg )与身高x (单位:cm )具有线性相关关系,根据一组样本数据(x i ,y i )(i=1,2,…,n ),用最小二乘法建立的回归方程为 y =0.85x-85.71,则下列结论中不正确...的是 A.y 与x 具有正的线性相关关系 B.回归直线过样本点的中心(x ,y ) C.若该大学某女生身高增加1cm ,则其体重约增加0.85kgD.若该大学某女生身高为170cm ,则可断定其体重必为58.79kg 【答案】D【解析】由回归方程为 y =0.85x-85.71知y 随x 的增大而增大,所以y 与x 具有正的线性相关关系,由最小二乘法建立的回归方程得过程知ˆ()y bx a bx y bx a y bx =+=+-=-,所以回归直线过样本点的中心(x ,y ),利用回归方程可以预测估计总体,所以D 不正确.【点评】本题组要考查两个变量间的相关性、最小二乘法及正相关、负相关的概念,并且是找不正确的答案,易错. 3.根据上表可得回归方程ˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为 A .63.6万元 B .65.5万元 C .67.7万元 D .72.0万元 【答案】B4.已知x 、y 的取值如下表所示:若y 与x 2.6 ;5. 某种产品的广告费支出x y(Ⅰ)求回归直线方程;(Ⅱ)试预测广告费支出为10万元时,销售额多大?(参考数据:521145iix==∑52113500iiy==∑511380i iix y==∑)(Ⅰ)解:2+4+5+6+825=555x==,30+40+60+50+70250=5055y==又已知521145iix==∑,511380i iix y==∑于是可得:5152215138055506.51455555i iiiix y x ybx x==--⨯⨯===-⨯⨯-∑∑, 50 6.5517.5a y bx=-=-⨯=因此,所求回归直线方程为: 6.517.5 y x=+(Ⅱ)解: 根据上面求得的回归直线方程,当广告费支出为10万元时,6.51017.5=82.5y=⨯+(万元) 即这种产品的销售收入大约为82. 5万元.。
2. 3.2 两个变量的线性相关2.3.2 两个变量的线性相关(第一课时)教学要求:经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程的系数公式建立线性回归方程.教学重点:根据给出的线性回归方程的系数公式建立线性回归方程. 教学难点:理解最小二乘法的思想 教学过程: 一、复习准备:1. 作散点图的步骤和方法?正.负相关的概念?2. 提问:看人体的脂肪百分比和年龄的散点图,当人的年龄增加时,体内脂肪含量到底是以什么方式增加的呢? 二、讲授新课: 1. 教学回归直线概念:①从散点图上可以看出,这些点大致分布在通过散点图中心的一条直线。
如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这这两个变量之间具有线形相关关系,直线叫回归直线。
(线形相关→回归直线)②提问:从散点图上可以发现,人体的脂肪百分比和年龄的散点图,大致分布在通过散点图中心的一条直线。
那么,怎样确定这条直线呢?(学生讨论:1.选择能反映直线变化的两个点。
2. 在图中放上一根细绳,使得上面和下面点的个数相同或基本相同。
3. 多取几组点对,确定几条直线方程。
再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距。
)。
教师:分别分析各方法的可靠性。
2. 教学最小二乘法:①求回归方程的关键是如何用数学的方法刻画“从整体上看,各点与此直线的距离最小”.如果直线的方程为αβ+=x y ,用()i ,,βαρ表示第i 个样本点()i i y x ,与直线之间的距离,则从总体上看各点与此直线的距离可以用所有样本点与回归直线的距离来表示,即用下面的公式()()∑==ni i Q 1,,,βαρβα来表示.注意到上面的等式对于任何实数α和β都有定义,因此可把()βα,Q 看成二元函数.这样,“从整体上看,各点与此直线的距离最小”的含义是回归方程的截距a 和斜率b 构成的点()b a ,应该是函数()βα,Q 的最小值点.特别地,当()()2,,i i i x y i αββαρ--=时,()b a ,应该使函数()()()()2222211,αβαβαββα--++--+--=n n x y x y x y Q Λ达到极小值,即a 和b 由公式①给出。
变量间的相关关系2.3.1 变量之间的相关关系2.3.2 两个变量的线性相关整体设计教学分析变量之间的关系是人们感兴趣的问题.教科书通过思考栏目“物理成绩与数学成绩之间的关系”,引导学生考察变量之间的关系.在教师的引导下,可使学生认识到在现实世界中存在不能用函数模型描述的变量关系,从而体会研究变量之间的相关关系的重要性.随后,通过探究人体脂肪百分比和年龄之间的关系,引入描述两个变量之间关系的线性回归方程(模型).教科书在探索用多种方法确定线性回归直线的过程中,向学生展示创造性思维的过程,帮助学生理解最小二乘法的思想.通过气温与饮料销售量的例子及随后的思考,使学生了解利用线性回归方程解决实际问题的全过程,体会线性回归方程作出的预测结果的随机性,并且可能犯的错误.进一步,教师可以利用计算机模拟和多媒体技术,直观形象地展示预测结果的随机性和规律性.三维目标1.通过收集现实问题中两个有关联变量的数据认识变量间的相关关系.)2.明确事物间的相互联系.认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系,并利用散点图直观体会这种相关关系.3.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程的系数公式建立线性回归方程.重点难点教学重点:通过收集现实问题中两个有关联变量的数据直观认识变量间的相关关系;利用散点图直观认识两个变量之间的线性关系;根据给出的线性回归方程的系数公式建立线性回归方程.教学难点:变量之间相关关系的理解;作散点图和理解两个变量的正相关和负相关;理解最小二乘法的思想.课时安排2课时教学过程、第1课时导入新课思路1在学校里,老师对学生经常这样说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系.这种说法有没有根据呢学生讨论:我们可以发现自己的数学成绩和物理成绩存在某种关系.(似乎就是数学好的,物理也好;数学差的,物理也差,但又不全对.)物理成绩和数学成绩是两个变量,从经验看,由于物理学习要用到比较多的数学知识和数学方法.数学成绩的高低对物理成绩的高低是有一定影响的.但决非唯一因素,还有其他因素,如是否喜欢物理,用在物理学习上的时间等等.(总结:不能通过一个人的数学成绩是多少就准确地断定他的物理成绩能达到多少.但这两个变量是有一定关系的,它们之间是一种不确定性的关系.如何通过数学成绩的结果对物理成绩进行合理估计有非常重要的现实意义.)为很好地说明上述问题,我们开始学习变量之间的相关关系和两个变量的线性相关.(教师板书课题)思路2某地区的环境条件适合天鹅栖息繁衍,有人经统计发现了一个有趣的现象,如果村庄附近栖息的天鹅多,那么这个村庄的婴儿出生率也高,天鹅少的地方婴儿的出生率低,于是,他就得出一个结论:天鹅能够带来孩子.你认为这样得到的结论可靠吗如何证明这个结论的可靠性推进新课新知探究提出问题(1)粮食产量与施肥量有关系吗“名师出高徒”可以解释为教师的水平越高,学生的水平也越高.教师的水平与学生的水平有什么关系你能举出更多的描述生活中两个变量的相关关系的成语吗((2)两个变量间的相关关系是什么有几种(3)两个变量间的相关关系的判断.讨论结果:(1)粮食产量与施肥量有关系,一般是在标准范围内,施肥越多,粮食产量越高;教师的水平与学生的水平是相关的,如水滴石穿,三人行必有我师等.我们还可以举出现实生活中存在的许多相关关系的问题.例如:商品销售收入与广告支出经费之间的关系.商品销售收入与广告支出经费有着密切的联系,但商品销售收入不仅与广告支出多少有关,还与商品质量、居民收入等因素有关.粮食产量与施肥量之间的关系.在一定范围内,施肥量越大,粮食产量就越高.但是,施肥量并不是决定粮食产量的唯一因素.因为粮食产量还要受到土壤质量、降雨量、田间管理水平等因素的影响.人体内的脂肪含量与年龄之间的关系.在一定年龄段内,随着年龄的增长,人体内的脂肪含量会增加,但人体内的脂肪含量还与饮食习惯、体育锻炼等有关,可能还与个人的先天体质有关.[应当说,对于上述各种问题中的两个变量之间的相关关系,我们都可以根据自己的生活、学习经验作出相应的判断,因为“经验当中有规律”.但是,不管你的经验多么丰富,如果只凭经验办事,还是很容易出错的.因此,在分析两个变量之间的相关关系时,我们需要一些有说服力的方法.在寻找变量之间相关关系的过程中,统计同样发挥着非常重要的作用.因为上面提到的这种关系,并不像匀速直线运动中时间与路程的关系那样是完全确定的,而是带有不确定性.这就需要通过收集大量的数据(有时通过调查,有时通过实验),在对数据进行统计分析的基础上,发现其中的规律,才能对它们之间的关系作出判断.(2)相关关系的概念:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.两个变量之间的关系分两类:①确定性的函数关系,例如我们以前学习过的一次函数、二次函数等;②带有随机性的变量间的相关关系,例如“身高者,体重也重”,我们就说身高与体重这两个变量具有相关关系.相关关系是一种非确定性关系.如商品销售收入与广告支出经费之间的关系.(还与商品质量、居民收入、生活环境等有关)(3)两个变量间的相关关系的判断:①散点图.②根据散点图中变量的对应点的离散程度,可以准确地判断两个变量是否具有相关关系.③正相关、负相关的概念.①教学散点图;出示例题:在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:年龄232738414549|50脂肪%年龄535456575860。
61脂肪)分析数据:大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加.我们可以作散点图来进一步分析.②散点图的概念:将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图,如下图.从散点图我们可以看出,年龄越大,体内脂肪含量越高.图中点的趋势表明两个变量之间确实存在一定的关系,这个图支持了我们从数据表中得出的结论.(a.如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.b.如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系.c.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系)③正相关与负相关的概念:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.(注:散点图的点如果几乎没有什么规则,则这两个变量之间不具有相关关系)应用示例{思路1例1 下列关系中,带有随机性相关关系的是_____________.①正方形的边长与面积之间的关系②水稻产量与施肥量之间的关系③人的身高与年龄之间的关系④降雪量与交通事故的发生率之间的关系解析:两变量之间的关系有两种:函数关系与带有随机性的相关关系.①正方形的边长与面积之间的关系是函数关系.②水稻产量与施肥量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.③人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而他们不具备相关关系.④降雪量与交通事故的发生率之间具有相关关系,因此填②④.答案:②④】例2 有关法律规定,香烟盒上必须印上“吸烟有害健康”的警示语.吸烟是否一定会引起健康问题你认为“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法对吗分析:学生思考,然后讨论交流,教师及时评价.解:从已经掌握的知识来看,吸烟会损害身体的健康,但是除了吸烟之外,还有许多其他的随机因素影响身体健康,人体健康是很多因素共同作用的结果.我们可以找到长寿的吸烟者,也更容易发现由于吸烟而引发的患病者,所以吸烟不一定引起健康问题.但吸烟引起健康问题的可能性大.因此“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法是不对的.点评:在探究研究的过程中,如果能够从两个变量的观察数据之间发现相关关系是极为有意义的,由此可以进一步研究二者之间是否蕴涵因果关系,从而发现引起这种相关关系的本质原因是什么.本题的意义在于引导学生重视对统计结果的解释,从中发现进一步研究的问题.思路2例1 有时候,一些东西吃起来口味越好,对我们的身体越有害.下表给出了不同类型的某种食品的数据.第二列表示此种食品所含热量的百分比,第三列数据表示由一些美食家以百分制给(1)作出这些数据的散点图."(2)关于两个变量之间的关系,你能得出什么结论解:(1)散点图如下:(2)基本成正相关关系,即食品所含热量越高,口味越好.例2 案例分析:一般说来,一个人的身高越高,他的右手一拃长就越长,因此,人的身高与右手一拃长之间存在着一定的关系.为了对这个问题进行调查,我们收集了北京市某中学2003年高三年级96名学生的身高与右手一拃长的数据如下表.性别身高/cm右手一拃长/cm 性别身高/cm|右手一拃长/cm女152女~153女156女157158女159·女女160> 女160女160女#160女160女160160女160—女女161?女161女162女/162女163女163164女164;女女164】女164女165女:165女165女165166女167(女女167\ 女168179男179男179180男181#男男181:男181男182男@182男182男183185男186【男男191。
男191(1)根据上表中的数据,制成散点图.你能从散点图中发现身高与右手一拃长之间的近似关系吗(2)如果近似成线性关系,请画出一条直线来近似地表示这种线性关系.(3)如果一个学生的身高是188 cm,你能估计他的一拃大概有多长吗解:根据上表中的数据,制成的散点图如下.#从散点图上可以发现,身高与右手一拃长之间的总体趋势是成一直线,也就是说,它们之间是线性相关的.那么,怎样确定这条直线呢同学1:选择能反映直线变化的两个点,例如(153,16),(191,23)两点确定一条直线.同学2:在图中放上一根细绳,使得上面和下面点的个数相同或基本相同.同学3:多取几组点对,确定几条直线方程.再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距.同学4:从左端点开始,取两条直线,如下图.再取这两条直线的“中间位置”作一条直线.同学5:先求出相同身高同学右手一拃长的平均值,画出散点图,如下图,再画出近似的直线,使得在直线两侧的点数尽可能一样多.>同学6:先将所有的点分成两部分,一部分是身高在170 cm以下的,一部分是身高在170 cm 以上的;然后,每部分的点求一个“平均点”——身高的平均值作为平均身高、右手一拃的平均值作为平均右手一拃长,即(164,19),(177,21);最后,将这两点连接成一条直线.同学7:先将所有的点按从小到大的顺序进行排列,尽可能地平均分成三等份;每部分的点按照同学3的方法求一个“平均点”,最小的点为(,),中间的点为(,),最大的点为(,).求出这三个点的“平均点”为(,).我再用直尺连接最大点与最小点,然后平行地推,画出过点(,)的直线.同学8:取一条直线,使得在它附近的点比较多.在这里需要强调的是,身高和右手一拃长之间没有函数关系.我们得到的直线方程,只是对其变化趋势的一个近似描述.对一个给定身高的人,人们可以用这个方程来估计这个人的右手一拃长,这是十分有意义的.知能训练一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:零件数x(个)102030405060708090100加工时间y(min)626875818995102108115122画出散点图;关于加工零件的个数与加工时间,你能得出什么结论答案:(1)散点图如下:(2)加工零件的个数与所花费的时间呈正线性相关关系.拓展提升以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:房屋面积(m2)11511080135105销售价格(万元)22(1)画出数据对应的散点图;(2)指出是正相关还是负相关;(3)关于销售价格y和房屋的面积x,你能得出什么结论解:(1)数据对应的散点图如下图所示:(2)散点图中的点散分布在从左下角到右上角的区域内,所以是正相关.(3)关于销售价格y和房屋的面积x,房屋的面积越大,价格越高,它们呈正线性相关的关系.课堂小结通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系.作业习题2.3A组3、4(1).设计感想本节课学习了变量之间的相关关系和两个变量的线性相关的部分内容,通过身边的具体实例说明了两个变量的相关关系,并学会了利用散点图及其分布来说明两个变量的相关关系的种类,为下一节课作了铺垫,思路1和思路2的例题对知识进行了巩固和加强,另外,本节课通过选取一些学生特别关心的身边事例,对学生进行思想情操教育、意志教育和增强学生的自信心,养成良好的学习态度和学习方法,树立时间观,培养勤奋、刻苦耐劳的精神.。