人教版高中数学必修三 2.3线性相关中的巧思妙解
- 格式:doc
- 大小:64.50 KB
- 文档页数:2
两个变量的线性相关说课稿一、教学目标根据课标的要求及前面的分析,结合高二学生的认知特点确定本节课的教学目标如下:知识与技能:1. 知道最小二乘法和回归分析的思想;2. 能根据线性回归方程系数公式建立线性回归方程或根据给出的数据,应用图形计算器建立线性回归方程过程与方法:发现随机变量存在规律,经历线性回归分析过程,借助图形计算器得出回归直线,增强应用数学知识和信息技术解决实际问题的意识。
情感态度与价值观通过合作学习,养成倾听别人意见和建议的良好品质二、重点难点分析:根据目标分析,确定教学重点和难点如下:教学重点:1. 知道最小二乘法和回归分析的思想;2.会求回归直线教学难点:建立回归思想三、教学设计教学环节内容及说明创设情境探究:在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:年龄23 27 39 41 45 49 50脂肪9.5 17.8 21.2 25.9 27.5 26.3 28.2年龄53 54 56 57 58 60 61脂肪29.6 30.2 31.4 30.8 33.5 35.2 34.6问题与引导设计师生活动设计意图问题1. 利用图形计算器作出散点图,并指出上面的两个变量是正相关还是负相关?教师提问,学生通过动手操作得出散点图并回答以旧“探”新:对旧的知识进行简要的提问复习,为本节课学生能够更好的建构新的知识做好充分的准备;尤其为一些后进生能够顺利的完成本节课的内容提供必要的基础。
教师引导:通过上节课的学习,我们知道散点图是研究两个变量相关关系的一种重要手段。
下面,请同学们根据得出的散点图,思考下面的问题2 .问题2. 甲同学判断某人年龄在65岁时体内脂肪含量百分比可能为34,乙同学判断可能为25,而丙同学则判断可能为37,你对甲,乙,丙三个同学的判断有什么看法?学生能够表达自己的看法。
有的学生可能会认为乙同学的判断是错误的;有的学生可能认为甲乙丙三个同学的判断都是对的,答案不唯一该问题具有探究性、启发性和开放性。
人教版高中必修3(B版)2.3.2 两个变量的线性相关教学设计1. 教学目标1.了解什么是两个变量的线性相关。
2.掌握用散点图和回归分析判断两个变量间是否存在线性相关。
3.能够利用Excel进行数据的处理和线性回归模型的建立。
4.能够分析不同变量间的线性相关性并进行实际应用。
2. 教学重点1.掌握用散点图和回归分析判断两个变量间是否存在线性相关。
2.理解和掌握线性回归模型的建立方法。
3.实际应用场景中的变量分析。
3. 教学工具1.教师用PPT进行幻灯片的展示。
2.学生使用Excel进行数据处理。
3.学生使用PPT或者报告进行结果汇报。
4. 教学步骤4.1 引入1.利用课件引入什么是线性相关性,同时列出场景案例。
2.让学生思考实际用途,如何帮助决策。
4.2 教学内容1.通过教学案例和数据,帮助学生发现两个变量之间存在的线性关系,将数据进行散点图的展示。
2.利用线性回归方法求出变量间的关系,并进行解释分析,同时重点帮助学生理解回归线和残差。
3.在Excel中模拟数据,并进行线性回归模型的建立,帮助学生掌握模型参数的估计与推断,同时展示数据处理过程。
4.通过网络或者其他途径获得实际数据,并进行数据处理和线性回归分析,展示关键参数和线性回归模型的评估。
4.3 练习和应用1.让学生利用Excel进行数据录入和线性回归模型的建立,同时进行结果展示。
2.让学生分组,进行数据收集处理和建模,完成案例分析和报告撰写,同时进行展示和交流。
4.4 总结1.整理本次课程的重点知识点,巩固学生的掌握程度。
2.引导学生思考如何将所学知识应用到更广泛的场景中。
5. 教学资源1.教材:人教版高中必修3(B版)2.网络课件和视频资源:参考相关资源如慕课网、Coursera等。
6. 教学评估1.观察学生课前预习和课堂参与状况。
2.课堂能力训练:教师提供练习题目并进行课堂答题,加深学生对所学知识点的理解,同时检验学会程度。
3.课堂小组作业和课外大作业的评估:教师通过查看学生PPT报告和答辩情况进行交流和评估。
《两个变量的线性有关》教课方案目录一.教课内容分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 6二、教课目的设置⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 6三、学生学情剖析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 6四、教课策略剖析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 6五、教课媒体支持⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 7六、教课过程设计⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 71、提出问题、勇敢设计⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 72、数学建模、转变化归⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 83、深入研究、转变求解⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 94、感觉成功、拓展推行⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 95、学致使用⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 106、讲堂小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 10七、教课反省⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 10第 1 页《两个变量的线性有关》教课方案1. 教课内容分析《两个变量的线性有关》是高中教材人民教育第一版社 A 版必修三第二章的内容。
本节课主要商讨对拥有线性有关关系的两个变量进行统计剖析,是回归剖析的基础知识,表现了统计是以确立性数学为工具来研究不确立现象的数学。
其最小二乘法的思想是提升学生数学思想能力很好的素材。
同时为此后更好的研修选修 2-3 第三章《回归剖析的基本思想及其初步应用》确立基础。
2.教课目的设置知识与技术目标:(1)认识最小二乘法的思想及回归直线方程的推导过程;(2)经过实例增强对回归直线方程含义的理解。
过程与方法目标:(1)经过自主研究领会数形联合及最小二乘法的数学思想方法;(2)经过着手操作培育学生察看、剖析、比较和归纳能力,培育学生的创造性思想。
感情态度与价值观目标:(1) 能经过亲自试验和感觉来理解知识,领会数学知识与现实世界的联系。
(2) 经过体验公式的生成过程,培育学生踊跃研究的学习习惯。
3.学生学情剖析学生已经懂得经过散点图认识变量之间的有关关系,学生已经能解决单变量的统计问题,两个变量的回归剖析将为学生打开统计学崭新的一页。
高考数学高中数学(2.3.2 两个变量的线性相关第2课时)示范教案新人教A版必修3导入新课思路1客观事物是相互联系的,过去研究的大多数是因果关系,但实际上更多存在的是一种非因果关系.比如说:某某同学的数学成绩与物理成绩,彼此是互相联系的,但不能认为数学是“因”,物理是“果”,或者反过来说.事实上数学和物理成绩都是“果”,而真正的“因”是学生的理科学习能力和努力程度.所以说,函数关系存在着一种确定性关系,但还存在着另一种非确定性关系——相关关系.为表示这种相关关系,我们接着学习两个变量的线性相关——回归直线及其方程.思路2某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对照表:气温/℃26 18 13 10 4 -1 杯数20 24 34 38 50 64 如果某天的气温是-5 ℃,你能根据这些数据预测这天小卖部卖出热茶的杯数吗?为解决这个问题我们接着学习两个变量的线性相关——回归直线及其方程.推进新课新知探究提出问题(1)作散点图的步骤和方法?(2)正、负相关的概念?(3)什么是线性相关?(4)看人体的脂肪百分比和年龄的散点图,当人的年龄增加时,体内脂肪含量到底是以什么方式增加的呢?(5)什么叫做回归直线?(6)如何求回归直线的方程?什么是最小二乘法?它有什么样的思想?(7)利用计算机如何求回归直线的方程?(8)利用计算器如何求回归直线的方程?活动:学生回顾,再思考或讨论,教师及时提示指导.讨论结果:(1)建立相应的平面直角坐标系,将各数据在平面直角坐标中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图.(a.如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.b.如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系.c.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系)(2)如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.(3)如果所有的样本点都落在某一直线附近,变量之间就有线性相关的关系.(4)大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加,呈正相关的趋势,我们可以从散点图上来进一步分析.(5)如下图:从散点图上可以看出,这些点大致分布在通过散点图中心的一条直线附近.如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线(regression line).如果能够求出这条回归直线的方程(简称回归方程),那么我们就可以比较清楚地了解年龄与体内脂肪含量的相关性.就像平均数可以作为一个变量的数据的代表一样,这条直线可以作为两个变量具有线性相关关系的代表.(6)从散点图上可以发现,人体的脂肪百分比和年龄的散点图,大致分布在通过散点图中心的一条直线.那么,我们应当如何具体求出这个回归方程呢?有的同学可能会想,我可以采用测量的方法,先画出一条直线,测量出各点与它的距离,然后移动直线,到达一个使距离的和最小的位置,测量出此时的斜率和截距,就可得到回归方程了.但是,这样做可靠吗?有的同学可能还会想,在图中选择这样的两点画直线,使得直线两侧的点的个数基本相同.同样地,这样做能保证各点与此直线在整体上是最接近的吗?还有的同学会想,在散点图中多取几组点,确定出几条直线的方程,再分别求出各条直线的斜率、截距的平均数,将这两个平均数当成回归方程的斜率和截距.同学们不妨去实践一下,看看这些方法是不是真的可行?(学生讨论:1.选择能反映直线变化的两个点.2.在图中放上一根细绳,使得上面和下面点的个数相同或基本相同.3.多取几组点对,确定几条直线方程.再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距.)教师:分别分析各方法的可靠性.如下图:上面这些方法虽然有一定的道理,但总让人感到可靠性不强.实际上,求回归方程的关键是如何用数学的方法来刻画“从整体上看,各点与此直线的距离最小”.人们经过长期的实践与研究,已经得出了计算回归方程的斜率与截距的一般公式⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=---=∑∑∑∑====.)1(,)())((2121121x b y a x n x yx n yx x x y y x x b n i i ni ii n i i ni i i其中,b 是回归方程的斜率,a 是截距.推导公式①的计算比较复杂,这里不作推导.但是,我们可以解释一下得出它的原理.假设我们已经得到两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ), 且所求回归方程是^y =bx+a,其中a 、b 是待定参数.当变量x 取x i (i=1,2,…,n)时可以得到^y =bx i +a(i=1,2,…,n), 它与实际收集到的y i 之间的偏差是y i -^y =y i -(bx i +a)(i=1,2,…,n).这样,用这n 个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的.由于(y i -^y )可正可负,为了避免相互抵消,可以考虑用∑=-ni i iy y1^||来代替,但由于它含有绝对值,运算不太方便,所以改用Q=(y 1-bx 1-a)2+(y 2-bx 2-a)2+…+(y n -bx n -a)2②来刻画n 个点与回归直线在整体上的偏差. 这样,问题就归结为:当a,b 取什么值时Q 最小,即总体偏差最小.经过数学上求最小值的运算,a,b 的值由公式①给出.通过求②式的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫做最小二乘法(method of least square ).(7)利用计算机求回归直线的方程.根据最小二乘法的思想和公式①,利用计算器或计算机,可以方便地求出回归方程. 以Excel 软件为例,用散点图来建立表示人体的脂肪含量与年龄的相关关系的线性回归方程,具体步骤如下:①在Excel 中选定表示人体的脂肪含量与年龄的相关关系的散点图(如下图),在菜单中选定“图表”中的“添加趋势线”选项,弹出“添加趋势线”对话框.②单击“类型”标签,选定“趋势预测/回归分析类型”中的“线性”选项,单击“确定”按钮,得到回归直线.③双击回归直线,弹出“趋势线格式”对话框.单击“选项”标签,选定“显示公式”,最后单击“确定”按钮,得到回归直线的回归方程^y =0.577x-0.448.(8)利用计算器求回归直线的方程.用计算器求这个回归方程的过程如下:所以回归方程为^y =0.577x-0.448.正像本节开头所说的,我们从人体脂肪含量与年龄这两个变量的一组随机样本数据中,找到了它们之间关系的一个规律,这个规律是由回归直线来反映的. 直线回归方程的应用:①描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系.②利用回归方程进行预测;把预报因子(即自变量x )代入回归方程对预报量(即因变量Y )进行估计,即可得到个体Y 值的容许区间.③利用回归方程进行统计控制规定Y 值的变化,通过控制x 的范围来实现统计控制的目标.如已经得到了空气中NO 2的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中NO 2的浓度. 应用示例思路1例1 有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表: 摄氏温度/℃ -5 0 4 7 12 15 19 23 27 31 36 热饮杯数15615013212813011610489937654(1)画出散点图;(2)从散点图中发现气温与热饮销售杯数之间关系的一般规律; (3)求回归方程;(4)如果某天的气温是2 ℃,预测这天卖出的热饮杯数. 解:(1)散点图如下图所示:(2)从上图看到,各点散布在从左上角到右下角的区域里,因此,气温与热饮销售杯数之间呈负相关,即气温越高,卖出去的热饮杯数越少.(3)从散点图可以看出,这些点大致分布在一条直线的附近,因此,可用公式①求出回归方程的系数.利用计算器容易求得回归方程^y =-2.352x+147.767.(4)当x=2时,^y =143.063.因此,某天的气温为2 ℃时,这天大约可以卖出143杯热饮. 思考气温为2 ℃时,小卖部一定能够卖出143杯左右热饮吗?为什么? 这里的答案是小卖部不一定能够卖出143杯左右热饮,原因如下: 1.线性回归方程中的截距和斜率都是通过样本估计出来的,存在随机误差,这种误差可以导致预测结果的偏差.2.即使截距和斜率的估计没有误差,也不可能百分之百地保证对应于x 的预报值,能够与实际值y 很接近.我们不能保证点(x,y )落在回归直线上,甚至不能百分之百地保证它落在回归直线的附近,事实上,y=bx+a+e=^y +e.这里e 是随机变量,预报值^y 与实际值y 的接近程度由随机变量e 的标准差所决定.一些学生可能会提出问题:既然不一定能够卖出143杯左右热饮,那么为什么我们还以“这天大约可以卖出143杯热饮”作为结论呢?这是因为这个结论出现的可能性最大.具体地说,假如我们规定可以选择连续的3个非负整数作为可能的预测结果,则我们选择142,143和144能够保证预测成功(即实际卖出的杯数是这3个数之一)的概率最大. 例2 下表为某地近几年机动车辆数与交通事故数的统计资料. 机动车辆数x /千台 95 110 112 120 129 135 150180 交通事故数y /千件6.27.57.78.58.79.810.213(1)请判断机动车辆数与交通事故数之间是否有线性相关关系,如果不具有线性相关关系,说明理由;(2)如果具有线性相关关系,求出线性回归方程. 解:(1)在直角坐标系中画出数据的散点图,如下图.直观判断散点在一条直线附近,故具有线性相关关系. (2)计算相应的数据之和:∑=81i ix=1 031,∑=81i iy=71.6,∑=812i ix=137 835,∑=81i ii yx =9 611.7.将它们代入公式计算得b≈0.077 4,a=-1.024 1, 所以,所求线性回归方程为=0.077 4x-1.024 1.思路2例1 给出施化肥量对水稻产量影响的试验数据: 施化肥量x 15 20 25 30 35 40 45 水稻产量y330345365405445450455(1)画出上表的散点图; (2)求出回归直线的方程. 解:(1)散点图如下图.(2)表中的数据进行具体计算,列成以下表格:i 1 2 3 4 5 6 7 x i 15 20 25 30 35 40 45 y i 330 345 365 405 445 450 455 x i y i4 9506 9009 12512 15015 57518 00020 47587175,1132725,7000,3.399,3071712712=====∑∑∑===i i i i iiiy x y x y x故可得到 b=230770003.39930787175⨯-⨯⨯-≈4.75,a=399.3-4.75×30≈257.从而得回归直线方程是^y =4.75x+257.例2 一个车间为了规定工时定额,需要确定加工零件所花费的时间.为此进行了10次试验,测得数据如下: 零件个数x (个) 10 20 30 40 50 60 70 80 90 100 加工时间y (分)626875818995102108115122请判断y 与x 是否具有线性相关关系,如果y 与x 具有线性相关关系,求线性回归方程. 解:在直角坐标系中画出数据的散点图,如下图.直观判断散点在一条直线附近,故具有线性相关关系.由测得的数据表可知:∑===1012,7.91,55i ix y x =38 500,∑=1012i iy =87 777,∑=101i i i y x =55 950.b=2210121015510385007.915510559501010⨯-⨯⨯-=--∑∑==x x yx yx i i i ii≈0.668. a=x b y -=91.7-0.668×55≈54.96.因此,所求线性回归方程为^y =bx+a=0.668x+54.96. 例3 已知10条狗的血球体积及红血球数的测量值如下: 血球体积x(mL)45424648423558403950红血球数y(百万) 6.53 6.30 9.52 7.50 6.99 5.90 9.49 6.20 6.55 8.72 (1)画出上表的散点图; (2)求出回归直线的方程.解:(1)散点图如下.(2)101=x (45+42+46+48+42+35+58+40+39+50)=44.50, 101=y (6.53+6.30+9.52+7.50+6.99+5.90+9.49+6.20+6.55+8.72)=7.37. 设回归直线方程为^y =bx+a,则b=210121011010x x yx yx i ii ii --∑∑===0.175,a=x b y -=-0.418,所以所求回归直线的方程为^y =0.175x-0.148.点评:对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数a,b 的计算公式,算出a,b .由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误,求线性回归方程的步骤:计算平均数y x ,;计算x i 与y i 的积,求∑x i y i ;计算∑x i 2;将结果代入公式求b ;用a=x b y -求a ;写出回归直线方程. 知能训练1.下列两个变量之间的关系哪个不是函数关系( )A.角度和它的余弦值B.正方形边长和面积C.正n边形的边数和它的内角和D.人的年龄和身高 答案:D2.三点(3,10),(7,20),(11,24)的线性回归方程是( ) A.^y =5.75-1.75x B.^y =1.75+5.75x C.^y =1.75-5.75x D.^y =5.75+1.75x答案:D3.已知关于某设备的使用年限x 与所支出的维修费用y (万元),有如下统计资料: 使用年限x 2 3 4 5 6 维修费用y2.23.85.56.57.0设y 对x 呈线性相关关系.试求: (1)线性回归方程^y =bx+a 的回归系数a,b ; (2)估计使用年限为10年时,维修费用是多少? 答案:(1)b=1.23,a=0.08;(2)12.38.4.我们考虑两个表示变量x 与y 之间的关系的模型,δ为误差项,模型如下: 模型1:y=6+4x ;模型2:y=6+4x+e .(1)如果x=3,e=1,分别求两个模型中y 的值;(2)分别说明以上两个模型是确定性模型还是随机模型. 解:(1)模型1:y=6+4x=6+4×3=18; 模型2:y=6+4x+e=6+4×3+1=19.(2)模型1中相同的x 值一定得到相同的y 值,所以是确定性模型;模型2中相同的x 值,因δ的不同,所得y 值不一定相同,且δ为误差项是随机的,所以模型2是随机性模型. 5.以下是收集到的新房屋销售价格y 与房屋大小x 的数据: 房屋大小x (m 2) 80 105 110 115135 销售价格y (万元)18.42221.624.829.2(1)画出数据的散点图;(2)用最小二乘法估计求线性回归方程. 解:(1)散点图如下图.(2)n=5,∑=51i ix=545,x =109,∑=51i iy=116,y =23.2,∑=512i ix=60 952,∑=51i ii yx =12 952,b=2545609525116545129525-⨯⨯-⨯≈0.199,a=23.2-0.199×109≈1.509, 所以,线性回归方程为y=0.199x+1.509. 拓展提升某调查者从调查中获知某公司近年来科研费用支出(X i )与公司所获得利润(Y i )的统计资料如下表:科研费用支出(X i )与利润(Y i )统计表 单位:万元年份 科研费用支出利润 1998 1999 2000 2001 2002 2003 5 11 4 5 3 2 31 40 30 34 25 20 合计30180要求估计利润(Y i )对科研费用支出(X i )的线性回归模型.解:设线性回归模型直线方程为:i i X Y 1^0^^ββ+=,因为:630==∑nX x i=5,6180==∑nYY i=30, 根据资料列表计算如下表:年份 X i Y i X i Y i X i 2X i -X Y i -Y(X i -X )2(X i -X )(Y i -Y )1998 1999 2000 2001 2002 2003 5 11 4 5 3 2 31 40 30 34 25 20 155 440 120 170 75 40 25 121 16 25 9 4 0 6 -1 0 -2 -3 1 10 0 4 -5 -10 0 36 1 0 4 9 0 60 0 0 10 30 合计301801 00020050100现求解参数β0、β1的估计值: 方法一:3006009001200540060003020061803010006)(2221^=--=-⨯⨯-⨯=--=∑∑∑∑i i ii i X X n Y Y X n β=2, x Y 1^0^ββ-==30-2×5=20.方法二:501005620030561000)(2221^=⨯-⨯⨯-=--=∑∑x n X Y x n Y X ii i β=2, x Y 1^0^ββ-==30-2×5=20.方法三:50100)())((21^=---=∑∑x X Y Y x X ii iβ=2, x Y 1^0^ββ-==30-2×5=20.所以利润(Y i )对科研费用支出(X i )的线性回归模型直线方程为:i Y ^=20+2X i . 课堂小结1.求线性回归方程的步骤: (1)计算平均数y x ,; (2)计算x i 与y i 的积,求∑x i y i ;(3)计算∑x i 2,∑y i 2,11 (4)将上述有关结果代入公式⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=---=∑∑∑∑====x b y a x n x y x n y x x x y y x x b n i i n i i i n i i n i i i ,)())((1221121 求b,a,写出回归直线方程.2.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.作业习题2.3A 组3、4,B 组1、2.设计感想本节课在上节课的基础上,利用实例分析了散点图的分布规律,推导出了线性回归直线的方程的求法,并利用回归直线的方程估计可能的结果,本节课讲得较为详细,实例较多,便于同学们分析比较.思路1和思路2的例题对知识进行了巩固和加强,另外,本节课通过选取一些学生特别关心的身边事例,对学生进行思想情操教育、意志教育和增强学生的自信心,养成良好的学习态度,树立时间观,培养勤奋、刻苦的精神.。
线性相关中的巧思妙解线性相关题型在高考试题中具有计算复杂运算量大,但是有一定的灵活性、和技巧等特点,.一般情况下对本节知识的考察,多以选择题、填空题形式出现,但也不排除应用题的形式,比如2007年广东高考题就以大题的形式出现,所以对于这一部分内容要熟练灵活的掌握.例1. 已知x 与y 之间的一组数据:则y 与x 的线性回归方程为y=bx+a 必过( )A.(2,2)点B.(1.5,0)点C.(1,2)点D.(1.5,4)点基本解法: (1)设所求的直线方程为yˆ=bx +a ,其中a 、b 是待定系数。
(2)计算平均数x ,y ;(3)求a ,b ;(4)写出回归直线方程。
(5)验证A.B C D 那些点所求直线上.⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=---=∑∑∑∑====.,)())((1221121x b y a x n x y x n y x x x y y x x b n i i n i i i n i i n i i i 其中x =n 1∑=n i i x 1,y =n 1∑=n i i y1,a 为回归方程的斜率,b 为截距。
对于本题4,5.1==y x ,所以b =2,a=1, yˆ=2x +1,过(1.5,4)点,故选D 巧思:由于回归直线一定要过样本点的中心),(y x ,只需求出y x ,妙解:x =n 1∑=n i i x 1,y =n 1∑=n i i y14,5.1==y x 所以必过点),(y x 即点(1.5,4), 故选D.此法避免了求解回归方程的步骤,只需求出4,5.1==y x 即可.例2某地区某种病的发病人数呈上升趋势,统计近四年这种病的新发病的人数如下表所示:2003年底的四年里,该地区这种病的新发病人数总共多少?基本解法: 利用回归分析x 轴上表示年份,y 轴上表示新发病的人数,将表格中的四组数据描点.观察这些点的位置,它们的分布大致在一条直线附近,所以尝试用直线进行拟合.设回归直线方程为bx a y +=ˆ,则由相关数据计算得:5.199711==∑=n i i x n x ,25.254011==∑=ni i y n y ,7.94)(1221=--=∑∑==n i i n i i i x n xy x n y x b ,186623-=-=x b y a , 所以回归直线方程为x y7.94186623ˆ+-=,从而 ⨯+⨯-=7.944186623总y 11676)2003200220012000(≈+++(人),即为所求.巧思:由于求解先性回归方程时公式难记运算量又大,容易出错,我们还可以从新发病的增长率入手1996年到1997年新发病的增长率为 (2491-2400)/2400≈3.792%; 1997年到1998年新发病的增长率为 (2586-2491)/2491≈3.814%; 1998年到1999年新发病的增长率为 (2684-2586)/2586≈3.790%.由此可见,新发病的增长率基本一致,取其平均数为3.799%,以此作为以后新发病增长率的预测,妙解: 由上面的巧思中的分析可知,新发病的增长率基本一致,取其平均数为3.799%,以此作为以后新发病增长率的预测,即2684(1+3.799%)+2684(1+3.799%)2+2684(1+3.799%)3+2684(1+3.799%)4,不难算得约等于11795(人).。
2.3.2两个变量的线性相关教学目标:1.明确事物间的相互联系。
认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系,并利用散点图直观体会这种相关关系。
2.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程的系数公式建立线性回归方程.教学重点:1.利用散点图直观认识两个变量之间的线性关系.2.根据给出的线性回归方程的系数公式建立线性回归方程.教学难点:1.作散点图和理解两个变量的正相关和负相关。
2.理解最小二乘法的思想教学过程:一、复习准备:1. 人的身高和体重之间的关系?2. 学生设计一个统计问题,并指出问题涉及的总体是什么,所涉及的变量是什么.二、讲授新课:1. 教学散点图①出示例题:在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:图来进一步分析。
②散点图的概念:将各数据在平面直角坐标中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图。
(1.如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.2.如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系。
3. 如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系)③正相关与负相关概念:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关。
如果散点图中的点散布在从左上角到右下角的区域内,称为负相关。
(注:散点图的点如果几乎没有什么规则,则这两个变量之间不具有相关关系)④ 讨论:你能举出一些生活中的变量成正相关或负相关的例子吗?(比如高学历高收入现象)⑤练习:一个工厂为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次调查,收集数据如下:2. 指出是正相关还是负相关。
3. 关于加工零件的个数与加工时间,你能得出什么结论? ⑥ 小结:1.散点图的画法。
2.正相关与负相关的概念。
2.3.2 两个变量的线性相关一、教材与学情分析数学必修3(人教社A版)第二章《统计》是学生在高中学段首次学习基础统计知识、了解统计思想、认识统计方法。
虽然高中阶段的统计知识学习较为浅显,却有必要让学生在一开始的学习中形成正确的统计思想、理解统计原理过程以及掌握简单的统计方法,所以教材非常注重提供丰富的实际案例以及突出统计的操作过程。
这从第二章《统计》的教材编排可以清晰地看出,2.1随机抽样是向学生强调统计中数据的重要性与随机性,2.2用样本估计总体是让学生了解与掌握单变量样本的统计过程,2.3变量间的相关关系是进入统计中双变量统计方法的学习,而且每一节都附上大量典型的统计案例,大大增强了学生学习过程的实践性。
在本课时之前,学生已经在前面知识的学习中掌握了科学随机抽样的方法,理解了单变量样本数据的整理与分析,具备样本估计总体操作方法的有关知识,同时在2.3.1的学习中已经认识了两个变量的相关关系,这些均为本课时学习提供了坚实的奠基,为本课时的学习提供了极大的便利。
二、教学设计思想基于对学生已学统计知识的分析,本课时作为线性回归分析的第一课时,重在运用典型的实际统计案例,让学生在实践中学习、在问题式教学与讨论式活动中认识双变量的统计方法、了解最小二乘法的思想原理以及学习如何分析理解数据的预测,而关于回归方程的具体求解计算则留待下个课时学习。
本节课开头以学生们感兴趣的篮球比赛作为情境引入,抛出“如何根据乔丹祖孙四代的身高推出第五代的身高”的问题,活跃课堂气氛,激起学生学习新知识的兴趣。
再以“年龄与脂肪含量的关系”的问题作为本节课新内容学习的典型例子开始进行探讨学习。
通过教师引导、学生讨论回答、实践操作,逐步掌握线性回归方程的求解。
本节课有一个亮点是让学生在电脑上上课,亲自动手操作画出散点图、趋势线、算出回归方程以及根据方程预测数据,让学生体会现代信息技术对学习的帮助与快捷,掌握用现代信息技术学习两个变量的线性关系。
线性相关中的巧思妙解
线性相关题型在高考试题中具有计算复杂、运算量大,但是有一定的灵活性、和技巧等特点,.一般情况下对本节知识的考察,多以选择题、填空题形式出现,但也不排除应用题的形式,比如2007年广东高考题就以大题的形式出现,所以对于这一部分内容要熟练灵活的掌握.
例1. 已知x 与y 之间的一组数据:则y 与x 的线性回归方程为y=bx+a 必过( )
A.(2,2)点
B.(1.5,0)点
C.(1,2)点
D.(1.5,4)点
基本解法:(1)设所求的直线方程为y
ˆ=bx +a ,其中a 、b 是待定系数。
(2)计算平均数x ,y ; (3)求a ,b ;
(4)写出回归直线方程。
(5)验证A.B C D 那些点所求直线上.
⎪⎪
⎪
⎩⎪⎪⎪
⎨
⎧
-=--=---=∑
∑∑
∑====.
,
)())((1
2
2
1
12
1
x b y a x n x y
x n y
x x x y y x x b n
i i n
i i
i
n
i i n
i i i
其中x =
n
1
∑
=n
i i x 1
,y =
n
1
∑=n
i i
y
1
,a 为回归方程的斜率,b 为截距。
对于本题4,5.1==y x ,所以b =2,a=1, y
ˆ=2x +1,过(1.5,4)点,故选D 巧思:由于回归直线一定要过样本点的中心),(y x ,只需求出y x ,
妙解:x =
n
1
∑
=n
i i x 1
,y =
n
1
∑=n
i i
y
1
4,5.1==y x 所以必过点),(y x 即点(1.5,4),
故选D.此法避免了求解回归方程的步骤,只需求出4,5.1==y x 即可.
例2某地区某种病的发病人数呈上升趋势,统计近四年这种病的新发病的人数如下表所
示:
年底的四年里,该地区这种病的新发病人数总共多少?
基本解法: 利用回归分析
x 轴上表示年份,y 轴上表示新发病的人数,将表格中的四组数据描点.观察这些点的位置,它们的分布大致在一条直线附近,所以尝试用直线进行拟合.
设回归直线方程为bx a y
+=ˆ,则由相关数据计算得:5.199711
==∑=n
i i x n x ,25.254011
==∑=n
i i y n y ,7.94)(1
2
21=--=
∑∑==n
i i
n
i i
i
x n x
y
x n y
x b ,186623-=-=x b y a ,
所以回归直线方程为x y
7.94186623ˆ+-=,从而 ⨯+⨯-=7.944186623总y 11676)2003200220012000(≈+++(人),即为所求.
巧思:由于求解先性回归方程时公式难记运算量又大,容易出错,我们还可以从新发病的增长率入手
1996年到1997年新发病的增长率为 (2491-2400)/2400≈3.792%; 1997年到1998年新发病的增长率为 (2586-2491)/2491≈3.814%; 1998年到1999年新发病的增长率为 (2684-2586)/2586≈3.790%.
由此可见,新发病的增长率基本一致,取其平均数为3.799%,以此作为以后新发病增长率的预测,
妙解: 由上面的巧思中的分析可知,新发病的增长率基本一致,取其平均数为3.799%,以此作为以后新发病增长率的预测,
即2684(1+3.799%)+2684(1+3.799%)2+2684(1+3.799%)3+2684(1+3.799%)4,不难算得约等于11795(人).。