2.3.1 变量之间的相关关系 教案2
- 格式:doc
- 大小:233.50 KB
- 文档页数:14
2.3变量间地相关关系一、教材分析本节知识内容不多,但分析本节内容,至少有下列特点:1)知识地联系面广,应用性强,概念地真正理解有难度,教学既要承前启后,完成统计必修基础知识地构建;也要知道知识地来龙去脉,提升学生运用统计知识解决实际问题地能力,更要抓住本质,正确理解统计推断地结论.b5E2RGbCAP2)通过典型案例进行教学,使知识形成地过程中具有可操作性,易于创设问题情境,引导学生参与,而学生借助解决问题,通过自主思维活动,会产生感悟、发现,能提出问题,思考交流,不仅能正确、全面地理解基础知识和基本方法,而且能促进、发展学生地统计意识、统计思想.p1EanqFDPw二、教学目标1.通过收集现实问题中两个有关联变量地数据作出散点图,并利用散点图直观认识变量间地相关关系;2.知道最小二乘法地思想,能根据给出地线性回归方程系数公式建立线性回归方程.三、教学重点难点重点:作出散点图和根据给出地线性回归方程系数公式建立线性回归方程.难点:对最小二乘法地理解.四、学情分析本节是一种对样本数据地处理方法,但侧重地是由样本推断总体,其方法是学生初识地、知识地作用也是学生初见地.知识量并不大,但涉及地数学方法、数学思想较充分,同时,在教材中留有供发现地点,设有开放性问题,既具有体验数学方法、数学思想地功能,也具有培养学生从具体到抽象能力、锻炼创造性思维能力地作用.DXDiT a9E3d五、教学方法1.自主探究,互动学习2.学案导学:见后面地学案.3.新授课教学基本环节:预习检查、总结疑惑→情境导入、展示目标→合作探究、精讲点拨→反思总结、当堂检测→发导学案、布置预习RTCrpUDGiT六、课前准备1.学生地学习准备:预习课本,初步把握必须地定义.2.教师地教学准备:多媒体课件制作,课前预习学案,课内探究学案,课后延伸拓展学案.七、课时安排:1课时5PCzVD7HxA八、教学过程〖复习回顾〗标准差地公式为:______________________________________________________jLBHrnAILg〖创设情境〗1、函数是研究两个变量之间地依存关系地一种数量形式.对于两个变量,如果当一个变量地取值一定时,另一个变量地取值被惟一确定,则这两个变量之间地关系就是一个函数关系xHAQX74J0X2、在中学校园里,有这样一种说法:“如果你地数学成绩好,那么你地物理学习就不会有什么大问题.”按照这种说法,似乎学生地物理成绩与数学成绩之间存在着某种关系,我们把数学成绩和物理成绩看成是两个变量,那么这两个变量之间地关系是函数关系吗?LDAYtRyKfE3、“名师出高徒”可以解释为教师地水平越高,学生地水平就越高,那么学生地学业成绩与教师地教学水平之间地关系是函数关系吗?Zzz6ZB2Ltk〖新知探究〗思考:考察下列问题中两个变量之间地关系:(1)商品销售收入与广告支出经费;(2)粮食产量与施肥量;(3)人体内地脂肪含量与年龄.问题中两个变量之间地关系是函数关系吗?一、相关关系:自变量取值一定时,因变量地取值带有一定随机性地两个变量之间地关系,叫做相关关系.【说明】函数关系是一种非常确定地关系,而相关关系是一种非确定性关系.思考探究:1、有关法律规定,香烟盒上必须印上“吸烟有害健康”地警示语.吸烟是否一定会引起健康问题?你认为“健康问题不一定是由吸烟引起地,所以可以吸烟”地说法对吗?dvzfvkwMI12、某地区地环境条件适合天鹅栖息繁衍,有人经统计发现了一个有趣地现象,如果村庄附近栖息地天鹅多,那么这个村庄地婴儿出生率也高,天鹅少地地方婴儿出生率低,于是他得出了一个结论:天鹅能够带来孩子.你认为这样地结论可靠吗?如何证明这个问题地可靠性?rqyn14ZNXI分析:(1)吸烟只是影响健康地一个因素,对健康地影响还有其他地一些因素,两者之间非函数关系即非因果关系;EmxvxOtOco)不对,这也是相关关系而不是函数关系.上面提到了很多相关关系,那它们之间地相关关系强还是弱?我们下面来研究一下.二、散点图探究:在一次对人体脂肪含量和年龄关系地研究中,研究人员获得了一组样本数据:其年龄对应地脂肪数据是这个年龄人群脂肪含量地样本平均数.思考探究:1、对某一个人来说,他地体内脂肪含量不一定随年龄增长而增加或减少,但是如果把很多个体放在一起,就可能表现出一定地规律性.观察上表中地数据,大体上看,随着年龄地增加,人体脂肪含量怎样变化?SixE2yXPq52、为了确定年龄和人体脂肪含量之间地更明确地关系,我们需要对数据进行分析,通过作图可以对两个变量之间地关系有一个直观地印象.以x轴表示年龄,y轴表示脂肪含量,你能在直角坐标系中描出样本数据对应地图形吗?6ewMyirQFL表示具有相关关系地两个变量地一组数据图形称为散点图.3、观察人地年龄地与人体脂肪含量散点图地大致趋势,有什么样地特点?阅读课本P,这种相关85~86关系我们称为什么?还有没有其他地相关关系?它又有怎样地特点?kavU42VRUs三、线性相关、回归直线方程和最小二乘法在各种各样地散点图中,有些散点图中地点是杂乱分布地,有些散点图中地点地分布有一定地规律性,年龄和人体脂肪含量地样本数据地散点图中地点地分布有什么特点?y6v3ALoS89如果散点图中地点地分布,从整体上看大致在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做回归直线.M2ub6vSTnP我们所画地回归直线应该使散点图中地各点在整体上尽可能地与其接近.我们怎么来实现这一目地呢?说一说你地想法.0YujCfmUCw 设所求地直线方程为yˆ=bx +a ,其中a 、b 是待定系数. 则yˆi =bx i +a (i =1,2,…,n ).于是得到各个偏差 y i -yˆi =y i -(bx i +a )(i =1,2,…,n ) 显见,偏差y i -yˆi 地符号有正有负,若将它们相加会造成相互抵消,所以它们地和不能代表几个点与相应直线在整体上地接近程度,故采用n 个偏差地平方和eUts8ZQVRd Q =(y 1-bx 1-a )2+(y 2-bx 2-a )2+…+(y n -bx n -a )2表示n 个点与相应直线在整体上地接近程度. 记Q =∑=--ni i i a bx y 12)(这样,问题就归结为:当a 、b 取什么值时Q 最小,a 、b 地值由下面地公式给出:⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=---=∑∑∑∑====.,)())((1221121x b y a x n x yx n yx x x y y x x b ni i ni iini i ni i i其中x =n1∑=ni i x 1,y =n1∑=ni iy1,a 为回归方程地斜率,b 为截距.求回归直线,使得样本数据地点到它地距离地平方和最小地方法叫最小二乘法. 【例题精析】有一个同学家开了一个小卖部,他为了研究气温对热饮销售地影响,经过统计,得到一个卖出地饮料杯数与当天气温地对比表:sQsAEJkW5T(1)画出散点图;(2)从散点图中发现气温与热饮杯数之间关系地一般规律;(3)求回归方程;(4)如果某天地气温是2℃,预测这天卖出地热饮杯数.解:)当x=2时,y=143.063(四)反思总结,当堂检测.1、求样本数据地线性回归方程,可按下列步骤进行: (1)计算平均数x ,y ; (2)求a ,b ;(3)写出回归直线方程.2、回归方程被样本数据惟一确定,对同一个总体,不同地样本数据对应不同地回归直线,所以回归直线也具有随机性..GMsIasNXkA3、对于任意一组样本数据,利用上述公式都可以求得“回归方程”,如果这组数据不具线性相关关系,即不存在回归直线,那么所得地“回归方程”是没有实际意义地.因此,对一组样本数据,应先作散点图,在具有线性相关关系地前提下再求回归方程TIrRGchYzg 教师组织学生反思总结本节课地主要内容,并进行当堂检测.设计意图:引导学生构建知识网络并对所学内容进行简单地反馈纠正.(课堂实录) (五)发导学案、布置预习.完成本节地课后练习及课后延伸拓展作业.设计意图:布置下节课地预习作业,并对本节课巩固提高.教师课后及时批阅本节地延伸拓展训练. 九、板书设计十、教学反思本课地设计采用了课前下发预习学案,学生预习本节内容,找出自己迷惑地地方.课堂上师生主要解决重点、难点、疑点、考点、探究点以及学生学习过程中易忘、易混点等,最后进行当堂检测,课后进行延伸拓展,以达到提高课堂效率地目地.7EqZcWLZNX本节课学习了变量间地相互关系和两个变量地线性相关,以及最小二乘法和回归直线地定义,体会了用最小二乘法解决两个变量线性相关地方法,在解决问题中要熟练掌握求回归系数b、a地公式,精确计算.同时,要注意培养学生地观察分析两变量地关系和抽象概括地能力lzq7IGf02E在后面地教学过程中会继续研究本节课,争取设计地更科学,更有利于学生地学习,也希望大家提出宝贵意见,共同完善,共同进步!zvpgeqJ1hk2.3变量间相关关系课前预习学案一、预习目标1.通过收集现实问题中两个有关联变量地数据作出散点图,并利用散点图直观认识变量间地相关关系;2.知道最小二乘法地思想,能根据给出地线性回归方程系数公式建立线性回归方程.二、预习内容1.举例说明函数关系为什么是确定关系?2.一个人地身高与体重是函数关系吗?3.相关关系地概念:4.什么叫做散点图?5.回归分析,(1)求回归直线方程地思想方法;(2)回归直线方程地求法三、提出疑惑同学们,通过你地自主学习,你还有哪些疑惑,请把它填在下面地表格中课内探究学案一、学习目标1.通过收集现实问题中两个有关联变量地数据作出散点图,并利用散点图直观认识变量间地相关关系.2.经历用不同估算方法描述两个变量线性相关地过程,知道最小二乘法地思想,能根据给出地线性回归方程系数公式建立线性回归方程.NrpoJac3v1二、学习重难点:重点:作出散点图和根据给出地线性回归方程系数公式建立线性回归方程难点:对最小二乘法地理解.三、学习过程思考:考察下列问题中两个变量之间地关系:(1)商品销售收入与广告支出经费;(2)粮食产量与施肥量;(3)人体内地脂肪含量与年龄.这些问题中两个变量之间地关系是函数关系吗?(一)、相关关系:自变量取值一定时,因变量地取值带有一定随机性地两个变量之间地关系,叫做相关关系.【说明】函数关系是一种非常确定地关系,而相关关系是一种非确定性关系.思考探究:1、有关法律规定,香烟盒上必须印上“吸烟有害健康”地警示语.吸烟是否一定会引起健康问题?你认为“健康问题不一定是由吸烟引起地,所以可以吸烟”地说法对吗?1nowfTG4KI2、某地区地环境条件适合天鹅栖息繁衍,有人经统计发现了一个有趣地现象,如果村庄附近栖息地天鹅多,那么这个村庄地婴儿出生率也高,天鹅少地地方婴儿出生率低,于是他得出了一个结论:天鹅能够带来孩子.你认为这样地结论可靠吗?如何证明这个问题地可靠性?fjnFLDa5Zo(二)、散点图探究:在一次对人体脂肪含量和年龄关系地研究中,研究人员获得了一组样本数据:其中各年龄对应地脂肪数据是这个年龄人群脂肪含量地样本平均数.思考探究:1、对某一个人来说,他地体内脂肪含量不一定随年龄增长而增加或减少,但是如果把很多个体放在一起,就可能表现出一定地规律性.观察上表中地数据,大体上看,随着年龄地增加,人体脂肪含量怎样变化?tfnNhnE6e52、为了确定年龄和人体脂肪含量之间地更明确地关系,我们需要对数据进行分析,通过作图可以对两个变量之间地关系有一个直观地印象.以x轴表示年龄,y轴表示脂肪含量,你能在直角坐标系中描出样本数据对应地图形吗?HbmVN777sL3、观察人地年龄地与人体脂肪含量散点图地大致趋势,有什么样地特点?阅读课本P,这种相关关85~86系我们称为什么?还有没有其他地相关关系?它又有怎样地特点?V7l4jRB8Hs(三)、线性相关、回归直线方程和最小二乘法在各种各样地散点图中,有些散点图中地点是杂乱分布地,有些散点图中地点地分布有一定地规律性,年龄和人体脂肪含量地样本数据地散点图中地点地分布有什么特点?83lcPA59W9如果散点图中地点地分布,从整体上看大致在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做回归直线.mZkklkzaaP我们所画地回归直线应该使散点图中地各点在整体上尽可能地与其接近.我们怎么来实现这一目地呢?说一说你地想法.AVktR43bpw这样,问题就归结为:当a 、b 取什么值时Q 最小,a 、b 地值由下面地公式给出:⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=---=∑∑∑∑====.,)())((1221121x b y a x n x yx n yx x x y y x x b ni i ni iini i ni i i其中x =n1∑=ni i x 1,y =n1∑=ni iy1,a 为回归方程地斜率,b 为截距.求回归直线,使得样本数据地点到它地距离地平方和最小地方法叫最小二乘法. 【例题精析】【例1】下表是某小卖部6天卖出热茶地杯数与当天气温地对比表:(1)将上表中地数据制成散点图.(2)你能从散点图中发现温度与饮料杯数近似成什么关系吗?(3)如果近似成线性关系地话,请求出回归直线方程来近似地表示这种线性关系. (4)如果某天地气温是-5℃时,预测这天小卖部卖出热茶地杯数.(四)反思总结1、求样本数据地线性回归方程,可按下列步骤进行: (1)计算平均数x ,y ; (2)求a ,b ;(3)写出回归直线方程.2、回归方程被样本数据惟一确定,对同一个总体,不同地样本数据对应不同地回归直线,所以回归直线也具有随机性..ORjBnOwcEd3、对于任意一组样本数据,利用上述公式都可以求得“回归方程”,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得地“回归方程”是没有实际意义地.因此,对一组样本数据,应先作散点图,在具有线性相关关系地前提下再求回归方程.2MiJTy0dTT(五)当堂检测1.有关线性回归地说法,不正确地是A.相关关系地两个变量不是因果关系B.散点图能直观地反映数据地相关程度C.回归直线最能代表线性相关地两个变量之间地关系D.任一组数据都有回归方程2.下面哪些变量是相关关系A.出租车费与行驶地里程B.房屋面积与房屋价格C.身高与体重D.铁地大小与质量3.回归方程yˆ=1.5x-15,则A.y=1.5x-15B.15是回归系数aC.1.5是回归系数aD.x=10时,y=04.r是相关系数,则结论正确地个数为①r∈[-1,-0.75]时,两变量负相关很强②r∈[0.75,1]时,两变量正相关很强③r∈(-0.75,-0.3]或[0.3,0.75)时,两变量相关性一般④r=0.1时,两变量相关很弱A.1B.2C.3D.45.线性回归方程yˆ=bx+a过定点________.6.一家工厂为了对职工进行技能检查,对某位职工进行了10次实验,收集数据如下:(1)画出散点图;(2)求回归方程.参考答案:1. 答案:D解析:只有线性相关地数据才有回归直线.2.答案:C解析:A、B、D都是函数关系,其中A一般是分段函数,只有C是相关关系.3.答案:A解析:D中x=10时yˆ=0,而非y=0,系数a、b地意义要分清.4.答案:D解析:相关系数r地性质.5.答案:(x,y)解析:yˆ=bx+a,yˆ=bx+y-b x,(yˆ-y)=b(x-x)课后练习与提高1.下列两个变量之间地关系不具有线性关系地是()A.小麦产量与施肥值B.球地体积与表面积C.蛋鸭产蛋个数与饲养天数D.甘蔗地含糖量与生长期地日照天数2.下列变量之间是函数关系地是()A.已知二次函数2=++,其中a,c是已知常数,取b为自变量,因变量是这个函数地判别式:y ax bx c24∆=-b acB.光照时间和果树亩产量C.降雪量和交通事故发生率D.每亩施用肥料量和粮食亩产量3.下面现象间地关系属于线性相关关系地是()A.圆地周长和它地半径之间地关系B.价格不变条件下,商品销售额与销售量之间地关系C.家庭收入愈多,其消费支出也有增长地趋势D.正方形面积和它地边长之间地关系4.下列关系中是函数关系地是( ) A.球地半径长度和体积地关系 B.农作物收获和施肥量地关系 C.商品销售额和利润地关系 D.产品产量与单位成品成本地关系5.设有一个回归方程为ˆ2 1.5yx =-,则变量x 增加一个单位时( ) A.y 平均增加1.5单位 B.y 平均增加2单位 C.y 平均减少1.5单位 D.y 平均减少2单位6.工人月工资(x 元)与劳动生产率(x 千元)变化地回归直线方程为ˆ5080yx =+,下列判 断不正确地是( ) A .劳动生产率为1000元时,工资约为130元 B.劳动生产率提高1000元时,则工资平均提高80元 C.劳动生产率提高1000元时,则工资平均提高130元 D.当月工资为210元时,劳动生产率约为2000元7.某城市近10年居民地年收入x 与支出y 之间地关系大致符合0.80.1y x =+(单位:亿元),预计今年该城市居民年收入为15亿元,则年支出估计是.gIiSpiue7A8、在某种产品表面进行腐蚀线试验,得到腐蚀深度y 与腐蚀时间x 之间对应地一组数据:(1)画出散点图;(2)试求腐蚀深度y对时间t地回归直线方程.版权申明本文部分内容,包括文字、图片、以及设计等在网上搜集整理.版权为个人所有This article includes some parts, including text, pictures, and design. Copyright is personal ownership.uEh0U1Yfmh用户可将本文地内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律地规定,不得侵犯本网站及相关权利人地合法权利.除此以外,将本文任何内容或服务用于其他用途时,须征得本人及相关权利人地书面许可,并支付报酬.IAg9qLsgBXUsers may use the contents or services of this article for personal study, research or appreciation, and other non-commercial or non-profit purposes, but at the same time, they shall abide by the provisions of copyright law and other relevant laws, and shall not infringe upon the legitimate rights of this website and its relevant obligees. In addition, when any content or service of this article is used for other purposes, written permission and remuneration shall be obtained from the person concerned and the relevant obligee.WwghWvVhPE转载或引用本文内容必须是以新闻性或资料性公共免费信息为使用目地地合理、善意引用,不得对本文内容原意进行曲解、修改,并自负版权等法律责任.asfpsfpi4k Reproduction or quotation of the content of this article must be reasonable and good-faith citation for the use of news or informative public free information. It shall not misinterpret or modify the original intention of the content of this article, and shall bear legal liability such as copyright.ooeyYZTjj1。
2.3.1变量间的相关关系
【自主学习】1.什么叫散点图 2.三种关系:(1)。
如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关系,即(2)。
如果所有的样本点都落在某一函数曲线附近,,变量之间就有(3)。
如果所有的样本点都落在某一直线附近,变量之间就有 3.正、负相关的概念。
4.线性相关的概念:如果所有的样本点都落在,变量之间就有线性相关的关系。
【合作探究】
例1.5个学生的数学和物理成绩如下表:
画出散点图,并判断它们是否有相关关系
例2. 下表给出了某校12名高一学生的身高(单位:cm)和体重(单位:kg):
画出散点图,并观察它们是否有相关关系.练习:P74 练习
【课堂练习】
1,下列关系中,是带有随机性相关关系的是
①正方形的边长面积之间的关系;②水稻产量与施肥量之间的关系③人的身高与年龄之间的关系④降雪量与交通事故的发生率之间的关系。
2,下列关系不属于相关关系的是。
( B )
A.人的年龄和身高;
B.求的表面积与体积; C.家庭的收入与支出; D.人的年龄与体积。
3,下列两个变量之间的关系,不是函数关系的是。
( D )。
A,角度和它的余弦值; B.正方形的边长和面积;C.正n边形的边数和内角和;D.人的年龄和身高。
( D )
(2)(3)(4)
A:(1)(2)B:(1)(3)C:(2)(4)D:(2)(3)
5,变量与变量之间的关系有两类:一类是,另一类是。
课题:变量间的相关关系授课教师:杨扬教材:普通高中课程标准实验教科书数学必修3 人教B版从散点图中,可以更清楚地看出随着气温的升高,空调销量也有增加的趋势因此,要判断两变量是否有相关关系,我们可以借助——散点图与图表比较散点图有什么优点?——更直观,形象,容易得到相关信息教师用Ece演示散点图的操作过程3相关关系的分类:正相关,负相关练习:1下面是某小卖部9天卖出的热饮的杯数与当天天气温度的散点图,请判断两个变量是否具有相关关系?2请判断以下两个变量是否具有相关关系?其他学生在学案上完成发现两变量的变化趋势,类比函数的单调性引出相关关系的分类:正相关和负相关请画图的学生描述两变量的关系特征学生回答:是相关关系,负相关学生用已知的知识来研究未知的事物,并且渗透函数思想,为后面学习回归直线方程做铺垫联系函数的相关知识,体现了知识的迁移数学与计算机技术的融合,让学生体会现代信息技术的广有的同学可能有这样的疑问:我们为什么要学习相关关系呢?函数关系是一种理想的关系模型,而相关关系是更为一般的情况,因此研究相关关系可以处理更广泛的数学问题五、学生活动(一)给出本班10名学生期中考试的数学以及物理成绩,请对成绩进行分析:姓名数学物理夏晗77 80张铭梁74 73何颖媛69 73支张69 61薛闻达67 63拉巴雍措66 54李泽昂60 56孙雨59 48杜思旭55 37具浩宇48 281画出散点图,并判断是否具有相关关系?2通过分析,你能得到什么结论?学生回答:没有规律,是离散的点,不具有相关关系,学生活动5分钟,先独自完成散点图,再分析数据特征教师巡视,进行指导泛应用,同时为作业中用Ece拟合函数做基础深化概念,了解散点图可以判断相关关系的功能,并且从散点图上看出是正相关还是负相关,深刻体会到散点图的作用说明:“数理不分家”,它们之间的关系是正相关事实上,两个成绩都是随机变量1影响成绩的因素有哪些?2假如一名同学的数学成绩是70分,你能估测他的物理成绩吗?从趋势上看,可以估计是60分左右,但是不能确定,因为影响物理成绩的因素有很多从整体上看,散点图的形状接近什么函数?——一次函数,所以我们可以用一次函数来对散点图进行拟合定性分析——定量分析——进行预测(二)回到引例,气温升高空调销量上升,假如你是销售部经理,明天的气温是31℃,你该作何准备?看视频截取,卖场经理也在做预测如何画出这条直线?在画直线时,怎样能更贴近它的真实值是下节课的内容展示台展示学生作图,并提问学生回答问题1,是相关关系,是正相关提问成绩较好的同学,说出影响成绩的因素提问学生,关注学生的回答,进行分析解释截取视频中预测一让学生体会到数学的重要性,它是学好其他理科的必备工具并对学习方法进行总结,引导学生如何学好数学让学生体会到研究相关关系九、教学反思在前面的学习中,学生对统计学有了一定的认识和理解,在生活中统计学应用很广泛。
2.3 变量间的相关关系 2.3.1 变量之间的相关关系 2.3.2 两个变量的线性相关考点 学习目标核心素养 相关关系的概念理解两个变量的相关关系的概念 数学抽象 散点图 会作散点图,并利用散点图判断两个变量之间是否具有相关关系逻辑推理、数学建模回归直线方程会求回归直线方程数学运算问题导学(1)相关关系分为哪两种? (2)什么叫散点图?(3)什么叫回归直线?求回归直线的方法及步骤是什么?1.两个变量的线性相关(1)散点图:将样本中n 个数据点(x i ,y i )(i =1,2,…,n )描在平面直角坐标系中得到的图形.(2)正相关与负相关①正相关:散点图中的点散布在从左下角到右上角的区域; ②负相关:散点图中的点散布在从左上角到右下角的区域. 2.回归直线的方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归方程:回归直线对应的方程叫回归直线的方程,简称回归方程. (3)最小二乘法求回归直线方程y ^=b ^x +a ^时,使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.其中b ^是回归方程的斜率,a ^是回归方程在y 轴上的截距. ■名师点拨 (1)散点图的作用散点图形象地反映了各对数据的密切程度.根据散点图中点的分布趋势分析两个变量之间的关系,可直观地判断并得出结论.(2)回归直线的性质由a ^=y --b ^x -可知回归直线一定经过点(x -,y -),因此点(x -,y -)通常称为样本点的中心,其中,x -,y -分别是变量x 1,x 2,…,x n 和y 1,y 2,…,y n 的平均数.(3)线性相关关系强弱的定性分析线性相关关系的强弱体现在散点图中就是样本点越集中在某条直线附近,两变量的线性相关关系越强;样本点在某条直线附近越分散,两变量的线性相关关系越弱.判断正误(对的打“√”,错的打“×”) (1)线性回归方程必经过点(x -,y -).( )(2)对于方程y ^=b ^x +a ^,x 增加一个单位时,y 平均增加b ^个单位.( ) (3)样本数据中x =0时,可能有y =a ^.( ) (4)样本数据中x =0时,一定有y =a ^.( )解析:根据回归直线方程的意义知,(1)(2)都正确,而(3)(4)中,样本数据x =0时,y 的值可能为a ^,也可能不是a ^,故(3)正确.答案:(1)√ (2)√ (3)√ (4)×下列各图中所示的两个变量具有相关关系的是( )A .(1)(2)B .(1)(3)C .(2)(4)D .(2)(3)解析:选D.(1)为函数关系;(2)(3)为相关关系;(4)中,因为点分布得比较分散,两者之间无相关关系.5位学生的数学成绩和物理成绩如下表: 学科 A B C D E 数学 80 75 70 65 60 物理7066686462A .是函数关系B .是相关关系,但相关性很弱C .具有较好的相关关系,且是正相关D .具有较好的相关关系,且是负相关解析:选C.数学成绩x 和物理成绩y 的散点图如图所示.从图上可以看出数学成绩和物理成绩具有较好的相关关系,且成正相关. 设有一个回归方程为y ^=2-1.5x ,则变量x 每增加1个单位时,y 平均减少____________个单位.,解析:因为y ^=2-1.5x ,所以变量x 每增加1个单位时,y 1-y 2=[2-1.5(x +1)]-(2-1.5x )=-1.5,所以y 平均减少1.5个单位.答案:1.5相关关系的判断以下是在某地搜集到的不同楼盘新房屋的销售价格y(单位:万元)和房屋面积x(单位:m2)的数据:房屋面积x(m2)11511080135105销售价格y(万元)24.821.619.429.222(2)判断新房屋的销售价格和房屋面积之间是否具有相关关系?如果有相关关系,是正相关还是负相关?【解】(1)数据对应的散点图如图所示:(2)通过以上数据对应的散点图可以判断,新房屋的销售价格和房屋的面积之间具有相关关系,且是正相关.相关关系的判断方法(1)两个变量x和y具有相关关系的判断方法①散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断;②表格、关系式法:结合表格或关系式进行判断;③经验法:借助积累的经验进行分析判断.(2)判断两个变量x和y之间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.[易错警示]在解答本题过程中,易出现如下错误:虽然五点中有四点大致分布在一条直线附近,但第二个点离这条直线太远,所以两个变量不相关,导致错误的原因是没有看主流点,而过分关注了不影响大局的个别点.对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图如图所示.由这个散点图可以判断()A.变量x与y正相关B.变量x与y不相关C.变量x与y负相关D.变量x与y是函数关系解析:选C.由这个散点图可以判断,变量x与y负相关,故选C.线性回归方程的求法下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:x 345 6y 2.534 4.5 (2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y^=b^x+a^. 【解】(1)散点图如图.(2)x-=3+4+5+64=4.5,y-=2.5+3+4+4.54=3.5,∑i=14x i y i=3×2.5+4×3+5×4+6×4.5=66.5,∑i=14x2i=32+42+52+62=86,所以b ^=∑4i =1x i y i -4x -y-∑4i =1x 2i -4x-2=66.5-4×4.5×3.586-4×4.52=0.7, a ^=y --b ^x -=3.5-0.7×4.5=0.35. 所以所求的线性回归方程为y ^=0.7x +0.35.如果把例题中的y 的值2.5及4.5分别改为2和5,如何求回归直线方程? 解:散点坐标分别为(3,2),(4,3),(5,4),(6,5). 可验证这四点共线, 斜率k =3-24-3=1,所以直线方程为y -2=x -3, 即回归直线方程为y ^=x -1.求线性回归方程的步骤(1)计算平均数x -,y -.(5)用a ^=y --b ^x -,求a ^. (6)写出回归方程.某化工厂为预测某产品的回收率y ,需要研究它和原料有效成分含量x之间的相关关系,现取了8对观测值,计算得:则y 关于x 的回归直线方程是( )A.y ^=11.47+2.62x B.y ^=-11.47+2.62x C.y ^=2.62+11.47x D.y ^=11.47-2.62x解析:选A.利用题目中的已知条件可以求出x -=6.5,y -=28.5,然后利用回归直线方程的计算公式得b ^=∑8i =1x i y i -8x -y-∑8i =1x 2i -8x-2=1 849-8×6.5×28.5478-8×6.52≈2.62, a ^=y --b ^x -=11.47,因此回归直线方程为y ^=11.47+2.62x .线性回归方程的应用(2020·黑龙江省大庆铁人中学期末考试)某班主任为了对本班学生的月考成绩进行分析,从全班40名同学中随机抽取一个容量为6的样本进行分析.随机抽取6位同学的数学、物理分数对应如表:学生编号 1 2 3 4 5 6 数学分数x 60 70 80 85 90 95 物理分数y728088908595(1) (2)如果具有线性相关性,求出线性回归方程(系数精确到0.1);如果不具有线性相关性,请说明理由;(3)如果班里的某位同学数学成绩为50,请预测这位同学的物理成绩.【解】 (1)画出散点图:通过图象可以看出物理成绩y 与数学成绩x 之间具有线性相关性. (2)x -=16×(60+70+80+85+90+95)=80,y -=16×(72+80+88+90+85+95)=85,故b ^=0.6,a ^=37.故回归方程是y =0.6x +37. (3)当x =50时,解得y =67.故数学成绩为50,预测这位同学的物理成绩是67.利用线性回归方程解题的常见思路及注意点(1)利用回归直线过样本点的中心,可以求参数问题,参数可涉及回归方程或样本点数据.(2)利用回归方程中系数b ^的意义,分析实际问题.(3)利用回归直线进行预测,此时需关注两点:①所得的值只是一个估计值,不是精确值;②变量x 与y 成线性相关关系时,线性回归方程才有意义,否则即使求出线性回归方程也是毫无意义的,用其估计和预测的量也是不可信的.(2020·江西省临川第一中学期末考试)我国西部某贫困地区2011年至2017年农村居民家庭人均年收入y (千元)的数据如下表:年份 2011 2012 2013 2014 2015 2016 2017 年份代号x 1 2 3 4 5 6 7 人均年收入y2.93.33.64.44.85.25.9(2)利用(1)中的回归方程,预测该地区2019年农村居民家庭人均年收入将达到多少千元.解:(1)依题意x -=4,y -=4.3,从而b ^=0.5,a ^=y --b ^x -=4.3-0.5×4=2.3, 故所求线性回归方程为y ^=0.5x +2.3. (2)令x =9,得y ^=0.5×9+2.3=6.8.预测该地区在2019年农村居民家庭人均年收入为6.8千元.1.我们常说“吸烟有害健康”,吸烟与健康之间的关系是( ) A .正相关 B .负相关 C .无相关D .不确定解析:选B.烟吸得越多,则健康程度越差.2.关于回归直线方程y ^=a ^+b ^x 的叙述正确的是( ) ①反映y ^与x 之间的函数关系; ②反映y 与x 之间的函数关系; ③表示y ^与x 之间的不确定关系;④表示最接近y 与x 之间真实关系的一条直线. A .①② B .②③ C .③④ D .①④解析:选D.y ^=a ^+b ^x 表示y ^与x 之间的函数关系,而不是y 与x 之间的函数关系,它反映的关系最接近y 与x 之间的真实关系.故①④正确.3.在最小二乘法中,用来刻画各个样本点到直线y =a ^+b ^x 的“距离”的量是( ) A .|y i -y -| B .(y i -y -)2 C .|y i -(a ^+b ^x i )|D .[y i -(a ^+b ^x i )]2解析:选D.最小二乘法的定义明确给出,用[y i -(a ^+b ^x i )]2来刻画各个样本点与这条直线之间的“距离”(即二者之间的接近程度),用它们的和表示所有样本点与这条直线的接近程度.4.已知工厂加工零件的个数x 与花费时间y (h)之间的线性回归方程为y ^=0.01x +0.5,则加工200个零件大约需要________小时.解析:将200代入线性回归方程y ^=0.01x +0.5, 得y ^=2.5. 答案:2.5[A 基础达标]1.如图所示是具有相关关系的两个变量的一组数据的散点图,去掉哪个点后,两个变量的相关关系更明显( )A .DB .EC .FD .A解析:选C.A 、B 、C 、D 、E 五点分布在一条直线附近且贴近该直线,而F 点离得远,故去掉点F .2.(2020·江西省上饶市期末统考)某车间为了规定工时定额,需要确定加工零件所花费用的时间,为此进行了5次实验,根据收集到的数据(如下表),由最小二乘法求得回归直线方程为y ^=7.8x +40.2.零件数x (个) 1 23 4 5 加工时间y (min)50677179A .55B .55.8C .59D .51解析:选 D.设表中模糊的数据为m .由表中的数据可得x -=1+2+3+4+55=3,y -=50+m +67+71+795=267+m5,又由回归直线的方程为y ^=7.8x +40.2,所以267+m 5=7.8×3+40.2,解得m =51.即表中模糊的数据为51.故选D.3.已知变量x 和y 满足关系y =-0.1x +1,变量y 与z 正相关.下列结论中正确的是( ) A .x 与y 正相关,x 与z 负相关 B .x 与y 正相关,x 与z 正相关 C .x 与y 负相关,x 与z 负相关 D .x 与y 负相关,x 与z 正相关解析:选C.因为y =-0.1x +1的斜率小于0,故x 与y 负相关.因为y 与z 正相关,可设z =b ^y +a ^,b ^>0,则z =b ^y +a ^=-0.1b ^x +b ^+a ^,故x 与z 负相关.4.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归方程为y =b x +a .若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′ B.b ^>b ′,a ^<a ′ C.b ^<b ′,a ^>a ′D.b ^<b ′,a ^<a ′解析:选C.由两组数据(1,0)和(2,2)可求得直线方程为y =2x -2,从而b ′=2,a ′=-2.而利用线性回归方程的公式与已知表格中的数据,可求得b ^=∑6i =1x i y i -6x -·y-∑6i =1x 2i -6x-2=58-6×72×13691-6×⎝⎛⎭⎫722=57,a ^=y --b ^x -=136-57×72=-13,所以b ^<b ′,a ^>a ′. 5.(2020·广西钦州市期末考试)若回归直线y ^=b ^x +a ^的斜率估值为1.23,样本中心点为(4,5),当x =2时,估计y 的值为____________.解析:因为回归直线y ^=b ^x +a ^的斜率估值为1.23,所以b ^=1.23,y ^=1.23x +a ^. 因为样本中心点为(4,5),所以5=1.23×4+a ^,a ^=0.08,y ^=1.23x +0.08, 代入x =2,y =1.23×2+0.08=2.54. 答案:2.546.(2020·湖北省宜昌市葛洲坝中学期末考试)某公司借助手机微信平台推广自己的产品,对今年前5个月的微信推广费用x 与利润额y (单位:百万元)进行了初步统计,得到下列表格中的数据:x 2 4 5 6 8 y304060p70经计算,月微信推广费用x 与月利润额y 满足线性回归方程y ^=6.5x +17.5,则p 的值为____________.解析:由题中数据可得x -=2+4+5+6+85=5,y -=30+40+60+p +705=200+p5.由线性回归方程y ^=6.5x +17.5经过样本中心(x -,y -), 有200+p 5=6.5×5+17.5,解得p =50.答案:507.对某台机器购置后的运营年限x (x =1,2,3,…)与当年利润y 的统计分析知具备线性相关关系,线性回归方程为y ^=10.47-1.3x ,估计该台机器使用________年最合算.解析:只要预计利润不为负数,使用该机器就算合算,即y ^≥0,所以10.47-1.3x ≥0,解得x ≤8.05,所以该台机器使用8年最合算.答案:88.(2020·湖南省张家界市期末联考)为了解某地区某种农产品的年产量x (单位:吨)对价格y (单位:千元/吨)的影响,对近五年该农产品的年产量和价格统计如表:x 1 2 3 4 5 y86542(1)求x -,y -;(2)求y 关于x 的线性回归方程y ^=b ^x +a ^; (3)若年产量为4.5吨,试预测该农产品的价格.解:(1)计算可得x -=1+2+3+4+55=3,y -=8+6+5+4+25=5.(2)b ^=∑5i =1x i y i -5x -y-∑5i =1x 2i -5x-2=61-5×3×555-5×32=-1.4, 因为线性回归直线过(x -,y -),则a ^=y --b ^x -=5-(-1.4×3)=9.2, 故y 关于x 的线性回归方程是y ^=-1.4x +9.2. (3)当x =4.5时,y ^=-1.4×4.5+9.2=2.9(千元/吨).9.(2020·河北省石家庄市期末考试)在一段时间内,分5次测得某种商品的价格x (万元)和需求量y (吨)之间的一组数据为(1)根据上表数据,求出回归直线方程y =b x +a ;(2)试根据(1)中求出的回归方程预估当价格为1.9万元时,需求量大约是多少吨?(参考公式:b ^=∑ni =1(x i -x -)(y i -y -)∑ni =1(x i -x -)2=∑ni =1x i y i -n x -y -∑n i =1x 2i -n (x )-2,a ^=y --b ^x -)解:(1)因为x -=15×9=1.8,y -=15×37=7.4,∑i =15 x i y i =62,∑i =15x 2i =16.6,所以 b ^=∑5i =1x i y i -5x -y-∑5i =1x 2i -5(x )-2=62-5×1.8×7.416.6-5×1.82=-11.5, a ^=y --b ^x -=7.4+11.5×1.8=28.1, 故y 对x 的线性回归方程为y ^=28.1-11.5x . (2)y =28.1-11.5×1.9=6.25(吨).所以如果价格为1.9万元,则需求量大约是6.25吨.[B 能力提升]10.对两个变量的四组数据进行统计,获得以下散点图,关于两个变量相关系数的比较,正确的是( )A .r 2<r 4<0<r 3<r 1B .r 4<r 2<0<r 1<r 3C .r 4<r 2<0<r 3<r 1D .r 2<r 4<0<r 1<r 3解析:选A.由相关系数的定义以及散点图的含义,可知r 2<r 4<0<r 3<r 1.11.期中考试后,某校高三(9)班班主任对全班65名学生的成绩(单位:分)进行分析,得到数学成绩y 关于总成绩x 的回归直线方程为y ^=6+0.4x .由此可以估计:若2名同学的总成绩相差50分,则他们的数学成绩大约相差________分.解析:设两名同学的总成绩分别为x 1,x 2,则对应的数学成绩估计为y ^1=6+0.4x 1,y ^2=6+0.4x 2,所以|y ^1-y ^2|=|0.4(x 1-x 2)|=0.4×50=20.答案:2012.(2020·湖北省宜昌县域高中协同发展共同体期末考试)为研究冬季昼夜温差大小对某反季节大豆新品种发芽率的影响,某校课外兴趣小组记录了5组昼夜温差与100颗种子发芽数,得到如下资料:组号 1 2 3 4 5 温差x (℃) 10 11 13 12 8 发芽数y (颗)2325302616组数据中选取3组数据求出线性回归方程,再用没选取的2组数据进行检验.(1)若选取的是第2,3,4组的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^; (2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?(参考公式:b ^=∑ni =1(x i -x -)(y i -y -)∑ni =1 (x i -x -)2=∑ni =1x i y i -n x -y -∑n i =1x 2i -n x-2,a ^=y --b ^x -)解:(1)由题意:x -=11+13+123=12,y -=25+30+263=27,b ^=∑3i =1 (x i -x -)(y i -y -)∑3i =1 (x i -x -)2=(x 1-x -)(y 1-y -)+(x 2-x -)(y 2-y -)+(x 3-x -)(y 3-y -)(x 1-x -)2+(x 2-x -)2+(x 3-x -)2=(11-12)×(25-27)+(13-12)×(30-27)+(12-12)×(26-27)(11-12)2+(13-12)2+(12-12)2=52, a ^=y --b ^x -=27-52×12=-3,故回归直线方程为y ^=52x -3.(2)当x =10时,y =52×10-3=22,|22-23|=1<2,当x =8时,y =52×8-3=17,|17-16|=1<2,所以(1)中所得的回归直线方程是可靠的.13.(选做题)(2019·黑龙江省牡丹江市第一高级中学期末考试)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响,对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中w i=xi,w-=18i=18w i.(1)根据散点图判断,y=a+bx与y=c+d x哪一个适宜作为年销售量y关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x、y的关系为z=0.2y-x.根据(2)的结果回答下列问题:(ⅰ)年宣传费x=49时,年销售量及年利润的预报值是多少?(ⅱ)年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(u n,v n),其回归线v=α+βu的斜率和截距的最小二乘估计分别为解:(1)由散点图可以判断,y=c+d x适宜作为年销售量y关于年宣传费x的回归方程类型.(2)令w=x,先建立y关于w的线性回归方程.由于d=108.81.6=68,c^=y--d^w-=563-68×6.8=100.6,所以y关于w的线性回归方程为y^=100.6+68w,因此y关于x的回归方程为y^=100.6+68x.(3)(ⅰ)由(2)知,当x=49时,年销售量y的预报值y^=100.6+6849=576.6,年利润z的预报值z^=576.6×0.2-49=66.32.(ⅱ)根据(2)的结果知,年利润z的预报值z^=0.2(100.6+68x)-x=-x+13.6x+20.12.所以当x=13.62=6.8,即x=46.24时,z^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.。
变量之间的相关关系教学设计第一篇:变量之间的相关关系教学设计变量间的相关关系教学设计教学目标:(一)知识技能:(1)散点图的概念及画法(2)利用最小二乘法求回归方程(3)会用散点图及回归方程判断相关关系(二)过程与方法1.通过自主探究,体会数形结合、类比的数学思想方法。
2.通过动手操作培养学生观察、分析、比较和归纳能力,引出利用计算机等现代化教学工具的必要性。
(三)情感、态度、价值观类比函数的表示方法,使学生理解变量间的相关关系,增强对实际问题进行分析和预测的意识。
利用合作交流激发学生的学习兴趣。
教学重点:利用散点图直观认识两个变量之间的相关关系及求回归直线方程。
教学难点:建立回归思想,理解回归直线。
教学方法: 教师启发、问题探究、合作学习教学过程:(一)创设情境,导入新课西方流传的一首民谣:丢失一个钉子,坏了一只蹄铁;坏了一只蹄铁,折了一匹战马;折了一匹战马,伤了一位骑士;伤了一位骑士,输了一场战斗;输了一场战斗,亡了一个帝国.(二)初步探索,直观感知探究一: 两个变量间的相关关系问题1、有些老师常说:“如果你的数学成绩好,那么你的物理学习就不会有什么问题。
”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着某种关系,你如何认识他们之间存在的关系?探究二:散点图问题2、在一次对人体脂肪含量和年龄的关系的研究中,研究人员获得了一组样本数据:年龄脂肪年龄脂肪 23 9.5 53 29.6 17.8 54 30.221.2 56 31.425.9 57 30.827.5 58 33.526.3 60 35.228.2 61 34.6 脂肪含量4035302520******年龄问题3、观察上面的散点图,你能发现这些点具有什么样的特征?如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系, 这条直线叫做回归直线。
探究三:用最小二乘法求回归方程;探究四:线性相关、正相关、负相关(1)散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关。
新课导入1. 用样本的数字特征估计总体的数字特征分两类:(1)用样本平均数估计总体平均数.(2)用样本标准差估计总体标准差.样本容量越大,估计就越精确.2. 平均数对数据有“取齐”的作用,代表一组数据的平均水平.3. 标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度.理解两个变量之间的相关关系.知识与技能教学目标过程与方法在解决统计问题的过程中,逐步体会用变量间相关关系,理解数形结合的数学思想和逻辑推理的数学方法.情感态度与价值观会用变量之间的相关关系解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系.教学重难点重点1. 利用是哪点图直观认识两个变量之间的线性关系;2. 两个变量之间相关关系的理解.难点回归思想的建立;对回归直线与观测数据的关系的理解.在学校里,老师经常对学生说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系.这种说法有没有根据?物理成绩和数学成绩是两个变量,从经验看,由于物理成绩学习要用到较多的数学知识和数学方法,数学成绩的好坏影响着物理成绩的高低,即一个人的物理成绩与数学成绩有一定的关系.数学成绩物理成绩但是除此之外,还存在着其他影响物理成绩的因素,如学习物理的兴趣,用在物理学习上的时间等.数学成绩物理成绩学习兴趣学习时间其他因素知识要点相互关系两个变量之间的关系,可能是确定关系或非确定关系.当自变量却只一定,因变量的取值带有一定随机性时,两个变量之间的关系成为相关关系.相关关系是一种不确定性关系.根据上述数据,人体的脂肪含量和年龄之间有怎样的关系?知识要点散点图表示具有相关关系的两个变量的一组数据的图形,叫做散点图.散点图的画法(1)进入Excel,在A1,B1分别输入“数学成绩”、“物理成绩”,在A、B列输入相应的数据. (2)点击图表向导图标,进入对话框,选择“标准类型”中的“XY散点图”,单击“完成”.(3)选中“数值X轴”,单击右键选中“坐标轴格式”中的“刻度”,把“最小值”、“最大值”、“刻度主要单位”作相应调整,最后按“确定”.y轴方法相同.20 25 30 35 40 45 50 55 60 65 年龄 脂肪含量0 510152025303540课堂小结1. 变量之间的相互关系两个变量之间的关系,可能是确定关系或非确定关系.当自变量却只一定,因变量的取值带有一定随机性时,两个变量之间的关系成为相关关系.相关关系是一种不确定性关系.2. 散点图表示具有相关关系的两个变量的一组数据的图形,叫做散点图.高考链接1(2008上海)由施肥量x与水稻产量y试验数据的关系,画出散点图,并指明相关性解析:散点图为通过图象可知是正相关.1. 球的体积和球的半径具有( )A. 函数关系B. 相关关系C. 不确定关系D. 无任何关系2. 下列两个变量之间的关系不是函数关系的是( )A.角的度数和正弦值B. 速度一定时,距离和时间的关系C. 正方体的棱长和体积D. 日照时间和水稻的亩产量A D 随堂练习。
2020年高中数学必修三第二章《统计》2.3.1变量之间的相关关系2.3.2两个变量的线性相关学习目标 1.了解变量间的相关关系,会画散点图;2.根据散点图,能判断两个变量是否具有相关关系;3.了解线性回归思想,会求回归直线的方程.知识点一变量间的相关关系思考1粮食产量与施肥量间的相关关系是正相关还是负相关?答案在施肥不过量的情况下,施肥越多,粮食产量越高,所以是正相关.思考2怎样判断一组数据是否具有线性相关关系?答案画出散点图,若点大致分布在一条直线附近,就说明这两个变量具有线性相关关系,否则不具有线性相关关系.梳理1.相关关系的定义变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,那么这两个变量之间的关系叫做相关关系,两个变量之间的关系分为函数关系和相关关系.2.散点图将样本中n个数据点(x i,y i)(i=1,2,…,n)描在平面直角坐标系中得到的图形叫做散点图.3.正相关与负相关(1)正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.知识点二两个变量的线性相关思考任何一组数据都可以由最小二乘法得出线性回归方程吗?答案用最小二乘法求线性回归方程的前提是先判断所给数据是否具有线性相关关系(可利用散点图来判断),否则求出的线性回归方程是无意义的.梳理 回归直线的方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)线性回归方程:回归直线对应的方程叫做回归直线的方程,简称回归方程. (3)最小二乘法:求线性回归方程y ^=b ^x +a ^时,使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.⎩⎪⎨⎪⎧b ^=∑i =1n(x i-x )(y i-y )∑i =1n(x i-x )2=∑i =1nx i y i-n x y ∑i =1nx 2i-n x 2,a ^=y -b ^x ,其中,b ^是线性回归方程的斜率,a ^是线性回归方程在y 轴上的截距.类型一 相关关系的判断与应用 命题角度1 判断两个变量的相关性例1 为了研究质量对弹簧长度的影响,对6根相同的弹簧进行测量,所得数据如下:判断它们是否有相关关系,若有,判断是正相关还是负相关. 解 散点图如图:由散点图可以看出两个变量对应的点大致分布在一条直线附近,因此可以得出结论:质量与弹簧长度这两个变量具有相关关系,且它们是正相关关系.反思与感悟在研究两个变量之间是否存在某种关系时,必须从散点图入手,对于散点图,可以作出如下判断:(1)如果所有的样本点都落在某一函数曲线上,那么就用该函数来描述变量之间的关系,即变量之间具有函数关系;(2)如果所有的样本点都落在某一直线附近,那么变量之间就有线性相关关系;(3)如果散点图中的点的分布几乎没有什么规律,那么这两个变量之间不具有相关关系,即两个变量之间是相互独立的.跟踪训练1下表是某地的年降雨量与年平均气温的统计表,判断两者是否具有相关关系,求线性回归方程有意义吗?解以x轴为年平均气温,y轴为年降雨量,可得相应的散点图如图.因为图中各点并不在一条直线的附近,所以两者不具有线性相关关系,没必要用回归直线进行拟合,即使用公式法求出线性回归方程也是没有意义的.命题角度2函数关系与相关关系的区别与联系例2下列关系中,是相关关系的是________.①正方形的边长与面积之间的关系;②农作物的产量与施肥量之间的关系;③人的身高与年龄之间的关系;④降雪量与交通事故的发生率之间的关系.答案②④解析①中,正方形的边长与面积之间的关系是函数关系;②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;③中,人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人达到一定年龄后,身高就不发生明显变化了,所以它们不具有相关关系;④中,降雪量与交通事故的发生率之间具有相关关系. 反思与感悟 相关关系与函数关系的区别与联系如表所示:跟踪训练2 下列图形中两个变量具有相关关系的是( )答案 C解析A 是一种函数关系;B 也是一种函数关系;C 中从散点图中可看出所有点看上去都在某条直线附近波动,具有相关关系,而且是一种线性相关;D 中所有的点在散点图中没有显示任何关系,因此变量间是不相关的. 类型二 回归直线的求解与应用例3 一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器运转速度的变化而变化,下表为抽样试验的结果:(1)画出散点图;(2)如果y 对x 有线性相关关系,请画出一条直线近似地表示这种线性关系;(3)在实际生产中,若它们的近似方程为y =5170x -67,允许每小时生产的产品中有缺点的零件最多为10件,那么机器的运转速度应控制在什么范围内? 解 (1)散点图如图所示:(2)近似直线如图所示:(3)由y ≤10得5170x -67≤10,解得x ≤14.9,所以机器的运转速度应控制在14转/秒内.引申探究1.本例(3)中近似方程不变,若每增加一个单位的转速,生产有缺点的零件数近似增加多少? 解 因为y =5170x -67,所以当x 增加一个单位时,y 大约增加5170.2.本例(3)中近似方程不变,每小时生产有缺点的零件件数是7,估计机器的转速. 解 因为y =5170x -67,所以当y =7时,7=5170x -67,解得x ≈11.反思与感悟 求线性回归方程的一般步骤(1)收集样本数据,设为(x i ,y i )(i =1,2,…,n )(数据一般由题目给出). (2)作出散点图,确定x ,y 具有线性相关关系. (3)把数据制成表格x i ,y i ,x 2i ,x i y i . (4)计算x ,y,∑i =1nx 2i ,∑i =1nx i y i .(5)代入公式计算b ^,a ^,公式为⎩⎪⎨⎪⎧b ^=∑i =1nx i y i-n x y ∑i =1nx 2i-n x2,a ^=y -b ^x .(6)写出线性回归方程y ^=b ^x +a ^.跟踪训练3 (1)变量y 与x 满足线性回归方程y ^=b ^x +a ^,现在将y 的单位由厘米变为米,x的单位由毫米变为米,则在新的线性回归方程y ^=b ^*x +a ^*中,b ^*是b ^的____________倍.(2)为了均衡教育资源,加大对偏远地区的教育投入,调查了某地区若干户家庭的年收入x (单位:万元)和年教育支出y (单位:万元),调查显示年收入x 与年教育支出y 具有相关关系,并由调查数据得到y 对x 的线性回归方程为y ^=0.15x +0.2.由线性回归方程可知,家庭年收入每增加1万元,年教育支出平均增加________万元. 答案 (1)10 (2)0.15解析 (1)由回归系数公式知,当y 的值变为原来的10-2倍,x 的值变为原来的10-3倍时,b^*的值应为原来的10倍.(2)回归直线的斜率为0.15,所以家庭年收入每增加1万元,年教育支出平均增加0.15万元.1.设有一个线性回归方程为y ^=2-1.5x ,则变量x 增加1个单位时,y 平均( ) A .增加1.5个单位 B .增加2个单位 C .减少1.5个单位 D .减少2个单位答案 C2.由三点(3,10),(7,20),(11,24)确定的线性回归方程为( ) A.y ^=1.75x -5.75 B.y ^=1.75x +5.75 C.y ^=-1.75x +5.75 D.y ^=-1.75x -5.75答案 B解析 设线性回归方程为y ^=b ^x +a ^, 则b ^=x 1y 1+x 2y 2+x 3y 3-3x y x 21+x 22+x 23-3x2=3×10+7×20+11×24-3×7×189+49+121-3×49=1.75,a ^=y -b ^x =18-1.75×7=5.75. 故y ^=1.75x +5.75,故选B.3.某地区近10年居民的年收入x 与年支出y 之间的关系大致符合y ^=0.8x +0.1(单位:亿元),预计今年该地区居民收入为15亿元,则今年支出估计是________亿元. 答案 12.1解析 将x =15代入y ^=0.8x +0.1,得y ^=12.1.4.某市居民2012~2016年家庭年平均收入x (单位:万元)与年平均支出y (单位:万元)的统计资料如表所示:根据统计资料,居民家庭年平均收入的中位数是__________万元,家庭年平均收入与年平均支出有________线性相关关系. 答案 13 正解析 考查中位数的定义,奇数个时按大小顺序排列后中间一个是中位数,而偶数个时需取中间两数的平均数.由统计资料可以看出,当年平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系.5.某5名学生的总成绩和数学成绩(单位:分)如表所示:(1)画出散点图;(2)求y 对x 的线性回归方程(结果保留到小数点后3位数字); (3)如果一个学生的总成绩为450分,试预测这个学生的数学成绩. 解 (1)散点图如图所示:(2)由题中数据计算可得x =391.6,y =67.8,∑i =15x 2i =770 654,∑i =15x i y i =133 548.代入公式得b ^=133 548-5×391.6×67.8770 654-5×391.62≈0.204,a ^=67.8-0.204×391.6≈-12.086,所以y 对x 的线性回归方程为y ^=-12.086+0.204x .(3)由(2)得当总成绩为450分时,y ^=-12.086+0.204×450≈80,即这个学生的数学成绩大约为80分.1.判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图.根据散点图,可以很容易看出两个变量是否具有相关关系,是不是线性相关,是正相关还是负相关. 2.求线性回归方程时应注意的问题(1)知道x 与y 成线性相关关系,无需进行相关性检验,否则应首先进行相关性检验,如果两个变量之间本身不具有相关关系,或者说,它们之间的相关关系不显著,即使求出线性回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的. (2)用公式计算a ^、b ^的值时,要先计算b ^,然后才能算出a ^.3.利用回归方程,我们可以进行估计和预测.若回归方程为y ^=b ^x +a ^,则x =x 0处的估计值为y ^0=b ^x 0+a ^.40分钟课时作业一、选择题1.某商品销售量y (件)与销售价格x (元/件)负相关,则其线性回归方程可能是( ) A.y ^=-10x +200 B.y ^=10x +200 C.y ^=-10x -200 D.y ^=10x -200答案 A解析 x 的系数为负数,表示负相关,排除B 、D ,由实际意义可知x >0,y >0,C 中,散点图在第四象限无意义,故选A.2.根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )A .逐年比较,2008年减少二氧化硫排放量的效果最显著B .2007年我国治理二氧化硫排放显现成效C .2006年以来我国二氧化硫年排放量呈减少趋势D .2006年以来我国二氧化硫年排放量与年份正相关 答案 D解析 由柱形图可知:A 、B 、C 均正确,2006年以来我国二氧化硫年排放量在逐渐减少,所以排放量与年份负相关,所以D 不正确.3.对变量x ,y 有观测数据(x i ,y i )(i =1,2,3,…,10),得散点图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,3,…,10),得散点图2,由这两个散点图可以判断( )A .y 与x 正相关,v 与u 正相关B .y 与x 正相关,v 与u 负相关C .y 与x 负相关,v 与u 正相关D .y 与x 负相关,v 与u 负相关 答案 C解析 根据散点图直接进行判断.4.已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( ) A.y ^=0.4x +2.3 B.y ^=2x -2.4 C.y ^=-2x +9.5 D.y ^=-0.3x +4.4答案 A解析 由变量x 与y 正相关知C 、D 均错,又回归直线经过样本点的中心(3,3.5),代入验证得A 正确,B 错误.故选A. 5.已知x 与y 之间的一组数据:若y 与x 线性相关,则y 与x 的回归直线y ^=b ^x +a ^必过( ) A .点(2,2) B .点(1.5,0) C .点(1,2) D .点(1.5,4)答案 D 解析 ∵x =0+1+2+34=1.5,y =1+3+5+74=4, ∴回归直线必过点(1.5,4).故选D. 6.已知x ,y 的取值如表所示:如果y 与x 线性相关,且线性回归方程为y ^=b ^x +132,则b ^等于( )A .-12B.12 C .-110D.110答案 A 解析 ∵x =2+3+43=3,y =6+4+53=5, ∴回归直线过点(3,5),∴5=3b ^+132,∴b ^=-12,故选A.二、填空题7.为了研究某种细菌在特定环境下随时间变化的繁殖规律,得到了下表中的数据,计算得回归方程为y ^=0.85x -0.25.由以上信息,可得表中c 的值为________.答案 6解析 x =3+4+5+6+75=5,y =2.5+3+4+4.5+c 5=14+c 5,代入回归方程中得14+c5=0.85×5-0.25,解得c =6.8.如图所示的五组数据(x ,y )中,去掉________后,剩下的四组数据相关性增强.答案 (4,10)解析 去掉点(4,10)后,其余四点大致在一条直线附近,相关性增强. 9.在一次试验中测得(x ,y )的四组数据如下:根据上表可得线性回归方程y ^=-5x +a ^,据此模型预报当x =20时,y 的值为________. 答案 26.5解析 x =16+17+18+194=17.5,y =50+34+41+314=39,∴回归直线过点(17.5,39), ∴39=-5×17.5+a ^, ∴a ^=126.5,∴当x =20时,y =-5×20+126.5=26.5.10.某工厂对某产品的产量与成本的资料分析后有如下数据:由表中数据得到的线性回归方程y ^=b ^x +a ^中b ^=1.1,预测当产量为9千件时,成本约为________万元. 答案 14.5解析 由表中数据得x =4,y =9,代入线性回归方程得a ^=4.6,∴当x =9时,y ^=1.1×9+4.6=14.5. 三、解答题11.某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)利用所给数据求两变量之间的回归方程y ^=b ^x +a ^;(2)利用(1)中所求出的回归方程预测该地第6年的粮食需求量. 解 (1)由所给数据得 x =3,y =5.8,b ^=∑i =15(x i -x )(y i -y )∑i =15(x i -x )2=1.1,a ^=y -b ^x =2.5, ∴y ^=1.1x +2.5.故所求的回归方程为y ^=1.1x +2.5. (2)第6年的粮食需求量约为 y ^=1.1×6+2.5=9.1(万吨).12.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =110x 2i =720.(1)求月储蓄y (千元)关于月收入x (千元)的线性回归方程; (2)若该居民区某家庭的月收入为7千元,预测该家庭的月储蓄. 解 (1)由题意知n =10,x =1n ∑i =110x i =110×80=8,y =1n ∑i =110y i =110×20=2,又∑i =110x 2i -n x 2=720-10×82=80, ∑i =110x i y i -n x y =184-10×8×2=24,由此得b ^=2480=0.3,a ^=y -b ^x =2-0.3×8=-0.4, 故所求线性回归方程为y ^=0.3x -0.4.(2)将x =7代入线性回归方程,可以得到该家庭的月储蓄约为y ^=0.3×7-0.4=1.7(千元). 13.为了分析某高三学生的学习状态,对其下一阶段的学习提供指导性建议,现对他前7次考试的数学成绩x 、物理成绩y 进行分析.下面是该生7次考试的成绩(单位:分).(1)他的数学成绩与物理成绩哪个更稳定?并说明理由;(2)已知该学生的物理成绩y 与数学成绩x 是线性相关的,若该生的物理成绩达到115分,请你估计他的数学成绩大约是多少分,并请你根据物理成绩与数学成绩的相关性,给出该生在学习数学、物理上的合理建议.解 (1)x =100+-12-17+17-8+8+127=100,y =100+-6-9+8-4+4+1+67=100,s 2数学=142,s 2物理=2507,因为s 2数学>s 2物理, 所以他的物理成绩更稳定.(2)由于x 与y 之间具有线性相关关系,经计算得b ^=0.5,a ^=100-0.5×100=50. 所以线性回归方程为y ^=0.5x +50. 当y =115时,x =130. 估计他的数学成绩是130分.建议:进一步加强对数学的学习,提高数学成绩的稳定性,将有助于物理成绩的进一步提高.。
变量间的相关关系的教学设计
本节教学设计主要是使用TI92图形计算器,对普通高中课程标准实验教科书数学③第
二章《统计》中的“两个变量的线性相关”进行有益的教与学探究。学生通过对 TI图形计
算器的操作,具体形象地利用散点图等直观图形认识变量之间的相关关系,同时,经历描述
两个变量的相关关系的过程。学生亲自体验了发现数学、领悟数学的全过程。与此同时,教
师在落实新课程标准的相关理念上作了一些有益的探讨。
教学设计与实践:
[教学目标]:
1、 明确事物间的相互联系。认识现实生活中变量间除了存在确定的关系外,仍存在
大量的非确定性的相关关系,并利用散点图直观体会这种相关关系。
2、 通过TI技术探究用不同的估算方法描述两个变量的线性相关关系的过程,学会用
数学的有关变量来描述现实关系。
3、知道最小二乘法思想,了解其公式的推导。会用TI图形计算器来求回归方程,相
关系数。
[教学用具]:
学生每人一台TI图形计算器、多媒体展示台、幻灯
[教学实践情况]:
一、 问题引出:请同学们如实填写下表(在空格中打“√” )
好 中 差
你的数学成绩
你的物理成绩
然后回答如下问题:①“你的数学成绩对你的物理成绩有无影响?”②“ 如果你的数
学成绩好,那么你的物理成绩也不会太差,如果你的数学成绩差,那么你的物理成绩也不会
太好。”对你来说,是这样吗?同意这种说法的同学请举手。
根据同学们回答的结果,让学生讨论:我们可以发现自己的数学成绩和物理成绩存在
某种关系。(似乎就是数学好的,物理也好;数学差的,物理也差,但又不全对。)教师总
结如下:
物理成绩和数学成绩是两个变量,从经验看,由于物理学习要用到比较多的数学知识
和数学方法。数学成绩的高低对物理成绩的高低是有一定影响的。但决非唯一因素,还有其
它因素,如图所示(幻灯片给出):
(影响你的物理成绩的关系图)
因此,不能通过一个人的数学成绩是多少就准确地断定他的物理成绩能达到多少。但
这两个变量是有一定关系的,它们之间是一种不确定性的关系。如何通过数学成绩的结果对
物理成绩进行合理估计有非常重要的现实意义。
二、 引出相关关系的概念
教师提问:“像刚才这种情况在现实生活中是否还有?”
学生甲:粮食产量与施肥用量的关系;
学生乙:人的体重与食肉数量的关系。
……
从而得出:两个变量之间的关系可能是确定的关系(如:函数关系),或非确定性关
系。当自变量取值一定时,因变量也确定,则为确定关系;当自变量取值一定时,因变量带
有随机性,这种变量之间的关系称为相关关系。相关关系是一种非确定性关系。
三、探究线性相关关系和其他相关关系
问题:在一次对人体脂肪和年龄关系的研究中,研究人员获得了一组样本数据:
人体的脂肪百分比和年龄
年龄 23 27 39 41 45 49 50
脂肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2
年龄 53 54 56 57 58 60 61
脂肪 29.6 30.2 31.4 30.8 33.5 35.2 34.6
针对于上述数据所提供的信息,你认为人体的脂肪含量与年龄之间有怎样的关系?教
师特别向学生强调在研究两个变量之间是否存在某种关系时,必须从散点图入手(向学生介
绍什么是散点图)。并且引导学生从散点图上可以得出如下规律:(幻灯片给出)
1、如果所有的样本点都落在某一函数曲线上,那么变量之间具有函数关系(确定性关
系);
2、如果所有的样本点都落在某一函数曲线的附近,那么变量之间具有相关关系(不确
定性关系);
3、如果所有的样本点都落在某一直线附近,那么变量之间具有线性相关关系(不确定
性关系)。
下面我们用TI图形计算器作出这两个变量的散点图。
学生实验:先把数据中成对出现的两个数分别作为横坐标、纵坐标,把数据输入到表
格当中(第一列横坐标、第二列纵坐标)得到图1;然后,用TI图形计算器作散点图得图2:
(图1)
(图2)
引导学生观察作出的散点图,体会现实生活中两个变量之间的关系存在着不确定性。
散点图中的散点并不在一条直线上,只是分布在一条直线的周围,即为线性相关关系。
给出三组数据(表1-3),请学生作出散点图,并观察每组数据的特点。