高中数学第2章统计2.4线性回归方程自我检测苏教版必修524
- 格式:doc
- 大小:767.00 KB
- 文档页数:8
2.4 线性回归方程自我检测基础达标一、选择题1.下列有关线性回归的说法,不正确的是()A.自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B.在平面直角坐标系中用描点的方法得到具有相关关系的两个变量的一组数据的图形叫做散点图C.线性回归直线能得到具有代表意义的回归直线方程D.任何一组观测值都能得到具有代表意义的回归直线方程答案:D2.下列命题中正确的为()①任何两个变量都具有相关关系②圆的周长与该圆的半径具有相关关系③某商品的需求与该商品的价格是一种非确定性关系④根据散点图求得的回归直线方程可能是没有意义的⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究A.①③④B.②④⑤C.③④⑤D.②③⑤答案:C3.观测两相关变量得如下数据:x -1 -2 -3 -4 -5 5 4 3 2 1y -1 -2 -3 -3 -5 5 4 3 2 1则两变量间的回归直线方程为()1A.yˆ= x-1 B.yˆ=0.964x21C.yˆ=2x+ D.yˆ=0.964x+0.13答案:D4.由一组样本数据(x1,y1),(x2,y2),…,(x n,y n)得到的回归直线方程yˆ=bx+a,那么下面说法不正确的是()A.直线yˆ=bx+a必经过点(x,y)B.直线yˆ=bx+a至少经过点(x1,y1),(x2,y2),…,(x n,y n)中的一个点C.直线yˆ=bx+a的斜率为nx y nxyi i2ii11nD.直线yˆ=bx+a和各点(x1,y1),(x2,y2),…,(x n,y n)的偏差[y是i(bx a)]i2i1该坐标平面上所有直线与这些点的偏差中最小的答案:B5.下列变量中具有相关关系的是()A.正方形的体积和边长B.人的身高与体重C.匀速行驶车辆的行驶距离与时间D.球的半径与体积答案:B6.一位同学对自家所开小卖部就“气温与热饮杯的销售量进行调查”,根据统计结果,该生运用所学知识得到气温x℃与当天销售量y(个)之间的线性回归方程yˆ=-2.352x+147.767,估计在x=2℃时,可卖出热饮杯的个数为()A.128 B.134C.143 D.109答案:C7.下列两个变量之间的关系不是函数关系的是()A.正方体的体积与棱长B.角的度数和它的正弦值C.单产为常数时,土地面积和总产量D.日照时间与水稻的亩产量答案:D8.统计中用相关系数r来衡量两个变量之间线性关系的强弱,对应于变量x取值x i,变量y 的观测值为y i(1≤i≤n).若计算得相关系数r=0.8 ,则对变量x 、y的相关强弱为()A.相关性很强B.相关性一般C.相关性很弱D.不相关答案:A9.两个变量成负相关关系时,散点图的特征是()A.点散布特征为从左下角到右上角区域B.点散布在某带形区域内C.点散布在某圆形区域内D.点散布特征为从左上角到右下角区域内答案:D10.某医学科研所对人体脂肪含量与年龄这两个变量的一组随机样本数据,运用Excel软件计算得yˆ=0.577x-0.448(x为人的年龄,y为人体脂肪含量).对年龄为37的人来说,下列说法正确的是()A.年龄为37的人体内脂肪含量为20.90%B.年龄为37的人体内脂肪含量约为20.90%2二、填空题11.已知回归直线方程yˆ=0.50x-0.81,则当x=25时,y的估计值为_________.答案:11.6912.用科学计算器求回归方程的过程中,进入回归计算模式键是_________.答案:13.对某种产品表面进行腐蚀刻线实验,腐蚀深度y(μm)与时间x(s)之间有线性相关关系,回归方程为yˆ=0.304x+5.36,则回归系数b=0.304的实质意义是_____________.答案:腐蚀时间x每增加1s,估计深度y平均增加0.304个μm(或腐蚀速度为0.304μm/s)14.在研究硝酸钠的可溶性程度时,在不同的温度观测它在水中的溶解度,得观测结果如下表:温度(x)0 10 20 50 70溶解度(y)66.7 76.0 85.0 112.3 128.0由此得到回归直线的斜率是___________答案:0.880 9三、解答题15.设对变量x,Y有如下观察数据:x 151 152 153 154 156 157 158 160 160 162 163 164Y 40 41 41.5 41.5 42 42.5 43 44 45 45 46 45.5使用科学计算器求Y对x的回归直线方程.(结果保留4位小数)并写出操作过程.解:计算得:a=-26.057 3,b=0.438 967回归直线方程为yˆ=0.438 967x-26.057 3,操作过程略.16.一台机器由于使用时间较长,但还可以使用.它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少随机器运转的速度而变化,下表为抽样试验结果:转速(x转/秒)16 14 12 8每小时生产有缺点的零件数(y件)11 9 8 5(1)如果y与x有线性相关关系,求回归直线方程;(2)求线性相关系数;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么,机器的运转速度应控制在什么范围内?解:(1)计算得:a=-0.857 5,b=0.728 6回归直线方程为yˆ=0.728 6x-0.857 5.(2)相关系数r=0.995.(3)x≤14.9019.17.在对某产品进行耐压强度试验中,运用刻线试验方法,得到凹陷深度Y与挤压冲力x个单位(N)之间相应的一组观察值,如下表:x(N) 5 10 15 20 30 40 50 60 70 90 100Y(μm) 6 10 10 13 16 17 19 23 25 29 46(1)画出表中数据的散点图;(2)求Y对x的回归直线方程;(3)试预测冲击力为100N时,凹陷深度是多少?解:(1)散点图略.(2)计算得:a=4.82,b=0.329.回归直线方程为yˆ=0.329x+4.82.(3)38.26μm.更上一层1.下列语句所表示的事件中的因素不具有相关关系的是()A.吸烟有害健康B.乌鸦叫,没好兆C.粮食产量与施肥量D.名师出高徒答案:B2.下列关于回归直线的命题,正确的个数是()①回归直线通过散点图的中心(x,y)②回归直线必经过散点图的多个点③对给定数据组(x i,y i)(1≤i≤n)得出的散点图,回归直线可有多条④如果散点图中点的分布从整体上看大致在一条直线附近,且散点图中各点到这条直线的距离差最小,这条直线是回归直线A.0 B.1C.2 D.3答案:C3.改革开放以来,我国高等教育事业迅速发展.为调查某省从1990年到2000年农村18岁到24 岁的青年人每年考入大学的百分比,为便于统计,把1990年到2000年的年号依次编号为0,1,…,10作为自变量x,每年考入大学的百分比作为因变量y,进行回归分析,得到回归直线yˆ=0.42x+1.80.下列对数据解释正确的是()①每年升入大学的百分比为1.80②升入大学的18岁到24岁的人数按大约每年0.42%的速度递增③1990年升入大学的百分比约为1.80%,2000年升入大学的百分比约为6% ④从1990年到2000年升入大学的人数成等距离增加A....②③答案:D4.观察下列四个散点图,两变量具有线性相关关系的是()答案:A5.对相关关系的变量的一组数据(x1,y1),(x2,y2),…,(x n,y n),所求回归方程为yˆ=bx+a,其中回归直线的斜率为()1n A.n1i x i yiB.x yC.nx ynx yi ii1nx n(x)22ii1D.x y ni1x i yi答案:C6.下列两个变量具有相关关系的是()A.三角形的面积与三角形的底和高的乘积B.粮食单产量与光照时间C.圆柱的体积与底面圆的半径施化肥量x 15 20 25 30 35 40 455水稻产量y 330 345 365 405 445 450 455则由此得到的回归直线的斜率是()A.B.4.75C.3..5.35答案:B8.对相关关系的两个变量x、y,与相关强对应的相关系数r满足()A.r∈[0.5,0.9]B.r∈[0.75,1]C.|r|∈[0.75,1]D.r∈[-1,-0.75]答案:C9.现抽取某校高一10名学生入学考试中的数学成绩x和入学后的第一次考试数学成绩y,统计计算得x=107.8,∑(x i)2=116 584,y=68,∑(y i)2=47 384,∑x i y i=73 796,则两次数学成绩的关系()A.相关强B.不相关C.没关系D.相关一般答案:A10.某考察团对全国10大城市进行职工人均平均工资x与居民人均消费y进行统计调查,y与x具有相关关系,回归方程yˆ=0.66x+1.562(单位:千元),若某城市居民消费水平为7.675,估计该城市消费额占人均工资收入的百分比为()A.66%B.72.3%C.67.3%D.83%答案:D11.回归直线方程yˆ=bx+a中,b=__________,a=___________.nx y nx yi i答案:y bxi1nx n(x)22ii112.对某种机器购置后运营年限x(1,2,3,…)与当年增加利润y的统计分析知具备线性相关关系,回归方程为yˆ=10.47-1.3x,估计这种机器使用_________年最合算.答案:劳动生产率提高1 000元,则工资提高80元14.对具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(x n,y n),回归方程为yˆ6,求Q=_________的最小值而得出回归方程的方法,叫最小二乘法.n答案:(y,,,i bx a)2(i12n)ii115.5个学生的数学和物理成绩如下表:学生 A B C D E学科数学80 75 70 65 60物理70 66 68 64 62(1)画出散点图;(2)确定回归方程.解:(1)散点图略.(2)计算得:a=40.8,b=0.36.回归直线方程为yˆ=0.36x+40.8.16.现对x ,y有如下观测数据:x 18 25 30 39 41 42 49 52y 3 5 6 7 8 8 9 10试求y对x的线性回归方程.解:计算得:a=-0.067,b=0.191.回归直线方程为yˆ=0.191x-0.067.17.某公司抽查5位职工的月收入及储蓄额(单位:元)得到如下对应数据:x 700 800 950 1 000 1 200y 254 281 317 331 382(1)作散点图;(2)如果y与x之间具有线性相关关系,求回归直线方程.解:(1)散点图略.(2)计算得:a=76.13,b=0.254 7.回归直线方程为yˆ=0.254 7x+76.13.18.某厂某产品的产量x(单位:千件)与单位成本y(单位:万元/千件)的对应数据如下:x 29 28 28.5 29.5 30 31 30 29y 500 510 504 494 493 485 492 498(1)对变量y与x作出散点图;(2)若y与x具有线性相关关系,求回归直线方程;7(3)预测产量x=25千件时的单位成本.解:(1)散点图略.(2)计算得:a=732,b=-8.回归直线方程为yˆ=-8x+732.(3)当x=25时,yˆ=-8×25+732=532万元/千件.8。
2.4 线性回归方程 1整体设计教材分析在实际问题中,变量之间关系有两类:一类是确定性关系,变量之间关系可以用函数表示.例如,正方形面积S与边长a之间就是确定性关系,可以用函数s=a2表示.还有一类是非确定性关系,例如“学生数学成绩与物理成绩之间关系〞“粮食产量与施肥量之间关系〞“商品销售额与广告费支出之间关系〞“人体脂肪百分比与年龄之间关系〞等贴近学生实际问题,它不能由一个变量数值准确地确定另一个变量数值.像这种自变量取一定值时,因变量取值带有一定随机性,这样两个变量之间关系,我们称之为相关关系.“线性回归方程〞这一节是为了帮助我们了解变量之间相关关系,使学生学会区别变量之间函数关系与变量相关关系,从而到达正确判断实际生活中两个变量之间相关关系并会作出变量相关关系散点图;通过散点图直观性,看各点是否在某条直线附近摆动来为判断两个变量之间相关关系打下坚实根底.通过对人体脂肪百分比与年龄之间关系散点图分析,引入描述两个变量之间关系线性回归方程〔模型〕,使学生通过探索用多种方法确定线性回归直线,学会类比寻求新突破方法,体会最小二乘法思想,掌握计算回归方程斜率与截距方法,求出回归直线方程.通过典型求解,强化回归思想建立,理解回归直线与观测数据关系. 通过引导学生感受生活中实际问题转化为数学问题,学会类比寻求新突破方法,体会最小二乘法思想,培养学生创新精神,不断收取信息,学会用统计知识对实际问题进展数学分析.通过课堂目标检测到达强化所学知识点,提高学生对现代化教学工具应用能力.三维目标1.通过实例,使学生感受到现实世界中变量之间除了函数关系外,还存在着虽无确定函数关系,但却有一定关联性相关关系,相关关系是一种非确定性关系.2.通过收集实际问题中两个有关联变量数据作出散点图,直观认识变量间相关关系.3.经历用不同估算方法描述两个变量线性相关过程,运用最小二乘法思想,发现可用线性回归方程近似地表示两个具有相关关系变量之间关系,并能根据给出线性回归方程系数公式建立线性回归方程.重点难点教学重点:1.会区别变量之间函数关系与变量相关关系;会举例说明现实生活中变量之间相关关系.2.会作散点图,并由此对变量间关系作出直观判断,会求回归直线.教学难点:1.对变量之间相关关系理解;变量之间函数关系与变量相关关系区别.2.了解最小二乘法思想,能根据给出线性回归方程系数公式建立回归方程.课时安排2课时教学过程第1课时导入新课〔多媒体播放四个问题,组织学生分析、思考〕问题1:将汽油以均匀速度注入桶里,注入时间t与注入油量y 如下表:从表里数据得出油量y与时间t之间函数关系式为________________.问题2:圆面积S与半径r之间函数关系式为________________.问题3:小麦产量y千克每亩与施肥量x千克每亩之间关系如下表:从表里数据能得出小麦产量y与施肥量x之间函数关系式吗?问题4:人体重y与身高x之间有什么关系呢?分析问题1:因为是以均匀速度注入桶里,所以注入油量y与注入时间t成正比例关系,由表格数据知,注入油量y与注入时间t之间函数关系式为y=2x(x≥0).因为是实际问题,所以要特别注意自变量取值范围要有实际意义.分析问题2:这是大家熟悉面积公式,所以圆面积S与半径r之间函数关系式为S=πr2(r>0).第1、2两个问题中变量间函数关系是确定,在我们现实生活,两个变量之间存在确定性关系是极少,而两个变量之间存在不确定性关系是很普遍,那么问题3中两个变量之间是确定性函数关系,还是不确定性关系呢?学生甲分析问题3:此问中两个变量之间是确定性函数关系,设为y=kx+b,当x=10时,函数值y为420;当x=20时,函数值y 为440,代入可得函数关系式为y=2x+400(x≥0).学生乙:学生甲答复是错误,假设函数关系式为y=20x+400(x≥0),当x=30时,函数值为460,而不是470.但是可以感觉到施肥量越大,小麦产量就越高.教师分析:从表格里容易发现施肥量越大,小麦产量就越高.但是,施肥量并不是影响小麦产量唯一因素,小麦产量还与土壤质量、降雨量、田间管理等诸多因素影响有关,更何况当施肥量超出一定范围时,还会造成小麦倒塌,以致颗粒无收.这时两个变量之间就不是确定性函数关系,那么这两个变量之间终究是什么关系呢?这就是我们本节课所要研究问题——变量之间相关关系.(引入新课,书写课题)推进新课新知探究由学生举出现实生活中相关关系例子,教师归纳概念!1.变量之间有一定联系,但不能完全用函数来表达,即当自变量一定时,因变量取值带有一定随机性两个变量之间关系称为相关关系.相关关系是非随机变量与随机变量之间关系,函数关系是两个非随机变量之间关系,是一种因果关系,而相关关系不一定是因果关系,所以相关关系与函数关系不同,其变量具有随机性,因此相关关系是一种非确定性关系〔有因果关系,也有伴随关系〕.通过上述三个问题请学生思考相关关系与函数关系有什么区别与联系?相关关系与函数关系异同点如下:一样点:均是指两个变量关系.不同点:函数关系是一种确定关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间关系,这种关系是两个非随机变量关系;而相关关系是非随机变量与随机变量关系.注意:问题3中小麦产量是在土壤质量、降雨量、田间管理等诸多变量共同作用下结果,本节课只研究其中两个主要变量之间相关关系.我们只能得出经历性结论:施肥量越大,小麦产量就越高.但是经历再丰富,也容易犯经历性错误.施肥量过大,反而容易造成粮食减产.由学生解决问题4, 人体重y与身高x之间是一种非确定关系相关关系,因为,一般说来,身高越高,体重就越重,而无法写出具体函数关系.应用例如例1 某班学生在一次数学测验与物理测验中,学号1到20学生成绩如下表:从表里数据你能得出什么样经历性结论呢?分析:即是考虑两门学科成绩之间是否具有一定相关关系.解:数学成绩好同学那么物理成绩就好,反之,数学成绩差同学那么物理成绩就差.点评:注意,只是问“得出什么样经历性结论〞,并不完全绝对.例2 下面提供四个问题,让各组同学共同探究:第一小组探究问题是:调查一下本组所有成员视力与各自学习成绩关系.第二小组探究问题是:商品销售额与广告费支出之间关系.第三小组探究问题是:调查一下本组所有成员身高与各自体重之间关系.第四小组探究问题是:气温上下与空调销售量间关系.分析:根据变量相关关系讨论.解:第一小组:通过对本组所有成员调查我们得到结论是:学习成绩好同学视力都不太好,都佩带了近视眼镜,但是,我们发现这个结论对我们全班来说就不成立,例如,我们班第一名同学视力却是很棒,所以我们只能说学习成绩好同学视力一般都不太好,人视力还与用眼卫生习惯、遗传因素等有密切关系.第二小组:通过本组所有成员共同探讨,我们得到结论是:商品销售额与广告费支出之间有密切关系,但商品销售额不仅与广告费支出多少有关,还与商品质量、居民收入以及售后效劳质量等诸多因素有关.第三小组:通过对本组所有成员调查我们得到结论是:身材高同学体重一般来说大多都比拟大,但是,人体重还与饮食习惯、遗传因素等有密切关系.第四小组:通过本组所有成员共同探讨,我们得到结论是:气温上下与空调销售量之间有密切关系,但空调销售量不仅与气温上下有关,还与空调质量、居民收入以及售后效劳质量等诸多因素有关.点评:通过此例使学生养成考虑问题要多方面思考习惯.例3 以下两个变量之间关系哪个不是函数关系〔〕解析:利用变量函数关系与相关关系解决问题.角度与它余弦值是一个确定函数关系y=cosx;正方形边长与面积:s=a2;正n边形边数与它内角与:s=(n-2)×180°,而人年龄与身高具有相关关系.答案:D点评:函数关系是一种确定关系,而相关关系是一种非确定关系;函数关系是自变量与因变量之间关系,这种关系是两个非随机变量关系,而相关关系是非随机变量与随机变量关系.例4 “强将手下无弱兵〞可以理解为将军本领越高,他手下士兵本领也越高.那么,将军本领与士兵本领成什么相关关系?你能举出更多描述生活中两个变量相关关系成语吗?分析:这是与生活、生产、工作、学习息息相关相关关系,语言功底好同学更显优势.解:此题与“名师出高徒〞相对应.另外举例有:水涨船高.点评:此题加强了与其他学科联系,学生会对数学很有亲切感.知能训练1.在一次对人体脂肪含量与年龄关系研究中,研究人员获得了一组样本数据:根据上述数据,人体脂肪含量与年龄之间有怎样关系?2.某小卖部为了了解热茶销售量与气温之间关系,随机统计并制作了某6天卖出热茶杯数与当天气温比照表:根据上述数据,气温与热茶销售量之间有怎样关系?解答:1.观察表中数据,大体上来看,随着年龄增加,人体中脂肪百分比也在增加.2.观察表中数据,大体上来看,气温越高,卖出去热饮杯数越少.点评:使学生学会全面考察现实生活中变量之间相关关系,并为下一节课作铺垫.课堂小结(让学生进展小结,帮助他们回忆反思、归纳概括.)1.变量之间相关关系;2.变量之间函数关系与变量相关关系区别;3.学会全面考察现实生活中变量之间相关关系.作业阅读、预习课本中本节下一局部内容.举出生活中具有相关关系例子.设计感想通过生活中存在相关关系一些典型事例,如“学生数学成绩与物理成绩之间关系〞“粮食产量与施肥量之间关系〞“商品销售额与广告费支出之间关系〞等贴近学生实际问题,介绍与函数关系不同两个变量之间相关关系,在教学设计时,通过复习变量之间函数关系引出变量相关关系,由熟悉到生疏过程便于学生理解,同时分成四个小组同学共同探究以下四个问题:〔1〕调查一下本组所有成员视力与各自学习成绩关系;〔2〕商品销售额与广告费支出之间关系;〔3〕调查一下本组所有成员身高与各自体重之间关系;〔4〕气温上下与空调销售量间关系.通过讨论来强化学生对所学内容理解.。
2.4 线性回归方程自主广场我夯基 我达标1.相关关系与函数关系的区别是_________.思路解析:考查函数关系和相关关系的含义.答案:函数关系是两个变量之间有完全确定的关系,而相关关系是两个变量之间并没有严格的确定关系,当一个变量变化时,另一变量的取值有一定的随机性 2.线性回归方程y=bx+a 过定点__________.思路解析:考查线性回归方程的意义,及点与直线的位置关系的判断.由线性回归直线方程的推导过程不难发现直线恒过定点(x ,y ).答案:(x ,y )3.工人工资(元)依劳动生产率(千元)变化的回归方程为y ˆ=50+80x ,下列判断正确的是( )A .劳动生产率为1 000元时,工资为130元B .劳动生产率提高1 000元时,工资大约提高80元C .劳动生产率提高1 000元时,工资提高大约130元D .当月工资250元时,劳动生产率为2 000元思路解析:考查了直线斜率的实际意义,即k=.x x y y xy1212∆∆==--横坐标的增量纵坐标的增量答案: B4.设有一个直线回归方程为yˆ=2-1.5x ,则变量x 增加一个单位( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位C .y 平均减少1.5个单位D .y 平均减少2个单位思路解析:考查了直线斜率的实际意义,即k=.x x y y xy1212∆∆==--横坐标的增量纵坐标的增量答案: C5.下列两个变量之间的关系不是函数关系的是( )A .角度和它的余弦值B .正方形边长和面积C .正n 边形的边数和它的内角和D .人的年龄和身高 思路解析:本题主要考查相关关系的概念.由函数的定义可知A 、B 、C 三项中的两个变量间的关系均为函数关系,故答案为D.答案: D 6.已知样本容量为11,计算得∑=111i i x =510,∑=111i i y =214,∑=1112i i x =36 750,∑=1112i i y =5422,∑=111i ii yx =13 910,则y 对x 的回归方程为__________.思路解析:考查线性回归方程的求法.在回归方程中b=. x b ,x x n y x y x n ni i n i i ni i n i i n i i i -=--∑∑∑∑∑=====y a )())((2112111答案:y=5.34+0.3x7.部分国家13岁学生数学测验平均分数见下表. 中国 韩国 瑞士 俄罗斯 法国 以色列 加拿大 英国 美国 约旦 授课天数 251 222 207 210 174 215 188 192 180 191 分 数80737170646362615546试作出该数据的散点图,并由图判断是否存在回归直线.若有,试求出直线方程.思路解析:考查了用回归直线方程进行拟合的一般步骤.用回归直线方程进行拟合的一般步骤为:作出散点图;判断散点是不是在一条直线的附近;若散点在一条直线的附近,利用公式求出回归直线方程.答案:(图略)存在回归直线方程,回归直线方程是y=0.313 3x+0.900 1.我综合 我发展8.一个工厂在某年每月产品的总成本y(万元)与该月产量x(万件)之间的一组数据如下: x 1.08 1.12 1.19 1.28 1.36 1.48 1.59 1.68 1.80 1.87 1.98 2.07 y 2.25 2.37 2.40 2.55 2.64 2.75 2.92 3.03 3.14 3.26 3.36 3.50试作出该数据的散点图,并求总成本y 与月产量x 之间的回归直线方程. 思路解析:考查了回归直线方程的求法. 答案:(图略)回归直线方程是y ˆ=1.215x +0.974.9.对于线性相关系数r ,叙述正确的是( )A .|r|∈(0,+∞),|r|越大,相关程度越大;反之,相关程度越小B .r∈(-∞,+∞),r 越大,相关程度越大;反之,相关程度越小C .|r|≤1,且|r|越接近于1,相关程度越大,|r|越接近于0,相关程度越小D .以上说法都不对思路解析:考查了线性相关程度的判断方法.|r|≤1,且|r|越接近于1,相关程度越大,|r|越接近于0,相关程度越小.答案: C我创新 我超越10.改革开放以来,我国高等教育事业有了迅速发展.这里我们得到了某省从1990~2000年18~24岁的青年人每年考入大学的百分比,我们把农村、乡镇和城市分开统计.为了便于计算,把1990年编号为0,1991年编号为1,…,2000年编号为10.如果把每年考入大学的百分比作为因变量,把年份从0到10作为自变量进行回归分析,可得到下面三条回归直线:城市yˆ=9.50+2.84x,乡镇yˆ=6.76+2.32x,农村yˆ=1.80+0.42x.(1)在同一坐标系内作出三条回归直线.(2)对于农村青年来讲,系数等于0.42意味着什么?(3)在这一阶段,三个组哪一个的大学入学率年增长最快?(4)请查阅我国人口分布的有关资料,选择一个在高等教育发展上有代表性的省,以这个省的大学入学率作为样本,说明我国在1991~2000年10年间大学入学率的总体发展情况.思路解析:考查了直线方程的画法,直线斜率的实际意义及解决问题和分析问题的能力.答案:(1)图略.(2)对于农村青年来讲,系数等于0.42意味着考入大学的百分比增长较慢.(3)城市组.(4)略.。
2.4 线性回归方程1.理解线性回归的基本思想和方法,体会变量之间的相关关系.(难点)2.会画出数据的散点图,并会通过散点图判断这组数据是否具有线性关系.(重点) 3.会求数据的线性回归方程,并根据线性回归方程做出合理的判断.(重点、难点)[基础·初探]教材整理1 变量间的关系阅读教材P 74的内容,并完成下面的问题.1.变量间的关系关系.确定性函数表示,是一种函数函数关系:变量之间的关系可以用(1)来表达.函数,但不能完全用一定的联系相关关系:变量之间有(2)2.散点图横坐的取值作为x 是否有相关关系,常将y 与x 统计数表中,为了更清楚地看出从一个,这样的图形…),1,2,3=i )(i y ,i x (,在直角坐标系中描点纵坐标的相应取值作为y ,将标叫做散点图.判断正误:(1)相关关系是一种不确定关系,而函数关系是一种确定关系.( )(2)商品的销售收入与广告支出经费是函数关系.( )(3)散点图越集中,则相关关系越强.( )【解析】 (1)√.由函数关系及相关关系的定义知正确.(2)×.是相关关系,而不是确定关系,故错误.(3)×.只有当散点图呈规律性分布时才具有相关关系.故错误.【答案】 (1)√ (2)× (3)×教材整理2 线性回归方程阅读教材P 75~P 76“例1”上边的内容,并完成下列问题.1.线性相关关系拟合a +bx =y ^,我们用直线一条直线的附近如果散点图中点的分布从整体上看大致在叫做线性相关关系.相关关系近似表示的a +bx =y ^散点图中的这些点,像这样能用直线 2.线性回归方程设有n 对观察数据如下:=y ^时,就称最小值取得2)a -n bx -n y (+…+2)a -2bx -2y (+2)a -1bx -1y(=Q 使b ,a 当bx +a 为拟合这n 对数据的线性回归方程,该方程所表示的直线称为回归直线.3.用回归直线进行数据拟合的一般步骤附近;一条直线是否在散点作出散点图,判断(1)(2)如果散点在一条直线附近,用公式⎩⎪⎨⎪⎧b =∑i =1nxiyi -∑i =1nx∑i =1nyn ∑i =1n x2i -∑i =1n xa =y --b x-或求出a ,b ,并写出线性回归方程.填空:(1)有一个线性回归方程为y ^=2-1.5x ,则变量x 增加一个单位时,y 平均________1.5个单位.(填“增加”或“减少”)【解析】 ∵b =-1.5,∴x 每增加一个单位时y 减少1.5个单位.【答案】 减少(2)过(3,10),(7,20),(11,24)三点的回归直线方程是________.【解析】 代入系数公式得b =1.75,a =5.75.代入直线方程.求得y ^=5.75+1.75x .。
必修一第一章集合1.1集合的含义及其表示1。
2子集、全集、补集1。
3交集、并集第二章函数2。
1函数的概念和图象2.2指数函数2.3对数函数2.4幂函数2。
5函数与方程2。
6函数模型及其应用必修二第一章立体几何初步1。
1空间几何体1。
2点、线、面之间的位置关系1。
3空间几何体的表面积和体积第二章平面解析几何初步2.1直线与方程2。
2圆与方程2.3空间直角坐标系必修三第一章算法初步1.1算法的含义1.2流程图1.3基本算法语句1。
4算法案例第二章统计2。
1抽样方法2。
2总体分布的估计2。
3总体特征数的估计2。
4线性回归方程第三章概率3.1随机事件及其概率3。
2古典概型3。
3几何概型3.4互斥事件必修四第一章三角函数1。
1任意角、弧度1。
2任意角的三角函数1.3三角函数的图象与性质第二章平面向量2.1向量的概念与表示2。
2向量的线性运算2.3向量的坐标表示2。
4向量的数量积2.5向量的应用第三章三角恒等变换3。
1两角和与差的三角函数3.2二倍角的三角函数3。
3几个三角恒等式必修五第一章解三角形1.1正弦定理1。
2余弦定理1.3正弦定理、余弦定理的应用第二章2.1数列2。
2等差数列2.3等比数列第三章3.1不等关系3.2一元二次不等式3。
3二元一次不等式组与简单线性规划3.4《基本不等式》选修1-1第一章常用逻辑用语1.1命题及其关系1。
2充分条件与必要条件1。
3简单的逻辑联结词1。
4全称量词与存在量词第二章圆锥曲线与方程2。
1椭圆2。
2双曲线2。
3抛物线第三章导数及其应用3.1变化率与导数3。
2导数的计算3.3导数在研究函数中的应用3.4生活中的优化问题举例选修1—2第一章统计案例1。
1回归分析的基本思想及其初步应用1。
2独立性检验的基本思想及其初步应用第二章推理与证明2。
1合情推理与演绎推理2。
2直接证明与间接证明第三章数系的扩充与复数的引入3.1数系的扩充和复数的概念3。
2复数代数形式的四则运算第四章框图4.1流程图4.2结构图选修2—1第一章常用逻辑用语1。
2018版高中数学第二章统计2.4 线性回归方程学案苏教版必修3 编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2018版高中数学第二章统计2.4 线性回归方程学案苏教版必修3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2018版高中数学第二章统计2.4 线性回归方程学案苏教版必修3的全部内容。
2.4 线性回归方程1.理解线性回归的基本思想和方法,体会变量之间的相关关系.(难点)2.会画出数据的散点图,并会通过散点图判断这组数据是否具有线性关系.(重点)3.会求数据的线性回归方程,并根据线性回归方程做出合理的判断.(重点、难点)[基础·初探]教材整理1 变量间的关系阅读教材P74的内容,并完成下面的问题.1.变量间的关系(1)函数关系:变量之间的关系可以用函数表示,是一种确定性函数关系.(2)相关关系:变量之间有一定的联系,但不能完全用函数来表达.2.散点图从一个统计数表中,为了更清楚地看出x与y是否有相关关系,常将x的取值作为横坐标,将y的相应取值作为纵坐标,在直角坐标系中描点(x i,y i)(i=1,2,3,…),这样的图形叫做散点图.判断正误:(1)相关关系是一种不确定关系,而函数关系是一种确定关系.( )(2)商品的销售收入与广告支出经费是函数关系.( )(3)散点图越集中,则相关关系越强.()【解析】(1)√。
由函数关系及相关关系的定义知正确.(2)×.是相关关系,而不是确定关系,故错误.(3)×。
只有当散点图呈规律性分布时才具有相关关系.故错误.【答案】(1)√(2)×(3)×教材整理2 线性回归方程阅读教材P75~P76“例1”上边的内容,并完成下列问题.1.线性相关关系如果散点图中点的分布从整体上看大致在一条直线的附近,我们用直线错误!=bx+a拟合散点图中的这些点,像这样能用直线错误!=bx+a近似表示的相关关系叫做线性相关关系.2.线性回归方程设有n对观察数据如下:x x1x2x3…x ny y1y2y3…y n当a,b使Q112222n n2取得最小值时,就称错误!=bx+a为拟合这n对数据的线性回归方程,该方程所表示的直线称为回归直线.3.用回归直线进行数据拟合的一般步骤(1)作出散点图,判断散点是否在一条直线附近;(2)如果散点在一条直线附近,用公式错误!或求出a,b,并写出线性回归方程.填空:(1)有一个线性回归方程为错误!=2-1.5x,则变量x增加一个单位时,y平均________1.5个单位.(填“增加”或“减少”)【解析】∵b=-1。
2.4 线性回归方程(1)教学目标:1. 通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系;2. 在两个变量具有线性相关关系时,会在散点图中作出线性直线,会用线性回归方程进行预测;3. 知道最小二乘法的含义,知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程,了解(线性)相关系数的定义.教学重点:散点图的画法,回归直线方程的求解方法.教学难点:回归直线方程的求解方法.教学方法:引导发现、合作探究.教学过程:一、创设情景,揭示课题客观事物是相互联系的.过去研究的大多数是因果关系,但实际上更多存在的是一种非因果关系.比如说:某某同学的数学成绩与物理成绩,彼此是互相联系的,但不能认为数学是“因”,物理是“果”,或者反过来说事实上数学和物理成绩都是“果”,而真正的“因”是学生的理科学习能力和努力程度.所以说,函数关系存在着一种确定性关系,但还存在着另一种非确定性关系——相关关系.二、学生活动提出问题:两个变量之间的常见关系有几种?(1)确定性的函数关系,变量之间的关系可以用函数表示;(2)相关关系,变量之间有一定的联系,但不能完全用函数来表示.说明:不要认为两个变量间除了函数关系,就是相关关系,事实是,两个变量间可能毫无关系.比如地球运行的速度与某个人的行走速度就可认为没有关系.某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对照表:-0C,你能根据这些数据预测这天小卖部卖出热茶的杯数吗?如果某天的气温是5为了了解热茶销量与气温的大致关系,我们以横坐标x表示气温,纵坐标y表示热茶销量,建立直角坐标系,将表中数据构成的6个数对所表示的点在坐标系内标出,得到下图,今后我们称这样的图为散点图(scatterplot).从下图可以看出,这些点散布在一条直线的附近,故可用一个线性函数近似地表示热茶销量与气温之间的关系.选择怎样的直线近似地表示热茶销量与气温之间的关系?我们有多种思考方案:(1)选择能反映直线变化的两个点,例如取(4,50),(18,24)这两点的直线;(2)取一条直线,使得位于该直线一侧和另一侧的点的个数基本相同;(3)多取几组点,确定几条直线方程,再分别算出各条直线斜率、截距的平均值,作为所求直线的斜率、截距;……怎样的直线最好呢?三、建构数学1.最小平方法:=+的直线拟合散点图中的点,应使得该直线用方程为ˆy bx a=+与图中六与散点图中的点最接近.那么,怎样衡量直线ˆy bx a个点的接近程度呢?我们将表中给出的自变量x的六个值带入直线方程,得到相应的六个ˆy的值:26,18,13,10,4,b a b a b a b a b a b a +++++-+.这六个值与表中相应的实际值应该越接近越好.所以,我们用类似于估计平均数时的思想,考虑离差的平方和222222(,)(2620)(1824)(1334)(1038)(450)(64)Q a b b a b a b a b a b a b a =+-++-++-++-++-+-+- 21286b =26140382046010172a ab b a ++--+说明: (,)Q a b 是直线ˆybx a =+与各散点在垂直方向(纵轴方向)上的距离的平 方和,可以用来衡量直线ˆybx a =+与图中六个点的接近程度,所以,设法取,a b 的 值,使(,)Q a b 达到最小值.这种方法叫做最小平方法(又称最小二乘法)(method of least square ).先把a 看作常数,那么Q 是关于b 的二次函数.易知,当140382021286a b -=-⨯时, Q取得最小值.同理, 把b 看作常数,那么Q 是关于a 的二次函数.当14046012b a -=-时, Q 取得最小值.因此,当14038202128614046012a b b a -⎧=-⎪⎪⨯⎨-⎪=-⎪⎩时,Q 取的最小值,由此解得 1.6477,57.5568b a ≈-≈.所求直线方程为ˆ 1.647757.5568y x =-+.当5x =- 时,ˆ66y≈,故当气温为5-0C 时,热茶销量约为66杯. 2.线性相关关系:像这样能用直线方程ˆybx a =+近似表示的相关关系叫做线性相关关系(liner correlation).3.线性回归方程:一般地,设有n 个观察数据如下:当,a b 使2221122()()...()n n Q y bx a y bx a y bx a =--+--++--取得最小值时,就称ˆybx a =+为拟合这n 对数据的线性回归方程(linear regression equation ),该方程所表示的直线称为回归直线.上述式子展开后,是一个关于,a b 的二次多项式,应用配方法,可求出使Q 为最小值时的,a b 的值.即结论:1112211()()()n n ni i i i i i i n ni i i i n x y x y b n x x a y bx=====⎧-⎪=⎪⎨-⎪⎪=-⎪⎩∑∑∑∑∑,(*) ∑==n i i x n x 11, ∑==ni i y n y 11 说明:公式(*)的推导比较复杂,这里不作要求. 四、数学运用例题 下表为某地近几年机动车辆数与交通事故数的统计资料,请判断机动 车辆数与交通事故数之间是否有线性相关关系,如果具有线性相关关系,求出线 性回归方程;如果不具有线性相关关系,说明理由.解:在直角坐标系中画出数据的散点图,直观判断散点在一条直线附近,故具有线性相关关系.计算相应的数据之和:8888211111031,71.6,137835,9611.7ii i i i i i i i xy x x y ========∑∑∑∑,将它们代入(*)式计算得0.0774, 1.0241b a ≈=-, 所以,所求线性回归方程为0.0774 1.0241y x =-.巩固深化,反馈矫正:1.下面是我国居民生活污水排放量的一组数据(单位:103t )试分别估计1996年和2004年我国居民生活污水排放量. 2.一个工厂在某年里每月产品的总成本y(单位:万元)与月产量(单位:万件)之间有如下一组数据:(1)画出散点图; (2)求线性回归方程. 五、归纳整理,整体认识1.对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数,a b 的计算公式,算出,a b .由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误.2.求线性回归方程的步骤:①计算平均数y x ,;②计算i i y x 与的积,求∑iiyx ;③计算∑2ix;④将结果代入公式求a ;⑤用 x a y b -=求b ;⑥写出回归方程。
高中苏教数学③2.4线性回归方程测试题一、选择题1.下列关系属于线性负相关的是( ) A.父母的身高与子女身高的关系 B.身高与手长C.吸烟与健康的关系D.数学成绩与物理成绩的关系答案:C2.由一组数据1122()()()n n x y x y x y L ,,,,,,得到的回归直线方程$y bx a =+,那么下面说法不正确的是( )A.直线$y bx a =+必经过点()x y , B.直线$y bx a =+至少经过点1122()()()n n x y x y x y L ,,,,,,中的一个点C.直线$y bx a =+a 的斜率为1221ni ii nii x ynx yxnx==--∑∑ D.直线$y bx a =+和各点1122()()()n n x y x y x y L ,,,,,,的总离差平方和21[()]ni i i y bx a =-+∑是该坐标平面上所有直线与这些点的离差平方和中最小的直线答案:B3.实验测得四组()x y ,的值为(12)(23)(34)(45),,,,,,,,则y 与x 之间的回归直线方程为( ) A.$1y x =+ B.$2y x =+ C.$21y x =+D.$1y x =-答案:A4.为了考查两个变量x 和y 之间的线性关系,甲、乙两位同学各自独立作了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1,l2,已知两人所得的试验数据中,变量x 和y 的数据的平均值都相等,且分别是s t ,,那么下列说法正确的是( ) A.直线1l 和2l 一定有公共点()s t ,B.直线1l 和2l 相交,但交点不一定是()s t , C.必有直线12l l ∥ D.1l 和2l 必定重合答案:A二、填空题5.有下列关系:(1)人的年龄与他(她)拥有的财富之间的关系 (2)曲线上的点与该点的坐标之间的关系 (3)苹果的产量与气候之间的关系(4)森林中的同一种树木,其断面直径与高度之间的关系 (5)学生与他(她)的学号之间的关系 其中,具有相关关系的是 .答案:(1)(3)(4)6.对具有相关关系的两个变量进行的方法叫做回归分析.用直角坐标系中的坐标分别表示具有 的两个变量,将数据表中的各对数据在直角坐标系中描点得到的表示具有相关关系的两个变量的一组数据的图形,叫做 .答案:统计分析;相关关系;散点图7.将一组数据同时减去3.1,得到一组新数据,若原数据的平均数、方差分别为2x s ,,则新数据的平均数是 ,方差是 ,标准差是 .答案: 3.1x -;2s ;s8.已知回归直线方程为$4.4838.19y x =+,则可估计x 与y 增长速度之比约为 .答案:522三、解答题9.某商店统计了近6个月某商品的进价x 与售价y (单位:元)的对应数据如下:x 3 5 2 8 9 12y4 6 3 9 12 14求y 对x 的回归直线方程. 解:3528912 6.56x +++++==∵,4639121486y +++++==,621327ii x==∑,61396i i i x y ==∑,6162216 1.1436i ii ii x yxy b xx==-=≈-∑∑∴,0.571a y bx =-=,∴回归直线方程为$1.1430.571y x =+.10.已知10只狗的血球体积及红血球的测量值如下:x 45 42 4648 42 y6.53 6.30 9.257.580 6.99 x35 58 40 39 50 y5.909.496.206.557.72x (血球体积,ml ),y (红血球数,百万)(1)画出上表的散点图;(2)求出y 对x 的回归直线方程并且画出图形 . 解:(1)见下图(2)1(45424648423558403950)44.510x =+++++++++=, 1(6.53 6.309.257.50 6.99 5.909.49 6.20 6.557.72)7.24310y =+++++++++= 102120183ii x==∑,1013283.9i i i x y ==∑,设回归直线方程为$y bx a =+, 则12210.1597ni ii nii x ynx y b xnx==-=≈-∑∑,0.1364a y bx =-=.图形如下:11.某医院用光电比色计检验尿汞时,得尿汞含量(毫克/升)与消光系数如下表: 尿汞含量x :2 4 6 8 10 消光系数:y 64 134 205 285 360(1)画出散点图;(2)如果y 与x 之间具有线性相关关系,求回归直线方程; (3)估计尿汞含量为9毫克/升时的消光系数. 解: (1)(2)由散点图可知y 与x 线性相关,设回归直线方程为$y bx a =+.列表: i1 2 3 4 5 i x 2 4 6 8 10 i y 64 134 205 285 360 i i x y1285361230228036006x = 209.6y =521220ii x==∑ 517774i i i x y ==∑2777456209.637.1522056b -⨯⨯==-⨯∴,209.637.15613.3a =-⨯=-∴.∴回归直线方程为$37.1513.3y x =-. (3)当9x =时,$37.15913.3321.05y =⨯-=.。
高中数学线性回归方程自我小测苏教版必修3 1.下列语句所表示的事件中的因素不具有相关关系的是________.①瑞雪兆康年②名师出高徒③抽烟有害健康④喜鹊叫喜,乌鸦叫丧2.工人月工资y(元)依劳动生产率x(千元)转变的回归方程为y=80x+50,下列四个说法:①劳动生产率为1千元时,月工资为130元;②劳动生产率提高1千元,则月工资平均提高80元;③劳动生产率提高1千元,则月工资提高130元;④当月工资为210元时,劳动生产率为2千元,其中正确的是__________.(填序号)3.对于一条线性回归直线y=a+bx,若是x=3时,对应的y的估量值是17,当x=8时,对应的y的估量值是22,那么,可以估量出回归直线方程是__________,按照回归直线方程判断当x=__________时,y的估量值是38.4.如图所示,有5组(x,y)数据,去掉___________组数据后,剩下的4组数据的线性相关性最大.5.某县近几年来的财政收入x与财政支出y之间的关系大致符合y=+(单位:亿元),估计今年该县财政收入为3亿元,则今年财政支出估量是__________亿元.6.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元).调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据取得y对x的回归直线方程:y=+.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.7.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号天天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系:小李这5预测小李该月6号打6小时篮球的投篮命中率为__________.8.有一名同窗家开了一个小卖部,他为了研究气温对热饮销售的影响,通过统计,取得一个卖出热饮杯数与当天气温的对比表:(2)你能从散点图中发现气温与热饮销售杯数之间关系的一般规律吗?(3)求回归方程;(4)若是某天的气温是2 ℃,预测此日卖出的热饮杯数.9.在7块并排、形状大小相同的实验田上进行施化肥量对水稻产量影响的实验,得数据列表(单位:kg):(1)(2)若水稻产量y与施化肥量x之间具有线性相关关系,求其线性回归方程;(3)当施化肥38 kg时,请估量水稻的产量.参考答案1答案:④ 2答案:②解析:按照回归方程的概念可知①③④错误. 3答案:y =x +14 24解析:首先把两组值代入回归直线方程,得317822b a b a +=⎧⎨+=⎩⇒1,14,b a =⎧⎨=⎩ 所以回归直线方程是y =x +14.令x +14=38,可得x =24. 4答案:D (3,10)解析:去掉D (3,10),A ,B ,C ,E 大致在一条直线上,线性相关关系较强. 5答案:解析:当财政收入为3亿元,即x =3时,y =3×+=.6答案:解析:家庭收入每增加1万元,对应回归直线方程中的x 增加1,相应的y 的值增加,即年饮食支出平均增加万元.7答案:解析:这5天的平均投篮命中率为0.4+0.5+0.6+0.6+0.40.55y ==.1234535x ++++==.5=1i ∑(x i -x )(y i -y )=(1-3)×-+(2-3)×-+(3-3)×-+(4-3)×-+(5-3)×-=.5=1i ∑(x i -x )2=(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2=10.b =0.110=,a =y -b x =-=. 所以回归直线方程为y =+.当x=6时,y=×6+=.8解:(1)散点图如图所示.(2)从散点图看出,各点散布在从左上角到右下角的区域里.因此,气温与热饮销售杯数之间是负相关关系,即气温越高,卖出去的热饮杯数越少.(3)从散点图可以看出,这些点大致散布在一条直线周围,因此,可用公式求出回归方程的系数,利用计算器容易求得回归方程为y=-+.(4)当x=2时,y=.因此,某天的气温为2 ℃,此日大约可以卖出143杯热饮.9解:(1)按照表中数据可得散点图如下:(2)按照回归直线方程系数的公式计算可得回归直线方程是y=+257.(3)把x=38代入回归直线方程得y≈438.所以,可以预测,施化肥量为38 kg时,水稻的产量约是438 kg.。
2.4 线性回归方程互动课堂疏导引导1.变量之间的关系在实际问题中,变量之间的常见关系的有两类:一类是确定性的函数关系;另一类是变量间有一定的联系,但不能完全用函数来表达,它们的关系带有随机性,我们说这两个变量具有相关关系.疑难疏引(1)对相关关系的理解应当注意以下几点:其一是相关关系与函数关系不同,因为函数关系是一种非常确定的关系,而相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.而函数关系可以看成是两个非随机变量之间的关系.因此,不能把相关关系等同于函数关系.其二是函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.例如,有人发现,对于在校儿童,鞋的大小与阅读能力有很强的相关关系.然而,学会新词并不能使脚变大,而是涉及到第三个因素——年龄.当儿童长大一些,他们的阅读能力会提高,而且由于长大,脚也变大.其三是在现实生活中存在着大量的相关关系,如何判断和描述相关关系,统计学发挥着非常重要的作用.变量之间的相关关系带有不确定性,这需要通过收集大量的数据,对数据进行统计分析,发现规律,才能作出科学的判断.(2)在考虑相关关系中的两个量的关系时,为了对变量之间的关系有一个大致的了解,我们通常将变量所对应的点描出来,这些点就组成了具有相关关系的变量之间的一组数据的图形,通常称这种图为变量之间的散点图.根据散点图中变量的对应点的离散程度,我们也可以准确地判断两个变量是否具有相关关系.散点图中变量的对应点如果分布在某条直线的周围,我们就可以得出结论,这两个变量具有相关关系.如果变量的对应点分布没有规律,我们就可以得出结论:这两个变量不具有相关关系.案例1 下列关系中,带有随机性相关关系的是____________.①正方形的边长与面积之间的关系②水稻产量与施肥量之间的关系③人的身高与年龄之间的关系④降雪量与交通事故的发生率之间的关系【探究】两变量之间的关系有两种:函数关系与带有随机性的相关关系.①正方形的边长与面积之间的关系是函数关系.②水稻产量与施肥量之间不是严格的函数关系,但是具有相关性,因而是相关关系.③人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而他们不具相关关系.④降雪量与交通事故的发生率之间具有相关关系.答案:②④规律总结准确理解变量间的相关关系是解答本题的关键.要准确区分两变量间相关关系和函数关系,事实上,现实生活中相关关系是到处存在的,从某种意义上讲,函数关系可以看作一种理想关系模型,而相关关系是一种普遍的关系.两者区别的关键点是“确定性”还是“随机性”.案例2 5个学生的数学和物理成绩如下表:学科学生 A B C D E 数学80 75 70 65 60物理70 66 68 64 62 画出散点图,并判断它们是否有相关关系.【探究】涉及两个变量:数学成绩与物理成绩,可以以数学成绩为自变量,考查因变量物理成绩的变化趋势.以x轴表示数学成绩,y轴表示物理成绩,可得相应的散点图.由散点图(上图)可见,两者之间具有相关关系.规律总结判断变量之间有无相关关系,一种常用的简便可行的方法是绘散点图,散点图是由数据点分布构成,是分析研究两个变量相关关系的重要手段.从散点图中,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量是线性相关的.2.最小二乘法(最小平方法)、线性回归方程(1)线性相关关系如果散点图中,相应于具有相关关系的两个变量所有观察值的数据点分布在一条直线的附近,我们称这两个变量之间具有线性相关关系.也就是说能用直线方程=bx+a近似表示的相关关系叫线性相关关系.(2)最小二乘法(最小平方法)如果n个点:(x1,y1),(x2,y2),…,(x n,y n),可以用下面的表达式来刻画这些点与直线y=a+bx的接近程度:[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[y n-(a+bx n)]2.使得上式达到最小值的直线=bx+a就是我们所要求的直线,这种方法称为最小二乘法. (3)线性回归方程记线性回归方程为=bx+a,则系数a、b满足:b=(※)疑难疏引(1)我们知道,回归直线是与数据点最接近的直线,反映贴近程度的数据是:离差的平方和,即总离差Q=(y i-a-bx i)2.这样,回归直线就是所有直线中Q取最小值的那一条.这样使“离差平方和为最小”的方法,叫做最小二乘法.(最小平方法)(2)利用最小二乘法求回归系数a、b时,是将离差的平方和Q转化为关于a或b的二次函数,利用二次函数知识求得的.(3)借助散点图,可以直观地看出两个变量之间是否具有相关关系.用最小二乘法思想建立的回归直线方程,能定量地描述两个变量的关系.回归系数a和b,刻画了两个变量之间的变化趋势.利用回归直线,可以对问题进行预测,由一个变量的变化去推测另一个变量的变化.(4)求线性回归方程的一般步骤:①根据两组数据计算,,x i,y i,,x i y i;②代入(*)计算求a、b的值;③代入=a+bx.一般情况下,求线性回归方程可借助计算器和计算机来完成.另外,回归系数可简化为:b=,a=-b,这里x=x i,y=y i案例3 某产品的广告支出x与销售收入y(单位:万元)之间有下表所对应的数据.广告支出x(单位:万元) 1 2 3 4 销售收入y(单位:万元) 12 28 42 56 (1)画出表中数据的散点图;(2)求出y对x的回归直线方程;(3)若广告费为9万元,则销售收入约为多少万元?【探究】只有散点图大致表现为线性时,求回归直线方程才有实际意义.【解析】(1)散点图如下:(2)观察散点图可知各点大致分布在一条直线附近,列出下列表格,以备计算a、b.序号x y x2 y2 xy1 1 12 1 144 122 2 28 4 784 563 3 42 9 1 764 1264 4 56 16 3 136 224∑10 138 30 5 828 418 于是=,=,=30,=5 828,xy i=418,代入公式得:b==,a=-b=×=-2.故y对x的回归直线方程为=x-2,其中回归系数b=,它的意义是:广告支出每增加1万元,销售收入y平均增加万元.(3)当x=9万元时,=×9-2=129.4万元.即广告费为9万元,则销售收入为129.4万元.规律总结(1)对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数a、b的计算公式,算出a、b,由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误.(2)在利用公式:b=,a=-b来计算回归系数时,为了方便常制表对应出x i y i, ,以利于求和.(3)研究变量间的相关关系,求得回归直线方程能帮助发现事物发展的一些规律,补充积累资料的不足,估计预测某些数据,为我们的判断和决策提供依据.活学巧用1.下列两变量中具有相关关系的是()A.正方体的体积与边长B.匀速行驶的车辆的行驶距离与时间C.人的身高与体重D.人的身高与视力解析:选C.本题主要考查变量间的相关性,其中A,B均为函数关系,D则无相关关系.答案:C2.下列各关系中不属于相关关系的是()A.产品成本与生产数量B.球的表面积与体积C.家庭的支出与收入D.人的年龄与体重解析:球的表面积与体积之间是函数关系,不属于相关关系,选B.答案:B3.下列关系属于负相关的是()A.父母的身高与子女身高的关系B.农作物产量与施肥量的关系C.吸烟与健康的关系D.数学成绩与物理成绩的关系解析:吸烟有害健康,因此,吸烟与健康之间的关系属于负相关.答案:C4.下列两个变量之间的关系哪个不是函数关系()A.圆的半径和它的面积B.正方形边长和它的面积C.正n边形的边数和顶点角度之和D.期中考试数学成绩与复习时间的投入量解析:期中考试数学成绩与复习时间的投入量是相关关系而不是函数关系.答案:D5.“名师出高徒”可以解释为教师的水平越高,学生的水平也越高.那么,教师的水平与学生的水平成什么相关关系?你能举出更多的描述生活中的两个变量相关关系的成语吗?解析:“名师出高徒”的意思是说有名的教师一定能教出高明的徒弟,通常情况下,高水平的教师有很大趋势教出高水平的学生,所以,教师的水平与学生的水平成正相关关系,生活中这样的成语很多,如“龙生龙,凤生凤,老鼠的孩子会打洞” .6.现随机抽取某校10名学生在入学考试中的数学成绩x与入学后的第一次数学成绩y,数据如下:学号 1 2 3 4 5 6 7 8 9 10 x 120 108 117 104 103 110 104 105 99 108 y 84 64 84 68 69 68 69 46 57 71 问这10名学生的两次数学考试成绩是否具有相关关系?解析:应用散点图分析.两次数学考试成绩散点图如下图所示.由散点图可以看出两个变量的对应点集中在一条直线的周围,且y随x的变大而变大,具有正相关关系.因此,这10名学生的两次数学考试成绩具有相关关系.7.变量y与x之间的回归方程()A.表示y与x之间的函数关系B.表示y和x之间的不确定性关系C.反映y和x之间真实关系的形式D.反映y与x之间的真实关系达到最大限度的吻合解析:回归直线是与数据点最贴近的直线,y与x之间的回归方程,反映了y与x之间的真实关系达到最大限度的吻合.答案:D8.设有一个回归方程=2-1.5x,当变量x增加一个单位时()A.y平均增加 1.5个单位B.y平均增加2个单位C.y平均减少 1.5个单位D.y平均减少2个单位解析:=2-1.5(x+1)=2-1.5x-1.5=-1.5.答案:C9.线性回归方程表示的直线=a+bx必定过()A.(0,0)点B.(,0)点C.(0, )点D.(,)点解析:回归直线函数a、b有公式a=-b,即y=a+b∴直线=a+bx必定过(,)点.答案:D10.回归直线方程的系数a,b的最小二乘估计a,b,使函数Q(a,b)最小,Q函数指()A.(y i-a-bx i)2B.|y i-a-bx i|C.(y i-a-bx i)2D.|y i-a-bx i|解析:Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(y n-bx n-a)2=(y i-bx i-a)2.答案:A11.观测两相关变量得如下数据:x y-1 -9-2 -7-3 -5-4 -3-5 -15 13 54 32 71 9则两变量间的回归直线方程是()A.y=x-1B.y=xC.y=2x+D.y=x+1解析:由线性回归方程系数的求解公式,易得b==1,a=-b=0.∴线性回归方程为y=x.答案:B12.以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:房屋面积(m2) 115 110 80 135 105销售价格(万元) 24.8 21.6 18.4 29.2 22 (1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线;(3)据(2)的结果估计当房屋面积为150 m2时的销售价格.解析:(1)数据对应的散点图如下图所示:(2)=x i=109,(x i-)2=1 570,=23.2,(x i-)(y i-)=311.2.设所求回归直线方程为=bx+a,则==≈0.198 2,=-b=23.2-109×0.198 2≈1.596 2.故所求回归直线方程为=-0.198 2x+1.596 2.(3)据(2),当x=150 m2时,销售价格的估计值为:=0.198 2×150+1.596 2=31.326 2(万元).13.为研究某市家庭年平均收入与年平均生活支出的关系,该市统计调查队随机调查了10个家庭,得数据如下:i(家庭编号) 1 2 3 4 5 6 7 8 9 10 x i(收入)(千元)0.8 1.1 1.3 1.5 1.5 1.8 2.0 2.2 2.4 2.8 y i(支出)(千元)0.7 1.0 1.2 1.0 1.3 1.5 1.3 1.7 2.0 2.5求回归直线方程.解析:列表i 1 2 3 4 5 6 7 8 9 10 x i 0.8 1.1 1.3 1.5 1.5 1.8 2 2 2.4 2.8 y i 0.7 1.0 1.2 1.0 1.3 1.5 1.3 1.7 2.0 2.5 x i y i 0.56 1.10 1.56 1.50 1.95 2.70 2.60 3.40 4.80 7.000.64 1.21 1.69 2.25 2.25 3.24 4.00 4.00 5.76 7.840.49 1.0 1.44 1.00 1.69 2.25 1.69 2.89 4.0 6.25故可求得==1.72,==1.42,=32.88,=22.7,x i y i=27.17.∴b=0.833,a=-0.013.∴回归直线方程为y=0.833x-0.013.。
2.4 线性回归方程自我检测 基础达标 一、选择题1.下列有关线性回归的说法,不正确的是( )A .自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B .在平面直角坐标系中用描点的方法得到具有相关关系的两个变量的一组数据的图形叫做散点图C .线性回归直线能得到具有代表意义的回归直线方程D .任何一组观测值都能得到具有代表意义的回归直线方程 答案:D2.下列命题中正确的为( )①任何两个变量都具有相关关系 ②圆的周长与该圆的半径具有相关关系 ③某商品的需求与该商品的价格是一种非确定性关系 ④根据散点图求得的回归直线方程可能是没有意义的 ⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究A .①③④ B.②④⑤ C .③④⑤ D.②③⑤ 答案:C3.观测两相关变量得如下数据:x -1 -2 -3 -4 -5 5 4 3 2 1 y -1 -2 -3 -3 -5 54321则两变量间的回归直线方程为( )A .yˆ=21x-1 B .yˆ=0.964x C .yˆ=2x+31D .y ˆ=0.964x+0.1 答案:D4.由一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到的回归直线方程yˆ=bx+a,那么下面说法不正确的是( )A .直线yˆ=bx+a 必经过点(x ,y ) B .直线y ˆ=bx+a 至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点C .直线yˆ=bx+a 的斜率为2121)(x n xyx n yx ni ini ii--∑∑==D .直线y ˆ=bx+a 和各点(x 1,y 1),(x 2,y 2),…,(x n ,y n )的偏差∑=+-ni i ia bx y12)]([是该坐标平面上所有直线与这些点的偏差中最小的答案:B5.下列变量中具有相关关系的是( ) A .正方形的体积和边长 B .人的身高与体重C .匀速行驶车辆的行驶距离与时间D .球的半径与体积 答案:B6.一位同学对自家所开小卖部就“气温与热饮杯的销售量进行调查”,根据统计结果,该生运用所学知识得到气温x℃与当天销售量y (个)之间的线性回归方程y ˆ=-2.352x+147.767,估计在x=2℃时,可卖出热饮杯的个数为( )A .128B .134C .143D .109 答案:C7.下列两个变量之间的关系不是函数关系的是( ) A .正方体的体积与棱长 B .角的度数和它的正弦值C .单产为常数时,土地面积和总产量D .日照时间与水稻的亩产量 答案:D8.统计中用相关系数r 来衡量两个变量之间线性关系的强弱,对应于变量x 取值x i ,变量y 的观测值为y i(1≤i≤n).若计算得相关系数r=0.8 ,则对变量x 、y 的相关强弱为( ) A .相关性很强 B .相关性一般 C .相关性很弱 D .不相关 答案:A9.两个变量成负相关关系时,散点图的特征是( ) A .点散布特征为从左下角到右上角区域 B .点散布在某带形区域内 C .点散布在某圆形区域内D .点散布特征为从左上角到右下角区域内 答案:D 10.某医学科研所对人体脂肪含量与年龄这两个变量的一组随机样本数据,运用Excel 软件计算得yˆ=0.577x-0.448(x 为人的年龄,y 为人体脂肪含量).对年龄为37的人来说,下列说法正确的是( )A.年龄为37的人体内脂肪含量为20.90%B.年龄为37的人体内脂肪含量约为20.90%C.年龄为37的人群中的大部分人的体内脂肪含量约为20.90%D.年龄为37的大部分人的体内脂肪含量为20.90%答案:C二、填空题11.已知回归直线方程yˆ=0.50x-0.81,则当x=25时,y的估计值为_________.答案:11.6912.用科学计算器求回归方程的过程中,进入回归计算模式键是_________.答案:13.对某种产品表面进行腐蚀刻线实验,腐蚀深度y (μm)与时间x (s)之间有线性相关关系,回归方程为yˆ=0.304x+5.36,则回归系数b=0.304的实质意义是_____________.答案:腐蚀时间x每增加1s,估计深度y平均增加0.304个μm(或腐蚀速度为0.304μm/s)14.在研究硝酸钠的可溶性程度时,在不同的温度观测它在水中的溶解度,得观测结果如下表:温度(x)0 10 20 50 70溶解度(y)66.7 76.0 85.0 112.3 128.0由此得到回归直线的斜率是___________答案:0.880 9三、解答题15.设对变量x,Y有如下观察数据:x 151 152 153 154 156 157 158 160 160 162 163 164Y 40 41 41.5 41.5 42 42.5 43 44 45 45 46 45.5使用科学计算器求Y对x的回归直线方程.(结果保留4位小数)并写出操作过程.解:计算得:a=-26.057 3,b=0.438 967回归直线方程为yˆ=0.438 967x-26.057 3,操作过程略.16.一台机器由于使用时间较长,但还可以使用.它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少随机器运转的速度而变化,下表为抽样试验结果:转速(x转/秒)16 14 12 8每小时生产有缺点的零件数(y件)11 9 8 5(1)如果y与x有线性相关关系,求回归直线方程;(2)求线性相关系数;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为10 个,那么,机器的运转速度应控制在什么范围内?解:(1)计算得:a=-0.857 5,b=0.728 6回归直线方程为yˆ=0.728 6x-0.857 5.(2)相关系数r=0.995.(3)x≤14.901 9.17.在对某产品进行耐压强度试验中,运用刻线试验方法,得到凹陷深度Y与挤压冲力x 个单位(N)之间相应的一组观察值,如下表:x(N) 5 10 15 20 30 40 50 60 70 90 100Y(μm) 6 10 10 13 16 17 19 23 25 29 46(1)画出表中数据的散点图;(2)求Y对x的回归直线方程;(3)试预测冲击力为100N时,凹陷深度是多少?解:(1)散点图略.(2)计算得:a=4.82,b=0.329.回归直线方程为yˆ=0.329x+4.82.(3)38.26μm.更上一层1.下列语句所表示的事件中的因素不具有相关关系的是()A.吸烟有害健康B.乌鸦叫,没好兆C.粮食产量与施肥量D.名师出高徒答案:B2.下列关于回归直线的命题,正确的个数是()①回归直线通过散点图的中心(x,y)②回归直线必经过散点图的多个点③对给定数据组(x i,y i)(1≤i≤n)得出的散点图,回归直线可有多条④如果散点图中点的分布从整体上看大致在一条直线附近,且散点图中各点到这条直线的距离差最小,这条直线是回归直线A.0 B.1C.2 D.3答案:C3.改革开放以来,我国高等教育事业迅速发展.为调查某省从1990年到2000年农村18岁到24岁的青年人每年考入大学的百分比,为便于统计,把1990年到2000年的年号依次编号为0,1,…,10作为自变量x,每年考入大学的百分比作为因变量y,进行回归分析,得到回归直线yˆ=0.42x+1.80.下列对数据解释正确的是()①每年升入大学的百分比为1.80 ②升入大学的18岁到24岁的人数按大约每年0.42%的速度递增 ③1990年升入大学的百分比约为1.80%,2000年升入大学的百分比约为6% ④从1990年到2000年升入大学的人数成等距离增加 A .①②B .①③C .②④D .②③ 答案:D4.观察下列四个散点图,两变量具有线性相关关系的是( )答案:A5.对相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),所求回归方程为yˆ=bx+a ,其中回归直线的斜率为( )A .∑=ni i i y x n 11B .x yC .2121)(x n xyx n yx ni ini ii--∑∑==D .∑=ni ii yx yx 1答案:C6.下列两个变量具有相关关系的是( ) A .三角形的面积与三角形的底和高的乘积 B .粮食单产量与光照时间C .圆柱的体积与底面圆的半径D .人的寿命与生辰属相 答案:B7.在七块并排的形状、大小相同的试验田上进行施化肥量对水稻产量影响的试验,得到如下所示的一组数据.(单位:kg )施化肥量x 15 202530 354045 水稻产量y 330345 365405445 450455则由此得到的回归直线的斜率是( ) A .4.57 B .4.75 C .3.94D .5.35 答案:B8.对相关关系的两个变量x 、y ,与相关强对应的相关系数r 满足( ) A .r∈[0.5,0.9] B .r∈[0.75,1] C .|r|∈[0.75,1] D .r∈[-1,-0.75] 答案:C9.现抽取某校高一10名学生入学考试中的数学成绩x 和入学后的第一次考试数学成绩y ,统计计算得x =107.8,∑(x i )2=116 584,y =68,∑(y i )2=47 384,∑x i y i =73 796,则两次数学成绩的关系( ) A .相关强 B .不相关 C .没关系 D .相关一般 答案:A 10.某考察团对全国10大城市进行职工人均平均工资x 与居民人均消费y 进行统计调查,y与x 具有相关关系,回归方程y ˆ=0.66x+1.562(单位:千元),若某城市居民消费水平为7.675,估计该城市消费额占人均工资收入的百分比为( ) A .66% B .72.3% C .67.3% D .83% 答案:D11.回归直线方程yˆ=bx+a 中,b=__________,a=___________. 答案:x b y x n xyx n yx ni ini ii---∑∑==2121)(12.对某种机器购置后运营年限x (1,2,3,…)与当年增加利润y 的统计分析知具备线性相关关系,回归方程为yˆ=10.47-1.3x,估计这种机器使用_________年最合算.答案:813.某工厂实行效益工资,工人月工资y(元)与其劳动生产率x(千元)的回归方程为yˆ=50+80x,则该回归直线的斜率b=80的含义为__________.答案:劳动生产率提高1 000元,则工资提高80元14.对具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),… ,(x n,y n),回归方程为yˆ=bx+a,求Q=_________的最小值而得出回归方程的方法,叫最小二乘法.答案:∑==--niiiniabxy12)21()(,,,Λ15.5个学生的数学和物理成绩如下表:学生学科A B C D E数学80 75 70 65 60物理70 66 68 64 62(1)画出散点图;(2)确定回归方程.解:(1)散点图略.(2)计算得:a=40.8,b=0.36.回归直线方程为yˆ=0.36x+40.8.16.现对x ,y有如下观测数据:x 18 25 30 39 41 42 49 52y 3 5 6 7 8 8 9 10试求y对x的线性回归方程.解:计算得:a=-0.067,b=0.191.回归直线方程为yˆ=0.191x-0.067.17.某公司抽查5位职工的月收入及储蓄额(单位:元)得到如下对应数据:x 700 800 950 1 000 1 200y 254 281 317 331 382(1)作散点图;(2)如果y与x之间具有线性相关关系,求回归直线方程.解:(1)散点图略.(2)计算得:a=76.13,b=0.254 7.回归直线方程为yˆ=0.254 7x+76.13.18.某厂某产品的产量x(单位:千件)与单位成本y(单位:万元/千件)的对应数据如下:(1)对变量y与x作出散点图;(2)若y与x具有线性相关关系,求回归直线方程;(3)预测产量x=25千件时的单位成本.解:(1)散点图略.(2)计算得:a=732,b=-8.回归直线方程为yˆ=-8x+732.(3)当x=25时,yˆ=-8×25+732=532万元/千件.。