高一数学人教A版必修3学业分层测评14 变量间的相关关系(附答案)
- 格式:doc
- 大小:160.97 KB
- 文档页数:9
学业分层测评(十四)变量间的相关关系(建议用时:45分钟)[学业达标]一、选择题1.(2015·张掖高一检测)有几组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩;③立方体的棱长和体积.其中两个变量成正相关的是( )A.①③B.②③C.②D.③【解析】①是负相关;②是正相关;③是函数关系,不是相关关系.【答案】 C2.对于给定的两个变量的统计数据,下列说法正确的是( )A.都可以分析出两个变量的关系B.都可以用一条直线近似地表示两者的关系C.都可以作出散点图D.都可以用确定的表达式表示两者的关系【解析】由两个变量的数据统计,不能分析出两个变量的关系,A错;不具有线性相关的两个变量不能用一条直线近似地表示他们的关系,更不能用确定的表达式表示他们的关系,B,D错.【答案】 C3.对有线性相关关系的两个变量建立的回归直线方程y^=a^+b^ x中,回归系数b^( )A.不能小于0 B.不能大于0C.不能等于0 D.只能小于0【解析】当b^=0时,r=0,这时不具有线性相关关系,但b^能大于0,也能小于0.【答案】 C4.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y与x负相关且y^=2.347x-6.423;②y与x负相关且y^=-3.476x+5.648;③y与x正相关且y^=5.437x+8.493;④y与x正相关且y^=-4.326x-4.578.其中一定不正确...的结论的序号是( )A.①②B.②③C.③④D.①④【解析】由正负相关性的定义知①④一定不正确.【答案】 D5.某产品的广告费用x与销售额y的统计数据如下表:广告费用x/万元423 5销售额y/万元49263954根据上表可得回归方程y^=b^x+a^中的b^为9.4,据此模型预报广告费用为6万元时,销售额为( )A.63.6万元B.65.5万元C.67.7万元D.72.0万元【解析】x-=14(4+2+3+5)=3.5,-y=14(49+26+39+54)=42,所以a^=-y-b^x-=42-9.4×3.5=9.1,所以回归方程为y^=9.4x+9.1,令x=6,得y^=9.4×6+9.1=65.5(万元).故选B.【答案】 B二、填空题6.若施化肥量x(千克/亩)与水稻产量y(千克/亩)的回归方程为y^=5x+250,当施化肥量为80千克/亩时,预计水稻产量为亩产________千克左右.【解析】当x=80时,y^=400+250=650.【答案】6507.已知一个回归直线方程为y^=1.5x+45,x∈{1,7,5,13,19},则-y =________.【解析】因为x-=15(1+7+5+13+19)=9,且回归直线过样本中心点(x-,-y),所以-y=1.5×9+45=58.5.【答案】58.58.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x 的回归直线方程:y^。
§2.3 变量间的相关关系课时目标 1.理解两个变量的相关关系的概念.2.会作散点图,并利用散点图判断两个变量之间是否具有相关关系.3.会求回归直线方程.1.相关关系:与函数关系不同,相关关系是一种__________性关系.2.从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为________,点散布在从左上角到右下角的区域内,两个变量的相关关系为________.3.如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量之间具有____________,这条直线叫__________.4.回归直线方程y ^=b ^x +a ^,其中⎩⎪⎨⎪⎧b ^=∑i =1n-x -y ∑i =1n-x =∑i =1nxiyi -n x y∑i =1nx2i -n x 2,a ^= .b ^是回归方程的斜率,a ^是截距.5.通过求Q =∑i =1n(yi -bxi -a)2的最小值而得出回归直线的方法,即求出的回归直线使样本数据中的点到它的距离的平方和最小,由于平方又叫二乘方,所以这种使“偏差平方和最小”的方法叫做______________.一、选择题1.下列两个变量之间的关系,哪个不是函数关系?( ) A .匀速行驶车辆的行驶距离与时间 B .圆半径与圆的面积C .正n 边形的边数与内角度数之和D .人的年龄与身高2.下列有关线性回归的说法,不正确的是( )A .变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B .在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫做散点图C .回归直线方程最能代表观测值x 、y 之间的关系D .任何一组观测值都能得到具有代表意义的回归直线方程3.工人月工资(元)依劳动生产率(千元)变化的回归直线方程为y ^=60+90x ,下列判断正确的是( ) A .劳动生产率为1千元时,工资为50元 B .劳动生产率提高1千元时,工资提高150元 C .劳动生产率提高1千元时,工资约提高90元 D .劳动生产率为1千元时,工资90元4.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是( ) A.y ^ =-10x +200 B.y ^=10x +200 C.y ^ =-10x -200 D.y ^=10x -2005.给出两组数据x 、y 的对应值如下表,若已知x 、y 是线性相关的,且回归直线方程:y =a ^ +b ^x ,经计算知:b ^ =-1.4,则a ^为( )A. 17.4 B .-1.74 C .0.6 D .-0.6 6.回归直线方程表示的直线y ^ =a ^ +b ^x 必经过点( ) A .(0,0) B .(x ,0) C .(x ,y ) D .(0,y )二、填空题7.若对某个地区人均工资x 与该地区人均消费y 进行调查统计得y 与x 具有相关关系,且回归直线方程y ^=0.7x +2.1(单位:千元),若该地区人均消费水平为10.5,则估计该地区人均消费额占人均工资收入的百分比约为________.8.设有一个回归方程y ^=3-2.5x ,当变量x 增加一个单位时,变量y________个单位.9.期中考试后,某校高三(9)班对全班65名学生的成绩进行分析,得到数学成绩y 对总成绩x 的回归直线方程为y ^=6+0.4x.由此可以估计:若两个同学的总成绩相差50分,则他们的数学成绩大约相差______分. 三、解答题10.下表是某旅游区游客数量与平均气温的对比表:若已知游客数量与平均气温是线性相关的,求回归方程.11.5个学生的数学和物理成绩(单位:分)如下表:画出散点图,判断它们是否具有相关关系,若相关,求出回归方程.能力提升12.在研究硝酸钠的可溶性程度时,观测它在不同温度的水中的溶解度,得观测结果如下:则由此得到回归直线的斜率约为________.13.20世纪初的一项关于16艘轮船的研究显示,轮船的吨位从192~3 246吨,船员的数目从5~32人,对船员人数关于轮船的吨位数的回归分析得:船员人数=9.5+0.006 2×轮船吨位.(1)假设两轮船吨位相差1 000吨,船员人数平均相差多少?(2)对于最小的轮船估计的船员人数是多少?对于最大的轮船估计的船员人数是多少?1.由最小二乘法得⎩⎪⎨⎪⎧b ^ =∑n i =1 -x i -y ∑ni =1 -x =∑ni =1xiyi -n x y ∑ni =1x2i -n x 2a ^ =y -b ^x其中:b ^ 是回归方程的斜率,a ^是截距. 2.回归方程的求解过程 计算x ,y ,∑n i =1x2i ,∑ni =1xiyi计算b ^ =∑ni =1xiyi -n x y ∑n i =1x2i -n x 2,a ^ =y -b ^ x⇓y ^ =b ^ x +a ^3.在回归方程y ^=bx +a 中,当回归系数b>0时,说明两个变量呈正相关关系,它的意义是:当x 每增加一个单位时y 就增加b 个单位;当b<0时,说明两个变量呈负相关关系,它的意义是:当x 每增加一个单位时,y 就减少b 个单位. 答案:§2.3 变量间的相关关系 知识梳理1.非确定 2.正相关 负相关 3.线性相关关系 回归直线 4.y -b ^x 5.最小二乘法 作业设计1.D [人的年龄与身高具有相关关系.]2.D [只有所有的数据点都分布在一条直线附近时,才能得到具有代表意义的回归直线.]3.C [因工人月工资与劳动生产率变化的回归直线方程为y ^ =60+90x ,当x 由a 提高到a +1时,y ^ 2-y ^1=60+90(a +1)-60-90a =90.] 4.A [∵y 与x 负相关,∴排除B 、D , 又∵C 项中x>0时y ^<0不合题意,∴C 错.] 5.A [x =15(4+5+6+7+8)=6, y =15(12+10+9+8+6)=9.a ^ =y -b ^x =9+1.4×6=9+8.4=17.4.] 6.C [由a ^ =y -b ^ x 得y =b ^ x +a ^, 即点(x ,y )适合方程y ^ =a ^ +b ^x .] 7.87.5%解析 设该地区人均工资收入为y , 则y =0.7x +2.1, 当y =10.5时,x =10.5-2.10.7=12.10.512×100%=87.5%. 8.减少2.5解析 y ^ ′=3-2.5(x +1)=3-2.5x -2.5=y ^-2.5, 因此,y 的值平均减少2.5个单位. 9.20解析 令两人的总成绩分别为x1,x2. 则对应的数学成绩估计为 y ^ =6+0.4x1,y ^2=6+0.4x2,所以|y ^ 1-y ^2|=|0.4(x1-x2)|=0.4×50=20.10.解 x =706=353,y =2306=1153,∑6i =1x2i =1+16+100+169+324+676=1 286,∑6i =1xiyi =-20+96+340+13×38+18×50+26×64=3 474.b ^ =∑6i =1xiyi -6x y∑6i =1x2i -6x 2=3 474-6×353×11531 286-353≈1.68,a ^ =y -b ^x ≈18.73,即所求的回归方程为y ^=1.68x +18.73.11.解 以x 轴表示数学成绩,y 轴表示物理成绩,可得到相应的散点图如图所示:由散点图可知,两者之间具有相关关系,且为线性相关. 列表,计算设所求回归方程为y ^ =b ^ x +a ^,则由上表可得b ^ =∑5i =1xiyi -5x y ∑5i =1x2i -5x 2=90250=0.36,a ^ =y -b ^ x =40.8.∴所求回归方程为y ^=0.36x +40.8. 12.0.880 9解析 x =30,y =93.6,∑5i =1x2i =7 900, ∑5i =1xiyi =17 035, 所以回归直线的斜率b ^=∑5i =1xiyi -5x y ∑5i =1x2i -5x 2=17 035-5×30×93.67 900-4 500≈0.880 9.13.解 (1)由y ^ =9.5+0.006 2x 可知,当x1与x2相差1 000吨时,船员平均人数相差y ^ 1-y ^ 2=(9.5+0.006 2x1)-(9.5+0.006 2x2)=0.006 2×1000≈6(人).(2)当取最小吨位192时,预计船员人数为y ^=9.5+0.006 2×192≈10(人). 当取最大吨位3 246时,预计船员人数为y ^=9.5+0.006 2×3 246≈29(人).。
分层训练·进阶冲关A组基础练(建议用时20分钟)1.下列四个选项中,关于两个变量所具有的相关关系描述正确的是( D )A.圆的面积与半径具有相关关系B.纯净度与净化次数不具有相关关系C.作物的产量与人的耕耘是负相关关系D.学习成绩与学习效率是正相关关系2.某旅行社为迎节日搞活动旅游,经市场调查,某旅游线路销量y(人)与旅游单价(元/人)负相关,则其回归方程可能是( A )A.=-80+1 600B.=80+1 600C.=-80-1 600D.=80-1 6003.具有线性相关关系的变量,y的一组数据如表所示.若根据表中数据得出y与的回归直线方程为=3-,则m的值是( A )0 1 2 3A.4B.C.5.5D.64.四名同学根据各自的样本数据研究变量,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论;①y与负相关且=2.347-6.423;②y与负相关且=-3.476+5.648;③y与正相关且=5.437+8.493;④y与正相关且=-4.326-4.578.其中一定不正确的结论的序号是 ( D ) A.①②B.②③C.③④D.①④5.为了解某社区居民购买水果和牛奶的年支出费用与购买食品的年支出费用的关系,随机调查了该社区5户家庭,得到如下统计数据表;根据上表可得回归直线方程=+,其中=0.59,=-,据此估计,该社区一户购买食品的年支出费用为3.00万元的家庭购买水果和牛奶的年支出费用约 为( A ) A.1.795万元 B.2.555万元 C.1.915万元D.1.945万元6.在一组样本数据(1,y 1),(2,y 2),…,(n ,y n )(n ≥2,1,2,…,n 不全相等)的散点图中,若所有样本点(i ,y i )(i=1,2,…,n)都在直线y=+1上,则这组样本数据的样本相关系数为( D )A.-1B.0C.D.17.经调查某地若干户家庭的年收入(万元)和年饮食支出y(万元)具有线性相关关系,并得到y 关于的回归直线方程;=0.245+0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加 0.245 万元.8.一位母亲记录了儿子3~9岁的身高,数据略,建立的身高与年龄的回归模型为=7.19+73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是③.①身高一定是145.83 cm ②身高145.83 cm以上③身高在145.83 cm左右④身高在145.83 cm以下9.已知与y之间的一组数据;则y必过点(1.5,4).10.某单位为了了解用电量y度与气温℃之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表;为68度.11.为了研究男羽毛球运动员的身高(单位;cm)与体重y(单位;g)的关系,通过随机抽样的方法,抽取5名运动员测得他们的身高与体重关系如下表;【解析】=176,=75,-i-yi===0.4,=-=4.6,所以=0.4+4.6.12.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据;(1)求回归直线方程=+,其中=-20,=-.(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)【解析】(1)=×(8+8.2+8.4+8.6+8.8+9)=8.5.=×(90+84+83+80+75+68)=80.=+20=80+20×8.5=250,=-20+250.(2)工厂获得利润=(-4)y=-202+330-1 000,由二次函数知识可知当=时,=361.25(元).ma故该产品的单价应定为8.25元.B组提升练(建议用时20分钟)13.已知由一组样本数据确定的回归直线方程为=1.5+1,且=2,发现有两个数据(2.6,2.8)与(1.4,5.2)误差较大,去掉这两个数据后,重新求得回归直线的斜率为1.4,那么当=6时,的值为( A )A.9.6B.10C.10.6D.9.414.已知与y之间的几组数据如表;据(1,0)和(2,2)求得的直线方程为y′=b′+a′,则以下结论正确的是( C ) A.>b′,>a′ B.>b′,<a′C.<b′,>a′D.<b′,<a′15.某服装商场为了了解毛衣的月销售量y(件)与月平均气温(℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表;约为6℃,据此估计,该商场下个月毛衣的销售量约为46件.16.在2018年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价元和销售量y件之间的一组数据如下表所示;由散点图可知,销售量y 与价格之间有较强的线性相关关系,其线性回归方程是=-3.2+40,且m+n=20,则其中的n= 10 .17.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下;(1)(2)求出y 关于的线性回归方程=+,并在坐标系中画出回归直线. (3)试预测加工10个零件需要多少时间?注;=,=-.【解析】(1)散点图如图;(2)由表中数据得;i y i=52.5,=3.5,=3.5,=54,所以==0.7,所以=-=1.05,所以=0.7+1.05.回归直线如图中所示.(3)将=10代入回归直线方程,得=0.7×10+1.05=8.05(小时).所以预测加工10个零件需要8.05小时.18.根据“2015年国民经济和社会发展统计公报”中公布的数据,从2011年到2015年,我国的第三产业在GDP中的比重如下;(2)建立第三产业在GDP中的比重y关于年份代码的回归方程.(3)按照当前的变化趋势,预测2018年我国第三产业在GDP中的比重.附;回归直线=+的斜率和截距的最小二乘估计分别为=,= -.【解析】(1)数据对应的散点图如图所示.(2)=3,=47.06,===1.5,=-=42.56,所以回归直线方程为=1.5+42.56.(3)代入2018年的年份代码=8,得=1.5×8+42.56=54.56,所以按照当时的变化趋势,预计到2018年,我国第三产业在GDP中的比重将达到54.56%.C组培优练(建议用时15分钟)19.某考察团对10个城市的职工人均工资(千元)与居民人均消费y(千元)进行调查统计,得出y与具有线性相关关系,且回归方程为=0.6+1.2.若某城市职工人均工资为5千元,估计该城市人均消费额占人均工资收入的百分比为( D )A.66%B.67%C.79%D.84%20.一家商场为了确定营销策略,进行了四次投入促销费用和商场实际销售额的试验,得到如下数据.(1)较好的线性相关性.(2)求出,y之间的回归直线方程=+.(3)若该商场计划营销额不低于600万元,则至少要投入多少万元的促销费用? 【解析】(1)散点图如图所示,从图上可以看出两个变量具有较好的线性相关性.(2)==4,==250,(-)2=(2-4)2+(3-4)2+(5-4)2+(6-4)2i=4+1+1+4=10,(i -)(y i -)=(-2)×(-150)+(-1)×(-50)+1×50+2×150=700.==70,=-=250-70×4=-30.故所求的回归直线方程为=70-30.(3)令70-30≥600,即≥=9(万元),即若该商场计划营销额不低于600万元,则至少要投入9万元的促销费用.。
变量的相关性【学习目标】1.明确两个变量具有相关关系的意义;2.知道回归分析的意义;3.知道回归直线、回归直线方程、线性回归分析的意义;4.掌握对两个变量进行线性回归的方法和步骤,并能借助科学计算器确定实际问题中两个变量间的回归直线方程;【要点梳理】要点一、变量之间的相关关系变量与变量之间存在着两种关系:一种是函数关系,另一种是相关关系。
1.函数关系函数关系是一种确定性关系,如y=kx+b,变量x取的每一个值,y都有唯一确定的值和它相对应。
2.相关关系变量间确定存在关系,但又不具备函数关系所要求的确定性相关关系分为两种:正相关和负相关要点诠释:对相关关系的理解应当注意以下几点:(1)相关关系与函数关系不同.因为函数关系是一种非常确定的关系,而相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.而函数关系可以看成是两个非随机变量之间的关系.因此,不能把相关关系等同于函数关系.(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.例如,有人发现,对于在校儿童,鞋的大小与阅读能力有很强的相关关系.然而,学会新词并不能使脚变大,而是涉及到第三个因素——年龄.当儿童长大一些,他们的阅读能力会提高而且由于长大脚也变大.(3)函数关系与相关关系之间有着密切联系,在一定的条件下可以相互转化.例如正方形面积S与其边长x间虽然是一种确定性关系,但在每次测量边长时,由于测量误差等原因,其数值大小又表现出一种随机性.而对于具有线性关系的两个变量来说,当求得其回归直线后,我们又可以用一种确定性的关系对这两个变量间的关系进行估计.3.散点图将收集到的两个变量的统计数据分别作为横、纵坐标,在直角坐标系中描点,这样的图叫做散点图。
通过散点图可初步判断两个变量之间是否具有相关关系,她反映了各数据的密切程度。
要点二、正相关、负相关(1)正相关:在统计数据中的两个变量,一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关。
第八章成对数据的统计分析8.1成对数据的统计相关性8.1.1变量的相关关系8.1.2样本相关系数课后篇巩固提升必备知识基础练1.下列说法正确的是()A.圆的面积与半径之间的关系是相关关系B.粮食产量与施肥量之间的关系是函数关系C.一定范围内,学生的成绩与学习时间呈现正相关关系D.人的体重与视力呈现负相关关系A,圆的面积与半径之间的关系是确定的关系,是函数关系,所以A错误;对于B,粮食产量与施肥量之间的关系不是函数关系,是相关关系,所以B错误;对于C,一定范围内,学生的成绩与学习时间呈现正相关关系,所以C正确;对于D,人的体重与视力是没有相关关系的,所以D错误.2.在下列各图中,两个变量具有相关关系的是()A.(1)(2)(3)B.(1)(3)(4)C.(2)(3)(4)D.(1)(2)(4)(1)、(2)、(3)中,散点图中的点大致分布在一条直线附近,呈带状分布,所以变量间具有线性相关关系;图(4)中,散点图中的点分布杂乱无章,不在一条直线附近,也不呈带状分布,所以变量间不具有线性相关关系.3.如下四个散点图中,呈现正相关关系的是(),依次分析选项:对于A,散点图中的点从左向右是上升的,且在一条直线附近,呈现正相关关系;对于B,散点图中的点从左向右是下降的,且在一条直线附近,呈现负相关关系;对于C,散点图中的点呈片状分布,没有明显的相关性;对于D,散点图中的点也呈片状分布,没有明显的相关性.4.为了比较甲、乙、丙三组数据的线性相关性的强弱,小郑分别计算了甲、乙、丙三组数据的线性相关系数,其数值分别为0.939,0.937,0.948,则()A.甲组数据的线性相关性最强,乙组数据的线性相关性最弱B.乙组数据的线性相关性最强,丙组数据的线性相关性最弱C.丙组数据的线性相关性最强,甲组数据的线性相关性最弱D.丙组数据的线性相关性最强,乙组数据的线性相关性最弱0.939,0.937,0.948,所以线性相关系数最大的丙组数据的线性相关性最强,线性相关系数最小的乙组数据的线性相关性最弱.5.下列两个变量之间具有相关关系的是.①正方形的边长a和面积S;②一个人的身高h和腿长x;③真空中的自由落体运动其下落的距离h和下落的时间t;④一个人的身高h和体重x.①,正方形的边长a和面积S是函数关系,不是相关关系;对于②,一般情况下,一个人的身高h和腿长x是正相关关系;对于③,真空中的自由落体运动其下落的距离h和下落的时间t是函数关系,不是相关关系;对于④,一般情况下,一个人的身高h和他的体重x是正相关关系.6.为了对某班考试成绩进行分析,现从全班同学中随机抽取8位同学,他们的数学、物理成绩对应如表.根据表中数据分析:是否可以认为变量x与y具有线性相关关系?物理分数y72 77 80 85 88 90 93 95=18×(60+65+70+75+80+85+90+95)=77.5,y =18×(72+77+80+85+88+90+93+95)=85.i=18(x i -x )(y i -y )=685, i=18(x i -x )2=1 050, i=18(y i -y )2=456. 所以线性相关系数r= i=18(x i -x )(y -y )√ i=1(x i -x )2 i=1(y i -y )2=√1 050×456≈0.99,接近于1,所以可以认为变量x 与y 具有线性相关关系.关键能力提升练7.在各散点图中,两个变量具有正相关关系的是( ),依次分析选项为:对于A,是相关关系,但不是正相关关系,不符合题意;对于B,是相关关系,也是正相关关系,符合题意;对于C,是相关关系,是负相关关系,不符合题意;对于D,所示的散点图中,样本点不呈带状分布,这两个变量不具有线性相关关系,不符合题意.8.甲、乙、丙、丁四位同学各自对x ,y 两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r ,如表:则哪位同学的试验结果体现两变量有更强的线性相关性?( )A.甲B.乙C.丙D.丁,丁同学的相关系数|r|=0.87为最大,所以丁同学的试验结果体现两变量有更强的线性相关性.9.(2021江西九江二模)恩格尔系数(Engel’s Coefficien)是食品支出总额占个人消费支出总额的比重.居民可支配收入是居民可用于最终消费支出和储蓄的总和,即居民可用于自由支配的收入.如图为我国2013年至2019年全国恩格尔系数和居民人均可支配收入的折线图.给出三个结论:①恩格尔系数与居民人均可支配收入之间存在负相关关系;②一个国家的恩格尔系数越小,说明这个国家越富裕;③一个家庭收入越少,则家庭收入中用来购买食品的支出所占的比重就越小.其中正确的是()A.①B.②C.①②D.②③,恩格尔系数在逐年下降,居民人均可支配收入在逐年增加,故两者之间存在负相关关系;恩格尔系数越小,居民人均可支配收入越多,经济越富裕,故选项①②正确.10.如图所示,5组数据(x,y)中去掉D(3,10)后,下列说法正确的是()A.相关系数r不变B.相关系数r变小C.负相关变为正相关D.解释变量x与预报变量y的相关性变强,去掉点D(3,10)后,y与x的线性相关性加强,相关系数r变大,选项A错误,选项B错误;仍然是正相关,选项C错误;解释变量x与预报变量y的相关性变强,所以选项D正确.11.如图是某市2019年4月至2020年3月每月最低气温与最高气温(单位:℃)的折线统计图.已知每月最低气温与最高气温的线性相关系数r=0.83,则下列结论错误的是()A.每月最低气温与最高气温有较强的线性相关性,且二者为线性正相关B.月温差(月最高气温-月最低气温)的最大值出现在10月C.9~12月的月温差相对于5~8月,波动性更大D.每月最高气温与最低气温的平均值在前6个月逐月增加r=0.83,可知每月最低气温与最高气温有较强的线性相关性,且二者为线性正相关,由所给的折线图可以看出月温差(月最高气温-月最低气温)的最大值出现在10月,9~12月的月温差相对于5~8月,波动性更大,每月的最高气温与最低气温的平均值在前5个月逐月增加,第六个月开始减少,所以选项A,B,C正确,D错误.12.关于变量x,y的一组样本数据(a1,b1),(a2,b2),…,(a n,b n)(n≥2,a1,a2,…,a n不全相等)的散点图中,若所有样本点(a i,b i)(i=1,2,…,n)恰好都在直线y=-2x+1上,则根据这组样本数据推断的变量x,y的相关系数为.1,说明这两个变量间完全负相关,故其相关系数为-1.学科素养创新练13.许多先进国家对驾驶员的培训大多采用室内模拟教学和训练,而后再进行实地训练并考试,这种方法可以大大节约训练的费用.问题是这种方法有效吗?如表是12名学员的模拟驾驶成绩x与实际考试成绩y的记录(单位:分):试问:两者的相关性如何?请画出散点图,并求出x与y间的线性相关系数..画出散点图,如图所示,由散点图中的点分布在一条直线附近,知两变量线性相关性很强; 由表中数据,计算x =112×(98+55+…+73)≈80, y =112×(95+60+…+72)≈78. 相关系数为r=x y 1+x y 2+…+x y 12-12x y√x 12+x 22+…+x 122-12x 2·√y 12+y 22+…+y 122-12y 2=√98+55+…+73-12×80×√95+60+…+72-12×78≈2 12246.08×46.73≈0.985 5. 所以y 与x 间的线性相关系数为0.985 5,接近于1,知两变量的线性相关性很强.。
变量间的相关关系【知识梳理】1.相关关系如果两个变量中一个变量的取值一定时,另一个变量的取值带有一定的随机性,那么这两个变量之间的关系叫做相关关系.2.散点图将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图,利用散点图,可以判断两个变量是否相关,相关时是正相关还是负相关.3.正相关和负相关(1)正相关:散点图中的点散布在从左下角到右上角的区域. (2)负相关:散点图中的点散布在从左上角到右下角的区域. 4.回归直线方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归方程:回归直线的方程,简称回归方程. (3)回归方程的推导过程:①假设已经得到两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ). ②设所求回归方程为y ^=b ^x +a ^,其中a ^,b ^是待定参数. ③由最小二乘法得⎩⎪⎨⎪⎧b ^=∑i =1n(x i-x )(y i-y )∑i =1n(x i-x )2=∑i =1nx i y i-nx -y -∑i =1nx 2i-n x2a ^=y -b^x其中:b ^是回归方程的斜率,a ^是截距.【常考题型】题型一、相关关系的判断【例1】 (1)下列关系中,属于相关关系的是________ ①正方形的边长与面积之间的关系; ②农作物的产量与施肥量之间的关系;③人的身高与年龄之间的关系;④降雪量与交通事故的发生率之间的关系.(2)某个男孩的年龄与身高的统计数据如下表所示.②判断y与x是否具有线性相关关系.[解析](1)在①中,正方形的边长与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;在③中,人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;在④中,降雪量与交通事故的发生率之间具有相关关系.[答案](1)②④(2)①散点图如图所示.②由图知,所有数据点接近一条直线排列,因此,认为y与x有线性相关关系.【类题通法】两个变量是否相关的两种判断方法(1)根据实际经验:借助积累的经验进行分析判断.(2)利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断.【对点训练】如图所示的两个变量不具有相关关系的有________.解析:①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条直线周围;④中点的分布没有任何规律可言,x,y不具有相关关系.答案:①④题型二、求回归方程【例2】 某连锁经营公司所属5个零售店某月的销售额和利润额资料如下表:(1)(2)若销售额和利润额具有相关关系,计算利润额y 对销售额x 的回归直线方程. [解] (1)散点图如下:(2)数据如下表:可以求得b ^=0.5,a ^=0.4, 线性回归方程为y ^=0.5x +0.4. 【类题通法】求线性回归方程的步骤(1)计算平均数x ,y . (2)计算x i 与y i 的积,求1ni ii x y =∑.(3)计算21nii x=∑.(4)将结果代入公式b ^=1221ni ii nii x y n x yxnx ==-⋅⋅-∑∑,求b ^.(5)用a ^=y -b ^x ,求a ^. (6)写出回归方程. [变式训练]已知变量x ,y 有如下对应数据:(1)作出散点图;(2)用最小二乘法求关于x ,y 的回归直线方程. 解:(1)散点图如图所示.(2)x =1+2+3+44=52,y =1+3+4+54=134,41ii x=∑y i =1+6+12+20=39.41ii x=∑=1+4+9+16=30,b ^=39-4×52×13430-4×(52)2=1310,a ^=134-1310×52=0,所以y ^=1310x 为所求回归直线方程.题型三、利用线性回归方程对总体进行估计【例3】 一台机器由于使用时间较长,但还可以使用,它按不同的转速生产出来的某机器零件有一些会有缺点,每小时生产有缺点零件的多少随机器运转的速度而变化,下表是抽样试验结果:(1)如果(2)若实际生产中,允许每小时的产品中有缺点的零件数最多为10个,那么机器的转速应该控制在什么范围内?[解] (1)由题意,可得x =12.5,y =8.25,41ii x=∑y i =438,∑i =1nx 2i =660,则b ^=438-4×12.5×8.25660-4×12.52≈0.728 6,a ^=y -b ^x =-0.857 5. 所以回归直线的方程为y ^=0.728 6x -0.857 5. (2)要使y ≤10,则0.728 6x -0.857 5≤10,解得x ≤14.90.所以机器的转速应该控制在15转/秒以下. 【类题通法】回归分析的三个步骤(1)进行相关性检验,若两变量无线性相关关系,则所求的线性回归方程毫无意义. (2)求回归直线方程,其关键是正确地求得a ^,b ^. (3)根据直线方程进行预测. 【对点训练】假设关于某设备的使用年限x (年)和所支出的维修费用y (万元),有如下的统计资料:由资料可知y (1)求回归方程y ^=b ^x +a ^的回归系数a ^,b ^; (2)估计使用年限为10年时维修费用是多少. 解:(1)先把数据列成表.由表可知x yb ^=112.3-5×4×590-5×42=12.310=1.23,a ^=y -b ^x =5-1.23×4=0.08. (2)由(1)可知回归方程是y ^=1.23x +0.08,∴当x =10时,y ^=1.23×10+0.08=12.3+0.08=12.38(万元). 故估计使用年限为10年时,维修费用是12.38万元.【练习反馈】1.下列命题正确的是( ) ①任何两个变量都具有相关关系; ②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系; ④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.A .①③④B .②③④C .③④⑤D .②④⑤解析:选C ①显然不对,②是函数关系,③④⑤正确.2.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图图2.由这两个散点图可以判断( )A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关解析:选C 由这两个散点图可以判断,变量x 与y 负相关,u 与v 正相关.3.若施肥量x (kg)与水稻产量y (kg)的线性回归方程为y ^=5x +250,当施肥量为80 kg 时,预计水稻产量约为________kg.解析:把x =80 kg 代入回归方程可得其预测值y ^=5×80+250=650(kg). 答案:6504.对具有线性相关关系的变量x 和y ,测得一组数据如下表所示.________. 解析:由题意可知x =2+4+5+6+85=5,y =30+40+60+50+705=50.即样本中心为(5,50)设回归直线方程为y ^=6.5x +b ^, ∵回归直线过样本中心(x ,y ), ∴50=6.5×5+b ^,即b ^=17.5, ∴回归直线方程为y ^=6.5x +17.5 答案:y ^=6.5x +17.55.2013年元旦前夕,某市统计局统计了该市2012年10户家庭的年收入和年饮食支出的统计资料如下表:(2)若某家庭年收入为9万元,预测其年饮食支出. (参考数据:101i i i x y =∑=117.7,1021i i x =∑=406)解:依题意可计算得:x =6,y =1.83,x 2=36,x y =10.98, 又∵101i i i x y =∑=117.7,1021i i x =∑=406,∴b^=101102211010i i x yii xix yx--=-=--∑∑≈0.17,a^=y-b^x=0.81,∴y^=0.17x+0.81.∴所求的回归方程为y^=0.17x+0.81.(2)当x=9时,y^=0.17×9+0.81=2.34(万元).可估计大多数年收入为9万元的家庭每年饮食支出约为2.34万元.。
2.3 变量间的相关关系课后篇巩固提升1.下面的散点图与相关系数r 一定不符合的是( )A.(1)(2)(3)B.(1)(2)(4)C.(1)(3)(4)D.(2)(3)(4)(1)(3),变量x ,y 的散点图从左向右是下降的,所以r<0,(1)(3)错误;对于(2),变量x ,y 的散点图从左向右是上升的且各点不在一条直线上,所以0<r<1,(2)正确; 对于(4),变量x ,y 的散点图从左向右呈上升的带状分布,所以0<r<1,(4)错误.2.某学生课外活动兴趣小组对两个相关变量收集到5组数据如下表:由最小二乘法求得回归方程为y ^=0.67x+54.9,现发现表中有一个数据模糊不清,请推断该数据的值为( )A.60B.62C.68D.68.3由题意可得x =30,代入回归方程得y =75.设看不清的数为a ,则62+a+75+81+89=75×5,所以a=68.3.由一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到的回归直线方程为y ^=b ^x+a ^,那么下面说法不正确的是( ) A.直线y ^=b ^x+a ^必经过点(x,y )B.直线y ^=b ^x+a ^至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点C.直线y ^=b ^x+a ^的斜率为∑i=1nx i y i -nx y ∑i=1n x i 2-nx 2D.直线y ^=b ^x+a ^是最接近y 与x 之间真实关系的一条直线,故A 正确;直线y ^=b ^x+a ^可以不经过样本点中的任何一点,故B 错误;由回归系数b ^的计算公式可知C 正确;在直角坐标系中,直线y ^=b ^x+a ^与所有样本点的偏差的平方和最小,故D 正确.4.某工厂经过技术改造后,降低了能源消耗,经统计该厂某种产品的产量x (吨)与相应的生产能耗y (吨)汽油有如下几组样本数据:根据相关性检验,x 与y 具有线性相关关系,通过线性回归分析,求得回归直线的斜率为0.7,已知该工厂在2020年能耗计划中汽油不超过8.75吨,则该工厂2020年的计划产量最大约为 吨.=3+4+5+64=4.5,y =2.5+3+4+4.54=3.5,故样本点的中心为A (4.5,3.5),由题意,设回归直线方程是y ^=0.7x+a ^,代入A 点坐标得3.5=0.7×4.5+a ^,解得a ^=0.35,故回归直线方程为y ^=0.7x+0.35.由题意得y ^=0.7x+0.35≤8.75,解得x ≤12.所以该工厂2020年的计划产量最大约为12吨.5.下表为某地近几年机动车辆数与交通事故数的统计资料:(1)请判断机动车辆数与交通事故数之间是否有线性相关关系,如果不具有线性相关关系,说明理由;(2)如果具有线性相关关系,求出回归方程.在直角坐标系中画出数据的散点图,如下图:直观判断散点在一条直线附近,故具有线性相关关系.(2)计算相应的数据之和:∑i=18x i =1 031,∑i=18y i =71.6,∑i=18x i 2=137 835,∑i=18x i y i =9 611.7. 将它们代入公式计算得b ≈0.077 4,a=-1.024 9,所以,所求回归方程为y ^=0.077 4x-1.024 9.6.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y ^=b ^x+a ^,其中b ^=-20,a ^=y −b ^x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)由于x =1(8+8.2+8.4+8.6+8.8+9)=8.5, y =1(90+84+83+80+75+68)=80. 所以a ^=y −b ^x =80+20×8.5=250,从而回归直线方程为y ^=-20x+250.(2)设工厂获得的利润为L 元,依题意得L=x (-20x+250)-4(-20x+250)=-20x 2+330x-1 000=-20(x -334)2+361.25. 当且仅当x=8.25时,L 取得最大值.故当单价定为8.25元时,工厂可获得最大利润.。
人教A数学必修三第二单元单元测试卷:变量间的相关关系一、选择题(本大题共10小题,每小题4分,共40分.每小题只有一个选项符合题意)1. 下列关系中,属于相关关系的是()A.正四面体的棱长与体积B.火龙果的产量与施肥量C.人的美丑与眼睛近视的度数D.动车的车费与行驶的里程2. 一位母亲记录了儿子3∼9岁的身高,由此建立的身高y(单位:cm)与年龄x(单位:岁)的回归模型为ŷ=7.19x+73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是()A.身高一定是145.83cmB.身高在145.83cm以上C.身高在145.83cm以下D.身高在145.83cm左右3. 对于给定的两个变量的统计数据,下列说法正确的是()A.都可以分析出两个变量的关系B.都可以用一条直线近似地表示两者的关系C.都可以作出散点图D.都可以用确定的表达式表示两者的关系4.已知x,y之间的一组数据如表中所示,则线性回归方程ŷ=b̂x+â所表示的直线必经过点()A.(0, 0)B.(1.5, 5)C.(4,1.5)D.(2,2)5. (2010·湖南高考·文)某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是()A.ŷ=−10x+200B.ŷ=10x+200C.ŷ=−10x−200D.ŷ=10x−2006.某公司生产某种婴幼儿纸尿裤的产量x与相应的生产能耗y有如下几组样本数据:为0.72,则这组样本数据的回归直线方程是()A.ŷ=0.72x+2.05B.ŷ=0.72x+0.35C.ŷ=0.72x+0.26D.ŷ=0.35x+0.727. 已知变量x和y满足关系ŷ=−0.1x+1,变量y与z正相关,下列结论中正确的是()A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关8. 由—组数据(x1,y1),(x2,y2),⋅⋅⋅,(x n,y n)得到的线性回归方程为ŷ=b̂x+â,则下列说法正确的是()A.(x1,y1),(x2,y2),⋅⋅⋅,(x n,y n)这n个点到直线ŷ=b̂x+â的距离之和最小B.直线ŷ=b̂x+â至少经过点(x1,y1),(x2,y2),⋅⋅⋅,(x n,y n)中的一点C.直线ŷ=b̂x+â是由(x1,y1),(x2,y2),⋅⋅⋅,(x n,y n)中的两点确定的D.直线ŷ=b̂x+â必过点(x,y)9.根据如下样本数据:得到的线性回归方程为ŷ=b)A.â<0,b̂<0B.â>0,b̂>0C.â>0,b̂<0D.â<0,b̂>010.某公司在2013∼2017年的广告费支出x(单位:万元)与销售额y(单位:万元)之间有下列对应数据:y对x线性相关,且回归直线方程为ŷ=6.5x+17.5,给出下列说法:①销售额y与广告费支出x正相关;②丢失的数据a 为30;③该公司广告费支出每增加1万元,销售额一定增加17.5万元;④若该公司在2018年的广告费支出为8万元,则销售额为70万元.其中说法正确的有()A.1个B.2个C.3个D.4个二、填空题(本大题共4小题,每小题4分,共16分.把答案填在题中横线上)为了均衡教育资源,加大对偏远地区的教育投入,某机构调查了某地若干户家庭的年收入x(单位:万元)和年教育支出y(单位:万元)的情况.调查显示年收入与年教育支出y具有线性相关关系,并由调查数据得到y对x的线性回归方程为ŷ=0.15x+ 0.2.由线性回归方程可知,家庭年收入每增加1万元,年教育支出约增加________万元.高考复习经过二轮“见多识广”之后,为了研究考前“限时抢分”强化训练次数x与答题正确率y%的关系,对某校高三某班同学进行了调查,并统计得到y关于x线性相关,且y∧=14x+5,则当训练次数为6时,预测答题的正确率为________.某单位为了了解用电量y(度)与气温x(∘C)之间的关系,随机统计了某4天的用电量与当天的气温(如下表),并求得线性回归方程为ŷ=−2x+60.但后来不小心丢失了表中数据c,d,那么由现有数据知2c+d=________.某汽车的使用年数x(单位:年)与所支出的维修总费用y(单位:万元)的统计数据如下表:根据上表可得y关于x的线性回归方程了ŷ=b元就不再维修,直接报废,据此模型预测该汽车最多可使用________年.三、解答题(本大题共4小题,共44分.解答应写出文字说明、证明过程或演算步骤)为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月连续5天每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系:(1)请根据上表提供的数据,用最小二乘法求出投篮命中率y与打篮球时间x(单位:小时)之间的回归直线方程ŷ=b̂x+â;(2)如果小李某天打了2.5小时的篮球,预测小李当天的投篮命中率.在某化学反应的中间阶段,压力保持不变,温度x(单位:∘C)与反应结果y之间的关系如下表所示:(1)求化学反应的结果y 对温度x 的线性回归方程y ∧=b ∧x +a ∧;(2)判断变量x 与y 之间是正相关还是负相关,并预测当温度到达8∘C 时反应结果为多少?为了探究城市车流量与PM2.5的浓度是否相关,现采集到某城市12月份星期一到星期日某一时间段车流量与PM2.5的数据如下表:(1)由散点图知y 与x 具有线性相关关系,求y 关于x 的线性回归方程;(2)①利用(1)中所求的回归方程,预测该市车流量为8万辆时PM2.5的浓度;②规定:当一天内PM2.5的浓度平均值在(0, 35]内,空气质量等级为优;当一天内PM2.5的浓度平均值在(35, 75]内,空气质量等级为良.为使该市某日空气质量为优或者良,则应控制当天车流量在多少万辆以内?(结果以万辆为单位,保留整数)某农科所对冬季昼夜温差大小x (℃)与某反季节新品种大豆种子的发芽数y (颗)之间的关系进行了分析研究,他们分别记录了12月1日至12月5日每天的昼夜温差与实验室每天每100颗种子的发芽数,得到的数据如表中所示:该农科所确定的研究方案是:先从这5组数据中选取3组求线性回归方程,剩下的2组数据用于回归方程检验.(1)请根据12月2日至12月4日的数据,求出y关于x的线性回归方程ŷ=b̂x+â;(2)若由线性回归方程得到的估计数据与所选的检验数据的误差均不超过2,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?如果可靠,请预测温差为14℃时实验室每天每100颗种子的发芽数;如果不可靠,请说明理由.四、附加题(本大题共2小题,每小题10分,共20分解答应写出文字说明、证明过程或演算步骤)某百货食品有限公司的销售部门共有10名员工,他们某年的收入如下表所示:(1)求该销售部门当年年薪的平均数和中位数(2)已知员工年薪收入与工作年限成正相关关系,若某员工工作第一年至第四年的年薪分别为3万元、4.2万元、5.6万元、7.2万元,预测该员工第九年的年薪为多少.刘老师是一位经验丰富的高三理科班班主任,经长期研究,他发现高中理科班学生的数学成绩(总分150分)与理综成绩(物理、化学与生物的综合,总分300分)具有较强的线性相关性,以下是刘老师随机选取的八名学生在高考中的数学得分x与理综得分y 的数据:参考数据及公式:ŷ=â+b̂x,b̂≈1.83,x¯=100,y¯=200.(1)求y关于x的线性回归方程.(2)若小王高考数学为110分,请你预测他理综得分约为多少分.(精确到整数)(3)小金同学的语文与英语总分能稳定在215分左右.如果他的目标是高考总分冲击600分,请你帮他估算他的数学与理综分别至少需要拿到多少分.(精确到整数)参考答案与试题解析人教A数学必修三第二单元单元测试卷:变量间的相关关系一、选择题(本大题共10小题,每小题4分,共40分.每小题只有一个选项符合题意)1.【答案】B【考点】变量间的相关关系【解析】本题主要考查两变量相关关系的判断.【解答】解:正四面体的棱长与体积是函数关系,故排除A;火龙果的产量与施肥量之间不具有严格的函数关系,但具有相关关系;人的美丑与眼睛近视的度数既不是函数关系也不是相关关系,故排除C;动车的车费与行驶的里程是函数关系,故排除D.故选B.2.【答案】D【考点】求解线性回归方程【解析】本题考查回归方程的应用.【解答】解:由线性回归方程求出的y值只是一个约数,而不是确切的值,当x=10时,ŷ= 145.83,所以身高在145.83cm左右.故选D.3.【答案】C【考点】变量间的相关关系【解析】本题主要考查对变量间的相关关系的理解.【解答】解:给出两个变量的统计数据,总可以作出相应的散点图,但不一定能分析出两个变量的关系,更不一定能得出两个变量有线性相关关系或函数关系.故选C.4.【答案】B【考点】求解线性回归方程【解析】本题考查线性回归方程及样本点的中心. 【解答】解:由题意可知x ¯=0+1+2+34=1.5,y ¯=8+2+6+44=5,而线性回归方程所表示的直线必经过样本点的中心(x ¯,y ¯). 故选B . 5.【答案】 A【考点】求解线性回归方程 【解析】 此题暂无解析 【解答】解∵ 销售量y (件)与销售价格x (元/件)负相关,∴ x 的系数为负. 又∵ y 不能为负值, ∴ 常数项必须是正值. 6. 【答案】 C【考点】求解线性回归方程 【解析】本题主要考查回归直线方程的求解. 【解答】解:设回归直线方程为y ̂=0.72x +a ̂,由样本数据,可得x =4.5,y =3.5.因为回归直线经过上点(x,y),所以3.5=0.72×4.5+a ̂,解得a ̂=0.26.所以回归直线方程为y ̂=0.72x +0.26. 故选C . 7.【答案】 C【考点】变量间的相关关系 【解析】本题主要考查变量间的相关关系. 【解答】 解:因为y ̂=−0.1x +1,x 的系数为负,故x 与y 负相关;而y 与z 正相关,故z 与x 负相关. 故选C . 8.【答案】 D【考点】求解线性回归方程本题考查线性回归方程的意义. 【解答】解:对于A ,应为这n 个点到直线y ̂=b ̂x +a ̂的距离的平方和最小;对于B ,回归直线不一定经过样本点; 对于C ,回归直线不是由两点确定的;由回归直线必过样本点的中心(x,y),知D 正确. 故选D . 9.【答案】 C【考点】求解线性回归方程 【解析】 此题暂无解析 【解答】解:样本平均数x ¯=5.5,y ¯=0.25, ∴∑(x i−x ¯)6i=1(y i −y ¯)=−23.75,∑(x i−x ¯)26i=1=17.5,∴ b ̂=−23.7517.5≈−1.4, ∴ a ̂=0.25−(−1.4)×5.5=7.95. 故选C . 10.【答案】 A【考点】求解线性回归方程 【解析】本题考查回归直线方程的应用. 【解答】解:由回归直线方程为y ̂=6.5x +17.5,可知销售额y 与广告费支出x 正相关,所以①正确;由表中的数据可得x ¯=5,y ¯=220+a 5,把(5,220+a 5)代入回归直线方程,可得220+a 5=6.5×5+17.5,解得a =30,所以②正确;该公司广告费支出每增加1万元,销售额约增加6.5万元,所以③不正确; 若该公司在2018年的广告费支出为8万元,则销售额约为y ̂=6.5×8+17.5=69.5(万元),所以④不正确. 故选B .二、填空题(本大题共4小题,每小题4分,共16分.把答案填在题中横 线上) 【答案】 0.15【考点】求解线性回归方程 【解析】 此题暂无解析解:因为回归直线的斜率为0.15,所以家庭收入每增加1万元,年教育支出约增加0.15万元.故答案为:0.15. 【答案】 89% 【考点】求解线性回归方程 【解析】 此题暂无解析 【解答】解:当x =6时,y ∧=89,故可预测答题的正确率为89%. 故答案为:89%.【答案】 100【考点】求解线性回归方程 【解析】本题考查回归直线方程的应用. 【解答】解:由题意,得x ¯=14(c +13+10−1)=22+c 4,y ¯=14(24+34+38+d)=96+d 4.又线性回归方程为y ̂=−2x +60,故−2×22+c 4+60=96+d 4,解得2c +d =100.故答案为:100. 【答案】 11【考点】求解线性回归方程 【解析】 此题暂无解析 【解答】解:x ¯=15×(1+2+3+4+5)=3,y ¯=15×(0.5+1.2+2.2+3.3+4.5)=2.34,代入线性回归方程y ̂=b ̂x −0.69,得2.34=3b ̂−0.69,解得b ̂=1.01,所以线性回归方程为y ̂=1.01x −0.69.令y ̂=1.01x −−0.69≥10,得x ≥1069101≈11,据此模型预测该代车最多可使用11年.故答案为:11.三、解答题(本大题共4小题,共44分.解答应写出文字说明、证明过程 或演算步骤) 【答案】解:(1)由表中数据,得x ¯=1+2+3+4+55=3,y ¯=0.4+0.5+0.6+0.6+0.45=0.5,∴ b ¯=(1×0.4+2×0.5+3×0.6+4×0.6+5×0.4)−5×3×0.5(12+22+32+42+52)−5×9=0.01,a ̂=y ¯−bx ¯=0.5−0.01×3=0.47,∴ 所求的回归直线方程为y ̂=0.01x +0.47. (2)将x =2.5代入回归直线方程,得y ̂=0.01×2.5+0.47=0.495, ∴ 可预测小李当天的投篮命中率约为0.495. 【考点】求解线性回归方程 【解析】 此题暂无解析 【解答】解:(1)由表中数据,得x ¯=1+2+3+4+55=3,y ¯=0.4+0.5+0.6+0.6+0.45=0.5,∴ b ¯=(1×0.4+2×0.5+3×0.6+4×0.6+5×0.4)−5×3×0.5(12+22+32+42+52)−5×9=0.01,a ̂=y ¯−bx ¯=0.5−0.01×3=0.47,∴ 所求的回归直线方程为y ̂=0.01x +0.47. (2)将x =2.5代入回归直线方程,得y ̂=0.01×2.5+0.47=0.495, ∴ 可预测小李当天的投篮命中率约为0.495. 【答案】解:(1)由题意,得x ¯=15∑x i 5i=1=3,y ¯=15∑y i 5i=1=7.2,∴ ∑x i 25i=1−5x ¯2=55−5×9=10,∑x i y i 5i=1−5x ¯y ¯=129−5×3×7.2=21, ∴ b ̂=2110=2.1,a ̂=y ¯−b ̂x ¯=7.2−2.1×3=0.9,∴ 所求的线性回归方程为y ̂=2.1x +0.9.(2)∵ b ∧=2.1>0,∴ x 与y 之间是正相关, 当x =8时,y ̂=2.1×8+0.9=17.7, ∴ 当温度达到8∘C 时反应结果大约为17.7. 【考点】求解线性回归方程 【解析】 此题暂无解析 【解答】解:(1)由题意,得x ¯=15∑x i 5i=1=3,y ¯=15∑y i 5i=1=7.2,∴ ∑x i 25i=1−5x ¯2=55−5×9=10,∑x i y i 5i=1−5x ¯y ¯=129−5×3×7.2=21,∴ b ̂=2110=2.1,a ̂=y ¯−b̂x ¯=7.2−2.1×3=0.9, ∴ 所求的线性回归方程为y ̂=2.1x +0.9. (2)∵ b ∧=2.1>0,∴ x 与y 之间是正相关,当x =8时,y ̂=2.1×8+0.9=17.7,∴ 当温度达到8∘C 时反应结果大约为17.7.【答案】解:(1)由数据可得x ¯=17(1+2+3+4+5+6+7)=4,y ¯=17(28+30+35+41+49+56+62)=43, ∑x i 7i=1y i =1372,∑x i 27i=1=140,所以b ̂=∑x i 7i=1y i −7x ¯ y¯∑x i 27i=1−7x ¯2=1372−7×4×43140−7×42=6,a ̂=y ¯−b ̂x ¯=43−4×6=19,所以y 关于x 的线性回归方程为y ̂=6x +19.(2)①当车流量为8万辆,即x =8时,y ̂=6×8+19=67,故车流量为8万辆时,PM2.5的浓度为67微克/米3.②根据题意得6x +19≤75,即x ≤283,又283≈9, 故要使该市某日空气质量为优或良,则应控制当天车流量在9万辆以内.【考点】求解线性回归方程【解析】此题暂无解析【解答】解:(1)由数据可得x ¯=17(1+2+3+4+5+6+7)=4,y ¯=17(28+30+35+41+49+56+62)=43,∑x i 7i=1y i =1372,∑x i 27i=1=140,所以b ̂=∑x i 7i=1y i −7x ¯ y¯∑x i 27i=1−7x ¯2=1372−7×4×43140−7×42=6,a ̂=y ¯−b ̂x ¯=43−4×6=19,所以y 关于x 的线性回归方程为y ̂=6x +19.(2)①当车流量为8万辆,即x =8时,y ̂=6×8+19=67,故车流量为8万辆时,PM2.5的浓度为67微克/米3.②根据题意得6x +19≤75,即x ≤283,又283≈9, 故要使该市某日空气质量为优或良,则应控制当天车流量在9万辆以内.【答案】解:(1)由数据求得x ¯=12,y ¯=27,由公式求得b ̂=52,a ̂=y ¯−b ̂x ¯=−3,所以y 关于x 的线性回归方程为y ̂=52x −3.(2)当x =10时,y ̂=52×10−3=22,|22−23|<2; 当x =8时,y ̂=52×8−3=17,|17−16|<2, 所以该农科所得到的线性回归方程是可靠的.当x =14时,则y ̂=52x −3=35−3=32, 所以当温差为14∘C 时实验室每天每100颗种子的发芽数约为32颗.【考点】回归分析的初步应用【解析】此题暂无解析【解答】解:(1)由数据求得x ¯=12,y ¯=27,由公式求得b ̂=52,a ̂=y ¯−b ̂x ¯=−3, 所以y 关于x 的线性回归方程为y ̂=52x −3. (2)当x =10时,y ̂=52×10−3=22,|22−23|<2; 当x =8时,y ̂=52×8−3=17,|17−16|<2,所以该农科所得到的线性回归方程是可靠的.当x =14时,则y ̂=52x −3=35−3=32,所以当温差为14∘C 时实验室每天每100颗种子的发芽数约为32颗.四、附加题(本大题共2小题,每小题10分,共20分解答应写出文字说明、 证明过程或演算步骤)【答案】解:(1)由题意,知平均数为110(3+3.5+4+5+5.5+6.5+7+7.5+8+50)=10(万元),中位数为5.5+6.52=6(万元).(2)设x i ,y i (i =1,2,3,4)分别表示该员工的工作年限及相应年薪,则x ¯=2.5,y ¯=5,∑(x i −x ¯)4i=1(y i −y ¯)=−1.5×(−2)+(−0.5)×(0.8)+0.5×0.6+1.5×2.2=7.∑(x i−x ¯)24i=1=(−1.5)2+(−0.5)2+0.52+1.52=5,∴ b ̂=75=1.4,a ̂=y ¯−bx ¯=1.5.∴ 线性回归方程为y ̂=1.4x +1.5.令x =9,得y ̂=1.4×9+1.5=14.1,可预测该员工第九年的年薪约为14.1万元.【考点】求解线性回归方程【解析】此题暂无解析【解答】解:(1)由题意,知平均数为110(3+3.5+4+5+5.5+6.5+7+7.5+8+50)=10(万元),中位数为5.5+6.52=6(万元).(2)设x i ,y i (i =1,2,3,4)分别表示该员工的工作年限及相应年薪,则x ¯=2.5,y ¯=5,∑(x i −x ¯)4i=1(y i −y ¯)=−1.5×(−2)+(−0.5)×(0.8)+0.5×0.6+1.5×2.2=7.∑(x i −x ¯)24i=1=(−1.5)2+(−0.5)2+0.52+1.52=5,∴ b ̂=75=1.4,a ̂=y ¯−bx ¯=1.5.∴ 线性回归方程为y ̂=1.4x +1.5.令x =9,得y ̂=1.4×9+1.5=14.1,可预测该员工第九年的年薪约为14.1万元.【答案】解:(1)将(x ¯,y ¯)代入y ̂=a ̂+1.83x ,解得a ̂=17,∴ y ̂=17+1.83x .(2)将x =110代人回归方程,得y ̂=17+1.83×110=218.3≈218,∴ 可预测他理综得分约为218分.(3)由题意,得215+x +y ̂≥600,将y ̂=17+1.83x 代人,得x ≥3682.83≈130,∴ y ̂≥17+1.83×130≈255,∴ 他的数学与理综分别至少需要拿到130分与255分.【考点】求解线性回归方程【解析】此题暂无解析【解答】解:(1)将(x ¯,y ¯)代入y ̂=a ̂+1.83x ,解得a ̂=17,∴ y ̂=17+1.83x .(2)将x =110代人回归方程,得y ̂=17+1.83×110=218.3≈218,∴ 可预测他理综得分约为218分.(3)由题意,得215+x +y ̂≥600,将y ̂=17+1.83x 代人,得x ≥3682.83≈130, ∴ y ̂≥17+1.83×130≈255,∴ 他的数学与理综分别至少需要拿到130分与255分.。
学业分层测评(十四)
变量间的相关关系
(建议用时:45分钟)
[学业达标]
一、选择题
1.(2015·张掖高一检测)有几组变量:
①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;
②平均日学习时间和平均学习成绩;
③立方体的棱长和体积.
其中两个变量成正相关的是()
A.①③B.②③
C.②D.③
【解析】①是负相关;②是正相关;③是函数关系,不是相关关系.
【答案】 C
2.对于给定的两个变量的统计数据,下列说法正确的是() A.都可以分析出两个变量的关系
B.都可以用一条直线近似地表示两者的关系
C.都可以作出散点图
D.都可以用确定的表达式表示两者的关系
【解析】由两个变量的数据统计,不能分析出两个变量的关系,A错;不具有线性相关的两个变量不能用一条直线近似地表示他们的
关系,更不能用确定的表达式表示他们的关系,B,D错.【答案】 C
3.对有线性相关关系的两个变量建立的回归直线方程y^=a^+b^x 中,回归系数b^()
A.不能小于0 B.不能大于0
C.不能等于0 D.只能小于0
【解析】当b^=0时,r=0,这时不具有线性相关关系,但b^能大于0,也能小于0.
【答案】 C
4.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
①y与x负相关且y^=2.347x-6.423;②y与x负相关且y^=-3.476x +5.648;③y与x正相关且y^=5.437x+8.493;④y与x正相关且y^=-4.326x-4.578.
其中一定不正确
...的结论的序号是()
A.①②B.②③
C.③④D.①④
【解析】由正负相关性的定义知①④一定不正确.
【答案】 D
5.某产品的广告费用x与销售额y的统计数据如下表:
根据上表可得回归方程y ^=b ^x +a ^中的b ^为9.4,据此模型预报广告费用为6万元时,销售额为( )
A .63.6万元
B .65.5万元
C .67.7万元
D .72.0万元
【解析】 x -=1
4(4+2+3+5)=3.5,
-y =14(49+26+39+54)=42, 所以a ^=-y -b ^x -=42-9.4×3.5=9.1, 所以回归方程为y ^=9.4x +9.1,
令x =6,得y ^=9.4×6+9.1=65.5(万元).故选B. 【答案】 B 二、填空题
6.若施化肥量x (千克/亩)与水稻产量y (千克/亩)的回归方程为y ^=5x +250,当施化肥量为80千克/亩时,预计水稻产量为亩产________千克左右.
【解析】 当x =80时,y ^=400+250=650. 【答案】 650
7.已知一个回归直线方程为y ^=1.5x +45,x ∈{1,7,5,13,19},则-y
=________. 【解析】 因为x -=15(1+7+5+13+19)=9, 且回归直线过样本中心点(x -,-y
),
所以-y
=1.5×9+45=58.5. 【答案】 58.5
8.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
【解析】 由于y ^=0.254x +0.321知,当x 增加1万元时,年饮食支出y 增加0.254万元.
【答案】 0.254 三、解答题
9.某工厂对某产品的产量与成本的资料分析后有如下数据:
(1)画出散点图;
(2)求成本y 与产量x 之间的线性回归方程.(结果保留两位小数) 【解】 (1)散点图如图所示.
(2)设y 与产量x 的线性回归方程为y ^=b ^x +a ^, x -=2+3+5+64=4,-y =7+8+9+124
=9,
=1.10,
a^=y-b^x-=9-1.10×4=4.60.
∴回归方程为:y^=1.10x+4.60.
10.假设关于某设备的使用年限x(年)和所支出的年平均维修费用y(万元)(即维修费用之和除以使用年限),有如下的统计资料:
(1)画出散点图;
(2)从散点图中发现使用年限与所支出的年平均维修费用之间关系的一般规律;
(3)求回归方程;
(4)估计使用年限为10年时所支出的年平均维修费用是多少?【导学号:28750043】
【解】(1)画出散点图如图所示.
(2)由图可知,各点散布在从左下角到右上角的区域里,因此,使用年限与所支出的年平均维修费用之间成正相关,即使用年限越长,所支出的年平均维修费用越多.
(3)从散点图可以看出,这些点大致分布在一条直线的附近,因此,两变量呈线性相关关系.
由题表数据可得,x=4,y=5,∑
5
i=1x i y i=112.3,∑
5
i=1
x2i=90,由公式
可得b^=112.3-5×4×5
90-5×42
=1.23,a^=y-b^x-=5-1.23×4=0.08.即回归
方程是y^=1.23x+0.08.
(4)由(3)知,当x=10时,y^=1.23×10+0.08=12.38(万元).
故估计使用年限为10年时所支出的年平均维修费用是12.38万元.
[能力提升]
1.(2014·湖北高考)根据如下样本数据
得到的回归方程为y^=bx+a,则()
A.a>0,b>0 B.a>0,b<0
C.a<0,b>0 D.a<0,b<0
【解析】作出散点图如下:
观察图象可知,回归直线y^=bx+a的斜率b<0,当x=0时,y^=a>0.故a>0,b<0.
【答案】 B
2.工人工资y(元)与劳动生产率x(千元)的相关关系的回归方程为y^=50+80x,下列判断正确的是()
A.劳动生产率为1 000元时,工人工资为130元
B.劳动生产率提高1 000元时,工人工资平均提高80元
C.劳动生产率提高1 000元时,工人工资平均提高130元
D.当月工资为250元时,劳动生产率为2 000元
【解析】因为回归方程斜率为80,所以x每增加1,y平均增加80,即劳动生产率提高1 000元时,工人工资平均提高80元.【答案】 B
3.期中考试后,某校高三(9)班对全班65名学生的成绩进行分析,得到数学成绩y对总成绩x的回归直线方程为y^=6+0.4x.由此可以估计:若两个同学的总成绩相差50分,则他们的数学成绩大约相
差________分.
【解析】 令两人的总成绩分别为x 1,x 2. 则对应的数学成绩估计为 y ^1=6+0.4x 1,y ^2=6+0.4x 2,
所以|y ^1-y ^2|=|0.4(x 1-x 2)|=0.4×50=20. 【答案】 20
4.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单
位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑10
i =1
x i =80, ∑10
i =1
y i =20,
∑10
i =1
x i y i =184, +∑i =1
100
x 2i =720.
(1)求家庭的月储蓄y 对月收入x 的线性回归方程y=bx+a
(2)判断变量x 与y 之间是正相关还是负相关;
(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄
.
【解】 (1)由题意知n =10,x =1n ∑i =1
n x i =80
10=8,
y =1n i =1
n y i =20
10=2,
,
由此得b =l xy l xx =2480=0.3,a =-y -b x -=2-0.3×8=-0.4. 故所求线性回归方程为y =0.3x -0.4.
(2)由于变量y 的值随x 值的增加而增加(b =0.3>0),故x 与y 之间是正相关.
(3)将x =7代入回归方程可以预测该家庭的月储蓄为y =0.3×7-0.4=1.7(千元).。