2017-2018版高中数学 第二章 统计 2.3.1 变量之间的相关关系 2.3.2 两个变量的线
- 格式:doc
- 大小:482.50 KB
- 文档页数:12
2.3变量间的相关关系[提出问题](1)吸烟可导致肺癌.(2)下表是某小卖部6天卖出热茶的杯数与当天气温的对比表.(3)y=x2+5(x问题1:吸烟一定可以导致肺癌吗?吸烟与患肺癌有关吗?提示:吸烟不一定患肺癌,但它们有一定的关系.问题2:小卖部中卖出的热茶杯数与当天气温有关吗?两者之间是如何变化的?提示:两者间有关系.随着气温的降低卖出的热茶杯数增加.问题3:y=x2+5(x∈R)中,x,y间是什么关系?提示:y与x间是函数关系,是一种确定关系.[导入新知]相关关系如果两个变量中一个变量的取值一定时,另一个变量的取值带有一定的随机性,那么这两个变量之间的关系叫做相关关系.[化解疑难]两个变量间的关系分类两个变量间的关系分为三类:一类是确定性的函数关系,如正方形边长与面积的关系;另一类是变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,这种关系就是相关关系,如某位同学的“物理成绩”与“数学成绩”之间的关系;再一类是不相关,即两变量没有任何关系.[提出问题]下表是某地搜集到的新房屋的销售价格y(单位:万元)和房屋的面积x(单位:m2)的数据:问题1:以x提示:如图所示:问题2:房屋的销售价格与房屋的面积有关系吗?提示:有关系.问题3:怎样描述房屋的销售价格与房屋的面积之间的变化关系?提示:大体上来看,面积越大,售价越高.但不是正比例函数关系.[导入新知]1.散点图将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图,利用散点图,可以判断两个变量是否相关,相关时是正相关还是负相关.2.正相关和负相关(1)正相关:散点图中的点散布在从左下角到右上角的区域.(2)负相关:散点图中的点散布在从左上角到右下角的区域.[化解疑难]对正相关和负相关的理解(1)正相关随自变量的变大(或变小),因变量也随之变大(或变小),这种带有随机性的相关关系,我们称为正相关.例如,人年龄由小变大时,体内脂肪含量也由少变多.(2)负相关随自变量的变大(或变小),因变量却随之变小(或变大),这种带有随机性的相关关系,我们称为负相关.例如,汽车越重,每消耗1 L汽油所行驶的平均路程就越短.[提出问题]问题:在“知识点二”的问题中,能否估计出房屋面积为120 m2时的销售价格?如何估计?提示:能.根据散点图作出一条直线,求出直线方程,即可预测.[导入新知]回归直线方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线;(2)回归方程:回归直线的方程,简称回归方程. (3)回归方程的推导过程:①假设已经得到两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ); ②设所求回归方程为,其中a ^,b ^是待定参数;③由最小二乘法得其中:b ^是回归方程的斜率,a ^是截距. [化解疑难]回归直线方程与直线方程的区别线性回归直线方程中y 的上方加记号“^ ”是与实际值y 相区别,因为线性回归方程中“y ^”的值是通过统计大量数据所得到的一个预测值,它具有随机性,因而对于每一个具体的实际值而言,y ^的值只是比较接近,但存在一定的误差,即y =y ^+e (其中e 为随机变量),预测值y ^与实际值y 的接近程度由随机变量e 的标准差决定.[例1] (1)) ①正方形的边长与面积之间的关系; ②农作物的产量与施肥量之间的关系; ③人的身高与年龄之间的关系;④降雪量与交通事故的发生率之间的关系.(2)某个男孩的年龄与身高的统计数据如下表所示.②判断y与x是否具有线性相关关系.[解](1)在①中,正方形的边长与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;在③中,人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;在④中,降雪量与交通事故的发生率之间具有相关关系.(2)①散点图如图所示.②由图知,所有数据点接近一条直线排列,因此,认为y与x有线性相关关系.[答案](1)②④[类题通法]两个变量是否相关的两种判断方法(1)根据实际经验:借助积累的经验进行分析判断.(2)利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断.[活学活用]如图所示的两个变量不具有相关关系的是______(填序号).解析:①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条直线周围;④中点的分布没有任何规律可言,x,y不具有相关关系.答案:①④[例2] 某连锁经营公司所属5个零售店某月的销售额和利润额资料如下表:(1)(2)若销售额和利润额具有相关关系,计算利润额y 对销售额x 的回归直线方程. [解] (1)散点图如下:(2)数据如下表:可以求得b ^=0.5,a ^=0.4, 线性回归方程为y ^=0.5x +0.4. [类题通法]求线性回归方程的步骤(1)计算平均数x ,y ; (2)计算x i 与y i 的积,求∑i =1nx i y i ;(3)计算∑i =1nx 2i ;(4)将结果代入公式b ^=∑i =1nx i y i -n x -y-∑i =1nx 2i -n x2,求b ^;(5)用a ^=y -b ^x ,求a ^; (6)写出回归方程. [活学活用]1.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y 对x A.y ^=x -1 B.y ^=x +1 C.y ^=88+12xD.y ^=176 解析:选C 由题意得 x =174+176+176+176+1785=176(cm),y =175+175+176+177+1775=176(cm),由于(x ,y )一定满足线性回归方程,经验证知选C. 2.已知变量x ,y 有如下对应数据:(1)作出散点图;(2)用最小二乘法求关于x ,y 的回归直线方程. 解:(1)散点图如图所示:(2)x =1+2+3+44=52,y =1+3+4+54=134,∑i =14x i y i =1+6+12+20=39.∑i =14x 2i =1+4+9+16=30,b ^=39-4×52×13430-4×⎝⎛⎭⎫522=1310,a ^=134-1310×52=0,所以y ^=1310x 为所求回归直线方程.[例3] 零件有一些会有缺点,每小时生产有缺点零件的多少随机器运转的速度而变化,下表是抽样试验结果:(1)如果y (2)若实际生产中,允许每小时的产品中有缺点的零件数最多为10个,那么机器的转速应该控制在什么范围内?[解] (1)由题意,可得x =12.5,y =8.25,∑i =14x i y i =438,∑i =14x 2i =660,则b ^=438-4×12.5×8.25660-4×12.52≈0.728 6,a ^=y -b ^x =-0.857 5.所以回归直线的方程为y ^=0.728 6x -0.857 5. (2)要使y ≤10,则0.728 6x -0.857 5≤10, 解得x ≤14.90.所以机器的转速应该控制在15转/秒以下. [类题通法]回归分析的三个步骤(1)进行相关性检验,若两变量无线性相关关系,则所求的线性回归方程毫无意义;(2)求回归直线方程,其关键是正确地求得a ^,b ^; (3)根据直线方程进行预测. [活学活用](全国乙卷)如图是我国2008年到2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注:参考数据:∑i =17y i =9.32,∑i =17t i y i =40.17,∑i =17(y i -y )2=0.55,7≈2.646.参考公式:相关系数r =∑i =1n(t i -t )(y i -y )∑i =1n(t i -t )2∑i =1n(y i -y )2,回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为:b ^=∑i =1n(t i -t )(y i -y )∑i =1n(t i -t )2,a^=y -b ^t .解:(1)由折线图中数据和附注中参考数据得 t =4,∑i =17(t i -t )2=28,∑i =17(y i -y )2=0.55,∑i =17 (t i -t )(y i -y )=∑i =17t i y i -t ∑i =17y i =40.17-4×9.32=2.89,r ≈2.892×2.646×0.55≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由y =9.327≈1.331及(1)得 b ^=∑i =17(t i -t )(y i -y )∑i =17(t i -t )2=2.8928≈0.103, a ^=y -b ^t ≈1.331-0.103×4≈0.92. 所以y 关于t 的回归方程为y ^=0.92+0.10t . 将2016年对应的t =9代入回归方程得 y ^=0.92+0.10×9=1.82.所以预测2016年我国生活垃圾无害化处理量将约为1.82亿吨.6.线性相关关系的判断及回归方程的应用[典例] 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (单位:吨)与相应的生产能耗y (单位:吨标准煤)的几组对照数据:(1)(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?[解题流程][规范解答]x =3+4+5+64=4.5,y =2.5+3+4+4.54=3.5, i =1nx 2i =32+42+52+62=86,∴b ^=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7,a ^=y -b ^x =3.5-0.7×4.5=0.35, 故线性回归方程为y ^=0.7x +0.35.(3)根据回归方程预测,现在生产100吨产品消耗的标准煤的数量为0.7×100+0.35=70.35,故耗能约减少了90-70.35=19.65(吨)标准煤.[类题通法]解答回归分析问题的四个注意点 (1)先用散点图确定是否线性相关; (2)准确计算回归方程中的各个系数; (3)回归直线必过样本中心;(4)利用回归直线方程求出的值只是估计值,会与实际值有一定的误差. [活学活用]某个体服装店经营某种服装在某周内所获纯利y (元)与该周每天销售这种服装的件数x (件)之间有一组数据如下表:(1)求x ,y ;(2)若纯利y 与每天销售这种服装的件数x 之间是线性相关的,求回归直线方程; (3)若该店每周至少要获纯利200元,请你预测该店每天至少要销售这种服装多少件?(以下数据供选择:∑i =17x 2i =280,∑i =17y 2i =45 309,∑i =17x i y i =3 487)解:(1)x =3+4+5+6+7+8+97=6,y =66+69+73+81+89+90+917≈79.86.(2)∵b ^=3 487-7×6×79.86280-7×62≈4.75,a ^=79.86-4.75×6=51.36,∴纯利与每天销售件数x 之间的回归直线方程为y ^=51.36+4.75x . (3)当y ^=200时,200=4.75x +51.36,所以x ≈31.29.因此若该店每周至少要获纯利200元,则该店每天至少要销售这种服装32件.[随堂即时演练]1.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是( ) A.y ^=-10x +200 B .y ^=10x +200 C.y ^=-10x -200D .y ^=10x -200解析:选A ∵商品销售量y (件)与销售价格x (元/件)负相关,∴b <0,排除B ,D.又∵x =0时,y >0,∴选A.2.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图图2.由这两个散点图可以判断( )A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关解析:选C 由这两个散点图可以判断,变量x 与y 负相关,u 与v 正相关.3.若施肥量x (kg)与水稻产量y (kg)的线性回归方程为y ^=5x +250,当施肥量为80 kg 时,预计水稻产量约为________kg.解析:把x =80 kg 代入回归方程可得其预测值 y ^=5×80+250=650(kg). 答案:6504.对具有线性相关关系的变量x 和y ,测得一组数据如下表所示.__________________. 解析:由题意可知x =2+4+5+6+85=5,y =30+40+60+50+705=50.即样本中心为(5,50).设回归直线方程为y ^=6.5x +b ^, ∵回归直线过样本中心(x ,y ), ∴50=6.5×5+b ^, 即b ^=17.5,∴回归直线方程为y ^=6.5x +17.5. 答案:y ^=6.5x +17.55.2015年元旦前夕,某市统计局统计了该市2014年10户家庭的年收入和年饮食支出的统计资料如下表:(1)如果已知y 与x 是线性相关的,求回归方程; (2)若某家庭年收入为9万元,预测其年饮食支出. (参考数据:∑i =110x i y i =117.7,∑i =110x 2i =406)解:(1)依题意可计算得:x =6,y =1.83,x 2=36,x y =10.98, 又∵∑i =110x i y i =117.7,∑i =110x 2i =406,∴b ^=∑i =110x i y i -10x y∑i =110x 2i -10x2≈0.17,a ^=y -b ^x =0.81, ∴y ^=0.17x +0.81.∴所求的回归方程为y ^=0.17x +0.81.(2)当x =9时,y ^=0.17×9+0.81=2.34(万元).可估计大多数年收入为9万元的家庭每年饮食支出约为2.34万元.[课时达标检测]一、选择题1.下列命题正确的是( ) ①任何两个变量都具有相关关系; ②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系; ④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.A .①③④B .②③④C .③④⑤D .②④⑤答案:C2.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423; ②y 与x 负相关且y ^=-3.476x +5.648; ③y 与x 正相关且y ^=5.437x +8.493; ④y 与x 正相关且y ^=-4.326x -4.578. 其中一定不正确的结论的序号是( ) A .①② B .②③ C .③④ D .①④答案:D3.某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得回归方程y =b x +a 中的b 为9.4,据此模型预测广告费用为6万元时的销售额为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元答案:B4.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是( )A .y 与x 具有正的线性相关关系B .回归直线过样本的中心点(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 答案:D5.对有线性相关关系的两个变量建立的回归直线方程y ^=a ^+b ^x 中,回归系数b ^( ) A .不能小于0 B .不能大于0 C .不能等于0 D .只能小于0答案:C 二、填空题6.正常情况下,年龄在18岁到38岁之间的人,体重y (单位:kg)对身高x (单位:cm)的回归方程为y ^=0.72x -58.2,张红同学(20岁)身高为178 cm ,她的体重应该在________ kg左右.解析:用回归方程对身高为178 cm 的人的体重进行预测,当x =178时,y ^=0.72×178-58.2=69.96(kg).答案:69.967.为了均衡教育资源,加大对偏远地区的教育投入,调查了某地若干户家庭的年收入x (单元:万元)和年教育支出y (单位:万元).调查显示年收入x 与年教育支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程为y ^=0.15x +0.2.由回归直线方程可知,家庭年收入每增加1万元,年教育支出平均增加________万元.解析:因为回归直线的斜率为0.15,所以家庭年收入每增加1万元,年教育支出平均增加0.15万元.答案:0.158.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球的时间x (单位:小时)与当天投篮的命中率:小李这56号打6小时篮球的投篮命中率为________.解析:小李这5天的平均投篮命中率y =15(0.4+0.5+0.6+0.6+0.4)=0.5,x =3,b ^=∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2=0.2+0+0+0.1+(-0.2)(-2)2+(-1)2+0+12+22=0.01,a ^=y -b ^x =0.47,∴线性回归方程为y ^=0.01x +0.47, 则当x =6时,y =0.53.∴预测小李该月6号打6小时篮球的投篮命中率为0.53. 答案:0.5 0.53三、解答题9.一项关于16艘轮船的研究中,船的吨位区间为[192,3 246](单位:吨),船员的人数为5~32人,船员人数y 关于吨位x 的回归方程为y ^=9.5+0.006 2x ,(1)若两艘船的吨位相差1 000,求船员平均相差人数; (2)估计吨位最大的船和最小的船的船员人数. 解:(1)设两艘船的吨位分别为x 1,x 2则 y ^1-y ^2=9.5+0.006 2x 1-(9.5+0.006 2x 2) =0.006 2×1 000≈6, 即船员平均相差6人.(2)当x =192时,y ^=9.5+0.006 2×192≈11, 当x =3 246时,y ^=9.5+0.006 2×3 246≈30. 即估计吨位最大和最小的船的船员数分别为30和11.10.某工厂对某种产品的产量与成本进行资料分析后有如下数据:(1)画出散点图;(2)求成本y 与产量x 之间的线性回归方程; (3)预计产量为8千件时的成本.解:(1)散点图如下:(2)设成本y 与产量x 的线性回归方程为y ^=b ^x +a ^, x =2+3+5+64=4,y =7+8+9+124=9.b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x2=1110=1.1, a ^=y -b ^x =9-1.1×4=4.6. 所以,回归方程为y ^=1.1x +4.6.(3)当x =8时,y ^=1.1×8+4.6=8.8+4.6=13.4,即产量为8千件时,成本约为13.4万元.。
学习资料2。
3 变量间的相关关系2。
3.1变量之间的相关关系2.3.2两个变量的线性相关学习目标核心素养1.了解变量间的相关关系,会画散点图,并利用散点图判断两个变量之间是否具有相关关系.(重点)2.了解线性回归思想,会求回归直线方程.(难点)1.通过对数据的分析、统计,培养数据分析素养.2.借助变量间相关关系的研究,提升数学运算素养。
1.变量间的相关关系(1)相关关系的定义变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有不确定性的,那么这两个变量之间的关系叫做相关关系,两个变量之间的关系分为函数关系和相关关系.(2)散点图将样本中n个数据点(x i,y i)(i=1,2,…,n)描在平面直角坐标系中得到的图形叫做散点图.(3)正相关与负相关①正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.②负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.2.回归直线方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)线性回归方程:回归直线对应的方程叫做回归直线的方程,简称回归方程.(3)最小二乘法:求线性回归方程错误!=错误!x+错误!时,使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.错误!其中,错误!是线性回归方程的斜率,错误!是线性回归方程在y轴上的截距.1.下列两个变量具有相关关系的是()A.角度和它的余弦值B.圆的半径和该圆的面积C.正n边形的边数和它的内角和D.居民的收入与存款D[A、B、C中两变量是确定的函数关系.]2.某工厂某产品产量x(千件)与单位成本y(元)满足回归直线方程y,^=77.36-1。
82x,则以下说法中正确的是()A.产量每增加1 000件,单位成本约下降1.82元B.产量每减少1 000件,单位成本约下降1.82元C.当产量为1千件时,单位成本为75。
2020年高中数学必修三第二章《统计》2.3.1变量之间的相关关系2.3.2两个变量的线性相关学习目标 1.了解变量间的相关关系,会画散点图;2.根据散点图,能判断两个变量是否具有相关关系;3.了解线性回归思想,会求回归直线的方程.知识点一变量间的相关关系思考1粮食产量与施肥量间的相关关系是正相关还是负相关?答案在施肥不过量的情况下,施肥越多,粮食产量越高,所以是正相关.思考2怎样判断一组数据是否具有线性相关关系?答案画出散点图,若点大致分布在一条直线附近,就说明这两个变量具有线性相关关系,否则不具有线性相关关系.梳理1.相关关系的定义变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,那么这两个变量之间的关系叫做相关关系,两个变量之间的关系分为函数关系和相关关系.2.散点图将样本中n个数据点(x i,y i)(i=1,2,…,n)描在平面直角坐标系中得到的图形叫做散点图.3.正相关与负相关(1)正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.知识点二两个变量的线性相关思考任何一组数据都可以由最小二乘法得出线性回归方程吗?答案用最小二乘法求线性回归方程的前提是先判断所给数据是否具有线性相关关系(可利用散点图来判断),否则求出的线性回归方程是无意义的.梳理 回归直线的方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)线性回归方程:回归直线对应的方程叫做回归直线的方程,简称回归方程. (3)最小二乘法:求线性回归方程y ^=b ^x +a ^时,使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.⎩⎪⎨⎪⎧b ^=∑i =1n(x i-x )(y i-y )∑i =1n(x i-x )2=∑i =1nx i y i-n x y ∑i =1nx 2i-n x 2,a ^=y -b ^x ,其中,b ^是线性回归方程的斜率,a ^是线性回归方程在y 轴上的截距.类型一 相关关系的判断与应用 命题角度1 判断两个变量的相关性例1 为了研究质量对弹簧长度的影响,对6根相同的弹簧进行测量,所得数据如下:判断它们是否有相关关系,若有,判断是正相关还是负相关. 解 散点图如图:由散点图可以看出两个变量对应的点大致分布在一条直线附近,因此可以得出结论:质量与弹簧长度这两个变量具有相关关系,且它们是正相关关系.反思与感悟在研究两个变量之间是否存在某种关系时,必须从散点图入手,对于散点图,可以作出如下判断:(1)如果所有的样本点都落在某一函数曲线上,那么就用该函数来描述变量之间的关系,即变量之间具有函数关系;(2)如果所有的样本点都落在某一直线附近,那么变量之间就有线性相关关系;(3)如果散点图中的点的分布几乎没有什么规律,那么这两个变量之间不具有相关关系,即两个变量之间是相互独立的.跟踪训练1下表是某地的年降雨量与年平均气温的统计表,判断两者是否具有相关关系,求线性回归方程有意义吗?解以x轴为年平均气温,y轴为年降雨量,可得相应的散点图如图.因为图中各点并不在一条直线的附近,所以两者不具有线性相关关系,没必要用回归直线进行拟合,即使用公式法求出线性回归方程也是没有意义的.命题角度2函数关系与相关关系的区别与联系例2下列关系中,是相关关系的是________.①正方形的边长与面积之间的关系;②农作物的产量与施肥量之间的关系;③人的身高与年龄之间的关系;④降雪量与交通事故的发生率之间的关系.答案②④解析①中,正方形的边长与面积之间的关系是函数关系;②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;③中,人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人达到一定年龄后,身高就不发生明显变化了,所以它们不具有相关关系;④中,降雪量与交通事故的发生率之间具有相关关系. 反思与感悟 相关关系与函数关系的区别与联系如表所示:跟踪训练2 下列图形中两个变量具有相关关系的是( )答案 C解析A 是一种函数关系;B 也是一种函数关系;C 中从散点图中可看出所有点看上去都在某条直线附近波动,具有相关关系,而且是一种线性相关;D 中所有的点在散点图中没有显示任何关系,因此变量间是不相关的. 类型二 回归直线的求解与应用例3 一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器运转速度的变化而变化,下表为抽样试验的结果:(1)画出散点图;(2)如果y 对x 有线性相关关系,请画出一条直线近似地表示这种线性关系;(3)在实际生产中,若它们的近似方程为y =5170x -67,允许每小时生产的产品中有缺点的零件最多为10件,那么机器的运转速度应控制在什么范围内? 解 (1)散点图如图所示:(2)近似直线如图所示:(3)由y ≤10得5170x -67≤10,解得x ≤14.9,所以机器的运转速度应控制在14转/秒内.引申探究1.本例(3)中近似方程不变,若每增加一个单位的转速,生产有缺点的零件数近似增加多少? 解 因为y =5170x -67,所以当x 增加一个单位时,y 大约增加5170.2.本例(3)中近似方程不变,每小时生产有缺点的零件件数是7,估计机器的转速. 解 因为y =5170x -67,所以当y =7时,7=5170x -67,解得x ≈11.反思与感悟 求线性回归方程的一般步骤(1)收集样本数据,设为(x i ,y i )(i =1,2,…,n )(数据一般由题目给出). (2)作出散点图,确定x ,y 具有线性相关关系. (3)把数据制成表格x i ,y i ,x 2i ,x i y i . (4)计算x ,y,∑i =1nx 2i ,∑i =1nx i y i .(5)代入公式计算b ^,a ^,公式为⎩⎪⎨⎪⎧b ^=∑i =1nx i y i-n x y ∑i =1nx 2i-n x2,a ^=y -b ^x .(6)写出线性回归方程y ^=b ^x +a ^.跟踪训练3 (1)变量y 与x 满足线性回归方程y ^=b ^x +a ^,现在将y 的单位由厘米变为米,x的单位由毫米变为米,则在新的线性回归方程y ^=b ^*x +a ^*中,b ^*是b ^的____________倍.(2)为了均衡教育资源,加大对偏远地区的教育投入,调查了某地区若干户家庭的年收入x (单位:万元)和年教育支出y (单位:万元),调查显示年收入x 与年教育支出y 具有相关关系,并由调查数据得到y 对x 的线性回归方程为y ^=0.15x +0.2.由线性回归方程可知,家庭年收入每增加1万元,年教育支出平均增加________万元. 答案 (1)10 (2)0.15解析 (1)由回归系数公式知,当y 的值变为原来的10-2倍,x 的值变为原来的10-3倍时,b^*的值应为原来的10倍.(2)回归直线的斜率为0.15,所以家庭年收入每增加1万元,年教育支出平均增加0.15万元.1.设有一个线性回归方程为y ^=2-1.5x ,则变量x 增加1个单位时,y 平均( ) A .增加1.5个单位 B .增加2个单位 C .减少1.5个单位 D .减少2个单位答案 C2.由三点(3,10),(7,20),(11,24)确定的线性回归方程为( ) A.y ^=1.75x -5.75 B.y ^=1.75x +5.75 C.y ^=-1.75x +5.75 D.y ^=-1.75x -5.75答案 B解析 设线性回归方程为y ^=b ^x +a ^, 则b ^=x 1y 1+x 2y 2+x 3y 3-3x y x 21+x 22+x 23-3x2=3×10+7×20+11×24-3×7×189+49+121-3×49=1.75,a ^=y -b ^x =18-1.75×7=5.75. 故y ^=1.75x +5.75,故选B.3.某地区近10年居民的年收入x 与年支出y 之间的关系大致符合y ^=0.8x +0.1(单位:亿元),预计今年该地区居民收入为15亿元,则今年支出估计是________亿元. 答案 12.1解析 将x =15代入y ^=0.8x +0.1,得y ^=12.1.4.某市居民2012~2016年家庭年平均收入x (单位:万元)与年平均支出y (单位:万元)的统计资料如表所示:根据统计资料,居民家庭年平均收入的中位数是__________万元,家庭年平均收入与年平均支出有________线性相关关系. 答案 13 正解析 考查中位数的定义,奇数个时按大小顺序排列后中间一个是中位数,而偶数个时需取中间两数的平均数.由统计资料可以看出,当年平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系.5.某5名学生的总成绩和数学成绩(单位:分)如表所示:(1)画出散点图;(2)求y 对x 的线性回归方程(结果保留到小数点后3位数字); (3)如果一个学生的总成绩为450分,试预测这个学生的数学成绩. 解 (1)散点图如图所示:(2)由题中数据计算可得x =391.6,y =67.8,∑i =15x 2i =770 654,∑i =15x i y i =133 548.代入公式得b ^=133 548-5×391.6×67.8770 654-5×391.62≈0.204,a ^=67.8-0.204×391.6≈-12.086,所以y 对x 的线性回归方程为y ^=-12.086+0.204x .(3)由(2)得当总成绩为450分时,y ^=-12.086+0.204×450≈80,即这个学生的数学成绩大约为80分.1.判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图.根据散点图,可以很容易看出两个变量是否具有相关关系,是不是线性相关,是正相关还是负相关. 2.求线性回归方程时应注意的问题(1)知道x 与y 成线性相关关系,无需进行相关性检验,否则应首先进行相关性检验,如果两个变量之间本身不具有相关关系,或者说,它们之间的相关关系不显著,即使求出线性回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的. (2)用公式计算a ^、b ^的值时,要先计算b ^,然后才能算出a ^.3.利用回归方程,我们可以进行估计和预测.若回归方程为y ^=b ^x +a ^,则x =x 0处的估计值为y ^0=b ^x 0+a ^.40分钟课时作业一、选择题1.某商品销售量y (件)与销售价格x (元/件)负相关,则其线性回归方程可能是( ) A.y ^=-10x +200 B.y ^=10x +200 C.y ^=-10x -200 D.y ^=10x -200答案 A解析 x 的系数为负数,表示负相关,排除B 、D ,由实际意义可知x >0,y >0,C 中,散点图在第四象限无意义,故选A.2.根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )A .逐年比较,2008年减少二氧化硫排放量的效果最显著B .2007年我国治理二氧化硫排放显现成效C .2006年以来我国二氧化硫年排放量呈减少趋势D .2006年以来我国二氧化硫年排放量与年份正相关 答案 D解析 由柱形图可知:A 、B 、C 均正确,2006年以来我国二氧化硫年排放量在逐渐减少,所以排放量与年份负相关,所以D 不正确.3.对变量x ,y 有观测数据(x i ,y i )(i =1,2,3,…,10),得散点图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,3,…,10),得散点图2,由这两个散点图可以判断( )A .y 与x 正相关,v 与u 正相关B .y 与x 正相关,v 与u 负相关C .y 与x 负相关,v 与u 正相关D .y 与x 负相关,v 与u 负相关 答案 C解析 根据散点图直接进行判断.4.已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( ) A.y ^=0.4x +2.3 B.y ^=2x -2.4 C.y ^=-2x +9.5 D.y ^=-0.3x +4.4答案 A解析 由变量x 与y 正相关知C 、D 均错,又回归直线经过样本点的中心(3,3.5),代入验证得A 正确,B 错误.故选A. 5.已知x 与y 之间的一组数据:若y 与x 线性相关,则y 与x 的回归直线y ^=b ^x +a ^必过( ) A .点(2,2) B .点(1.5,0) C .点(1,2) D .点(1.5,4)答案 D 解析 ∵x =0+1+2+34=1.5,y =1+3+5+74=4, ∴回归直线必过点(1.5,4).故选D. 6.已知x ,y 的取值如表所示:如果y 与x 线性相关,且线性回归方程为y ^=b ^x +132,则b ^等于( )A .-12B.12 C .-110D.110答案 A 解析 ∵x =2+3+43=3,y =6+4+53=5, ∴回归直线过点(3,5),∴5=3b ^+132,∴b ^=-12,故选A.二、填空题7.为了研究某种细菌在特定环境下随时间变化的繁殖规律,得到了下表中的数据,计算得回归方程为y ^=0.85x -0.25.由以上信息,可得表中c 的值为________.答案 6解析 x =3+4+5+6+75=5,y =2.5+3+4+4.5+c 5=14+c 5,代入回归方程中得14+c5=0.85×5-0.25,解得c =6.8.如图所示的五组数据(x ,y )中,去掉________后,剩下的四组数据相关性增强.答案 (4,10)解析 去掉点(4,10)后,其余四点大致在一条直线附近,相关性增强. 9.在一次试验中测得(x ,y )的四组数据如下:根据上表可得线性回归方程y ^=-5x +a ^,据此模型预报当x =20时,y 的值为________. 答案 26.5解析 x =16+17+18+194=17.5,y =50+34+41+314=39,∴回归直线过点(17.5,39), ∴39=-5×17.5+a ^, ∴a ^=126.5,∴当x =20时,y =-5×20+126.5=26.5.10.某工厂对某产品的产量与成本的资料分析后有如下数据:由表中数据得到的线性回归方程y ^=b ^x +a ^中b ^=1.1,预测当产量为9千件时,成本约为________万元. 答案 14.5解析 由表中数据得x =4,y =9,代入线性回归方程得a ^=4.6,∴当x =9时,y ^=1.1×9+4.6=14.5. 三、解答题11.某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)利用所给数据求两变量之间的回归方程y ^=b ^x +a ^;(2)利用(1)中所求出的回归方程预测该地第6年的粮食需求量. 解 (1)由所给数据得 x =3,y =5.8,b ^=∑i =15(x i -x )(y i -y )∑i =15(x i -x )2=1.1,a ^=y -b ^x =2.5, ∴y ^=1.1x +2.5.故所求的回归方程为y ^=1.1x +2.5. (2)第6年的粮食需求量约为 y ^=1.1×6+2.5=9.1(万吨).12.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =110x 2i =720.(1)求月储蓄y (千元)关于月收入x (千元)的线性回归方程; (2)若该居民区某家庭的月收入为7千元,预测该家庭的月储蓄. 解 (1)由题意知n =10,x =1n ∑i =110x i =110×80=8,y =1n ∑i =110y i =110×20=2,又∑i =110x 2i -n x 2=720-10×82=80, ∑i =110x i y i -n x y =184-10×8×2=24,由此得b ^=2480=0.3,a ^=y -b ^x =2-0.3×8=-0.4, 故所求线性回归方程为y ^=0.3x -0.4.(2)将x =7代入线性回归方程,可以得到该家庭的月储蓄约为y ^=0.3×7-0.4=1.7(千元). 13.为了分析某高三学生的学习状态,对其下一阶段的学习提供指导性建议,现对他前7次考试的数学成绩x 、物理成绩y 进行分析.下面是该生7次考试的成绩(单位:分).(1)他的数学成绩与物理成绩哪个更稳定?并说明理由;(2)已知该学生的物理成绩y 与数学成绩x 是线性相关的,若该生的物理成绩达到115分,请你估计他的数学成绩大约是多少分,并请你根据物理成绩与数学成绩的相关性,给出该生在学习数学、物理上的合理建议.解 (1)x =100+-12-17+17-8+8+127=100,y =100+-6-9+8-4+4+1+67=100,s 2数学=142,s 2物理=2507,因为s 2数学>s 2物理, 所以他的物理成绩更稳定.(2)由于x 与y 之间具有线性相关关系,经计算得b ^=0.5,a ^=100-0.5×100=50. 所以线性回归方程为y ^=0.5x +50. 当y =115时,x =130. 估计他的数学成绩是130分.建议:进一步加强对数学的学习,提高数学成绩的稳定性,将有助于物理成绩的进一步提高.。
变量间的相关关系(1)函数关系与相关关系的区别与联系是什么?(2)如何判断两个变量之间是否具备相关关系?(3)什么是正相关、负相关?与散点图有什么关系?[新知初探]1.相关关系如果两个变量中一个变量的取值一定时,另一个变量的取值带有一定的随机性,那么这两个变量之间的关系叫做相关关系.2.散点图将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图,利用散点图,可以判断两个变量是否相关,相关时是正相关还是负相关.3.正相关和负相关(1)正相关:散点图中的点散布在从左下角到右上角的区域.(2)负相关:散点图中的点散布在从左上角到右下角的区域.[点睛]对正相关和负相关的理解(1)正相关随自变量的变大(或变小),因变量也随之变大(或变小),这种带有随机性的相关关系,我们称为正相关.例如,人年龄由小变大时,体内脂肪含量也由少变多.(2)负相关随自变量的变大(或变小),因变量却随之变小(或变大),这种带有随机性的相关关系,我们称为负相关.例如,汽车越重,每消耗1 L 汽油所行驶的平均路程就越短.4.回归直线方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归方程:回归直线的方程,简称回归方程. (3)回归方程的推导过程:①假设已经得到两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ).②设所求回归方程为y ^=b ^x +a ^,其中a ^,b ^是待定参数. ③由最小二乘法得⎩⎪⎨⎪⎧b ^=∑i =1n(x i-x )(y i-y )∑i =1n (x i-x )2=∑i =1nx i y i-n x y ∑i =1n x 2i-n x 2a ^=y -b ^x其中:b ^是回归方程的斜率,a ^是截距.[小试身手]1.下列命题正确的是( ) ①任何两个变量都具有相关关系; ②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系; ④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.A .①③④B .②③④C .③④⑤D .②④⑤解析:选C ①显然不对,②是函数关系,③④⑤正确.2.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图图2.由这两个散点图可以判断( )A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关解析:选C 由这两个散点图可以判断,变量x 与y 负相关,u 与v 正相关. 3.若施肥量x (kg)与水稻产量y (kg)的线性回归方程为y ^=5x +250,当施肥量为80 kg 时,预计水稻产量约为________kg.解析:把x =80代入回归方程可得其预测值y ^=5×80+250=650(kg). 答案:6504.对具有线性相关关系的变量x 和y ,测得一组数据如下表所示.x 2 4 5 6 8 y3040605070若已求得它们回归直线的方程为______________________.解析:由题意可知x =2+4+5+6+85=5,y =30+40+60+50+705=50.即样本中心为(5,50).设回归直线方程为y ^=6.5x +a ^, ∵回归直线过样本中心(x ,y ), ∴50=6.5×5+a ^,即a ^=17.5, ∴回归直线方程为y ^=6.5x +17.5 答案:y ^=6.5x +17.5相关关系的判断①正方形的边长与面积之间的关系;②农作物的产量与施肥量之间的关系;③出租车费与行驶的里程;④降雪量与交通事故的发生率之间的关系.(2)某个男孩的年龄与身高的统计数据如下表所示.年龄x(岁)12345 6身高y(cm)788798108115120①画出散点图;②判断y与x是否具有线性相关关系.[解析](1)在①中,正方形的边长与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;③为确定的函数关系;在④中,降雪量与交通事故的发生率之间具有相关关系.答案:②④(2)解:①散点图如图所示.②由图知,所有数据点接近一条直线排列,因此,认为y与x具有线性相关关系.两个变量是否相关的两种判断方法(1)根据实际经验:借助积累的经验进行分析判断.(2)利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断.[活学活用]如图所示的两个变量不具有相关关系的是________(填序号).解析:①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条直线周围;④中点的分布没有任何规律可言,x ,y 不具有相关关系.答案:①④[典例] (1)已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( )A.y ^=0.4x +2.3 B.y ^=2x -2.4 C.y ^=-2x +9.5D.y ^=-0.3x +4.4(2)一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器的运转的速度的变化而变化,下表为抽样试验的结果:转速x (转/秒)16 14 12 8 每小时生产有缺点的零件数y (件)11985②如果y 对x 有线性相关关系,请画出一条直线近似地表示这种线性关系; ③在实际生产中,若它们的近似方程为y =5170x -67,允许每小时生产的产品中有缺点的零件最多为10件,那么机器的运转速度应控制在什么范围内?[解析] (1)依题意知,相应的回归直线的斜率应为正,排除C 、D.且直线必过点(3,3.5),代入A 、B 得A 正确.答案:A(2)解:①散点图如图所示:②近似直线如图所示:③由y ≤10得5170x -67≤10,解得x ≤14.9,所以机器的运转速度应控制在14转/秒内.求回归直线方程的步骤(1)收集样本数据,设为(x i ,y i )(i =1,2,…,n )(数据一般由题目给出). (2)作出散点图,确定x ,y 具有线性相关关系. (3)把数据制成表格x i ,y i ,x 2i ,x i y i . (4)计算x ,y,∑i =1nx 2i ,∑i =1nx i y i . (5)代入公式计算b ^,a ^,公式为⎩⎪⎨⎪⎧b ^=∑i =1n x i y i -n x y∑i =1n x 2i-n x2,a ^=y -b ^x .(6)写出回归直线方程y ^=b ^x +a ^. [活学活用]已知变量x ,y 有如下对应数据:x 1 2 3 4 y1345(1)作出散点图;(2)用最小二乘法求关于x ,y 的回归直线方程. 解:(1)散点图如图所示.(2)x =1+2+3+44=52,y =1+3+4+54=134, ∑i =14x i y i =1+6+12+20=39.∑i =14x 2i =1+4+9+16=30,b ^=39-4×52×13430-4×⎝⎛⎭⎫522=1310,a ^=134-1310×52=0,所以y ^=1310x 为所求的回归直线方程.利用线性回归方程对总体进行估计[典例] 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据:x 3 4 5 6 y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,求出y 关于x 的回归直线方程y ^=b ^x +a ^;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归直线方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤?[解] (1)散点图如图:(2)x =3+4+5+64=4.5,y =2.5+3+4+4.54=3.5,∑i =14x i y i =3×2.5+4×3+5×4+6×4.5=66.5,∑i =14x 2i =32+42+52+62=86, 所以b ^=∑i =14x i y i -4x y ∑i =14x 2i -4x2=66.5-4×4.5×3.586-4×4.52=0.7,a ^=y -b ^x =3.5-0.7×4.5=0.35. 所以所求的线性回归方程为y ^=0.7x +0.35.(3)当x =100时,y ^=0.7×100+0.35=70.35(吨标准煤),90-70.35=19.65(吨标准煤).即生产100吨甲产品的生产能耗比技改前降低了19.65吨标准煤.只有当两个变量之间存在线性相关关系时,才能用回归直线方程对总体进行估计和预测.否则,如果两个变量之间不存在线性相关关系,即使由样本数据求出回归直线方程,用其估计和预测结果也是不可信的.[活学活用](重庆高考)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份 2010 2011 2012 2013 2014 时间代号t 1 2 3 4 5 储蓄存款y (千亿元)567810(1)求y 关于t 的回归方程y ^=b ^t +a ^;(2)用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款. 解:(1)列表计算如下:i t i y i t 2i t i y i 1 2 3 4 51 2 3 4 55 6 7 8 101 4 9 16 255 12 21 32 50这里n =5,t -=1n ∑i =1n t i =155=3,y -=1n ∑i =1ny i =365=7.2.∑i =1nt 2i -n t -2=55-5×32=10,∑i =1nt i y i -n t -y -=120-5×3×7.2=12,从而b ^=1210=1.2,a ^=y --b ^t -=7.2-1.2×3=3.6,故所求回归方程为y ^=1.2t +3.6.(2)将t =6代入回归方程可预测该地区2015年的人民币储蓄存款为y ^=1.2×6+3.6=10.8(千亿元).[层级一 学业水平达标]1.下列变量具有相关关系的是( ) A .人的体重与视力B .圆心角的大小与所对的圆弧长C .收入水平与购买能力D .人的年龄与体重解析:选C B 为确定性关系;A ,D 不具有相关关系,故选C. 2.已知变量x ,y 之间具有线性相关关系,其散点图如图所示,则其回归方程可能为A.y ^=1.5x +2 B.y ^=-1.5x +2 C.y ^=1.5x -2 D.y ^=-1.5x -2解析:选B 设回归方程为y ^=b ^x +a ^,由散点图可知变量x ,y 之间负相关,回归直线在y 轴上的截距为正数,所以b ^<0,a ^>0,因此方程可能为y ^=-1.5x +2.3.设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线如图所示,则以下结论正确的是( )A .直线l 过点(x ,y )B .回归直线必通过散点图中的多个点C .直线l 的斜率必在(0,1)D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同解析:选A A 是正确的;回归直线可以不经过散点图中的任何点,故B 错误;回归直线的斜率不确定,故C 错误;分布在l 两侧的样本点的个数不一定相同,故D 错误.4.对有线性相关关系的两个变量建立的回归直线方程y ^=a ^+b ^x 中,回归系数b ^( ) A .不能小于0 B .不能大于0 C .不能等于0D .只能小于0解析:选C 当b ^=0时,r =0,这时不具有线性相关关系,但b ^能大于0,也能小于0. 5.2016年元旦前夕,某市统计局统计了该市2015年10户家庭的年收入和年饮食支出的统计资料如下表:(2)若某家庭年收入为9万元,预测其年饮食支出. (参考数据:∑i =110x i y i =117.7,∑i =110x 2i =406)解:依题意可计算得:x =6,y =1.83,x 2=36,x y =10.98, 又∵∑i =110x i y i =117.7,∑i =110x 2i =406,∴b ^=∑i =110x i y i -10x y∑i =110x 2i -10x2≈0.17,a ^=y -b ^x =0.81,∴y ^=0.17x +0.81. ∴所求的回归方程为y ^=0.17x +0.81.(2)当x =9时,y ^=0.17×9+0.81=2.34(万元).可估计年收入为9万元的家庭每年饮食支出约为2.34万元.[层级二 应试能力达标]1.一个口袋中有大小不等的红、黄、蓝三种颜色的小球若干个(大于5个),从中取5次,那么取出红球的次数和口袋中红球的数量是( )A .确定性关系B .相关关系C .函数关系D .无任何关系解析:选B 每次从袋中取球取出的球是不是红球,除了和红球的个数有关外,还与球的大小等有关系,所以取出红球的次数和口袋中红球的数量是一种相关关系.2.农民工月工资y (元)依劳动生产率x (千元)变化的回归直线方程为y ^=50+80x ,下列判断正确的是( )A .劳动生产率为1 000元时,工资为130元B .劳动生产率提高1 000元时,工资水平提高80元C .劳动生产率提高1 000元时,工资水平提高130元D .当月工资为210元时,劳动生产率为2 000元解析:选B 由回归直线方程y ^=50+80x 知,x 每增加1,y 增加80,但要注意x 的单位是千元,y 的单位是元.3.为了解儿子身高与其父亲身高的关系,随机抽取5对父子身高数据如下:父亲身高x (cm) 174 176 176 176 178 儿子身高y (cm)175175176177177则y 对x 的线性回归方程为( ) A .y =x -1 B .y =x +1 C .y =88+12xD .y =176解析:选C 计算得,x =174+176+176+176+1785=176,y =175+175+176+177+1775=176,根据回归直线经过样本中心(x ,y )检验知,C 符合.4.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归直线方程为y ^=b ^x +a ^,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′B.y ^>b ′,a ^<a ′C.b ^<b ′,a ^>a ′D.y ^<b ′,a ^<a ′解析:选C 由(1,0),(2,2)求b ′,a ′. b ′=2-02-1=2,a ′=0-2×1=-2.求b ^,a ^时,∑i =16x i y i =0+4+3+12+15+24=58,x =3.5,y =136, ∑i =16x 2i =1+4+9+16+25+36=91,∴b ^=58-6×3.5×13691-6×3.52=57, a ^=136-57×3.5=136-52=-13,∴b ^<b ′,a ^>a ′.5.正常情况下,年龄在18岁到38岁的人,体重y (kg)对身高x (cm)的回归方程为y ^=0.72x -58.2,张红同学(20岁)身高为178 cm ,她的体重应该在________ kg 左右.解析:用回归方程对身高为178 cm 的人的体重进行预测,当x =178时,y ^=0.72×178-58.2=69.96(kg).答案:69.966.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:由表中数据,求得线性回归方程为y =-4x +a ,则a =________. 解析:x =4+5+6+7+8+96=132,y =92+82+80+80+78+686=80,由回归方程过样本中心点(x ,y ) 得80=-4×132+a ^.即a ^=80+4×132=106.答案:1067.对某台机器购置后的运行年限x (x =1,2,3,…)与当年利润y 的统计分析知x ,y 具备线性相关关系,回归方程为y ^=10.47-1.3x ,估计该台机器最为划算的使用年限为________年.解析:当年利润小于或等于零时应该报废该机器,当y =0时,令10.47-1.3x =0,解得x ≈8,故估计该台机器最为划算的使用年限为8年.答案:88.一项关于16艘轮船的研究中,船的吨位区间为[192,3 246](单位:吨),船员的人数5~32人,船员人数y 关于吨位x 的回归方程为y ^=9.5+0.006 2x ,(1)若两艘船的吨位相差1 000,求船员平均相差的人数; (2)估计吨位最大的船和最小的船的船员人数. 解:(1)设两艘船的吨位分别为x 1,x 2,则 y ^1-y ^2=9.5+0.006 2x 1-(9.5+0.006 2x 2) =0.006 2×1 000≈6, 即船员平均相差6人.(2)当x =192时,y ^=9.5+0.006 2×192≈11, 当x =3 246时,y ^=9.5+0.006 2×3 246≈30.即估计吨位最大和最小的船的船员数分别为30人和11人.9.某个体服装店经营某种服装在某周内所获纯利y (元)与该周每天销售这种服装的件数x (件)之间有一组数据如下表:(1)求x ,y ;(2)若纯利y 与每天销售这种服装的件数x 之间是线性相关的,求回归直线方程; (3)若该店每周至少要获纯利200元,请你预测该店每天至少要销售这种服装多少件? (提示:∑i =17x 2i =280,∑i =17y 2i =45 309,∑i =17x i y i =3 487)解:(1)x =3+4+5+6+7+8+97=6,y =66+69+73+81+89+90+917≈79.86.(2)∵b ^=3 487-7×6×79.86280-7×62≈4.75,a ^=79.86-4.75×6=51.36,∴纯利与每天销售件数x 之间的回归直线方程为y ^=51.36+4.75x . (3)当y ^=200时,200=4.75x +51.36,所以x ≈31.29.因此若该店每周至少要获纯利200元,则该店每天至少要销售这种服装32件.(时间120分钟,满分150分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列三个抽样:①一个城市有210家某商品的代理商,其中大型代理商有20家,中型代理商有40家,小型代理商有150家,为了掌握该商品的销售情况,要从中抽取一个容量为21的样本;②在某公司的50名工人中,依次抽取工号为5,10,15,20,25,30,35,40,45,50的10名工人进行健康检查;③某市质量检查人员从一食品生产企业生产的两箱(每箱12盒)牛奶中抽取4盒进行质量检查.则应采用的抽样方法依次为( )A .简单随机抽样;分层抽样;系统抽样B .分层抽样;简单随机抽样;系统抽样C .分层抽样;系统抽样;简单随机抽样D .系统抽样;分层抽样;简单随机抽样解析:选C ①中商店的规模不同,所以应利用分层抽样;②中抽取的学号具有等距性,所以应是系统抽样;③中总体没有差异性,容量较小,样本容量也较小,所以应采用简单随机抽样.故选C.2.将某班的60名学生编号为01,02,…,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是( )A .09,14,19,24B .16,28,40,52C .10,16,22,28D .08,12,16,20解析:选B 分成5组,每组12名学生,按等间距12抽取.选项B 正确.3.某学校有教师200人,男学生1 200人,女学生1 000人.现用分层抽样的方法从全体师生中抽取一个容量为n 的样本,若女学生一共抽取了80人,则n 的值为( )A .193B .192C .191D .190解析:选B 1 000×n200+1 200+1 000=80,求得n =192.4.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是( )A.y ^=-10x +200 B.y ^=10x +200 C.y ^=-10x -200D.y ^=10x -200解析:选A 由于销售量y 与销售价格x 成负相关,故排除B ,D.又因为销售价格x >0,则C 中销售量全小于0,不符合题意,故选A.5.设有两组数据x 1,x 2,…,x n 与y 1,y 2,…,y n ,它们的平均数分别是x 和y ,则新的一组数据2x 1-3y 1+1,2x 2-3y 2+1,…,2x n -3y n +1的平均数是( )A .2x -3yB .2x -3y +1C .4x -9yD .4x -9y +1解析:选B 设z i =2x i -3y i +1(i =1,2,…,n ),则z =1n (z 1+z 2+…+z n )=2n (x 1+x 2+…+x n )-3n (y 1+y 2+…+y n )+⎝⎛⎭⎫1+1+…+1n =2x -3y +1.6.有一个容量为66的样本,数据的分组及各组的频数如下: [11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18 [27.5,31.5) 11 [31.5,35.5) 12 [35.5,39.5) 7 [39.5,43.5) 3则总体中大于或等于31.5的数据所占比例约为( ) A.211 B.13 C.12D.23解析:选B 由题意知,样本的容量为66,而落在[31.5,43.5)内的样本个数为12+7+3=22,故总体中大于或等于31.5的数据约占2266=13.7.某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各有1人,则该小组数学成绩的平均数、众数、中位数分别是( )A .85,85,85B .87,85,86C .87,85,85D .87,85,90解析:选C ∵得85分的人数最多为4人, ∴众数为85,中位数为85,平均数为110(100+95+90×2+85×4+80+75)=87.8.某出租汽车公司为了了解本公司司机的交通违章情况,随机调查了50名司机,得到了他们某月交通违章次数的数据,结果制成了如图所示的统计图,根据此统计图可得这50名出租车司机该月平均违章的次数为( )A .1B .1.8C .2.4D .3解析:选B5×0+20×1+10×2+10×3+5×450=1.8.9.下表是某厂1~4月份用水量情况(单位:百吨)的一组数据月份x 1 2 3 4 用水量y4.5432.5用水量y 与月份x 之间具有线性相关关系,其线性回归方程为y ^=-0.7x +a ,则a 的值为( )A .5.25B .5C .2.5D .3.5解析:选A 线性回归方程经过样本的中心点,根据数据可得样本中心点为(2.5,3.5),所以a =5.25.10.如图是在元旦晚会举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )A .84,4.84B .84,1.6C .85,1.2D .85,4解析:选C 去掉一个最高分95,去掉一个最低分77,平均数为80+15(5+3+6+5+6)=85,方差为15[(85-85)2+(85-83)2+(85-86)2+(85-85)2+(85-86)2]=1.2,因此选C.11.如果数据x 1,x 2,x 3,…,x n 的平均数是x ,方差是s 2,则3x 1+2,3x 2+2,…,3x n +2的平均数和方差分别是( )A.x 和s 2 B .3x 和9s 2 C .3x +2和9s 2D .3x +2和12s 2+4解析:选C 3x 1+2,3x 2+2,…,3x n +2的平均数是3x +2,由于数据x 1,x 2,…x n的方差为s2,所以3x1+2,3x2+2,…,3x n+2的方差为9s2.12.如图是某赛季甲、乙两名篮球运动员5场比赛得分的茎叶图,已知甲的成绩的极差为31,乙的成绩的平均值为24,则下列结论错误的是()A.x=9B.y=8C.乙的成绩的中位数为26D.乙的成绩的方差小于甲的成绩的方差解析:选B因为甲的成绩的极差为31,所以其最高成绩为39,所以x=9;因为乙的成绩的平均值为24,所以y=24×5-(12+25+26+31)-20=6;由茎叶图知乙的成绩的中位数为26;对比甲、乙的成绩分布发现,乙的成绩比较集中,故其方差较小.二、填空题(本大题共4小题,每小题5分,共20分)13.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x-y|的值为________.解析:由平均数为10,得(x+y+10+11+9)×15=10,则x+y=20;又方差为2,∴[(x-10)2+(y-10)2+(10-10)2+(11-10)2+(9-10)2]×15=2,得x2+y2=208,2xy=192,∴|x-y|=(x-y)2=x2+y2-2xy=4.答案:414.一支田径队有男运动员48人,女运动员36人,若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为________.解析:抽取的男运动员的人数为2148+36×48=12.答案:1215.要考察某种品牌的500颗种子的发芽率,抽取60粒进行实验,利用随机数表抽取种子时,先将500颗种子按001,002,…,500进行编号,如果从随机数表第7行第8列的数3开始向右读,请你依次写出最先检测的5颗种子的编号:________,________,________,________,________.(下面摘取了随机数表第7行至第9行)84 42 17 53 3157 24 55 06 8877 04 74 47 6721 76 33 50 2583 92 12 06 7663 01 63 78 5916 95 55 67 1998 10 50 71 7512 86 73 58 0744 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54 解析:选出的三位数分别为331,572,455,068,877,047,447,…,其中572,877均大于500,将其去掉,剩下的前5个编号为331,455,068,047,447.答案:331 455 068 047 44716.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如下图).由图中数据可知a =________.若要从身高在[120,130),[130,140),[140,150]三组的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]的学生中选取的人数应为________.解析:∵0.005×10+0.035×10+a ×10+0.020×10+0.010×10=1, ∴a =0.030.设身高在[120,130),[130,140),[140,150]三组的学生分别有x ,y ,z 人, 则x100=0.030×10,解得x =30.同理,y =20,z =10. 故从[140,150]的学生中选取的人数为1030+20+10×18=3.答案:0.030 3三、解答题(本大题共6小题,共70分.解答应写出文字说明,证明过程或演算步骤) 17.(本小题满分10分)为调查某班学生的平均身高,从50名学生中抽取110,应如何抽样?若知道男生、女生的身高显著不同(男生30人,女生20人),应如何抽样?解:从50名学生中抽取110,即抽取5人,采用简单随机抽样法(抽签法或随机数法).若知道男生、女生的身高显著不同,则采用分层抽样法,按照男生与女生的人数比为30∶20=3∶2进行抽样,则男生抽取3人,女生抽取2人.18.(本小题满分12分)某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示.(1)根据茎叶图计算样本均值;(2)日加工零件个数大于样本均值的工人为优秀工人.根据茎叶图推断该车间12名工人中有几名优秀工人?解:(1)样本均值为17+19+20+21+25+306=1326=22.(2)由(1)知样本中优秀工人所占比例为26=13,故推断该车间12名工人中有12×13=4名优秀工人.19.(本小题满分12分)2016年春节前,有超过20万名广西、四川等省籍的外出务工人员选择驾乘摩托车沿321国道长途跋涉返乡过年,为防止摩托车驾驶人员因长途疲劳驾驶,手脚僵硬影响驾驶操作而引发交通事故,肇庆市公安交警部门在321国道沿线设立了多个长途行驶摩托车驾乘人员休息站,让返乡过年的摩托车驾乘人员有一个停车休息的场所.交警小李在某休息站连续5天对进站休息的驾驶人员每隔50辆摩托车就进行一次省籍询问,询问结果如图所示:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是什么抽样方法?(2)用分层抽样的方法对被询问了省籍的驾驶人员进行抽样,若广西籍的有5人,则四川籍的应抽取几人?解:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是系统抽样法.(2)从题图可知,被询问了省籍的驾驶人员广西籍的有5+20+25+20+30=100(人); 四川籍的有15+10+5+5+5=40(人).设四川籍的驾驶人员应抽取x 人,依题意得5100=x 40,解得x =2,即四川籍的应抽取2人.20.(本小题满分12分)某化肥厂有甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其重量(单位:kg),分别记录抽查数据如下:甲:102,101,99,98,103,98,99; 乙:110,115,90,85,75,115,110. (1)这种抽样方法是哪一种方法?(2)试计算甲、乙车间产品重量的平均数与方差,并说明哪个车间产品较稳定? 解:(1)甲、乙两组数据间隔相同,所以采用的方法是系统抽样. (2)x 甲=17(102+101+99+98+103+98+99)=100,x 乙=17(110+115+90+85+75+115+110)=100,s 2甲=17(4+1+1+4+9+4+1)≈3.43,s 2乙=17(100+225+100+225+625+225+100)=228.57, ∴s 2甲<s 2乙,故甲车间产品比较稳定.21.(本小题满分12分)对某校高一年级学生参加社区服务次数进行统计,随机抽取M 名学生作为样本,得到这M 名学生参加社区服务的次数.根据此数据作出了频数与频率的统计表和频率分布直方图如下:(1)求出表中M ,p 及图中a 的值;(2)若该校高一学生有360人,试估计该校高一学生参加社区服务的次数在区间[10,15)的人数.解:(1)由分组[10,15)的频数是10, 频率是0.25知, 10M =0.25,所以M =40. 因为频数之和为40,所以10+25+m +2=40,解得m =3. 故p =340=0.075.因为a 是对应分组[15,20)的频率与组距的商, 所以a =2540×5=0.125.(2)因为该校高一学生有360人,分组[10,15)的频率是0.25,所以估计该校高一学生参加社区服务的次数在此区间内的人数为360×0.25=90.22.(本小题满分12分)从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =110x 2i =720.(1)求家庭的月储蓄y 对月收入x 的线性回归方程y ^=b ^x +a ^; (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.解:(1)由题意知n =10,x =1n ∑i =1n x i =8010=8, y =1n ∑i =1n y i =2010=2, 又∑i =110x 2i -10x 2=720-10×82=80,∑i =110x i y i -10x y =184-10×8×2=24,由此得b ^=∑i =110x i y i -10x y∑i =110x 2i -10x 2=2480=0.3, a ^=y -b ^x =2-0.3×8=-0.4,故所求回归方程为y ^=0.3x -0.4.(2)由于变量y 的值随x 的值增加而增加(b =0.3>0),故x 与y 之间是正相关.(3)将x =7代入回归方程可以预测该家庭的月储蓄为y =0.3×7-0.4=1.7千元.。
错误!预习课本P84~91,思考并完成以下问题(1)函数关系与相关关系的区别与联系是什么?(2)如何判断两个变量之间是否具备相关关系?(3)什么是正相关、负相关?与散点图有什么关系?错误!1.相关关系如果两个变量中一个变量的取值一定时,另一个变量的取值带有一定的随机性,那么这两个变量之间的关系叫做相关关系.2.散点图将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图,利用散点图,可以判断两个变量是否相关,相关时是正相关还是负相关.3.正相关和负相关(1)正相关:散点图中的点散布在从左下角到右上角的区域.(2)负相关:散点图中的点散布在从左上角到右下角的区域.[点睛] 对正相关和负相关的理解(1)正相关随自变量的变大(或变小),因变量也随之变大(或变小),这种带有随机性的相关关系,我们称为正相关.例如,人年龄由小变大时,体内脂肪含量也由少变多.(2)负相关随自变量的变大(或变小),因变量却随之变小(或变大),这种带有随机性的相关关系,我们称为负相关.例如,汽车越重,每消耗1 L汽油所行驶的平均路程就越短.4.回归直线方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归方程:回归直线的方程,简称回归方程.(3)回归方程的推导过程:①假设已经得到两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(x n,y n).②设所求回归方程为错误!=错误!x+错误!,其中错误!,错误!是待定参数.③由最小二乘法得错误!其中:错误!是回归方程的斜率,错误!是截距.错误!1.下列命题正确的是( )①任何两个变量都具有相关关系;②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系;④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.A.①③④B.②③④C.③④⑤D.②④⑤解析:选C ①显然不对,②是函数关系,③④⑤正确.2.对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图图1;对变量u,v有观测数据(u i,v i)(i=1,2,…,10),得散点图图2。
2.3.1 变量之间的相关关系2.3.2 两个变量的线性相关1.理解两个变量的相关关系的概念.(难点)2.会作散点图,并利用散点图判断两个变量之间是否具有相关关系.(重点)3.会求回归直线方程.(重点)4.相关关系与函数关系.(易混点)[基础·初探]教材整理1 变量之间的相关关系阅读教材P84~P86的内容,完成下列问题.1.相关关系:不像匀速直线运动中时间与路程的关系那样是完全确定的,而是带有不确定性.2.散点图:将样本中几个数据点(x i,y i)(i=1,2,…,n)描在平面直角坐标系中得到的图形.3.正相关与负相关:散点图中的点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,称它为正相关.若散点图中的点分布在从左上角到右下角的区域内,对于两个变量的这种相关关系,称它为负相关.4.相关关系与函数关系的辨析相关关系与函数关系均是指两个变量间的关系,它们的不同点如下:(1)函数关系是一种确定的关系;相关关系是一种非确定的关系,即不能用一个函数关系式来严格地表示变量之间的关系.(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.例如,有人发现,对于在校儿童,脚的大小与阅读能力有很强的相关关系,然而学会更多的新词并不能使脚变大,而是涉及第三个因素——年龄,当儿童长大一些以后,他们的阅读能力会提高,而且脚也会变大.如图231所示的两个变量不具有相关关系的有________.图231【解析】 ①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条直线周围;④中点的分布没有任何规律可言,x ,y 不具有相关关系.【答案】 ①④教材整理2 回归直线方程阅读教材P 87~P 89的内容,完成下列问题.1.回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.2.回归方程:回归直线对应的方程叫回归直线的方程,简称回归方程.3.最小二乘法:求回归直线时,使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.4.求回归方程:若两个具有线性相关关系的变量的一组数据为:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则所求的回归方程为y ^=b ^x +a ^,其中a ^,b ^为待定的参数,由最小二乘法得:⎩⎪⎨⎪⎧b ^=∑i =1nx i-x y i-y ∑i =1nx i-x 2=∑i =1nx i y i -n x -y-∑i =1nx 2i -n x -2,a ^=y -b ^x .b ^是回归直线斜率,a ^是回归直线在y 轴上的截距.1.判断(正确的打“√”,错误的打“×”)(1)回归方程中,由x 的值得出的y 值是准确值.( ) (2)回归方程一定过样本点的中心.( ) (3)回归方程一定过样本中的某一个点.( )(4)选取一组数据中的部分点得到的回归方程与由整组数据得到的回归方程是同一个方程.( )【答案】 (1)× (2)√ (3)× (4) ×2.过(3,10),(7,20),(11,24)三点的回归直线方程是( ) A.y ^=1.75+5.75x B.y ^=-1.75+5.75x C.y ^=5.75+1.75xD.y ^=5.75-1.75x【解析】 求过三点的回归直线方程,目的在于训练求解回归系数的方法,这样既可以训练计算,又可以体会解题思路,关键是能套用公式.代入系数公式得b ^=1.75,a ^=5.75.代入直线方程,求得y ^=5.75+1.75x .故选C.【答案】 C3.已知x 与y 之间的一组数据:则y 与x 的线性回归方程y =bx +a 必过点( ) A .(1,2) B .(5,2) C .(2,5)D .(2.5,5)【解析】 线性回归方程一定过样本中心(x ,y ). 由x =0+1+2+3+45=2,y =1+3+5+7+95=5.故必过点(2,5). 【答案】 C[小组合作型](1)A .正方体的棱长和体积 B .圆半径和圆的面积C .正n 边形的边数和内角度数之和D .人的年龄和身高(2)对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图①;对变量u ,v 有观测数据(u i,v i)(i=1,2,…,10),得散点图②.由这两个散点图可以判断( )图232A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关【精彩点拨】结合相关关系,函数关系的定义及正负相关的定义分别对四个选项作出判断.【尝试解答】(1)A、B、C都是函数关系,对于A,V=a3;对于B,S=πr2;对于C,g(n)=(n-2)π.而对于D,年龄确定的不同的人可以有不同的身高,∴选D.(2)由图象知,变量x与y呈负相关关系;u与v呈正相关关系.【答案】(1)D (2)C判断两个变量x和y间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.[再练一题]1.某公司2011~2016年的年利润x(单位:百万元)与年广告支出y(单位:百万元)的统计资料如下表所示:A.B.利润中位数是18,x与y有负线性相关关系C.利润中位数是17,x与y有正线性相关关系D.利润中位数是17,x与y有负线性相关关系【解析】 由表知,利润中位数是12(16+18)=17,且y 随x 的增大而增大,故选C.【答案】 C一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:(2)如果y 与x 具有线性相关关系,求y 关于x 的回归直线方程. 【精彩点拨】 画散点图→确定相关关系→求回归直线系数 →写回归直线方程【尝试解答】 (1)画散点图如下:由上图可知y 与x 具有线性相关关系. (2)列表、计算:b ^=∑i =110x i y i -10x y∑i =110x 2i -10x 2=55 950-10×55×91.738 500-10×552≈0.668, a ^=y -b ^x =91.7-0.668×55=54.96.即所求的回归直线方程为:y ^=0.668x +54.96.用公式求回归方程的一般步骤:列表x i ,y i ,x i y i ;计算x ,y ,∑i =1nx 2i ,∑i =1nx i y i;代入公式计算a ^,a ^的值; 写出回归方程.[再练一题]2.已知变量x ,y 有如下对应数据:(1)(2)用最小二乘法求关于x ,y 的回归直线方程. 【解】 (1)散点图如图所示:(2)x =1+2+3+44=52, y =1+3+4+54=134,∑i =14x i y i =1+6+12+20=39,∑i =14x 2i =1+4+9+16=30, b ^=39-4×52×13430-4×⎝ ⎛⎭⎪⎫522=1310,a ^=134-1310×52=0,所以y ^=1310x 为所求回归直线方程.x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据:(1)(2)请根据上表提供的数据,用最小二乘法求出回归方程y ^=b ^x +a ^;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?【精彩点拨】 (1)以产量为横坐标,以生产能耗对应的测量值为纵坐标,在平面直角坐标系内画散点图;(2)应用计算公式求得线性相关系数b ^,a ^的值;(3)实际上就是求当x =100时,对应的v 的值.【尝试解答】 (1)散点图,如图所示:(2)由题意,得∑i =14x i y i =3×2.5+4×3+5×4+6×4.5=66.5,x =3+4+5+64=4.5, y =2.5+3+4+4.54=3.5,∑i =14x 2i =32+42+52+62=86, ∴b ^=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7, a ^=y -b ^x =3.5-0.7×4.5=0.35,故线性回归方程为y ^=0.7x +0.35.(3)根据回归方程的预测,现在生产100吨产品消耗的标准煤为0.7×100+0.35=70.35(吨),故耗能减少了90-70.35=19.65(吨)标准煤.回归分析的三个步骤:判断两个变量是否线性相关:可以利用经验,也可以画散点图;求线性回归方程,注意运算的正确性;根据回归直线进行预测估计:估计值不是实际值,两者会有一定的误差.[再练一题]3.某种产品的广告费支出y (百万元)与销售额x (百万元)之间的关系如下表所示.(1)假定y (2)若广告费支出不少于60百万元,则实际销售额应不少于多少?【解】 (1)设回归直线方程为y ^=b ^x +a ^,则b ^=+12×8+14×9+-4×8+12+14+164×5+8+9+1142+122+142+162-4×⎝ ⎛⎭⎪⎫8+12+14+1642=438-412.5660-625=25.535=5170,a ^=y -b ^x =5+8+9+114-5170×8+12+14+164=334-5170×252=-67,则所求回归直线方程为y ^=5170x -67. (2)由y ^=5170x -67≥60,得x ≥4 26051≈84,所以实际销售额不少于84百万元.[探究共研型]探究 1 关系?【提示】 任意两个统计数据均可以作出散点图,对于作出的散点图,如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.特别地,若所有的样本点都落在某一直线附近,变量之间就具有线性相关关系;如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系;如果散点图中的点的分布几乎没有什么规则,则这两个变量之间不具有相关关系.探究2 【提示】 (1)建立直角坐标系,两轴的长度单位可以不一致. (2)将n 个数据点描在平面直角坐标系中.(3)画回归直线时,一定要画在多数点经过的区域,可以先观察有哪两个点在直线上. 探究3 回归系数b ^的含义是什么?【提示】 (1)b ^代表x 每增加一个单位,y 的平均增加单位数,而不是增加单位数. (2)当b ^>0时,两个变量呈正相关关系,含义为:x 每增加一个单位,y 平均增加b ^个单位数;当b ^<0时,两个变量呈负相关关系,含义为:x 每增加一个单位,y 平均减少b ^个单位数.探究4 回归直线方程与直线方程的区别是什么?【提示】 线性回归直线方程中y 的上方加记号“^ ”是与实际值y 相区别,因为线性回归方程中的“y ^”的值是通过统计大量数据所得到的一个预测值,它具有随机性,因而对于每一个具体的实际值而言,y ^的值只是比较接近,但存在一定的误差,即y =y ^+e (其中e 为随机变量),预测值y ^与实际值y 的接近程度由随机变量e 的标准差决定.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归直线方程为y =b x +a .若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′ B.b ^>b ′,a ^<a ′ C.b ^<b ′,a ^>a ′D.b ^<b ′,a ^<a ′【精彩点拨】 先由已知条件分别求出b ′,a ′的值,再由b ^,a ^的计算公式分别求解b ^,a ^的值,即可作出比较.【尝试解答】 根据所给数据求出直线方程y =b ′x +a ′和回归直线方程的系数,并比较大小.由(1,0),(2,2)求b ′,a ′.b ′=2-02-1=2, a ′=0-2×1=-2.求b ^,a ^时,∑i =16x i y i =0+4+3+12+15+24=58,x =3.5,y =136,∑i =16x 2i =1+4+9+16+25+36=91, ∴b ^=58-6×3.5×13691-6×3.52=57, a ^=136-57×3.5=136-52=-13,∴b ^<b ′,a ^>a ′. 【答案】 C [再练一题]4.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系.根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是( )A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg【解析】 b ^为正数,所以两变量具有正的线性相关关系,故A 正确;B ,C 显然正确;若该大学某女生身高为170 cm ,则可估计其体重为58.79 kg.【答案】 D1.设一个回归方程y ^=3+1.2x ,则变量x 增加一个单位时( )A .y 平均增加1.2个单位B .y 平均增加3个单位C .y 平均减少1.2个单位D .y 平均减少3个单位【解析】 由b =1.2>0,故选A.【答案】 A2.下列有关线性回归的说法,不正确的是( )A .变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B .在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫做散点图C .回归方程最能代表观测值x 、y 之间的线性关系D .任何一组观测值都能得到具有代表意义的回归直线【解析】 只有数据点整体上分布在一条直线附近时,才能得到具有代表意义的回归直线.【答案】 D3.已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( )A.y ^=0.4x +2.3B.y ^=2x -2.4C.y ^=-2x +9.5D.y ^=-0.3x +4.4 【解析】 因为变量x 和y 正相关,则回归直线的斜率为正,故可以排除选项C 和D.因为样本点的中心在回归直线上,把点(3,3.5)的坐标分别代入选项A 和B 中的直线方程进行检验,可以排除B ,故选A.【答案】 A4.对具有线性相关关系的变量x 和y ,测得一组数据如下表所示.【解析】 由题意可知x =2+4+5+6+85=5,y =30+40+60+50+705=50.即样本中心为(5,50),设回归直线方程为y ^=6.5x +b ^,∵回归直线过样本中心(5,50),∴50=6.5×5+b ^,即b ^=17.5,∴回归直线方程为y ^=6.5x +17.5.【答案】 y ^=6.5x +17.5。