2017-2018版高中数学 第二章 统计 2.3.1 变量间的相关关系 2.3.2 两个变量的线性
- 格式:doc
- 大小:214.50 KB
- 文档页数:7
高中数学 2.3.1-2.3.2变量间的相关关系练习基础巩固一、选择题1.由一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到的回归直线方程y ^=bx +a ,那么下面说法不正确的是( )A .直线y ^=bx +a 必经过点(x -,y -)B .直线y ^=bx +a 至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点C .直线y ^=bx +a 的斜率为∑i =1nx i y i -n x - y-∑i =1nx 2i -n x -2D .直线y ^=bx +a 和各点(x 1,y 1),(x 2,y 2),…,(x n ,y n )的偏差∑i =1n[y i -(bx i +a )]2是该坐标平面上所有直线与这些点的偏差中最小的直线.[答案] B[解析] 由a =y -b x 知y ^=y -b x +bx ,∴必定过(x ,y )点. 2.下列说法正确的是( )A .对于相关系数r 来说,|r |≤1,|r |越接近0,相关程度越大;|r |越接近1,相关程度越小B .对于相关系数r 来说,|r |≥1,|r |越接近1,相关程度越大;|r |越大,相关程度越小C .对于相关系数r 来说,|r |≤1,|r |越接近1,相关程度越大;|r |越接近0,相关程度越小D .对于相关系数r 来说,|r |≥1,|r |越接近1,相关程度越小;|r |越大,相关程度越大[答案] C3.两个变量成负相关关系时,散点图的特征是( )A .点从左下角到右上角区域散布B .点散布在某带形区域内C .点散布在某圆形区域内D .点从左上角到右下角区域散布[答案] D4.已知变量x 与y 正相关,且由观测数据算得样本的平均数x =2.5,y =3.5,则由观测的数据得线性回归方程可能为( )A.y ^=0.4x +2.3B.y ^=2x -2.4C.y ^=-2x +9.5D.y ^=-0.3x +4.4[答案] A[解析] ∵y ^=b ^x +a ^,正相关则b >0,∴排除C ,D.∵过中点心(x ,y )=(3,3.5),∴选A.5.某化工厂为预测某产品的回收率y ,需要研究它的原料有效成分含量x 之间的相关关素,现取了8对观测值,计算得:∑i =18x i =52,∑i =18y i =228,∑i =18x 2i =478,∑i =18x i y i =1849,则y 对x 的回归直线的方程是( ) A.y ^=11.47+2.62x B.y ^=-11.47+2.62x C.y ^=2.62+11.47xD.y ^=11.47-2.62x[答案] A6.为了考查两个变量x 和y 之间的线性关系,甲、乙两位同学各自独立做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l 1、l 2,已知两人所得的试验数据中,变量x 和y 的数据的平均值都相等,且分别是s 和t ,那么下列说法中正确的是( )A .直线l 1、l 2一定有公共点(s ,t )B .直线l 1、l 2相交,但交点不一定是(s ,t )C .必有直线l 1∥l 2D .l 1、l 2必定重合 [答案] A[解析] 线性回归直线方程为y ^=bx +a ,而a ^=y -b ^x ,即a =t -bs ,t =bs +a ,所以(s ,t )在回归直线上,直线l 1、l 2一定有公共点(s ,t ). 二、填空题7.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.[答案] 0.254[解析] 由于y ^=0.254x +0.321知,当x 增加1万元时,年饮食支出y 增加0.254万元.8.某单位为了解用电量y (度)与气温x (℃)之间的关系,随机抽查了某4天的用电量与当天气温,并制作了对照表:由表中数据得线性回归方程y =b x +a 中b =-2,预测当气温为-4℃时,用电量约为________度.[答案] 68 [解析] x =18+13+10-14=10,y =24+34+38+644=40,因为回归方程一定过点(x ,y ),所以y =b ^x +a ^,则a ^=y -b ^x =40+2×10=60. 则y ^=-2x +60,当x =-4时,y ^=-2×(-4)+60=68. 三、解答题9.某种产品的广告费支出x 与销售额y 之间有如下对应数据(单位:百万元)(1)画出散点图;(2)从散点图中判断销售金额与广告费支出成什么样的关系?[解析] (1)以x 对应的数据为横坐标,以y 对应的数据为纵坐标,所作的散点图如下图所示:(2)从图中可以发现广告费支出与销售金额之间具有相关关系,并且当广告费支出由小变大时,销售金额也大多由小变大,图中的数据大致分布在某条直线的附近,即x 与y 成正相关关系.10.一台机器由于使用时间较长,生产的零件有一些缺损.按不同转速生产出来的零件有缺损的统计数据如下表所示:(1)(2)如果y 与x 线性相关,求出回归直线方程;(3)若实际生产中,允许每小时的产品中有缺损的零件最多为10个,那么,机器的运转速度应控制在什么范围内?[解析] 先作出散点图,再根据散点图判断y 与x 呈线性相关,从而建立回归直线方程求解.解:(1)作散点图如图所示.(2)由散点图可知y 与x 线性相关.故可设回归直线方程为y ^=bx +a . 依题意,用计算器可算得:x =12.5,y =8.25,∑i =14x 2i =660,∑i =14x i y i =438.∴b =438-4×12.5×8.25660-4×12.52≈0.73,a =y -b x ≈8.25-0.73×12.5=-0.875. ∴所求回归直线方程为y ^=0.73x -0.875. (3)令y ^=10,得0.73x -0.875=10,解得x ≈15. 即机器的运转速度应控制在15转/秒内.能力提升一、选择题1.根据如下样本数据得到的回归方程为y ^=bx +a ,则( )A.a >0,b [答案] A[解析] 由于x 增大y 减小知b <0,又x =3时y >0,∴a >0,故选A. 2.某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得回归方程y ^=b ^x +a ^中的b ^为9.4,据此模型预报广告费用为6万元时销售额为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元[答案] B[探究] 由线性回归方程的图象过样本点的中心,可求得线性回归方程,然后结合该方程对x =6时的销售额作出估计.[解析] 样本点的中心是(3.5,42),则a ^=y -b ^x =42-9.4×3.5=9.1,所以线性回归方程是y ^=9.4x +9.1,把x =6代入得y ^=65.5. 3.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归直线方程为y =b x +a .若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( ) A.b ^>b ′,a ^>a ′ B.b ^>b ′,a ^<a ′C.b ^<b ′,a ^>a ′D.b ^<b ′,a ^<a ′[答案] C[探究] 先由已知条件分别求出b ′,a ′的值,再由b ^,a ^的计算公式分别求解b ^,a ^的值,即可作出比较.4.某学生课外活动兴趣小组对两个相关变量收集到5组数据如下表:由最小二乘法求得回归方程为y =0.67x +54.9,现发现表中有一个数据模糊不清,请推断该数据的值为( )A .60B .62C .68D .68.3[答案] C[解析] 由题意可得x =30, 代入回归方程得y =75. 设看不清处的数为a ,则62+a +75+81+89=75×5,∴a =68.[点评] 表中所给的数据只反映x 与y 的线性关系,并非函数关系,因而不能直接代入线性方程求预报值y ^,应根据线性回归方程性质,即线性回归方程经过中心点(x ,y )求解.二、填空题5.广东部分地区流行手足口病,党和政府采取果断措施,防治结合,很快使病情得到控制.下表是某同学记载的2010年4月1日到2010年4月12日每天广州手足口病治愈出院者数据,根据这些数据绘制散点图如图.下列说法:①根据此散点图,可以判断日期与人数具有线性相关关系;②根据此散点图,可以判断日期与人数且有一次函数关系;③后三天治愈出院的人数占这12天治愈出院人数的30%多;④后三天治愈出院的人数均超过这12天内北京市治愈出院人数的20%.其中正确的个数是________. [答案] 26.改革开放30年以来,我国高等教育事业迅速发展,对某省1990~2000年考大学升学百分比按城市、县镇、农村进行统计,将1990~2000年依次编号为0~10,回归分析之后得到每年考入大学的百分比y 与年份x 的关系为:城市:y ^=2.84x +9.50; 县镇:y ^=2.32x +6.67; 农村:y ^=0.42x +1.80.根据以上回归直线方程,城市、县镇、农村三个组中,________的大学入学率增长最快.按同样的增长速度,可预测2010年,农村考入大学的百分比为________%.[答案] 城市 10.2[探究] 增长速度可根据回归直线的斜率来判断,斜率大的增长速度快,斜率小的增长速度慢.[解析] 通过题目中所提供的回归方程可判断,城市的大学入学率增长最快;2010年农村考入大学的百分比为0.42×20+1.80=10.2.三、解答题7.某地区2007年至2013年农村居民家庭人均纯收入y (单位:千元)的数据如下表(1)(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入,附:回归直线的斜率和截距的最小二乘估计公式分别为:b ^=∑i =1nt i -ty i -y∑i =1nt i -t2,a ^=y -b^t .[解析] (1)由所给数据计算得t =17(1+2+3+4+5+6+7)=4,y =17(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,∑i =17(t i -t )2=9+4+1+0+1+4+9=28,∑i =17(t i -t)(y i -y )=(-3)×(-1.4)+(-2)×(-1)+(-1)(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,b ^=∑i =1nt i -ty i -y∑i =1nt i -t2=1428=0.5, a ^=y -b ^t =4.3-0.5×4=2.3,所求回归方程为y ^=0.5t +2.3.(2)由(1)知,b =0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元,将2015年的年份代号t =9代入(1)中的回归方程,得y ^=0.5×9+2.3=6.8,故预测该地区2015年农村居民家庭人均纯收人为6.8千元.8.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =110x 2i =720.(1)求家庭的月储蓄y 对月收入x 的线性回归方程y ^=b ^x +a ^; (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程y ^=b ^x +a ^中,b ^=∑i =1nx i y i -nx -y∑i =1nx 2i -nx -2,a ^=y -b ^x ,其中x ,y 为样本平均值.[探究] (1)根据线性回归方程求相关的量后,代入公式即可求得回归方程;(2)观察线性回归方程的系数b ^可判断是正相关还是负相关;(3)将x =7代入线性回归方程即可求得预报变量,即该家庭的月储蓄.[解析] (1)由题意知n =10,x =1n ∑i =1nx i =8010=8,y =1n ∑i =1n y i =2010=2,又∑i =1nx 2i -nx -2=720-10×82=80,∑i =1nx i y i -nx -y =184-10×8×2=24,由此得b ^=∑i =1nx i y i -nx -y∑i =1nx 2i -nx -2=2480=0.3,a ^=y -b ^x =2-0.3×8=-0.4, 故所求回归方程为y ^=0.3x -0.4.(2)由于变量y 的值随x 的值增加而增加(b ^=0.3>0),故x 与y 之间是正相关. (3)将x =7代入回归方程可以预测该家庭的月储蓄为y ^=0.3×7-0.4=1.7(千元).。
第2讲 变量的相关性、回归分析及独立性检验一、知识回顾1.如何判断两个变量的线性相关:如果在散点图中,2个变量数据点分布在一条直线附近,则这2个变量之间具有线性相关关系。
2.所求直线方程 ˆy=bx +a 叫做回归直线方程;其中 ⋅∑∑∑∑nnii i ii=1i=1nn222iii=1i=1(x-x)(y -y)x -nx yb ==,a =y -bx (x-x)x-nxy回归直线方程必过中心点(,)x y3.相关系数的∑nii (x-x)(y -y)r =性质• (1)|r|≤1.(2)|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小.4. ˆˆ=-i i y y i 残差e=实际值-预测值2^^211()===-∑∑nniiii i e y y 总残差平方和:残差平方和越小,即模型拟合效果越好5. 两个分类变量的独立性检验:(1)假设结论不成立,即“两个分类变量没有关系”.(2)在此假设下计算随机变量 22n(ad -bc)K =(a +b)(c +d)(a +c)(b +d)(3) 根据随机变量K 2查表得“两个分类变量没有关系”的概率,用1减去此概率即得有联系的概率 典型例题:例1.(宁夏海南卷)对变量x, y 有观测数据理力争(,)(i=1,2,…,10),得散点图1;对变量u ,v 有观测数据(,)(i=1,2,…,10),得散点图2. 由这两个散点图可以判断( )。
(A )变量x 与y 正相关,u 与v 正相关 (B )变量x 与y 正相关,u 与v 负相关 (C )变量x 与y 负相关,u 与v 正相关 (D )变量x 与y 负相关,u 与v 负相关1x 1y 1u 1v变式1. (韶关一模文、理)甲、乙、丙、丁四位同学各自对A 、B 两变量的线性相关性作试验,)()A 甲 ()B 乙 ()C 丙 ()D 丁 例2.一系列样本点(,)(1,2,,)=⋅⋅⋅i i x y i n 的回归直线方程为23,∧=-y x 若117==∑nii X则1==∑ni i y变式1.某地第二季各月平均气温(℃)与某户用水量(吨)如下表,根据表中数据,用最小二乘法求得用水量关于月平均气温的线性回归方程是( )A B. C. D. 例3.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据.(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程ˆˆy bxa =+; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:3 2.543546 4.566.5⨯+⨯+⨯+⨯=)例4.(惠州一模)对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪x y y x 5.115ˆ-=x y5.115.6ˆ-=x y 5.112.1ˆ-=x y5.113.1ˆ-=x y0.0005300035000.00030.0004200015000.00020.0001400025001000月收入(元)频率/组距 第2讲 变量的相关性、回归分析及独立性检验课后作业:姓名: 学号:1.若施化肥量x 与小麦产量y 之间的回归直线方程为ˆ2504yx =+,当施化肥量为50kg 时,预计小麦产量为2.下表是某厂1~4月份用水量(单位:百吨)的一组数据:月份x1 2 3 4用水量y5.443 5.2由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是a x y +-=∧7.0,则=a3.一组数据的平均数是2.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是( )A .57.2 3.6B .57.2 56.4C .62.8 63.6D .62.8 3.64.有一笔统计资料,共有11个数据如下(不完全以大小排列):2,4,4,5,5,6,7,8,9,11,x ,已知这组数据的平均数为6,则这组数据的方差为( ) A .6B .6C .66D .6.55.为了检查某超市货架上的奶粉是否含有三聚氰胺,要从编号依次为1到50的袋装奶粉中抽取5袋进行检验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的5袋奶粉的编号可能是( ) A.5,10,15,20,25 B.2,4,8,16,32 C.1,2,3,4,5 D.7,17,27,37,476.(广州调研文、理)某校对全校男女学生共1600名进行健康调查,选用分层抽样法抽取一个容量为200的样本.已知女生比男生少抽了10人,则该校的女生人数应是 人.7. (韶关一模文、理)一个社会调查机构就某地居民的 月收入调查了10000人,并根据所得数据画了样本的频率分 布直方图(如下图)。
2.3.1变量之间的相关关系教学目标:通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系。
教学重点:通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系。
教学过程:案例分析:一般说来,一个人的身高越高,他的人就越大,相应地,他的右手一拃长就越长,因此,人的身高与右手一拃长之间存在着一定的关系。
为了对这个问题进行调查,我们收集了北京市某中学2003年高三年级96名学生的身高与右手一拃长的数据如下表。
(1)根据上表中的数据,制成散点图。
你能从散点图中发现身高与右手一拃长之间的近似关系吗?(2)如果近似成线性关系,请画出一条直线来近似地表示这种线性关系。
(3)如果一个学生的身高是188cm,你能估计他的一拃大概有多长吗?解:根据上表中的数据,制成的散点图如下。
从散点图上可以发现,身高与右手一拃长之间的总体趋势是成一直线,也就是说,它们之间是线性相关的。
那么,怎样确定这条直线呢?同学1:选择能反映直线变化的两个点,例如(153,16),(191,23)二点确定一条直线。
同学2:在图中放上一根细绳,使得上面和下面点的个数相同或基本相同。
同学3:多取几组点对,确定几条直线方程。
再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距。
同学4:我从左端点开始,取两条直线,如下图。
再取这两条直线的“中间位置”作一条直线。
同学5:我先求出相同身高同学右手一拃长的平均值,画出散点图,如下图,再画出近似的直线,使得在直线两侧的点数尽可能一样多。
1015202530150155160165170175180185190195同学6:我先将所有的点分成两部分,一部分是身高在170 cm 以下的,一部分是身高在170 cm 以上的;然后,每部分的点求一个“平均点”——身高的平均值作为平均身高、右手一拃的平均值作为平均右手一拃长,即(164,19),(177,21);最后,将这两点连接成一条直线。
2.3.1 变量间的相关关系 2.3.2 两个变量的线性相关[学习目标]1.理解两个变量的相关关系的概念.2.会作散点图,并利用散点图判断两个变量之间是否具有相关关系.3.会求回归直线方程.[知识链接]1.已知直线y=kx+b,当k>0时,随着x的逐渐增大,y值逐渐增大;2.已知直线y=2x+1过点A(2,y0),则y0=5.3.为了反映样本数据的离散程度,常用的量是标准差,它是样本数据到平均数的一种平均距离.[预习导引]1.相关关系变量与变量之间的关系常见的有两类:一类是确定性的函数关系,另一类是变量间确实存在的关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的.也就是,自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.2.散点图将样本中n个数据点(x i,y i)(i=1,2,…,n)描在平面直角坐标系中,以表示具有相关关系的两个变量的一组数据的图形叫做散点图.3.正相关、负相关(1)正相关:如果散点图中的点散布在从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也近似的由小变大,对于两个变量的这种相关关系,我们称为正相关.(2)负相关:如果散点图中的点散布的位置是从左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值近似的由大变小,对于变量的这种相关关系,我们称为负相关.4.回归直线的方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归方程:=x+对应的方程叫回归直线的方程,简称回归方程.(3)回归方程的求解过程要点一变量间相关关系的判断例1 在下列两个变量的关系中,哪些是相关关系?(1)正方形边长与面积之间的关系;(2)作文水平与课外阅读量之间的关系;(3)人的身高与年龄之间的关系;(4)降雪量与交通事故的发生率之间的关系.答案(2)(4)解两变量之间的关系有两种:函数关系与带有随机性的相关关系.(1)正方形的边长与面积之间的关系是函数关系.(2)作文水平与课外阅读量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.(3)人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而他们不具备相关关系.(4)降雪量与交通事故的发生率之间具有相关关系.规律方法函数关系是一种确定的关系,而相关关系是非随机变量与随机变量的关系. 函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.跟踪演练1 下列两个变量之间的关系,哪个不是函数关系( )A.正方体的棱长和体积B.圆半径和圆的面积C.正n边形的边数和内角度数之和D.人的年龄和身高答案 D解析A、B、C都是函数关系,对于A,V=a3;对于B,S=πr2;对于C,g(n)=(n-2)π.而对于年龄确定的不同的人可以有不同的身高,∴选D.要点二散点图例2 (1)如图是两个变量统计数据的散点图,判断两个变量之间是否具有相关关系?(2)有个男孩的年龄与身高的统计数据如下.解(1)不具有相关关系,因为散点图散乱地分布在坐标平面内,不呈线形.(2)散点图是分析变量相关关系的重要工具.作出散点图如图:由图可见,具有线性相关关系,且是正相关.规律方法 1.判断两个变量x和y间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果图上发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.2.画散点图时应注意合理选择单位长度,避免图形过大或偏小,或者是点的坐标在坐标系中画不准,使图形失真,导致得出错误结论.跟踪演练2 对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图①;对变量u,v有观测数据(u i,v i)(i=1,2,…,10),得散点图②.由这两个散点图可以判断( )A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关 答案 C要点三 求线性回归方程例3 有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:(2)从散点图中发现气温与热饮销售杯数之间关系的一般规律; (3)求回归方程;(4)如果某天的气温是2 ℃,预测这天卖出的热饮杯数. 解 (1)散点图如图所示:(2)从上图看到,各点散布在从左上角到右下角的区域里,因此,气温与热饮销售杯数之间呈负相关,即气温越高,卖出去的热饮杯数越少.(3)从散点图可以看出,这些点大致分布在一条直线的附近,因此,可用公式求出回归方程的系数.利用计算器容易求得回归方程y ^=-2.352x +147.767.(4)当x =2时,y ^=143.063.因此,某天的气温为2 ℃时,这天大约可以卖出143杯热饮.规律方法 1.求线性回归方程的步骤 (1)列表x i ,y i ,x i y i .(2)计算x ,y ,∑i =1nx 2i ,∑i =1ny 2i ,∑i =1n x i y i .(3)代入公式计算b ^,a ^的值.(4)写出回归方程y ^=a ^+b ^x . 2.求回归直线方程的适用条件两个变量具有线性相关性,若题目没有说明相关性,则必须对两个变量进行相关性判断. 跟踪演练3 2014年元旦前夕,某市统计局统计了该市 2013年10户家庭的年收入和年饮食支出的统计资料如下表:(2)若某家庭年收入为9万元,预测其年饮食支出.(参考数据:∑i =110x i y i =117.7,∑i =110x 2i =406) 解 (1)依题意可计算得:x =6,y =1.83,x 2=36,x y =10.98,又∵∑i =110x i y i =117.7,∑i =110x 2i =406,∴b =∑i =110x i y i -10x y∑i =110x 2i -10x 2≈0.17,a =y -b x =0.81,∴y ^=0.17x +0.81.∴所求的回归方程为y ^=0.17x +0.81.(2)当x =9时,y ^=0.17×9+0.81=2.34(万元).可估计大多数年收入为9万元的家庭每年饮食支出约为2.34万元.1.下列说法正确的是( )A .任何两个变量之间都有相关关系B .根据身高和体重的相关关系可以确定身高对应的体重值C .相关关系是一种不确定的关系D .以上答案都不对 答案 C解析 变量之间的相关关系是一种不确定的关系,它也能反映变量之间的某种依赖关系.利用相关关系可以估计某些相关数据,但是不能确定准确的数值. 2.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是( )A.y ^=-10x +200 B.y ^=10x +200C.y ^=-10x -200 D.y ^=10x -200 答案 A解析 ∵y 与x 负相关,∴排除B 、D ,又∵C 项中x >0时,y ^<0不合题意,∴C 错.3.设有一个回归方程为y ^=-1.5x +2,则变量x 增加一个单位时( )A .y 平均增加1.5个单位B .y 平均增加2个单位C .y 平均减少1.5个单位D .y 平均减少2个单位答案 C解析 ∵两个变量线性负相关,∴变量x 增加一个单位,y 平均减少1.5个单位. 4.(2013·滨州高一检测)设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是( ) A .y 与x 具有正的线性相关关系 B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 答案 D解析 当x =170时,y ^=0.85×170-85.71=58.79,体重的估计值为58.79 kg.5.正常情况下,年龄在18岁到38岁的人,体重y (kg)对身高x (cm)的回归方程为y ^=0.72x -58.2,张红同学(20岁)身高178 cm ,她的体重应该在________kg 左右. 答案 69.96解析 用回归方程对身高为178 cm 的人的体重进行预测,当x =178时,y ^=0.72×178-58.2=69.96(kg).1.判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图.根据散点图,可以很容易看出两个变量是否具有相关关系,是不是线性相关,是正相关还是负相关. 2.求回归直线方程时应注意的问题(1)知道x 与y 呈线性相关关系,无需进行相关性检验,否则应首先进行相关性检验,如果两个变量之间本身不具有相关关系,或者说,它们之间的相关关系不显著,即使求出回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的.(2)用公式计算a ^,b ^的值时,要先算出b ^,然后才能算出a ^.3.利用回归方程,我们可以进行估计和预测.若回归直线方程为y ^=b ^x +a ^,则x =x 0处的估计值为y ^0=b ^x 0+a ^.。