【创新大课堂】(新课标)高考数学一轮总复习 第九章 第3节 变量间的相关关系与统计案例练习
- 格式:doc
- 大小:107.00 KB
- 文档页数:7
第3讲变量间的相关关系与统计案例组基础关1.观察下列各图形:其中两个变量x,y具有相关关系的图是()A.①②B.①④C.③④D.②③答案C解析观察散点图可知,两个变量x,y具有相关关系的图是③④.2.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m 如下表:甲乙丙丁r 0。
820。
780.690。
85m 106115124103则哪位同学的试验结果体现A,B两变量有更强的线性相关性()A.甲B.乙C.丙D.丁答案D解析在验证两个变量之间的线性相关关系时,相关系数的绝对值越接近1,相关性越强,在四个选项中只有丁的相关系数最大;残差平方和越小,相关性越强,只有丁的残差平方和最小,综上可知丁的试验结果体现了A,B两个变量有更强的线性相关性.故选D.3.(2019·湖北省七市(州)教科研协作体联考)为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据:(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5).根据收集到的数据可知x1+x2+x3+x4+x5=100,用最小二乘法求得回归直线方程为y,^=0.67x+54。
8,则y1+y2+y3+y4+y5的值为()A.68。
2 B.341 C.355 D.366.2答案B解析由题意,得错误!=错误!=20,将其代入回归直线方程错误!=0.67x+54.8中,得错误!=0.67×20+54。
8=68。
2,所以y1+y2+y3+y4+y5=5错误!=341.故选B.4.(2020·兰州模拟)根据如下样本数据:得到的回归方程为错误!=bx+a。
样本点的中心为(3,0.1),当x 增加1个单位,则y近似()A.增加0.8个单位B.减少0.8个单位C.增加2。
3个单位D.减少2.3个单位答案A解析由题意,知错误!=错误!×(1+2+3+4+5)=3,错误!=错误!×[(a-1)+(-1)+0.5+(b+1)+2。
【创新教程】2016年高考数学大一轮复习 第九章 第3节 变量间的相关关系与统计案例课时冲关 理 新人教A 版对应学生用书课时冲关理四十九第327页 文四十五第289页一、选择题1.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图如图(1),对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图如图(2).由这两个散点图可以判断( )A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关解析:由散点图可得两组数据均线性相关,且图(1)的线性回归方程斜率为负,图(2)的线性回归方程斜率为正,则由散点图可判断变量x 与y 负相关,u 与v 正相关.故选C.答案:C2.(2013·湖北高考)四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423;②y 与x 负相关且y ^=-3.476x +5.648;③y 与x 正相关且y ^=5.437x +8.493;④y 与x 正相关且y ^=-4.326x -4.578.其中一定不正确的结论的序号是( ) A .①② B .②③ C .③④D .①④解析:根据正负相关性的定义作出判断. 由正负相关性的定义知①④一定不正确.故选D.答案:D3.(2015·云南模拟)变量u 与v 相对应的一组样本数据为(1,1.4),(2,2.2),(3,3),(4,3.8),由上述样本数据得到u 与v 的线性回归分析,R 2表示解释变量对于预报变量变化的贡献率,则R 2=( )A.35B.45 C .1D .3解析:依题意,注意到点(1,1.4),(2,2.2),(3,3),(4,3.8)均位于直线y -1.4=2.2-1.42-1(x -1),即y =0.8x +0.6上,因此解释变量对于预报变量变化的贡献率R 2=1,故选C.答案:C4.(2015·安庆模拟)某著名纺织集团为了减轻生产成本继续走高的压力,计划提高某种产品的价格,为此销售部在10月1日至10月5日连续五天对某个大型批发市场中该产品一天的销售量及其价格进行了调查,其中该产品的价格x (元)与销售量y (万件)之间的数据如下表所示:已知销售量y 与价格x 之间具有线性相关关系,其回归直线方程为:y =-3.2x +a ,若该集团提高价格后该批发市场的日销售量为7.36万件,则该产品的价格约为( )A .14.2元B .10.8元C .14.8元D .10.2元解析:依题意x -=10,y -=8.因为线性回归直线必过样本点的中心(x -,y -),所以8=-3.2×10+a ^,解得a ^=40.所以回归直线方程为y ^=-3.2x +40.令y =7.36,则7.36=-3.2x +40,解得x =10.2.所以该产品的价格约为10.2元. 故选D.答案:D5.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由K 2=n a +bc +d a +cb +d,算得K 2=-260×50×60×50≈7.8.附表:A .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C .有99%以上的把握认为“爱好该项运动与性别有关”D .有99%以上的把握认为“爱好该项运动与性别无关”解析:根据独立性检验的定义,由K 2≈7.8>6.635,可知我们在犯错误的概率不超过0.01的前提下,即有99%以上的把握认为“爱好该项运动与性别有关”,故选C.答案:C6.(2015·贵阳模拟)某车间加工零件的数量x 与加工时间y 的统计数据如表:现已求得上表数据的回归方程y =b x +a 中的b 的值为0.9,则据此回归模型可以预测,加工90个零件所需要的加工时间约为( )A .93分钟B .94分钟C .95分钟D .96分钟解析:由表格,x -=20,y -=30.因为(x -,y -)在回归直线上,代入得a ^=12,所以回归直线为y ^=0.9x +12,x =90时,y ^=93.故选A. 答案:A7.设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是( )A .x 和y 的相关系数为直线l 的斜率B .x 和y 的相关系数在0到1之间C .当n 为偶数时,分布在l 两侧的样本点的个数一定相同D .直线l 过点(x -,y -) 解析:答案:D 二、填空题8.为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到2×2列联表:已知P (K 2根据表中数据,得到K 2=-223×27×20×30≈4.844,则认为选修文科与性别有关系出错的可能性约为________. 解析:由K 2=4.844>3.841.故认为选修文科与性别有关系出错的可能性约为5%. 答案:5%9.某数学老师身高176 cm ,他爷爷、父亲和儿子的身高分别是173 cm 、170 cm 和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________ cm.解析:儿子和父亲的身高可列表如下:设回归直线方程y ^=a ^+b x ,由表中的三组数据可求得b =1,故a ^=y --b ^x -=176-173=3,故回归直线方程为y ^=3+x ,将x =182代入得孙子的身高为185 cm.答案:18510.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设H 0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得χ2≈3.918,已知P (χ2≥3.841)≈0.05.对此,四名同学作出了以下的判断:p :有95%的把握认为“这种血清能起到预防感冒的作用”; q :若某人未使用该血清,那么他在一年中有95%的可能性得感冒; r :这种血清预防感冒的有效率为95%; s :这种血清预防感冒的有效率为5%.则下列结论中,正确结论的序号是________. ①p ∧¬q ;②¬p ∧¬q ;③(¬p ∧¬q )∧(r ∨s ); ④(p ∨¬r )∧(¬q ∨s ).解析:本题考查了独立性检验的基本思想及常用逻辑用语.由题意,得χ2≈3.918,P (χ2≥3.841)≈0.05,所以,只有第一位同学的判断正确,即有95%的把握认为“这种血清能起到预防感冒的作用”.由真值表知①④为真命题.答案:①④ 三、解答题11.(2014·新课标高考全国卷Ⅱ)某地区2007年至2013年农村居民家庭人均纯收入y (单位:千元)的数据如下表:(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘法估计公式分别为:b =∑i =1nt i -t-y i -y-∑i =1nt i -t-2,a ^=y --b ^t -解:(1)由所给数据计算得 t -=17(1+2+3+4+5+6+7)=4,y -=17(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,∑i =17(t i -t -)2=9+4+1+0+1+4+9=28,∑i =17(t i -t -)(y i -y -)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,b =∑i =17t i -t-y i -y-∑i =17t i -t-2=1428=0.5, a ^=y --b ^t -=4.3-0.5×4=2.3,所求回归方程为y =0.5t +2.3.(2)由(1)知,b ^=0.5>0.故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2015年的年份代号t =9代入(1)中的回归方程,得y ^=0.5×9+2.3=6.8, 故预测该地区2015年农村居民家庭人均纯收入为6.8千元.12.(2014·辽宁高考)某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:(1)习惯方面有差异”;(2)已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品.现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率.附:K 2=n n 11n 22-n 12n 212n 1+n 2+n +1n +2,解:(1)将2×2得K 2=n n 11n 22-n 12n 212n 1+n 2+n +1n +2=-270×30×80×20=10021≈4.762. 由于4.762>3.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.(2)从5名数学系学生中任取3人的一切可能结果所组成的基本事件空间Ω={(a 1,a 2,b 1),(a 1,a 2,b 2),(a 1,a 2,b 3),(a 1,b 1,b 2),(a 1,b 2,b 3),(a 1,b 1,b 3),(a 2,b 1,b 2),(a 2,b 2,b 3),(a 2,b 1,b 3),(b 1,b 2,b 3)}.其中a i 表示喜欢甜品的学生,i =1,2.b j 表示不喜欢甜品的学生,j =1,2,3. Ω由10个基本事件组成,且这些基本事件的出现是等可能的. 用A 表示“3人中至多有1人喜欢甜品”这一事件,则A ={(a 1,b 1,b 2),(a 1,b 2,b 3),(a 1,b 1,b 3),(a 2,b 1,b 2),(a 2,b 2,b 3),(a 2,b 1,b 3),(b 1,b 2,b 3)}.事件A 由7个基本事件组成,因而P (A )=710.[备课札记]。
【创新大课堂】(新课标)2016高考数学一轮总复习第九章第3节变量间的相关关系与统计案例练习一、选择题1.对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图如图(1),对变量u,v有观测数据(u i,v i)(i=1,2,…,10),得散点图如图(2).由这两个散点图可以判断( )A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关[解析] 由散点图可得两组数据均线性相关,且图(1)的线性回归方程斜率为负,图(2)的线性回归方程斜率为正,则由散点图可判断变量x与y负相关,u与v正相关.故选C.[答案] C2.(2013·湖北高考)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y与x负相关且y=2.347x-6.423;②y与x负相关且y=-3.476x+5.648;③y 与x正相关且y=5.437x+8.493;④y与x正相关且y=-4.326x-4.578.其中一定不正确的结论的序号是( )A.①②B.②③C.③④D.①④[解析] 根据正负相关性的定义作出判断.故选 D.由正负相关性的定义知①④一定不正确.[答案] D3.(2015·云南模拟)变量U与V相对应的一组样本数据为(1,1.4),(2,2.2),(3,3),(4,3.8),由上述样本数据得到U与V的线性回归分析,R2表示解释变量对于预报变量变化的贡献率,则R2=( )A.35B.45C.1 D.3[解析] 依题意,注意到点(1,1.4),(2,2.2),(3,3),(4,3.8)均位于直线y -1.4=2.2-1.42-1(x -1),即y =0.8x +0.6上,因此解释变量对于预报变量变化的贡献率R 2=1,故选C.[答案] C4.(2015·安庆模拟)某著名纺织集团为了减轻生产成本继续走高的压力,计划提高某种产品的价格,为此销售部在10月1日至10月5日连续五天对某个大型批发市场中该产品一天的销售量及其价格进行了调查,其中该产品的价格x (元)与销售量y (万件)之间的数据如下表所示:该集团提高价格后该批发市场的日销售量为7.36万件,则该产品的价格约为( )A .14.2元B .10.8元C .14.8元D .10.2元[解析] 依题意x =10,y =8.因为线性回归直线必过样本点的中心(x ,y ),所以8=-3.2×10+a ,解得a =40.所以回归直线方程为y =-3.2x +40.令y =7.36,则7.36=-3.2x +40,解得x =10.2.所以该产品的价格约为10.2元. 故选D.[答案] D5.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由K 2=a +bc +d a +cb +d,算得K 2=-260×50×60×50≈7.8.附表:A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该项运动与性别无关”[解析] 根据独立性检验的定义,由χ2≈7.8>6.635,可知我们在犯错误的概率不超过0.01的前提下,即有99%以上的把握认为“爱好该项运动与性别有关”,故选C.[答案] C6.(2015·贵阳模拟)某车间加工零件的数量x与加工时间y的统计数据如表:加工90个零件所需要的加工时间约为( )A.93分钟B.94分钟C.95分钟D.96分钟[解析] 由表格,x=20,y=30.因为(x,y)在回归直线上,代入得a=12,所以回归直线为y=0.9x+12,x=90时,y=93.故选A.[答案] A7.设(x1,y1),(x2,y2),…,(x n,y n)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是( )A.x和y的相关系数为直线l的斜率B.x和y的相关系数在0到1之间C.当n为偶数时,分布在l两侧的样本点的个数一定相同D.直线l过点(x,y)[解析]二、填空题8.为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到2×2列联表:已知P(K2根据表中数据,得到K2=-223×27×20×30≈4.844,则认为选修文科与性别有关系出错的可能性约为________.[解析] 由K2=4.844>3.841.故认为选修文科与性别有关系出错的可能性约为5%.[答案] 5%9.某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________cm.[解析] 儿子和父亲的身高可列表如下:设回归直线方程y=a+bx,由表中的三组数据可求得b=1,故a=y-b x=176-173=3,故回归直线方程为y=3+x,将x=182代入得孙子的身高为185 cm.[答案] 18510.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得x2≈3.918,已知P(x2≥3.841)≈0.05.对此,四名同学作出了以下的判断:p:有95%的把握认为“这种血清能起到预防感冒的作用”;q :若某人未使用该血清,那么他在一年中有95%的可能性得感冒; r :这种血清预防感冒的有效率为95%; s :这种血清预防感冒的有效率为5%.则下列结论中,正确结论的序号是________. ①p ∧¬q ;②¬p ∧q ;③(¬p ∧¬q )∧(r ∨s ); ④(p ∨¬r )∧(¬q ∨s ).[解析] 本题考查了独立性检验的基本思想及常用逻辑用语.由题意,得x 2≈3.918,P (x 2≥3.841)≈0.05,所以,只有第一位同学的判断正确,即有95%的把握认为“这种血清能起到预防感冒的作用”.由真值表知①④为真命题.[答案] ①④ 三、解答题11.(2014·新课标高考全国卷Ⅱ)某地区2007年至2013年农村居民家庭人均纯收入y (单位:千元)的数据如下表:(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘法估计公式分别为:b =∑i =1nt i -ty i -y∑i =1nt i -t2,a =y -b t[解] (1)由所给数据计算得t =17(1+2+3+4+5+6+7)=4,y =17(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,∑i =17(t i -t )2=9+4+1+0+1+4+9=28,∑i -17(t i -t )(y i -y )=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,b =∑i =17t i -ty i -y∑i =17t i -t2=1428=0.5, a =y -b t =4.3-0.5×4=2.3,所求回归方程为y =0.5t +2.3.(2)由(1)知,b =0.5>0.故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2015年的年份代号t =9代入(1)中的回归方程,得y =0.5×9+2.3=6.8,故预测该地区2015年农村居民家庭人均纯收入为6.8千元.12.(2014·辽宁高考)某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:(1)习惯方面有差异”;(2)已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品.现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率.附:x 2=n n 11n 22-n 12n 212n 1+n 2+n +1n +2,[解] (1)将2×2得x 2=n n 11n 22-n 12n 212n 1+n 2+n +1n +2=-70×30×80×20=10021≈4.762. 由于4.762>3.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.(2)从5名数学系学生中任取3人的一切可能结果所组成的基本事件空间Ω={(a1,a2,b1),(a1,a2,b2),(a1,a2,b3),(a1,b1,b2),(a1,b2,b3),(a1,b1,b3),(a2,b1,b2),(a2,b2,b3),(a2,b1,b3),(b1,b2,b3)}.其中a i表示喜欢甜品的学生,i=1,2.b j表示不喜欢甜品的学生,j=1,2,3.Ω由10个基本事件组成,且这些基本事件的出现是等可能的.用A表示“3人中至多有1人喜欢甜品”这一事件,则A={(a1,b1,b2),(a1,b2,b3),(a1,b1,b3),(a2,b1,b2),(a2,b2,b3),(a2,b1,b3),(b1,b2,b3)}.事件A由7个基本事件组成,因而P(A)=710.。