高考数学(文)新课堂一轮总复习(实用课件):第九章 第6讲 回归分析与独立性检验
- 格式:ppt
- 大小:1.20 MB
- 文档页数:35
第6讲 回归分析与独立性检验1.某产品广告宣传费与销售额的统计数据如下表,根据数据表可得回归直线方程y ^=b ^x +a ^,其中b ^=2广告宣传费x /千元 2 3 4 5 6 销售额y /万元 2 4 7 10 12A.17万元 C.19万元 D.20万元2.(2015年湖北)已知变量x 和y 满足关系y =-0.1x +1,变量y 与z 正相关.下列结论中正确的是( )A.x 与y 负相关,x 与z 负相关B.x 与y 正相关,x 与z 正相关C.x 与y 正相关,x 与z 负相关D.x 与y 负相关,x 与z 正相关3.(2018年湖南永州模拟)为大力提倡“厉行节约,反对浪费”,某市通过随机询问100名分类做不到“光盘” 能做到“光盘”男 45 10 女 30 15附:P (K 2≥k ) 0.10 0.05 0.025k 2.706 3.841 5.024K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ).参照附表,得到的正确结论是( )A.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C.有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”D.有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关” 4.(2016年重庆)已知变量x ,y 的取值如下表所示:x 4 5 6 y 8 6 7若y 与x 线性相关,且线性回归方程为y =b x +2,则b 的值为( )A.1B.32C.45D.565.(2017年山东)为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为y ^=b ^x +a ^.已101i i x =∑=225,101ii y=∑=1600,b ^=4.该班某学生的脚长为24,据此估计其身高为( )A.160B.163C.166D.1706.(多选)已知由样本数据点集合{(x i ,y i )|i =1,2,…,n },求得的回归直线方程为y ^=1.5x +0.5,且x-=3,现发现两个数据点(1.2,2.2)和(4.8,7.8)误差较大,去除后重新求得的回归直线l 的斜率为1.2,则()A.变量x与y具有正相关关系B.去除后的回归方程为y^=1.2x+1.4C.去除后y的估计值增加速度变快D.去除后相应于样本点(2,3.75)的残差为0.057.已知由样本数据点集合{(x i,y i)|i=1,2,…,n}求得的回归直线方程为y^=1.5x+0.5,且x-=3.现发现两个数据点(1.1,2.1)和(4.9,7.9)误差较大,去除后重新求得的回归直线l的斜率为1.2,那么,当x=2时,y的估计值为________.8.(2018年四川成都质检)某省的一个气象站观测点在连续4天里记录的AQI指数M与当天的空气水平可见度y(M 900700300100y 0.5 3.5 6.59.5M [0,200)[200,400)[400,600)[600,800)[800,1000] 频数/天36126 3(1)设x=M100,若x与y之间是线性关系,试根据表1的数据求出y关于x的线性回归方程;(2)小李在该市开了一家洗车店,洗车店每天的平均收入与AQI指数存在相关关系如表3:M [0,200)[200,400)[400,600)[600,800)[800,1000] 日均收入/元-2000-1000200060008000 附参考公式:y^=b^x+a^,其中b^=1221ni iiniix y nx yx nx==--∑∑,a^=y-b^x.9.(2018年新课标Ⅱ)图X9-6-1是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.图X9-6-1为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,…,17)建立模型①:y ^=-30.4+13.5t ;根据2010年至2016年的数据(时间变量t 的值依次为1,2,…,7)建立模型②:y ^=99+17.5t .(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.10.某学校研究性学习小组对该校高三学生视力情况进行调查,在高三的全体1000名学生中随机抽取了100名学生的体检表,并得到如图X9-6-2的频率分布直方图.年级名次 1~50名 951~1000名 近视人数/人 41 32 不近视人数/人 9 18(1)(2)学习小组成员发现,学习成绩突出的学生,近视的比较多,为了研究学生的视力与学习成绩是否有关系,对年级名次在1~50名和951~1000名的学生进行了调查,得到表格中的数据,试问:能否在犯错的概率不超过0.05的前提下认为视力与学习成绩有关系?(3)在(2)中调查的100名学生中,按照分层抽样在不近视的学生中抽取9人,进一步调查他们良好的养眼习惯,并且在这9人中任抽取3人,记名次在1~50名的学生人数为X ,求X 的分布列和数学期望.⎣⎢⎡参考公式:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中 ]n =a +b +c +d .第6讲 回归分析与独立性检验1.A 解析:易知x ^=4,y ^=7,∴a ^=7-2×4=-1,则y ^=2x -1.当x =9时,y ^=2×9-1=17.2.A 解析:∵变量x 和y 满足关系y =-0.1x +1,其中-0.1<0,∴x 与y 成负相关.又∵变量y 与z 正相关,不妨设z =ky +b (k >0),则将y =-0.1x +1代入即可得z =k (-0.1x +1)+b =-0.1kx +(k +b ).∴-0.1k <0.∴x 与z 负相关.故选A.3.C 解析:由题设知,a =45,b =10,c =30,d =15,∴K 2=100×(45×15-30×10)255×45×75×25≈3.030 3,2.706<3.030 3<3.841.由附表可知,有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”.故选C.4.A5.C 解析:由已知x =22.5,y =160,∴a ^=160-4×22.5=70,y =4×24+70=166.故选C.6.AB7.3.8 解析::将x =3代入y ^=1.5x +0.5得y =5.∴样本中心点为(3 , 5), 由数据点(1.1,2.1)和(4.9,7.9)知:1.1+4.92=3,2.1+7.92=5,故去除这两个数据点后,样本中心点不变.设新的回归直线方程为y ^=1.2x +b ,将样本中心点坐标代入得:b =1.4, ∴,当x =2时,y 的估计值为3.8.8.解:(1)x =14(9+7+3+1)=5,y =14(0.5+3.5+6.5+9.5)=5,41i x =∑i y i =9×0.5+7×3.5+3×6.5+1×9.5=58,41i x=∑2i=92+72+32+12=140. ∴b ^=58-4×5×5140-4×52=-2120,a ^=5-⎝⎛⎭⎫-2120×5=414, ∴y 关于x 的线性回归方程为y ^=-2120x +414.(2)根据表3可知,该月30天中有3天每天亏损2000元,有6天每天亏损1000元,有12天每天收入2000元,有6天每天收入6000元,有3天每天收入8000元.估计小李洗车店2017年11月份每天的平均收入为130×(-2000×3-1000×6+2000×12+6000×6+8000×3)=2400(元).9.解:(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为y ^=-30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为y ^=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠. 理由如下:①从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y =-30.4+13.5t 上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y ^=99+17.5t 可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.②从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.10.解:(1)由图可知,第一组3 人,第二组7人,第三组27人,∵后四组的频数成等差数列,且它们的和为90,∴后四组的频数依次为27,24,21,18,∴视力在5.0以下的人数为3+7+27+24+21=82(或者100-18=82)人,全年级视力在5.0以下的人数约为1000×82100=820(人).(2)K 2=100×(41×18-32×9)250×50×73×27=30073≈4.110>3.841,因此在犯错的概率不超过0.05的前提下认为视力与学习成绩有关系.(3)依题意9人中年级名次在1~50名和951~1000名分别有3人和6人,X 所有可能取值有0,1,2,3.P (x =0)=C 36C 39=2084=521,P (x =1)=C 26C 13C 39=4584=1528,P (x =2)=C 16C 23C 39=1884=314,P (x =3)=C 33C 39=184.X 的分布列为X 的数学期望E (X )=0×521+1×1528+2×314+3×184=1.快乐分享,知识无界!感谢您的下载!由Ruize收集整理!。