人教A版高中数学必修三练习:第二章 统计 分层训练 进阶冲关 2.3 变量间的相关关系 Word版含答案
- 格式:doc
- 大小:551.00 KB
- 文档页数:11
学业分层测评(十二) 用样本的频率分布估计总体分布(建议用时:45分钟)[学业达标]一、选择题1.下列命题正确的是( )A .频率分布直方图中每个小矩形的面积等于相应组的频数B .频率分布直方图的面积为对应数据的频率C .频率分布直方图中各小矩形高(平行于纵轴的边)表示频率与组距的比D .用茎叶图统计某运动员得分:13,51,23,8,26,38,16,33,14,28,39时,茎是指中位数26【解析】 在频率分布直方图中,横轴表示样本数据;纵轴表示频率组距,由于小矩形的面积=组距×频率组距=频率,所以各小矩形的面积等于相应各组的频率,因此各小矩形面积之和等于1.【答案】 C2.将容量为100的样本数据,按由小到大排列分成8个小组,如下表所示:第3组的频率和累积频率为( )A.0.14和0.37B.114和1 27C.0.03和0.06 D.314和637【解析】由表可知,第三小组的频率为14100=0.14,累积频率为10+13+14100=0.37.【答案】 A3.如图2-2-8所示是一容量为100的样本的频率分布直方图,则由图形中的数据可知样本落在[15,20)内的频数为()图2-2-8A.20B.30C.40 D.50【解析】样本数据落在[15,20)内的频数为100×[1-5×(0.04+0.1)]=30.【答案】 B4.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图2-2-9所示),则该样本的中位数、众数、极差分别是()图2-2-9A.46,45,56 B.46,45,53C.47,45,56 D.45,47,53【解析】由题意知各数为12,15,20,22,23,23,31,32,34,34,38,39,45,45,45,47,47,48,48,49,50,50,51,51,54,57,59,61,67,68,中位数是46,众数是45,最大数为68,最小数为12,极差为68-12=56.【答案】 A5.某学校组织学生参加英语测试,成绩的频率分布直方图如图2-2-10,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15人,则该班的学生人数是()图2-2-10A.45B.50C.55 D.60【解析】根据频率分布直方图的特点可知,低于60分的频率是(0.005+0.01)×20=0.3,所以该班的学生人数是150.3=50.【答案】 B二、填空题6.200辆汽车通过某一段公路时的时速的频率分布直方图如图2-2-11所示,时速在[50,60)的汽车大约有______辆.图2-2-11【解析】在[50,60)的频率为0.03×10=0.3,∴汽车大约有200×0.3=60(辆).【答案】607.(2016·东营高一检测)从甲、乙两个班中各随机选出15名同学进行随堂测验,成绩的茎叶图如图2212所示,则甲、乙两组的最高成绩分别是________,________,从图中看,________班的平均成绩较高.图2-2-12【解析】由茎叶图可知,甲班的最高分是96,乙班的最高分是92.甲班的成绩集中在60~80之间,乙班成绩集中在70~90之间,故乙班的平均成绩较高.【答案】9692乙8.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50度至350度之间,频率分布直方图如图2-2-13所示:图2-2-13(1)直方图中x的值为________;(2)在这些用户中,用电量落在区间[100,250)内的户数为________.【解析】由于(0.002 4+0.003 6+0.006 0+x+0.002 4+0.001 2)×50=1,解得x=0.004 4;数据落在[100,250)内的频率是(0.003 6+0.006 0+0.004 4)×50=0.7,所以月用电量在[100,250)内的用户数为100×0.7=70.【答案】(1)0.004 4(2)70三、解答题9.为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),实验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.52.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4服用B 药的20位患者日平均增加的睡眠时间: 3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两种药的平均数,从计算结果看,哪种药的疗效更好? (2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好? 【导学号:28750037】图2-2-14【解】 (1)设A 药观测数据的平均数为-x ,B 药观测数据的平均数为-y .由观测结果可得-x =120(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,-y =120(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.由以上计算结果可得-x>-y ,因此可看出A 药的疗效更好. (2)由观测结果可绘制茎叶图如图:从以上茎叶图可以看出,A 药疗效的试验结果有710的叶集中在茎“2.”,“3.”上,而B 药疗效的试验结果有710的叶集中在茎“0.”,“1.”上,由此可看出A 药的疗效更好.10.为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图2-2-15),图中从左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.图2-2-15(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?【解】 (1)频率分布直方图是以面积的形式反映了数据落在各小组内的频率大小的,因此第二小组的频率为42+4+17+15+9+3=0.08.又因为第二小组的频率=第二小组的频数样本容量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由频率分布直方图可估计,该校高一年级学生的达标率为: 17+15+9+32+4+17+15+9+3×100%=88%.[能力提升]1.如图2-2-16是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知()图2-2-16A.甲运动员的成绩好于乙运动员B.乙运动员的成绩好于甲运动员C.甲、乙两名运动员的成绩没有明显的差异D.甲运动员的最低得分为0分【解析】由茎叶图可以看出甲运动员的成绩主要集中在30至40之间,比较稳定,而乙运动员均匀地分布在10至40之间,所以甲运动员成绩较好.故选A.【答案】 A2.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图2-2-17所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是()图2-2-17【解析】 借助已知茎叶图得出各小组的频数,再由频率=频数样本容量求出各小组的频率,进一步求出频率组距并得出答案.法一 由题意知样本容量为20,组距为5. 列表如下:观察各选择项的频率分布直方图知选A.法二由茎叶图知落在区间[0,5)与[5,10)上的频数相等,故频率、频率也分别相等,比较四个选项知A正确,故选A.组距【答案】 A图2-2-183.某校开展“爱我海西,爱我家乡”摄影比赛,9位评委为参赛作品A给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x应该是________.【解析】当x≤4时,89+89+92+93+(90+x)+92+917=91,解之得x=1.当x>4时,易证不合题意.【答案】 14.某车站在春运期间为了了解旅客购票情况,随机抽样调查了100名旅客从开始在售票窗口排队到购到车票所用的时间t(以下简称为购票用时,单位为min),下面是这次调查统计分析得到的频率分布表和频率分布直方图:(如图2-2-19所示)图2-2-19解答下列问题:(1)这次抽样的样本容量是多少?(2)在表中填写出缺失的数据并补全频率分布直方图;(3)旅客购票用时的平均数可能落在哪一组?【解】(1)样本容量是100.(2)①50②0.10所补频率分布直方图如图中的阴影部分:(3)设旅客平均购票用时为t min,则有0×0+5×10+10×10+15×50+20×30100≤t<5×0+10×10+15×10+20×50+25×30100,即15≤t<20.所以旅客购票用时的平均数可能落在第四组.。
高中数学必修三第二章《统计》学案2.3.变量间的相关关系(学生专用)(A版)普通高中数学必修3(A版)学案 2.3. 变量间的相关关系2.3.1变量之间的相关关系授课时间:年月日【学习目标】通过收集现实问题中两个有关联变量的数据认识变量间的相关关系。
【重点难点】1. 通过收集现实问题中两个有关联变量的数据直观认识变量间的相关关系。
2. 变量之间相关关系的理解。
【学习过程】一、学习引导在中学校园里,有这样一种说法:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着某种关系,我们把数学成绩和物理成绩看成是两个变量,那么这两个变量之间的关系是函数关系吗?二、合作交流(教师可做点拨)相关关系的概念:两个变量之间的关系可能是确定的关系(如:函数关系),或非确定性关系。
当自变量取值一定时,因变量也确定,则为确定关系;当自变量取值一定时,因变量带有随机性,这种变量之间的关系称为相关关系。
相关关系是一种非确定性关系。
(分析:两个变量→自变量取值一定→因变量带有随机性→相关关系)三、随堂练习思考1:考察下列问题中两个变量之间的关系:(1)商品销售收入与广告支出经费;(2)粮食产量与施肥量;(3)人体内的脂肪含量与年龄.这些问题中两个变量之间的关系是函数关系吗?思考2:“名师出高徒”可以解释为教师的水平越高,学生的水平就越高,那么学生的学业成绩与教师的教学水平之间的关系是函数关系吗?你能举出类似的描述生活中两个变量之间的这种关系的成语吗?思考3:商品销售收入与广告支出经费之间的关系。
(还与商品质量,居民收入,生活环境等有关)四、能力提升1. 上述两个变量之间的关系是一种非确定性关系,称之为相关关系,那么相关关系的含义如何?2. 对于一个变量,可以控制其数量大小的变量称为可控变量,否则称为随机变量,那么相关关系中的两个变量有哪种类型?3. 相关关系与函数关系的异同点?【小结反思】1. 变量具有不确定性,需要通过收集大量的数据(通过调查或试验)在对数据进行统计分析的基础上,发现其中的规律,才能对它们之间的关系做出正确的判断。
人教新课标A版高中数学必修3 第二章统计 2.3变量间的相关关系D卷姓名:________ 班级:________ 成绩:________一、单选题 (共15题;共30分)1. (2分)下列两个变量之间的关系是相关关系的是()A . 角度和它的余弦值B . 正方形的边长与它的面积C . 电压一定时,电流与电阻D . 日照时间与水稻的亩产量2. (2分)某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是()A .B .C .D .5. (2分) (2017高二上·伊春月考) 某公司在销售某种环保材料过程中,记录了每日的销售量(吨)与利润(万元)的对应数据,下表是其中的几组对应数据,由此表中的数据得到了关于的线性回归方程,若每日销售量达到10吨,则每日利润大约是()34562.534 4.5A . 7.2万元B . 7.35万元C . 7.45万元D . 7.5万元6. (2分)下列有关线性回归的说法,不正确的是()A . 变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫作相关关系B . 在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫作散点图C . 回归方程最能代表观测值之间的线性关系D . 任何一组观测值都能得到具有代表意义的回归直线8. (2分)两个变量x,y与其线性相关系数r有下列说法(1)若r>0,则x增大时,y也相应增大;(2)若r<0,则x增大时,y也相应增大;(3)若r=1或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上.其中正确的有()A . ①B . ②③C . ①③D . ①②③9. (2分) (2017高二下·乾安期末) 下列关于统计学的说法中,错误的是()A . 回归直线一定过样本中心点B . 残差带越窄,说明选用的模型拟合效果越好C . 在线性回归模型中,相关指数的值趋近于1,表明模型拟合效果越好D . 从独立性检验:有的把握认为吸烟与患肺病有关系时,可解释为100人吸烟,其中就有99人可能患有肺病11. (2分) (2019高二下·福州期中) 已知的值如下表所示:如果与呈线性相关且回归直线方程为,则()x2345y54m7A .B .C .D .12. (2分) (2019高一上·安达期中) 今有一组实验数据如下:分别用下列函数模型来拟合变量与之间的关系,其中拟合效果最好的是()A .B .C .D .13. (2分)某单位为了了解用电量y(度)与气温X(℃)之间的关系,随机统计了某4天的用电量与当天气温,并作了如下的对照表:由表中数据,得回归直线方程 = + ,若 =﹣2,则 =()气温X(℃)181310﹣1用电量y24343864A . 60B . 58C . 62D . 6414. (2分) (2015高二下·会宁期中) 在两个变量y与x的回归模型中,分别选择了四个不同的模型,它的相关指数R2如下,其中拟合效果最好的模型是()A . 模型1的相关指数R2为0.87B . 模型2的相关指数R2为0.97C . 模型3的相关指数R2为0.50D . 模型4的相关指数R2为0.2515. (2分)根据一组样本数据的散点图分析存在线性相关关系,求得其回归方程,则在样本点处的残差为()A . 54.55B . 2.45C . 3.45D . 111.55二、填空题 (共5题;共7分)16. (1分)若由一个2×2列联表中的数据计算得χ2=4.073,那么有________ 的把握认为两变量有关系[已知P(χ2≥3.841)≈0.05,P(χ2≥5.024)≈0.025].19. (1分)某商品在5家商场的售价x(元)和销售量y(件)之间的一组数据如下表所示:价格x(元)99.51010.511销售量y(件)11a865由散点图可知,销售量y与价格x之间有较好的线性相关关系,且回归直线方程是=﹣3.2x+4a,则a=________三、解答题 (共5题;共25分)21. (5分)要分析学生初中升学考试的数学成绩对高一年级数学学习有什么影响,在高一年级学生中随机抽取10名学生,分析他们入学的数学成绩(x)和高一年级期末数学考试成绩(y)(如下表):编号12345678910x63674588817152995876y65785285928973985675(1)画出散点图;(2)判断入学成绩(x)与高一期末考试成绩(y)是否有线性相关关系;(3)如果x与y具有线性相关关系,求出回归直线方程;25. (5分)炼钢是一个氧化降碳的过程,由于钢水含碳量的多少直接影响冶炼时间的长短,因此必须掌握钢水含碳量和冶炼时间的关系.现已测得炉料熔化完毕时钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一组数据,如下表所示:(1)据统计表明,之间具有线性相关关系,请用相关系数r加以说明(,则认为y与x 有较强的线性相关关系,否则认为没有较强的线性相关关系,r精确到0.001);(2)建立y关于x的回归方程(回归系数的结果精确到0.01);(3)根据(2)中的结论,预测钢水含碳量为160个0.01%的冶炼时间.参考公式:回归方程中斜率和截距的最小二乘估计分别为,,相关系数参考数据:,.参考答案一、单选题 (共15题;共30分)1-1、2-1、5-1、6-1、8-1、9-1、11-1、12-1、13-1、14-1、15-1、二、填空题 (共5题;共7分)16-1、19-1、三、解答题 (共5题;共25分)21-1、21-2、21-3、25-1、25-2、25-3、。
高中数学第二章统计2.1.3 分层抽样练习(含解析)新人教A版必修3 编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高中数学第二章统计2.1.3 分层抽样练习(含解析)新人教A版必修3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高中数学第二章统计2.1.3 分层抽样练习(含解析)新人教A版必修3的全部内容。
2.1。
3 分层抽样一、选择题1.某校现有高一学生210人,高二学生270人,高三学生300人,学校学生会用分层抽样的方法从这三个年级的学生中随机抽取数名学生进行问卷调查.如果已知从高一学生中抽取的人数为7,那么从高三学生中抽取的人数应为( )A.10 B.9C.8 D.7【答案】A【解析】选A。
错误!×300=10。
2.已知某单位有职工120人,男职工有90人,现采用分层抽样(按男、女分层)抽取一个样本,若已知样本中有27名男职工,则样本容量为( )A.30 B.36C.40 D.没法确定【答案】B【解析】抽取比例为错误!=错误!,故样本容量为:错误!×120=36.3.某城区有农民、工人、知识分子家庭共计2000家,其中农民家庭1800户,工人家庭100户.现要从中抽取容量为40的样本,调查家庭收入情况,则在整个抽样过程中,用到的抽样方法有( )①简单随机抽样②系统抽样③分层抽样A.②③B.①③C.③D.①②③【答案】D【解析】由于各类家庭有明显差异,所以首先应用分层抽样的方法分别从三类家庭中抽出若干户.又由于农民家庭户数较多,那么在农民家庭这一层宜采用系统抽样;而工人、知识分子家庭户数较少,宜采用简单随机抽样.故整个抽样过程要用到①②③三种抽样方法.4.下列抽样方式中,是系统抽样的有()①某单位从老年、中年、青年职工中按2∶5∶3的比例选取职工代表;②搞市场调查,规定在商店门口随机地抽一些人进行询问,直到调查到规定的人数为止;③3D福利彩票的中将号码用摇奖机摇奖;④规定凡购买到的明信片的最后的四位号码是“6637”的人获三等奖;⑤从参加模拟考试的1200名高中生按优、中、差抽取100人分析试题的作答情况.A.1个B.2个C.3个D.4个【答案】A【解析】①⑤有明显的层次,不宜采用系统抽样;对于②,由于事先不知道总体,抽样方法不能保证每个个体等可能地入样,故②不是系统抽样;③是简单随机抽样;④是系统抽样.5.某初级中学有学生270人,其中一年级108人,二、三年级各81人.现要从中抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案.使用分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270;使用简单随机抽样和系统抽样时,将学生统一随机编号为1,2,…,270.如果抽得的号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250;②5,9,100,107,111,121,180,195,200,265;③11,38,65,92,119,146,173,200,227,254;④30,57,84,111,138,165,192,219,246,270。
修3编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高中数学第二章统计2.3 变量间的相关关系教材习题点拨新人教A版必修3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高中数学第二章统计2.3 变量间的相关关系教材习题点拨新人教A版必修3的全部内容。
版必修3练习11.解:从已经掌握的知识来看,吸烟会损害身体的健康。
但是除了吸烟之外,还有许多其他的随机因素影响身体健康,身体健康是很多因素共同作用的结果。
我们可以找到长寿的吸烟者,也更容易发现由于吸烟而引发的患病者,所以吸烟不一定引起健康问题。
但吸烟引起健康问题的可能性大,因此“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法是不对的。
点拨:吸烟与健康问题是相关关系问题,可以说吸烟与健康应该是负相关.2.解:从现在我们掌握的知识来看,没有发现根据说明“天鹅能够带来孩子”,完全可能存在既能吸引天鹅和又使婴儿出生率高的其他因素(例如独特的环境因素),即天鹅与婴儿出生率之间没有直接的关系,因此“天鹅能够带来孩子”的结论不可靠。
而要证实此结论是否可靠,可以通过试验来进行。
相同的环境下将居民随机地分为两组,一组居民和天鹅一起生活(比如家中都饲养天鹅),而另一组居民的附近不让天鹅活动,对比两组居民的出生率是否相同。
点拨:在探索研究的过程中,如果能够从两个变量的观察数据之间发现相关关系是极为有意义的,由此可以进一步研究二者之间是否蕴涵因果关系,从而发现引起这种相关关系的本质原因是什么。
这就要求我们能学会用时间去验证理论。
练习21.解:当x =0时,147.767ˆ=y,这个值与实际卖出的热饮杯数150不符,原因是:线性回归方程中的截距和斜率都是通过样本估计的,存在随机误差,这种误差可以导致预测结果的偏差;即使截距和斜率的估计没有误差,也不可能百分之百地保证对应于x ,预报值能够等于实际值y .事实上,e ye a bx y +=++=ˆ,这里e 是随机变量,预报值y ˆ与实际值y 的平均接近程度由随机变量e 的标准差所决定.2。
学业分层测评(十一)分层抽样(建议用时:45分钟)[学业达标]一、选择题1.某地区为了了解居民家庭生活状况,先把居民按所在行业分为几类,然后每个行业抽1100的居民家庭进行调查,这种抽样是() A.简单随机抽样B.系统抽样C.分层抽样D.分类抽样【解析】由于居民按行业可分为不同的几类,符合分层抽样的特点.【答案】 C2.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人,为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本,则从上述各层中依次抽取的人数分别是()A.12,24,15,9 B.9,12,12,7C.8,15,12,5 D.8,16,10,6【解析】抽样比例为40800=120,故各层中依次抽取的人数为160×120=8(人),320×120=16(人),200×120=10(人),120×120=6(人).故选D.【答案】 D3.在1 000个球中有红球50个,从中抽取100个进行分析,如果用分层抽样的方法对球进行抽样,则应抽红球( )A .33个B .20个C .5个D .10个【解析】 设应抽红球x 个,则1001 000=x50,则x =5. 【答案】 C4.已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )图2-1-1A .200,20B .100,20C .200,10D .100,10【解析】 该地区中小学生总人数为 3 500+2 000+4 500=10 000,则样本容量为10 000×2%=200,其中抽取的高中生近视人数为2 000×2%×50%=20.【答案】 A5.某城区有农民、工人、知识分子家庭共计2 000家,其中农民家庭1 800户,工人家庭100户.现要从中抽取容量为40的样本,调查家庭收入情况,则在整个抽样过程中,可以用到的抽样方法有()①简单随机抽样;②系统抽样;③分层抽样.A.②③B.①③C.③D.①②③【解析】由三种抽样方法的特点.可知,选D.【答案】 D二、填空题6.某高校甲、乙、丙、丁四个专业分别有150、150、400、300名学生.为了解学生的就业倾向,用分层抽样的方法从该校这四个专业共抽取40名学生进行调查,应在丙专业抽取的学生人数为________.【解析】应在丙专业抽取的学生人数是400×40=16.150+150+400+300【答案】167.某校共有2 000名学生,各年级男、女生人数如表所示.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为_____________.【解析】依题意可知三年级学生人数为500,即总体中各年级的人数比例为3∶3∶2,故用分层抽样抽取三年级学生人数为64×28=16.【答案】168.某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生.【解析】高二年级学生人数占总数的310,样本容量为50,则50×310=15.【答案】15三、解答题9.某单位有2 000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:(1)若要抽取40人调查身体状况,则应怎样抽样?(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人?【导学号:28750034】【解】 (1)按老年、中年、青年分层抽样, 抽取比例为402 000=150.故老年人,中年人,青年人各抽取4人,12人,24人, (2)按管理、技术开发、营销、生产进行分层,用分层抽样,抽取比例为252 000=180,故管理,技术开发,营销,生产各抽取2人,4人,6人,13人. 10.某市两所高级中学联合在暑假组织全体教师外出旅游,活动分为两条线路:华东五市游和长白山之旅,且每位教师至多参加了其中的一条线路.在参加活动的教师中,高一教师占42.5%,高二教师占47.5%,高三教师占10%.参加华东五市游的教师占参加活动总人数的14,且该组中,高一教师占50%,高二教师占40%,高三教师占10%.为了了解各条线路不同年级的教师对本次活动的满意程度,现用分层抽样的方法从参加活动的全体教师中抽取一个容量为200的样本.试确定:(1)参加长白山之旅的高一教师、高二教师、高三教师分别所占的比例;(2)参加长白山之旅的高一教师、高二教师、高三教师分别应抽取的人数.【解】 (1)设参加华东五市游的人数为x ,参加长白山之旅的高一教师、高二教师、高三教师所占的比例分别为a ,b ,c ,则有x ·40%+3xb 4x=47.5%,x ·10%+3xc4x =10%,解得b =50%,c =10%.故a =100%-50%-10%=40%,即参加长白山之旅的高一教师、高二教师、高三教师所占的比例分别为40%,50%,10%.(2)参加长白山之旅的高一教师应抽取人数为200×34×40%=60; 抽取的高二教师人数为200×34×50%=75; 抽取的高三教师人数为200×34×10%=15.[能力提升]1.某学校高一、高二、高三三个年级共有学生3 500人,其中高三学生数是高一学生数的两倍,高二学生数比高一学生数多300人,现在按1100的抽样比用分层抽样的方法抽取样本,则应抽取高一学生数为( )A .8B .11C .16D .10【解析】 若设高三学生数为x ,则高一学生数为x2,高二学生数为x 2+300,所以有x +x 2+x2+300=3 500,解得x =1 600.故高一学生数为800,因此应抽取高一学生数为 800100=8.【答案】 A2.某校做了一次关于“感恩父母”的问卷调查,从8~10岁,11~12岁,13~14岁,15~16岁四个年龄段回收的问卷依次为:120份,180份,240份,x份.因调查需要,从回收的问卷中按年龄段分层抽取容量为300的样本,其中在11~12岁学生问卷中抽取60份,则在15~16岁学生中抽取的问卷份数为()A.60 B.80C.120 D.180【解析】11~12岁回收180份,其中在11~12岁学生问卷中抽取60份,则抽样比为13.∵从回收的问卷中按年龄段分层抽取容量为300的样本,∴从8~10岁,11~12岁,13~14岁,15~16岁四个年龄段回收=900(份),则15~16岁回收问卷份数为:x=900-的问卷总数为30013120-180-240=360(份).=120(份),故选∴在15~16岁学生中抽取的问卷份数为360×13C.【答案】 C3.某单位有工程师6人,技术员12人,技工18人,要从这些人中抽取一个容量为n的样本,如果采用系统抽样和分层抽样方法抽取,不用剔除个体;如果样本容量增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求得样本容量为________.【解析】总体容量N=36.当样本容量为n 时,系统抽样间隔为36n ∈N *,所以n 是36的约数; 分层抽样的抽样比为n36,求得工程师、技术员、技工的抽样人数分别为n 6、n 3、n2,所以n 应是6的倍数,所以n =6或12或18或36.当样本容量为n +1时,总体中先剔除1人时还有35人,系统抽样间隔为35n +1∈N *,所以n 只能是6.【答案】 64.某中学举行了为期3天的新世纪体育运动会,同时进行全校精神文明擂台赛.为了解这次活动在全校师生中产生的影响,分别在全校500名教职员工、3 000名初中生、4 000名高中生中作问卷调查,如果要在所有答卷中抽出120份用于评估.(1)应如何抽取才能得到比较客观的评价结论?(2)要从3 000份初中生的答卷中抽取一个容量为48的样本,如果采用简单随机抽样,应如何操作?(3)为了从4 000份高中生的答卷中抽取一个容量为64的样本,如何使用系统抽样抽取到所需的样本?【解】 (1)由于这次活动对教职员工、初中生和高中生产生的影响不会相同,所以应当采取分层抽样的方法进行抽样.因为样本容量=120,总体个数=500+3 000+4 000=7 500,则抽样比:1207 500=2125,所以有500×2125=8,3 000×2125=48,4 000×2125=64,所以在教职员工、初中生、高中生中抽取的个体数分别是8、48、64.分层抽样的步骤是:①分层:分为教职员工、初中生、高中生,共三层.②确定每层抽取个体的个数:在教职员工、初中生、高中生中抽取的个体数分别是8、48,64.③各层分别按简单随机抽样或系统抽样的方法抽取样本.④综合每层抽样,组成样本.这样便完成了整个抽样过程,就能得到比较客观的评价结论.(2)由于简单随机抽样有两种方法:抽签法和随机数法.如果用抽签法,要作3 000个号签,费时费力,因此采用随机数法抽取样本,步骤是:①编号:将3 000份答卷都编上号码:0001,0002,0003, (3000)②在随机数表上随机选取一个起始位置.③规定读数方向:向右连续取数字,以4个数为一组,如果读取的4位数大于3 000,则去掉,如果遇到相同号码则只取一个,这样一直到取满48个号码为止.(3)由于4 000÷64=62.5不是整数,则应先使用简单随机抽样从4 000名学生中随机剔除32个个体,再将剩余的3 968个个体进行编号:1,2,…,3 968,然后将整体分为64个部分,其中每个部分中含有62个个体,如第1部分个体的编号为1,2,…,62.从中随机抽取一个号码,若抽取的是23,则从第23号开始,每隔62个抽取一个,这样得到容量为64的样本:23,85,147,209,217,333,395,457,…,3 929.。
(本栏目内容,在学生用书中以独立形式分册装订!)一、选择题(每小题5分,共20分) 1.下列变量是线性相关的是( ) A .人的体重与视力B .圆心角的大小与所对的圆弧长C .收入水平与购买能力D .人的年龄与体重解析: B 为确定性关系;A ,D 不具有线性关系,故选C. 答案: C2. 已知变量x ,y 之间具有线性相关关系,其散点图如图所示,则其回归方程可能为( )A.y ∧=1.5x +2B.y ∧=-1.5x +2C.y ∧=1.5x -2D.y ∧=-1.5x -2解析: 设回归方程为y ∧=b ∧x +a ∧,由散点图可知变量x ,y 之间负相关,回归直线在y轴上的截距为正数,所以b ∧<0,a ∧>0,因此方程可能为y ∧=-1.5x +2.答案: B3.设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线如图所示,则以下结论正确的是( )A .直线l 过点(x ,y )B .回归直线必通过散点图中的多个点C .直线l 的斜率必在(0,1)D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同解析: A 是正确的;回归直线可以不经过散点图中的任何点,故B 错误;回归直线的斜率不确定,故C 错误;分布在l 两侧的样本点的个数不一定相同,故D 错误.答案: A4.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为y =7.19x +73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是( )A .身高一定是145.83 cmB .身高在145.83 cm 以上C .身高在145.83 cm 以下D .身高在145.83 cm 左右解析: 当x =10时,y =145.83 cm ,所以身高在145.83 cm 左右,选D. 答案: D二、填空题(每小题5分,共15分)5.下列说法:①回归方程适用于一切样本和总体; ②回归方程一般都有局限性;③样本取值的范围会影响回归方程的适用范围; ④回归方程得到的预测值是预测变量的精确值. 正确的是________(将你认为正确的序号都填上).解析: 样本或总体具有线性相关关系时,才可求回归方程,而且由回归方程得到的函数值是近似值,而非精确值,因此回归方程有一定的局限性.所以①④错.答案: ②③6.一般来说,一个人脚掌越长,他的身高就越高,现对10名成年人的脚掌长x 与身高y 进行测量,得到数据(单位均为cm)如表,作出散点图后,发现散点在一条直线附近,经计算得到一些数据:∑i =110(x i -x )(y i -y )=577.5,∑i =110(x i -x )2=82.5;某刑侦人员在某案发现场发现一对裸脚印,量得每个脚印长为26.5 cm ,则估计案发嫌疑人的身高为________cm.解析: 回归方程的斜率b ∧=∑i =110(x i -x )(y i -y )∑i =110(x i -x )2=577.582.5=7,x =24.5,y =171.5,截距a ∧=y -b ∧x =0,即回归方程为y ∧=7x ,当x =26.5时,y =185.5.答案: 185.57.下表是某厂1~4月份用水量(单位:百吨)的一组数据,由其散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其回归直线方程是y ∧=-0.7x +a ∧,则a ∧=________.解析: x =14(1+2+3+4)=52,y =14(4.5+4+3+2.5)=72.又∵⎝⎛⎭⎫52,72在y ∧=-0.7x +a ∧上,∴72=-0.7×52+a ∧, 解得a ∧=5.25. 答案: 5.25三、解答题(每小题10分,共20分)8.某个服装店经营某种服装,在某周内获纯利y (元),与该周每天销售这种服装件数x 之间的一组数据关系见表已知∑i =1nx 2i =280,∑i =1n y 2i =45 209,∑i =1nx i y i =3 487.(1)求x ,y ; (2)求回归方程.解析: (1)x =17×(3+4+5+6+7+8+9)=6,y =17×(66+69+73+81+89+90+91)=5597.(2)b ∧=3 487-7×6×5597280-7×36=194,∴a ∧=5597-194×6=71914,∴所求回归方程为y ∧=194x +71914. 9.某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得下表数据(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ∧=b ∧x +a ∧; (3)试根据(2)求出的线性回归方程,预测记忆力为9的同学的判断力.(相关公式:b ∧=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ∧=y ∧-b ∧x )解析: (1)如图:(2)∑i =1nx i y i =6×2+8×3+10×5+12×6=158,x =6+8+10+124=9,y =2+3+5+64=4,∑i =1nx 2i =62+82+102+122=344,b ∧=158-4×9×4344-4×92=1420=0.7,a ∧=y -b ∧x =4-0.7×9=-2.3,故线性回归方程为y ∧=0.7x -2.3.(3)由回归直线方程预测,记忆力为9的同学的判断力约为4.。
分层训练·进阶冲关
A组基础练(建议用时20分钟)
1.下列四个选项中,关于两个变量所具有的相关关系描述正确的是
( D )
A.圆的面积与半径具有相关关系
B.纯净度与净化次数不具有相关关系
C.作物的产量与人的耕耘是负相关关系
D.学习成绩与学习效率是正相关关系
2.某旅行社为迎节日搞活动旅游,经市场调查,某旅游线路销量y(人)与旅游单价x(元/人)负相关,则其回归方程可能是( A )
A.=-80x+1 600
B.=80x+1 600
C.=-80x-1 600
D.=80x-1 600
3.具有线性相关关系的变量x,y的一组数据如表所示.若根据表中数据得出y与x的回归直线方程为=3x-,则m的值是( A )
A.4
B.
C.5.5
D.6
4.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
①y与x负相关且=2.347x-6.423;
②y与x负相关且=-3.476x+5.648;
③y与x正相关且=5.437x+8.493;
④y与x正相关且=-4.326x-4.578.
其中一定不正确的结论的序号是( D )
A.①②
B.②③
C.③④
D.①④
5.为了解某社区居民购买水果和牛奶的年支出费用与购买食品的年支出费用的关系,随机调查了该社区5户家庭,得到如下统计数据表:
根据上表可得回归直线方程=x+,其中=0.59,=-,据此估计,该社区一户购买食品的年支出费用为3.00万元的家庭购买水果和牛奶的年支出费用约
为( A )
A.1.795万元
B.2.555万元
C.1.915万元
D.1.945万元
6.在一组样本数据(x1,y1),(x2,y2),…,(x n,y n)(n≥2,x1,x2,…,x n不全相
等)的散点图中,若所有样本点(x i,y i)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( D )
A.-1
B.0
C.
D.1
7.经调查某地若干户家庭的年收入x(万元)和年饮食支出y(万元)具有线性相关关系,并得到y关于x的回归直线方程:=0.245x+0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加
0.245万元.
8.一位母亲记录了儿子3~9岁的身高,数据略,建立的身高与年龄的回归模型为=7.19x+73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是
③.
①身高一定是145.83 cm ②身高145.83 cm以上
③身高在145.83 cm左右④身高在145.83 cm以下
9.已知x与y之间的一组数据:
则y与x的线性回归方程=x+必过点(1.5,4).
10.某单位为了了解用电量y度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:
由表中数据得线性回归方程=x+中=-2,预测当气温为-4 ℃时,用电量的度数约为68度.
11.为了研究男羽毛球运动员的身高x(单位:cm)与体重y(单位:kg)的关系,通过随机抽样的方法,抽取5名运动员测得他们的身高与体重关系如下表:
求回归直线方程=x+.
【解析】=176,=75,
-
=
=
=0.4,=-=4.6,所以=0.4x+4.6.
12.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
(1)求回归直线方程=x+,其中=-20,=-.
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)
【解析】(1)=×(8+8.2+8.4+8.6+8.8+9)=8.5.
=×(90+84+83+80+75+68)=80.
=+20=80+20×8.5=250,
=-20x+250.
(2)工厂获得利润z=(x-4)y=-20x2+330x-1 000,
由二次函数知识可知当x=时,z max=361.25(元).
故该产品的单价应定为8.25元.
B组提升练(建议用时20分钟)
13.已知由一组样本数据确定的回归直线方程为=1.5x+1,且=2,发现有两个数据(2.6,2.8)与(1.4,5.2)误差较大,去掉这两个数据后,重新求得回归直线的斜率为1.4,那么当x=6时,的值为 ( A )
A.9.6
B.10
C.10.6
D.9.4
14.已知x与y之间的几组数据如表:
假设根据上表数据所得线性回归方程为=x+,若某同学根据上表中的
前两组数据(1,0)和(2,2)求得的直线方程为y′=b′x+a′,则以下结论正确的是( C )
A.>b′,>a′
B.>b′,<a′
C.<b′,>a′
D.<b′,<a′
15.某服装商场为了了解毛衣的月销售量y(件)与月平均气温x(℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:
由表中数据算出线性回归方程=x+中的≈-2,气象部门预测下个月的平均气温约为6℃,据此估计,该商场下个月毛衣的销售量约为46件.
16.在2018年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x元和销售量y件之间的一组数据如下表所示:
由散点图可知,销售量y与价格x之间有较强的线性相关关系,其线性回归方程是=-3.2x+40,且m+n=20,则其中的n= 10.
17.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:
(1)在给定的坐标系中画出表中数据的散点图:
(2)求出y关于x的线性回归方程=x+,并在坐标系中画出回归直线.
(3)试预测加工10个零件需要多少时间?
注:=,=-.
【解析】(1)散点图如图:
(2)由表中数据得:x i y i=52.5,
=3.5,=3.5,=54,所以==0.7,
所以=-=1.05,所以=0.7x+1.05.
回归直线如图中所示.
(3)将x=10代入回归直线方程,得=0.7×10+1.05=8.05(小时).
所以预测加工10个零件需要8.05小时.
18.根据“2015年国民经济和社会发展统计公报”中公布的数据,从2011年到2015年,我国的第三产业在GDP中的比重如下:
(1)在所给坐标系中作出数据对应的散点图.
(2)建立第三产业在GDP中的比重y关于年份代码x的回归方程.
(3)按照当前的变化趋势,预测2018年我国第三产业在GDP中的比重. 附:回归直线=+x的斜率和截距的最小二乘估计分别为
=,=-.
【解析】(1)数据对应的散点图如图所示.
(2)=3,=47.06,===1.5,
=-=42.56,
所以回归直线方程为=1.5x+42.56.
(3)代入2018年的年份代码x=8,得=1.5×8+42.56=54.56,
所以按照当时的变化趋势,预计到2018年,我国第三产业在GDP中的比重将达到54.56%.
C组培优练(建议用时15分钟)
19.某考察团对10个城市的职工人均工资x(千元)与居民人均消费
y(千元)进行调查统计,得出y与x具有线性相关关系,且回归方程为
=0.6x+1.2.若某城市职工人均工资为5千元,估计该城市人均消费额
占人均工资收入的百分比为
( D )
A.66%
B.67%
C.79%
D.84%
20.一家商场为了确定营销策略,进行了四次投入促销费用x和商场实际销售额的试验,得到如下数据.
(1)在下面的直角坐标中,画出上述数据的散点图,并据此判断两个变量是否具有较好的线性相关性.
(2)求出x,y之间的回归直线方程=x+.
(3)若该商场计划营销额不低于600万元,则至少要投入多少万元的促销费用?
【解析】(1)散点图如图所示,从图上可以看出两个变量具有较好的线性相关性.
(2)==4,
==250,
(x i-)2=(2-4)2+(3-4)2+(5-4)2+(6-4)2
=4+1+1+4=10,
(x i-)(y i-)=(-2)×(-150)+(-1)×(-50)+1×50+2×150=700.
==70,
=
-=250-70×4=-30.
故所求的回归直线方程为=70x-30.
(3)令70x-30≥600,即x ≥=9(万元),即若该商场计划营销额不低于600万元,则至少要投入9万元的促销费用.
关闭Word文档返回原板块
高中数学。