高考数学易错题10.2 统计图表的应用-2019届高三数学提分精品讲义
- 格式:doc
- 大小:1.70 MB
- 文档页数:23
问题41 统计图表的应用一、考情分析统计图表有频率分布直方图、茎叶图、折线图、条形图、饼形图、雷达图等,它们广泛应用于实际生活之中,也是历年高考的热点,求解此类的关键是由图表读出有用的数据,再根据数据进行分析.二、经验分享1.明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为1.2.对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据.由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.3.频率分布直方图是高考考查的热点,考查频率很高,题型有选择题、填空题,也有解答题,难度为低中档.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.三、知识拓展统计图是利用点、线、面、体等绘制成几何图形,以表示各种数量间的关系及其变动情况的工具。
表现统计数字大小和变动的各种图形总称。
其中有条形统计图、扇形统计图、折线统计图、象形图等。
在统计学中把利用统计图形表现统计资料的方法叫做统计图示法。
其特点是:形象具体、简明生动、通俗易懂、一目了然。
其主要用途有:表示现象间的对比关系;揭露总体结构;检查计划的执行情况;揭示现象间的依存关系,反映总体单位的分配情况;说明现象在空间上的分布情况。
一般采用直角坐标系.横坐标用来表示事物的组别或自变量x,纵坐标常用来表示事物出现的次数或因变量y;或采用角度坐标(如圆形图)、地理坐标(如地形图)等。
考点28 统计【考点剖析】1.命题方向预测:统计在高考中选择题、填空题、解答题中均有出现,选择题、填空题往往单独考查统计知识,较为容易;解答题常与概率知识放在一块考查,以应用题的面目出现,难度以中档题为主.2.名师二级结论:两个异同(1)众数、中位数与平均数的异同①众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量.②由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变,这是中位数、众数都不具有的性质.③众数考查各数据出现的频率,其大小只与这组数据中的部分数据有关.当一组数据中有不少数据多次重复出现时,其众数往往更能反映问题.④某些数据的变动对中位数可能没有影响.中位数可能出现在所给数据中,也可能不在所给数据中.当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势.(2)标准差与方差的异同标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大;标准差、方差越小,数据的离散程度则越小,因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.三个特征利用频率分布直方图估计样本的数字特征:(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数值.(2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和.(3)众数:最高的矩形的中点的横坐标.正确运用频率分布条形图和直方图,由于总体分布通常不易知道,我们往往用样本的频率分布去估计总体分布,一般地,样本容量越大,估计越精确.要求会作、会用频率分布条形图和直方图.三种抽样方法:在三种抽样中,简单随机抽样是最简单、最基本的抽样方法,其他两种抽样方法是建立在它的基础上的,三种抽样方法的共同点:它们都是等概率抽样,体现了抽样的公平性;三种抽样方法各有其特点和适用范围,在抽样实践中要根据具体情况选用相应的抽样方法.分析两个变量相关关系的常用方法:一是利用散点图进行判断:把样本数据表示的点在平面直角坐标系中作出,从而得到散点图,如果这些点大致分布在通过散点图中心的一条直线附近,那么就说这两个变量之间具有线性相关关系;二是利用相关系数r 进行判断:|r|≤1而且|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小.线性回归方程参考公式: ⎪⎪⎪⎩⎪⎪⎪⎨⎧⋅-=---=∑∑==x b y ax x y y x x b ni i ni i i ˆˆ)())((ˆ121掌握独立性检验的一般步骤: ①根据样本数据制成2×2列联表.②根据公式()()()()22k n ad bc a b c d a c b d -=++++(),计算K2的值.③比较K2与临界值的大小关系作统计推断.【考点分类】考向一 随机抽样1.某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本的老年教师人数为( )A .90B .100C .180D .300 【答案】C【解析】由题意,总体中青年教师与老年教师比例为1600169009=;设样本中老年教师的人数为x ,由分层抽样的性质可得总体与样本中青年教师与老年教师的比例相等,即320169x =,解得180x =,故选C. 2.【2018年全国卷Ⅲ文】某公司有大量客户,且不同龄段客户对其服务的评价有较大差异.为了解客户的评价,10.8287.8796.6355.0243.8412.7062.0721.3230.7080.455k0.0010.0050.0100.0250.050.100.150.250.400.50()2P K k ≥该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.【答案】分层抽样3.【2017江苏,3】某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件.18【答案】【方法总结】统按照预先制定的规则,从每一部分抽取一个个体,得到需要的样本.(2)在利用系统抽样时,经常遇到总体容量不能被样本容量整除的情况,这时可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量整除.考向二频率分布直方图的绘制与应用1.【2018年新课标I卷文】某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表使用了节水龙头50天的日用水量频数分布表(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)【答案】(1)直方图见解析.(2) 0.48.(3).【解析】(1)该家庭使用了节水龙头后50天日用水量的平均数为.估计使用节水龙头后,一年可节省水.2.【2016高考北京文数】某市民用水拟实行阶梯水价,每人用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(I )如果w 为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w 至少定为多少? (II )假设同组中的每个数据用该组区间的右端点值代替,当w=3时,估计该市居民该月的人均水费. 【答案】(Ⅰ)3;(Ⅱ)10.5元.(II )由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:根据题意,该市居民该月的人均水费估计为:40.160.1580.2100.25120.15170.05220.05270.05⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯10.5=(元). 【方法总结】1.频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示频率组距,频率=组距×频率组距.2.频率分布直方图中各小长方形的面积之和为1,因此在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.3.频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.考向三茎叶图的应用1.【2017山东,文8】如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为()A. 3,5B. 5,5C. 3,7D. 5,7【答案】A【解析】2.【2018年江苏卷】已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________.【答案】90【解析】由茎叶图可知,5位裁判打出的分数分别为,故平均数为.【方法总结】由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表试题时,就要充分使用这个图表提供的数据进行相关的计算或者是对某些问题作出判断,这类试题往往伴随着对数据组的平均值或者是方差的计算等.考向四基本数字特征1.【2017课标1,文2】为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数【答案】B【解析】刻画评估这种农作物亩产量稳定程度的指标是标准差,故选B2.【【衡水金卷压轴卷】2018年模拟(二)】现有甲、乙两台机床同时生产直径为的零件,各抽测件进行测量,其结果如下图,则不通过计算从图中数据的变化不能反映的数字特征是()A.极差B.方差C.平均数D.中位数【答案】C【解析】考向五变量的相关性与回归分析1.【2018届安徽省六安市舒城中学仿真(三)】某地级市共有200000中小学生,其中有7%学生在2017年享受了“国家精准扶贫”政策,在享受“国家精准扶贫”政策的学生中困难程度分为三个等次:一般困难、很困难、特别困难,且人数之比为5:3:2,为进一步帮助这些学生,当地市政府设立“专项教育基金”,对这三个等次的困难学生每年每人分别补助1000元、1500元、2000元。
专题13统计易错点一:统计用表中概念不清、识图不准致误(频率分布直方图、总体取值规律)频率分布直方图作频率分布直方图的步骤①求极差:极差为一组数据中最大值与最小值的差.②决定组距与组数将数据分组时,一般取等长组距,并且组距应力求“取整”,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.③将数据分组④列频率分布表各小组的频率=小组频数样本容量.⑤画频率分布直方图纵轴表示频率组距,频率组距实际上就是频率分布直方图中各小长方形的高度,小长方形的面积=组距×频率组距=频率.频率分布直方图的性质①因为小矩形的面积=组距×频率组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.②在频率分布直方图中,各小矩形的面积之和等于1.③频数相应的频率=样本容量.④频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性.易错提醒:频率分布条形图和频率分布直方图是两个完全不同的概念,考生应注意两者之间的区别.虽然它们的横轴表示的内容是相同的,但是频率分布条形图的纵轴表示频率;频率分布直方图的纵轴表示频率与组距的比值,其各小组的频率等于该小组上的矩形的面积.例:如图所示是某公司(共有员工300人)2021年员工年薪情况的频率分布直方图,由此可知,员工中年薪在1.4万元~1.6万元之间的共有______人.易错分析:解本题容易出现的错误是审题不细,对所给图形观察不细心,认为员工中年薪在1.4万元~1.6万元之间的频率为()10.020.080.1020.60-++⨯=,从而得到员工中年薪在1.4万元~1.6万元之间的共有3000.60180⨯=(人)的错误结论.正解:由所给图形,可知员工中年薪在1.4万元~1.6万元之间的频率为()10.020.080.080.100.1020.24-++++⨯=,所以员工中年薪在1.4万元~1.6万元之间的共有3000.2472⨯=(人).故72.易错警示:考生误认为频率分布直方图中纵轴表示的是频率,这是错误的,而是“频率/组距”,所以频率对应的是各矩形的面积.变式1:某大学有男生2000名.为了解该校男生的身体体重情况,随机抽查了该校100名男生的体重,并将这100名男生的体重(单位:kg )分成以下六组:[)54,58、[)58,62、[)62,66、[)66,70、[)70,74、[]74,78,绘制成如下的频率分布直方图:70,78上的男生大约有人.该校体重(单位:kg)在区间[]变式2:现对某类文物进行某种物性指标检测,从1000件中随机抽取了200件,测量物性指标值,得到如下频率分布直方图,据此估计这1000件文物中物性指标值不小于95的件数为.变式3:如图是根据我国部分城市某年6月份的平均气温数据得到的样本频率分布直方图,其中平均气温的范围是[20,26],样本数据的分组为[20,21),[21,22),[22,23),[23,24),[24,25),[25,26].已知样本中平均气温低于22°C的城市个数为11,样本中平均气温不低于25°C的城市个数是.1.已知某班全体学生在某次数学考试中的成绩(单位:分)的频率分布直方图如图所示,则图中a所代表的数值是.2.某校共有400名学生参加了趣味知识竞赛(满分:这400名学生的竞赛成绩分组如下:分布直方图如图所示,则这400名学生中竞赛成绩不低于3.从某小学所有学生中随机抽取100名学生,将他们的身高(单位:图),其中样本数据分组[100,110),[110,120),[120,130),[130,140),[140,150)4.某工厂抽取100件产品测其重量(单位:[[[[,42],据此绘制出如图所示的频率分布直方图,则重量在40,40.5),40.5,41),41,41.5),41.5件数为.5.某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:利用该指标制定一个检测标准,需要确定临界值c ,将该指标大于c 的人判定为阳性,小于或等于定为阴性,此检测标准的漏诊率是将患病者判定为阴性的概率,记为()p c ;误诊率是将未患病者判定为阳性的概率,记为()q c .假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.设函数()()()f c p c q c =+,则函数()f c 在区间[95,105]取得最小值时c =.6.某大学有男生10000名.为了解该校男生的身体体重情况,随机抽查了该校100100名男生的体重(单位:kg )分成以下六组:[)54,58、[)58,62、[)62,66、[66,70kg []7.某中学为了解高三男生的体能情况,通过随机抽样,获得了秒),将数据按照[)11.5,12,[)12,12.5,…8.某工厂对一批产品的长度(单位:mm)进行检验,将抽查的产品所得数据分为五组,整理后得到的频率分布直方图如图所示,若长度在20mm以下的产品有30个,9.某中学为了解学生的数学学习情况,在全体学生中随机抽取30,40成绩,将所得的数据分为7组:[)图,则在被抽取的学生中,该次数学考试成绩不低于10.某区为了解全区12000名高二学生的体能素质情况,测试,并将这1000名的体能测试成绩整理成如下频率分布直方图.根据此频率分布直方图,这平均成绩的估计值为.11.将一个容量为100的样本数据,按照从小到大的顺序分为组号123456频数10161815若第6组的频率是第3组频率的12.节约用水是中华民族的传统美德,某市政府希望在本市试行居民生活用水定额管理,即确定一个合理易错点二:统计中的数字特征的实际意义理解不清楚致误(频率分布直方图特征数考查)众数、中位数、平均数①众数:一组数据中出现次数最多的数.②中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在中间位置的数(或中间两个数的平均数)叫做这组数据的中位数.③平均数:如果n个数x1,x2,…,x n,那么()∑==+++=niinxnxxxnx12111叫做这n个数的平均数.总体集中趋势的估计①平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.②一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;而对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.频率分布直方图中平均数、中位数、众数的求法①样本平均数:可以用每个小矩形底边中点的横坐标与小矩形面积的乘积之和近似代替.②在频率分布直方图中,中位数左边和右边的直方图的面积应相等.③将最高小矩形所在的区间中点作为众数的估计值.易错提醒:利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.例.某班50名学生期中考试数学成绩的频率分布直方图如图所示.根据频率分布直方图,估计该班本次测试众数为.变式1:为响应自己城市倡导的低碳出行,小李上班可以选择自行车,他记录了100次骑车所用时间(单位:分钟),得到频率分布直方图,则骑车时间的众数的估计值是分钟变式2:数学兴趣小组的四名同学各自抛掷骰子5次,分别记录每次骰子出现的点数,四名同学的部分统计结果如下:甲同学:中位数为3,方差为2.8;乙同学:平均数为3.4,方差为1.04;丙同学:中位数为3,众数为3;丁同学:平均数为3,中位数为2.根据统计结果,数据中肯定没有出现点数6的是同学.变式3:以下5个命题中真命题的序号有.①样本数据的数字特征中,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息;②若数据1x ,2x ,3x ,…,n x 的标准差为S ,则数据1ax b +,2ax b +,3ax b +,…,n ax b +的标准差为aS ;③将二进制数(2)11001000转化成十进制数是200;④x 是区间[0,5]内任意一个整数,则满足“3x <”的概率是35.1.2022年11月卡塔尔世界杯如期举行,这是世界足球的一场盛宴.为了了解全民对足球的热爱程度,组委会在某场比赛结束后,随机抽取了1000名观众进行对足球“喜爱度”的调查评分,将得到的分数分成6段:[)70,75,[)75,80,[)80,85,[)85,90,[)90,95,[]95,100,得到如图所示的频率分布直方图.图中部分数据丢失,若已知这1000名观众评分的中位数估计值为87.5,则m=.2.为了普及环保知识,增强环保意识,某中学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为e m ,众数为o m ,平均数为x ,则,,e o m m x 的大小关系是.3.《中国居民膳食指南(2022)》数据显示,学生的体重情况,某机构从该地中学生中随机抽取数据,按[)40,45,[)45,50,[50,55所示.根据调查的数据,估计该地中学生体重的中位数是4.为了解某校高三学生的数学成绩,随机地抽查了该校布直方图如图所示.请根据以上信息,估计该校高三学生数学成绩的中位数为两位)5.2021年某省高考体育百米测试中,成绩全部介于按如下方式分成六组:第一组[12,13该100名考生的成绩的中位数(保留一位小数)是6.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,则时速的众数、中位数的估计值分别为.7.某快递驿站统计了近期每天代收快件的数量,并制成如下图所示的频率分布直方图.则该快递驿站每天代收包裹数量的中位数为8.某质检部门对某新产品的质量指标随机抽取10.某大学天文台随机调查了该校100位天文爱好者的年龄,得到如下样本数据频率分布直方图,则估计该校100名天文爱好者的平均岁数为.11.众数、平均数和中位数都描述了数据的集中趋势,、、分别表示众数、平均数、形态中,m n p12.如图为某工厂工人生产能力频率分布直方图,则估计此工厂工人生产能力的平均值为易错点三:运用数字特征作评价时考虑不周(方差、标准差的求算)方差、标准差①假设一组数据为n x x x x ,,,321,则这组数据的平均数()∑==+++=ni i n x n x x x n x 12111 ,方差为()()()[]()⎪⎪⎭⎫ ⎝⎛-=-=-+-+-=∑∑=2221222212111n ii n i i n x n x n x x n x x x x x x ns ,标准差()211∑=-=ni i x x n s ②若假设一组数据为n x x x x ,,,321,它的平均数为x ,方差为2s ,则一组数据为b ax b ax b ax b ax n ++++ ,,,321,的平均数为b x a +,方差为22s a 。
1.(2018年全国新课标I卷理)某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:则下面结论中不正确的是A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半【答案】A【解析】设新农村建设前的收入为M,而新农村建设后的收入为2M,则新农村建设前种植收入为0.6M,而新农村建设后的种植收入为0.74M,所以种植收入增加了,所以A 项不正确;新农村建设前其他收入为0.04M,新农村建设后其他收入为0.1M,故增加了一倍以上,所以B项正确;新农村建设前,养殖收入为0.3M,新农村建设后为0.6M,所以增加了一倍,所以C项正确;新农村建设后,养殖收入与第三产业收入的综合占经济收入的,所以超过了经济收入的一半,所以D正确;故选A.2.某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15℃,B点表示四月的平均最低气温约为5℃.下面叙述不正确的是A.各月的平均最低气温都在0℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20℃的月份有5个【答案】D【易错警示】解答本题时易错可能有两种:(1)对图形中的线条认识不明确,不知所措,只觉得是两把雨伞重叠在一起,找不到解决问题的方法;(2)估计平均温差时易出现错误,错选B.3.某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳【解析】由折线图,可知每年7月到8月折线图呈下降趋势,月接待游客量减少,A错误;折线图整体呈现出增长的趋势,年接待游客量逐年增加,B正确;每年的接待游客量7,8月份达到最高点,即各年的月接待游客量高峰期大致在7,8月,C正确;每年1月至6月的月折线图平稳,月接待游客量波动性更小,7月至12月折线图不平稳,月接待游客量波动性大,D正确.所以选A.【名师点睛】用样本估计总体时统计图表主要有:1.频率分布直方图,特点:频率分布直方图中各小长方形的面积等于对应区间的频率,所有小长方形的面积之和为1;2.频率分布折线图,连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.3. 茎叶图,对于统计图表类题目,最重要的是认真观察图表,从中提炼出有用的信息和数据.4.某中学进行初中与高中各年级的期末考试,该校共有50个考场,每个考场有30个考生,每个考生的座位号按1~30号随机编排,每个考场抽取座位号为18号考生的试卷进行评分,这种抽样方法是A.简单随机抽样B.系统抽样C.分层抽样D.分组抽样【答案】B5.对两个变量进行线性回归分析,计算得到相关系数,则下列说法中正确的是A.与正相关B.与具有较强的线性相关关系C.与几乎不具有线性相关关系D.与的线性相关关系还需进一步确定【答案】B【解析】由可知, 与负相关,并且具有较强的线性相关关系,故选B.6.福利彩票“双色球”中红色球的号码由编号为01,02,…,33的33个个体组成,某彩民利用下面的随机数表选取6组数作为6个红色球的编号,选取方法是从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出来的第6个红色球的编号为A.23 B.09C.17 D.027.某疾病研究所想知道吸烟与患肺病是否有关,于是随机抽取1000名成年人调查是否吸烟及是否患有肺病,得到2×2列联表,经计算得,已知在假设吸烟与患肺病无关的前提条件下,,则该研究所可以A.有95%以上的把握认为“吸烟与患肺病有关”B.有95%以上的把握认为“吸烟与患肺病无关”C.有99%以上的把握认为“吸烟与患肺病有关”D.有99%以上的把握认为“吸烟与患肺病无关”【答案】A【解析】由独立性检验的结论结合题意可知:有95%以上的把握认为“吸烟与患肺病有关”.故选A. 8.某市疾病控制中心对某校高二学生进行了某项健康调查,调查的方法是采取分层抽样的方法抽取样本.我校高二学生共有2000人,抽取了一个200人的样本,其中男生103人,请问该校共有女生A.970人B.1030人C.997人D.206人【答案】A【解析】因为样本容量为200,其中女生人数为200-103=97,且分层抽样的抽取比例为,所以该校的女生总人数为97÷=970.故选A.9.如图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,则甲、乙两人这几场比赛得分的中位数之和是A.51 B.58C.61 D.62【答案】D【解析】由茎叶图可知,甲的这几场比赛得分的中位数为27,乙的这几场比赛得分的中位数为35, 所以甲、乙两人这几场比赛得分的中位数之和是27+35=62.10.已知一组数据3,5,7,x,10的平均数为6,则这组数据的方差为A.B.6C.D.5【答案】C【解析】由题意,得3+5+7+x+10=6×5,得x=5,所以这组数据的方差为s2=(9+1+1+1+16)=.11.采用系统抽样方法从1000人中抽取50人做问卷调查,为此将他们随机编号为1,2,…,1000,适当分组后在第一组采用简单随机抽样的方法抽到的号码为8.抽到的50人中,编号落入区间[1,400]的人做问卷A,编号落入区间[401,750]的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷C的人数为A.12 B.13C.14 D.15【答案】A12.为了全面推进素质教育,教育部门对某省500所中小学进行调研考评,考评分数在80以上(包括80分)的授予“素质教育先进学校”称号,考评统计结果按[50,60),[60,70),[70,80),[80,90),[90,100]绘制成如图所示的频率分布直方图,则应授予“素质教育先进学校”称号的学校的个数为A.175 B.145C.180 D.240【答案】A【解析】由频率和为1可知x=0.1-(0.040+0.020+0.010+0.005)=0.025,故应授予“素质教育先进学校”称号的学校有(0.025+0.010)×10×500=175(所).13.某厂家为了解销售轿车台数与广告宣传费之间的关系,得到如表所示的统计数据表:根据数据表可得回归直线方程其中据此模型预测广告费用为9万元时,销售轿车台数为广告费用万元销售轿车A.17 B.18C.19 D.20【答案】C14.(2018年江苏卷)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________.【答案】90【解析】由茎叶图可知,5位裁判打出的分数分别为,故平均数为.15.(2018年全国新课标Ⅲ)某公司有大量客户,且不同龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.【答案】分层抽样.16.采用系统抽样的方法从800名学生中抽取50名学生进行视力检査.为此,将他们随机编号为1,2,3,…,800,若在116号中随机抽到的号码数为7,则从3348这16个号码数中应抽取的号码为________.【答案】39【解析】33〜48应在第3组中,故应抽取的号码为.17.已知x1,x2,…,x6的标准差为10,则10x1-1,10x2-1,…,10x6-1的标准差是________.【答案】100【解析】根据标准差的定义可得10x1-1,10x2-1,…,10x6-1的标准差是100.18.《九章算术》第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱,欲以钱数多少衰出之,问各几何?”其意为:“仅有甲带了560钱,乙带了350钱,丙带了180钱,三人一起出关,共需要交关税100钱,依照钱的多少按比例出钱”,则丙应出________钱(所得结果四舍五入,保留整数).【答案】17【解析】设丙应出x钱,由题意可得,求解可得钱.19.为了判断高中二年级学生选修文科或理科是否与性别有关,现随机抽取50名学生,得到如下的2×2列联表:已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025,根据表中数据,可得有________的把握认为选修文科或理科与性别有关.【答案】95%20.(2018全国新课标III理)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m 的工人数填入下面的列联表:(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:()()()()()22n ad bcKa b c d a c b d-=++++,【解析】(1)第二种生产方式的效率更高.理由如下:(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高. (iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.(2)由茎叶图知7981802m+==.列联表如下:(3)由于2240(151555)10 6.63520202020K⨯-⨯==>⨯⨯⨯,所以有99%的把握认为两种生产方式的效率有差异.21.某市为了制定合理的节电方案,对居民用电情况进行了调查,通过抽样,获得了某年200户居民每户的月均用电量(单位:百千瓦时),将数据按,,,,,分成9组,制成了如图所示的频率分布直方图.(1)求直方图中的值;(2)设该市有100万户居民,估计全市每户居民中月均用电量不低于6百千瓦时的人数及每户居民月均用电量的中位数;(3)政府计划对月均用电量在4百千瓦时以下的用户进行奖励,月均用电量在内的用户奖励20元/月,月均用电量在内的用户奖励10元/月,月均用电量在内的用户奖励2元/月.若该市共有400万户居民,试估计政府执行此计划的年度预算.【答案】(1);(2)百千瓦时;(3)亿元.【解析】(1)由题得=,所以.(3)该市月均用电量在内的用户数分别为,所以每月预算为元,故估计政府执行此计划的年度预算为万元亿元.22.(2018全国新课标II理)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1217,,…,)建立模型①:ˆ30.413.5y t =-+;根据2010年至2016年的数据(时间变量t 的值依次为127,,…,)建立模型②:ˆ9917.5y t =+. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.【解析】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为ˆ30.413.519226.1y=-+⨯=(亿元). 利用模型②,该地区2018年的环境基础设施投资额的预测值为ˆ9917.59256.5y=+⨯=(亿元). (2)利用模型②得到的预测值更可靠. 理由如下:(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线30.413.5y t =-+上下.这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型ˆ9917.5yt =+可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理.说明利用模型②得到的预测值更可靠.(以上给出了2种理由,只要答出其中任意一种或其他合理理由即可)23.(2018全国新课标I )某家庭记录了未使用节水龙头50天的日用水量数据(单位:m 3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表使用了节水龙头50天的日用水量频数分布表(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)【解析】(1)(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35m3的概率的估计值为0.48.【名师点睛】该题考查的是有关统计的问题,涉及到的知识点有频率分布直方图的绘制、利用频率分布直方图计算变量落在相应区间上的概率、利用频率分布直方图求平均数,在解题的过程中,需要认真审题,细心运算,仔细求解,就可以得出正确结果.24.(2017全国新课标I )为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm ).下面是检验员在一天内依次抽取的16个零件的尺寸:经计算得16119.9716i i x x ===∑,0.212s ==≈,18.439≈,161()(8.5) 2.78i i x x i =--=-∑,其中i x 为抽取的第i 个零件的尺寸,1,2,,16i =⋅⋅⋅.(1)求(,)i x i (1,2,,16)i =⋅⋅⋅的相关系数r ,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若||0.25r <,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).(2)一天内抽检零件中,如果出现了尺寸在(3,3)x s x s -+之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查. (ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(ⅱ)在(3,3)x s x s -+之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(,)i i x y (1,2,,)i n =⋅⋅⋅的相关系数()()niix x y y r --=∑0.09≈.(2)(i )由于9.97,0.212x s =≈,由样本数据可以看出抽取的第13个零件的尺寸在(3,3)x s x s -+以外,因此需对当天的生产过程进行检查.【名师点睛】解答新颖的数学题时,一是通过转化,化“新”为“旧”;二是通过深入分析,多方联想,以“旧”攻“新”;三是创造性地运用数学思想方法,以“新”制“新”,应特别关注创新题型的切入点和生长点.25.(2017新课标全国Ⅱ理科)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg ).其频率分布直方图如下:(1)设两种养殖方法的箱产量相互独立,记A 表示事件:“旧养殖法的箱产量低于50kg ,新养殖法的箱产量不低于50kg”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).附:,22()()()()()n ad bc K a b c d a c b d -=++++【解析】(1)记B 表示事件“旧养殖法的箱产量低于50kg ”,C 表示事件“新养殖法的箱产量不低于50kg ”,由题意知()()()()P A P BC P B P C ==,旧养殖法的箱产量低于50kg 的频率为()0.0120.0140.0240.0340.04050.62++++⨯=, 故()P B 的估计值为0.62.新养殖法的箱产量不低于50kg 的频率为()0.0680.0460.0100.00850.66+++⨯=, 故()P C 的估计值为0.66.因此,事件A 的概率估计值为0.620.660.4092⨯=. (2)根据箱产量的频率分布直方图得列联表:2K的观测值()22006266343815.70510010096104k⨯⨯-⨯=≈⨯⨯⨯,由于15.705 6.635>,故有99%的把握认为箱产量与养殖方法有关.【名师点睛】(1)利用独立性检验,能够帮助我们对日常生活中的实际问题作出合理的推断和预测.独立性检验就是考察两个分类变量是否有关系,并能较为准确地给出这种判断的可信度,随机变量的观测值k值越大,说明“两个变量有关系”的可能性越大.(2)利用频率分布直方图求众数、中位数和平均数时,应注意三点:①最高的小长方形底边中点的横坐标即众数;②中位数左边和右边的小长方形的面积和是相等的;③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.26.“阿曼德比萨”是一个制作和外卖意大利比萨的餐饮连锁店,其主要客户群是在校大学生,为研究各店铺的销售额与店铺附近大学生人数的关系,随机抽取10个分店作为样本,得到数据如下:(1)画出散点图,并判断x与y是否具有相关关系?(2)求回归直线方程,根据回归方程预测一个附近大学生人数为1万人的店铺的季度销售额; (3)若店铺的季度销售额低于10万元则亏损,试求附近大学生人数至少约多少人时才适合建店.【解析】(1)散点图如图所示:由散点图可以看出:这些点分布在一条直线的附近,因此这两个变量具有相关关系.(3)回归直线方程是=5x+6.令≥10,解得x≥0.8.故当附近大学生人数至少约8000人时才适合建店.________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________。
统计2.会用样本频率分布估计总体的概率分布.“统计”这一章,是初中数学中的“统计初步”的深化和拓展.要求主要会用随机抽样,分层抽样的方法从总体中抽取样本,并用样本频率分布估计总体分布.本章高考题以基本题(中、低档题)为主,每年只出一道填空题,常以实际问题为背景,综合考查学生应用基础知识解决实际问题的能力.高考的热点是总体分布的估计和抽样方法.知识的交汇点是排列、组合、概率与统计的解答题.第1课时抽样方法与总体分布估计1.总体、样本、样本容量我们要考察的对象的全体叫做_______,其中每个考察的对象叫_______.从总体中抽出的一部分个体叫做_______,样本中个体的数目叫做_______.2.简单随机抽样设一个总体由N个个体组成,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时,各个个体被抽到的_______相等,就称这样的抽样为_______.3.分层抽样当已知总体由_______的几部分组成时,为了使样本更能充分地反映总体的情况,常将总体分成几个部分,然后按照各部分所占的_______进行抽样,这种抽样叫做_______.其中所分成的各个部分叫做_______.4.总体分布和样本频率分布总体取值的_______分布规律称为总体分布.样本频率分布_______称为样本频率分布.5.总体分布估计:总体分布估计主要指两类.一类是用样本的频率分布去估计总体(的概率)分布.二类是用样本的某些数字特征(例如平均数、方差、标准差等)去估计总体的相应数字特征.6.频率分布条形图和直方图:两者都是用来表示总体分布估计的.其横轴都是表示总体中的个体.但纵轴的含义却截然不同.前者纵轴(矩形的高)表示频率;后者纵轴表示频率与组距的比,其相应组距上的频率等于该组距上的矩形的面积.7.总体期望值指总体平均数.例1. 某公司在甲、乙、丙、丁四个地区分别有150个,120个,180个,150个销售点,公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务等情况,记这项调查为②;则完成①②这两项调查采用的抽样方法依次是()A.分层抽样,系统抽样B.分层抽样,简单随机抽样法C.系统抽样,分层抽样D.简单随机抽样法,分层抽样法解:B变式训练1:某单位有职工100人,不到35岁的有45人,35岁到49岁的有25人,剩下的为50岁以上的人,用分层抽样的方法从中抽取20人,各年龄段分别抽取多少人()A.7,5,8 B.9,5,6C.6,5,9 D.8,5,7解:B样本容量与总体个数的比为20:100=1:5∴各年龄段抽取的人数依次为:11499,255,20956⨯=⨯=--=(人)55例2. 一批产品有一级品100个,二级品60个,三级品40个,分别采用系统抽样和分层抽样,从这批产品中抽取一个容量为20的样本。
抽样方法【背一背基础知识】1. 简单随机抽样:一般地,从元素个数为N 的总体中逐个不放回地抽取容量为n 的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样.最常用的简单随机抽样的方法:抽签法和随机数法.简单随机抽样适用范围是:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小。
2.系统抽样:假设要从容量为N 的总体中抽取容量为n 的样本,第一步,先将总体的N 个个体编号;第二步,确定分隔间距k ,对编号进行分段,当Nn (n 是样本容量)是整数时,取k =N n ;当N n (n 是样本容量)不是整数时,先用简单随机抽样剔除N n -[N n ]个个体,取k =[Nn ];第三步,在第1段用简单随机抽样确定第一个个体编号l (l ≤k );第四步,按照一定的规则抽取样本,通常是将l 加上间隔k 得到第2个个体编号l k +,再加k 得到第3个个体编号2l k +,依次进行下去,直到获取整个样本.系统抽样的适用范围是:元素个数很多且均衡的总体;各个个体被抽到的机会均等。
3.分层抽样:当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,常采用分层抽样,将总体中各个个体按某种特征分成若干个互不交叉的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.分层抽样的应用范围是:总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样或系统抽样.【讲一讲提高技能】1必备技能:在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分成几个组,则分段间隔即为Nn(N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量和总体容量的比值. 2典型例题:例1. 某校高一年级有900名学生,其中女生400名,按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为_______.【答案】25【解析】由题意得抽样比例为45190020=,故应抽取的男生人数为15002520⨯=.【考点】分层抽样.【名师点睛】本题考查抽样方法,要搞清楚三种抽样方法的区别和联系,其中分层抽样是按比例抽样;系统抽样是等距离抽样,属于基础题.例2. 某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本的老年教师人数为()A.90 B.100 C.180 D.300【答案】C【考点定位】分层抽样.【名师点晴】本题主要考查的是分层抽样,属于容易题.解题时一定要清楚“320”是指抽取前的人数还是指抽取后的人数,否则容易出现错误.解本题需要掌握的知识点是分层抽样,即抽取比例=样本容量总体容量.【练一练提升能力】1.为了了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为()A.50B.40C.25D .20 【答案】C【解析】由题意知,分段间隔为10002540=,故选C . 2.从3001名学生中选取50名组成参观团,现采用下面的方法选取:先用简单随机抽样从 3001人中剔除1人,剩下的3000人再按系统抽样的方法进行,则每个人被选到的机会( )A .不全相等B 。
高考数学复习典型题型专题讲解与练习专题96 统计图表的应用题型一频率分布直方图的应用【例1】为落实党中央的“三农”政策,某市组织该市所有乡镇干部进行了一期“三农”政策高考数学复习典型题型专题讲解与练习专题培训,并在培训结束时进行了结业考试.如图是该次考试成绩随机抽样样本的频率分布直方图.则下列关于这次考试成绩的估计错误的是()A.众数为82.5B.中位数为85C .平均数为86D .有一半以上干部的成绩在80~90分之间【答案】C【解析】由频率直方图知:众数为82.5,A 正确;又(0.010.030.06)50.5++⨯=,即中位数为85,B 正确;由(0.0172.50.0377.50.0682.50.0587.50.0392.50.0297.5)5⨯+⨯+⨯+⨯+⨯+⨯⨯=85.5,C 错误;由()0.060.0550.550.5+⨯=>,则有一半以上干部的成绩在80~90分之间,D 正确.故选:C【变式1-1】第24届冬奥会于2022年2月4日在国家体育场鸟巢举行了盛大开幕式.在冬奥会的志愿者选拔工作中,某高校承办了面试工作,面试成绩满分100分,现随机抽取了80名候选者的面试成绩并分为五组,绘制成如图所示的频率分布直方图,则下列说法错误的是(每组数据以区间的中点值为代表)( )A .直方图中b 的值为0.025B .候选者面试成绩的中位数约为69.4C .在被抽取的学生中,成绩在区间[)65,75之间的学生有30人D .估计候选者的面试成绩的平均数约为69.5分【答案】C【解析】A ,∵()0.0050.0450.020.005101b ++++⨯=,∴0.025b =,故A 正确;B ,设候选者面试成绩的中位数为x ,则()()0.0050.02510650.0450.5x +⨯+-⨯=, 解得69.4x ≈,故B 正确;C ,成绩在区间[)65,75的频率为0.045100.45⨯=,故人数有800.4536⨯=,故C 错误;D ,500.00510600.02510700.04510800.0210900.0051069.5⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=,故D 正确.【变式1-2】某市政府部门为了解该市的“全国文明城市”创建情况,在该市的12个区县市中随机抽查到了甲、乙两县,考核组对他们的创建工作进行量化考核.在两个县的量化考核成绩(均为整数)中各随机抽取20个,得到如图数据(用频率分布直方图估计总体平均数时,每个区间的值均取该区间的中点值).关于甲乙两县的考核成绩,下列结论正确的是( )A .甲县平均数小于乙县平均数B .甲县中位数小于乙县中位数C .甲县众数不小于乙县众数D .不低于80的数据个数,甲县多于乙县【答案】C 【解析】由条形图可知,甲样本的平均数:57258596768269279687886899874.820x ⨯++++⨯+⨯+⨯++⨯++==甲, 中位数:79,众数:79,不低于80的数据共5个; 由频率分布直方图可知,一样本的平均数:55100.0265100.02575100.0385100.0295100.00571.574.8x =⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=<乙, 中位数:设中位数为x 中,由0.02100.025100.450.5⨯+⨯=<,0.02100.025100.03100.750.5⨯+⨯+⨯=>,故中位数[)70,80x ∈中,()0.02100.02510700.030.5x ⨯+⨯+-⨯=中,解得71.6779x ≈<中,众数[)70,80x ∈众且x N +∈众,即7179x ≤≤众,不低于80的数据共20100.0051⨯⨯=,所以A ,B ,D 选项错误,故选:C.【变式1-3】某班进行了一次数学测试,全班学生的成绩都落在区间[]50,100内,其成绩的频率分布直方图如图所示,若该班学生这次数学测试成绩的中位数的估计值为81.25,则b a -的值为( )A .0.01B .0.005C .0.008D .0.006【答案】A【解析】由题意有10100.250.4101a b b ++++=,得20.035+=a b ,又由()10100.2581.25800.040.5a b +++-⨯=,得0.02+=a b ,解得0.005a =,0.015b =,有0.0150.0050.01-=-=b a .故选:A.【变式1-4】某城市在创建文明城市的活动中,为了解居民对“创建文明城市”的满意程度,组织居民给活动打分(分数为整数,满分100分),从中随机抽取一个容量为100的样本,发现数据均在[]40,100内.现将这些分数分成6组并画出样本的频率分布直方图,但不小心污损了部分图形,如图所示.观察图形,则下列说法错误的是( )A .频率分布直方图中第三组的频数为10人B .根据频率分布直方图估计样本的众数为75分C .根据频率分布直方图估计样本的中位数为75分D .根据频率分布直方图估计样本的平均数为75分【答案】D【解析】分数在[)60,70内的频率为()1100.0050.0200.0300.0250.0100.10-⨯++++=,所以第三组[)60,70的频数为1000.1010⨯=(人),故A 正确;因为众数的估计值是频率分布直方图中最高矩形的中点,从图中可看出众数的估计值为75分,故B 正确;因为()0.0050.0200.010100.350.5++⨯=<,()0.0050.0200.0100.03100.650.5+++⨯=>, 所以中位数位于[)70,80,设中位数为a ,则()0.35700.030.5a +-⨯=,解得75a =,故C 正确;样本平均数的估计值为:450.05550.2650.1750.3850.25950.173⨯+⨯+⨯+⨯+⨯+⨯=(分),故D 错误.故选:D .【变式1-5】(多选)某高中学校积极响应国家“阳光体育运动”的号召,为确保学生每天一小时的体育锻炼,调查该校2000名高中学生每周平均参加体育锻炼时间的情况,现从高一、高二、高三三个年级学生中按照3:1:1的比例分层抽样,收集了200名学生每周平均体育运动时间的样本数据(单位:小时),整理后得到如图所示的频率分布直方图,则下列说法中,正确的是( )A .估计该校高中学生每周平均体育运动时间不足4小时的人数为500人B .估计该校高中学生每周平均体育运动时间不少于8小时的人数百分比为20%C .估计该校高中学生每周平均体育运动时间的中位数为5小时D .估计该校高中学生每周平均体育运动时间为5.8小时【答案】ABD【解析】A :该校学生每周平均体育运动时间不足4小时的频率为()0.0250.120.25+⨯=,所以,估计高一年级每周平均体育运动时间不足4小时的人数约为20000.25500⨯=人,故A 选项正确;B :该校学生每周平均体育运动时间不少于8小时的百分比为()0.0750.025220%+⨯=,故B 选项正确;C :估计该校高中学生每周平均体育运动时间的中位数为()0.50.025+0.124+5.70.152-⨯≈⨯小时,故C 选项不正确;D :该校高中学生每周平均体育运动时间为5.8小时为0.02521+0.123+0.1525+0.12527+0.07529+0.025211 5.8⨯⨯⨯⨯⨯⨯⨯⨯⨯⨯⨯⨯=小时,故D选项正确.故选:ABD.题型二折线图的应用【例2】下图是国家统计局近期公布的全国居民消费价格的涨跌幅情况:现有如下说法:①2021年3月份,全国居民消费价格的同比和环比均呈现增长趋势②2021年1月至2022年1月,全国居民消费价格同比增长的月份有7个;③2021年1月至2022年1月中的任1个月,全国居民消费价格的环比呈现增长趋势的频率为12④在2021年1月至2022年1月这个时段中,全国居民消费价格的同比与环比都增长的月份有5个上述说法正确的个数为()A.1 B.2 C.3 D.4【答案】A【解析】2021年3月份,全国居民消费价格的同比为正数,环比为负数,所以①错误:2021年1月至2022年1月,全国居民消费价格同比增长的月份有11个,下跌的月份有2个,所以②错误;2021年1月至2022年1月,全国居民消费价格环比增长的月份有7个,下跌的月份有6个,故从2021年1月至2022年1月中任取1个月,全国居民消费价格的环比呈现增长趋势的频率为713,所以③错误;在2021年1月至2022年1月这个时段中,全国居民消费价格的同比与环比都增长的月份有5个,所以④正确,故选:A.【变式2-1】随着我国经济总量的日益增长和社会财富的不断积累,投资理财观念已经深入普通国人家庭.“投资理财情绪指数”是根据互联网用户搜索某种理财产品相应关键词的次数为基础所得到的统计指标.指数越大,表示互联网用户对该理财产品的关注度也越高.如图是2019年上半年某种理财产品的投资理财情绪指数走势图.根据该走势图,下列结论正确的是()A.这半年中,互联网用户对该理财产品的关注度不断增强B.这半年中,互联网用户对该理财产品的关注度呈周期性变化C.从这半年的投资理财情绪指数来看,2月份的方差大于4月份的方差D.从这半年的投资理财情绪指数来看,5月份的平均值小于6月份的平均值【答案】C【解析】由2019年上半年某种理财产品的投资理财情绪指数走势图知:A:这半年中,互联网用户对该理财产品的关注度不断增强呈现出一定的波动性,故A错误;B:这半年中,互联网用户对该理财产品的关注度不断增强呈现出一定的波动性,没有周期性变化,故B错误;C:从这半年的投资理财情绪指数来看,2月份的波动性大于4月份的波动性,∴2月份的方差大于4月份的方差,故C正确;D:从这半年的投资理财情绪指数来看,5月份的平均值大于6月份的平均值,故D错误.故选:C.【变式2-2】甲、乙两个跑步爱好者利用微信运动记录了去年下半年每个月的跑步里程(单位:公里),现将两人的数据绘制成如图所示的折线图,则下列结论中错误的是()A.甲跑步里程的极差等于110B .乙跑步里程的中位数是273C .分别记甲、乙下半年每月跑步里程的平均数为1m ,2m ,则12m m >D .分别记甲乙下半年每月跑步里程的标准差为1s ,2s ,则12s s >【答案】C【解析】甲跑步里程的极差为313203110-=,A 的结论正确. 乙跑步里程的中位数为2802662732+=,B 的结论正确. 甲跑步里程的平均数313254217245203301255.56+++++=, 乙跑步里程的平均数293280262283255266273.26+++++≈, 所以12m m <,C 的结论错误.根据折线图可知,甲的波动大,乙的波动小,所以12s s >,D 的结论正确.故选:C【变式2-3】某市气象部门根据2021年各月的每天最高气温平均值与最低气温平均值(单位:℃)数据,绘制如下折线图:那么,下列叙述错误的是( )A .各月最高气温平均值与最低气温平均值总体呈正相关B.全年中,2月份的最高气温平均值与最低气温平均值的差值最大C.全年中各月最低气温平均值不高于10℃的月份有5个D.从2021年7月至12月该市每天最高气温平均值与最低气温平均值都呈下降趋势【答案】D【解析】在A中,各月最高气温平均值与最低气温平均值为正相关,故A正确;在B中,全年中,2月的最高气温平均值与最低气温平均值的差值最大,故B 正确;在C中,全年中各月最低气温平均值不高于10C 的月份有1月,2月,3月,11月,12月,共5个,故C正确;在D中,从2021年7月至12月该市每天最高气温平均值与最低气温平均值,先上升后下降,故D错误.故选:D.【变式2-4】2021年11月3日11时,全国首条无人驾驶跨座式单轨芜湖轨道交通1号线全线开通运营,标志着芜湖市正式跨入轨道交通时代,如图为1号线正式运行后连续11天的客运量折线图,根据该折线图,下列说法错误的是()A.该11天中客运量的极差大约是4.8B.该11天客运量的平均数大约为5C.该11天中客运量的中位数大约是4.5D.8日至10日客运量相对于11日至13日客运量,波动性更小,方差更大【答案】D【解析】根据折线图进行数据分析:对于A:该11天中客运量的最小值为11月3日的客运量,最大值为11月13日的客运量,极差大约是4.8.故A正确;对于B:该11天客运量中,有两次超过8,其余9次都小于5,但距离5较近,故可以估计该11天客运量的平均数大约为5.故B正确;对于C:把该11天客运量从小到大排列,处在第六位的是11月7日的客运量,大约是4.5.故C正确;对于D:8日至10日客运量相对于11日至13日客运量,波动性更小,根据方差的意义,可以得到方差更小.故D错误.故选:D【变式2-5】下图是国家统计局发布的2018年3月到2019年3月全国居民消费价格的涨跌幅情况折线图,其中上面折线是同比涨跌幅情况折线图,下面折线是环比涨跌幅情况折线图,(注:2019年2月与2018年2月相比较称同比,2019年2月与2019年1月相比较称环比),根据该折线图,下列结论不正确的是()A.2018年3月至2019年3月全国居民消费价格同比均上涨B.2018年3月至2019年3月全国居民消费价格环比有涨有跌C.2019年3月全国居民消费价格同比涨幅最大D.2019年3月全国居民消费价格环比变化最快【答案】C【解析】A:上面的同比涨跌幅情况折线图中,所有数值均为正,即同比均上涨,正确;B:下面的环比涨跌幅情况折线图中,数值有正有负,即消费价格环比有涨有跌,正确;C:上面的同比涨跌幅情况折线图中,居民消费价格同比涨幅最大的是2018.和2018.10两个月,涨幅均为2.5,大于2019年2月全国居民消费价格同比涨幅(2.3),错误;D:下面的环比涨跌幅情况折线图中,2019年3月全国居民消费价格环比变化最快,由1降到了-0.4,变化值1.4,是最大的,正确.故选:C题型三扇形图的应用【例3】某学校高一年级学生来自农村、牧区、城镇三类地区,下面是根据其人数比例绘制的扇形统计图,由图中的信息,得出以下3个判断:①该校高一学生在这三类不同地区的分布情况为3:2:7;②若已知该校来自牧区的高一学生为140人,则高一学生总人数为840人.③若从该校高一学生中抽取120人作为样本,调查高一学生父母的文化程度,则利用分层抽样,从农村、牧区、城镇学生中分别抽取30、20、70人,样本更具有代表性.其中正确的判断有( )A .3个B .2个C .1个D .0个【答案】A【解析】根据扇形统计图,结合圆心角分别为:90,60,210︒︒︒,来自农村,牧区和城镇的人数之比为:90:60:2103:2:7=;对①:该校高一学生在这三类不同地区的分布情况为3:2:7,故①正确;对②:设高一学生总人数为x ,则由来自牧区的高一学生为140人可得:11406x =,则840x =人,即高一学生总人数为840人,故②正确; 对③:根据题意,从高一学生中抽取120人,来自农村,牧区和城镇的人数分别为:312030327⨯=++人,212020327⨯=++,712070327⨯=++,故③正确;故选:A .【变式3-1】某学校于3月12日组织师生举行植树活动,购买垂柳、银杏、侧柏、海桐四种树苗共计1200棵,比例如图所示.高一、高二、高三报名参加植树活动的人数分别为600,400,200,若每种树苗均按各年级报名人数的比例进行分配,则高三年级应分得侧柏的数量为()A.34 B.46 C.50 D.70【答案】C【解析】由扇形统计图知,购买的1200棵树苗中,侧柏的数量为120025%300⨯=,依题意,高一、高二、高三分到的侧柏的棵数比为:600:400:2003:2:1=,所以高三年级应分得侧柏的数量为130050321⨯=++.故选:C【变式3-2】郫都是中国农家乐旅游发源地、最美中国生态旅游目的地,是四川省乡村旅游的先行者,快工作慢生活,构成了安逸郫都最靓丽的风景线.郫都大部分农民都有自己的苗圃,也不断改进种植花卉苗木的技术.改进后,某种苗木在单位面积上的出苗数量增加了50%,且在同一生长周期内的高度(cm)变化的饼图如图所示,则下列说法正确的是()A .80cm 以上优质苗木所占比例增加10%B .改进后,80cm 以上优质苗木产量实现了增加80%的目标C .70cm-80cm 的苗木产量没有变化D .70cm 以下次品苗木产量减少了13【答案】B【解析】设改进前某种苗木在单位面积上的出苗数量为a ,改进后它的出苗数量为()10.5a +,则80cm 以上优质苗木所占比例增加了()10.50.60.50.4+⨯-=,即40%故A 错; 80cm 以上优质苗木产量实现了增加了()10.50.60.50.80.5a a a +⨯-=,即80%的目标,故B 正确;单位面积上70cm-80cm 的苗木产量增加了()10.50.30.30.15a a a +⨯-=,故C 错; 70cm 以下次品苗木产量减少了()0.20.110.510.24a a a -+=,故D 错,故选:B .【变式3-3】某乡镇实现脱贫目标后,在奔小康的道路上,继续大步前进,依托本地区苹果种植的优势,经过3年的发展,苹果总产量翻了一番,统计苹果的品质得到了如下饼图:70,80是指苹果的外径,则以下说法中不正确的是( )A.80以上优质苹果所占比例增加B.经过3年的努力,80以上优质苹果产量实现翻了一番的目标C.70~80的苹果产量翻了一番D.70以下次品苹果产量减少了一半【答案】D【解析】设原苹果总产量为a,则经过3年的发展,苹果总产量为2a,3年前80以上优质苹果所占比例50%,3年后80以上优质苹果所占比例60%,所占比例增加,故选项A正确;3年前80以上优质苹果的产量为50%0.5a a⨯=,3年后80以上优质苹果的产量为60%2 1.2⨯=,a a故80以上优质苹果产量实现翻了一番的目标,选项B正确;3年前70~80苹果的产量为30%0.3a a⨯=,3年后70~80苹果的产量为30%20.6⨯=,a a故70~80的苹果产量翻了一番,选项C正确;3年前70以下次品苹果的产量为20%0.2⨯=,a a3年后70以下次品苹果的产量为10%20.2⨯=,a a故70以下次品苹果的产量没变,选项D错误.故选:D.【变式3-4】某商场开通三种平台销售商品,五一期间这三种平台的数据如图1所示.该商场为了解消费者对各平台销售方式的满意程度,用分层抽样的方法抽取了6%的顾客进行满意度调查,得到的数据如图2所示.下列说法正确的是()A.样本中对平台一满意的消费者人数约700B.总体中对平台二满意的消费者人数为18C.样本中对平台一和平台二满意的消费者总人数为60D.若样本中对平台三满意的消费者人数为120,则90%=m【答案】C【解析】对于A:样本中对平台一满意的人数为20006%35%42⨯⨯=,故选项A错误;对于B:总体中对平台二满意的人数约为150020%300⨯=,故选项B错误;对于C:样本中对平台一和平台二满意的总人数为:20006%35%15006%20%60⨯⨯+⨯⨯=,故选项C正确:对于D:对平台三的满意率为12080%25006%=⨯,所以80%=m,故D错误.故选:C【变式3-5】2020年中国经济在疫情狙击战的基础上实现了正增长,根据中国统计局官网提供的数据,20162020-年全国居民人均可支配收入及其增长速度和2020年全国居民人均消费支出及其构成如图所示.根据该图,下列结论正确的是()A.2020年全国居民人均可支配收入比上年下降了2.1%B.2020年全国居民人均居住支出占可支配收入的比重为25%C.2020年全国居民人均交通通信支出占消费支出的比重为13%D.20162020-年全国居民人均可支配收入逐年增加,比上年实际增长率逐年下降【答案】C【解析】对于A选项,由图可知,2020年全国居民人均可支配收入比上年上涨了2.1%,A 错;对于B选项,2020年全国居民人均居住支出占消费支出的比重为25%,2020年全国居民人均居住支出占可支配收入的比重为521525%32189<,B错;对于C选项,2020年全国居民人均交通通信支出占消费支出的比重为13%,C对;对于D选项,20162020-年全国居民人均可支配收入逐年增加,2017年比上年实际增长率上升,D错.故选:C.。
一、选择题1.如图1为某省2019年1~4月快递业务量统计图,图2是该省2019年1~4月快递业务收入统计图,下列对统计图理解错误的是( )A.2019年1~4月的业务量,3月最高,2月最低,差值接近2000万件B.2019年1~4月的业务量同比增长率超过50%,在3月最高C.从两图来看2019年1~4月中的同一个月快递业务量与收入的同比增长率并不完全一致D.从1~4月来看,该省在2019年快递业务收入同比增长率逐月增长2.我校高中生共有2700人,其中高一年级900人,高二年级1200人,高三年级600人,现采取分层抽样法抽取容量为135的样本,那么高一、高二、高三各年级抽取的人数分别为 ( ) A.45,75,15 B.45,45,45 C.45,60,30 D.30,90,153.2020年,一场突如其来的“新型冠状肺炎”使得全国学生无法在春季正常开学,不得不在家“停课不停学”.为了解高三学生居家学习时长,从某校的调查问卷中,随机抽取n个学生的调查问卷进行分析,得到学生可接受的学习时长频率分布直方图(如下图所示),已9,11的学生人数为25,则n的值为()知学习时长在[)A.40 B.50 C.80 D.1004.在一个容量为5的样本中,数据均为整数,已测出其平均数为8,但墨水污损了后面两个数据,其中一个数据的十位数字1未污损,即5,7,8,,那么这组数据的方差2s可能的最大值是( ) A .185B .18C .36D .65.图1是某学习小组学生数学考试成绩的茎叶图,1号到16号的同学的成绩依次为1A ,216,,A A ⋯,图2是统计茎叶图中成绩在一定范围内的学生情况的程序框图,那么该程序框图输出的结果是( )A .10B .6C .7D .166.如图是某手机商城2018年华为、苹果、三星三种品牌的手机各季度销量的百分比堆积图(如:第三季度华为销量约占50%,苹果销量约占20%,三星销量约占30%).根据该图,以下结论中一定正确的是( )A .华为的全年销量最大B .苹果第二季度的销量大于第三季度的销量C .华为销量最大的是第四季度D .三星销量最小的是第四季度7.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号1,2,⋯,960,分组后在第一组采用简单随机抽样的方法抽到的号码为29,则抽到的32人中,编号落入区间[]200,480的人数为 A .7B .9C .10D .128.在2018年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价元和销售量件之间的一组数据如下表所示:价格 9 9.510.5 11销售量 1186 5由散点图可知,销售量与价格之间有较强的线性相关关系,其线性回归方程是,且,则其中的( ) A .10B .11C .12D .10.59.学校为了解新课程标准提升阅读要求对学生阅读兴趣的影响情况,随机抽取了100名学生进行调查.根据调查结果绘制学生周末阅读时间的频率分布直方图如图所示:将阅读时间不低于30分钟的观众称为“阅读霸”,则下列命题正确的是( ) A .抽样表明,该校有一半学生为阅读霸 B .该校只有50名学生不喜欢阅读 C .该校只有50名学生喜欢阅读 D .抽样表明,该校有50名学生为阅读霸 10.有线性相关关系的变量有观测数据,已知它们之间的线性回归方程是,若,则( ) A .B .C .D .11.下列说法正确的是( )①设某大学的女生体重(kg)y 与身高(cm)x 具有线性相关关系,根据一组样本数据(,)(1,2,3,,)i i x y i n =,用最小二乘法建立的线性回归方程为0.8585.71y x =- ,则若该大学某女生身高增加1cm ,则其体重约增加0.85kg ;②关于x 的方程210(2)x mx m -+=>的两根可分别作为椭圆和双曲线的离心率; ③过定圆C 上一定点A 作圆的动弦AB ,O 为原点,若1()2OP OA OB =+,则动点P 的轨迹为椭圆;④已知F 是椭圆22143x y +=的左焦点,设动点P 在椭圆上,若直线FP 的斜率大于3,则直线OP (O 为原点)的斜率的取值范围是3333(,)(,)282-∞-.A .①②③B .①③④C .①②④D .②③④12.PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表: 时间周一 周二 周三 周四 周五 车流量x (万辆) 100 102 108 114 116 浓度y (微克)7880848890根据上表数据,用最小二乘法求出y 与x 的线性回归方程是( )参考公式:121()()()niii ni i x x y y b x x ==--=-∑∑,a y b x =-⋅;参考数据:108x =,84y =;A .0.6274ˆ.2yx =+ B .0.7264ˆ.2y x =+ C .0.7164ˆ.1y x =+ D .0.6264ˆ.2y x =+ 二、填空题13.已知数据1x ,2x ,…,10x 的方差为1,且()()()222123222x x x -+-+-()2102170x ++-=,则数据1x ,2x ,…,10x 的平均数是________.14.如图是甲、乙两人在10天中每天加工零件个数的茎叶图,若这10天甲加工零件个数的中位数为a ,乙加工零件个数的平均数为b ,则a b +=______.15.下表记录了某公司投入广告费x 与销售额y 的统计结果,由表可得线性回归方程为^^^y b x a =+,据此方程预报当6x =时,y =__. x4 2 35 y 49263954附:参考公式:^1122211()()()n niii ii i nni i i i x x y y x y nx yb x x x nx====---==--∑∑∑∑,^^^a y b x =-16.玉林市有一学校为了从254名学生选取部分学生参加某次南宁研学活动,决定采用系统抽样的方法抽取一个容量为42的样本,那么从总体中应随机剔除的个体数目为__________.17.对具有线性相关关系的变量,x y ,有一组观测数据(,)i i x y (1,2,3,,10i =),其回归直线方程是3ˆ2ˆybx =+,且121012103()30x x x y y y +++=+++=,则b =______.18.一个项目由15个专家评委投票表决,剔除一个最高分96,一个最低分58后所得到的平均分为92,方差为16,那么原始得分的方差为______________.19.变量X 与Y 相对应的5组数据和变量U 与V 相对应的5组数据统计如表:用b 1表示变量Y 与X 之间的回归系数,b 2表示变量V 与U 之间的回归系数,则b 1与b 2的大小关系是___.20.一个容量为40的样本,分成若干组,在它的频率分布直方图中,某一组相应的小长方形的面积为0.4,则该组的频数是__________.三、解答题21.某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表: (2)预测该地区2015年农村居民家庭人均纯收入. 附:77211134.4,140i ii i i x yx ====∑∑.回归直线的斜率和截距的最小二乘法估计公式分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-22.假设关于某设备的使用年限x (年)和所支出的维修费用y (万元),有如下的统计资料:x (年)12 3 4 5y (万元) 5 6 7 8 10由资料可知y 对x 呈线性相关关系. (1)求y 关于x 的线性回归方程;(2)请估计该设备使用年限为15年时的维修费用.参考公式:线性回归方程y bx a =+的最小二乘法计算公式:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-,参考数据:5115263748510120i ii x y==⨯+⨯+⨯+⨯+⨯=∑23.脐橙营养丰富,含有人体所必需的各类营养成份,若规定单个脐橙重量(单位:千克)在[0.1,0.3)的脐橙是“普通果”,重量在[0.3,0.5)的磨橙是“精品果”,重量在[0.5,0.7]的脐橙是“特级果”,有一果农今年种植脐橙,大获丰收为了了解脐橙的品质,随机摘取100个脐橙进行检测,其重量分别在[0.1,0.2),[0.2,0.3),[0.3,0.4),[0.4,0.5),[0.5,0.6),[0.6,0.7]中,经统计得到如图所示频率分布直方图(1)将频率视为概率,用样本估计总体.现有一名消费者从脐橙果园中,随机摘取5个脐橙,求恰有3个是“精品果”的概率.(2)现从摘取的100个脐橙中,采用分层抽样的方式从重量为[0.4,0.5),[0.5,0.6)的脐橙中随机抽取10个,再从这10个抽取3个,记随机变量X 表示重量在[0.5,0.6)内的脐橙个数,求X 的分布列及数学期望.24.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次[0,200](200,400](400,600]空气质量等级 1(优) 2 16 25 2(良) 5 10 12 3(轻度污染) 6 7 8 4(中度污染)72(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的列联表,并根据列联表,判断是否有多少的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次400≤ 人次400>空气质量好 空气质量不好附:22()()()()()n ad bc K a b c d a c b d -=++++. 25.某校为“全国数学联赛”选拔人才,分初赛和复赛两个阶段进行,规定:分数不小于本次考试成绩中位数的具有复赛资格,该校有900名学生参加了初赛,所有学生的成绩均在区间(]30,150内,其频率分布直方图如图.(1)根据频率分布直方图,估计获得复赛资格应划定的最低分数线; (2)根据频率分布直方图,估计本次初赛的平均成绩. 26.某企业广告费支出与销售额(单位:百万元)数据如表所示: 广告费x64825(1)求销售额y 关于广告费x 的线性回归方程;(2)预测当销售额为76百万元时,广告费支出为多少百万元. 回归方程y bx a =+中斜率和截距的最小二乘估计公式分别为:()()()1122211n niii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】由题意结合所给的统计图确定选项中的说法是否正确即可. 【详解】对于选项A : 2018年1~4月的业务量,3月最高,2月最低, 差值为439724111986-=,接近2000万件,所以A 是正确的;对于选项B : 2018年1~4月的业务量同比增长率分别为55%,53%,62%,58%,均超过50%,在3月最高,所以B 是正确的;对于选项C :2月份业务量同比增长率为53%,而收入的同比增长率为30%,所以C 是正确的;对于选项D ,1,2,3,4月收入的同比增长率分别为55%,30%,60%,42%,并不是逐月增长,D 错误. 本题选择D 选项. 【点睛】本题主要考查统计图及其应用,新知识的应用等知识,意在考查学生的转化能力和计算求解能力.2.C解析:C 【解析】因为共有学生2700,抽取135,所以抽样比为1352700,故各年级分别应抽取135900452700⨯=,1351200602700⨯=,135600302700⨯=,故选C. 3.B解析:B 【分析】由频率分布直方图的性质,求得0.25x =,再结合频率分布直方图的频率的计算方法,即可求解. 【详解】由频率分布直方图的性质,可得()20.050.150.051x +++=,解得0.25x =, 所以学习时长在[)9,11的频率2520.5x n==,解得50n =. 故选:B . 【点睛】本题主要考查了频率分布直方图性质及其应用,其中解答中熟记频率分布直方图的性质是解答的关键,着重考查了数据分析能力,以及计算能力.4.C解析:C 【分析】设出最后两个数,然后根据已知条件列方程,求得方程2s 的表达式,根据表达式的结构求得2s 的最大值. 【详解】设这组数据的最后2个分别是10x +,y 则5781085x y +++++=⨯, 得10x y +=,故10y x =-. ∴()222211910(2)(2)21855s x x x ⎡⎤=+++++-=+⎣⎦, 显然当9x =时,2s 最大,最大为36. 故选:C 【点睛】本小题主要考查平均数和方差的计算,考查方程的思想,属于基础题.5.A解析:A 【分析】先弄清楚程序框图中是统计成绩不低于90分的学生人数,然后从茎叶图中将不低于90分的个数数出来,即为输出的结果. 【详解】176A =,1i =,16i ≤成立,190A ≥不成立,112i =+=; 279A =,2i =,16i ≤成立,290A ≥不成立,112i =+=;792A =,7i =,16i ≤成立,790A ≥成立,011n =+=,718i =+=;依此类推,上述程序框图是统计成绩不低于90分的学生人数,从茎叶图中可知,不低于90分的学生数为10,故选A . 【点睛】本题考查茎叶图与程序框图的综合应用,理解程序框图的意义,是解本题的关键,考查理解能力,属于中等题.6.A解析:A 【分析】根据图象即可看出,华为在每个季度的销量都最大,从而得出华为的全年销量最大,从而得出A 正确;由于不知每个季度的销量多少,从而苹果、华为和三星在哪个季度的销量大或小是没法判断的,从而得出选项B ,C ,D 都错误. 【详解】根据图象可看出,华为在每个季度的销量都最大,所以华为的全年销量最大;每个季度的销量不知道,根据每个季度的百分比是不能比较苹果在第二季度和第三季度销量多少的,同样不能判断华为在哪个季度销量最大,三星在哪个季度销量最小;B ∴,C ,D 都错误,故选A . 【点睛】本题主要考查对销量百分比堆积图的理解.7.C解析:C 【分析】根据系统抽样的定义,可知抽到的号码数可组成一个以301=-n a n 为通项公式的等差数列,令*200301480,≤-≤∈n n N ,解不等式可得结果. 【详解】每组人数=9603230÷=人,即抽到号码数的间隔为30,因为第一组抽到的号码为29,根据系统抽样的定义,抽到的号码数可组成一个等差数列,且*2930(1)301,=+-=-∈n n n n N a ,令200301480≤-≤n ,得2014813030≤≤n ,可得n 的取值可以从7取到16,共10个,故选C . 【点睛】本题主要考查系统抽样的定义及应用,转化为等差数列是解决本题的关键.8.A解析:A 【解析】 【分析】由表求得,,代入回归直线方程,联立方程组,即可求解,得到答案.【详解】由题意,5家商场的售价元和销售量件之间的一组数据,可得,,又由回归直线的方程,则,即,又因为,解得,故选A.【点睛】本题主要考查了回归直线方程的特征及其应用,其中解答中熟记回归直线方程的特征,准确计算是解答的关键,着重考查了推理与运算能力,属于基础题.9.A解析:A【分析】根据频率分布直方图得到各个时间段的人数,进而得到结果.【详解】根据频率分布直方图可列下表:阅读时间[0,10)[10,20)[20,30)[30,40)[40,50)[50,60](分)抽样人数10182225205(名)故选A.【点睛】这个题目考查了频率分布直方图的实际应用,以及样本体现整体的特征的应用,属于基础题.10.D解析:D【解析】【分析】先计算,代入回归直线方程,可得,从而可求得结果.【详解】因为,所以,代入回归直线方程可求得,所以,故选D.【点睛】该题考查的是有关回归直线的问题,涉及到的知识点有回归直线一定会过样本中心点,利用相关公式求得结果,属于简单题目.11.C解析:C【分析】利用线性回归方程系数的几何意义,圆锥曲线离心率的范围,椭圆的性质,逐一判断即可.【详解】①设某大学的女生体重y(kg)与身高x(cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的线性回归方程为y∧=0.85x﹣85.71,则若该大学某女生身高增加1cm,则其体重约增加0.85kg,正确;②关于x的方程x2﹣mx+1=0(m>2)的两根之和大于2,两根之积等于1,故两根中,一根大于1,一根大于0小于1,故可分别作为椭圆和双曲线的离心率.正确;③设定圆C的方程为(x﹣a)2+(x﹣b)2=r2,其上定点A(x0,y0),设B(a+r cosθ,b+r sinθ),P(x,y),由12OP =(OA OB+)得22x a rcosxy b rsinyθθ++⎧=⎪⎪⎨++⎪=⎪⎩,消掉参数θ,得:(2x﹣x0﹣a)2+(2y﹣y0﹣b)2=r2,即动点P的轨迹为圆,∴故③不正确;④由22143x y+=,得a2=4,b2=3,∴1c==.则F(﹣1,0),如图:过F作垂直于x轴的直线,交椭圆于A(x轴上方),则x A=﹣1,代入椭圆方程可得32Ay=.当P为椭圆上顶点时,P(0FPk=32OAk=-,∴当直线FP时,直线OP的斜率的取值范围是32⎛⎫-∞-⎪⎝⎭,.当P为椭圆下顶点时,P(0,∴当直线FP时,直线OP,32),综上,直线OP(O为原点)的斜率的取值范围是32⎛⎫-∞-⎪⎝⎭,∪(8,32).故选C【点睛】本题以命题真假的判断为载体,着重考查了相关系数、离心率、椭圆简单的几何性质等知识点,属于中档题.12.B解析:B 【解析】 【分析】利用最小二乘法做出线性回归直线的方程的系数,写出回归直线的方程,得到结果. 【详解】由题意,b=22222210078102801088411488116905108841001021081141165108⨯+⨯+⨯+⨯+⨯-⨯⨯++++-⨯=0.72, a=84﹣0.72×108=6.24,∴y =0.72x+6.24, 故选:B . 【点睛】本题主要考查线性回归方程,属于难题.求回归直线方程的步骤:①依据样本数据画出散点图,确定两个变量具有线性相关关系;②计算211,,,nnii i i i x y x x y ==∑∑的值;③计算回归系数ˆˆ,ab ;④写出回归直线方程为ˆˆˆy bx a =+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.二、填空题13.或6【分析】由数据…的方差为1且把所给的式子进行整理两式相减得到关于数据的平均数的一元二次方程解方程即可【详解】数据…的方差为1①②将②-①得解得或故答案为:或6【点睛】本题主要考查一组数据的平均数解析:2-或6. 【分析】由数据1x ,2x ,…,10x 的方差为1,且()()()()2222123102222170x x x x -+-+-++-=,把所给的式子进行整理,两式相减,得到关于数据的平均数的一元二次方程,解方程即可. 【详解】数据1x ,2x ,…,10x 的方差为1,()()()()22221231010x x x x x x x x∴-+-+-++-=,()()22221210121010210x x x x x x x x ∴++++-+++=,()222212101010x x x x ∴+++-=,①()()()()2222123102222170x x x x -+-+-++-=,()()22212101210440170x x x x x x ∴+++-++++=,()22212104040170x x x x ∴+++-+=,②将②-①得24120x x --=,解得2x =-,或6x =, 故答案为:2-或6. 【点睛】本题主要考查一组数据的平均数的求法,解题时要熟练掌握方差的计算公式的灵活运用,属于中档题.14.5【解析】【分析】由茎叶图直接可以求出甲的中位数和乙的平均数求和即可【详解】由茎叶图知甲加工零件个数的中位数为乙加工零件个数的平均数为则【点睛】本题主要考查利用茎叶图求中位数和平均数解析:5 【解析】 【分析】由茎叶图直接可以求出甲的中位数和乙的平均数,求和即可. 【详解】由茎叶图知,甲加工零件个数的中位数为()1212221.52a =⨯+=, 乙加工零件个数的平均数为()11917112124222430323010b =⨯+++++++++23=,则21.52344.5a b +=+=. 【点睛】本题主要考查利用茎叶图求中位数和平均数.15.5【分析】根据表中数据先求出回归方程然后将代入可得到答案【详解】由题意故回归方程为当时【点睛】本题考查了回归方程的求法考查了学生的计算求解能力属于基础题解析:5 【分析】根据表中数据,先求出回归方程,然后将6x =代入,可得到答案. 【详解】 由题意,2345 3.54x +++==,49263954424y +++==,4144492263395544 3.54263558847i ii x y xy =-=⨯+⨯+⨯+⨯-⨯⨯=-=∑,2211649254 3.5 3.55nii xnx =-=+++-⨯⨯=∑,479.45ˆb==,42ˆˆ9.4 3.59.1ay bx =-=-⨯=,故回归方程为9.194ˆ.y x =+,当6x =时,9.19.4665.5y =+⨯=. 【点睛】本题考查了回归方程的求法,考查了学生的计算求解能力,属于基础题.16.2【解析】【分析】根据系统抽样的概念结合可得最后结果为2【详解】学生总数不能被容量整除根据系统抽样的方法应从总体中随机剔除个体保证整除∵故应从总体中随机剔除个体的数目是2故答案为2【点睛】本题主要考解析:2 【解析】 【分析】根据系统抽样的概念结合2544262=⨯+,可得最后结果为2. 【详解】学生总数不能被容量整除,根据系统抽样的方法,应从总体中随机剔除个体,保证整除. ∵2544262=⨯+,故应从总体中随机剔除个体的数目是2,故答案为2. 【点睛】本题主要考查系统抽样,属于基础题;从容量为N 的总体中抽取容量为n 的样本,系统抽样的前面两个步骤是:(1)将总体中的N 个个体进行编号;(2)当Nn为整数时,抽样距即为N n ;当N n 不是整数时,从总体中剔除一些个体,使剩下的总体中的个体的个数N '能被n 整除.17.【解析】【分析】由题意求得样本中心点代入回归直线方程即可求出的值【详解】由已知代入回归直线方程可得:解得故答案为【点睛】本题考查了线性回归方程求出横坐标和纵坐标的平均数写出样本中心点将其代入线性回归解析:16-【解析】 【分析】由题意求得样本中心点,代入回归直线方程即可求出b 的值 【详解】 由已知,()12101210330x x x y y y +++=+++=()12101310x x x x ∴=⨯+++= ()12101110y y y y =⨯+++=代入回归直线方程可得:3132b =+ 解得16b =-故答案为16- 【点睛】本题考查了线性回归方程,求出横坐标和纵坐标的平均数,写出样本中心点,将其代入线性回归方程即可求出结果18.【解析】分析:根据方差与均值的关系求解即可详解:剔除最高分和最低分后的则原始平均分 原始原始方差即原始方差为88点睛:本题考查方差与均值的关系属基础题 解析:88【解析】分析:根据方差与均值的关系()()()22D x E x E x ⎡⎤=-⎣⎦ 求解即可. 详解:剔除最高分和最低分后的222()()()92168480,E x E x D x =+=+= 22()8480(152)110240,x E x n ∑=⨯=⨯-=则原始平均分()921?3? 96? 589015E x ;⨯++==原始 22229658()8188,15x E x ∑++==原始方差 222()?()?()81889088.D x E X E X =-=-=原始原始 即原始方差为 88 .点睛:本题考查方差与均值的关系,属基础题.19.【解析】分析:根据回归系数几何意义得详解:因为Y 与X 之间正增长所以因为V 与U 之间负增长所以因此点睛:函数关系是一种确定的关系相关关系是一种非确定的关系事实上函数关系是两个非随机变量的关系而相关关系是解析:12b b >. 【解析】分析:根据回归系数几何意义得120b b >> 详解:因为Y 与X 之间正增长,所以10b > 因为V 与U 之间负增长,所以20b < 因此120b b >>,点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .b 的正负,决定正相关与负相关.20.16【解析】根据频率直方图的含义每组小矩形的面积就是该组数据在总体中出现的频率所以该组频数为故填16解析:16 【解析】根据频率直方图的含义,每组小矩形的面积就是该组数据在总体中出现的频率,所以该组频数为400.4=16⨯,故填16.三、解答题21.(1)0.5 2.3y x =+;(2)6800元. 【分析】(1)根据表中数据计算出4x =, 4.3y =,再结合参考数据利用公式即可计算出,b a ,进而得出线性回归方程; (2)将9x =代入即可预测. 【详解】解:(1)由表可得:123456747++++++==x ,2.93.3 3.64.4 4.85.2 5.9 4.37y ++++++==,又77211134.4,140i ii i i x yx ====∑∑,71722217134.474 4.30.5140747i ii i i x y x yb x x==--⨯⨯∴===-⨯-∑∑ 4.30.54 2.3a y bx ∴=-=-⨯=y ∴关于x 的线性回归方程为0.5 2.3y x =+;(2)由(1)可得:0.5 2.3y x =+,∴当9x =时,0.59 2.3 6.8y =⨯+=,即该地区2015年农村居民家庭人均纯收入约为6800元. 【点睛】本题考查线性回归方程的求法,考查由线性回归方程进行预测,属于基础题. 22.(1) 1.2 3.6y x =+;(2)21.6万元. 【分析】(1)先求出年限x 和维修费用y 的平均值,即得到样本中心点,利用最小二乘法得到线性回归方程的系数,根据样本中心点在线性回归直线上,得到a 值,即得线性回归方程; (2)将15x =代入回归直线方程即可求得结果. 【详解】(1)1234535x ++++==,5678107.25++++==y51120i ii x y==∑,522222211234555i i x ==++++=∑25945nx =⨯=,537.2108nx y =⨯⨯=∴1201081.25545b -==-,7.2 1.23 3.6a =-⨯=∴y 关于x 的线性回归方程为 1.2 3.6y x =+(2)在上述回归方程中,当15x =时得21.6y = ∴该设备使用年限为15年时的维修费用大约为21.6万元. 【点睛】本题考查回归直线方程的求解及其应用,其中认真审题,准确合理的运算是解决此类问题的关键,考查运算能力,属于基础题. 23.(1)516(2)见解析 【分析】(1)根据题意,先得到随机摘取一个脐橙,是“精品果”的概率为0.5,并且随机摘取5个脐橙,其中“精品果”的个数符合二项分布,再根据二项分布的概率公式,列出式子,得到答案.(2)先判断出X 可取的值为0,1,2,3,分别计算出其概率,然后列出概率分布列,再根据随机变量的数学期望公式,计算出其数学期望. 【详解】(1)从从脐橙果园中,随机摘取5个脐橙,其中“精品果”的个数记为Y , 由图可知,随机摘取一个脐橙,是“精品果”的概率为:0.2+0.3=0.5, ∴Y ~B (5,12), ∴随机摘取5个脐橙,恰有3个是“精品果”的概率为: P (Y =3)3325115()()2216C ==. (2)依题意,抽取10个脐橙,重量为[0.3,0.4),[0.4,0.5)的个数分别为6和4, X 的可能取值为0,1,2,3,P (X =0)3631016C C ==,P (X =1)216431012C C C ==, P (X =2)1264310310C C C ==,P (X =3)34310130C C ==, ∴X 的分布列为:E (X )01236210305=⨯+⨯+⨯+⨯=. 【点睛】本题考查满足二项分布的概率问题,以及随机变量的概率分布列和数学期望,属于中档题. 24.(1)概率分别为:43100,27100,21100,9100;(2)350;(3)填表见解析;有95%的把握认为锻炼的人次与该市的空气质量有关. 【分析】(1)用频率估计概率,从而得到估计该市一天的空气质量等级为1,2,3,4的概率; (2)利用频率分布直方图估计样本平均值的方法可得得答案; (3)完善列联表,由公式计算卡方的值,从而查表即可, 【详解】解:(1)该市一天的空气质量等级为1的概率为:2162543100100++=;该市一天的空气质量等级为2的概率为:5101227100100++=;该市一天的空气质量等级为3的概率为:67821100100++=; 该市一天的空气质量等级为4的概率为:7209100100++=; (2)由题意可得:一天中到该公园锻炼的平均人次的估计值为:1000.203000.355000.45350x =⨯+⨯+⨯=;(3)根据所给数据,可得下面的22⨯列联表,由表中数据可得:2()100(3383722) 5.820 3.841()()()()70305545n ad bc K a b c d a c b d -⨯⨯-⨯==≈>++++⨯⨯⨯, 所以有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关. 【点睛】本题考查了独立性检验与频率估计概率,估计平均值的求法,属于中档题. 25.(1)100分;(2)97. 【分析】(1)根据题意,由频率分布直方图求出[]30,90的频率为0.35,[]90,110的频率为0.3,由0.30.350.650.5+=>知:最低分数线在(]90,110之间,进而求出中位数,即可估计出本次考试复赛资格最低分数线;(2)利用频率分布直方图计算出各组的频率,即可估计本次初赛的平均成绩. 【详解】解:(1)由题意知[]30,90的频率为:()200.00250.00750.00750.35⨯++=, 由题意知[]90,110的频率为: 200.01500.3⨯=, 由0.30.350.650.5+=>知:最低分数线在(]90,110之间, 设最低分数线为x ,且(]90,110x ∈. 由()0.35900.0150.5x +-⨯=得:100x =, 故本次考试复赛资格最低分数线应划为100分.(2)由题意可知:初赛分数在区间(]30,50,(]50,70,(]70,90,(]90,110,(]110,130,(]130,150的频率分别为:0.05,0.15,0.15,0.3,0.25,0.1, 所以本次初赛的平均分为:400.05600.15800.151000.31200.251400.197⨯+⨯+⨯+⨯+⨯+⨯=.【点睛】本题考查频率分布直方图的频率、中位数、平均数的求法,考查解题分析和计算能力. 26.(1)17.5 6.5y x =+;(2)9百万元. 【分析】(1)由已知求得ˆb与ˆa 的值,可得销售额y 关于广告费x 的线性回归方程; (2)在(1)中求得的线性回归方程中,取76y =求得x 值即可. 【详解】 (1)6482555x ++++==,5040703060505y ++++==.61621()()10(1)(10)320(3)(20)010130ˆ 6.51199020()iii ii x x yy bx x ==--⨯+-⨯-+⨯+-⨯-+⨯====++++-∑∑,50 6.5517.5ˆˆay bx =-=-⨯=. ∴销售额y 关于广告费x 的线性回归方程为ˆ17.5 6.5yx =+; (2)当ˆ76y=时,代入回归方程ˆ17.5 6.5y x =+,求得9x =. 故预测当销售额为76百万元时,广告费支出为9百万元. 【点睛】本题考查线性回归方程的求法,考查回归方程的应用,考查了计算能力,是中档题.。
§3统计图表1.条形统计图(1)概念:条形统计图是用一个单位长度表示一定的数量,根据数量的多少画成长短不同的①,然后把这些②按一定的顺序排列起来.(2)特点:体现每组中的具体数据,常用其高度来表示各值的频率,如果改变纵轴的意义,它还可以表示取各值的频数.2.折线统计图(1)概念:折线统计图是用一个单位长度表示一定的数量,根据数量的多少描出各点,然后把各点用③顺次连接起来.(2)特点:既能表示数量的多少,又能清楚地反映出数量增减和大小的变化.3.扇形统计图(1)概念:扇形统计图中的④代表总体,圆中的各个⑤分别代表总体中的不同部分,⑥的大小反映部分占总体的百分比的大小.通过扇形统计图可以很清楚地表示各部分数量同总体数量之间的关系.(2)特点:能清楚地表示出各部分在总体中所占的百分比.4.茎叶图(1)概念:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的⑦,两边的部分像植物的茎上长出来的⑧,因此通常把这样的图叫作茎叶图.(2)特点:(i)统计图上的数据没有信息的损失,所有的原始数据都可以从这个茎叶图中得到;(ii)茎叶图可以随时记录,方便表示和比较.基础巩固训练1.如下图所示,以下四种说法中对的是( )A.8班学生最少B.9班男生是女生的2倍C.10班女生比男生多D.8班和10班学生一样多2.某工厂前四年各年的产值统计图如下图,下列说法错误的是( )A.第一年产值为2 000万元B.四年中产值增长的是第二年到第四年C.四年中产值增长速度最快的是第二年到第三年D.四年中产值增长速度最快的是第三年到第四年3.2008~2014年的国内生产总值的增长情况如下图所示,下列结论中不正确的是( )A.2014年国内生产总值的年增长率开始回升B.这7年中,每年的国内生产总值有增有减C.2009~2013年,国内生产总值的年增长率逐年减小D.这7年中,每年的国内生产总值一直在增加4.下图是某中学初中各年级学生人数百分比的统计图,已知八年级学生有540人,那么该校七年级学生人数为( )A.405B.216C.473D.3245.下图为小强参加今年1~5月份的全县中学生数学竞赛的测验成绩,则他的五次成绩的平均数为( )A.80B.82C.78D.816.从甲、乙两个班各随机选出15名同学进行测验,成绩(单位:分)的茎叶图如图所示,则甲、乙两个班的最高成绩各是、,从图中看,班的平均成绩较高.7.某果园有苹果树100棵,为了估计该果园的苹果总产量,小王先按长势把苹果树分成了A、B、C三个级别,其中A级30棵,B级60棵,C级10棵,然后从A、B、C三个级别的苹果树中分别随机抽取了3棵、6棵、1棵,测出其产量,制成了如下统计表.小李看了这个统计表后马上正确估计出了该果园的苹果总产量,那么小李的估计值是千克.苹果树长势A级B级C级随机抽取棵数(棵) 3 6 1 所抽取果树的平均产量(千克) 80 75 70能力提升训练8.某奶品生产企业,2010年对铁锌牛奶、酸牛奶、纯牛奶三个品种的生产情况进行了统计,绘制了图1、图2的统计图,请根据图中信息解答下列问题:(1)酸牛奶生产了多少万吨?把图1补充完整;酸牛奶在图2中所对应的圆心角是多少度?(2)由于市场不断需求,据统计,2011年的生产量比2010年增长20%,按照这样的增长速度,请你估算2012年酸牛奶的生产量是多少万吨.9.某校组织学生书法比赛,对参赛作品按A、B、C、D四个等级进行了评定.现随机抽取部分学生书法作品的评定结果进行分析,并绘制扇形统计图和条形统计图如下:分析结果的扇形统计图、条形统计图根据上述信息完成下列问题:(1)求这次抽取的样本容量;(2)请把条形统计图补充完整;(3)已知该校这次活动共收到参赛作品750份,请你估计参赛作品达到B级以上(即A级和B级)的有多少份.知识清单①直条②直条③线段④圆⑤扇形⑥扇形⑦茎⑧叶子链接高考1. A 由题图可知,样本容量等于(3 500+4 500+2 000)×2%=200;抽取的高中生近视人数为2 000×2%×50%=20,故选A.,所以鸡蛋开支占总开支的2.C 由题图2可知鸡蛋开支占食品开支的11030%×1=3%,故选C.103.答案8解析50岁以上的职工数为200×20%=40人,按分层抽样应抽取的人数为=8.40×402004.答案(1)132;48;60 (2)4;6解析(1)A型有240×55%=132(套),B型有240×20%=48(套),C型有240×25%=60(套).(2)由题中左图可知每人组装A型玩具16套用2小时,所以组装C型玩具12套用2小时,则每小时组装6套,由2a-2=6,得a=4.基础过关基础巩固训练1.B 由题中条形图知,仅B描述正确.2.D 由题中折线图知,增长最快的是第二年到第三年,故D错.3.B 由题中条形图知,增长率有变化,但产值一直在增加.4.D 540÷50%×30%=324.=80,选A.5.A x=65+80+80+85+9056.答案96;92;乙解析由题图可得甲班最高成绩为96分,乙班最高成绩为92分.甲班平均成绩约为73.1分,乙班平均成绩约为76.7分.7.答案7 600解析由题中表格各等级苹果树的平均产量可估算果园的总产量为(80×3+75×6+70×1)×10=7 600(千克).能力提升训练8.解析(1)牛奶总产量=120÷50%=240(万吨),酸牛奶产量=240-40-120=80(万吨),酸牛奶在图2中所对应的圆心角度数为80×360°=120°.补充图1.240(2)80×(1+20%)2=115.2(万吨).答:估算2012年酸牛奶的生产量是115.2万吨.9.解析(1)结合条形统计图及扇形统计图中A级的信息可以求出这次抽取的样本容量为120.×100%=40%;D级的百分(2)求出C级的人数是120×30%=36;B级的百分比为48120比为1-20%-40%-30%=10%,D级的人数为120×10%=12,补充条形统计图如图所示.(3)由扇形统计图可知:参赛作品达到B级以上的占20%+40%=60%,故参赛作品达到B级以上的有750×60%=450(份).。
一、选择题1.某校举行演讲比赛,9位评委给选手A 打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若统计员计算无误,则数字x 应该是( )A .5B .4C .3D .22.我校高中生共有2700人,其中高一年级900人,高二年级1200人,高三年级600人,现采取分层抽样法抽取容量为135的样本,那么高一、高二、高三各年级抽取的人数分别为 ( ) A .45,75,15 B .45,45,45 C .45,60,30 D .30,90,153.工人月工资y (元)与劳动生产率x (千元)变化的回归直线方程为=50+80x ,下列判断不正确的是( )A .劳动生产率为1000元时,工资约为130元B .工人月工资与劳动者生产率具有正相关关系C .劳动生产率提高1000元时,则工资约提高130元D .当月工资为210元时,劳动生产率约为2000元4.某班统计一次数学测验的平均分与方差,计算完毕才发现有位同学的分数还未录入,只好重算一次.已知原平均分和原方差分别为x ,2s ,新平均分和新方差分别为1x ,21s ,若此同学的得分恰好为x ,则( )A .1x x =,221s s = B .1x x =,221s s < C .1x x =,221s s >D .1x x <,221s s =5.某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i =得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( )A .y a bx =+B .2y a bx =+C .e x y a b =+D .ln y a b x =+6.下表是某两个相关变量x ,y 的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆ0.70.35yx =+,那么表中t 的值为( ) x 3 4 5 6 y2.5t44.5A .3B .3.15C .3.5D .4.57.图1是某学习小组学生数学考试成绩的茎叶图,1号到16号的同学的成绩依次为1A ,216,,A A ⋯,图2是统计茎叶图中成绩在一定范围内的学生情况的程序框图,那么该程序框图输出的结果是( )A .10B .6C .7D .168.如图是某手机商城2018年华为、苹果、三星三种品牌的手机各季度销量的百分比堆积图(如:第三季度华为销量约占50%,苹果销量约占20%,三星销量约占30%).根据该图,以下结论中一定正确的是( )A .华为的全年销量最大B .苹果第二季度的销量大于第三季度的销量C .华为销量最大的是第四季度D .三星销量最小的是第四季度9.某班有50名学生,在一次考试中统计出平均分数为70,方差为75,后来发现有2名学生的成绩统计有误,学生甲实际得分是80分却误记为60分,学生乙实际得分是70分却误记为90分,更正后的平均分数和方差分别是( ) A .70和50B .70和67C .75和50D .75和6710.将1000名学生的编号如下:0001,0002,0003,…,1000,若从中抽取50个学生,用系统抽样的方法从第一部分0001,0002,…,0020中抽取的号码为0015时,抽取的第40个号码为( ) A .0795B .0780C .0810D .081511.在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,若将学生按成绩由低到高编为1-45号,再用系统抽样方法从中抽取9人,则其中成绩在区间[120,135]上的学生人数是( )A .4B .5C .6D .712.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经统计,得到一个卖出的热饮杯数与当天气温的对比表: 温度℃ -5 0 4 7 12 15 19 23 27 31 36 热饮杯数15615013212813011610489937654根据上表数据确定的线性回归方程应该是( )A .ˆ 2.352147.767yx =-+ B .ˆ 2.352127.765yx =-+ C .ˆ 2.35275.501yx =+D .ˆ 2.35263.674yx =+ 二、填空题13.给出下列命题:①函数()π4cos 23f x x ⎛⎫=+ ⎪⎝⎭的一个对称中心为5π,012⎛⎫- ⎪⎝⎭;②若,αβ为第一象限角,且αβ>,则tan tan αβ>;③设一组样本数据12,,,n x x x ⋅⋅⋅的平均数是2,则数据1221,21,,21n x x x --⋅⋅⋅-的平均数为3;④函数sin 2y x =的图象向左平移π4个单位长度,得到πsin 24y x ⎛⎫=+ ⎪⎝⎭的图象.其中正确命题的序号是_____________(把你认为正确的序号都填上).14.一组数据由小到大依次为2,4,5,7,,,12,13,14,15a b ,且平均数为9,则49a b+的最小值为________.15.某市有A 、B 、C 三所学校,各校有高三文科学生分别为650人,500人,350人,在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,进行成绩分析,则应从B 校学生中抽取______人.16.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取_______名学生.17.对具有线性相关关系的变量x ,y ,有一组观察数据(,)(1,2,9)i i x y i =⋅⋅⋅,其回归直线方程是:2y x a =+,且919ii x==∑,9118i i y ==∑,则实数a 的值是__________.18.变量X 与Y 相对应的5组数据和变量U 与V 相对应的5组数据统计如表:用b 1表示变量Y 与X 之间的回归系数,b 2表示变量V 与U 之间的回归系数,则b 1与b 2的大小关系是___. 19.已知下列命题:①在线性回归模型中,相关指数2R 越接近于1,表示回归效果越好; ②两个变量相关性越强,则相关系数r 就越接近于1;③在回归直线方程0.52y x ∧=-+中,当解释变量x 每增加一个单位时,预报变量y ∧平均减少0.5个单位;④两个模型中残差平方和越小的模型拟合的效果越好.⑤回归直线ˆˆˆy bx a =+恒过样本点的中心(),x y ,且至少过一个样本点;⑥若2K 的观测值满足2K ≥6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;⑦从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误. 其中正确命题的序号是__________.20.某班60名学生参加普法知识竞赛,成绩都在区间[40100],上,其频率分布直方图如图所示,则成绩不低于60分的人数为___.三、解答题21.为提高某作物产量,种植基地对单位面积播种数与每棵作物的产量之间的关系进行了研究,收集了10块试验田的数据,得到下表: 试验田编号 1 2 3 4 5 6 7 8 9 10 (棵2/m ) 3.5 4 5.1 5.7 6.1 6.9 7.5 8 9.1 11.2 (斤/棵)0.330.320.30.280.270.250.250.240.220.15技术人员选择模型21y a bx =+作为y 与x 的回归方程类型,令2i i u x =,1i iv y =. (1)由最小二乘法得到线性回归方程v u βα=+,求y 关于x 的回归方程; (2)利用(1)得出的结果,计算当单位面积播种数x 为何值时,单位面积的总产量w xy =的预报值最大?(计算结果精确到0.01)附:对于一组数据()11,u v ,()22,u v …(),n n u v 其回归直线v u βα=+的斜率和截距的最小二乘法估计分别为1221ni i i nii u v nu vunuβ==-⋅=-∑∑,v u αβ=-.参考数据:1500nii u==∑,140ni i v ==∑,12321n i i i u v ==∑,2135642ni i u ==∑30 5.48≈.22.假设关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:x2 3 4 5 6 y 2.23.85.56.57.0若由资料可知y 对x 呈线性相关关系,试求: (1)回归直线方程;(2)估计使用年限为10年时,维修费用约是多少?(参考:1221ni ii nii x ynxyb xnx ==-=-∑∑,a y bx =-)23.两台机床同时生产直径为10的零件,为了检验产品质量,质量质检员从两台机床的产品中各抽取4件进行测量,结果如下:如果你是质量检测员,在收集到上述数据后,你将通过怎样的运算来判断哪台机床生产的零件质量更符合要求.24.某土特产销售总公司为了解其经营状况,调查了其下属各分公司月销售额和利润,得到数据如下表:在统计中发现月销售额x 和月利润额y 具有线性相关关系.(Ⅰ)根据如下的参考公式与参考数据,求月利润y 与月销售额x 之间的线性回归方程; (Ⅱ)若该总公司还有一个分公司“雅果”月销售额为10万元,试求估计它的月利润额是多少?(参考公式:1221ni i i n i i x y nx y b x nx==-⋅=-∑∑,a y b x =-,其中:1112ni ii x y ==∑,21200)nii x==∑.25.某城市100户居民的月平均用水量(单位:吨),以[0,2)[2,4)[4,6)[6,8)[8,10)[10,12)[12,14)分组的频率分布直方图如图.(1)求直方图中x的值;并估计出月平均用水量的众数.(2)求月平均用水量的中位数及平均数;(3)在月平均用水量为[6,8),[8,10),[10,12),[12,14)的四组用户中,用分层抽样的方法抽取22户居民,则应在[10,12)这一组的用户中抽取多少户?(4)在第(3)问抽取的样本中,从[10,12)[12,14)这两组中再随机抽取2户,深入调查,则所抽取的两户不是来自同一个组的概率是多少?26.某校为了了解甲、乙两班的数学学习情况,从两班各抽出10名学生进行数学水平测试,成绩如下(单位:分):甲班:82848589798091897974乙班:90768681848786828583(1)求两个样本的平均数;(2)求两个样本的方差和标准差;(3)试分析比较两个班的学习情况.【参考答案】***试卷处理标记,请不要删除一、选择题1.D解析:D【解析】记分员在去掉一个最高分94和一个最低分87后,余下的7个数字的平均数是91,()89889290939291791+++++++÷=,635=917=6372x∴+⨯∴=,故选D.x x,解析:C 【解析】因为共有学生2700,抽取135,所以抽样比为1352700,故各年级分别应抽取135900452700⨯=,1351200602700⨯=,135600302700⨯=,故选C. 3.C解析:C 【解析】试题分析:根据线性回归方程=50+80x 的意义,对选项中的命题进行分析、判断即可. 解:根据线性回归方程为=50+80x ,得;劳动生产率为1000元时,工资约为50+80×1=130元,A 正确; ∵=80>0,∴工人月工资与劳动者生产率具有正相关关系,B 正确;劳动生产率提高1000元时,工资约提高=80元,C 错误;当月工资为210元时,210=50+80x ,解得x=2, 此时劳动生产率约为2000元,D 正确. 故选C .考点:线性回归方程.4.C解析:C 【分析】根据平均数和方差公式计算比较即可. 【详解】设这个班有n 个同学,分数分别是123,,,,n a a a a ⋅⋅⋅,假设第i 个同学的成绩没录入,这一次计算时,总分是()1n x -,方差为()()()()()222222121111i i n s a x a x a x a x a x n -+⎡⎤=-+-+⋅⋅⋅+-+-+⋅⋅⋅+-⎣⎦-; 第二次计算时,()11n nxx x -+=x =,方差为()()()()()()222222221121111++i i i n n s a x a x a x a x a x a x s n n-+-⎡⎤=-+-⋅⋅⋅-+-+-+⋅⋅⋅+-=⎣⎦故有1x x =,221s s >.故选:C 【点睛】本题主要考查样本的平均数和方差公式;属于中档题.解析:D 【分析】根据散点图的分布可选择合适的函数模型. 【详解】由散点图分布可知,散点图分布在一个对数函数的图象附近, 因此,最适合作为发芽率y 和温度x 的回归方程类型的是ln y a b x =+. 故选:D. 【点睛】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.6.A解析:A 【分析】计算得到 4.5x =,114t y +=,代入回归方程计算得到答案. 【详解】3456 4.54x +++==, 2.54 4.51144t t y ++++==,中心点(),x y 过ˆ0.70.35yx =+, 即114.50.70.354t +=⨯+,解得3t =. 故选:A . 【点睛】本题考查了回归方程的相关问题,意在考查学生的计算能力.7.A解析:A 【分析】先弄清楚程序框图中是统计成绩不低于90分的学生人数,然后从茎叶图中将不低于90分的个数数出来,即为输出的结果. 【详解】176A =,1i =,16i ≤成立,190A ≥不成立,112i =+=; 279A =,2i =,16i ≤成立,290A ≥不成立,112i =+=;792A =,7i =,16i ≤成立,790A ≥成立,011n =+=,718i =+=;依此类推,上述程序框图是统计成绩不低于90分的学生人数,从茎叶图中可知,不低于90分的学生数为10,故选A . 【点睛】本题考查茎叶图与程序框图的综合应用,理解程序框图的意义,是解本题的关键,考查理解能力,属于中等题.8.A解析:A【分析】根据图象即可看出,华为在每个季度的销量都最大,从而得出华为的全年销量最大,从而得出A正确;由于不知每个季度的销量多少,从而苹果、华为和三星在哪个季度的销量大或小是没法判断的,从而得出选项B,C,D都错误.【详解】根据图象可看出,华为在每个季度的销量都最大,所以华为的全年销量最大;每个季度的销量不知道,根据每个季度的百分比是不能比较苹果在第二季度和第三季度销量多少的,同样不能判断华为在哪个季度销量最大,三星在哪个季度销量最小;B,C,D都错误,故选A.【点睛】本题主要考查对销量百分比堆积图的理解.9.B解析:B【解析】【分析】根据平均数、方差的概念表示出更正前的平均数、方差和更正后的平均数、方差,比较其异同,然后整体代入即可求解.【详解】设更正前甲,乙,…的成绩依次为a1,a2,…,a50,则a1+a2+…+a50=50×70,即60+90+a3+…+a50=50×70,(a1﹣70)2+(a2﹣70)2+…+(a50﹣70)2=50×75,即102+202+(a3﹣70)2+…+(a50﹣70)2=50×75.更正后平均分为x=150×(80+70+a3+…+a50)=70;方差为s2=150×[(80﹣70)2+(70﹣70)2+(a3﹣70)2+…+(a50﹣70)2]=150×[100+(a3﹣70)2+…+(a50﹣70)2]=150×[100+50×75﹣102﹣202]=67.故选B.【点睛】本题考查平均数与方差的概念与应用问题,是基础题.10.A解析:A【解析】分析:先确定间距,再根据等差数列通项公式求结果.详解:因为系统抽样的方法抽签,所以间距为100020 50=所以抽取的第40个数为1520(401)795+⨯-=选A.点睛:本题考查系统抽样概念,考查基本求解能力.11.B解析:B【解析】分析:首先写出所有学生的乘积,然后结合系统抽样的方法整理计算即可求得最终结果.详解:由题意可知,学生的成绩如下:111,111,112,113,113;116,117,117,118,118;120,120,121,122,122;123,124,124,126127;128,128,129,129,129;131,131,131,132,132;132,133,134,134,135;137,138,138,138,139;140,142,142,143,144.用系统抽样方法从中抽取9人,则每5人中抽取一人,即上述分组中每组抽取一人,则所抽取的学生的成绩在区间[]120,135上的学生人数为5.本题选择B选项.点睛:本题主要考查系统抽样的概念及其应用,茎叶图的识别等知识,意在考查学生的转化能力和计算求解能力.12.A解析:A【解析】分析:先观察表中数据的规律,确定回归系数b的符号,再计算x和y,代入选项确定正确答案.详解:由表中数据规律发现:热饮杯数y随当天气温x升高而减少,则0b<,排除C、D.计算1169=(504712151923273136)1111x-++++++++++=11228=(15615013212813011610489937654)111.64 1111y++++++++++=≈将x代入选项A,得1692.352147.767111.6311ˆy=-⨯+=将x代入选项B,得1692.352127.76591.6311ˆy=-⨯+=所以选项A正确.故选A.点睛:本题考查线性回归方程的求法与应用,一次项系数b 符号的判断和回归直线过样本中心点(,)x y 是解题关键.二、填空题13.①③【分析】求解的值判断①;举例说明②错误;求解平均数判断③;利用函数图象的平移变换判断④【详解】解:对于①函数的一个对称中心为故①正确;对于②取为第一象限角且但故②错误;对于③一组样本数据的平均数解析:①③ 【分析】 求解5()12f π-的值判断①;举例说明②错误;求解平均数判断③;利用函数图象的平移变换判断④. 【详解】 解:对于①,55()4cos()4cos()012632f ππππ-=-+=-=, ∴函数()4cos(2)3f x x π=+的一个对称中心为5(,0)12π-,故①正确;对于②,取94πα,3πβ=,α,β为第一象限角,且αβ>,但tan tan αβ<,故②错误;对于③,一组样本数据1x ,2x ,⋯,n x 的平均数是2,则数据121x -,221x -,⋯,21n x -的平均数为22132⨯-=,故③正确; 对于④,函数sin 2y x =的图象向左平移4π个单位长度,得到sin 2()sin(2)cos242y x x x ππ=+=+=的图象,故④错误.∴正确命题的序号是①③.故答案为:①③. 【点睛】本题考查命题的真假判断与应用,考查三角函数的图象与性质,训练了平均数的求法,属于中档题.14.【分析】由已知可得利用基本不等式即可求出的最小值【详解】一组数据由小到大依次为且平均数为9故当且仅当时等号成立的最小值为故答案为:【点睛】本题考查基本不等式在最值中的应用关键要对1做代换属于中档题解析:2518【分析】由已知可得18,712a b a b +=≤≤≤,利用基本不等式,即可求出49a b+的最小值. 【详解】一组数据由小到大依次为2,4,5,7,,,12,13,14,15a b , 且平均数为9,故18,712,118a ba b a b ++=≤≤≤=, 49149()()18a b a b a b +=++ 149125(13)(13181818b a a b =++≥+= 当且仅当3654,55a b ==时,等号成立, 49a b+的最小值为2518.故答案为:2518【点睛】本题考查基本不等式在最值中的应用,关键要对“1”做代换,属于中档题.15.40【分析】设应从B 校抽取n 人利用分层抽样的性质列出方程组能求出结果【详解】设应从B 校抽取n 人某市有ABC 三所学校各校有高三文科学生分别为650人500人350人在三月进行全市联考后准备用分层抽样的解析:40 【分析】设应从B 校抽取n 人,利用分层抽样的性质列出方程组,能求出结果. 【详解】设应从B 校抽取n 人,某市有A 、B 、C 三所学校,各校有高三文科学生分别为650人,500人,350人, 在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,120n650500350500∴=++,解得n 40=.故答案为40. 【点睛】本题考查应从B 校学生中抽取人数的求法,考查分层抽样的性质等基础知识,考查运算求解能力,是基础题.16.60【分析】采用分层抽样的方法从该校四个年级的本科生中抽取一个容量为300的样本进行调查的【详解】∵该校一年级二年级三年级四年级的本科生人数之比为4:5:5:6∴应从一年级本科生中抽取学生人数为:故解析:60 【分析】采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查的. 【详解】∵该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6, ∴应从一年级本科生中抽取学生人数为:4300604556⨯=+++.故答案为60.17.0【解析】分析:根据回归直线方程过样本中心点计算平均数代入方程求出的值详解:根据回归直线方程过样本中心点即答案为0点睛:本题考查了线性回归方程过样本中心点的应用问题是基础题解析:0 【解析】分析:根据回归直线方程过样本中心点x y (,), 计算平均数代入方程求出a 的值. 详解:根据回归直线方程ˆ2y x a =+过样本中心点x y (,),191191,99i i x x ==∑=⨯=191118299i i y y ==∑=⨯=,22210a y x ∴=-=-⨯=;即答案为0.点睛:本题考查了线性回归方程过样本中心点的应用问题,是基础题.18.【解析】分析:根据回归系数几何意义得详解:因为Y 与X 之间正增长所以因为V 与U 之间负增长所以因此点睛:函数关系是一种确定的关系相关关系是一种非确定的关系事实上函数关系是两个非随机变量的关系而相关关系是解析:12b b >. 【解析】分析:根据回归系数几何意义得120b b >> 详解:因为Y 与X 之间正增长,所以10b > 因为V 与U 之间负增长,所以20b < 因此120b b >>,点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .b 的正负,决定正相关与负相关.19.①③④⑦【分析】根据线性回归分析的概念进行分析即可【详解】在线性回归模型中相关指数越接近于1表示回归效果越好①正确;两个变量相关性越强则相关系数r 的绝对值就越接近于1②错误;③正确;两个模型中残差平解析:①③④⑦ 【分析】根据线性回归分析的概念进行分析即可. 【详解】在线性回归模型中,相关指数2R 越接近于1,表示回归效果越好,①正确;两个变量相关性越强,则相关系数r 的绝对值就越接近于1,②错误;③正确;两个模型中残差平方和越小的模型拟合的效果越好,④正确;回归直线ˆˆˆybx a =+恒过样本点的中心(),x y ,不一定过样本点,⑤错误;若2K 的观测值满足2K ≥6.635,我们有99%的把握认为吸烟与患肺病有关系,并不能说在100个吸烟的人中必有99人患有肺病,⑥错误;从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误,⑦正确.故答案为①③④⑦. 【点睛】本题考查线性回归分析的有关概念,掌握相关概念是解题基础,属于基础题.20.30【解析】由题意可得:则成绩不低于分的人数为人解析:30 【解析】 由题意可得:()400.0150.0300.0250.0051030⨯+++⨯=则成绩不低于60分的人数为30人三、解答题21.(1)212.50.03y x=+;(1)9.13x =棵2/m . 【分析】(1)先利用公式和数据计算,αβ,即得v 关于u 的线性回归方程,再代入得到y 关于x 的回归方程即可;(2)先利用(1)的结果计算w xy =,再利用基本不等式求其最大值即可. 【详解】解:(1)由题意得115010n i i u u ===∑,11410ni i v v ===∑,∴1011022212321105040.033564210501010i i i i i u v u vu uβ==-⨯⨯=⨯⋅--≈=-∑∑, 2.5v u αβ=-=.所以v 关于u 的线性回归方程为0.03 2.5v u =+.则y 关于x 的回归方程为212.503ˆ0.yx =+.(2)根据(1)的结果并结合条件,单位面积的总产量的预报值21252.50.030.03x w x x x==++ 1.83≤=≈. 当且仅当2.50.03x x =时,等号成立,此时9.13x =≈. 即当9.13x =棵2/m 时,单位面积的总产量w 的预报值最大,最大值是1.83.【点睛】本题考查了非线性回归方程的求法以及方程的应用,属于中档题.22.(1) 1.2308ˆ.0yx =+;(2)12.38万元.. 【分析】(1)由已知表格中的数据,易计算出变量x ,y 的平均数,及2i x ,i i x y 的累加值,代入回归直线系数公式1221ni ii nii x ynxyb xnx ==-=-∑∑,a y bx =-,即可求出回归直线的系数,进而求出回归直线方程.(2)把使用年限10代入回归直线方程,即可估算出维修费用的值. 【详解】 (1)4x =,5y=,52190i i x==∑,51112.3i i i x y ==∑,12215 1.235ni ii nii x yxyb xx ==-==-∑∑,0.08a y bx =-=, 所以回归直线方程为 1.2308ˆ.0yx =+; (2) 1.23100.0812.3ˆ8y=⨯+=, 即估计用10年时维修费约为12.38万元. 【点评】本题考查回归直线的方程求解,关键是要求出回归直线方程的系数,由已知的变量x ,y的值,我们计算出变量x ,y 的平均数,及2i x ,i i x y 的累加值,代入回归直线系数公式1221ni ii nii x ynxyb xnx ==-=-∑∑,a y bx =-,即可求出回归直线的系数,进而求出回归直线方程.属于中等题.23.机床乙的零件质量更符合要求,运算见解析. 【详解】先考虑各自的平均数:设机床甲的平均数、方差分别为211x s 、; 机床乙的平均数、方差分别为222x s 、.1109.81010.2104x +++==,210.1109.910104x +++==∴两者平均数相同,再考虑各自的方差: 2222211[(1010)(9.810)(1010)(10.210)]0.024s =-+-+-+-=2222221[(1010)(10.110)(1010)(9.910)]0.0054s =-+-+-+-=∵2212s s >,∴机床乙的零件质量较稳定,乙更符合要求.24.(1)ˆ0.50.4yx =+(2)5.4万元 【解析】 试题分析:(1)首先由题意求得平均数6, 3.4x y ==,然后利用系数公式计算可得回归方程为0.5.4ˆ0yx =+ . (2)由题意结合(1)中的结论预测可得“雅果”分公司的月利润额是5.4万元. 试题(Ⅰ) 由已知数据计算得:5n =,6, 3.4x y ==1221511256 3.40.5,20056653.40.560.4ni i i n i i x y xy b x x a ==--⨯⨯===-⨯⨯-=-⨯=∑∑∴线性回归方程为0.5.4ˆ0yx =+ (Ⅱ)将x =10代入线性回归方程中得到0.5100.4ˆ 5.4y=⨯+=(万元) ∴估计“雅果”分公司的月利润额是5.4万元 25.(1) x =0.075,7;(2) 6.4,5.36;(3) 2;(4)23. 【分析】(1)根据频率和为1,列方程求出x 的值;(2)根据频率分布直方图中,每个矩形的中点横坐标与该矩形的纵坐标、组距相乘后求和可得平均值,由最高矩形的数据组中点为众数;中位数两边的频率相等,由此求出中位数;(3)求出抽取比例数,计算应抽取的户数; (4)利用列举法,由古典概型概率公式可得结果. 【详解】(1)根据频率和为1,得2×(0.02+0.095+0.11+0.125+x +0.05+0.025)=1, 解得x =0.075;由图可知,最高矩形的数据组为[6,8),所以众数为()16872+=; (2) [2,6)内的频率之和为 (0.02+0.095+0.11)×2=0.45;设中位数为y ,则0.45+(y −6)×0.125=0.5, 解得y =6.4,∴中位数为6.4;平均数为()210.0230.09550.1170.12590.075110.025 5.36⨯+⨯+⨯+⨯+⨯+⨯= (3)月平均用电量为[10,12)的用户在四组用户中所占的比例为0.0520.1250.0750.050.02511=+++,∴月平均用电量在[10,12)的用户中应抽取11×211=2(户). (4)月平均用电量在[12,14)的用户中应抽取11×111=1(户), 月平均用电量在[10,12)的用户设为A 、B , 月平均用电量在[12,14)的用户设为C ,从[10,12),[12,14)这两组中随机抽取2户共有 ,,AB AC BC ,3种情况, 其中,抽取的两户不是来自同一个组的有,,AC BC ,2种情况, 所以,抽取的两户不是来自同一个组的概率为23. 【点睛】本题主要考查频率分布直方图的应用,属于中档题. 直方图的主要性质有:(1)直方图中各矩形的面积之和为1;(2)组距与直方图纵坐标的乘积为该组数据的频率;(3)每个矩形的中点横坐标与该矩形的纵坐标、组距相乘后求和可得平均值;(4)直方图左右两边面积相等处横坐标表示中位数.26.(1)=83.2x 甲,=84x 乙;(2)22=26.36=13.2S S 甲乙,,=5.13S 甲,=3.63S 乙;(3)乙班的总体学习情况比甲班好 【解析】试题分析:每组样本数据有10个,求样本的平均数利用平均数公式,10个数的平均数等于这10个数的和除以10;比较平均分的大小可以看出两个班学生平均水平的高低,求样本的方差只需使用方差公式,求这10个数与平均数的差的平方方和再除以10;比较两组数据方差的大小就可得出两组数据的标准差的大小,标准差较小者成绩较稳定 . 试题(1)x 甲=110×(82+84+85+89+79+80+91+89+79+74)=83. 2, x 乙=110×(90+76+86+81+84+87+86+82+85+83)=84. (2)2S 甲=110×[(82-83. 2)2+(84-83. 2)2+(85-83. 2)2+(89-83. 2)2+(79-83. 2)2+(80-83. 2)2+(91-83. 2)2+(89-83. 2)2+(79-83. 2)2+(74-83. 2)2]=26. 36,2S 甲=110[(90-84)2+(76-84)2+(86-84)2+(81-84)2+(84-84)2+(87-84)2+(86-84)2+(82-84)2+(85-84)2+(83-84)2]=13. 2,则s 甲,s 乙≈3. 63.(3)由于x x <甲乙,则甲班比乙班平均水平低.由于S S >甲乙,则甲班没有乙班稳定. 所以乙班的总体学习情况比甲班好【点睛】怎样求样本的平均数,n 个数的平均数等于这n 个数的和除以n ;比较平均数的大小可以看出两个样本平均水平的高低,怎样求样本的方差,就是求这n 个数与平均数的差的平方方和再除以n ;比较两组数据方差的大小就可得出两组数据的标准差的大小,标准差较小者成绩较稳定 .。
§10.2 统计及统计案例探考情悟真题【考情探究】考点内容解读5年考情预测热度考题示例考向关联考点抽样方法①理解随机抽样的必要性和重要性;②会用简单随机抽样方法从总体中抽取样本2019课标全国Ⅰ,6,5分系统抽样—★★☆2018课标全国Ⅲ,14,5分分层抽样—统计图表了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率分布折线图、茎叶图,体会它们各自的特点2017课标全国Ⅲ,3,5分认识折线图—★★☆2018课标全国Ⅰ,3,5分认识扇形统计图—2018课标全国Ⅰ,19,12分用频率分布直方图解决实际问题平均数样本的数字特征①理解样本数据标准差的意义和作用,会计算数据标准差;②能从样本数据中提取基本的数字特征,并给出合理的解释;③会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征;④会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题2017课标全国Ⅰ,2,5分理解方差或标准差—★★☆2019课标全国Ⅲ,4,5分用样本估计总体—2019课标全国Ⅲ,17,12分用频率分布直方图估计数字特征频率分布直方图2019课标全国Ⅱ,19,12分频数分布表及数字特征—变量间的相关性①会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系;②了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程2016课标全国Ⅲ,18,12分相关系数与回归方程折线统计图★★☆2017课标全国Ⅰ,19,12分相关系数数字特征独立性检验了解独立性检验的基本思想、方法及其简单应用,能通过计算判断两个变量的相关程度2019课标全国Ⅰ,17,12分独立性检验用频率估计概率★★☆2017课标全国Ⅱ,19,12分频率分布直方图与独立性检验用频率估计概率2018课标全国Ⅲ,18,12分茎叶图与独立性检验样本的数字特征分析解读从近几年的高考试题来看,本部分在高考中的考查点如下:1.主要考查分层抽样的定义、频率分布直方图、平均数、方差的计算、识图能力及借助概率知识分析、解决问题的能力;2.在频率分布直方图中,注意小矩形的竖直方向的长度=频率/组距,小矩形的面积为频率,所有小矩形的面积之和为1;3.分析两个变量间的相关关系,通过独立性检验判断两个变量是否相关.本节内容在高考中分值为17分左右,属中档题.破考点练考向【考点集训】考点一抽样方法1.(2019河南部分省示范性高中1月份联考,7)某学校为落实学生掌握社会主义核心价值观的情况,用系统抽样的方法从全校2 400名学生中抽取30人进行调查.现将2 400名学生随机地从1~2 400编号,按编号顺序平均分成30组(1~80号,81~160号,……,2 321~2 400号),若第3组与第4组抽出的号码之和为432,则第6组抽到的号码是()A.416B.432C.448D.464答案A2.(2018安徽安庆一中、山西太原五中等五省六校(K12联盟)期末联考,3)某中学有高中生960人,初中生480人,为了了解学生的身体状况,采用分层抽样的方法,从该校学生中抽取容量为n的样本,其中高中生有24人,那么n等于()A.12B.18C.24D.36答案D考点二统计图表1.(2019广东东莞第二次调研考试,3)有24名投资者想到某地投资,他们年龄的茎叶图如图所示,先将他们的年龄从小到大编号为1—24号,再用系统抽样方法抽出6名投资者,邀请他们到实地进行考察.其中年龄不超过55岁的人数为()3940112551366778889600123345A.1B.2C.3D.4答案B2.(多选题)(2020届山东夏季高考模拟,9)下图为某地区2006年—2018年地方财政预算内收入、城乡居民储蓄年末余额折线图.根据该折线图可知,该地区2006年—2018年()A.财政预算内收入、城乡居民储蓄年末余额均呈增长趋势B.财政预算内收入、城乡居民储蓄年末余额的逐年增长速度相同C.财政预算内收入年平均增长量高于城乡居民储蓄年末余额年平均增长量D.城乡居民储蓄年末余额与财政预算内收入的差额逐年增大答案AD考点三样本的数字特征1.(2018湖北华师一附中月考,3)某人到甲、乙两市各7个小区调查空置房情况,将调查得到的小区空置房的套数绘成了如图所示的茎叶图,则调查中甲市空置房套数的中位数与乙市空置房套数的中位数之差为()A.4B.3C.2D.1答案B2.(2018山东济南一模,3)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x ,方差为s 2,则( ) A.x =4,s 2<2 B.x =4,s 2>2 C.x >4,s 2<2 D.x >4,s 2>2答案 A考点四 变量间的相关性1.(2018河南焦作四模,3)已知变量x 和y 的统计数据如下表:x 3 4 5 6 7 y2.5344.56根据上表可得回归直线方程为y ^=b ^x-0.25,据此可以预测当x=8时,y ^=( ) A.6.4 B.6.25 C.6.55 D.6.45答案 C2.(2018湖南张家界三模,4)已知变量x,y 之间的线性回归方程为y ^=-0.7x+10.3,且变量x,y 之间的一组相关数据如下表所示,则下列说法错误..的是( ) x 6 8 10 12 y6m32A.变量x,y 之间成负相关关系B.可以预测,当x=20时,y ^=-3.7 C.m=4D.该回归直线必过点(9,4) 答案 C考点五独立性检验(2018贵州六校12月联考,18)海南大学某餐饮中心为了解新生的饮食习惯,在全校新生中进行了抽样调查,调查结果如下表所示:喜欢甜品不喜欢甜品合计南方学生602080北方学生101020合计7030100(1)根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”?(2)已知在被调查的北方学生中有5名中文系的学生,其中2名喜欢甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率.P(K2≥k0)0.100.050.010k0 2.706 3.841 6.635附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).答案(1)将2×2列联表中的数据代入公式计算,得K2=100×(60×10-20×10)270×30×80×20=10021≈4.762.由于4.762>3.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.(2)从5名中文系学生中任取3人的所有可能结果所组成的基本事件空间Ω={(a1,a2,b1),(a1,a2,b2),(a1,a2,b3),(a1,b1,b2),(a1,b1,b3),(a1,b2,b3),(a2,b1,b2),(a2,b1,b3),(a2,b2,b3),(b1,b2,b3)},其中a i表示喜欢甜品的学生,i=1,2,b j表示不喜欢甜品的学生,j=1,2,3.Ω由10个基本事件组成,且这些基本事件的出现是等可能的.用A表示“3人中至多有1人喜欢甜品”这一事件,则A={(a1,b1,b2),(a1,b1,b3),(a1,b2,b3),(a2,b1,b2),(a2,b1,b3),(a2,b2,b3),(b1,b2,b3)}.事件A由7个基本事件组成,因而P(A)=710.炼技法提能力【方法集训】方法1 解与频率分布直方图有关问题的方法1.(2016山东,3,5分)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140答案D2.(2020届广西桂林十八中模拟,18)某家电公司销售部门共有200名销售员,每年部门对每名销售员都有1 400万元的年度销售任务.已知这200名销售员去年完成的销售额在区间[2,22](单位:百万元)内,现将其分成5组:第1组、第2组、第3组、第4组、第5组对应的区间分别为[2,6),[6,10),[10,14),[14,18),[18,22),并绘制出频率分布直方图,如图.(1)若用分层抽样的方法从这200名销售员中抽取容量为25的样本,求a的值和样本中完成年度任务的销售员人数;(2)从(1)中样本内完成年度任务的销售员中随机选取2名,奖励海南三亚三日游,求获得此奖励的2名销售员在同一组的概率.答案(1)∵(0.02+0.08+0.09+2a)×4=1,∴a=0.03.∴样本中完成年度任务的人数为200×0.03=6.(2)样本中完成年度任务的销售员中,第4组有3人,记这3人分别为A1,A2,A3;第5组有3人,记这3人分别为B1,B2,B3,从这6人中随机抽取2名,所有的基本事件为A1A2,A1A3,A1B1,A1B2,A1B3,A2A3,A2B1,A2B2,A2B3,A3B1,A3B2,A3B3,B1B2,B1B3,B2B3,共15个,获得此奖励的2名销售员在同一组的基本事件分别为A1A2,A1A3,A2A3,B1B2,B1B3,B2B3,共6个,故所求概率为615=25 .方法2 样本的数字特征的求解及其应用1.(2015山东,6,5分)为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的编号为()A.①③B.①④C.②③D.②④答案B2.(2018四川德阳模拟,13)为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(10分制)的频数分布直方图如图所示,如果得分的中位数为a,众数为b,平均数为c,则a、b、c中的最大者是.答案 c方法3 回归直线方程的求解与运用1.(2020届河南南阳第一中学模拟,1)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i=1,2,…,n)都在直线y=-15x+1上,则这组样本数据的样本相关系数为( ) A.-1B.1C.-15D.15答案 A2.(2018湘东五校12月联考,18)某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:日期 1月10日 2月10日 3月10日 4月10日 5月10日 6月10日 昼夜温 差x(℃) 10 11 13 12 8 6 就诊人 数y222529261612该兴趣小组确定的研究方案是:先从这六组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验. (1)求选取的2组数据恰好是相邻两个月数据的概率;(2)若选取的是1月与6月的两组数据,请根据2至5月份的数据求出y 关于x 的线性回归方程y ^=b ^x+a ^;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想? 参考公式:b ^=∑i=1nx i y i -nx y ∑i=1nx i 2-nx2=∑i=1n(x i -x)(y i -y)∑i=1(x i -x)2,a ^=y -b ^x ;参考数据:11×25+13×29+12×26+8×16=1 092,112+132+122+82=498.答案 (1)设抽到相邻两个月的数据为事件A.因为从6组数据中选取2组数据共有15种情况,每种情况都是等可能出现的,其中,抽到相邻两个月的数据的情况有5种,所以P(A)=515=13.(2)由题表中数据求得x =11,y =24,由公式求得b ^=187,则a ^=y -b ^x =-307,所以y 关于x 的线性回归方程为y ^=187x-307.(3)由(2)知,当x=10时,y ^=1507,|1507-22|<2,当x=6时,y ^=787,|787-12|<2, 所以,该小组所得线性回归方程是理想的.方法4 独立性检验的思想方法(2018山西太原五中模拟,18)网购是当前民众购物的新方式,某公司为改进营销方式,随机调查了100名市民,统计其周平均网购的次数,并整理得到如图所示的频数直方图.这100名市民中,年龄不超过40岁的有65人.将所抽样中周平均网购次数不少于4次的市民称为网购迷,且已知其中有5名市民的年龄超过40岁.(1)根据已知条件完成下面的2×2列联表,能否在犯错的概率不超过0.10的前提条件下认为网购迷与年龄不超过40岁有关?网购迷非网购迷合计年龄不超过40岁 年龄超过40岁合计(2)现将所抽取样本中周平均网购次数不少于5次的市民称为超级网购迷,且已知超级网购迷中有2名年龄超过40岁,若从超级网购迷中任意挑选2名,求至少有1名市民年龄超过40岁的概率. 附:K 2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d).答案 (1)根据已知条件完成2×2列联表如下:网购迷 非网购迷 合计 年龄不超过40岁 20 45 65 年龄超过40岁5 30 35 合计2575100K 2=100×(20×30-5×45)225×75×65×35≈3.297,因为3.297>2.706,所以据此列联表判断,在犯错误的概率不超过0.10的前提下,认为网购迷与年龄不超过40岁有关.(2)由频数分布直方图知,超级网购迷共有10人,记其中年龄超过40岁的2名市民为A 、B,其余8名市民记为c 、d 、e 、f 、g 、h 、m 、n,现从10人中任取2人,基本事件有AB 、Ac 、Ad 、Ae 、Af 、Ag 、Ah 、Am 、An 、Bc 、Bd 、Be 、Bf 、Bg 、Bh 、Bm 、Bn 、cd 、ce 、cf 、cg 、ch 、cm 、cn 、de 、df 、dg 、dh 、dm 、dn 、ef 、eg 、eh 、em 、en 、fg 、fh 、fm 、fn 、gh 、gm 、gn 、hm 、hn 、mn,共有45种,其中至少有1名市民年龄超过40岁的基本事件有AB 、Ac 、Ad 、Ae 、Af 、Ag 、Ah 、Am 、An 、Bc 、Bd 、Be 、Bf 、Bg 、Bh 、Bm 、Bn,共17种,故所求的概率P=1745.【五年高考】A 组 统一命题·课标卷题组考点一 抽样方法1.(2019课标全国Ⅰ,6,5分)某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是()A.8号学生B.200号学生C.616号学生D.815号学生答案C2.(2018课标全国Ⅲ,14,5分)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是.答案分层抽样考点二统计图表1.(2018课标全国Ⅰ,3,5分)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案A2.(2017课标全国Ⅲ,3,5分)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳答案A3.(2015课标Ⅱ,3,5分)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关答案D4.(2018课标全国Ⅰ,19,12分)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)[0.6,0.7)频数13249265使用了节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)频数151310165(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图;(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水.(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表) 答案(1)(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35 m3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为x1=1×(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.50该家庭使用了节水龙头后50天日用水量的平均数为x2=1×(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.50估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3).考点三样本的数字特征1.(2019课标全国Ⅲ,4,5分)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为()A.0.5B.0.6C.0.7D.0.8答案C2.(2017课标全国Ⅰ,2,5分)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数答案B3.(2019课标全国Ⅲ,17,12分)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).答案本题主要考查频率分布直方图的含义,以及用频率分布直方图估计样本的数字特征,通过实际问题的应用考查学生的运算求解能力,考查了数学运算的核心素养,体现了应用意识.(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.4.(2019课标全国Ⅱ,19,12分)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.y的分组[-0.20,0)[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80)企业数22453147(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:√74≈8.602.答案本题考查了统计的基础知识、基本思想和方法,考查学生对频数分布表的理解与应用,考查样本的平均数,标准差等数字特征的计算方法,以及对现实社会中实际数据的分析处理能力.(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为14+7100=0.21.产值负增长的企业频率为2100=0.02.用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)y=1100(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,s2=1100∑i=15n i(y i-y)2=1100[2×(-0.40)2+24×(-0.20)2+53×02+14×0.202+7×0.402]=0.029 6,s=√0.029 6=0.02×√74≈0.17.所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.考点四变量间的相关性1.(2017课标全国Ⅰ,19,12分)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:抽取次序12345678零件尺寸9.9510.129.969.9610.019.929.9810.04抽取次序910111213141516零件尺寸10.269.9110.1310.029.2210.0410.059.95经计算得x=116∑i=116x i=9.97,s=√116∑i=116(x i-x)2=√116(∑i=116x i2-16x2)≈0.212,√∑i=116(i-8.5)2≈18.439,∑i=116(x i-x)(i-8.5)=-2.78,其中x i为抽取的第i个零件的尺寸,i=1,2, (16)(1)求(x i,i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);(2)一天内抽检零件中,如果出现了尺寸在(x-3s,x+3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(i)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(ii)在(x-3s,x+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01) 附:样本(x i,y i)(i=1,2,…,n)的相关系数r=∑i=1n(x -x)(y -y)√∑i=1(x i -x)2√∑i=1(y i -y)2.√0.008≈0.09.答案 (1)由样本数据得(x i ,i)(i=1,2,…,16)的相关系数为r=∑i=116(x i -x)(i -8.5)√∑i=1(x i -x)2√∑i=1(i -8.5)2=-2.780.212×√16×18.439≈-0.18.由于|r|<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)(i)由于x =9.97,s ≈0.212,由样本数据可以看出抽取的第13个零件的尺寸在(x -3s,x +3s)以外,因此需对当天的生产过程进行检查.(ii)剔除离群值,即第13个数据,剩下数据的平均数为115×(16×9.97-9.22)=10.02, 这条生产线当天生产的零件尺寸的均值的估计值为10.02.∑i=116x i 2=16×0.2122+16×9.972≈1 591.134,剔除第13个数据,剩下数据的样本方差为115×(1 591.134-9.222-15×10.022)≈0.008, 这条生产线当天生产的零件尺寸的标准差的估计值为√0.008≈0.09.2.(2016课标全国Ⅲ,18,12分)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明;(2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注:参考数据:∑i=17y i =9.32,∑i=17t i y i =40.17,√∑i=17(y i -y)2=0.55,√7≈2.646.参考公式:相关系数r=∑i=1n(t i -t)(y -y)√∑i=1(t i -t)2∑i=1(i -y)2,回归方程y ^=a ^+b ^t 中斜率和截距最小二乘估计公式分别为:b ^=∑i=1n(t i -t)(y i -y)∑i=1n(t i -t)2,a ^=y -b ^t .答案 (1)由折线图中数据和附注中参考数据得t =4,∑i=17(t i -t )2=28,√∑i=17(y i -y)2=0.55,∑i=17(t i -t )(y i -y )=∑i=17t i y i -t ∑i=17y i =40.17-4×9.32=2.89,r ≈2.890.55×2×2.646≈0.99.(4分)因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(6分)(2)由y =9.327≈1.331及(1)得b ^=∑i=17(t i -t)(y i -y)∑i=17(t i -t)2=2.8928≈0.10,a ^=y -b ^t =1.331-0.10×4≈0.93.所以y 关于t 的回归方程为y ^=0.93+0.10t.(10分)将2016年对应的t=9代入回归方程得:y ^=0.93+0.10×9=1.83. 所以预测2016年我国生活垃圾无害化处理量将约为1.83亿吨.(12分)考点五 独立性检验1.(2019课标全国Ⅰ,17,12分)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意 不满意 男顾客 40 10 女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异? 附:K 2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d).P(K 2≥k) 0.050 0.010 0.001 k3.8416.63510.828答案 本题通过对概率与频率的关系、统计案例中两变量相关性检验考查学生的抽象概括能力与数据处理能力,重点考查数学抽象、数据分析、数学运算的核心素养;倡导学生关注生活,提高数学应用意识.(1)由调查数据,男顾客中对该商场服务满意的比率为4050=0.8,因此男顾客对该商场服务满意的概率的估计值为0.8. 女顾客中对该商场服务满意的比率为3050=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6.(2)K 2=100×(40×20-30×10)250×50×70×30≈4.762.由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.2.(2018课标全国Ⅲ,18,12分)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高,并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m 和不超过m 的工人数填入下面的列联表;超过m不超过m第一种生产方式 第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异? 附:K 2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d),P(K 2≥k) 0.050 0.010 0.001 k 3.841 6.635 10.828.答案 (1)第二种生产方式的效率更高. 理由如下:(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟.因此第二种生产方式的效率更高.(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分. (2)由茎叶图知m=79+812=80. 列联表如下:超过m 不超过m 第一种生产方式 15 5 第二种生产方式515(3)由于 K 2=40×(15×15-5×5)220×20×20×20=10>6.635,所以有99%的把握认为两种生产方式的效率有差异.3.(2017课标全国Ⅱ,19,12分)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:。
二、统计图表的应用题型分析【一】频率分布直方图在频率分布直方图中:频率卷文数120)图1 A类工人生产能力的频率分布直方图图2 B类工人生产能力的频率分布直方图(ii)分别估计A类工人和B类工人生产能力的平均数,并估计该工厂工人的生产能力的平均数(同一组中的数据用该组区间的中点值作代表).【练习2】某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),┄,[80,90],并整理得到如下频率分布直方图:(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.【练习3】某校从高一年级学生中随机抽取40名学生,将他们的期中考试数学成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,…,后得到如图的频率分布直方图.天的销售量(单位:树苗比乙种树苗长得整齐.甲种树苗的高度的中位数大于乙种树苗高度的中位数,但乙种于一条光滑曲线,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域两个变量的关系可通过它们所对应的点在平面上表现出来,这些点对应的图形叫做散点图.根据该折线图,下列结论错误的是.月接待游客量逐月增加条形表示的学生人数依次记为图1 图2A 2、…、A m (如A 2表示身高(单位:cm)在[150,155)内的学生人数).图2是统计图1中身高在一定范围内学生人数的一个算法流程图.现要统计身高在160~180cm(含160cm ,不含180cm)的学生人数,那么在流程图中的判断框内应填写的条件是______.2.巩固提升综合练习【练习1】是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即日均值在2.5PM 2.5PM 以下空气质量为一级,在空气量为二级,超过为超标.如图是某335/g m μ335~75/g m μ375/g m μ地12月1日至10日的(单位:)的日均值,则下列说法不正确的是( )2.5PM 3/g m μA .这天中有天空气质量为一级 103B .从日到日日均值逐渐降低 69 2.5PMC .这天中日均值的中位数是 10 2.5PM 55D .这天中日均值最高的是月日 10 2.5PM 126【练习2】 某学校为了了解本校学生的上学方式,在全校范围内随机抽查部分学生,了解到上学方式主要有:A 结伴步行,B 自行乘车,C 家人接送,D 其他方式,并将收集的数据整理绘制成如下两幅不完整的统计图.根据图中信息,可知本次抽查的学生中A 类人数是( )A.30B.40C.42D.48【练习3】某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A 点表示十月的平均最高气温约为15℃,B 点表示四月的平均最低气温约为5℃.下面叙述不正确的是A .各月的平均最低气温都在0℃以上B .七月的平均温差比一月的平均温差大C .三月和十一月的平均最高气温基本相同年的家庭总收入为80000元,各种用途占比统计如下面的折线图2018年的就医费用比2017年增加了4750B.95000元C.90000D.85000元某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如则下面结论中不正确的是(),制成了如图所示的频率分布直方图,其中,位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级中的排名情况如下,甲、乙、丙为该班三位学生.①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是10:40记作(3)312331根据以上茎叶图,对甲、乙两品种棉花的纤维长度作比较,写出两个统计结论:_________________________________________________________________________ __________________________________________________________________________ _________________________________________________________________________ __________________________________________________________________________0.12.300 000×0.12图1 A 类工人生产能力的频率分布直方图图2 B 类工人生产能力的频率分布直方图类工人中个体间的差异程度更小.123145253135255125255115=⨯+⨯+⨯⋅+,8.13314575181357536=⨯+⨯+1.1318.133=.类工人生产能力的平均数,B 类工人生产能力的平均数以及全厂工人生产能力的平均数的估计值分由频率分布直方图知, 0.04100.4⨯=,由于该校高一年级共有学生内的频】【答案】【解析】 根据折线图可知,9日天中5个,根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35的频率为3m 0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35的概率的估计值为0.483m 该家庭未使用节水龙头50天日用水量的平均数为甲品种棉花的纤维长度较乙品种棉花的纤维长度更分散。
专题十概率、统计问题二:统计图表的应用一、考情分析统计图表有频率分布直方图、茎叶图、折线图、条形图、饼形图、雷达图等,它们广泛应用于实际生活之中,也是历年高考的热点,求解此类的关键是由图表读出有用的数据,再根据数据进行分析.二、经验分享1.明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为1.学科-网2.对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据.由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.3.频率分布直方图是高考考查的热点,考查频率很高,题型有选择题、填空题,也有解答题,难度为低中档.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.三、知识拓展统计图是利用点、线、面、体等绘制成几何图形,以表示各种数量间的关系及其变动情况的工具。
表现统计数字大小和变动的各种图形总称。
其中有条形统计图、扇形统计图、折线统计图、象形图等。
在统计学中把利用统计图形表现统计资料的方法叫做统计图示法。
其特点是:形象具体、简明生动、通俗易懂、一目了然。
其主要用途有:表示现象间的对比关系;揭露总体结构;检查计划的执行情况;揭示现象间的依存关系,反映总体单位的分配情况;说明现象在空间上的分布情况。
一般采用直角坐标系.横坐标用来表示事物的组别或自变量x,纵坐标常用来表示事物出现的次数或因变量y;或采用角度坐标(如圆形图)、地理坐标(如地形图)等。
按图尺的数字性质分类,有实数图、累积数图、百分数图、对数图、指数图等;其结构包括图名、图目(图中的标题)、图尺(坐标单位)、各种图线(基线、轮廓线、指导线等)、图注(图例说明、资料来源等)等。
折叠基本用途统计图一般由图形、图号、图目、图注等组成。
在行政职业能力测验中常见的有条形统计图、扇型统计图、折线统计图和网状统计图。
基本类型(1)条形统计图:又称直条图,表示独立指标在不同阶段的情况,有两维或多维,图例位于右上方。
(2)扇形统计图:描述百分比(构成比)的大小,用颜色或各种图形将不同比例表达出来。
(3)折线统计图:用线条的升降表示事物的发展变化趋势,主要用于计量资料,描述两个变量间关系。
(4)半对数线图:纵轴用对数尺度,描述一组连续性资料的变化速度及趋势。
(5)直方图:描述计量资料的频数分布。
(6)散点图:描述两种现象的相关关系。
(7)统计地图:描述某种现象的地域分布。
条形图用一个单位长度(如1厘米)表示一定的数量,根据数量的多少,画成长短相应成比例的直条,并按一定顺序排列起来,这样的统计图,称为条形统计图。
条形统计图可以清楚地表明各种数量的多少。
条形图是统计图资料分析中最常用的图形。
按照排列方式的不同,可分为纵式条形图和横式条形图;按照分析作用的不同,可分为条形比较图和条形结构图。
条形统计图的特点:(1)能够使人们一眼看出各个数据的大小。
(2)易于比较数据之间的差别。
(3)能清楚的表示出数量的多少。
扇形图以一个圆的面积表示事物的总体,以扇形面积表示占总体的百分数的统计图,叫作扇形统计图。
也叫作百分数比较图。
扇形统计图可以比较清楚地反映出部分与部分、部分与整体之间的数量关系。
扇形统计图的特点:(1)用扇形的面积表示部分在总体中所占的百分比。
(2)易于显示每组数据相对于总数的大小。
折线图折线统计图以折线的上升或下降来表示统计数量的增减变化的统计图,叫作折线统计图。
与条形统计图比较,折线统计图不仅可以表示数量的多少,而且可以反映同一事物在不同时间里的发展变化的情况。
折线图在生活中运用的非常普遍,虽然它不直接给出精确的数据,但只要掌握了一定的技巧,熟练运用"坐标法"也可以很快地确定某个具体的数据。
折线统计图的特点: (1)能够显示数据的变化趋势,反映事物的变化情况。
网状图网状统计图的特点是:母代表的意义,在具体的答题过程中就可以脱离字母,较简便找出答案。
统计图的意义:表示现象间的对比关系;揭露总体结构;检查计划的执行情况;揭示现象间的依存关系,反映总体单位的分配情况;说明现象在空间上的分布情况。
茎叶统计图茎叶图又称"枝叶图",它的思路是将数组中的数按位数进行比较,将数的大小基本不变或变化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少。
茎叶图有三列数:左边的一列数统计数,它是上(或下)向中心累积的值,中心的数(带括号)表示最多数组的个数;中间的一列表示茎,也就是变化不大的位数;右边的是数组中的变化位,它是按照一定的间隔将数组中的每个变化的数一一列出来,象一条枝上抽出的叶子一样,所以人们形象地叫它茎叶图。
茎叶图是一个与直方图相类似的特殊工具,但又与直方图不同,茎叶图保留原始资料的资讯,直方图则失去原始资料的讯息。
将茎叶图茎和叶逆时针方向旋转90度,实际上就是一个直方图,可以从中统计出次数,计算出各数据段的频率或百分比。
从而可以看出分布是否与正态分布或单峰偏态分布逼近。
茎叶图在质量管理上用途与直方图差不多,但它通常是作为更细致的分析阶段使用。
由于它是用数字组成直方图,所以在做的时候比直方图时,通常我们常使用专业的软件进行绘制。
茎叶图的特征1、用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。
2、茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观、清晰。
统计图的意义:表示现象间的对比关系;揭露总体结构;检查计划的执行情况;揭示现象间的依存关系,反映总体单位的分配情况;说明现象在空间上的分布情况。
学科网网状统计图的特点是这类统计图中只有一些字母,字母所代表的意义都在题外,在答题前必弄清这些字母代表的意义,在具体的答题过程中就可以脱离字母,较简便地得出答案。
统计表是由纵横交叉线条所绘制的表格来表现统计资料的一种形式.根据《中国小学教学百科全书》介绍,它是用原始数据制成的一种表格.为了实际需要,人们常常要把工农业生产、科学技术和日常工作中所得到的相互关联的数据,按照一定的要求进行整理、归类,并按照一定的顺序把数据排列起来,制成表格,这种表格叫做统计表.它的作用是:①用数量说明研究对象之间的相互关系.②用数量把研究对象之间的变化规律显著地表示出来.③用数量把研究对象之间的差别显著地表示出来.这样便于人们用来分析问题和研究问题.统计表的形式繁简不一,通常按项目的多少,分为单式统计表和复式统计表两种.只对某一个项目的数据进行统计的表格,叫做单式统计表,也叫做简单统计表.统计项目在两个或两个以上的统计表格,叫做复式统计表.统计表的内容一般都包括总标题、横标题、纵标题、数字资料、单位、制表日期.总标题是指表的名称,它要能简单扼要地反映出表的主要内容,横标题是指每一横行内数据的意义;纵标题是指每一纵栏内数据的意义;数字资料是指各空格内按要求填写的数字;单位是指表格里数据的计量单位.在数据单位相同时,一般把单位放在表格的左上角.如果各项目的数据单位不同时,可放在表格里注明.制表日期放在表的右上角,表明制表的时间.各种统计表都应有"备考"或"附注"栏,以便必要时填入不属于表内各项的事实或说明.直方图直方图(Histogram)又称柱状图、质量分布图。
是一种统计报告图,由一系列高度不等的纵向条纹或线段表示数据分布的情况。
一般用横轴表示数据类型,纵轴表示分布情况。
直方图法的涵义在质量管理中,如何预测并监控产品质量状况?如何对质量波动进行分析?直方图就是一目了然地把这些问题图表化处理的工具。
它通过对收集到的貌似无序的数据进行处理,来反映产品质量的分布情况,判断和预测产品质量及不合格率。
直方图又称质量分布图,柱状图,它是表示资料变化情况的一种主要工具。
用直方图可以的资料,解析出规则性,比较直观地看出产品质量特性的分布状态,对於资分布状况一目了然,便於判断其总体质量分布情况。
在制作直方图时,牵涉学的概念,首先要对资料进行分组,因此如何合理分组是其中的关键问题。
按组距相等的原则进行的两个关键数位是分组数和组距。
是一种几何形图表,它是根据从生产过程中收集来的质量数据分布情况,画成以组距为底边、以频数为高度的一系列连接起来的直方型矩形图,如图所示。
作直方图的目的就是通过观察图的形状,判断生产过程是否稳定,预测生产过程的质量。
具体来说,作直方图的目的有:①判断一批已加工完毕的产品;②验证工序的稳定性;③为计算工序能力搜集有关数据。
直方图将数据根据差异进行分类,特点是明察秋毫地掌握差异。
直方图的绘制方法①集中和记录数据,求出其最大值和最小值。
数据的数量应在100个以上,在数量不多的情况下,至少也应在50个以上。
我们把分成组的个数称为组数,每一个组的两个端点的差称为组距。
②将数据分成若干组,并做好记号。
分组的数量在6-20之间较为适宜。
③计算组距的宽度。
用组数去除最大值和最小值之差,求出组距的宽度。
④计算各组的界限位。
各组的界限位可以从第一组开始依次计算,第一组的下界为最小值减去最小测定单位的一半,第一组的上界为其下界值加上组距。
第二组的下界限位为第一组的上界限值,第二组的下界限值加上组距,就是第二组的上界限位,依此类推。
⑤统计各组数据出现频数,作频数分布表。
⑥作直方图。
以组距为底长,以频数为高,作各组的矩形图。
四、题型分析(一)频率分布直方图【例1】某校高二(16)班共有50人,如图是该班在四校联考中数学成绩的频率分布直方图,则成绩在内的学生人数为( )A. 36B. 25C. 22D. 11【答案】B【分析】根据频率分别直方图的性质,求得,进而求得在之间的概率,即可求解其人数.【点评】本题主要考查了用样本估计总体,独立性检验的应用,其中对于用样本估计总体主要注意以下两个方面:1、用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法.分布表在数量表示上比较准确,直方图比较直观;2、频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.【小试牛刀】【黑龙江省大庆市2018届高三第二次教学质量检测】下面是追踪调查200个某种电子元件寿命(单位:)频率分布直方图,如图:其中300-400、400-500两组数据丢失,下面四个说法中有且只有一个与原数据相符,这个说法是( )①寿命在300-400的频数是90;②寿命在400-500的矩形的面积是0.2;③用频率分布直方图估计电子元件的平均寿命为:④寿命超过的频率为0.3A. ①B. ②C. ③D. ④【答案】B【解析】若①正确,则对应的频率为,则对应的频率为,则②错误;电子元件的平均寿命为,则③正确;寿命超过的频率为,则④正确,故不符合题意;若②正确,则对应的频率为,则①错误;电子元件的平均寿命为,则③错误;寿命超过的频率为,则④错误,故符合题意.故选B.(二)茎叶图【例2】【福建省南平市2018届高三第二次(5月)综合质量检查】五四青年节活动中,高三(1)、(2)班都进行了3场知识辩论赛,比赛得分情况的茎叶图如图所示(单位:分),其中高三(2)班得分有一个数字被污损,无法确认,假设这个数字x具有随机性,那么高三(2)班的平均得分大于高三(1)班的平均得分的概率为()A. 34B.13C.35D.25【答案】D【分析】由高三(2)班的平均得分大于高三(1)班的平均得分,求得x取值范围,再根据古典概形求得概率。