高考数学易错题10.2 统计图表的应用-2019届高三数学提分精品讲义
- 格式:doc
- 大小:1.70 MB
- 文档页数:23
问题41 统计图表的应用一、考情分析统计图表有频率分布直方图、茎叶图、折线图、条形图、饼形图、雷达图等,它们广泛应用于实际生活之中,也是历年高考的热点,求解此类的关键是由图表读出有用的数据,再根据数据进行分析.二、经验分享1.明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为1.2.对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据.由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.3.频率分布直方图是高考考查的热点,考查频率很高,题型有选择题、填空题,也有解答题,难度为低中档.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.三、知识拓展统计图是利用点、线、面、体等绘制成几何图形,以表示各种数量间的关系及其变动情况的工具。
表现统计数字大小和变动的各种图形总称。
其中有条形统计图、扇形统计图、折线统计图、象形图等。
在统计学中把利用统计图形表现统计资料的方法叫做统计图示法。
其特点是:形象具体、简明生动、通俗易懂、一目了然。
其主要用途有:表示现象间的对比关系;揭露总体结构;检查计划的执行情况;揭示现象间的依存关系,反映总体单位的分配情况;说明现象在空间上的分布情况。
一般采用直角坐标系.横坐标用来表示事物的组别或自变量x,纵坐标常用来表示事物出现的次数或因变量y;或采用角度坐标(如圆形图)、地理坐标(如地形图)等。
考点28 统计【考点剖析】1.命题方向预测:统计在高考中选择题、填空题、解答题中均有出现,选择题、填空题往往单独考查统计知识,较为容易;解答题常与概率知识放在一块考查,以应用题的面目出现,难度以中档题为主.2.名师二级结论:两个异同(1)众数、中位数与平均数的异同①众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量.②由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变,这是中位数、众数都不具有的性质.③众数考查各数据出现的频率,其大小只与这组数据中的部分数据有关.当一组数据中有不少数据多次重复出现时,其众数往往更能反映问题.④某些数据的变动对中位数可能没有影响.中位数可能出现在所给数据中,也可能不在所给数据中.当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势.(2)标准差与方差的异同标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大;标准差、方差越小,数据的离散程度则越小,因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.三个特征利用频率分布直方图估计样本的数字特征:(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数值.(2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和.(3)众数:最高的矩形的中点的横坐标.正确运用频率分布条形图和直方图,由于总体分布通常不易知道,我们往往用样本的频率分布去估计总体分布,一般地,样本容量越大,估计越精确.要求会作、会用频率分布条形图和直方图.三种抽样方法:在三种抽样中,简单随机抽样是最简单、最基本的抽样方法,其他两种抽样方法是建立在它的基础上的,三种抽样方法的共同点:它们都是等概率抽样,体现了抽样的公平性;三种抽样方法各有其特点和适用范围,在抽样实践中要根据具体情况选用相应的抽样方法.分析两个变量相关关系的常用方法:一是利用散点图进行判断:把样本数据表示的点在平面直角坐标系中作出,从而得到散点图,如果这些点大致分布在通过散点图中心的一条直线附近,那么就说这两个变量之间具有线性相关关系;二是利用相关系数r 进行判断:|r|≤1而且|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小.线性回归方程参考公式: ⎪⎪⎪⎩⎪⎪⎪⎨⎧⋅-=---=∑∑==x b y ax x y y x x b ni i ni i i ˆˆ)())((ˆ121掌握独立性检验的一般步骤: ①根据样本数据制成2×2列联表.②根据公式()()()()22k n ad bc a b c d a c b d -=++++(),计算K2的值.③比较K2与临界值的大小关系作统计推断.【考点分类】考向一 随机抽样1.某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本的老年教师人数为( )A .90B .100C .180D .300 【答案】C【解析】由题意,总体中青年教师与老年教师比例为1600169009=;设样本中老年教师的人数为x ,由分层抽样的性质可得总体与样本中青年教师与老年教师的比例相等,即320169x =,解得180x =,故选C. 2.【2018年全国卷Ⅲ文】某公司有大量客户,且不同龄段客户对其服务的评价有较大差异.为了解客户的评价,10.8287.8796.6355.0243.8412.7062.0721.3230.7080.455k0.0010.0050.0100.0250.050.100.150.250.400.50()2P K k ≥该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.【答案】分层抽样3.【2017江苏,3】某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件.18【答案】【方法总结】统按照预先制定的规则,从每一部分抽取一个个体,得到需要的样本.(2)在利用系统抽样时,经常遇到总体容量不能被样本容量整除的情况,这时可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量整除.考向二频率分布直方图的绘制与应用1.【2018年新课标I卷文】某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表使用了节水龙头50天的日用水量频数分布表(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)【答案】(1)直方图见解析.(2) 0.48.(3).【解析】(1)该家庭使用了节水龙头后50天日用水量的平均数为.估计使用节水龙头后,一年可节省水.2.【2016高考北京文数】某市民用水拟实行阶梯水价,每人用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(I )如果w 为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w 至少定为多少? (II )假设同组中的每个数据用该组区间的右端点值代替,当w=3时,估计该市居民该月的人均水费. 【答案】(Ⅰ)3;(Ⅱ)10.5元.(II )由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:根据题意,该市居民该月的人均水费估计为:40.160.1580.2100.25120.15170.05220.05270.05⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯10.5=(元). 【方法总结】1.频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示频率组距,频率=组距×频率组距.2.频率分布直方图中各小长方形的面积之和为1,因此在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.3.频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.考向三茎叶图的应用1.【2017山东,文8】如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为()A. 3,5B. 5,5C. 3,7D. 5,7【答案】A【解析】2.【2018年江苏卷】已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________.【答案】90【解析】由茎叶图可知,5位裁判打出的分数分别为,故平均数为.【方法总结】由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表试题时,就要充分使用这个图表提供的数据进行相关的计算或者是对某些问题作出判断,这类试题往往伴随着对数据组的平均值或者是方差的计算等.考向四基本数字特征1.【2017课标1,文2】为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数【答案】B【解析】刻画评估这种农作物亩产量稳定程度的指标是标准差,故选B2.【【衡水金卷压轴卷】2018年模拟(二)】现有甲、乙两台机床同时生产直径为的零件,各抽测件进行测量,其结果如下图,则不通过计算从图中数据的变化不能反映的数字特征是()A.极差B.方差C.平均数D.中位数【答案】C【解析】考向五变量的相关性与回归分析1.【2018届安徽省六安市舒城中学仿真(三)】某地级市共有200000中小学生,其中有7%学生在2017年享受了“国家精准扶贫”政策,在享受“国家精准扶贫”政策的学生中困难程度分为三个等次:一般困难、很困难、特别困难,且人数之比为5:3:2,为进一步帮助这些学生,当地市政府设立“专项教育基金”,对这三个等次的困难学生每年每人分别补助1000元、1500元、2000元。
专题13统计易错点一:统计用表中概念不清、识图不准致误(频率分布直方图、总体取值规律)频率分布直方图作频率分布直方图的步骤①求极差:极差为一组数据中最大值与最小值的差.②决定组距与组数将数据分组时,一般取等长组距,并且组距应力求“取整”,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.③将数据分组④列频率分布表各小组的频率=小组频数样本容量.⑤画频率分布直方图纵轴表示频率组距,频率组距实际上就是频率分布直方图中各小长方形的高度,小长方形的面积=组距×频率组距=频率.频率分布直方图的性质①因为小矩形的面积=组距×频率组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.②在频率分布直方图中,各小矩形的面积之和等于1.③频数相应的频率=样本容量.④频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性.易错提醒:频率分布条形图和频率分布直方图是两个完全不同的概念,考生应注意两者之间的区别.虽然它们的横轴表示的内容是相同的,但是频率分布条形图的纵轴表示频率;频率分布直方图的纵轴表示频率与组距的比值,其各小组的频率等于该小组上的矩形的面积.例:如图所示是某公司(共有员工300人)2021年员工年薪情况的频率分布直方图,由此可知,员工中年薪在1.4万元~1.6万元之间的共有______人.易错分析:解本题容易出现的错误是审题不细,对所给图形观察不细心,认为员工中年薪在1.4万元~1.6万元之间的频率为()10.020.080.1020.60-++⨯=,从而得到员工中年薪在1.4万元~1.6万元之间的共有3000.60180⨯=(人)的错误结论.正解:由所给图形,可知员工中年薪在1.4万元~1.6万元之间的频率为()10.020.080.080.100.1020.24-++++⨯=,所以员工中年薪在1.4万元~1.6万元之间的共有3000.2472⨯=(人).故72.易错警示:考生误认为频率分布直方图中纵轴表示的是频率,这是错误的,而是“频率/组距”,所以频率对应的是各矩形的面积.变式1:某大学有男生2000名.为了解该校男生的身体体重情况,随机抽查了该校100名男生的体重,并将这100名男生的体重(单位:kg )分成以下六组:[)54,58、[)58,62、[)62,66、[)66,70、[)70,74、[]74,78,绘制成如下的频率分布直方图:70,78上的男生大约有人.该校体重(单位:kg)在区间[]变式2:现对某类文物进行某种物性指标检测,从1000件中随机抽取了200件,测量物性指标值,得到如下频率分布直方图,据此估计这1000件文物中物性指标值不小于95的件数为.变式3:如图是根据我国部分城市某年6月份的平均气温数据得到的样本频率分布直方图,其中平均气温的范围是[20,26],样本数据的分组为[20,21),[21,22),[22,23),[23,24),[24,25),[25,26].已知样本中平均气温低于22°C的城市个数为11,样本中平均气温不低于25°C的城市个数是.1.已知某班全体学生在某次数学考试中的成绩(单位:分)的频率分布直方图如图所示,则图中a所代表的数值是.2.某校共有400名学生参加了趣味知识竞赛(满分:这400名学生的竞赛成绩分组如下:分布直方图如图所示,则这400名学生中竞赛成绩不低于3.从某小学所有学生中随机抽取100名学生,将他们的身高(单位:图),其中样本数据分组[100,110),[110,120),[120,130),[130,140),[140,150)4.某工厂抽取100件产品测其重量(单位:[[[[,42],据此绘制出如图所示的频率分布直方图,则重量在40,40.5),40.5,41),41,41.5),41.5件数为.5.某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:利用该指标制定一个检测标准,需要确定临界值c ,将该指标大于c 的人判定为阳性,小于或等于定为阴性,此检测标准的漏诊率是将患病者判定为阴性的概率,记为()p c ;误诊率是将未患病者判定为阳性的概率,记为()q c .假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.设函数()()()f c p c q c =+,则函数()f c 在区间[95,105]取得最小值时c =.6.某大学有男生10000名.为了解该校男生的身体体重情况,随机抽查了该校100100名男生的体重(单位:kg )分成以下六组:[)54,58、[)58,62、[)62,66、[66,70kg []7.某中学为了解高三男生的体能情况,通过随机抽样,获得了秒),将数据按照[)11.5,12,[)12,12.5,…8.某工厂对一批产品的长度(单位:mm)进行检验,将抽查的产品所得数据分为五组,整理后得到的频率分布直方图如图所示,若长度在20mm以下的产品有30个,9.某中学为了解学生的数学学习情况,在全体学生中随机抽取30,40成绩,将所得的数据分为7组:[)图,则在被抽取的学生中,该次数学考试成绩不低于10.某区为了解全区12000名高二学生的体能素质情况,测试,并将这1000名的体能测试成绩整理成如下频率分布直方图.根据此频率分布直方图,这平均成绩的估计值为.11.将一个容量为100的样本数据,按照从小到大的顺序分为组号123456频数10161815若第6组的频率是第3组频率的12.节约用水是中华民族的传统美德,某市政府希望在本市试行居民生活用水定额管理,即确定一个合理易错点二:统计中的数字特征的实际意义理解不清楚致误(频率分布直方图特征数考查)众数、中位数、平均数①众数:一组数据中出现次数最多的数.②中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在中间位置的数(或中间两个数的平均数)叫做这组数据的中位数.③平均数:如果n个数x1,x2,…,x n,那么()∑==+++=niinxnxxxnx12111叫做这n个数的平均数.总体集中趋势的估计①平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.②一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;而对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.频率分布直方图中平均数、中位数、众数的求法①样本平均数:可以用每个小矩形底边中点的横坐标与小矩形面积的乘积之和近似代替.②在频率分布直方图中,中位数左边和右边的直方图的面积应相等.③将最高小矩形所在的区间中点作为众数的估计值.易错提醒:利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.例.某班50名学生期中考试数学成绩的频率分布直方图如图所示.根据频率分布直方图,估计该班本次测试众数为.变式1:为响应自己城市倡导的低碳出行,小李上班可以选择自行车,他记录了100次骑车所用时间(单位:分钟),得到频率分布直方图,则骑车时间的众数的估计值是分钟变式2:数学兴趣小组的四名同学各自抛掷骰子5次,分别记录每次骰子出现的点数,四名同学的部分统计结果如下:甲同学:中位数为3,方差为2.8;乙同学:平均数为3.4,方差为1.04;丙同学:中位数为3,众数为3;丁同学:平均数为3,中位数为2.根据统计结果,数据中肯定没有出现点数6的是同学.变式3:以下5个命题中真命题的序号有.①样本数据的数字特征中,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息;②若数据1x ,2x ,3x ,…,n x 的标准差为S ,则数据1ax b +,2ax b +,3ax b +,…,n ax b +的标准差为aS ;③将二进制数(2)11001000转化成十进制数是200;④x 是区间[0,5]内任意一个整数,则满足“3x <”的概率是35.1.2022年11月卡塔尔世界杯如期举行,这是世界足球的一场盛宴.为了了解全民对足球的热爱程度,组委会在某场比赛结束后,随机抽取了1000名观众进行对足球“喜爱度”的调查评分,将得到的分数分成6段:[)70,75,[)75,80,[)80,85,[)85,90,[)90,95,[]95,100,得到如图所示的频率分布直方图.图中部分数据丢失,若已知这1000名观众评分的中位数估计值为87.5,则m=.2.为了普及环保知识,增强环保意识,某中学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为e m ,众数为o m ,平均数为x ,则,,e o m m x 的大小关系是.3.《中国居民膳食指南(2022)》数据显示,学生的体重情况,某机构从该地中学生中随机抽取数据,按[)40,45,[)45,50,[50,55所示.根据调查的数据,估计该地中学生体重的中位数是4.为了解某校高三学生的数学成绩,随机地抽查了该校布直方图如图所示.请根据以上信息,估计该校高三学生数学成绩的中位数为两位)5.2021年某省高考体育百米测试中,成绩全部介于按如下方式分成六组:第一组[12,13该100名考生的成绩的中位数(保留一位小数)是6.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,则时速的众数、中位数的估计值分别为.7.某快递驿站统计了近期每天代收快件的数量,并制成如下图所示的频率分布直方图.则该快递驿站每天代收包裹数量的中位数为8.某质检部门对某新产品的质量指标随机抽取10.某大学天文台随机调查了该校100位天文爱好者的年龄,得到如下样本数据频率分布直方图,则估计该校100名天文爱好者的平均岁数为.11.众数、平均数和中位数都描述了数据的集中趋势,、、分别表示众数、平均数、形态中,m n p12.如图为某工厂工人生产能力频率分布直方图,则估计此工厂工人生产能力的平均值为易错点三:运用数字特征作评价时考虑不周(方差、标准差的求算)方差、标准差①假设一组数据为n x x x x ,,,321,则这组数据的平均数()∑==+++=ni i n x n x x x n x 12111 ,方差为()()()[]()⎪⎪⎭⎫ ⎝⎛-=-=-+-+-=∑∑=2221222212111n ii n i i n x n x n x x n x x x x x x ns ,标准差()211∑=-=ni i x x n s ②若假设一组数据为n x x x x ,,,321,它的平均数为x ,方差为2s ,则一组数据为b ax b ax b ax b ax n ++++ ,,,321,的平均数为b x a +,方差为22s a 。
1.(2018年全国新课标I卷理)某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:则下面结论中不正确的是A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半【答案】A【解析】设新农村建设前的收入为M,而新农村建设后的收入为2M,则新农村建设前种植收入为0.6M,而新农村建设后的种植收入为0.74M,所以种植收入增加了,所以A 项不正确;新农村建设前其他收入为0.04M,新农村建设后其他收入为0.1M,故增加了一倍以上,所以B项正确;新农村建设前,养殖收入为0.3M,新农村建设后为0.6M,所以增加了一倍,所以C项正确;新农村建设后,养殖收入与第三产业收入的综合占经济收入的,所以超过了经济收入的一半,所以D正确;故选A.2.某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15℃,B点表示四月的平均最低气温约为5℃.下面叙述不正确的是A.各月的平均最低气温都在0℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20℃的月份有5个【答案】D【易错警示】解答本题时易错可能有两种:(1)对图形中的线条认识不明确,不知所措,只觉得是两把雨伞重叠在一起,找不到解决问题的方法;(2)估计平均温差时易出现错误,错选B.3.某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳【解析】由折线图,可知每年7月到8月折线图呈下降趋势,月接待游客量减少,A错误;折线图整体呈现出增长的趋势,年接待游客量逐年增加,B正确;每年的接待游客量7,8月份达到最高点,即各年的月接待游客量高峰期大致在7,8月,C正确;每年1月至6月的月折线图平稳,月接待游客量波动性更小,7月至12月折线图不平稳,月接待游客量波动性大,D正确.所以选A.【名师点睛】用样本估计总体时统计图表主要有:1.频率分布直方图,特点:频率分布直方图中各小长方形的面积等于对应区间的频率,所有小长方形的面积之和为1;2.频率分布折线图,连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.3. 茎叶图,对于统计图表类题目,最重要的是认真观察图表,从中提炼出有用的信息和数据.4.某中学进行初中与高中各年级的期末考试,该校共有50个考场,每个考场有30个考生,每个考生的座位号按1~30号随机编排,每个考场抽取座位号为18号考生的试卷进行评分,这种抽样方法是A.简单随机抽样B.系统抽样C.分层抽样D.分组抽样【答案】B5.对两个变量进行线性回归分析,计算得到相关系数,则下列说法中正确的是A.与正相关B.与具有较强的线性相关关系C.与几乎不具有线性相关关系D.与的线性相关关系还需进一步确定【答案】B【解析】由可知, 与负相关,并且具有较强的线性相关关系,故选B.6.福利彩票“双色球”中红色球的号码由编号为01,02,…,33的33个个体组成,某彩民利用下面的随机数表选取6组数作为6个红色球的编号,选取方法是从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出来的第6个红色球的编号为A.23 B.09C.17 D.027.某疾病研究所想知道吸烟与患肺病是否有关,于是随机抽取1000名成年人调查是否吸烟及是否患有肺病,得到2×2列联表,经计算得,已知在假设吸烟与患肺病无关的前提条件下,,则该研究所可以A.有95%以上的把握认为“吸烟与患肺病有关”B.有95%以上的把握认为“吸烟与患肺病无关”C.有99%以上的把握认为“吸烟与患肺病有关”D.有99%以上的把握认为“吸烟与患肺病无关”【答案】A【解析】由独立性检验的结论结合题意可知:有95%以上的把握认为“吸烟与患肺病有关”.故选A. 8.某市疾病控制中心对某校高二学生进行了某项健康调查,调查的方法是采取分层抽样的方法抽取样本.我校高二学生共有2000人,抽取了一个200人的样本,其中男生103人,请问该校共有女生A.970人B.1030人C.997人D.206人【答案】A【解析】因为样本容量为200,其中女生人数为200-103=97,且分层抽样的抽取比例为,所以该校的女生总人数为97÷=970.故选A.9.如图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,则甲、乙两人这几场比赛得分的中位数之和是A.51 B.58C.61 D.62【答案】D【解析】由茎叶图可知,甲的这几场比赛得分的中位数为27,乙的这几场比赛得分的中位数为35, 所以甲、乙两人这几场比赛得分的中位数之和是27+35=62.10.已知一组数据3,5,7,x,10的平均数为6,则这组数据的方差为A.B.6C.D.5【答案】C【解析】由题意,得3+5+7+x+10=6×5,得x=5,所以这组数据的方差为s2=(9+1+1+1+16)=.11.采用系统抽样方法从1000人中抽取50人做问卷调查,为此将他们随机编号为1,2,…,1000,适当分组后在第一组采用简单随机抽样的方法抽到的号码为8.抽到的50人中,编号落入区间[1,400]的人做问卷A,编号落入区间[401,750]的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷C的人数为A.12 B.13C.14 D.15【答案】A12.为了全面推进素质教育,教育部门对某省500所中小学进行调研考评,考评分数在80以上(包括80分)的授予“素质教育先进学校”称号,考评统计结果按[50,60),[60,70),[70,80),[80,90),[90,100]绘制成如图所示的频率分布直方图,则应授予“素质教育先进学校”称号的学校的个数为A.175 B.145C.180 D.240【答案】A【解析】由频率和为1可知x=0.1-(0.040+0.020+0.010+0.005)=0.025,故应授予“素质教育先进学校”称号的学校有(0.025+0.010)×10×500=175(所).13.某厂家为了解销售轿车台数与广告宣传费之间的关系,得到如表所示的统计数据表:根据数据表可得回归直线方程其中据此模型预测广告费用为9万元时,销售轿车台数为广告费用万元销售轿车A.17 B.18C.19 D.20【答案】C14.(2018年江苏卷)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________.【答案】90【解析】由茎叶图可知,5位裁判打出的分数分别为,故平均数为.15.(2018年全国新课标Ⅲ)某公司有大量客户,且不同龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.【答案】分层抽样.16.采用系统抽样的方法从800名学生中抽取50名学生进行视力检査.为此,将他们随机编号为1,2,3,…,800,若在116号中随机抽到的号码数为7,则从3348这16个号码数中应抽取的号码为________.【答案】39【解析】33〜48应在第3组中,故应抽取的号码为.17.已知x1,x2,…,x6的标准差为10,则10x1-1,10x2-1,…,10x6-1的标准差是________.【答案】100【解析】根据标准差的定义可得10x1-1,10x2-1,…,10x6-1的标准差是100.18.《九章算术》第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱,欲以钱数多少衰出之,问各几何?”其意为:“仅有甲带了560钱,乙带了350钱,丙带了180钱,三人一起出关,共需要交关税100钱,依照钱的多少按比例出钱”,则丙应出________钱(所得结果四舍五入,保留整数).【答案】17【解析】设丙应出x钱,由题意可得,求解可得钱.19.为了判断高中二年级学生选修文科或理科是否与性别有关,现随机抽取50名学生,得到如下的2×2列联表:已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025,根据表中数据,可得有________的把握认为选修文科或理科与性别有关.【答案】95%20.(2018全国新课标III理)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m 的工人数填入下面的列联表:(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:()()()()()22n ad bcKa b c d a c b d-=++++,【解析】(1)第二种生产方式的效率更高.理由如下:(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高. (iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.(2)由茎叶图知7981802m+==.列联表如下:(3)由于2240(151555)10 6.63520202020K⨯-⨯==>⨯⨯⨯,所以有99%的把握认为两种生产方式的效率有差异.21.某市为了制定合理的节电方案,对居民用电情况进行了调查,通过抽样,获得了某年200户居民每户的月均用电量(单位:百千瓦时),将数据按,,,,,分成9组,制成了如图所示的频率分布直方图.(1)求直方图中的值;(2)设该市有100万户居民,估计全市每户居民中月均用电量不低于6百千瓦时的人数及每户居民月均用电量的中位数;(3)政府计划对月均用电量在4百千瓦时以下的用户进行奖励,月均用电量在内的用户奖励20元/月,月均用电量在内的用户奖励10元/月,月均用电量在内的用户奖励2元/月.若该市共有400万户居民,试估计政府执行此计划的年度预算.【答案】(1);(2)百千瓦时;(3)亿元.【解析】(1)由题得=,所以.(3)该市月均用电量在内的用户数分别为,所以每月预算为元,故估计政府执行此计划的年度预算为万元亿元.22.(2018全国新课标II理)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1217,,…,)建立模型①:ˆ30.413.5y t =-+;根据2010年至2016年的数据(时间变量t 的值依次为127,,…,)建立模型②:ˆ9917.5y t =+. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.【解析】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为ˆ30.413.519226.1y=-+⨯=(亿元). 利用模型②,该地区2018年的环境基础设施投资额的预测值为ˆ9917.59256.5y=+⨯=(亿元). (2)利用模型②得到的预测值更可靠. 理由如下:(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线30.413.5y t =-+上下.这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型ˆ9917.5yt =+可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理.说明利用模型②得到的预测值更可靠.(以上给出了2种理由,只要答出其中任意一种或其他合理理由即可)23.(2018全国新课标I )某家庭记录了未使用节水龙头50天的日用水量数据(单位:m 3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表使用了节水龙头50天的日用水量频数分布表(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)【解析】(1)(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35m3的概率的估计值为0.48.【名师点睛】该题考查的是有关统计的问题,涉及到的知识点有频率分布直方图的绘制、利用频率分布直方图计算变量落在相应区间上的概率、利用频率分布直方图求平均数,在解题的过程中,需要认真审题,细心运算,仔细求解,就可以得出正确结果.24.(2017全国新课标I )为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm ).下面是检验员在一天内依次抽取的16个零件的尺寸:经计算得16119.9716i i x x ===∑,0.212s ==≈,18.439≈,161()(8.5) 2.78i i x x i =--=-∑,其中i x 为抽取的第i 个零件的尺寸,1,2,,16i =⋅⋅⋅.(1)求(,)i x i (1,2,,16)i =⋅⋅⋅的相关系数r ,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若||0.25r <,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).(2)一天内抽检零件中,如果出现了尺寸在(3,3)x s x s -+之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查. (ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(ⅱ)在(3,3)x s x s -+之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(,)i i x y (1,2,,)i n =⋅⋅⋅的相关系数()()niix x y y r --=∑0.09≈.(2)(i )由于9.97,0.212x s =≈,由样本数据可以看出抽取的第13个零件的尺寸在(3,3)x s x s -+以外,因此需对当天的生产过程进行检查.【名师点睛】解答新颖的数学题时,一是通过转化,化“新”为“旧”;二是通过深入分析,多方联想,以“旧”攻“新”;三是创造性地运用数学思想方法,以“新”制“新”,应特别关注创新题型的切入点和生长点.25.(2017新课标全国Ⅱ理科)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg ).其频率分布直方图如下:(1)设两种养殖方法的箱产量相互独立,记A 表示事件:“旧养殖法的箱产量低于50kg ,新养殖法的箱产量不低于50kg”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).附:,22()()()()()n ad bc K a b c d a c b d -=++++【解析】(1)记B 表示事件“旧养殖法的箱产量低于50kg ”,C 表示事件“新养殖法的箱产量不低于50kg ”,由题意知()()()()P A P BC P B P C ==,旧养殖法的箱产量低于50kg 的频率为()0.0120.0140.0240.0340.04050.62++++⨯=, 故()P B 的估计值为0.62.新养殖法的箱产量不低于50kg 的频率为()0.0680.0460.0100.00850.66+++⨯=, 故()P C 的估计值为0.66.因此,事件A 的概率估计值为0.620.660.4092⨯=. (2)根据箱产量的频率分布直方图得列联表:2K的观测值()22006266343815.70510010096104k⨯⨯-⨯=≈⨯⨯⨯,由于15.705 6.635>,故有99%的把握认为箱产量与养殖方法有关.【名师点睛】(1)利用独立性检验,能够帮助我们对日常生活中的实际问题作出合理的推断和预测.独立性检验就是考察两个分类变量是否有关系,并能较为准确地给出这种判断的可信度,随机变量的观测值k值越大,说明“两个变量有关系”的可能性越大.(2)利用频率分布直方图求众数、中位数和平均数时,应注意三点:①最高的小长方形底边中点的横坐标即众数;②中位数左边和右边的小长方形的面积和是相等的;③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.26.“阿曼德比萨”是一个制作和外卖意大利比萨的餐饮连锁店,其主要客户群是在校大学生,为研究各店铺的销售额与店铺附近大学生人数的关系,随机抽取10个分店作为样本,得到数据如下:(1)画出散点图,并判断x与y是否具有相关关系?(2)求回归直线方程,根据回归方程预测一个附近大学生人数为1万人的店铺的季度销售额; (3)若店铺的季度销售额低于10万元则亏损,试求附近大学生人数至少约多少人时才适合建店.【解析】(1)散点图如图所示:由散点图可以看出:这些点分布在一条直线的附近,因此这两个变量具有相关关系.(3)回归直线方程是=5x+6.令≥10,解得x≥0.8.故当附近大学生人数至少约8000人时才适合建店.________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________。
统计2.会用样本频率分布估计总体的概率分布.“统计”这一章,是初中数学中的“统计初步”的深化和拓展.要求主要会用随机抽样,分层抽样的方法从总体中抽取样本,并用样本频率分布估计总体分布.本章高考题以基本题(中、低档题)为主,每年只出一道填空题,常以实际问题为背景,综合考查学生应用基础知识解决实际问题的能力.高考的热点是总体分布的估计和抽样方法.知识的交汇点是排列、组合、概率与统计的解答题.第1课时抽样方法与总体分布估计1.总体、样本、样本容量我们要考察的对象的全体叫做_______,其中每个考察的对象叫_______.从总体中抽出的一部分个体叫做_______,样本中个体的数目叫做_______.2.简单随机抽样设一个总体由N个个体组成,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时,各个个体被抽到的_______相等,就称这样的抽样为_______.3.分层抽样当已知总体由_______的几部分组成时,为了使样本更能充分地反映总体的情况,常将总体分成几个部分,然后按照各部分所占的_______进行抽样,这种抽样叫做_______.其中所分成的各个部分叫做_______.4.总体分布和样本频率分布总体取值的_______分布规律称为总体分布.样本频率分布_______称为样本频率分布.5.总体分布估计:总体分布估计主要指两类.一类是用样本的频率分布去估计总体(的概率)分布.二类是用样本的某些数字特征(例如平均数、方差、标准差等)去估计总体的相应数字特征.6.频率分布条形图和直方图:两者都是用来表示总体分布估计的.其横轴都是表示总体中的个体.但纵轴的含义却截然不同.前者纵轴(矩形的高)表示频率;后者纵轴表示频率与组距的比,其相应组距上的频率等于该组距上的矩形的面积.7.总体期望值指总体平均数.例1. 某公司在甲、乙、丙、丁四个地区分别有150个,120个,180个,150个销售点,公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务等情况,记这项调查为②;则完成①②这两项调查采用的抽样方法依次是()A.分层抽样,系统抽样B.分层抽样,简单随机抽样法C.系统抽样,分层抽样D.简单随机抽样法,分层抽样法解:B变式训练1:某单位有职工100人,不到35岁的有45人,35岁到49岁的有25人,剩下的为50岁以上的人,用分层抽样的方法从中抽取20人,各年龄段分别抽取多少人()A.7,5,8 B.9,5,6C.6,5,9 D.8,5,7解:B样本容量与总体个数的比为20:100=1:5∴各年龄段抽取的人数依次为:11499,255,20956⨯=⨯=--=(人)55例2. 一批产品有一级品100个,二级品60个,三级品40个,分别采用系统抽样和分层抽样,从这批产品中抽取一个容量为20的样本。
抽样方法【背一背基础知识】1. 简单随机抽样:一般地,从元素个数为N 的总体中逐个不放回地抽取容量为n 的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样.最常用的简单随机抽样的方法:抽签法和随机数法.简单随机抽样适用范围是:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小。
2.系统抽样:假设要从容量为N 的总体中抽取容量为n 的样本,第一步,先将总体的N 个个体编号;第二步,确定分隔间距k ,对编号进行分段,当Nn (n 是样本容量)是整数时,取k =N n ;当N n (n 是样本容量)不是整数时,先用简单随机抽样剔除N n -[N n ]个个体,取k =[Nn ];第三步,在第1段用简单随机抽样确定第一个个体编号l (l ≤k );第四步,按照一定的规则抽取样本,通常是将l 加上间隔k 得到第2个个体编号l k +,再加k 得到第3个个体编号2l k +,依次进行下去,直到获取整个样本.系统抽样的适用范围是:元素个数很多且均衡的总体;各个个体被抽到的机会均等。
3.分层抽样:当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,常采用分层抽样,将总体中各个个体按某种特征分成若干个互不交叉的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.分层抽样的应用范围是:总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样或系统抽样.【讲一讲提高技能】1必备技能:在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分成几个组,则分段间隔即为Nn(N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量和总体容量的比值. 2典型例题:例1. 某校高一年级有900名学生,其中女生400名,按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为_______.【答案】25【解析】由题意得抽样比例为45190020=,故应抽取的男生人数为15002520⨯=.【考点】分层抽样.【名师点睛】本题考查抽样方法,要搞清楚三种抽样方法的区别和联系,其中分层抽样是按比例抽样;系统抽样是等距离抽样,属于基础题.例2. 某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本的老年教师人数为()A.90 B.100 C.180 D.300【答案】C【考点定位】分层抽样.【名师点晴】本题主要考查的是分层抽样,属于容易题.解题时一定要清楚“320”是指抽取前的人数还是指抽取后的人数,否则容易出现错误.解本题需要掌握的知识点是分层抽样,即抽取比例=样本容量总体容量.【练一练提升能力】1.为了了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为()A.50B.40C.25D .20 【答案】C【解析】由题意知,分段间隔为10002540=,故选C . 2.从3001名学生中选取50名组成参观团,现采用下面的方法选取:先用简单随机抽样从 3001人中剔除1人,剩下的3000人再按系统抽样的方法进行,则每个人被选到的机会( )A .不全相等B 。
高考数学复习典型题型专题讲解与练习专题96 统计图表的应用题型一频率分布直方图的应用【例1】为落实党中央的“三农”政策,某市组织该市所有乡镇干部进行了一期“三农”政策高考数学复习典型题型专题讲解与练习专题培训,并在培训结束时进行了结业考试.如图是该次考试成绩随机抽样样本的频率分布直方图.则下列关于这次考试成绩的估计错误的是()A.众数为82.5B.中位数为85C .平均数为86D .有一半以上干部的成绩在80~90分之间【答案】C【解析】由频率直方图知:众数为82.5,A 正确;又(0.010.030.06)50.5++⨯=,即中位数为85,B 正确;由(0.0172.50.0377.50.0682.50.0587.50.0392.50.0297.5)5⨯+⨯+⨯+⨯+⨯+⨯⨯=85.5,C 错误;由()0.060.0550.550.5+⨯=>,则有一半以上干部的成绩在80~90分之间,D 正确.故选:C【变式1-1】第24届冬奥会于2022年2月4日在国家体育场鸟巢举行了盛大开幕式.在冬奥会的志愿者选拔工作中,某高校承办了面试工作,面试成绩满分100分,现随机抽取了80名候选者的面试成绩并分为五组,绘制成如图所示的频率分布直方图,则下列说法错误的是(每组数据以区间的中点值为代表)( )A .直方图中b 的值为0.025B .候选者面试成绩的中位数约为69.4C .在被抽取的学生中,成绩在区间[)65,75之间的学生有30人D .估计候选者的面试成绩的平均数约为69.5分【答案】C【解析】A ,∵()0.0050.0450.020.005101b ++++⨯=,∴0.025b =,故A 正确;B ,设候选者面试成绩的中位数为x ,则()()0.0050.02510650.0450.5x +⨯+-⨯=, 解得69.4x ≈,故B 正确;C ,成绩在区间[)65,75的频率为0.045100.45⨯=,故人数有800.4536⨯=,故C 错误;D ,500.00510600.02510700.04510800.0210900.0051069.5⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=,故D 正确.【变式1-2】某市政府部门为了解该市的“全国文明城市”创建情况,在该市的12个区县市中随机抽查到了甲、乙两县,考核组对他们的创建工作进行量化考核.在两个县的量化考核成绩(均为整数)中各随机抽取20个,得到如图数据(用频率分布直方图估计总体平均数时,每个区间的值均取该区间的中点值).关于甲乙两县的考核成绩,下列结论正确的是( )A .甲县平均数小于乙县平均数B .甲县中位数小于乙县中位数C .甲县众数不小于乙县众数D .不低于80的数据个数,甲县多于乙县【答案】C 【解析】由条形图可知,甲样本的平均数:57258596768269279687886899874.820x ⨯++++⨯+⨯+⨯++⨯++==甲, 中位数:79,众数:79,不低于80的数据共5个; 由频率分布直方图可知,一样本的平均数:55100.0265100.02575100.0385100.0295100.00571.574.8x =⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=<乙, 中位数:设中位数为x 中,由0.02100.025100.450.5⨯+⨯=<,0.02100.025100.03100.750.5⨯+⨯+⨯=>,故中位数[)70,80x ∈中,()0.02100.02510700.030.5x ⨯+⨯+-⨯=中,解得71.6779x ≈<中,众数[)70,80x ∈众且x N +∈众,即7179x ≤≤众,不低于80的数据共20100.0051⨯⨯=,所以A ,B ,D 选项错误,故选:C.【变式1-3】某班进行了一次数学测试,全班学生的成绩都落在区间[]50,100内,其成绩的频率分布直方图如图所示,若该班学生这次数学测试成绩的中位数的估计值为81.25,则b a -的值为( )A .0.01B .0.005C .0.008D .0.006【答案】A【解析】由题意有10100.250.4101a b b ++++=,得20.035+=a b ,又由()10100.2581.25800.040.5a b +++-⨯=,得0.02+=a b ,解得0.005a =,0.015b =,有0.0150.0050.01-=-=b a .故选:A.【变式1-4】某城市在创建文明城市的活动中,为了解居民对“创建文明城市”的满意程度,组织居民给活动打分(分数为整数,满分100分),从中随机抽取一个容量为100的样本,发现数据均在[]40,100内.现将这些分数分成6组并画出样本的频率分布直方图,但不小心污损了部分图形,如图所示.观察图形,则下列说法错误的是( )A .频率分布直方图中第三组的频数为10人B .根据频率分布直方图估计样本的众数为75分C .根据频率分布直方图估计样本的中位数为75分D .根据频率分布直方图估计样本的平均数为75分【答案】D【解析】分数在[)60,70内的频率为()1100.0050.0200.0300.0250.0100.10-⨯++++=,所以第三组[)60,70的频数为1000.1010⨯=(人),故A 正确;因为众数的估计值是频率分布直方图中最高矩形的中点,从图中可看出众数的估计值为75分,故B 正确;因为()0.0050.0200.010100.350.5++⨯=<,()0.0050.0200.0100.03100.650.5+++⨯=>, 所以中位数位于[)70,80,设中位数为a ,则()0.35700.030.5a +-⨯=,解得75a =,故C 正确;样本平均数的估计值为:450.05550.2650.1750.3850.25950.173⨯+⨯+⨯+⨯+⨯+⨯=(分),故D 错误.故选:D .【变式1-5】(多选)某高中学校积极响应国家“阳光体育运动”的号召,为确保学生每天一小时的体育锻炼,调查该校2000名高中学生每周平均参加体育锻炼时间的情况,现从高一、高二、高三三个年级学生中按照3:1:1的比例分层抽样,收集了200名学生每周平均体育运动时间的样本数据(单位:小时),整理后得到如图所示的频率分布直方图,则下列说法中,正确的是( )A .估计该校高中学生每周平均体育运动时间不足4小时的人数为500人B .估计该校高中学生每周平均体育运动时间不少于8小时的人数百分比为20%C .估计该校高中学生每周平均体育运动时间的中位数为5小时D .估计该校高中学生每周平均体育运动时间为5.8小时【答案】ABD【解析】A :该校学生每周平均体育运动时间不足4小时的频率为()0.0250.120.25+⨯=,所以,估计高一年级每周平均体育运动时间不足4小时的人数约为20000.25500⨯=人,故A 选项正确;B :该校学生每周平均体育运动时间不少于8小时的百分比为()0.0750.025220%+⨯=,故B 选项正确;C :估计该校高中学生每周平均体育运动时间的中位数为()0.50.025+0.124+5.70.152-⨯≈⨯小时,故C 选项不正确;D :该校高中学生每周平均体育运动时间为5.8小时为0.02521+0.123+0.1525+0.12527+0.07529+0.025211 5.8⨯⨯⨯⨯⨯⨯⨯⨯⨯⨯⨯⨯=小时,故D选项正确.故选:ABD.题型二折线图的应用【例2】下图是国家统计局近期公布的全国居民消费价格的涨跌幅情况:现有如下说法:①2021年3月份,全国居民消费价格的同比和环比均呈现增长趋势②2021年1月至2022年1月,全国居民消费价格同比增长的月份有7个;③2021年1月至2022年1月中的任1个月,全国居民消费价格的环比呈现增长趋势的频率为12④在2021年1月至2022年1月这个时段中,全国居民消费价格的同比与环比都增长的月份有5个上述说法正确的个数为()A.1 B.2 C.3 D.4【答案】A【解析】2021年3月份,全国居民消费价格的同比为正数,环比为负数,所以①错误:2021年1月至2022年1月,全国居民消费价格同比增长的月份有11个,下跌的月份有2个,所以②错误;2021年1月至2022年1月,全国居民消费价格环比增长的月份有7个,下跌的月份有6个,故从2021年1月至2022年1月中任取1个月,全国居民消费价格的环比呈现增长趋势的频率为713,所以③错误;在2021年1月至2022年1月这个时段中,全国居民消费价格的同比与环比都增长的月份有5个,所以④正确,故选:A.【变式2-1】随着我国经济总量的日益增长和社会财富的不断积累,投资理财观念已经深入普通国人家庭.“投资理财情绪指数”是根据互联网用户搜索某种理财产品相应关键词的次数为基础所得到的统计指标.指数越大,表示互联网用户对该理财产品的关注度也越高.如图是2019年上半年某种理财产品的投资理财情绪指数走势图.根据该走势图,下列结论正确的是()A.这半年中,互联网用户对该理财产品的关注度不断增强B.这半年中,互联网用户对该理财产品的关注度呈周期性变化C.从这半年的投资理财情绪指数来看,2月份的方差大于4月份的方差D.从这半年的投资理财情绪指数来看,5月份的平均值小于6月份的平均值【答案】C【解析】由2019年上半年某种理财产品的投资理财情绪指数走势图知:A:这半年中,互联网用户对该理财产品的关注度不断增强呈现出一定的波动性,故A错误;B:这半年中,互联网用户对该理财产品的关注度不断增强呈现出一定的波动性,没有周期性变化,故B错误;C:从这半年的投资理财情绪指数来看,2月份的波动性大于4月份的波动性,∴2月份的方差大于4月份的方差,故C正确;D:从这半年的投资理财情绪指数来看,5月份的平均值大于6月份的平均值,故D错误.故选:C.【变式2-2】甲、乙两个跑步爱好者利用微信运动记录了去年下半年每个月的跑步里程(单位:公里),现将两人的数据绘制成如图所示的折线图,则下列结论中错误的是()A.甲跑步里程的极差等于110B .乙跑步里程的中位数是273C .分别记甲、乙下半年每月跑步里程的平均数为1m ,2m ,则12m m >D .分别记甲乙下半年每月跑步里程的标准差为1s ,2s ,则12s s >【答案】C【解析】甲跑步里程的极差为313203110-=,A 的结论正确. 乙跑步里程的中位数为2802662732+=,B 的结论正确. 甲跑步里程的平均数313254217245203301255.56+++++=, 乙跑步里程的平均数293280262283255266273.26+++++≈, 所以12m m <,C 的结论错误.根据折线图可知,甲的波动大,乙的波动小,所以12s s >,D 的结论正确.故选:C【变式2-3】某市气象部门根据2021年各月的每天最高气温平均值与最低气温平均值(单位:℃)数据,绘制如下折线图:那么,下列叙述错误的是( )A .各月最高气温平均值与最低气温平均值总体呈正相关B.全年中,2月份的最高气温平均值与最低气温平均值的差值最大C.全年中各月最低气温平均值不高于10℃的月份有5个D.从2021年7月至12月该市每天最高气温平均值与最低气温平均值都呈下降趋势【答案】D【解析】在A中,各月最高气温平均值与最低气温平均值为正相关,故A正确;在B中,全年中,2月的最高气温平均值与最低气温平均值的差值最大,故B 正确;在C中,全年中各月最低气温平均值不高于10C 的月份有1月,2月,3月,11月,12月,共5个,故C正确;在D中,从2021年7月至12月该市每天最高气温平均值与最低气温平均值,先上升后下降,故D错误.故选:D.【变式2-4】2021年11月3日11时,全国首条无人驾驶跨座式单轨芜湖轨道交通1号线全线开通运营,标志着芜湖市正式跨入轨道交通时代,如图为1号线正式运行后连续11天的客运量折线图,根据该折线图,下列说法错误的是()A.该11天中客运量的极差大约是4.8B.该11天客运量的平均数大约为5C.该11天中客运量的中位数大约是4.5D.8日至10日客运量相对于11日至13日客运量,波动性更小,方差更大【答案】D【解析】根据折线图进行数据分析:对于A:该11天中客运量的最小值为11月3日的客运量,最大值为11月13日的客运量,极差大约是4.8.故A正确;对于B:该11天客运量中,有两次超过8,其余9次都小于5,但距离5较近,故可以估计该11天客运量的平均数大约为5.故B正确;对于C:把该11天客运量从小到大排列,处在第六位的是11月7日的客运量,大约是4.5.故C正确;对于D:8日至10日客运量相对于11日至13日客运量,波动性更小,根据方差的意义,可以得到方差更小.故D错误.故选:D【变式2-5】下图是国家统计局发布的2018年3月到2019年3月全国居民消费价格的涨跌幅情况折线图,其中上面折线是同比涨跌幅情况折线图,下面折线是环比涨跌幅情况折线图,(注:2019年2月与2018年2月相比较称同比,2019年2月与2019年1月相比较称环比),根据该折线图,下列结论不正确的是()A.2018年3月至2019年3月全国居民消费价格同比均上涨B.2018年3月至2019年3月全国居民消费价格环比有涨有跌C.2019年3月全国居民消费价格同比涨幅最大D.2019年3月全国居民消费价格环比变化最快【答案】C【解析】A:上面的同比涨跌幅情况折线图中,所有数值均为正,即同比均上涨,正确;B:下面的环比涨跌幅情况折线图中,数值有正有负,即消费价格环比有涨有跌,正确;C:上面的同比涨跌幅情况折线图中,居民消费价格同比涨幅最大的是2018.和2018.10两个月,涨幅均为2.5,大于2019年2月全国居民消费价格同比涨幅(2.3),错误;D:下面的环比涨跌幅情况折线图中,2019年3月全国居民消费价格环比变化最快,由1降到了-0.4,变化值1.4,是最大的,正确.故选:C题型三扇形图的应用【例3】某学校高一年级学生来自农村、牧区、城镇三类地区,下面是根据其人数比例绘制的扇形统计图,由图中的信息,得出以下3个判断:①该校高一学生在这三类不同地区的分布情况为3:2:7;②若已知该校来自牧区的高一学生为140人,则高一学生总人数为840人.③若从该校高一学生中抽取120人作为样本,调查高一学生父母的文化程度,则利用分层抽样,从农村、牧区、城镇学生中分别抽取30、20、70人,样本更具有代表性.其中正确的判断有( )A .3个B .2个C .1个D .0个【答案】A【解析】根据扇形统计图,结合圆心角分别为:90,60,210︒︒︒,来自农村,牧区和城镇的人数之比为:90:60:2103:2:7=;对①:该校高一学生在这三类不同地区的分布情况为3:2:7,故①正确;对②:设高一学生总人数为x ,则由来自牧区的高一学生为140人可得:11406x =,则840x =人,即高一学生总人数为840人,故②正确; 对③:根据题意,从高一学生中抽取120人,来自农村,牧区和城镇的人数分别为:312030327⨯=++人,212020327⨯=++,712070327⨯=++,故③正确;故选:A .【变式3-1】某学校于3月12日组织师生举行植树活动,购买垂柳、银杏、侧柏、海桐四种树苗共计1200棵,比例如图所示.高一、高二、高三报名参加植树活动的人数分别为600,400,200,若每种树苗均按各年级报名人数的比例进行分配,则高三年级应分得侧柏的数量为()A.34 B.46 C.50 D.70【答案】C【解析】由扇形统计图知,购买的1200棵树苗中,侧柏的数量为120025%300⨯=,依题意,高一、高二、高三分到的侧柏的棵数比为:600:400:2003:2:1=,所以高三年级应分得侧柏的数量为130050321⨯=++.故选:C【变式3-2】郫都是中国农家乐旅游发源地、最美中国生态旅游目的地,是四川省乡村旅游的先行者,快工作慢生活,构成了安逸郫都最靓丽的风景线.郫都大部分农民都有自己的苗圃,也不断改进种植花卉苗木的技术.改进后,某种苗木在单位面积上的出苗数量增加了50%,且在同一生长周期内的高度(cm)变化的饼图如图所示,则下列说法正确的是()A .80cm 以上优质苗木所占比例增加10%B .改进后,80cm 以上优质苗木产量实现了增加80%的目标C .70cm-80cm 的苗木产量没有变化D .70cm 以下次品苗木产量减少了13【答案】B【解析】设改进前某种苗木在单位面积上的出苗数量为a ,改进后它的出苗数量为()10.5a +,则80cm 以上优质苗木所占比例增加了()10.50.60.50.4+⨯-=,即40%故A 错; 80cm 以上优质苗木产量实现了增加了()10.50.60.50.80.5a a a +⨯-=,即80%的目标,故B 正确;单位面积上70cm-80cm 的苗木产量增加了()10.50.30.30.15a a a +⨯-=,故C 错; 70cm 以下次品苗木产量减少了()0.20.110.510.24a a a -+=,故D 错,故选:B .【变式3-3】某乡镇实现脱贫目标后,在奔小康的道路上,继续大步前进,依托本地区苹果种植的优势,经过3年的发展,苹果总产量翻了一番,统计苹果的品质得到了如下饼图:70,80是指苹果的外径,则以下说法中不正确的是( )A.80以上优质苹果所占比例增加B.经过3年的努力,80以上优质苹果产量实现翻了一番的目标C.70~80的苹果产量翻了一番D.70以下次品苹果产量减少了一半【答案】D【解析】设原苹果总产量为a,则经过3年的发展,苹果总产量为2a,3年前80以上优质苹果所占比例50%,3年后80以上优质苹果所占比例60%,所占比例增加,故选项A正确;3年前80以上优质苹果的产量为50%0.5a a⨯=,3年后80以上优质苹果的产量为60%2 1.2⨯=,a a故80以上优质苹果产量实现翻了一番的目标,选项B正确;3年前70~80苹果的产量为30%0.3a a⨯=,3年后70~80苹果的产量为30%20.6⨯=,a a故70~80的苹果产量翻了一番,选项C正确;3年前70以下次品苹果的产量为20%0.2⨯=,a a3年后70以下次品苹果的产量为10%20.2⨯=,a a故70以下次品苹果的产量没变,选项D错误.故选:D.【变式3-4】某商场开通三种平台销售商品,五一期间这三种平台的数据如图1所示.该商场为了解消费者对各平台销售方式的满意程度,用分层抽样的方法抽取了6%的顾客进行满意度调查,得到的数据如图2所示.下列说法正确的是()A.样本中对平台一满意的消费者人数约700B.总体中对平台二满意的消费者人数为18C.样本中对平台一和平台二满意的消费者总人数为60D.若样本中对平台三满意的消费者人数为120,则90%=m【答案】C【解析】对于A:样本中对平台一满意的人数为20006%35%42⨯⨯=,故选项A错误;对于B:总体中对平台二满意的人数约为150020%300⨯=,故选项B错误;对于C:样本中对平台一和平台二满意的总人数为:20006%35%15006%20%60⨯⨯+⨯⨯=,故选项C正确:对于D:对平台三的满意率为12080%25006%=⨯,所以80%=m,故D错误.故选:C【变式3-5】2020年中国经济在疫情狙击战的基础上实现了正增长,根据中国统计局官网提供的数据,20162020-年全国居民人均可支配收入及其增长速度和2020年全国居民人均消费支出及其构成如图所示.根据该图,下列结论正确的是()A.2020年全国居民人均可支配收入比上年下降了2.1%B.2020年全国居民人均居住支出占可支配收入的比重为25%C.2020年全国居民人均交通通信支出占消费支出的比重为13%D.20162020-年全国居民人均可支配收入逐年增加,比上年实际增长率逐年下降【答案】C【解析】对于A选项,由图可知,2020年全国居民人均可支配收入比上年上涨了2.1%,A 错;对于B选项,2020年全国居民人均居住支出占消费支出的比重为25%,2020年全国居民人均居住支出占可支配收入的比重为521525%32189<,B错;对于C选项,2020年全国居民人均交通通信支出占消费支出的比重为13%,C对;对于D选项,20162020-年全国居民人均可支配收入逐年增加,2017年比上年实际增长率上升,D错.故选:C.。
专题十概率、统计问题二:统计图表的应用一、考情分析统计图表有频率分布直方图、茎叶图、折线图、条形图、饼形图、雷达图等,它们广泛应用于实际生活之中,也是历年高考的热点,求解此类的关键是由图表读出有用的数据,再根据数据进行分析.二、经验分享1.明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为1.学科-网2.对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据.由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.3.频率分布直方图是高考考查的热点,考查频率很高,题型有选择题、填空题,也有解答题,难度为低中档.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.三、知识拓展统计图是利用点、线、面、体等绘制成几何图形,以表示各种数量间的关系及其变动情况的工具。
表现统计数字大小和变动的各种图形总称。
其中有条形统计图、扇形统计图、折线统计图、象形图等。
在统计学中把利用统计图形表现统计资料的方法叫做统计图示法。
其特点是:形象具体、简明生动、通俗易懂、一目了然。
其主要用途有:表示现象间的对比关系;揭露总体结构;检查计划的执行情况;揭示现象间的依存关系,反映总体单位的分配情况;说明现象在空间上的分布情况。
一般采用直角坐标系.横坐标用来表示事物的组别或自变量x,纵坐标常用来表示事物出现的次数或因变量y;或采用角度坐标(如圆形图)、地理坐标(如地形图)等。
按图尺的数字性质分类,有实数图、累积数图、百分数图、对数图、指数图等;其结构包括图名、图目(图中的标题)、图尺(坐标单位)、各种图线(基线、轮廓线、指导线等)、图注(图例说明、资料来源等)等。
折叠基本用途统计图一般由图形、图号、图目、图注等组成。
在行政职业能力测验中常见的有条形统计图、扇型统计图、折线统计图和网状统计图。
基本类型(1)条形统计图:又称直条图,表示独立指标在不同阶段的情况,有两维或多维,图例位于右上方。
(2)扇形统计图:描述百分比(构成比)的大小,用颜色或各种图形将不同比例表达出来。
(3)折线统计图:用线条的升降表示事物的发展变化趋势,主要用于计量资料,描述两个变量间关系。
(4)半对数线图:纵轴用对数尺度,描述一组连续性资料的变化速度及趋势。
(5)直方图:描述计量资料的频数分布。
(6)散点图:描述两种现象的相关关系。
(7)统计地图:描述某种现象的地域分布。
条形图用一个单位长度(如1厘米)表示一定的数量,根据数量的多少,画成长短相应成比例的直条,并按一定顺序排列起来,这样的统计图,称为条形统计图。
条形统计图可以清楚地表明各种数量的多少。
条形图是统计图资料分析中最常用的图形。
按照排列方式的不同,可分为纵式条形图和横式条形图;按照分析作用的不同,可分为条形比较图和条形结构图。
条形统计图的特点:(1)能够使人们一眼看出各个数据的大小。
(2)易于比较数据之间的差别。
(3)能清楚的表示出数量的多少。
扇形图以一个圆的面积表示事物的总体,以扇形面积表示占总体的百分数的统计图,叫作扇形统计图。
也叫作百分数比较图。
扇形统计图可以比较清楚地反映出部分与部分、部分与整体之间的数量关系。
扇形统计图的特点:(1)用扇形的面积表示部分在总体中所占的百分比。
(2)易于显示每组数据相对于总数的大小。
折线图折线统计图以折线的上升或下降来表示统计数量的增减变化的统计图,叫作折线统计图。
与条形统计图比较,折线统计图不仅可以表示数量的多少,而且可以反映同一事物在不同时间里的发展变化的情况。
折线图在生活中运用的非常普遍,虽然它不直接给出精确的数据,但只要掌握了一定的技巧,熟练运用"坐标法"也可以很快地确定某个具体的数据。
折线统计图的特点: (1)能够显示数据的变化趋势,反映事物的变化情况。
网状图网状统计图的特点是:母代表的意义,在具体的答题过程中就可以脱离字母,较简便找出答案。
统计图的意义:表示现象间的对比关系;揭露总体结构;检查计划的执行情况;揭示现象间的依存关系,反映总体单位的分配情况;说明现象在空间上的分布情况。
茎叶统计图茎叶图又称"枝叶图",它的思路是将数组中的数按位数进行比较,将数的大小基本不变或变化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少。
茎叶图有三列数:左边的一列数统计数,它是上(或下)向中心累积的值,中心的数(带括号)表示最多数组的个数;中间的一列表示茎,也就是变化不大的位数;右边的是数组中的变化位,它是按照一定的间隔将数组中的每个变化的数一一列出来,象一条枝上抽出的叶子一样,所以人们形象地叫它茎叶图。
茎叶图是一个与直方图相类似的特殊工具,但又与直方图不同,茎叶图保留原始资料的资讯,直方图则失去原始资料的讯息。
将茎叶图茎和叶逆时针方向旋转90度,实际上就是一个直方图,可以从中统计出次数,计算出各数据段的频率或百分比。
从而可以看出分布是否与正态分布或单峰偏态分布逼近。
茎叶图在质量管理上用途与直方图差不多,但它通常是作为更细致的分析阶段使用。
由于它是用数字组成直方图,所以在做的时候比直方图时,通常我们常使用专业的软件进行绘制。
茎叶图的特征1、用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。
2、茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观、清晰。
统计图的意义:表示现象间的对比关系;揭露总体结构;检查计划的执行情况;揭示现象间的依存关系,反映总体单位的分配情况;说明现象在空间上的分布情况。
学科网网状统计图的特点是这类统计图中只有一些字母,字母所代表的意义都在题外,在答题前必弄清这些字母代表的意义,在具体的答题过程中就可以脱离字母,较简便地得出答案。
统计表是由纵横交叉线条所绘制的表格来表现统计资料的一种形式.根据《中国小学教学百科全书》介绍,它是用原始数据制成的一种表格.为了实际需要,人们常常要把工农业生产、科学技术和日常工作中所得到的相互关联的数据,按照一定的要求进行整理、归类,并按照一定的顺序把数据排列起来,制成表格,这种表格叫做统计表.它的作用是:①用数量说明研究对象之间的相互关系.②用数量把研究对象之间的变化规律显著地表示出来.③用数量把研究对象之间的差别显著地表示出来.这样便于人们用来分析问题和研究问题.统计表的形式繁简不一,通常按项目的多少,分为单式统计表和复式统计表两种.只对某一个项目的数据进行统计的表格,叫做单式统计表,也叫做简单统计表.统计项目在两个或两个以上的统计表格,叫做复式统计表.统计表的内容一般都包括总标题、横标题、纵标题、数字资料、单位、制表日期.总标题是指表的名称,它要能简单扼要地反映出表的主要内容,横标题是指每一横行内数据的意义;纵标题是指每一纵栏内数据的意义;数字资料是指各空格内按要求填写的数字;单位是指表格里数据的计量单位.在数据单位相同时,一般把单位放在表格的左上角.如果各项目的数据单位不同时,可放在表格里注明.制表日期放在表的右上角,表明制表的时间.各种统计表都应有"备考"或"附注"栏,以便必要时填入不属于表内各项的事实或说明.直方图直方图(Histogram)又称柱状图、质量分布图。
是一种统计报告图,由一系列高度不等的纵向条纹或线段表示数据分布的情况。
一般用横轴表示数据类型,纵轴表示分布情况。
直方图法的涵义在质量管理中,如何预测并监控产品质量状况?如何对质量波动进行分析?直方图就是一目了然地把这些问题图表化处理的工具。
它通过对收集到的貌似无序的数据进行处理,来反映产品质量的分布情况,判断和预测产品质量及不合格率。
直方图又称质量分布图,柱状图,它是表示资料变化情况的一种主要工具。
用直方图可以的资料,解析出规则性,比较直观地看出产品质量特性的分布状态,对於资分布状况一目了然,便於判断其总体质量分布情况。
在制作直方图时,牵涉学的概念,首先要对资料进行分组,因此如何合理分组是其中的关键问题。
按组距相等的原则进行的两个关键数位是分组数和组距。
是一种几何形图表,它是根据从生产过程中收集来的质量数据分布情况,画成以组距为底边、以频数为高度的一系列连接起来的直方型矩形图,如图所示。
作直方图的目的就是通过观察图的形状,判断生产过程是否稳定,预测生产过程的质量。
具体来说,作直方图的目的有:①判断一批已加工完毕的产品;②验证工序的稳定性;③为计算工序能力搜集有关数据。
直方图将数据根据差异进行分类,特点是明察秋毫地掌握差异。
直方图的绘制方法①集中和记录数据,求出其最大值和最小值。
数据的数量应在100个以上,在数量不多的情况下,至少也应在50个以上。
我们把分成组的个数称为组数,每一个组的两个端点的差称为组距。
②将数据分成若干组,并做好记号。
分组的数量在6-20之间较为适宜。
③计算组距的宽度。
用组数去除最大值和最小值之差,求出组距的宽度。
④计算各组的界限位。
各组的界限位可以从第一组开始依次计算,第一组的下界为最小值减去最小测定单位的一半,第一组的上界为其下界值加上组距。
第二组的下界限位为第一组的上界限值,第二组的下界限值加上组距,就是第二组的上界限位,依此类推。
⑤统计各组数据出现频数,作频数分布表。
⑥作直方图。
以组距为底长,以频数为高,作各组的矩形图。
四、题型分析(一)频率分布直方图【例1】某校高二(16)班共有50人,如图是该班在四校联考中数学成绩的频率分布直方图,则成绩在内的学生人数为( )A. 36B. 25C. 22D. 11【答案】B【分析】根据频率分别直方图的性质,求得,进而求得在之间的概率,即可求解其人数.【点评】本题主要考查了用样本估计总体,独立性检验的应用,其中对于用样本估计总体主要注意以下两个方面:1、用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法.分布表在数量表示上比较准确,直方图比较直观;2、频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.【小试牛刀】【黑龙江省大庆市2018届高三第二次教学质量检测】下面是追踪调查200个某种电子元件寿命(单位:)频率分布直方图,如图:其中300-400、400-500两组数据丢失,下面四个说法中有且只有一个与原数据相符,这个说法是( )①寿命在300-400的频数是90;②寿命在400-500的矩形的面积是0.2;③用频率分布直方图估计电子元件的平均寿命为:④寿命超过的频率为0.3A. ①B. ②C. ③D. ④【答案】B【解析】若①正确,则对应的频率为,则对应的频率为,则②错误;电子元件的平均寿命为,则③正确;寿命超过的频率为,则④正确,故不符合题意;若②正确,则对应的频率为,则①错误;电子元件的平均寿命为,则③错误;寿命超过的频率为,则④错误,故符合题意.故选B.(二)茎叶图【例2】【福建省南平市2018届高三第二次(5月)综合质量检查】五四青年节活动中,高三(1)、(2)班都进行了3场知识辩论赛,比赛得分情况的茎叶图如图所示(单位:分),其中高三(2)班得分有一个数字被污损,无法确认,假设这个数字x具有随机性,那么高三(2)班的平均得分大于高三(1)班的平均得分的概率为()A. 34B.13C.35D.25【答案】D【分析】由高三(2)班的平均得分大于高三(1)班的平均得分,求得x取值范围,再根据古典概形求得概率。