茎叶图与频率分布直方图_-2018届高三文科数学精品复习讲义与跟踪训练含解析
- 格式:doc
- 大小:994.50 KB
- 文档页数:20
专题02 频率分布直方图及其应用一、选择题1.【2017-2018年北京市首都师大附中高二期末】对高速公路某段上汽车行驶速度进行抽样调查,画出如下频率分布直方图.根据直方图估计在此路段上汽车行驶速度的众数和行驶速度超过80km/h的概率A. 75,0.25B. 80,0.35C. 77.5,0.25D. 77.5,0.35【答案】D故选D.2.【人教B版高中数学必修三同步测试】根据某水文观测点的历史统计数据,得到某条河流水位的频率分布直方图(如图),从图中可以看出,该水文观测点平均至少100年才遇到一次的洪水的最低水位是()A. 48 mB. 49 mC. 50 mD. 51 m【答案】C【解析】由频率分布直方图知水位为50 m的频率组距为0.00520.01,即水文观测点平均至少一百年才遇到一次的洪水的最低水位是50 m. 本题选择C选项.3.【福建省三明市A片区高中联盟校2017-2018学年高二上学期阶段性考试】为了解某地区名高三男生的身体发育情况,抽查了该地区名年龄为~岁的高三男生体重(),得到频率分布直方图如图.根据图示,估计该地区高三男生中体重在kg的学生人数是( )A. B. C. D.【答案】C点睛:此题主要考查了频率分布直方图在实际问题中的应用,属于中低档题型,也是常考考点.在解决此类问题中,充分利用频率分布直方图的纵坐标的实际意义,其纵坐标值为:频率/组距,由此各组数据的频率=其纵坐标组距,各组频数=频率×总体,从而可估计出所求数据段的频数(即人数).4.【广东省中山一中、仲元中学等七校2017-2018学年高二3月联考】某商场在国庆黄金周的促销活动中,对10月1日9时至14时的销售额进行统计,其频率分布直方图如图所示.已知9时至10时的销售额为3万元,则9时至14时的销售总额为A. 10万元B. 12万元C. 15万元D. 30万元【答案】D【解析】9时至10时的销售额频率为0.1,因此所有销售总额为万元,故选D.5.【四川省成都外国语学校2017-2018学年高二上学期期末考试】容量为100的样本,其数据分布在2,18,将样本数据分为4组:2,6,6,10,10,14,14,18,得到频率分布直方图如图所示.则下列说法不正确的是A. 样本数据分布在6,10的频率为0.32B. 样本数据分布在10,14的频数为40C. 样本数据分布在2,10的频数为40D. 估计总体数据大约有10%分布在10,14【答案】DD不正确.故选D.6.【四川省雅安市2017-2018学年高二上学期期末考试】某高校进行自主招生,先从报名者中筛选出400人参加笔试,再按笔试成绩择优选出100人参加面试,现随机调查了24名笔试者的成绩,如下表所示:据此估计允许参加面试的分数线大约是()A. 75B. 80C. 85D. 90【答案】B故选B7.【四川省成都市2017-2018学年高二上学期期末调研考试】容量为100的样本,其数据分布在2,18,将样本数据分为4组:2,6,6,10,10,14,14,18,得到频率分布直方图如图所示,则下列说法不正确的是()A. 样本数据分布在6,10的频率为0.32B. 样本数据分布在10,14的频数为40C. 样本数据分布在2,10的频数为40D. 估计总体数据大约有10%分布在10,14【答案】D【解析】总体数据分布在10,14的概率为0.140% 0.020.080.10.05故选D8.【广西南宁市第二中学(曲靖一中、柳州高中)2017-2018学年高二上学期末期考试】2014年5月,国家统计局公布了《2013年农民工监测调查报告》,报告显示:我国农民工收入持续快速增长.某地区农民工人均月收入增长率如图1,并将人均月收入绘制成如图2的不完整的条形统计图.根据以上统计图来判断以下说法错误的是()A. 2013年农民工人均月收入的增长率是.B. 2011年农民工人均月收入是元.C. 小明看了统计图后说:“农民工2012年的人均月收入比2011年的少了”.D. 2009年到2013年这五年中2013年农民工人均月收入最高.【答案】C9.【四川省遂宁市2017-2018学年高二上学期期末考试】供电部门对某社区位居民2017年12月份人均用电情况进行统计后,按人均用电量分为,,,,五组,整理得到如下的频率分布直方图,则下列说法错误的是A. 月份人均用电量人数最多的一组有人B. 月份人均用电量不低于度的有人C. 月份人均用电量为度D. 在这位居民中任选位协助收费,选到的居民用电量在一组的概率为【答案】C。
2.2.2频率分布直方图与折线图(二)2.2.3茎叶图一、填空题1.某调查机构调查了某地100个新生婴儿的体重,并根据所得数据画出了样本的频率分布直方图(如图所示),则新生婴儿的体重(单位:kg)在[3.2,4.0)的人数是______.2.随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图.根据茎叶图判断________班的平均身高较高.3.为了调查某厂工人生产某种产品的能力,现随机抽查了200名工人某天生产该产品的数量.产品数量的分组区间为[45,55),[55,65),[65,75),[75,85),[85,95],由此得到频率分布直方图如图所示,则这200名工人中一天生产该产品数量在[55,75)的人数是________.4.甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别为________和________.5.一次选拔运动员,测得7名选手的身高(单位:cm)分布茎叶图为⎪⎪⎪ 1817⎪⎪⎪0 10 3 x 8 9记录的平均身高为177 cm ,有一名候选人的身高记录不清楚,其末位数记为x ,那么x 的值为________________________________________________________________________. 6.在样本的频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形的面积和的14,且样本容量为160,则中间一组的频数为______.7.参加CBA 2013~2014赛季的甲、乙两支球队,统计两队队员的身高(单位:cm)茎叶图如下(以十位百位为茎,个位为叶):则由图知________队队员的身高更整齐些.8.某中学高一(2)班甲、乙两名同学自高中以来每次考试成绩的茎叶图如图,则________同学发挥较稳定,平均成绩________同学较高.(填“甲”或“乙”)9.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是________.(填序号)10.某个容量为100的样本的频率分布直方图如下图所示,则在区间[4,5)上的数据的频数..为______.二、解答题11.有一个容量为50的样本,数据分组及各组的频数如下:[12.5,15.5),3;[15.5,18.5),8;[18.5,21.5),9;[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),5;[30.5,33.5],4.(1)列出样本频率分布表;(2)画出频率分布直方图;(3)画出频率折线图.12.在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,你会得到什么结论?13.某市2014年4月1日-4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成频率分布表;(2)作出频率分布直方图;(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.答案精析1.40解析 频率分布直方图反映样本的频率分布,每个小矩形的面积等于样本数据落在相应区间上的频率,故新生婴儿的体重在[3.2,4.0)的人数为100×(0.4×0.625+0.4×0.375)=40. 2.乙解析 由茎叶图可知:甲班身高集中于160~179之间,而乙班身高集中于170~180之间.因此乙班平均身高高于甲班. 3.130解析 由频率分布直方图可得,一天生产该产品数量在[55,75)的频率是(0.040+0.025)×10=0.65,所以人数为0.65×200=130. 4.24 23 解析 x 甲=110(10×2+20×5+30×3+17+6+7)=24, x乙=110(10×3+20×4+30×3+17+11+2)=23. 5.8解析 由茎叶图可知10+11+3+x +8+97=7,解得x =8. 6.32解析 设中间一个小长方形的面积为x , 由题意知,x +4x =1,所以x =15.则中间一组的频数为15×160=32.7.甲解析 由茎叶图知甲队身高大部分是2米零几,而乙队身高拉得较开. 8.乙 乙解析 从茎叶图可知乙同学的成绩在80~90分分数段的有9次,而甲同学的成绩在80~90分分数段的只有7次;再从题图上还可以看出,乙同学的成绩集中在90~100分分数段的最多,而甲同学的成绩集中在80~90分分数段的最多.故乙同学发挥较稳定且平均成绩也比甲同学高.9.①解析由于频率分布直方图的组距为5,去掉③④,又[0,5),[5,10)两组各一人,应选图①.10.30解析样本数据在(1,4)和(5,6)上的频率为(0.05+0.10+0.40+0.15)×1=0.7,故样本数据在(4,5)上的频率为1-0.7=0.3,其频数为100×0.3=30.11.解(1)频率分布表如下:累计频数频率分组频数[12.5,15.5)330.06[15.5,18.5)1180.16[18.5,21.5)2090.18[21.5,24.5)31110.22[24.5,27.5)41100.20[27.5,30.5)4650.10[30.5,33.5]5040.08合计50 1.00(2)频率分布直方图如下:(3)频率折线图为12.解(1)(2)电脑杂志上每个句子的字数集中在10~30之间;而报纸上每个句子的字数集中在20~40之间.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为科普读物需要通俗易懂、简明.13.解(1)频率分布表如下:分组累计频数频数频率[41,51)222 30[51,61)311 30[61,71)744 30[71,81)1366 30[81,91)231010 30[91,101)2855 30[101,111]3022 30合计301 (2)频率分布直方图如图所示:(3)答对下述两条中的一条即可:①该市有一个月中空气污染指数有2天处于优的水平,占当月天数的115;有26天处于良的水平,占当月天数的1315;处于优或良的天数为28,占当月天数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115;污染指数在80以上的接近轻微污染的天数15,加上处于轻微污染的天数2,占当月天数的1730,超过50%;说明该市空气质量有待进一步改善.。
高考频率分布直方图知识点高考题频率分布直方图知识点在学生的学习生涯中,高考是一个极为重要的里程碑。
为了能在高考中取得好成绩,学生们不仅要掌握各学科的基础知识,还需要熟悉高考题型和考点。
而对于数学科目来说,直方图是高考频率分布的一个重要知识点。
下面将以直方图为主题,讨论其相关知识点。
直方图是一种用来表示数据分布情况的图形。
它由一系列高度不等的矩形组成,每个矩形代表一个数据区间,高度表示该区间内数据的频数或频率。
首先,我们先来了解一下直方图的构成。
直方图的横轴通常表示数据的取值范围,纵轴表示频数或频率。
每个矩形的宽度可以根据数据的分布情况来确定,它们可以等宽也可以不等宽。
矩形的高度则代表了数据的频数或频率。
直方图的制作需要经过以下几个步骤。
首先,根据给定的数据集,将数据按照一定的区间进行分组。
一般来说,划分区间时需要保证每个区间的宽度相等,并且包含足够多的数据点。
然后,统计每个区间内的数据个数或频率,并将其绘制成对应高度的矩形。
最后,根据实际需要,可以给直方图添加标题和坐标轴标签等。
直方图不仅能够展示数据的分布情况,还可以帮助我们观察和分析数据的特征和规律。
通过观察直方图,我们可以了解到数据的集中趋势、离散程度以及异常值等重要信息。
比如,直方图的峰度可以反映数据的分布形态是平坦还是陡峭,而直方图的偏度可以反映数据的偏斜程度。
在考试中,直方图也被广泛应用于频率分布题目中。
考生需要根据给定的数据分布情况,回答一些与直方图相关的问题。
例如,考生可以根据直方图估计数据的平均值、中位数和众数等统计指标。
同时,直方图还可以帮助考生判断数据是否满足正态分布或其他特定分布形态。
此外,在解答与直方图相关的题目时,考生还需要熟悉直方图的性质和特点。
例如,直方图的面积表示数据的频数或频率总和。
而不同的数据分布形态会对直方图的形状产生影响。
当数据分布近似正态分布时,直方图呈现出钟形曲线,对称分布的数据则呈现出对称形状的直方图。
2.2.3 茎叶图掌握茎叶图的意义及画法,并能在实际问题中用茎叶图进行数据统计.(重点、难点)[基础·初探]教材整理茎叶图阅读教材P60~P61“练习”上面的部分,并完成下列问题.1.茎叶图的定义将样本数据有条理的列出来,从中观察样本分布情况的图称为茎叶图.2.茎叶图的适用范围当样本数据较少时,用茎叶图表示数据的效果较好.3.茎叶图的制作方法(1)画“茎”:“茎”表示两位数的十位数字,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,再画上竖线作为分界线.(2)添“叶”:“叶”画在分界线的另一侧表示两位数的个位数字,共茎的叶一般按从小到大(或从大到小)的顺序同行列出.4.茎叶图刻画数据的优缺点(1)茎叶图刻画数据的优点:①所有的信息都可以从茎叶图中得到.②茎叶图便于记录和表示.(2)茎叶图刻画数据的缺点:当样本数据很多时,茎叶图的效果就不是很好了.填空:(1)用茎叶图表示一组两位数据时,数据的个数________茎叶图中叶的个数.(填“>”“=”“<”)【解析】因为每个数的个位数都要写在表示叶的那一栏中,故数据的个数与茎叶图中叶的个数相等.【答案】=(2)如图2214表示8位销售员一个月销售商品数量的茎叶图,则销售数量分别为________(单位:百件).图2214【解析】由茎叶图知“茎”表示十位“叶”表示个位.【答案】45,45,52,56,57,58,60,63[小组合作型]甲的得分:95,81,75,89,71,65,76,88,94,110,107;乙的得分:83,86,93,99,88,103,98,114,98,79,101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.【导学号:11032041】【精彩点拨】确定茎和叶→画出茎叶图→对两人成绩作出判断比较【自主解答】甲、乙两人数学成绩的茎叶图,如图所示.从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,大多集中在80~100之间,中位数是98分;甲同学的得分情况除一个特殊得分外,也大致对称,多集中在70~90之间,中位数是88分,但分数分布相对于乙来说,趋于分散.因此,乙同学发挥比较稳定,总体得分情况比甲同学好.1.画茎叶图关键是分清茎和叶,一般来说数据是两位数的,十位上数字为“茎”,个位数字为“叶”;如果是小数的,通常把整数部分作为“茎”,小数部分作为“叶”,解题时要合理的选择茎和叶.2.在画茎叶图时,对于重复出现的数据要重复记录,不要遗漏.[再练一题]1.在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.(1)画出两组数据的茎叶图;(2)比较分析两组数据,能得出什么结论?【解】(1)依题意画出茎叶图,如图所示:(2)电脑杂志文章中每个句子的字数集中在10~20之间,而报纸文章中每个句子的字数集中在20~30之间,还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少,说明电脑杂志作为科普读物要简明,通俗易懂.8∶00~12∶00间各自的车流量(单位:百辆),得到如图2215所示的茎叶图,根据茎叶图回答下列问题:图2215(1)甲交通站的车流量在[10,40]间的频率是多少?(2)甲、乙两个交通站哪个更繁忙?并说明理由.【精彩点拨】根据茎叶图中的数据进行分析并作出说明.【自主解答】 (1)甲交通站的车流量在[10,40]间的频率为414=27. (2)甲交通站的车流量集中在茎叶图的下方,而乙交通站的车流量集中在茎叶图的上方,从数据的分布情况来看,甲交通站更繁忙.1.利用茎叶图进行分析时要首先分清楚茎与叶所表示的意义及叶的排列规律,茎叶图直观地表示了数据的集中、离散的程度以及中位数、众数等特征.2.茎叶图既可以用于分析单组数据,也可以用于对两组数据进行比较分析.[再练一题]2.下面是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图2216可知,下列说法不正确的是________.(填序号)图2216①甲运动员的成绩好于乙运动员;②乙运动员的成绩好于甲运动员;③甲、乙两名运动员的成绩没有明显的差异;④甲运动员的最低得分为0分.【解析】 由图可知,甲运动员的成绩比较集中,且平均得分大约在30多分,乙运动员得分也大致对称,平均得分在20多分,甲运动员最低分10分,乙运动员最低分8分,故①正确.【答案】 ②③④[探究共研型]探究1 的,他们各有什么优缺点? 【导学号:11032042】【提示】【提示】 (1)当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.(2)正确利用三种分布的描述方法,都能得到一些有关分布的主要特点(如分布是否具有对称性、样本点落在各分组中的频率等),这些主要特点受样本的随机性的影响比较小,更接近于总体分布的特点.某统计机构从甲、乙两个城市所有的自动售货机中分别随机抽取了16台,记录一上午各自的销售情况:(元)甲:18,8,10,43,5,30,10,22,6,27,25,58,14,18,30,41.乙:22,31,32,42,20,27,48,23,38,43,12,34,18,10,34,23.试选用适当的方法表示上面的数据并简要说明选取该种方法的理由.【精彩点拨】 由于是两组数据,且数据个数不多,可选用茎叶图表示数据.【自主解答】 从题目中的数据不易直接看出各自的分布情况,为此,我们将以上数据用茎叶图表示,茎叶图如图所示,两竖线中间的数字表示甲、乙销售额的十位数字,两边的数字表示甲、乙销售额的个位数字.理由如下:茎叶图既可以用于分析单组数据,也可以用于对两组数据进行比较分析.用茎叶图刻画数据有两个优点:一是所有的信息都可以从这张茎叶图中得到,二是茎叶图便于记录和表示.茎叶图保留了数据信息,对数据的记录和表示很方便.但当样本数据很多时,茎叶图的效果就不是很好了,解题时应根据解决问题的特点和关注的主要方面有选择的应用.[再练一题]3.某化肥厂有甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其重量并分别记录如下:甲:52,51,49,48,53,48,49;乙:60,65,40,35,25,65,60.(1)这种抽样方法是哪一种抽样方法?(2)画出茎叶图,并说明哪个车间的产品比较稳定.【解】(1)该抽样方法为系统抽样法.(2)茎叶图如图所示.由图可以看出甲车间包装的产品质量较集中,而乙车间包装的产品质量较分散,说明甲车间产品质量较稳定.1.如图2217是甲参加物理考试的成绩.图2217从图中可知甲参加的次数为________.【解析】由于茎叶图中重复的数字要一一列举出来,可知甲参加8次考试.【答案】82.在茎叶图2218中比40大的数据有________个.图2218【解析】由茎叶图知比40大的有47,48,49,共3个.【答案】 33.甲、乙两个班级各随机选出15名同学进行测试,成绩(单位:分)的茎叶图如图2219所示.图2219则甲、乙两班的最高成绩各是________分,从图中看,________班的平均成绩较高.【解析】由茎叶图可知甲班最高成绩为96,乙班最高成绩为92.由于乙班的成绩集中在60~80之间,故乙班的平均成绩高.【答案】96,92 乙4.为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校400名授课教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示如图2220.图2220据此可估计该校上学期400名教师中,使用多媒体进行教学次数在[16,30)内的人数为________.【解析】由茎叶图数据可知,在20名教师中,使用多媒体在[16,30)内的人数为8人,则在400名教师中共有400×820=160人.【答案】1605.心理教育专家对某班50人进行智力测验,其得分如下:48,65,52,86,71,48,64,41,86,79,71,68,82,84,68,64,62,68,81,57,90,52,74,73,56,78,4 7,66,55,64,56,88,69,40,73,97,68,56,67,59,70,52,79,44,55,69,62,58,32,58.(1)这次测验成绩中的最大值和最小值是多少?(2)画出并分析这50人成绩的茎叶图,你能得出什么结论?【解】(1)这次测验成绩中的最大值为97,最小值为32.(2)画出茎叶图如下图所示.从茎叶图上可以明显看出学生的成绩大都在50到70之间,且分布较对称,集中程度较高,符合学生正常的智力水平.。
专题14频率分布直方图与数字特征-2018年高考数学三轮复习大题疯狂练(通用解析版)1.为选拔选手参加“中国诗词大会”,某中学举行一次“诗词大赛”活动.为了了解本次竞赛学生的成绩情况,从中抽取了部分学生的分数(得分取正整数,满分为100分)作为样本(样本容量为n )进行统计.按照50,60),60,70),70,80),80,90),90,100的分组作出频率分布直方图,并作出样本分数的茎叶图(图中仅列出了得分在50,60),90,100的数据).[[[[[][[](1)求样本容量n 和频率分布直方图中x 、y 的值;(2)在选取的样本中,从竞赛成绩在80分以上(含80分)的学生中随机抽取2名学生参加“中国谜语大会”,设随机变量X 表示所抽取的2名学生中得分在80,90)内的学生人数,求随机变量X 的分布列及数学期望.[【答案】(1)见解析;(2)见解析.【解析】试题分析:(1)由频率分布直方图及题意可得样本容量n 与x 、y 的值;(2)抽取的2名学生中得分在80,90)的人数X 可能取值0,1,2,求出相应的概率值,即可得到随机变量X 的分布列及数学期望.[抽取的2名学生中得分在80,90)的人数X 可能取值0,1,2,2112C 10C 10C 30C 303529则P (X =0)=2=,P (X =1)=,,=P X =2==()22C 4052C 4013C 4052[则X 的分布列为所以EX =0⨯35293+1⨯+2⨯=.52135222.某网站从春节期间参与收发网络红包的手机用户中随机抽取10000名进行调查,将受访用户按年龄分成5组:[10,20),[20,30),…,[50,60],并整理得到如下频率分布直方图:(Ⅰ)求a 的值;(Ⅱ)从春节期间参与收发网络红包的手机用户中随机抽取一人,估计其年龄低于40岁的概率;(Ⅲ)估计春节期间参与收发网络红包的手机用户的平均年龄.【答案】(Ⅰ)a =0.035;(Ⅱ)0.75;(Ⅲ)32.5.试题解析:(Ⅰ)根据频率分布直方图可知,10⨯(a+0.005+0.01+0.02+0.03)=1,解得a=0.035.(Ⅱ)根据题意,样本中年龄低于40的频率为10⨯(0.01+0.035+0.03)=0.75,所以从春节期间参与收发网络红包的手机用户中随机抽取一人,估计其年龄低于40岁的概率为0.75.(Ⅲ)根据题意,春节期间参与收发网络红包的手机用户的平均年龄估计为15⨯0.1+25⨯0.35+35⨯0.3+45⨯0.2+55⨯0.05=32.5(岁).3.为了弘扬民族文化,某中学举行了“我爱国学,传诵经典”考试,并从中随机抽取了60名学生的成绩(满分100分)作为样本,其中成绩不低于80分的学生被评为优秀生,得到成绩分布的频率分布直方图如图所示.(1)若该所中学共有2000名学生,试利用样本估计全校这次考试中优秀生人数;(2)(i)试估计这次参加考试的学生的平均成绩(同一组数据用该组区间的中点值作代表);(ii)若在样本中,利用分层抽样的方法从成绩不低于70分的学生中随机抽取6人,再从中抽取3人赠送一套国学经典学籍,试求恰好抽中2名优秀生的概率.【答案】(1)600;(2)(i)72.5;(ii).试题解析;(1)由直方图可知,样本中数据落在则估计全校这次考试中优秀生人数为(2)(i )设样本数据的平均数为,则则估计所有参加考试的学生的平均成绩为72.5..的频率为,,所以恰好抽中2名优秀生的概率为【点睛】统计中的四个数据特征.(1)众数:在样本数据中,出现次数最多的那个数据.(2)中位数:样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.(3)平均数:样本数据的算术平均数,即= (x 1+x 2+…+x n ).(其中频率分布直方图中,用每组数据中点数表示)(4)方差与标准差.s 2= [(x 1-)2+(x 2-)2+…+(x n -)2],4.2018年中央电视台春节联欢晚会分会场之一落户黔东南州黎平县肇兴侗寨,黔东南州某中学高二社会实践小组就社区群众春晚节目的关注度进行了调查,随机抽取80名群众进行调查,将他们的年龄分成6段:[20,30),[30,40),[40,50),[50,60),[60,70),[70,80],得到如图所示的频率分布直方图.(Ⅰ)求这80名群众年龄的中位数;(Ⅱ)将频率视为概率,现用随机抽样方法从该社区群众中每次抽取1人,共抽取3次,记被抽取的3人中年龄在30,40)的人数为ξ,若每次抽取的结果是相互独立的,求ξ的分布列,及数学期望E (ξ).[【答案】(Ⅰ)55;(Ⅱ)答案见解析.【解析】试题分析:(1)设80名群众年龄的中位数为x ,根据频率分布直方图数据即可求出x 的值,即80名群众年龄的中位数(2)求出年龄在[30,40)的概率,由题意可知ξ~B 3,⎪,ξ的所有可能取值为⎛1⎫⎝10⎭01,,2,3,求出相对应的概率,即可求得ξ的分布列,及数学期望E (ξ)(Ⅱ)由频率分布直方图可知,任意抽取1名群众,年龄恰在[30,40)的概率为1,10由题意可知ξ~B 3,⎪,ξ的所有可能取值为0,1,2,3,⎛1⎫⎝10⎭0937290⎛1⎫1⎛1⎫P (ξ=0)=C 3()=P ξ=1=C ()3 ⎪⎪1000⎝10⎭10⎝10⎭21243⎛9⎫,= ⎪101000⎝⎭3227⎛1⎫93⎛1⎫P (ξ=3)=C 3P (ξ=2)=C 32 ⎪()1=⎪1000⎝10⎭10⎝10⎭1⎛9⎫=⎪⎝10⎭10000X 的分布列为ξ0123P7291000243100027100011000所以E (ξ)=0⨯729243271300313+1⨯+2⨯+3⨯==.或者E (ξ)=3⨯=100010001000100010001010105.树立和践行“绿水青山就是金山银山,坚持人与自然和谐共生”的理念越来越深入人心,已形成了全民自觉参与,造福百姓的良性循环.据此,某网站退出了关于生态文明建设进展情况的调查,调查数据表明,环境治理和保护问题仍是百姓最为关心的热点,参与调查者中关注此问题的约占明建设的人群中随机选出200人,并将这200人按年龄分组:第1组第4组,第5组,得到的频率分布直方图如图所示.,第2组.现从参与关注生态文,第3组,(1)求出的值;(2)求这200人年龄的样本平均数(同一组数据用该区间的中点值作代表)和中位数(精确到小数点后一位);(3)现在要从年龄较小的第1,2组中用分层抽样的方法抽取5人,再从这5人中随机抽取3人进行问卷调查,求这2组恰好抽到2人的概率.【答案】(1)(2)平均数为41.5,中位数为(3)5人中随机抽取3人,共10个基本事件,从而得到第2组中抽到2人的概率.试题解析:(1)由(2)平均数为;设中位数为,则,得.岁;岁.(3)第1,2,3组的人数分别为20人,30人,从第1,2组中用分层抽样的方法抽取5人,则第1,2组抽取的人数分别为2人,3人,分别记为设从5人中随机抽取3人,为.,共10个基本事件,从而第2组中抽到2人的概率.6.某地区工会利用“健步行APP”开展健步走积分奖励活动.会员每天走5千步可获积分30分(不足5千步不积分),每多走2千步再积20分(不足2千步不积分).为了解会员的健步走情况,工会在某天从系统中随机抽取了1000名会员,统计了当天他们的步数,并将样本数据分为3,5),5,7),7,9),9,11),[[[[[11,13),[13,15),[15,17),[17,19),[19,21]九组,整理得到如下频率分布直方图:(Ⅰ)求当天这1000名会员中步数少于11千步的人数;(Ⅱ)从当天步数在11,13),13,15),15,17)的会员中按分层抽样的方式抽取6人,再从这6人中随机抽取2人,求这2人积分之和不少于200分的概率;(Ⅲ)写出该组数据的中位数(只写结果).【答案】(1) 300人;(2)[[[437;(3).53【解析】试题分析:(1)根据条形分布直方图中的数据得到健步走的步数在5,7)内的人数为60,在7,9)内的人数为100,在91,1[[[共得到300人;(2)根据分层抽样的概念得到在[11,13))内的人数为100,内应抽取3人,每人的积分是90分,在13,15)内应抽取2人,每人的积分是110分,在15,17)内应抽取[[1人,每人的积分是130分,再根据古典概型的公式得到概率值;(3)由中位数的概念,根据直方图可求出结果.解析:(Ⅰ)这1000名会员中健步走的步数在3,5)内的人数为0.02⨯2⨯1000=40;健步走的步数在5,7)内的人数为0.03⨯2⨯1000=60;健步走的步数在7,9)内的人数为0.05⨯2⨯1000=100;健步走的步数在9,11)内的人数为0.05⨯2⨯1000=100;[[[[40+60+100+100=300.所以这1000名会员中健步走的步数少于11千步的人数为300人.从6人中随机抽取2人,有a 1a 2,a 1a 3,a 1b 1,a 1b 2,a 1c ,a 2a 3,a 2b 1,a 2b 2,a 2c ,a 3b 1,a 3b 2,a 3c ,b 1b 2,b 1c ,b 2c 共15种方法.所以从6人中随机抽取2人,这2人的积分之和不少于200分的有a 1b 1,a 1b 2,a 1c ,a 2b 1,a 2b 2,a 2c ,a 3b 1,a 3b 2,a 3c ,b 1b 2,b 1c ,b 2c 共12种方法.设从6人中随机抽取2人,这2人的积分之和不少于200分为事件A ,则P (A )=124=.155所以从6人中随机抽取2人,这2人的积分之和不少于200分的概率为(Ⅲ)中位数为4.537.3。
(时间:40分钟)1.PM2.5是指大气中直径小于或等于2。
5微米的颗粒物,一般情况下PM2.5浓度越大,大气环境质量越差.如图所示的茎叶图表示的是某市甲、乙两个监测站连续10日内每天的PM2。
5浓度读数(单位:μg/m3),则下列说法正确的是( )A.甲、乙监测站读数的极差相等B.乙监测站读数的中位数较大C.乙监测站读数的众数与中位数相等D.甲、乙监测站读数的平均数相等答案C解析因为甲、乙监测站读数的极差分别为55,57,所以A错误;甲、乙监测站读数的中位数分别为74,68,所以B错误;乙监测站读数的众数与中位数都是68,所以C正确,因此选C.2.某企业为了解下属某部门对本企业职工的服务情况,随机访问50名职工,根据这50名职工对该部门的评分,得到频率分布直方图如图所示,其中样本数据分组区间为,则频率分布直方图中a的值为( )A.0.005 B.0。
006C.0。
05 D.0.06答案B解析因为(0。
004+a+0.018+0.022×2+0。
028)×10=1,所以a=0.006.选B.3.如图是某电视台综艺节目举办的挑战主持人大赛上七位评委为某选手打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为()A.84,4.8 B.84,1。
6C.85,4 D.85,1.6答案D解析去掉最高分和最低分后,所剩数据的平均数为错误!=80+错误!(4×3+6+7)=85,方差为s2=错误!=1。
6。
4.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差答案C解析甲的平均数是错误!=6,中位数是6,极差是4,方差是错误!=2;乙的平均数是错误!=6,中位数是5,极差是4,方差是错误!=错误!,故选C.5.设样本数据x1,x2,…,x10的均值和方差分别为1和4,若y i=x i+a(a为非零常数,i=1,2,…,10),则y1,y2,…,y10的均值和方差分别为( )A.1+a,4 B.1+a,4+aC.1,4 D.1,4+a答案A解析由均值和方差的定义及性质可知:错误!=错误!+a=1+a,s2y=s错误!=4,故选A。
频率分别直方图与茎叶图练习题1第三组的频数和频率分别是 ( ) A .14和0.14 B .0.14和14 C .141和0.14 D . 31和1412.为了了解初三学生女生身高情况,某中学对初三女生身高进行了一次测量,所得数据整理后列出了(1)求出表中,,,m n M N 所表示的数分别是多少? (2)画出频率分布直方图.(3)全体女生中身高在哪组范围内的人数最多?3.200辆汽车通过某一段公路时的时速的频率分布直方图如右图所示,则时速在[60,70)的汽车大约有( ) (A) 30辆 (B) 40辆(C) 60辆(D) 80辆)4年降水量/mm [ 100, 150 ) [ 150, 200 ) [ 200, 250 ) [ 250, 300 ] 概率0.21 0.16 0.13 0.125.如图,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如下:观察图形,回答下列问题:(1)79.5---89.5这一组的频数、频率分别是多少?(2)估计这次环保知识竞赛的及格率(60分及以上为及格)6. 某班有50名学生,在学校组织的一次数学质量抽测中,如果按照抽测成绩的分数段[60,65),[65,70),…[95,100)进行分组,得到的分布情况如图所示.求:(Ⅰ)该班抽测成绩在[70,85)之间的人数;(Ⅱ)该班抽测成绩不低于85分的人数占全班总人数的百分比.5101520成绩人数60 65 70 75 80 85 90 95 1007 观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重在(]2700,3000的频率为8 从两个班中各随机的抽取10名学生,他们的数学成绩如下:画出茎叶图9.某中学对高三年级进行身高统计,测量随机抽取的40名学生的身高,其结果如下(单位:cm)(1)列出频率分布表;(2)画出频率分布直方图;(3)估计数据落在[150,170]范围内的概率。
频率分布直方图-2018届高三理科数学精品复习讲义与跟踪训练教师版I .题源探究·黄金母题【例1】若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是 ( )A .91.5和91.5B .91.5和92C .91和91.5D .92和92 【答案】A【例2】如图是某城市100位居民去年的月均用水量(单位:t )的频率分布直方图,月均用水量在区间[)1.5,2.5的居民大约有 ( )A .37位B .40位C .47位D .52位 【答案】C【解析】由频率分布直方图月均用水量在区间[)1.5,2的频率为0.450.50.225⨯=,月均用水量在区间[)2,2.5的居民的频率 为精彩解读【试题来源】例1:人教A 版必修3P 70改编;例2:人教A 版必修3P 65例题改编.【母题评析】这类题主要考查平均数、方差的计算以及茎叶图与频率分布直方图的简单应用. 【思路方法】用样本估计总体是统计的基本方法:(1)最高的矩形的中点横坐标即众数;(2)中位数左边和右边的直方图的面积是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.0.50050.25⨯=..月均用水量在区间[)1.5,2.5的居民的频数大约为()0.2250.2510047+⨯=,故选C.II.考场精彩·真题回放【例1】【2017高考新课标3理3】某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳【答案】A客量波动性大,D选项正确.故选A.【例2】【2017高考新课标1文2】为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差【命题意图】这类重点题考查分层抽样和系统抽样的计算.考查考生基本计算能力.【考试方向】这类试题在考查题型上,主要以选择题或填空题为主,属于中低档题.【难点中心】1.将频率分布直方图中相邻的矩形的上底边的中点顺次连结起来,就得到一条折线,我们称这条折线为本组数据的频率折线图,频率分布折线图的的首、尾两端取值区间两端点须分别向外延伸半个组距,即折线图是频率分布直方图的近似,他们比频率分布表更直观、形象地反映了样本的分布规律.2.分清几个样本特征数:众数:一组数据出现次数最多的数叫众数,众数反应一组数据的多数水平;中位数:一组数据中间的数,(起到分水岭的作用)中位数反应一组数据的中间水平;平均数:反应一组数据的平均水平;方差:方差是和中心偏离的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数【答案】B【解析】刻画评估这种农作物亩产量稳定程度的指标是标准差,故选B.【例3】【2017高考山东文8】如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为A.3,5 B.5,5 C.3,7 D.5,7【答案】A得3x .故选A.【例4】【2017高考北京文17】某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),┄,[80,90],并整理得到如下频率分布直方图:大小)并把它叫做这组数据的方差.在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定.标准差是方差的算术平方根,意义在于反映一个数据集的离散程度.3.用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法.分布表在数量表示上比较准确,直方图比较直观.4.频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率; (Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(Ⅲ)已知样本中有一半男生的分数学不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例. 【答案】(Ⅰ)0.4;(Ⅱ)20;(Ⅲ):32.(Ⅱ)根据题意,样本中分数不小于50的频率为(0.010.020.040.02)100.9+++⨯=,分数在区间[40,50)内的人数为1001000.955-⨯-=.所以总体中分数在区间[40,50)内的人数估计为540020100⨯=. (Ⅲ)由题意可知,样本中分数不小于70的学生人数为(0.020.04)1010060+⨯⨯=,所以样本中分数不小于70的男生人数为160302⨯=. 所以样本中的男生人数为30260⨯=,女生人数为1006040-=,男生和女生人数的比例为60:403:2=.所以根据分层抽样原理,总体中男生和女生人数的比例估计为3:2.III .理论基础·解题原理⑴一表二图:①频率分布表——数据详实 ②频率分布直方图——分布直观③频率分布折线图——便于观察总体分布趋势 注:总体分布的密度曲线与横轴围成的面积为1. ⑵茎叶图:①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众位数等. ②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写.3.总体特征数的估计: ⑴平均数:nx x x x x n++++=321;取值为n x x x ,,,21 的频率分别为n p p p ,,,21 ,则其平均数为n n p x p x p x +++ 2211;注意:频率分布表计算平均数要取组中值.⑵方差与标准差:一组样本数据n x x x ,,,21 方差:212)(1∑=-=ni ix xns ;标准差:21)(1∑=-=ni ix xns注:方差与标准差越小,说明样本数据越稳定.平均数反映数据总体水平;方差与标准差反映数据的稳定水平.IV .题型攻略·深度挖掘【考试方向】这类试题在考查题型上,通常以选择题或填空题的形式出现,难度中等. 【技能方法】1.解题模板:第一步,根据频率分布直方图计算出相应的频率;第二步,运用样本的频率估计总体的频率;第三步,得出结论.2.用样本估计总体是统计的基本思想.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.3.(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量,与每个样本数据有关,这是中位数、众数所不具有的性质.(2)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大. 4.茎叶图、频率分布表和频率分布直方图都可直观描述样本数据的分布规律. 【易错指导】1.在使用茎叶图时,一定要注意看清楚所有的样本数据,弄清楚这个图中的数字特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义.2.利用频率分布直方图求众数、中位数与平均数时,应注意这三者的区分:(1)最高的矩形的中点横坐标即众数;(2)中位数左边和右边的直方图的面积是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.3.直方图与条形图不要搞混频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.V .举一反三·触类旁通考向1 茎叶图及其应用【例1】【2018黑龙江齐齐哈尔高三第一次模】某校连续12天对同学们的着装进行检查,着装不合格的人数用茎叶图表示,如图,则该组数据的中位数是A .24B .26C .27D .32 【答案】CC . 【例2】【2018江西上饶高三下学期二模】如图1是某学习小组学生在某次数学考试中成绩的茎叶图,1号到20号同学的成绩依次为1220,,,a a a ,图2是统计茎叶图中成绩在一定范围内的学生人数的程序框图,那么该框图的输出结果是( )A .8B .9C .11D .12 【答案】A【例3】某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.【答案】(1)75,75;(2)0.1,0.16;(3)该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为550=0.1,850=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.规律方法(1)茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况.(2)①作样本的茎叶图时先要根据数据特点确定茎、叶,再作茎叶图;作“叶”时,要做到不重不漏,一般由内向外,从小到大排列,便于数据的处理.②根据茎叶图中数据数字特征进行分析判断考查识图能力,判断推理能力和创新应用意识;解题的关键是抓住“叶”的分布特征,准确提炼信息.【跟踪练习】1.【2018河南安阳高三二模】在某校连续5次考试成绩中,统计甲,乙两名同学的数学成绩得到如图所示的茎叶图.已知甲同学5次成绩的平均数为81,乙同学5次成绩的中位数为73,则x y+的值为()A.3B.4C.5D.6【答案】A【解析】77 81+=因为乙同学5次成绩的中位数为73,所以33,y x y =∴+=选A .2.【2018山西平遥中学高三3月高考适应性调研】某学校A 、B 两个班的数学兴趣小组在一次数学对抗赛中的成绩绘制茎叶图如下,通过茎叶图比较两班数学兴趣小组成绩的平均值及方差①A 班数学兴趣小组的平均成绩高于B 班的平均成绩 ②B 班数学兴趣小组的平均成绩高于A 班的平均成绩 ③A 班数学兴趣小组成绩的标准差大于B 班成绩的标准差 ④B 班数学兴趣小组成绩的标准差大于A 班成绩的标准差 其中正确结论的编号为( )A .①③B .①④C .②③D .②④ 【答案】B【解析】A 班:53,63,64,76,74,78,78,76,81,85,86,88,82,92,95;B 班:45,48,51,3.【2018湖北武汉武昌区高三1月调研】将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个分数的平均数为91,现场作的7个分数的茎叶图有一个数据模糊,无法辨认,在图中以x 表示,则5个剩余分数的方差为________.【答案】6 【解析】依题意8793909190915x +++++=,解得4x =.则方差为1641965+++=.【名师点睛】本题主要考查茎叶图的分辨,考查平均数的计算,考查方差的计算.从茎叶图可以看出最低分是87,最高分是99,去掉这两个分数后,可利用平均数的公式列方程来求出x 的值.根据前面求出的值再利用方差的计算公式()211n i i x x n =-∑来计算方差.考向2 频率分布直方图【例4】某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A .56B .60C .120D .140【答案】D【解析】由频率分布直方图可知每周自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,则每周自习时间不少于22.5小时的人数为0.7×200=140,故选D .【例5】某校从高一年级学生中随机抽取100名学生,将他们期中考试的数学成绩(均为整数)分成六段:[40,50),[50,60),…,[90,100]后得到频率分布直方图(如下图所示),则分数在[70,80)内的人数是 .【答案】30【解析】由频率分布直方图知小长方形面积为对应区间概率,所有小长方形面积和为1,因此分数在[70,80)内的概率为3.010)005.0010.02015.0025.0(1=⨯++⨯+-,人数为301003.0=⨯ 【例6】我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),……,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.【答案】(1)0.30;(2)36 000;(3)2.04.(2)由(1)知,该市100位居民中月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5.又前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5.所以2≤x<2.5.由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.【名师点睛】(1)准确理解频率分布直方图的数据特点,频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率和条形图混淆.(2)“命题角度二”的例题中抓住频率分布直方图中各小长方形的面积之和为1,这是解题的关键.而利用频率分布直方图可以估计总体分布.【跟踪练习】1.【2018江西高三毕业班新课程教学质量监测】如图是60名学生参加数学竞赛的成绩(均为整数)的频率分布直方图,估计这次数学竞赛的及格率(60分及以上为及格)是()A .0.9B .0.75C .0.8D .0.7 【答案】B同样可得,60分及以上的频率=(0.015+0.03+0.025+0.005)×10=0.75 估计这次数学竞赛竞赛的及格率(大于或等于60分为及格)为75%, 故选:B .【名师点睛】利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数; (2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.2.【2018贵州黔东南州联考】近年呼吁高校招生改革的呼声越来越高,在赞成高校招生改革的市民中按年龄分组,得到样本频率分布直方图如图,其中年龄在[)30,40岁的有2500人,年龄在[)20,30岁的有1200人,则m 的值为( )A .0.013B .0.13C .0.012D .0.12 【答案】C3.【2018河南六市高三第一次联考(一模)】为了解学生在课外活动方面的支出情况,抽取了n 个同学进行调查,结果显示这些学生的支出金额(单位:元)都在[]10,50,其中支出金额在[]30,50的学生有117人,频率分布直方图如图所示,则n =( )A .180B .160C .150D .200 【答案】A【解析】[]30,50对应的概率为()10.010.025100.65-+⨯=,所以117=1800.65n =,选A . 4.一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10000人中再用分层抽样方法抽出100人作进一步调查,则在[)2500,3500(元)月收入段应抽出 人.【答案】40【解析】由图(2500,3500元/月)收入段的频率是0.0005×500+0.0003×500=0.4,故用分层抽样方法抽出100人作进一步调查,则在(2500,3500元/月)收入段应抽出人数为0.4×100=40. 考向3 样本的数字特征【例7】【2018内蒙古呼和浩特高三第一次质量调研】如图为某班35名学生的投篮成绩(每人投一次)的条形统计图,其中上面部分数据破损导致数据不完全.已知该班学生投篮成绩的中位数是5,则根据统计图,无法确定下列哪一选项中的数值( )A .3球以下(含3球)的人数B .4球以下(含4球)的人数C .5球以下(含5球)的人数D .6球以下(含6球)的人数 【答案】C【解析】因为共有35人,而中位数应该是第18个数,所以第18个数是5,从图中看出第四个柱状图故选C .【例8】【2018湖南衡阳高三第二次联考(二模)】已知样本12,,,n x x x 的平均数为x ;样本12,,,m y y y 的平均数为()y x y ≠,若样本12,,,n x x x ,12,,,m y y y 的平均数()z ax 1a y =+-;其中,则()*,,n m n m N ∈的大小关系为( ) A .n m = B .n m ≥ C .n m < D .n m > 【答案】C102a <<C . 这两个小组往年研发新产品的结果如下:(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b )(a ,b ),(a ,b ),(a ,b ),(a ,b ).其中a ,a 分别表示甲组研发成功和失败;b ,b 分别表示乙组研发成功和失败.(1)若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差,并比较甲、乙两组的研发水平;(2)若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率.(2)记E ={恰有一组研发成功}.在所抽得的15个结果中,恰有一组研发成功的结果是(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),共7个.因此事件E 发生的频率为715.用频率估计概率,即得所求概率为P (E )=715.【名师点睛】(1)平均数反映了数据的中心,是平均水平,而方差和标准差反映的是数据围绕平均数的波动大小.进行平均数与方差的计算,关键是正确运用公式;(2)平均数与方差所反映的情况有着重要的实际意义,一般可以通过比较甲、乙两组样本数据的平均数和方差的差异,对甲、乙两品种可以做出评价或选择. 【跟踪练习】1.【2018贵州黔东南州高三下学期二模】甲乙两名同学6次考试的成绩统计如下图,甲乙两组数据的平均数,标准差分别为σσ甲乙,,则ABCD 【答案】C中数据显示甲同学的成绩比乙同学稳定,故σσ<甲乙.故选C .2.【2018云南昆明高三教学质量检查(二统)】“搜索指数”是网民通过搜索引擎,以每天搜索关键词的次数为基础所得到的统计指标.“搜索指数”越大,表示网民对该关键词的搜索次数越多,对该关键词相关的信息关注度也越高.下图是2017年9月到2018年2月这半年中,某个关键词的搜索指数变化的走势图.根据该走势图,下列结论正确的是( )A .这半年中,网民对该关键词相关的信息关注度呈周期性变化B .这半年中,网民对该关键词相关的信息关注度不断减弱C .从网民对该关键词的搜索指数来看,去年10月份的方差小于11月份的方差D .从网民对该关键词的搜索指数来看,去年12月份的平均值大于今年1月份的平均值 【答案】D【解析】根据走势图可知:这半年中,网民对该关键词相关的信息关注度不呈周期性变化,A 错;这半年中,网民对该关键词相关的信息关注度增减不确定,B 错;从网民对该关键词的搜索指数来看,去年10月份的搜索指数的稳定性小于11 月份的搜索指数的稳定性,所以去年10月份的方差大于11 月份的方差,C 错;从网民对该关键词的搜索指数来看,去年12月份的平均值大于今年1月份的平均值,D正确,故选D.3.【2018陕西榆林高三二模】为了反映各行业对仓储物流业务需求变化的情况,以及重要商品库存变化的动向,中国物流与采购联合会和中储发展股份有限公司通过联合调查,制定了中国仓储指数.由2016年1月至2017年7月的调查数据得出的中国仓储指数,绘制出如下的折线图.根据该折线图,下列结论正确的是()A.2016年各月的合储指数最大值是在3月份B.2017年1月至7月的仓储指数的中位数为55C.2017年1月与4月的仓储指数的平均数为52D.2016年1月至4月的合储指数相对于2017年1月至4月,波动性更大D【答案】则这5 天中,每天最高气温较为稳定(方差较小)的城市为_______.(填甲或乙). 【答案】甲【解析】甲、乙两个城市的最高气温平均值都是30,甲的方差为(方差较小)的城市为甲,故答案为甲.5.【2018山东枣庄高三二模】随着高校自主招生活动的持续开展,我市高中生掀起了参与数学兴趣小组的热潮.为调查我市高中生对数学学习的喜好程度,从甲、乙两所高中各随机抽取了40名学生,记录他们在一周内平均每天学习数学的时间,并将其分成了6个区间:(]0,10、(]10,20、(]20,30、(]30,40、(]40,50、(]50,60,整理得到如下频率分布直方图:根据一周内平均每天学习数学的时间t ,将学生对于数学的喜好程度分为三个等级:(Ⅰ)试估计甲高中学生一周内平均每天学习数学的时间的中位数m 甲(精确到0.01);(Ⅱ)判断从甲、乙两所高中各自随机抽取的40名学生一周内平均每天学习数学的时间的平均值及方差2S 甲与2S 乙的大小关系(只需写出结论)、2S 甲(同一组中的数据用该组区间的中点值作代表);(Ⅲ)从甲高中与乙高中随机抽取的80名同学中数学喜好程度为“痴迷”的学生中随机抽取2人,求选出的2人中甲高中与乙高中各有1人的概率.【答案】(Ⅰ) 26.67m ≈甲;(Ⅱ)答案见解析;(Ⅲ)【解析】试题分析:()11026.67⨯≈;()2根据所给数据求出,2S 甲,2S 乙,然后对比即可得到答案;()3求出甲高中随机选取的40名学生中“痴迷”的学生的个数,记为1A ,2A ;乙高中随机选取的40名的概率解析:(Ⅰ)由样本估计总体的思想,甲高中学生一周内平均每天学习数学的时间的中位数1026.67⨯≈;;22S S >甲乙;350.2450.15550.0527.5+⨯+⨯+⨯=;()()21527.5400.2+-⨯⨯ ()()22527.5400.3+-⨯⨯ ()()23527.5400.2+-⨯⨯ ()()24527.5400.15+-⨯⨯ ()()25527.5400.05]+-⨯⨯178.75=.(Ⅲ)甲高中随机选取的40名学生中“痴迷”的学生有()400.005102⨯⨯=人,记为1A ,2A ;乙高中随机选取的40名学生中“痴迷”的学生有()400.015106⨯⨯=人,记为1B ,2B ,3B ,4B ,5B ,6B .随机选出2人有以下28种可能:()12,A A ,()11,A B ,()12,A B ,()13,A B ,()14,A B ,()15,A B ,()16,A B , ()21,A B ,()22,A B ,()23,A B ,()24,A B ,()25,A B ,()26,A B ,()12,B B , ()13,B B ,()14,B B ,()15,B B ,()16,B B ,()23,B B ,()24,B B ,()25,B B , ()26,B B ,()34,B B ,()35,B B ,()36,B B ,()45,B B ,()46,B B ,()56,B B ,所以,从甲、乙两所高中数学喜好程度为“痴迷”的同学中随机选出2人,选出的2人中甲、乙两所高中各有16.【2018海南高三第二次联合考试】从某小区抽取50户居民进行月用电量调查,发现其用电量都在50到350度之间,频率分布直方图如下.(1)求频率分布直方图中x 的值并估计这50户用户的平均用电量;(2)若将用电量在区间[)50,150内的用户记为A 类用户,标记为低用电家庭,用电量在区间[)250,350内的用户记为B 类用户,标记为高用电家庭,现对这两类用户进行问卷调查,让其对供电服务进行打分,打分情况见茎叶图:①从B 类用户中任意抽取1户,求其打分超过85分的概率;②若打分超过85分视为满意,没超过85分视为不满意,请填写下面列联表,并根据列联表判断是否有95%的把握认为“满意度与用电量高低有关”?附表及公式:,n a b c d =+++.【答案】(1)0.0044x =,186(2【解析】试题分析:(1)由矩形面积和为1,求得x ,再由每一个矩形的中点横坐标乘以矩形面积求和可得平均值;试题解析: 解:(120.0012)0.0044⨯+=, 按用电量从低到高的六组用户数分别为6,9,15,11,6,3, 186=度.(2)①B 类用户共9人,打分超过85分的有6人,所以从B 类用户中任意抽取3户,恰好有2户打分超过85 ②因为2K 的观测值 1.6 3.841=<,所以没有95%的把握认为“满意与否与用电量高低有关”. 【名师点睛】利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.。
第十章 算法初步、统计与统计案例第三节 用样本估计总体考点2 茎叶图及其运用(2018·全国卷Ⅲ(理))某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min )绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m ,并将完成生产任务所需时间超过m 和不超过m 的工人数填入下面的列联表;(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异? 附:K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),.【解析】(1)第二种生产方式的效率更高.理由如下:(ⅰ)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80 min ;用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79 min.因此第二种生产方式的效率更高.(ⅱ)由茎叶图可知,用第一种生产方式的工人完成生产任务所需时间的中位数为85.5 min ;用第二种生产方式的工人完成生产任务所需时间的中位数为73.5 min.因此第二种生产方式的效率更高.(ⅲ)由茎叶图可知,用第一种生产方式的工人完成生产任务平均所需时间高于80 min ;用第二种生产方式的工人完成生产任务平均所需时间低于80 min.因此第二种生产方式的效率更高.(ⅳ)由茎叶图可知,用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.(2)由茎叶图知m =79+812=80.列联表如下:(3)因为K 2=40(15×15−5×5)520×20×20×20=10>6.635,所以有99%的把握认为两种生产方式的效率有差异.【答案】见解析(2018·江苏卷)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________.【解析】这5位裁判打出的分数分别是89,89,90,91,91,因此这5位裁判打出的分数的平均数为89+89+90+91+915=90. 【答案】90。
2.2.3茎叶图学习目标 1.了解茎叶图的概念,会画茎叶图.2.了解频率分布直方图、频率折线图、茎叶图的各自特征,学会选择不同的方法分析样本的分布,从而作出总体估计.知识点茎叶图思考茎叶图是表示样本数据分布情况的一种方法,那么“茎”、“叶”分别指的是哪些数?答案茎是指中间的一列数,叶就是从茎的旁边生长出来的数.梳理茎叶图的定义:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.适用范围:当样本数据较少时,用茎叶图表示数据的效果较好.优点:它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来方便.缺点:当样本数据较多时,枝叶就会很长,茎叶图就显得不太方便.1.对于两位数的茎叶图,中间的数字表示十位数,旁边的数字表示个位数.(√) 2.对于三位数的茎叶图,中间的数字表示百位数.旁边的数字表示十位和个位数.(×) 3.茎叶图的茎相当于频率分布表中的分组,茎上叶的数目相当于频率分布表中指定区间组的频数.(√)类型一茎叶图及其绘制例1有关部门从甲、乙两城市所有自动售货机中分别随机抽取了16台,记录了上午8∶00~11∶00间各自销售情况(单位:元):甲:18,8,10,43,30,10,22,6,27,25,58,5,14,18,30,41;乙:22,31,32,42,20,27,48,23,38,43,12,34,18,10,34,23.试列出两个城市销售情况的茎叶图.解画出两个城市销售情况的茎叶图,把茎放在中间共用,叶分列左、右两侧.反思与感悟茎叶图的制作步骤:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.跟踪训练1某赛季甲、乙两名篮球运动员每场得分情况如下:甲的得分:12,15,24,25,31,31,36,36,37,39,44,49,50.乙的得分:8,13,14,16,23,26,28,33,38,39,51,9,17.用茎叶图表示上面的数据.解如图所示的茎叶图中,中间的数字表示两位运动员得分的十位数,两边的数字分别表示两个人各场比赛得分的个位数.类型二茎叶图的画法及应用例2某良种培育基地正在培育一种小麦新品种A.将其与原有的一个优良品种B进行对照试验.两种小麦各种植了25亩,所得亩产量数据(单位:千克)如下:品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,44 5,451,454.品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,41 6,422,430.(1)画出茎叶图;(2)用茎叶图处理现有的数据,有什么优点?(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,得出统计结论.解(1)茎叶图如图.(2)样本容量不大,画茎叶图很方便,此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息丢失,而且还可以随时记录新的数据.(3)通过观察茎叶图可以看出:①品种A亩产量的平均数比品种B亩产量的平均数大;②品种A的亩产量波动比品种B的亩产量波动大,故品种A的亩产量稳定性较差.反思与感悟利用茎叶图进行样本分析的角度及图形特点(1)角度:要从数据分布的对称性、中位数、稳定性、平均数等几个方面来比较.(2)图形特点:平均水平:大茎上的叶多,则平均值大;大茎上的叶少,则平均值小.分散程度:看叶集中在几个茎上,还是分散在多个茎上.跟踪训练2某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地区:6273819295857464537678869566977888827689B地区:7383625191465373648293486581745654766579根据两组数据作出两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可).解两地区用户满意度评分的茎叶图如图:通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.类型三茎叶图与频率分布直方图的综合应用例3在某市的青少年才艺表演评比活动中,参赛选手成绩的茎叶图和频率分布直方图都受到不同程度的破坏,可见部分如图所示,据此回答以下问题:求参赛总人数和频率分布直方图中[80,90)矩形的高,并补全频率分布直方图.解由茎叶图知,分数在[50,60)的频数为2.由频率分布直方图知,分数在[50,60)的频率为0.008×10=0.08,=25.所以参赛总人数为20.08所以分数在[80,90)的人数为25-2-7-10-2=4,=0.16,所以分数在[80,90)的频率为425故频率分布直方图中[80,90)矩形的高为0.16=0.016.10补全频率分布直方图,如图所示.反思与感悟茎叶图由所有样本数据构成,没有损失任何样本信息,可以在抽样的过程中随时记录,但样本容量较大,或者需要比较三组以上的数据时,使用茎叶图就不合适;而频率分布表和频率分布直方图可以处理样本容量很大的数据,但损失了样本的原始数据,而且必须在完成抽样后才能制作.跟踪训练3某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是下列所给直方图中的________.(填序号)答案①解析方法一由题意知样本容量为20,组距为5.列表如下:观察各选项的频率分布直方图知应为①.方法二由茎叶图知落在区间[0,5)与区间[5,10)上的频数相等,故频率、频率组距也分别相等,比较四个直方图知①正确.1.数据123,127,131,151,157,135,129,138,147,152,134,121,142,143的茎叶图中,茎应取__________.答案12,13,14,15解析在茎叶图中叶应是数据中的最后一位,从而茎就确定了.2.在茎叶图中比40大的数据有________个.答案3解析由茎叶图中知比40大的有47,48,49,共3个.3.已知某工厂工人在6月份每天加工的零件个数的茎叶图如图所示(以零件个数的百位、十位数字为茎,个位数字为叶),那么该工厂工人在该月内加工的零件个数超过130的天数所占的百分比为________.答案10%4.某校举行演讲比赛,9位评委给选手A打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若统计员计算无误,则数字x应该是________.答案2解析去掉最低分87,去掉最高分94(假设x≤4),则7×91=80×2+9+8+90×5+2+3+2+1+x,所以x=2,符合题意.同理可验证x>4不合题意.5.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.答案4解析由题意知,将1~35号分成7组,每组5名运动员,成绩落在区间[139,151]的运动员共有4组,故由系统抽样法知,共抽取4名.1.估计总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以在抽样的过程中随时记录;而频率分布表和频率分布直方图则损失了样本的原始信息,必须在完成抽样后才能制作.3.正确利用三种分布的描述方法,都能得到一些有关分布的主要特点(如分布是否具有单峰性、是否具有对称性、样本点落在各分组中的频率等),这些主要特点受样本的随机性的影响比较小,更接近于总体分布相应的特点.一、填空题1.下面的茎叶图,表示的数据为________________.答案8,11,11,12,21,24,29,50,52解析由茎叶图的制作方法知,数据为8,11,11,12,21,24,29,50,52.2.随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图.根据茎叶图判断________班的平均身高较高.答案乙解析由茎叶图可知:甲班身高集中于160~179之间,而乙班身高集中于170~180之间.因此乙班平均身高高于甲班.3.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是________,________.答案4546解析 甲组数据为28,31,39,42,45,55,57,58,66,中位数为45. 乙组数据为29,34,35,42,46,48,53,55,67,中位数为46.4.甲、乙两人在10天中每天加工零件的个数用茎叶图表示如图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天中甲、乙两人日加工零件的平均数分别为________和________.答案 24 23 解析 x 甲=110(10×2+20×5+30×3+17+6+7)=24, x乙=110(10×3+20×4+30×3+17+11+2)=23. 5.一次选拔运动员,测得7名选手的身高(单位:cm)分布茎叶图为1718⎪⎪⎪0 3 x 8 90 1记录的平均身高为177 cm ,有一名候选人的身高记录不清楚,其末位数记为x ,那么x 的值为________. 答案 8解析 由茎叶图可知10+11+3+x +8+97=7,解得x =8.6.甲、乙两个小组各8名同学的英语口语测试成绩的茎叶图如图所示.甲、乙两组的平均数与中位数之差较大的组是________.答案 乙解析 由茎叶图可知,甲的平均数和中位数分别是83.625和83.5,乙的平均数和中位数分别是82.25和81,故乙的平均数和中位数的差较大.7.参加CBA 2016~2017赛季的甲、乙两支球队,统计两队队员的身高(单位:cm)茎叶图如下(以十位百位为茎,个位为叶):则由图知________队队员的身高更整齐些.答案甲解析由茎叶图知甲队身高大部分是2米零几,而乙队身高比较分散.8.某中学高一(2)班甲、乙两名同学自高中以来每次考试成绩的茎叶图如图,则________同学发挥较稳定,平均成绩________同学较高.(填“甲”“乙”)答案乙乙解析从茎叶图可知乙同学的成绩在80~90分分数段的有9次,而甲同学的成绩在80~90分分数段的只有7次;再从题图上还可以看出,乙同学的成绩集中在90~100分分数段的最多,而甲同学的成绩集中在80~90分分数段的最多.故乙同学发挥较稳定且平均成绩也比甲同学高.9.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数分别是________.答案46,45解析由题意知各数为12,15,20,22,23,23,31,32,34,34,38,39,45,45,45,47,47,48,48,49,50,50,51,51,54,57,59,61,67,68,中位数是46,众数是45.10.空气质量指数(Air Quality Index,简称AQI)是定量描述空气质量状况的指数,空气质量按照AQI大小分为六级,0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;大于300为严重污染.从某地一环保人士某年的AQI记录数据中,随机抽取10个,用茎叶图记录如图.根据该统计数据,估计此地该年AQI大于100的天数约为________.(该年为365天)答案 146解析 该样本中AQI 大于100的频数是4,频率为25,由此估计该地全年AQI 大于100的频率为25,估计此地该年AQI 大于100的天数约为365×25=146.11.某篮球队的甲、乙两人练习罚球,每人练习10组,每组罚球40个,命中个数的茎叶图如图所示,则罚球命中率较高的是________(填“甲”“乙”).答案 甲解析 由茎叶图知甲每组进球数集中在20多个,乙每组进球数集中在10多个,故罚球命中率较高的是甲. 二、解答题12.参加某赛季的甲、乙两支球队,统计两队队员的身高(单位:cm)如下: 甲队队员:194,187,199,207,203,205,209,199,183,215,219,206,201,208; 乙队队员:179,192,218,223,187,194,205,207,185,197,199,209,214,189. (1)用茎叶图表示两队队员的身高;(2)根据茎叶图判断哪个队队员的身高整齐一些. 解 (1)茎叶图如下(以十位和百位为茎,个位为叶):(2)甲队队员的身高整齐一些.13.在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,你会得到什么结论?解(1)(2)电脑杂志上每个句子的字数集中在10~30之间;而报纸上每个句子的字数集中在20~40之间.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为科普读物需要通俗易懂、简明.三、探究与拓展14.某中学甲、乙两名同学最近几次的数学考试成绩情况如下:甲的得分:95,81,75,89,71,65,76,88,94,110,107;乙的得分:83,86,93,99,88,103,98,114,98,79,101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.解甲、乙两人数学成绩的茎叶图如图所示.从这个茎叶图上可以看出,乙同学的得分情况是大致对称的;甲同学的得分情况除一个特殊得分外,也大致对称,但分数分布相对于乙来说,趋向于低分阶段.因此乙同学发挥比较稳定,总体得分情况比甲同学好.15.甲、乙两个网站为了了解各自受欢迎的程度,分别随机选取了14天记录上午8:00~10:00间各自的点击量:甲:73,24,58,72,64,38,66,70,20,41,55,67,8,25;乙:12,37,21,5,54,52,61,45,19,6,19,36,42,14.你能用哪些方法表示上面的数据?你认为甲、乙两个网站哪个更受欢迎?解方法一列频数分布表如下:由频数分布可以看出,甲网站的点击量多集中在[50,80]上,而乙网站的点击量多集中在[0,60)上,从数据的分布情况来看,甲网站更受欢迎.方法二画出茎叶图如图所示.由茎叶图可以看出,甲网站的点击量集中在茎叶图的下方,而乙网站的点击量集中在茎叶图的上方.从数据的分布情况来看,甲网站更受欢迎.。
茎叶图与频率分布直方图2018届高三文科数学精品复习讲义与跟踪训练含解析I.题源探究·黄金母题【例1】若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是()A.91.5和91.5 B.91.5和92 C.91和91.5 D.92和92【答案】A【例2】如图是某城市100位居民去年的月均用水量(单位:t)的频率分布直方图,月均用水量在区间[)1.5,2.5的居民大约有()A.37位B.40位C.47位D.52位【答案】C【解析】由频率分布直方图月均用水量在区间[)1.5,2的频率为0.450.50.225⨯=,月均用水量在区间[)2,2.5的居民的频率为0.50050.25⨯=..月均用水量在区间[)1.5,2.5的居民的频数大约为()0.2250.2510047+⨯=,故选C.精彩解读【试题来源】例1:人教A版必修3P70改编;例2:人教A版必修3P65例题改编.【母题评析】这类题主要考查平均数、方差的计算以及茎叶图与频率分布直方图的简单应用.【思路方法】用样本估计总体是统计的基本方法:(1)最高的矩形的中点横坐标即众数;(2)中位数左边和右边的直方图的面积是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.II.考场精彩·真题回放【例1】【2017高考新课标1文2】为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数【答案】B【解析】刻画评估这种农作物亩产量稳定程度的指标是标准差,故选B.【例2】【2017高考山东文8】如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为A.3,5 B.5,5 C.3,7 D.5,7【答案】A得3x .故选A.【例3】【2017高考北京文17】某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),┄,[80,90],并整理得到如下频率分布直方图:【命题意图】这类重点题考查分层抽样和系统抽样的计算.考查考生基本计算能力.【考试方向】这类试题在考查题型上,主要以选择题或填空题为主,属于中低档题.【难点中心】1.将频率分布直方图中相邻的矩形的上底边的中点顺次连结起来,就得到一条折线,我们称这条折线为本组数据的频率折线图,频率分布折线图的的首、尾两端取值区间两端点须分别向外延伸半个组距,即折线图是频率分布直方图的近似,他们比频率分布表更直观、形象地反映了样本的分布规律.2.分清几个样本特征数:众数:一组数据出现次数最多的数叫众数,众数反应一组数据的多数水平;中位数:一组数据中间的数,(起到分水岭的作用)中位数反应一组数据的中间水平;平均数:反应一组数据的平均水平;方差:方差是和中心偏离的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差.在样本容量相同的情况下,(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率; (Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(Ⅲ)已知样本中有一半男生的分数学不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例. 【答案】(Ⅰ)0.4;(Ⅱ)20;(Ⅲ):32.(Ⅱ)根据题意,样本中分数不小于50的频率为(0.010.020.040.02)100.9+++⨯=,分数在区间[40,50)内的人数为1001000.955-⨯-=.所以总体中分数在区间[40,50)内的人数估计为540020100⨯=. (Ⅲ)由题意可知,样本中分数不小于70的学生人数为(0.020.04)1010060+⨯⨯=,所以样本中分数不小于70的男生人数为160302⨯=. 所以样本中的男生人数为30260⨯=,女生人数为1006040-=,男生和女生人数的比例为60:403:2=.所以根据分层抽样原理,总体中男生和女生人数的比例估计为3:2.方差越大,说明数据的波动越大,越不稳定.标准差是方差的算术平方根,意义在于反映一个数据集的离散程度.3.用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法.分布表在数量表示上比较准确,直方图比较直观. 4.频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.III .理论基础·解题原理⑴一表二图:①频率分布表——数据详实 ②频率分布直方图——分布直观③频率分布折线图——便于观察总体分布趋势 注:总体分布的密度曲线与横轴围成的面积为1. ⑵茎叶图:①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众位数等. ②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写. 3.总体特征数的估计: ⑴平均数:nx x x x x n++++=Λ321;取值为n x x x ,,,21Λ的频率分别为n p p p ,,,21Λ,则其平均数为n n p x p x p x +++Λ2211;注意:频率分布表计算平均数要取组中值.⑵方差与标准差:一组样本数据n x x x ,,,21Λ方差:212)(1∑=-=ni ix xns ;标准差:21)(1∑=-=ni ix xns注:方差与标准差越小,说明样本数据越稳定.平均数反映数据总体水平;方差与标准差反映数据的稳定水平.IV .题型攻略·深度挖掘【考试方向】这类试题在考查题型上,通常以选择题或填空题的形式出现,难度中等. 【技能方法】1.解题模板:第一步,根据频率分布直方图计算出相应的频率;第二步,运用样本的频率估计总体的频率;第三步,得出结论.2.用样本估计总体是统计的基本思想.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.3.(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量,与每个样本数据有关,这是中位数、众数所不具有的性质.(2)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大. 4.茎叶图、频率分布表和频率分布直方图都可直观描述样本数据的分布规律. 【易错指导】1.在使用茎叶图时,一定要注意看清楚所有的样本数据,弄清楚这个图中的数字特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义.2.利用频率分布直方图求众数、中位数与平均数时,应注意这三者的区分:(1)最高的矩形的中点横坐标即众数;(2)中位数左边和右边的直方图的面积是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.3.直方图与条形图不要搞混频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.V .举一反三·触类旁通考向1 茎叶图及其应用【例1】【2018黑龙江齐齐哈尔高三第一次模】某校连续12天对同学们的着装进行检查,着装不合格的人数用茎叶图表示,如图,则该组数据的中位数是A .24B .26C .27D .32 【答案】C 【解析】中位数是24+30272,选C . 【例2】【2018江西上饶高三下学期二模】如图1是某学习小组学生在某次数学考试中成绩的茎叶图,1号到20号同学的成绩依次为1220,,,a a a L ,图2是统计茎叶图中成绩在一定范围内的学生人数的程序框图,那么该框图的输出结果是( )A .8B .9C .11D .12 【答案】A【解析】由算法流程图可知,其统计的是数学成绩不小于100的人数,所以由茎叶图知,数学成绩不小于100的人数为8,因此输出结果为8,故选A .【例3】某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(1)分别估计该市的市民对甲、乙两部门评分的中位数; (2)分别估计该市的市民对甲、乙两部门的评分高于90的概率; (3)根据茎叶图分析该市的市民对甲、乙两部门的评价.【答案】(1)75,75;(2)0.1,0.16;(3)该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.【解析】(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67.规律方法 (1)茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况. (2)①作样本的茎叶图时先要根据数据特点确定茎、叶,再作茎叶图;作“叶”时,要做到不重不漏,一般由内向外,从小到大排列,便于数据的处理.②根据茎叶图中数据数字特征进行分析判断考查识图能力,判断推理能力和创新应用意识;解题的关键是抓住“叶”的分布特征,准确提炼信息. 【跟踪练习】1.【2018河南安阳高三二模】在某校连续5次考试成绩中,统计甲,乙两名同学的数学成绩得到如图所示的茎叶图.已知甲同学5次成绩的平均数为81,乙同学5次成绩的中位数为73,则x y 的值为( )A .3B .4C .5D .6 【答案】A 【解析】77728680908105x x +++++=∴=Q因为乙同学5次成绩的中位数为73,所以33,y x y =∴+=选A .2.【2018山西平遥中学高三3月高考适应性调研】某学校A 、B 两个班的数学兴趣小组在一次数学对抗赛中的成绩绘制茎叶图如下,通过茎叶图比较两班数学兴趣小组成绩的平均值及方差①A 班数学兴趣小组的平均成绩高于B 班的平均成绩 ②B 班数学兴趣小组的平均成绩高于A 班的平均成绩 ③A 班数学兴趣小组成绩的标准差大于B 班成绩的标准差 ④B 班数学兴趣小组成绩的标准差大于A 班成绩的标准差 其中正确结论的编号为( )A .①③B .①④C .②③D .②④ 【答案】B【解析】A 班:53,63,64,76,74,78,78,76,81,85,86,88,82,92,95;B 班:45,48,51,3.【2018湖北武汉武昌区高三1月调研】将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个分数的平均数为91,现场作的7个分数的茎叶图有一个数据模糊,无法辨认,在图中以x 表示,则5个剩余分数的方差为________.【答案】6 【解析】依题意8793909190915x +++++=,解得4x =.则方差为1641965+++=.【名师点睛】本题主要考查茎叶图的分辨,考查平均数的计算,考查方差的计算.从茎叶图可以看出最低分是87,最高分是99,去掉这两个分数后,可利用平均数的公式列方程来求出x 的值.根据前面求出的值再利用方差的计算公式()211n i i x x n =-∑来计算方差.考向2 频率分布直方图【例4】某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )A .56B .60C .120D .140【答案】D【例5】某校从高一年级学生中随机抽取100名学生,将他们期中考试的数学成绩(均为整数)分成六段:[40,50),[50,60),…,[90,100]后得到频率分布直方图(如下图所示),则分数在[70,80)内的人数是 .【答案】30【解析】由频率分布直方图知小长方形面积为对应区间概率,所有小长方形面积和为1,因此分数在[70,80)内的概率为3.010)005.0010.02015.0025.0(1=⨯++⨯+-,人数为301003.0=⨯【例6】我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),……,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a 的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由; (3)估计居民月均用水量的中位数.【答案】(1)0.30;(2)36 000;(3)2.04.【解析】(1)由频率分布直方图可知:月均用水量在[0,0.5)内的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a +0.5×a ,解得a =0.30.(2)由(1)知,该市100位居民中月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)设中位数为x 吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5. 又前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5.所以2≤x <2.5. 由0.50×(x -2)=0.5-0.48,解得x =2.04.故可估计居民月均用水量的中位数为2.04吨.【名师点睛】(1)准确理解频率分布直方图的数据特点,频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率和条形图混淆.(2)“命题角度二”的例题中抓住频率分布直方图中各小长方形的面积之和为1,这是解题的关键.而利用频率分布直方图可以估计总体分布.【跟踪练习】1.【2018江西高三毕业班新课程教学质量监测】如图是60名学生参加数学竞赛的成绩(均为整数)的频率分布直方图,估计这次数学竞赛的及格率(60分及以上为及格)是()A.0.9 B.0.75 C.0.8 D.0.7【答案】B【解析】大于或等于60分的共四组,它们是:故选:B.【名师点睛】利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.2.【2018贵州黔东南州联考】近年呼吁高校招生改革的呼声越来越高,在赞成高校招生改革的市民中按年龄分组,得到样本频率分布直方图如图,其中年龄在[)30,40岁的有2500人,年龄在[)20,30岁的有1200人,则m 的值为( )A .0.013B .0.13C .0.012D .0.12 【答案】C3.【2018河南六市高三第一次联考(一模)】为了解学生在课外活动方面的支出情况,抽取了n 个同学进行调查,结果显示这些学生的支出金额(单位:元)都在[]10,50,其中支出金额在[]30,50的学生有117人,频率分布直方图如图所示,则n =( )A .180B .160C .150D .200 【答案】A【解析】[]30,50对应的概率为()10.010.025100.65-+⨯=,所以117=1800.65n =,选A .4.一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10000人中再用分层抽样方法抽出100人作进一步调查,则在[)2500,3500(元)月收入段应抽出 人.【答案】40【解析】由图(2500,3500元/月)收入段的频率是0.0005×500+0.0003×500=0.4,故用分层抽样方法抽出100人作进一步调查,则在(2500,3500元/月)收入段应抽出人数为0.4×100=40. 考向3 样本的数字特征【例7】【2018内蒙古呼和浩特高三第一次质量调研】如图为某班35名学生的投篮成绩(每人投一次)的条形统计图,其中上面部分数据破损导致数据不完全.已知该班学生投篮成绩的中位数是5,则根据统计图,无法确定下列哪一选项中的数值( )A .3球以下(含3球)的人数B .4球以下(含4球)的人数C .5球以下(含5球)的人数D .6球以下(含6球)的人数 【答案】C【解析】因为共有35人,而中位数应该是第18个数,所以第18个数是5,从图中看出第四个柱状图故选C .【例8】【2018湖南衡阳高三第二次联考(二模)】已知样本12,,,n x x x L 的平均数为x ;样本12,,,m y y y L 的平均数为()y x y ≠,若样本12,,,n x x x L ,12,,,m y y y L 的平均数()z ax 1a y =+-;其中10a 2<<,则()*,,n m n m N ∈的大小关系为( ) A .n m = B .n m ≥ C .n m < D .n m > 【答案】C 【解析】由题得()11,,n n n z nx my x y a n m n m n m n m ⎛⎫=+=+-∴= ⎪++++⎝⎭110,0,.22n a n m n m <<∴<<∴<+Q 故选C .这两个小组往年研发新产品的结果如下:(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b )(a ,b ),(a ,b ),(a ,b ),(a ,b ).其中a ,a 分别表示甲组研发成功和失败;b ,b 分别表示乙组研发成功和失败.(1)若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差,并比较甲、乙两组的研发水平;(2)若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率. 【解析】(1)甲组研发新产品的成绩为1,1,1,0,0,1,1,1,0,0,1,1,1,0,1,因为x 甲>x 乙,s 2甲<s 2乙,所以甲组的研发水平优于乙组.(2)记E ={恰有一组研发成功}.在所抽得的15个结果中,恰有一组研发成功的结果是(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),共7个.因此事件E 发生的频率为715.用频率估计概率,即得所求概率为P (E )=715.【名师点睛】(1)平均数反映了数据的中心,是平均水平,而方差和标准差反映的是数据围绕平均数的波动大小.进行平均数与方差的计算,关键是正确运用公式;(2)平均数与方差所反映的情况有着重要的实际意义,一般可以通过比较甲、乙两组样本数据的平均数和方差的差异,对甲、乙两品种可以做出评价或选择. 【跟踪练习】1.【2018贵州黔东南州高三下学期二模】甲乙两名同学6次考试的成绩统计如下图,甲乙两组数据的平均数分别为x 甲、x 乙,标准差分别为σσ甲乙,,则A .x x σσ<<甲乙甲乙,B .x x σσ甲乙甲乙,C .x x σσ><甲乙甲乙,D .x x σσ>>甲乙甲乙,【答案】C【解析】由图可知,甲同学除第二次考试成绩略低与乙同学,其他次考试都远高于乙同学,可知x x >甲乙,图中数据显示甲同学的成绩比乙同学稳定,故σσ<甲乙.故选C .2.【2018云南昆明高三教学质量检查(二统)】“搜索指数”是网民通过搜索引擎,以每天搜索关键词的次数为基础所得到的统计指标.“搜索指数”越大,表示网民对该关键词的搜索次数越多,对该关键词相关的信息关注度也越高.下图是2017年9月到2018年2月这半年中,某个关键词的搜索指数变化的走势图.根据该走势图,下列结论正确的是( )A .这半年中,网民对该关键词相关的信息关注度呈周期性变化B .这半年中,网民对该关键词相关的信息关注度不断减弱C .从网民对该关键词的搜索指数来看,去年10月份的方差小于11月份的方差D .从网民对该关键词的搜索指数来看,去年12月份的平均值大于今年1月份的平均值 【答案】D【解析】根据走势图可知:这半年中,网民对该关键词相关的信息关注度不呈周期性变化,A 错;这半年中,网民对该关键词相关的信息关注度增减不确定,B 错;从网民对该关键词的搜索指数来看,去年10月份的搜索指数的稳定性小于11 月份的搜索指数的稳定性,所以去年10月份的方差大于11 月份的方差,C 错;从网民对该关键词的搜索指数来看,去年12月份的平均值大于今年1月份的平均值,D正确,故选D.3.【2018陕西榆林高三二模】为了反映各行业对仓储物流业务需求变化的情况,以及重要商品库存变化的动向,中国物流与采购联合会和中储发展股份有限公司通过联合调查,制定了中国仓储指数.由2016年1月至2017年7月的调查数据得出的中国仓储指数,绘制出如下的折线图.根据该折线图,下列结论正确的是()A.2016年各月的合储指数最大值是在3月份B.2017年1月至7月的仓储指数的中位数为55C.2017年1月与4月的仓储指数的平均数为52D.2016年1月至4月的合储指数相对于2017年1月至4月,波动性更大【答案】D【解析】2016年各月的仓储指数最大值是在11月份,所以A是错误的;由图可知,2017年1月至74.【2018江苏如皋高三年级第一学期教学质量调研(三)】甲、乙两个城市2017年夏季连续5天中,每天的最高气温(C )数据如下:城市每天的最高气温第1天第2天第3天第4天第5天甲28 31 27 33 31乙 25 26 29 34 36则这5 天中,每天最高气温较为稳定(方差较小)的城市为_______.(填甲或乙). 【答案】甲【解析】甲、乙两个城市的最高气温平均值都是30o ,甲的方差为419914.85++++=,乙的方差为2516116369318.6,55++++==∴每天最高气温较为稳定(方差较小)的城市为甲,故答案为甲.5.【2018山东枣庄高三二模】随着高校自主招生活动的持续开展,我市高中生掀起了参与数学兴趣小组的热潮.为调查我市高中生对数学学习的喜好程度,从甲、乙两所高中各随机抽取了40名学生,记录他们在一周内平均每天学习数学的时间,并将其分成了6个区间:(]0,10、(]10,20、(]20,30、(]30,40、(]40,50、(]50,60,整理得到如下频率分布直方图:根据一周内平均每天学习数学的时间t ,将学生对于数学的喜好程度分为三个等级: 学习时间(分钟/天) 20t ≤2050t <≤50t >喜好等级一般爱好痴迷(Ⅰ)试估计甲高中学生一周内平均每天学习数学的时间的中位数m 甲(精确到0.01);(Ⅱ)判断从甲、乙两所高中各自随机抽取的40名学生一周内平均每天学习数学的时间的平均值X 甲与X 乙及方差2S 甲与2S 乙的大小关系(只需写出结论),并计算其中的X 甲、2S 甲(同一组中的数据用该组区间的中点值作代表);(Ⅲ)从甲高中与乙高中随机抽取的80名同学中数学喜好程度为“痴迷”的学生中随机抽取2人,求选出的2人中甲高中与乙高中各有1人的概率.【答案】(Ⅰ) 26.67m ≈甲;(Ⅱ)答案见解析;(Ⅲ)37. 【解析】试题分析:()1根据频率分布直方图,由样本估计总体的思想可求得()0.50.10.2200.3m -+=+甲1026.67⨯≈;()2根据所给数据求出X 甲,X 乙,2S 甲,2S 乙,然后对比即可得到答案;()3求出甲高中随机选取的40名学生中“痴迷”的学生的个数,记为1A ,2A ;乙高中随机选取的40名解析:(Ⅰ)由样本估计总体的思想,甲高中学生一周内平均每天学习数学的时间的中位数()0.50.10.2200.3m -+=+甲 1026.67⨯≈;(Ⅱ)X X <甲乙;22S S >甲乙;50.1150.2250.3X =⨯+⨯+⨯甲 350.2450.15550.0527.5+⨯+⨯+⨯=;()()221[527.5400.140S =⨯-⨯⨯甲 ()()21527.5400.2+-⨯⨯ ()()22527.5400.3+-⨯⨯ ()()23527.5400.2+-⨯⨯ ()()24527.5400.15+-⨯⨯ ()()25527.5400.05]+-⨯⨯178.75=.(Ⅲ)甲高中随机选取的40名学生中“痴迷”的学生有()400.005102⨯⨯=人,记为1A ,2A ;乙高中随机选取的40名学生中“痴迷”的学生有()400.015106⨯⨯=人,记为1B ,2B ,3B ,4B ,5B ,6B .随机选出2人有以下28种可能:()12,A A ,()11,A B ,()12,A B ,()13,A B ,()14,A B ,()15,A B ,()16,A B , ()21,A B ,()22,A B ,()23,A B ,()24,A B ,()25,A B ,()26,A B ,()12,B B , ()13,B B ,()14,B B ,()15,B B ,()16,B B ,()23,B B ,()24,B B ,()25,B B , ()26,B B ,()34,B B ,()35,B B ,()36,B B ,()45,B B ,()46,B B ,()56,B B ,甲、乙两所高中各有1人,有以下12种可能:()11,A B ,()12,A B ,()13,A B ,()14,A B ,()15,A B ,()16,A B , ()21,A B ,()22,A B ,()23,A B ,()24,A B ,()25,A B ,()26,A B .所以,从甲、乙两所高中数学喜好程度为“痴迷”的同学中随机选出2人,选出的2人中甲、乙两所高中各有1人的概率为123287=. 6.【2018海南高三第二次联合考试】从某小区抽取50户居民进行月用电量调查,发现其用电量都在50到350度之间,频率分布直方图如下.(1)求频率分布直方图中x 的值并估计这50户用户的平均用电量;(2)若将用电量在区间[)50,150内的用户记为A 类用户,标记为低用电家庭,用电量在区间[)250,350内的用户记为B 类用户,标记为高用电家庭,现对这两类用户进行问卷调查,让其对供电服务进行打分,打分情况见茎叶图:①从B 类用户中任意抽取1户,求其打分超过85分的概率;②若打分超过85分视为满意,没超过85分视为不满意,请填写下面列联表,并根据列联表判断是否有95%的把握认为“满意度与用电量高低有关”?满意不满意 合计 A 类用户 B 类用户合计附表及公式:()2P K k≥0.050 0.010 0.001 0k3.841 6.635 10.828()()()()()22n ad bcKa b c d a c b d-=++++,n a b c d=+++.【答案】(1)0.0044x=,186(2)23,没有【解析】试题分析:(1)由矩形面积和为1,求得x,再由每一个矩形的中点横坐标乘以矩形面积求和可得平均值;试题解析:解:(1)1(0.0060.00360.002450x=-++20.0012)0.0044⨯+=,按用电量从低到高的六组用户数分别为6,9,15,11,6,3,所以估计平均用电量为675912515175112256275332550⨯+⨯+⨯+⨯+⨯+⨯186=度.(2)①B类用户共9人,打分超过85分的有6人,所以从B类用户中任意抽取3户,恰好有2户打分超过85分的概率为2163391528C CC=.②满意不满意合计A类用户 6 9 15B类用户 6 3 9因为2K 的观测值 1.6 3.841=<,所以没有95%的把握认为“满意与否与用电量高低有关”.【名师点睛】利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数; (2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.。