最新人教版高中数学必修3第二章《用样本的频率分布估计总体分布》课后训练1
- 格式:doc
- 大小:5.63 MB
- 文档页数:5
221用样本的频率分布估计总体分布(一)一、选择题1.某学校组织学生参加数学测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),C. 55 【答案】B【解析】 频率为0.15x20 = 0.3,人数为 15-0.3 = 50 人.2.某班加名学生在一次考试中数学成绩的频率分布直方图如图,若在这加名学生中,数学 成绩不低于100分的人数为33,则m 等于()A. 45C. 50【答案】D【解析】 P = 1 - (0.015 + 0.025) x 10 = 0.6,由 0.6m = 33 ,得加= 55,故选 D.3.在“双11”促销活动中,某商场对11月11 H 9时到14时的销售额进行统计,其频率 分布直方图如图所示,已知12时到14时的销售额为14万元,则9时到11时的销售额为() A. 3万元B. 6万元C. 8万元D. 10万元【答案】D 60分的人数是15人,则该班的学生人数是()D. 60B. 48D. 55【解析】由图知12时到14时的频率为0.35, 9时到11时的为0.25 ,则9时到11时的销售额为0 2514x—= 10万元故选D.0.354.在某中学举行的环保知识竞赛中,将三个年级参赛的学生的成绩进行整理后分为5组,绘制出如图所示的频率分布直方图,图屮从左到右依次为第一、第二、第三、第四、第五小A. 15B. 18C. 20D. 25【答案】A【解析】笫二组的频率是是,所有参赛的学生人数为,那么80-100分的频率,所以人数为,选故A.5.为了了解某校高三400名学生的数学学业水平测试成绩,制成样本频率分布直方图如图, 规定不低于60分为及格,不低于80分为优秀,则及格率与优秀人数分别是()及格率为P = 1 -(0.015 + 0.005)x 10 = 0.8 ,优秀人数为400x(0.010 + 0.010)x10 = 80, 故选C.6.如图,是某班50名学生身高的频率分布直方图,那么身高在区间[150,170)内的学生人数为(),则成绩在80-100分的学生人数是(A. 60%, 60C. 80%,80【答案】CB.60%,80D. 80%,C. 22D. 26【答案】B【解析】 根据频率分布直方图可知身高在区间[150,170)内的频率为P = (0・01 + 0・03)xl0 = 0.4 ,所以身髙在区间[150,170)内的学生人数为50x0.4 = 20,故选B.7. 甲、乙两人在一次射击比赛屮各射靶5次,两人成绩的条形统计图如图所示,则() A. 甲的成绩的平均数小于乙的成绩的平均数 B. 甲的成绩的中位数等于乙的成绩的中位数 C. 甲的成绩的方差小于乙的成绩的方差D. 甲的成绩的极差小于乙的成绩的极差【答案】C【解析】1 1 1兀甲=一(4 + 5+6 + 7+8) =6,兀乙=一(5X3 + 6 + 9) =6,甲的成绩的方差为一(2取2 5 5 5 + 12X2) =2,乙的成绩的方差为丄(1欣3 + 3取1) =2.4.故选C. 5二、填空题&某校从高一年级学生中随机抽取100名学生,将他们期中考试的数学成绩(均为 整数)分成六段:[40, 50), [50, 60),…,[90, 100]后得到频率分布直方图(如 右图所示),则分数在[70, 80)内的人数是 _________________________ ・【答案】30【解析】试题分析:由频率分布直方图知小长方形面积为对应区间概率,所有小长方形面积频数5 6 7 8 9 10 (甲) 环数 口 ..口 0 3456789 10(乙) 环数频数 3 2和为1,因此分数在[70, 80)内的概率为人数为03x100 =309. ___________ 已知一个样木容量为100的样木数据的频率分布直方图如图所示,样本数据落在[40, 60) 内的频数为•【答案】15【解析】由已知可得100x0.15 = 15.10.从高三年级随机抽取100名学生,将他们的某次考试数学成绩绘制成频率分布直方图.【答案】30【解析】成绩在[130,140)内的频率为1 -(0.005 + 0.035+0.020+0.010)x 10 = 0.3 ,所以成绩在[130,140)内的学生人数为100x0.3 = 30.11.如图是一批学生的体重情况的直方图,若从左到右的前3个小组的频率之比为1:2:3,其中第2小组的频数为24,则这批学生中的总人数为 ____________ ・【解析】设这批学生屮的总人数为〃,前三小组的频率分别为p, p2,厲,则由条件可得02 =2门,<必=3门,,解得p, =0.125 , p2 = 0.25 , p3 =0.375 .又因为“ + 几 + P. + (0.037 + 0.013)x5 = 1, p. = 0.25 =—,故n = 96,故答案为96.n12 . 一个容量为20的样本数据分组后,组距与频数如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2・则样本在[10,50]上的频率为_______ O【答案】0.7【解析】市频率分布表对知样本在[10,50]上的频数为2+3+4+5=14,所以频率为P =寻=0.7三、解答题13.沈阳统计局就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布(I)求居民月收入在[3000,3500)的频率;(II)根据频率分布直方图算出样本数据的中位数;(III)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10000人屮分层抽样方法抽出100人作进一步分析,则月收入在[2500,3000)的这段应抽多少人?【答案】(I )0. 15 (II)2400 (111)25【解析】(I )月收入在[3000,3500)的频率为0.0003x(3500-3000) = 0.150.0005 x (2500 - 2000) = 0.25 , 0」+ 02 + 0.25 = 0.55 > 05所以,样本数据的中位数2000 + -(。
第二章统计2.2用样本预计整体用样本的频次散布预计整体散布A 级基础稳固一、选择题1.以下对于频次散布直方图的说法正确的选项是()A.直方图的高表示取某数的频次B.直方图的高表示该组上的个体在样本中出现的频次C.直方图的高表示取某组上的个体在样本中出现的频数与组距的比值D.直方图的高表示取该组上的个体在样本中出现的频次与组距的比值答案: D2.一个容量为 32 的样本,已知某组样本的频次为0.125 ,则该组样本的频数为 () A. 2 B . 4 C . 6 D . 8分析:频次=频数,则频数=频次×样本容量=0.125 ×32= 4.样本容量答案: B3.某雷达测速区规定:凡车速大于或等于70 km/h 的汽车视为“超速”,并将受各处罚.如图是某路段的一个检测点对300 辆汽车的车速进行检测所得结果的频次散布直方图,则从图中可得出将被处分的汽车数为()A.30辆 B .40辆 C .60辆 D .80辆分析:车速大于或等于70 km/h的汽车数为0.02 ×10×300= 60( 辆) .答案: C4.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩( 单位:分 ) 分红6 组: [40 , 50) , [50 , 60) , [60 ,70) , [70 , 80) ,[80 , 90) ,[90 , 100] ,加以统计后得到以下图的频次散布直方图.已知高一年级共有学生600 名,据此预计,该模块测试成绩许多于60 分的学生人数为()A.588 B .480 C . 450 D .120分析:许多于60 分的学生的频次为(0.030 + 0.025 + 0.015 +0.010) ×10= 0.8 ,因此该模块测试成绩许多于60 分的学生人数应为600× 0.8 =480.答案: B5.某校 100 名学生的数学测试成绩的频次散布直方图以下图,分数不低于 a 即为优秀,假如优异的人数为20,则a的预计值是 ()A.130 B .140 C . 133 D .137分析:由已知能够判断a∈(130,140),因此[(140- a)×0.015+0.01×10]×100=20.解得 a≈133.答案: C二、填空题6.某市共有 5 000 名高三学生参加联考,为了认识这些学生对数学知识的掌握状况,现从中随机抽出若干名学生在此次测试中的数学成绩,制成以下频次散布表:分组/分频数频次[80, 90)①②[90 ,100)0.050[100,110)0.200[110,120)360.300[120,130)0.275[130,140)12③[140,150]0.050共计④依据上边的频次散布表,能够①处的数值为________,②处的数值为 ________.分析:由位于[110 , 120) 的频数为36,频次=36= 0.300,得样本容量n=120,n12因此 [130 ,140) 的频次=120= 0.1 ,②处的数值=1- 0.050 -0.200 - 0.300 -0.275 - 0.1 -0.050 = 0.025 ;①处的数值为0.025 ×120= 3.答案: 3 0.0257.(2015 ·湖南卷 ) 在一次马拉松竞赛中,35 名运动员的成绩( 单位:分钟 ) 的茎叶图如图所示.若将运动员按成绩由好到差编为1~ 35 号,再用系统抽样方法从中抽取7 人,则此中成绩在区间 [139 , 151] 上的运动员人数是________.分析:由题意可知,这 35 名运动员的分组状况为,第一组(130,130,133,134,135),第二组 (136 , 136, 138, 138, 138) ,第三组 (139 , 141, 141, 141, 142) ,第四组 (142 ,142,143,143,144) ,第五组 (144 ,145,145,145,146) ,第六组 (146 ,147, 148,150,151) ,第七组 (152 ,152,153,153,153) ,故成绩在区间[139 ,151] 上的运动员恰有 4 组,则运动员人数为 4.答案: 48.为认识某校教师使用多媒体进行教课的状况,采纳简单随机抽样的方法,从该校 200 名讲课教师中抽取 20 名教师,检查了他们上学期使用多媒体进行教课的次数,结果用茎叶图表示以下:据此可预计该校上学期200 名教师中,使用多媒体进行教课次数在[15 , 25) 内的人数为________ .答案: 60三、解答题9.某篮球运动员在 2015 赛季各场竞赛得分状况以下: 12, 15,24, 25,31,31, 36,36, 37, 39, 44, 49, 50. 制作茎叶图,并剖析这个运动员的整体水平及发挥的稳固程度.解:该运动员得分茎叶图以下:从茎叶图中能够大略地看出,该运动员得分大多能在20 分到 40 分之间,且散布较为对称,集中程度高,说明其发挥比较稳固.10.某校 100 名学生期中考试语文成绩的概率散布直方图以下图,此中成绩( 单位:分) 分组区间是 [50 , 60) , [60 , 70) , [70 , 80) , [80 , 90) ,[90 , 100] .(1)求图中 a 的值;(2)若这 100 名学生的语文成绩在某些分数段的人数x 与数学成绩相应分数段的人数y之比方下表所示,求数学成绩在[50 , 90) 分以外的人数.分数段/分[50 , 60)[60 , 70)70, 80)[80 , 90)x∶ y1∶12∶13∶44∶5解: (1) 由频次散布直方图知(2 a+ 0.02 + 0.03 +0.04)× 10= 1,解得a= 0.005.(2)由频次散布直方图知语文成绩在 [50 , 60) ,[60 ,70) , [70 , 80) ,[80 , 90) 各分数段的人数挨次为 0.005 ×10×100= 5,0.04 × 10× 100=40,0.03 ×10× 100= 30,0.02 × 10×100= 20.14由题中给出的比率关系知数学成绩在上述各分数段的人数挨次为5,40×2= 20,30×3 5=40, 20×4=25.故数学成绩在[50 , 90) 分以外的人数为100- (5 + 20+ 40+ 25) =10.B 级能力提高1.为了研究某药品的疗效,选用若干名志愿者进行临床试验,全部志愿者的舒张压数据( 位: kPa) 的分区 [12 , 13) , [13 ,14) , [14 ,15) , [15 , 16) ,[16 , 17] ,将其按从左到右的序分号第一,第二,⋯,第五,如是依据数据制成的率散布直方.已知第一与第二共有20 人,第三中没有效的有 6 人,第三中有效的人数()A. 6B. 8C. 12D. 18分析:志愿者的人数20= 50,因此第三的人数50×0.36 = 18,( 0.16 +0.24)×1有效的人数18- 6= 12.答案: C2.从某小区抽取 100 居民行月用量,其用量都在50~ 350 度之,率散布直方如所示:(1)直方中 x 的________;(2)在些用中,用量落在区[100 , 250) 内的数 ________.分析: (1) 因为 (0.002 4+0.003 6+0. 006 0+x+0.002 4+0.001 2 )×50=1,解得x=0.004 4.(2) 数据落在 [100 , 250) 内的率是 (0.003 6+0.006 0+0.004 4)×50=0.7.因此月用量在[100 , 250) 内的数100×0.7 = 70.答案: (1)0.004 4(2)703.了甲、乙两个网站受迎的程度,随机取了14 天,上午8: 00~ 10:0各自的点量,获得如所示的茎叶,依据茎叶回答以下.(1)甲、乙两个网站点击量的极差分别是多少?(2)甲网站点击量在 [10 ,40] 间的频次是多少?(3)甲、乙两网站哪个更受欢迎?并说明原因.解: (1) 甲网站的极差为:73- 8= 65,乙网站的极差为:71- 5= 66.4 2(2)=≈0.286. 147(3)甲网站的点击量集中在茎叶图的下方,而乙网站的点击量集中在茎叶图的上方,从数据的散布状况来看,甲网站更受欢迎.。
2.2 用样本估计总体2.2.1 用样本的频率分布估计总体分布双基达标(限时20分钟)1.用样本频率分布估计总体频率分布的过程中,下列说法正确的是 ( ).A .总体容量越大,估计越精确B .总体容量越小,估计越精确C .样本容量越大,估计越精确D .样本容量越小,估计越精确 解析 由用样本估计总体的性质可得. 答案 C2.频率分布直方图中,小长方形的面积等于 ( ). A .组距 B .频率 C .组数 D .频数解析 根据小长方形的宽及高的意义,可知小长方形的面积为一组样本数据的频率. 答案 B3.一个容量为100的样本,其数据的分组与各组的频数如下表组别 (0,10] (10,20] (20,30] (30,40] (40,50] (50,60] (60,70] 频数1213241516137A .0.13B .0.39C .0.52D .0.64解析 由题意可知频数在(10,40]的有:13+24+15=52,由频率=频数÷总数可得0.52. 答案 C4.一个容量为n 的样本,分成若干组,已知甲组的频数和频率分别为36和14,则容量n =________,且频率为16的乙组的频数是________.解析 抽样时要保证每个个体被抽到的机会均等,14=36n ,所以n =36×4=144,同理16=x144,x =24. 答案 144 245.为了帮助班上的两名贫困生解决经济困难,班上的20名同学捐出了自己的零花钱,他们捐款数(单位:元)如下:19,20,25,30,24,23,25,29,27,27,28,28,26,27,21,30,20,19,22,20.班主任老师准备将这组数据制成频率分布直方图,以表彰他们的爱心.制图时先计算最大值与最小值的差是________.若取组距为2,则应分成________组;若第一组的起点定为18.5,则在[26.5,28.5)内的频数为________.解析 由题意知,极差为30-19=11;由于组距为2,则112=5.5不是整数,所以取6组;捐款数落在[26.5,28.5)内的有27,27,28,28,27共5个,因此频数为5. 答案 11 6 56.美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图. (2)用自己的语言描述一下历届美国总统就任时年龄的分布情况. 解 (1)以4为组距,列表如下:分组 频数累计频数 频率 [41.5,45.5) 2 0.045 5 [45.5,49.5) 7 0.159 1 [49.5,53.5) 8 0.181 8 [53.5,57.5)16 0.363 6 [57.5,61.5) 5 0.113 6 [61.5,65.5) 4 0.090 9 [65.5,69.5] 2 0.045 5 合计441.00(2)从频率分布表中可以看出,将近60%的美国总统就任时的年龄在50岁至60岁之间,45岁以下以及65岁以上就任的总统所占的比例相对较小.综合提高(限时25分钟)7.一个容量为35的样本数据,分组后,组距与频数如下:[5,10),5个;[10,15),12个;[15,20),7个;[20,25),5个;[25,30),4个;[30,35),2个.则样本在区间[20,+∞)上的频率为().A.20% B.69% C.31% D.27%解析由题意,样本中落在[20,+∞)上的频数为5+4+2=11,∴在区间[20,+∞)上的频率为1135≈0.31.答案 C8.(2012·烟台高一检测)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是().A.90 B.75 C.60 D.45解析∵样本中产品净重小于100克的频率为(0.050+0.100)×2=0.3,频数为36,∴样本总数为360.3=120.∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,∴样本中净重大于或等于98克并且小于104克的产品的个数为120×0.75=90.答案 A9.将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________.解析∵n×2+3+42+3+4+6+4+1=27,∴n=60.答案6010.如图是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知________.甲运动员的成绩好于乙运动员;②乙运动员的成绩好于甲运动员;③甲、乙两名运动员的成绩没有明显的差别;④甲运动员的最低得分为0分.解析从这个茎叶图可以看出甲运动员的得分大致对称,平均得分是30多分,乙运动员的得分除一个52分外,也大致对称,平均得分20多分.因此,甲运动员发挥比较稳定,总体得分情况比乙好.答案①11.(2012·合肥高一检测)在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,你会得到什么结论?解(1)(2)电脑杂志上每个句子的字数集中在10~30之间;而报纸上每个句子的字数集中在20~40之间.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为科普读物需要通俗易懂、简明.12.(创新拓展)如图是一个样本的频率分布直方图,且在[15,18)内频数为8.(1)求样本容量;(2)若[12,15)一组的小长方形面积为0.06,求[12,15) 一组的频数;(3)求样本在[18,33)内的频率.解 (1)由图可知[15,18)一组对应的纵轴数值为475,且组距为3,所以[15,18)一组对应的频率为475×3=425.又已知[15,18)一组的频数为8,所以样本容量n =8425=50.(2)[12,15)一组的小长方形面积为0.06,即[12,15)一组的频率为0.06,且样本容量为50,所以[12,15)一组的频数为50×0.06=3.(3)由(1)、(2)知[12,15)一组的频数为3,[15,18)一组的频数为8,样本容量为50,所以[18,33)内频数为50-3-8=39,所以[18,33)内的频率为3950=0.78.。
课堂探究1.列出一组数据的频率分布表、画频率分布直方图,步骤如下:(1)________;(2)______________;(3)________;(4)列频率分布表;(5)绘制频率分布直方图.(1)将一批数据分组,目的是要描述数据分布的规律,要根据数据的多少来确定分组的数目,一般说来,数据越多,分的组数也越多.(2)使分点比数据多一位小数,并且把第1小组的下限略去,或把第1组的起点稍微减小一点,各组上下限的平均数叫做组中值,一般作为各组的代表数.【做一做1-1】用样本频率分布来估计总体情况时,下列叙述正确的序号有________.①估计准确与否与样本容量无关②估计准确与否只与总体容量有关③样本容量越大,估计结果越准确④估计准确与否只与所分组数有关【做一做1-2】一个容量为20的样本,已知某组的频率为0.25,则该组的频数为______.2.____是一组数据的最大值与最小值的差,它反映了一组数据变化的幅度,极差又叫____.因此计算极差时,需要找出这组数据的______和______.组距是指每个小组的两个端点之间的距离,极差、组距、组数有如下关系:(1)若极差组距为整数,则极差组距=组数;(2)若极差组距不为整数,则[极差组距]+1=组数.注意:[x]表示不大于x的最大整数.【做一做2】抽查100袋洗衣粉,测得它们的质量如下(单位:g):494 498 493 505 496 492 485 483 508 511 495 494 483 485 511 493 505 488 501 491 493 509 509 512 484 509 510 495 497 498 504 498 483 510 503 497 502 511 497 500 493 509 510 493 491 497 515 503 515 518 510 514 509 499 493 499 509 492 505 489 494 501 509 498 502 500 508 491 509 509 499 495 493 509 496 509 505 499 486 491 492 496 499 508 485 498 496495 496 505 499 505 496 501 510 496 487 511 501 496则样本数据的极差是______.3.在频率分布直方图中,纵轴表示__________,数据落在各小组内的频率用__________________表示,各小长方形的面积总和______.【做一做3】下列说法不正确的是().A.频率分布直方图中每个小矩形的高就是该组的频率B.频率分布直方图中各个小矩形的面积之和等于1C.频率分布直方图中各个小矩形的宽一样大D.频率分布折线图是依次连接频率分布直方图的每个小矩形上边的中点得到的4.频率分布折线图、总体密度曲线(1)频率分布折线图的定义把频率分布直方图______________________用线段连接起来,就得到频率分布折线图.(2)总体密度曲线如果样本容量________,分组的组距________,则频率分布直方图实际上越来越接近于__________,它可以用一条光滑曲线y=f(x)来描绘,这条光滑曲线就叫做总体密度曲线.【做一做4】在频率分布直方图与总体密度曲线的关系中,下列说法正确的是().A.频率分布直方图与总体密度曲线无关B.频率分布直方图就是总体密度曲线C.样本容量很大的频率分布直方图就是总体密度曲线D.如果样本容量无限增大,分组组距无限缩小,那么频率分布直方图就可以用一条光滑曲线——总体密度曲线来描绘5.茎叶图用茎叶图表示数据有两个突出的优点,一是从统计图上没有________的损失,所有的数据信息都可以从茎叶图中得到;二是茎叶图可以________,方便记录与表示.制作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.【做一做5】如图所示的茎叶图中,茎为2的叶数有().A.0 B.1 C.2 D.31.样本的分布与总体分布的关系剖析:数据一旦被收集后,人们总希望从中找出所需要的信息.但通过收集得到的数据一般比较多,这样,就需要对这些数据进行适当的整理,将其转化为可以直接利用的形式,并从中获取相应的信息,以帮助人们作出恰当的决策.统计图就是整理数据的重要工具,它不仅可以帮助我们从数据中获取有用的信息,还可以帮助我们直观、准确地理解相应的结果.不同的统计图有着各自的特点和用途.对于总体中个体取值较少的情况,我们常用条形图表示其样本分布;而对于个体取值较多或无限的总体,我们则常用频率分布表、频率分布直方图、频率分布折线图等图表形式表示样本分布.一般样本容量越大,这种估计越精确.当样本容量较大时,样本中落在每个区间内的样本数的频率会稳定于总体在相应区间内取值的频率.因此,我们可以用样本的频率分布直方图来估计总体在任意区间内取值的频率,也即总体的分布情况.在样本的频率分布中,随着样本容量的不断扩大,其分布越来越接近总体分布,当样本容量无限增大,而组距无限缩小时,频率分布直方图的上方将演变成一条光滑的曲线——总体密度曲线.2.频率分布表、频率分布直方图与频率分布折线图的关系剖析:频率分布直方图中各小矩形的面积等于相应各组的频率,以面积的形式反映了数据落在各个小组的频率的大小.在反映样本的频率分布方面,频率分布表比较准确,频率分布直方图比较直观,它们起着相互补充的作用.频率分布折线图的优点是反映了数据的变化趋势.答案:基础知识·梳理1.(1)计算极差(2)决定组数与组距(3)决定分点【做一做1-1】③一般地,样本容量越大,用样本的频率分布去估计总体的分布就越精确.样本容量越大,工作量也就越大,所以,在实际问题中,我们一般都要根据不同的情况选择适当的样本.【做一做1-2】 52.极差全距最大值最小值【做一做2】353.频率/组距各小长方形的面积等于1 【做一做3】 A4.(1)各个长方形上边的中点(2)不断增大不断缩小总体的分布【做一做4】 D5.原始信息随时记录【做一做5】 D。
人教新课标A版高中数学必修3 第二章统计 2.2样本估计总体 2.2.1用样本的频率分布估计总体同步测试(I)卷姓名:________ 班级:________ 成绩:________一、单选题 (共15题;共30分)1. (2分)(2017·鞍山模拟) 某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,若这200名学生中每周的自习时间不超过m小时的人数为164,则m的值约为()A . 26.25B . 26.5C . 26.75D . 272. (2分)某路段检查站监控录像显示,在某时段内,有1000辆汽车通过该站,现在随机抽取其中的200辆汽车进行车速分析,分析的结果表示为如右图的频率分布直方图,则估计在这一时段内通过该站的汽车中速度不小于90km/h的约有A . 100辆B . 200辆C . 300辆D . 400辆3. (2分)为了解一片速生林的生长情况,随机测量了其中100株树木的底部周长(单位:cm).根据所得数据画出了样本的频率分布直方图,那么在这100株树木中,底部周长小于110cm的株数是A . 30B . 60C . 70D . 804. (2分)某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;…… 第六组,成绩大于等于18秒且小于等于19秒. 右图是按上述分组方法得到的频率分布直方图. 设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y分别为()A . 0.9,35B . 0.9,45C . 0.1,35D . 0.1,455. (2分)为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生,得到学生视力频率分布直方图,如右图,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频率成等差数列.设最大频率为a;视力在4.6到5.0之间的学生人数为b,则a、b的值分别为A . 0.27,78B . 0.27,83C . 2.7,78D . 2.7,836. (2分)已知样本:10861013810121178911912910111211那么频率为0.2的范围是()A . 5.5~7.5B . 7.5~9.5C . 9.5~11.5D . 11.5~13.57. (2分)一个容量为100的样本分成若干组,已知某组的频率为0.3,则该组的频数是()A . 3B . 30C . 10D . 3008. (2分)某校高二(1)班一次阶段考试数学成绩的茎叶图和频率分布直方图可见部分如图,根据图中的信息,可确定被抽测的人数及分数在[90,100]内的人数分别为()A . 20,2B . 24,4C . 25,2D . 25,49. (2分) (2017高二下·乾安期末) 某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论正确的是()A . 月接待游客逐月增加B . 年接待游客量逐年减少C . 各年的月接待游客量高峰期大致在6、7月D . 各年1月至6月的月接待游客量相对于7月至12月,波动性较小,变化比较稳定10. (2分)某大学对名学生的自主招生水平测试成绩进行统计,得到样本频率分布直方图(如图),则这名学生在该次自主招生水平测试中成绩不低于分的学生数是()A .B .C .D .11. (2分)某商场在国庆黄金周的促销活动中,对10月2日9时到14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时到12时的销售额为()A . 6万元B . 8万元C . 10万元D . 12万元12. (2分) (2016高二下·银川期中) 对某班学生一次英语测验的成绩分析,各分数段的分布如图(分数取整数),由此,估计这次测验的优秀率(不小于80分)为()A . 92%B . 24%C . 56%D . 5.6%13. (2分)某地一种植物一年生长的高度如下表:则该植物一年生长在[30,40)内的频率是()B . 0.65C . 0.40D . 0.2514. (2分)为了解某大学的学生是否爱好体育锻炼,用简单随机抽样方法在校园内调查了120位学生,得到如下2×2列联表:男女总计爱好a b73不爱好c25总计74则a﹣b﹣c等于()A . 6B . 7C . 8D . 915. (2分) 5000辆汽车经过某一雷达测速区,其速度频率分布直方图如图所示,则时速超过70km/h的汽车数量为()A . 50C . 1000D . 4500二、填空题 (共5题;共5分)16. (1分)一个高中研究性学习小组对本地区2002年至2004年快餐公司发展情况进行了调查,根据图中的信息可以得出这三年中该地区每年平均销售盒饭________ 万盒.17. (1分)某中学举行了一次田径运动会,其中有50名学生参加了一次百米比赛,他们的成绩和频率如图所示.若将成绩小于15秒作为奖励的条件,则在这次百米比赛中获奖的人数共有________ 人.18. (1分) (2017高一下·珠海期末) 下面是被严重破坏的频率分布表和频率分布直方图,根据残表和残图,则 p=________,q=________.分数段频数[60,70)p[70,80)90[80,90)60[90,100]20q19. (1分) (2017高一下·桃江期末) 如图是某班50名学生身高的频率分布直方图,那么身高在区间[150,170)内的学生约有________人.20. (1分)对某文科班50名同学的一次数学成绩进行了统计,全年级文科数学平均分是100分,这个班数学成绩的频率分布直方图如图:(总分150分)从这个班中任取1人,其数学成绩达到或超过年级文科平均分的概率是________.三、解答题 (共5题;共25分)21. (5分) (2017高一下·衡水期末) 2015年下学期某市教育局对某校高三文科数学进行教学调研,从该校文科生中随机抽取40名学生的数学成绩进行统计,将他们的成绩分成六段[80,90),[90,100),[100,110),[110,120),[120,130),[130,140)后得到如图所示的频率分布直方图.(1)求这40名学生中数学成绩不低于120分的学生人数;(2)若从数学成绩[80,100)内的学生中任意抽取2人,求成绩在[80,90)中至少有一人的概率.22. (5分)为了研究某种农作物在特定温度下(要求最高温度t满足:27℃≤t≤30℃)的生长状况,某农学家需要在十月份去某地进行为期十天的连续观察试验.现有关于该地区10月份历年10月份日平均最高温度和日平均最低温度(单位:℃)的记录如下:(Ⅰ)根据本次试验目的和试验周期,写出农学家观察试验的起始日期.(Ⅱ)设该地区今年10月上旬(10月1日至10月10日)的最高温度的方差和最低温度的方差分别为D1 , D2 ,估计D1 , D2的大小?(直接写出结论即可).(Ⅲ)从10月份31天中随机选择连续三天,求所选3天每天日平均最高温度值都在[27,30]之间的概率.23. (5分)某初级中学共有学生2000名,各年级男、女生人数如下表:初一年级初二年级初三年级已知在全校学生中随机抽取1名,抽到初二年级女生的概率是0.19.(1)求x的值;(2)现用分层抽样的方法在全校抽取48名学生,问应在初三年级抽取多少名?24. (5分)一个地区共有5个乡镇,共30万人,其人口比例为3∶2∶5∶2∶3,从这30万人中抽取一个300人的样本,分析某种疾病的发病率.已知这种疾病与不同的地理位置及水土有关,则应采取什么样的抽样方法?并写出具体过程.25. (5分) (2018高二上·宾阳月考) 某产品的三个质量指标分别为x,y,z,用综合指标S=x+y+z评价该产品的等级.若S≤4,则该产品为一等品.先从一批该产品中,随机抽取10件产品作为样本,其质量指标列表如下:(1)利用上表提供的样本数据估计该批产品的一等品率;(2)在该样本的一等品中,随机抽取2件产品,(ⅰ) 用产品编号列出所有可能的结果;(ⅱ) 设事件B为“在取出的2件产品中,每件产品的综合指标S都等于4”,求事件B发生的概率.参考答案一、单选题 (共15题;共30分)1-1、2-1、3-1、4-1、5-1、6-1、7-1、8-1、9-1、10-1、11-1、12-1、13-1、14-1、15-1、二、填空题 (共5题;共5分) 16-1、17-1、18-1、19-1、20-1、三、解答题 (共5题;共25分) 21-1、21-2、22-1、23-1、24-1、25-1、25-2、。
2用样本的频次散布预计整体散布(一)教材剖析本节内容是数学 3 第二章统计第二节用样本预计整体的第一小节第一课时,是在学习了随机抽样的基础上,进一步学惯用图、表来剖析样本数据并用样本的频次散布预计整体散布,为后边整体的众数、中位数、均匀数的预计做好知识铺垫 . 本节课的要点是频次散布表、频次散布直方图的绘制,难点是用样本的频次散布预计整体散布 . 经过对样本剖析和整体预计的过程,锻炼用图、表剖析数据的能力和对实质问题决议能力,理解用样本预计整体的思想,感觉数学对实质生活的需要,认识到数学知识源于生活并指导生活的事实,领会数学知识与现实世界的联系 .课时分派本节内容用 1 课时的时间达成,主假如学习绘制频次散布直方图和用样本的频次散布预计整体散布 .教课目的要点 :频次散布表、频次散布直方图的绘制.难点:用样本的频次散布预计整体散布.知识点:频次散布表、频次散布直方图.能力点:如何应用样本预计整体的思想,解决一些简单的实质问题.领会教育点:感觉数学对实质生活的需要,认识到数学知识源于生活并指导生活的事实,数学知识与现实世界的联系.自主研究点:相同一组数据,假如组距不一样,横轴、纵轴的单位不一样,频次散布直方图如何变化 .考试点:频次散布直方图的绘制和用样本的频次散布预计整体散布.易错易混点:频次散布直方图中误将纵轴表示频次.拓展点:能用其余图形对样本数据进行剖析吗.教具准备多媒体课件讲堂模式问题指引一、引入新课问题:前方我们主要学习了哪些抽样方法,抽取样本的目的是什么呢?【师生活动】学生思虑后回答.教师进一步指引:抽取样本是为从样本中获守信息,来预计整体的一些性质特色。
可是多而凌乱的数据,我们常常没法直接从原始数据中理解它们所包括的信息。
如何借助图、表、计算来剖析数据,使数据所包括的信息转变为直观、易理解的形式呢?这正是这节课需研究的问题 .【设计企图】回首旧知,合理设置新知识的生长点,以保证新内容的自然引入,使学生对新知识的接受不会感觉太冒昧,理解新旧知识的联系.【设计说明】留足够多时间让学生稳固旧知,在此基础上,进一步用问题惹起学生思虑,调换学生研究新知踊跃性 .二、研究新知教师——我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节俭生活用水,计划在本市试行居民生活用水定额管理,即确立一个居民月用水量标准a,用水量不超出 a 的部分按平价收费,高出 a 的部分按议价收费. 假如希望大多数居民的平时生活不受影响,那么标准 a 定为多少比较合理呢?你以为,为了了较为合理地确立出这个标准,需要做哪些工作?学生——为了拟订一个较为合理的标准a,一定先认识全市居民平时用水量的散布状况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比状况等. 所以采纳抽样检查的方式,经过剖析样本数据来预计全市居民用水量的散布状况.【设计企图】激发学生的学习兴趣,研究热忱,特别是问题提出,增添了学生的参加感. 让学生充足领会数学根源于生活,研究统计拥有较强的实质意义.学生——在教师指引下看课本P66 表 2-1 (此中 100 位居民某年的月均用水量)教师——如何将样本数据的信息反应出来,可用什么方法?学生——鉴于初中的统计知识学生议论后基本上会获得下边结论:剖析样本数据用图将它们画出来,用图反应样本信息 .教师——剖析数据的一种基本方法是用图将它们画出来,或许用紧凑的表格改变数据的摆列方式,作图能够达到两个目的,( 1)是从数据中提守信息,(2)是利用图形传达信息. 表格则是经过改变数据的组成形式,为我们供给解说数据的新方式.【设计企图】指引学生思虑如何对样本数据进行剖析,为频次散布直方图的学习做好准备. 教师——下边我们学习的频次散布表和频次散布图,则是从各个小组数据在样本容量中所占比率大小的角度,来表示数据散布的规律. 能够让我们更清楚的看到整个样本数据的频次分布状况 .频次散布是指一个样本数据在各个小范围内所占比率的大小. 一般用频次散布直方图反应样本的频次散布 . 其一般步骤为:(1)求极差 ( 即一组数据中最大值与最小值的差) :知道这组数据的改动范围(2)决定组距与组数组数:一般状况下,当样本容量不超出100 时,依据数据的多少,一般分红 5—12 组组距:指每个小组的两个端点的距离,这组数据我们确立组距为极差9 组 )组数 = 8.2 (关于本组数据我们分组距(3)将数据分组:[0, 0.5 ) ,[ 0.5 ,1 ) ,,[ 4, 4.5 ](4)列频次散布表(见课本 P67)(5 )画频次散布直方图频次/组距01234【设计企图】经过师生共同剖析、列表、作图,让学生掌握频次散布表、频次散布直方图的画法步骤,并领会图、表的各自特色问题一:每个小正方形的面积表示什么?问题二:全部小正方形的面积和是多少?【设计企图】让学生注意纵坐标不是频次,而是频次/ 组距,在频次散布直方图中,各小长方形的面积等于相应各组的频次,频次之和等于 1. 研究:相同一组数据,假如组距不一样,横轴、纵轴的单位不一样,获得的图和形状也会不一样不一样的形状给人以不一样的印象,这类印象有时会影响我们对整体的判断,分别以0.1 和1为组距从头作图,而后说说你对图的印象?结论:分组数的变化能够惹起频次散布表和频次散布直方图的构造变化;坐标系的单位长度的变化只好惹起频次散布直方图的形状沿坐标轴方向的拉伸变化.【设计企图】深入理解频次散布表、频次散布直方图的画法,同时领会到统计结果随机性、科学性,能作为整体的散布的合理性.思虑一:假如当地政府希望使85%以上的居民每个月的用水量不高出标准,依据频次散布表2-2 和频次散布直方图 2.2-1 ,(见课本 P67)你能对拟订月用水量标准提出建议吗?(标准可为 3t )思虑二:你以为 3 吨这个标准必定能够保证85%以上的居民用水量不超出标准吗?假如不一定那么哪些环节可能会致使结论的差异?( 可能出现误差 )【设计企图】从实质问题出发,再回到实质问题的决议,前后响应,使学生真实领会数据处理的全过程、统计应用于现实生活的全过程,领会这一“方法”对决议者的重要,使学生有一种身临其境之感,领会到学好数学也是一种“责任”.三、理解新知频次散布直方图的特色:(1)从频次散布直方图能够清楚的看出数据散布的整体趋向,(2)从频次散布直方图得不出原始的数据内容,把数据表示成直方图后,原有的详细数据信息就被抹掉了 .整体散布指的是整体取值的频次散布规律,因为整体散布不易知道,所以我们常常经过频次散布直方图用样本的频次散布去预计整体散布.【设计企图】掌握频次散布直方图与原始样本数据的关系,认识频次散布直方图剖析样本数据的优势和弊端,理解用样本的频次散布预计整体散布的思想.四、运用新知例 1 下表给出了某校500 名 12 岁男孩顶用随机抽样得出的120 人的身高 ( 单位cm ) 区间界线 [122,126) [126,130) [130,134) [134,138) [138,142) [142,146) 人数 5 8 10 22 33 20区间界线 [146,150) [150,154) [154,158)人数11 6 5(1) 列出样本频次散布表﹔ (2) 一画出频次散布直方图 ;(3) 预计身高小于 134cm的人数占总人数的百分比 .剖析:依据样本频次散布表、频次散布直方图的一般步骤解题 .解:(1)样本频次散布表以下:分组频数 频次 [122,126) 5 [126,130) 8 [130,134) 10 [134,138) 22 [138,142) 33 [142,146) 20 [146,150) 11[150,154) 6 (2)其[154,158) 5 频次散布直方图以下:共计频次 1201/ 组距o122 126 130 134 138 142 146 150 154 158身高( cm )(3)由样本频次散布表可知身高小于 134cm 的男孩出现的频次为0.04+0.07+0.08=0.19 ,所以我们预计身高小于 134cm 的人数占总人数的 19%.【设计企图】 经过学生的自我实践, 让学生掌握绘制频次散布表、 频次散布直方图的方法步骤,并会用样本的频次散布预计整体散布.例 2 为了认识高一学生的体能状况 , 某校抽取部频次/组距分学生进行一分钟跳绳次数测试, 将所得数据整理后,画出频次散布直方图( 如图 ) ,图中从左到右各小长方形面积之比为 2: 4:17:15:9:3,第二小 组频数为 12.(1) 第二小组的频次是多少?样本容量是多少?(2) 若次数在 110 以上(含 110 次)为达标,试预计该学校全体高一学生的达标率是多少?(3) 在此次测试中,学生跳绳次数的中位数落在哪个小组内?请说明原因 .剖析:在频次散布直方图中,各小长方形的面积等于相应各组的频次,小长方形的高与频数成正比,o100 110 120 130 140 150 次数90各组频数之和等于样本容量,频次之和等于 1.解:( 1)因为频次散布直方图以面积的形式反应了数据落在各小组内的频次大小,所以第二小组的频次为:44 17 15 92 3 又因为频次 =第二小组频数样本容量所以样本容量第二小组频数12150 =第二小组频次(2)由图可预计该学校高一学生的达标率约为17 15 9 3100% 88%2 4 17 15 9 3(3)由已知可得各小组的频数挨次为6,12,51,45,27,9,所从前三组的频数之和为 69,前四组的频数之和为 114,所以跳绳次数的中位数落在第四小组内.【设计企图】综合运用频数、样本容量、频次、小长方形面积关系解题,注意小长方形面积和为 1,加深用样本的频次散布预计整体思想的理解与应用.五、讲堂小结让学生回首议论,总结本节课学习内容:1.知识:频次散布表、频次散布直方图的绘制.2.思想:用样本预计整体的思想.教师总结 :掌握绘制频次散布直方图的步骤,注意纵轴表示频次/ 组距,小长方形面积表频率. 长处是能够很简单地表示大批数据,特别直观地表示散布形状,能看到在散布表中看不清楚的一些数据模式 . 弊端是能够大概预计出整体的散布状况,原有的详细数据信息就被抹掉了 . 领会到统计结果随机性、科学性,能作为整体的散布的合理性【设计企图】培育学生实时梳理,系统总结新学知识和方法的习惯,既从整体上掌握知识方法,又分清重难点,形成优秀的知识构造.六、部署作业1.阅读教材2.书面作业P66— 68;必做题:P81 习题 2.2 A 组 2选做题: 1. 在抽查某产品的尺寸过程中,将其尺寸分红若干组,[a,b] 是此中一组,抽查出的个体数在该组上的频率为 m ,该组上的直方图的高为h,则 | a b | 等于()( A) hmh(C )m( B) (D ) 与 m, h 没关m h2.为了认识学生身体的发育状况,对某要点中学年满 17 岁的 60 名同学的身高进行了丈量,结果以下(单位:m)身高人数 2 1 4 2 4 2 7 6 8身高人数7 4 3 2 1 2 1 1(Ⅰ)依据上表,预计这所要点中学年满 17 岁的男同学中,身高不低于于1.71 m的约占多少?不低于 1.63 m的约占多少?1.65 m且不高(Ⅱ)画出频次散布直方图,说出该校年满17 岁的男同学中身高在哪个范围内的人数所占比率最大?假如该校年满17 岁的男同学恰巧是300 人,那么在这个范围内的人数预计约有多少人?3.课外思虑能用其余图形对样本数据进行剖析吗.【设计企图】经过学生阅读和书面作业让学生进一步掌握绘制频次散布表、频次散布直方图的步骤,会用样本的频次散布预计整体散布;课外思虑的安排,是惹起学生发散思虑,为后面频次散布折线图、茎叶图的学习做好准备.七、教后反省1. 本教课设计的亮点是新知的研究,让学生参加到教课的过程中,体验数据办理、信息剖析、到最后进行决议等统计思想的整个过程,使学生一直保持较高的学习踊跃性.2.建议教师在使用本教课设计时多媒体展现与着手演示作图过程灵巧联合,兼备效率与成效.3.本节课的弱项是因为知识内容多,没能留给学生许多时间着手作图, 裸露操作中的各样不足.八、板书设计一、复习引入二、研究新知1. 频次散布直方图作2用样本的频次散布预计整体散布(3.研究相同一组数三、运用新知据,频次散布直方图例 1不一样构造变化1)四、小结五、部署作业法2. 频次散布直方图理例 2 解问题一问题二。
2.2.1用样本的频率分布估计总体分布(一)课时达标训练一、基础过关1.如图所示是一容量为100的样本的频率分布直方图,则由图形中的数据,样本落在[15,20)内的频数为()A.20 B.30 C.40 D.50答案 B解析样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.2.容量为20的样本数据,分组后的频数如下表:分[10,20)[20,30)[30,40)[40,50)[50,60)[60,70) 组频23454 2数A.0.35 B.0.45 C.0.55 D.0.65答案 B解析根据频率的定义求解.由表知[10,40)的频数为2+3+4=9,所以样本数据落在区间[10,40)的频率为9=0.45.203.某校为了了解高三学生的身体情况,抽取了100名女生的体重.将所得的数据整理后,画出了如图的频率分布直方图,则所抽取的女生中体重在40~45 kg的人数是()A .10B .2C .5D .15答案 A解析 由图可知频率=频率组距×组距,知频率=0.02×5=0.1,∴0.1×100=10人.4.学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n 的样本,其频率分布直方图如图所示,其中支出在[50,60)的同学有30人,若想在这n 个人中抽取50个人,则在[50,60)之间应抽取的人数为( )A .10B .15C .25D .30答案 B解析 根据频率分布直方图得总人数n =301-(0.01+0.024+0.036)×10=100,依题意知,应采取分层抽样,再根据分层抽样的特点,则在[50,60)之间应抽取的人数为50×30100=15.5.将容量为n 的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________. 答案60解析∵n·2+3+42+3+4+6+4+1=27,∴n=60.6.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)直方图中x的值为__________;(2)在这些用户中,用电量落在区间[100,250)内的户数为________.答案(1)0.004 4(2)70解析(1)(0.002 4+0.003 6+0.006 0+x+0.002 4+0.001 2)×50=1,∴x=0.004 4.(2)(0.003 6+0.004 4+0.006 0)×50×100=70.7.某制造商在今年3月份生产了一批乒乓球,随机抽取100个进行检查,测得每个球的直径(单位:mm),将数据分组如下表:分组频数频率[39.95,39.97)10[39.97,39.99)20[39.99,40.01)50[40.01,40.03]20合计100补充完成频率分布表(结果保留两位小数),并在上图中画出频率分布直方图. 解 频率分布表如下:分组 频数 频率 [39.95,39.97) 10 0.10 [39.97,39.99) 20 0.20 [39.99,40.01) 50 0.50 [40.01,40.03]20 0.20 合计1001二、能力提升8.容量为100的样本数据按从小到大的顺序分为8组,如下表:组号 1 2 3 4 5 6 7 8 频数1013 x 14 15 13 129 第3( )A .14和0.14B .0.14和14 C.114和0.14D.13和114答案 A9.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( )A.588 B.480 C.450 D.120答案 B解析少于60分的学生人数为600×(0.05+0.15)=120,∴不少于60分的学生人数为480.10.如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.答案9解析结合直方图和样本数据的特点求解.最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右面矩形面积为0.18×1=0.18,50×0.18=9.11.某市共有5 000名高三学生参加联考,为了了解这些学生对数学知识的掌握情况,现从中随机抽出若干名学生在这次测试中的数学成绩,制成如下频率分布表:分组频数频率[80,90)①②[90,100)0.050[100,110)0.200[110,120)360.300[120,130)0.275[130,140)12③[140,150]0.050合计④(1)根据上面的频率分布表,求①,②,③,④处的数值;(2)在所给的坐标系中画出区间[80,150]上的频率分布直方图.解(1)①3,②0.025,③0.100,④120.(2)频率分布直方图如下:三、探究与拓展12.某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.解 (1)由频率分布直方图知(2a +0.02+0.03+0.04)×10=1,解得a =0.005.(2)由频率分布直方图知这100名学生语文成绩的平均分为55×0.005×10+65×0.04×10+75×0.03×10+85×0.02×10+95×0.005×10=73(分).(3)由频率分布直方图知语文成绩在[50,60),[60,70),[70,80),[80,90)各分数段的人数依次为0.005×10×100=5,0.04×10×100=40,0.03×10×100=30,0.02×10×100=20. 由题中给出的比例关系知数学成绩在上述各分数段的人数依次为5,40×12=20,30×43=40,20×54=25.故数学成绩在[50,90)之外的人数为100-(5+20+40+25)=10.。
人教版高中数学必修三 第二章 统计2.2.1《用样本的频率分布估计总体分布》课时检测一、选择题 1.下列说法不正确的是( )A .频率分布直方图中每个小矩形的高就是该组的频率B .频率分布直方图中各个小矩形的面积之和等于1C .频率分布直方图中各个小矩形的宽一样大D .频率分布折线图是依次连接频率分布直方图的每个小矩形上端中点得到的 2.画样本频率分布直方图时,决定组数的正确方法是( ) A.任意确定 B.一般分为5~12组 C.由组距极差决定D.根据经验法则,灵活掌握3.一个容量为100的样本,其数据的分组与各组的频数如下:组别 (0,10] (10,20] (20,30] (30,40] (40,50] (50,60] (60,70] 频数1213241516137A .0.13B .0.39C .0.52D .0.644.100辆汽车通过某一段公路时的时速的频率分布直方图如下图所示,则时速在[60,70)的汽车大约有( )A .30辆B .40辆C .60辆D .80辆 5.一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数 为( ) A.4B.8C.12D.166.一个容量为35的样本数据,分组后,组距与频数如下:[5,10),5;[10,15),12;[15,20),7;[20,25),5;[25,30),4;[30,35),2.则样本在区间[20,+∞)上的频率约为()A.20%B.69%C.31%D.27%7.如图是总体密度曲线,下列说法正确的是()A.组距越大,频率分布折线图越接近于它B.样本容量越小,频率分布折线图越接近于它C.阴影部分的面积代表总体在(a,b)内取值的百分比D.阴影部分的平均高度代表总体在(a,b)内取值的百分比8.如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为()A.0.2B.0.4C.0.5D.0.69.一个容量为35的样本数据,分组后,组距与频数如下:[5,10),5个;[10,15),12个;[15,20),7个;[20,25),5个;[25,30),4个;[30,35),2个.则样本在区间[20,+∞)上的频率为()A.20% B.69% C.31% D.27%10.为了解学生“阳光体育”活动的情况,随机统计了n名学生的“阳光体育”活动时间(单位:分钟),所得数据都在区间[10,110]内,其频率分布直方图如图所示.已知活动时间在[10,35)内的频数为80,则n的值()A.700B.800C.850D.90011.某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是()A.90 B.75 C.60 D.4512.某高校进行自主招生,先从报名者中筛选出400人参加笔试,再按笔试成绩择优选出100人参加面试,现随机调查了24名笔试者的成绩,如下表所示:分数段[60,65) [65,70) [70,75) [75,80) [80,85) [85,90) 人数 2 3 4 9 5 1据此估计允许参加面试的分数线大约是()A.75B.80C.85D.9013.AQI是表示空气质量的指数,AQI越小,表明空气质量越好,当AQI不大于100时称空气质量为“优良”.如图是某地4月1日到12日AQI的统计数据,图中点A 表示4月1日的AQI为201.则下列叙述不正确的是()A.这12天中有6天空气质量为“优良”B.这12天中空气质量最好的是4月9日C.这12天的AQI的中位数是90D.从4日到9日,空气质量越来越好14.下图是2017年第一季度五省GDP情况图,则下列陈述正确的是()①2017年第一季度GDP总量和增速均居同一位的省只有1个;②与去年同期相比,2017年第一季度五个省的GDP总量均实现了增长;③去年同期的GDP总量前三位是D省、B省、A省;④2016年同期A省的GDP总量也是第三位.A.①②B.②③④C.②④D.①③④15.某公司10个销售店某月销售某产品数量(单位:台)的茎叶图如下:分组成[10,20),[20,30),[30,39]时,所作的频率分布直方图是()二、填空题16.将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________.17.如图是100位居民月平均用水量的频率分布直方图,则月平均用水量为[2,2.5)范围内的居民数有人.18.为了普及环保知识,增强环保意识,某大学有300名员工参加环保知识测试,按年龄分组:第1组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50),得到的频率分布直方图如图所示.现在要从第1,3,4组中用分层抽样的方法抽取16人,则在第4组中抽取的人数为.19.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是________.20.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在各组上的频率为m,该组上直方图的高为h,则|a-b|=________.21.已知样本:71014871211108101310811891291312那么这组样本数据落在范围8.5~11.5内的频率为.22.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在60株树木中底部周长小于100 cm的株数为.23.在样本的频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形的面积和的41,且样本容量为160,则中间一组的频数为 .24.空气质量指数(Air Quality Ind,简称AQI)是定量描述空气质量状况的指数,空气质量按照AQI 大小分为六级,0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;大于300为严重污染.一环保人士从当地某年的AQI 记录数据中,随机抽取10个,用茎叶图记录如图.根据该统计数据,估计此地该年AQI 大于100的天数约为 .(该年为365天)三、解答题25.某车间20名工人年龄数据如下表:年龄(岁)工人数(人)19128 3 29 3 30 5 31 4 32 3 40 1 合计20(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;26.市旅游局为了了解明代县衙在大众中的熟知度,随机对15~65岁的人群抽取n人,问题是“明代县衙是几A级旅游景点?”统计结果如下图表.组号分组回答正确人数回答正确人数占本组的频率第1组[15,25) a 0.5第2组[25,35) 18 x第3组[35,45) b 0.9第4组[45,55) 9 0.36第5组[55,65] 3 y(1)分别求出a,b,x,y的值;(2)从第2,3,4组回答正确的人中用分层抽样的方法抽取6人,求第2,3,4组每组各抽取多少人.27.为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午8∶00~10∶00间各自的点击量,得如图所示的茎叶图,根据茎叶图回答下列问题.(1)甲、乙两个网站点击量的极差分别是多少?(2)甲网站点击量在[10,40]间的频率是多少?(3)甲、乙两网站哪个更受欢迎?并说明理由.28.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得到如下频数分布表:质量指标[75,85) [85,95) [95,105) [105,115) [115,125) 值分组频数 6 26 38 22 8(1)作出这些数据的频率分布直方图;(2)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?29. 为检查某工厂所生产的8万台电风扇的质量,抽查了其中20台的无故障连续使用时限(单位:小时)如下: 248256232243188268278266289312274296288 302295228287217329283(1)完成下面的频率分布表,并作出频率分布直方图;分组频数频率频率/组距[180,200)[200,220)[220,240)[240,260)(2)估计8万台电风扇中有多少台无故障连续使用时限不低于280小时.2.2.1《用样本的频率分布估计总体分布》课时检测解答一、选择题1.下列说法不正确的是()A.频率分布直方图中每个小矩形的高就是该组的频率B.频率分布直方图中各个小矩形的面积之和等于1C.频率分布直方图中各个小矩形的宽一样大D.频率分布折线图是依次连接频率分布直方图的每个小矩形上端中点得到的[答案] A2.画样本频率分布直方图时,决定组数的正确方法是()A.任意确定B.一般分为5~12组C.由组距极差决定 D.根据经验法则,灵活掌握[答案] C3.一个容量为100的样本,其数据的分组与各组的频数如下:组别 (0,10] (10,20] (20,30] (30,40] (40,50] (50,60] (60,70] 频数1213241516137A .0.13B .0.39C .0.52D .0.64 [答案] C[解析] [样本数据落在(10,40]上的频数为13+24+15=52, 故其频率为52100=0.52.]4.100辆汽车通过某一段公路时的时速的频率分布直方图如下图所示,则时速在[60,70)的汽车大约有( )A .30辆B .40辆C .60辆D .80辆 [答案] B[解析] [时速在[60,70)的汽车的频率为:0.04×(70-60)=0.4, 又因汽车的总辆数为100,所以时速在[60,70)的汽车大约有0.4×100=40(辆).]5.一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数 为( ) A.4B.8C.12D.16[答案] B6.一个容量为35的样本数据,分组后,组距与频数如下:[5,10),5;[10,15), 12;[15,20),7;[20,25),5;[25,30),4;[30,35),2.则样本在区间[20,+∞)上的频率约为( ) A.20%B.69%C.31%D.27%[答案] C7.如图是总体密度曲线,下列说法正确的是()A.组距越大,频率分布折线图越接近于它B.样本容量越小,频率分布折线图越接近于它C.阴影部分的面积代表总体在(a,b)内取值的百分比D.阴影部分的平均高度代表总体在(a,b)内取值的百分比[答案] C8.如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为()A.0.2B.0.4C.0.5D.0.6[答案] B9.一个容量为35的样本数据,分组后,组距与频数如下:[5,10),5个;[10,15),12个;[15,20),7个;[20,25),5个;[25,30),4个;[30,35),2个.则样本在区间[20,+∞)上的频率为()A.20% B.69% C.31% D.27%[答案] C[解析][由题意,样本中落在[20,+∞)上的频数为5+4+2=11,∴在区间[20,+∞)上的频率为1135≈0.31.]10.为了解学生“阳光体育”活动的情况,随机统计了n名学生的“阳光体育”活动时间(单位:分钟),所得数据都在区间[10,110]内,其频率分布直方图如图所示.已知活动时间在[10,35)内的频数为80,则n的值()A.700B.800C.850D.900[答案] B11.某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是()A.90 B.75 C.60 D.45[答案] A[解析][∵样本中产品净重小于100克的频率为(0.050+0.100)×2=0.3,频数为36,∴样本总数为360.3=120.∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,∴样本中净重大于或等于98克并且小于104克的产品的个数为120×0.75=90.]12.某高校进行自主招生,先从报名者中筛选出400人参加笔试,再按笔试成绩择优选出100人参加面试,现随机调查了24名笔试者的成绩,如下表所示:据此估计允许参加面试的分数线大约是()A.75B.80C.85D.90[答案] B13.AQI是表示空气质量的指数,AQI越小,表明空气质量越好,当AQI不大于100时称空气质量为“优良”.如图是某地4月1日到12日AQI的统计数据,图中点A 表示4月1日的AQI为201.则下列叙述不正确的是()A.这12天中有6天空气质量为“优良”B.这12天中空气质量最好的是4月9日C.这12天的AQI的中位数是90D.从4日到9日,空气质量越来越好[答案] C14.下图是2017年第一季度五省GDP情况图,则下列陈述正确的是()①2017年第一季度GDP总量和增速均居同一位的省只有1个;②与去年同期相比,2017年第一季度五个省的GDP总量均实现了增长;③去年同期的GDP总量前三位是D省、B省、A省;④2016年同期A省的GDP总量也是第三位.A.①②B.②③④C.②④D.①③④[答案] B15.某公司10个销售店某月销售某产品数量(单位:台)的茎叶图如下:分组成[10,20),[20,30),[30,39]时,所作的频率分布直方图是()[答案] B二、填空题16.将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________.[答案] 60[解析]∵n·2+3+42+3+4+6+4+1=27,∴n=60.17.如图是100位居民月平均用水量的频率分布直方图,则月平均用水量为[2,2.5)范围内的居民数有人.[答案] 2518.为了普及环保知识,增强环保意识,某大学有300名员工参加环保知识测试,按年龄分组:第1组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50),得到的频率分布直方图如图所示.现在要从第1,3,4组中用分层抽样的方法抽取16人,则在第4组中抽取的人数为.[答案] 619.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是________.[答案] 45,46[解析] 由茎叶图及中位数的概念可知x 甲中=45,x 乙中=46.20.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a ,b)是其中的一组,抽查出的个体在各组上的频率为m ,该组上直方图的高为h ,则|a -b|=________. [答案] hm[解析]频率组距=h ,故|a -b|=组距=频率h =mh . 21.已知样本:7 10 14 8 7 12 11 10 8 10 13 10 8 11 8 9 12 9 13 12那么这组样本数据落在范围8.5~11.5内的频率为 . [答案] 0.422.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在60株树木中底部周长小于100 cm 的株数为 .[答案] 2423.在样本的频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形的面积和的41,且样本容量为160,则中间一组的频数为 . [答案] 3224.空气质量指数(Air Quality Ind,简称AQI)是定量描述空气质量状况的指数,空气质量按照AQI大小分为六级,0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;大于300为严重污染.一环保人士从当地某年的AQI记录数据中,随机抽取10个,用茎叶图记录如图.根据该统计数据,估计此地该年AQI大于100的天数约为.(该年为365天)[答案] 146三、解答题25.某车间20名工人年龄数据如下表:年龄(岁)工人数(人)19 128 329 330 531 432 340 1合计20(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;[解析](1)这20名工人年龄的众数为30;这20名工人年龄的极差为40-19=21. (2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图如下:26.市旅游局为了了解明代县衙在大众中的熟知度,随机对15~65岁的人群抽取n人,问题是“明代县衙是几A级旅游景点?”统计结果如下图表.组号分组回答正确人数回答正确人数占本组的频率第1组 [15,25) a 0.5 第2组 [25,35) 18 x 第3组 [35,45) b 0.9 第4组 [45,55) 9 0.36 第5组[55,65]3y(1)分别求出a,b,x,y 的值;(2)从第2,3,4组回答正确的人中用分层抽样的方法抽取6人,求第2,3,4组每组各抽取多少人.[解析](1)由频率表中第4组数据可知,第4组总人数为36.09=25, 结合频率分布直方图可知n =10025.025⨯=100,所以a =100×0.01×10×0.5=5, b =100×0.03×10×0.9=27,x =1002.010018⨯⨯=0.9,y =10015.01003⨯⨯=0.2.(2)因为第2,3,4组回答正确的共有54人,所以利用分层抽样在54人中抽取6人,每组分别抽取的人数为第2组:5418×6=2(人);第3组:5427×6=3(人);第4组:549×6=1(人). 27.为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午8∶00~10∶00间各自的点击量,得如图所示的茎叶图,根据茎叶图回答下列问题.(1)甲、乙两个网站点击量的极差分别是多少? (2)甲网站点击量在[10,40]间的频率是多少? (3)甲、乙两网站哪个更受欢迎?并说明理由.[解析](1)甲网站的极差为73-8=65,乙网站的极差为71-5=66. (2)144=72. (3)甲网站的点击量集中在茎叶图的下方,而乙网站的点击量集中在茎叶图的上方,从数据的分布情况来看,甲网站更受欢迎.28.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得到如下频数分布表: 质量指标 值分组 [75,85) [85,95) [95,105) [105,115)[115,125)频数62638228(1)作出这些数据的频率分布直方图;(2)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定? [解析](1)样本数据的频率分布直方图如图所示:(2)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.29.为检查某工厂所生产的8万台电风扇的质量,抽查了其中20台的无故障连续使用时限(单位:小时)如下: 248256232243188268278266289312274296288 302295228287217329283(1)完成下面的频率分布表,并作出频率分布直方图;分组频数频率频率/组距[180,200)[200,220)[220,240)[240,260)[260,280)[280,300)[300,320)[320,340]合计0.05(2)估计8万台电风扇中有多少台无故障连续使用时限不低于280小时.[解析](1)频率分布表及频率分布直方图如下所示:分组频数频率频率/组距[180,200) 1 0.05 0.002 5[200,220) 1 0.05 0.002 5[220,240) 2 0.10 0.005 0[240,260) 3 0.15 0.007 5[260,280) 4 0.20 0.010 0[280,300) 6 0.30 0.015 0[300,320) 2 0.10 0.005 0[320,340] 1 0.05 0. 002 5合计20 1.00 0.05(2)由题意可得8×(0.30+0.10+0.05)=3.6(万台),所以估计8万台电风扇中有3.6万台无故障连续使用时限不低于280小时.。
课后训练1.下列关于用样本频率估计总体分布的说法,正确的是().A.总体容量越大,估计越精确B.总体容量越小,估计越精确C.样本容量越大,估计越精确D.样本容量越小,估计越精确2.一个容量为20的样本数据,分组后,组距与频数如下:(10,20],2;(20,30],3;(30,40],4;(40,50],5;(50,60],4;(60,70],2.那么,样本在区间(40,50]上的频率为().A.5% B.25% C.50% D.70%3.某工厂对一批产品进行了抽样检测.如图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是().A.90 B.75 C.60 D.454.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在各组上的频率为m,该组上直方图的高为h,则|a-b|=__________.5.下图是容量为100的样本的频率分布直方图,试根据图中的数据填空.(1)样本数据落在[6,10)范围内的频率为__________;(2)样本数据落在[10,14)范围内的频数为__________;(3)总体在[2,6)的频率约为__________.6.某校开展“爱我海西、爱我家乡”摄影比赛,9位评委为参赛作品A给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中x)无法看清.若记分员计算无误,则数字x应该是__________.7.某良种培育基地正在培育一种小麦新品种A,将其与原有的一个优良品种B进行对照试验,两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,44 5,445,451,454;品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430.(1)画出茎叶图.(2)用茎叶图处理现有的数据,有什么优点?(3)通过观察茎叶图,对品种A 与B 的亩产量及其稳定性进行比较,写出统计结论. 8.某市2010年4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成频率分布表. (2)作出频率分布直方图.(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.某制造商为2008年北京奥运会生产一批直径为40 mm 的乒乓球,现随机抽样检查20只,测得每只球的直径(单位:mm ,保留两位小数)如下:40.03 40.00 39.98 40.00 39.99 40.00 39.98 40.01 39.98 39.99 40.00 39.99 39.95 40.01 40.02 39.98 40.00 39.99 40.00 39.96(1)完成下面的频率分布表,并画频率分布直方图;(2)假定乒乓球的直径误差不超过0.02 mm 为合格品.若这批乒乓球的总数为10 000只,参考答案1. 答案:C2. 答案:B 解析:51204==25%. 3. 答案:A解析:产品净重小于100克的频率为(0.050+0.100)×2=0.300,已知样本中产品净重小于100克的个数是36,设样本容量为n ,则36=0.300n,所以n =120,净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,所以样本中净重大于或等于98克并且小于104克的产品的个数是120×0.75=90.4. 答案:m h解析:=h 频率组距,故||==m a b h -组距. 5. 答案:(1)0.32 (2)36 (3)0.086. 答案:1解析:由茎叶图可得9个分数为88,89,89,92,93,90+x,92,91,94,∴89+89+92+93+90+x+92+91=636+x=91×7.∴x=1.7.解:(1)茎叶图如图所示:(2)用茎叶图处理现有的数据不仅可以看出数据的分布状况,而且可以看出每组中的具体数据.(3)通过观察茎叶图,可以发现品种A的平均亩产量为411.1千克,品种B的平均亩产量为397.8千克.由此可知,品种A的平均亩产量比品种B的平均亩产量高,但品种A的亩产量不够稳定,而品种B的亩产量比较集中在平均产量附近.8.解:(1)频率分布表(2)频率分布直方图:(3)答对下述两条中的一条即可:①该市一个月中空气污染指数有2天处于优的水平,占当月天数的115.有26天处于良的水平,占当月天数的1315.处于优或良的天数共有28天,占当月天数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115.污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的1730,超过50%.说明该市空气质量有待进一步改善.9.解:(1)合计20150(2)∵抽样的20只产品中在[39.98,40.02]范围内有17只,∴合格品的概率为17100%=85%.20∴10 000×85%=8 500(只).答:根据抽样检查结果,可以估计这批产品的合格数为8 500只.。
同步测控我夯基,我达标1.下列说法正确的是( )A.频率分布直方图的高表示该组个体出现的频数B.频率分布直方图的高表示该组上个体出现的频率C.直方图中每组对应的矩形面积就是该组中所含个体的数目D.直方图的高表示该组上的频率与组距的比值 解析:要理解频率分布直方图和频率分布条形图的区别,频率分布直方图的高表示该组的频率÷组距. 答案:D2.从某一总体中抽取200个样本后,得到组距与频数如下:[10,15),6;[15,20),8;[20,25),13;[25,30),35;[30,35),46;[35,40),34;[40,45),28;[45,50),15;[50,55],10;[55,60],5.则样本在[35,60]上的频率是( )A.0.69B.0.46C.1D.不存在解析:首先应得到样本容量为6+8+13+35+46+34+28+15+10+5=200,根据频率分布可知在[35,60]上的频率应为(34+28+15+10+5)÷200=0.46. 答案:B第3组的频数和频率分别为( )A.14和0.14B.0.14和14C.0.25和0.14D.31和141 解析:由表可知,第3组的频数为100-(10+13+14+15+13+12+9)=14,频率=14÷100=0.14. 答案:A4.为了解一片经济林的生长情况,随机测量了其中100株树木的底部周长(单位:cm ).根据所得数据画出样本的频率分布直方图(如右),那么在这100株树木中,底部周长小于110 cm 的株数是( )A.30B.60C.70D.80 解析:可由图先求出小于110 cm 的频率之和,即(0.01+0.02+0.04)×10=0.7,故所求株数为100×0.7=70(株). 答案:C5.已知样本7,10,14,8,7,12,11,10,8,10,13,10,8,11,8,9,12,9,13,12,那么这组数据落在8.5—11.5内的频率是______________.解析:样本总数是20,数据落在8.5—11.5内的样本个数是8,故频率为8÷20=0.4. 答案:0.46.据新华社2002年3月12日电,1985—2000年,我国农村人均居住面积如下图所示,其中____________—____________年的5年间增长最快.解析:1985—2000年,每5年为一期,各期的增长值依次为3.1,3.2,3.8,末5年,即1995—2000年的5年间增长最快.答案:1995,20007.某妇幼保健站对2006年9月至2007年9月期间当地新生婴儿的体重作了调查记录,其频率分布直方图如下图:画频率分布直方图:则新生婴儿体重在[2 700,3 000)的频率为__________________.解析:根据直方图所提供的信息及公式,可得新生婴儿体重在[2 700,3 000)的频率为0.001×300=0.3.答案:0.38.为了考察某种大麦穗长的分布情况,在一块试验地里抽取了100个麦穗,量得长度如下:(单位:cm)6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.65.8 5.56.0 6.5 5.1 6.5 5.3 5.9 5.5 5.86.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.56.8 6.0 6.3 5.5 5.0 6.3 5.2 6.07.0 6.46.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.77.46.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.65.36.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.05.56.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7 5.8 5.37.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0 6.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3 请画出频率分布直方图,并估计这块试验田里大麦的生长情况.分析:可以先按照作频率分布直方图的步骤制作直方图,而后用样本估计总体,对试验田里大麦的生长情况作出估计.解:取定组距为0.3 cm ,组数为12.从图中可以看到,长度在5.15—6.95 cm 范围内的麦穗所占比例是88%,小于5.15 cm 和大于6.95 cm 的麦穗所占比例很小.我综合,我发展9.下图是150辆汽车通过某路段时速度(整数)的频率分布直方图,则速度在[40,60)的汽车大约有( )A.30辆B.40辆C.50辆D.60辆解析:由图可知数据在[30,40)的频率为10×0.01=0.1,[60,80)的频率为10×0.04+10×0.03=0.7,∴在[40,60)的频率为1-0.1-0.7=0.2. ∴汽车数为150×0.2=30(辆). 答案:A10.在样本频率分布直方图中,共有11个小长方形,若中间一级小长方形的面积等于其他10个小长方形面积和的41,且样本容量为160,则中间一组的频数为( ) A.32 B.0.2 C.40 D.0.25解析:由频率分布直方图的性质,可设中间一组的频率为x ,则x+4x=1,∴x=0.2.故中间一组的频数为160×0.2=32. 答案:A11.在抽查某产品尺寸过程中,将其尺寸分成若干组,[a,b ]是其中的一组,已知该组的频率为m ,该组上的直方图的高为h ,则|a-b|等于( )A.mhB.m h C.hmD.m+h 解析:直方图的高=频率组距,则频率=直方图的高×组距,即m=h×(b-a),故|a-b|=hm.答案:C12.为了解某地儿童生长发育情况,抽查了100名3岁女童的身高(cm ),已按数据的大小排列如下:84.4 84.5 85.2 85.7 86.2 86.4 86.9 87.1 87.3 87.6 87.9 88.2 88.4 88.4 88.5 88.7 89.0 89.0 89.1 89.2 89.3 89.3 89.4 89.8 90.0 90.1 90.2 90.3 90.4 90.6 90.7 90.8 91.1 91.1 91.1 91.4 91.7 91.7 91.7 91.8 91.9 92.1 92.5 92.5 92.7 92.7 92.8 92.8 92.9 92.9 93.0 93.1 93.2 93.2 93.4 93.5 93.6 93.6 93.6 93.8 93.9 94.0 94.3 94.3 94.4 94.4 94.4 94.5 94.6 94.7 94.8 94.9 95.0 95.1 95.1 95.1 95.5 95.6 95.6 96.0 96.2 96.3 96.4 96.5 96.8 97.0 97.2 97.3 97.3 97.9 98.3 98.4 98.7 99.2 99.3 99.4 99.5 100.7 100.9 101.5 (1)列出样本数据的频率分布表; (2)画出频率分布直方图;(3)利用频率分布直方图,估计身高在第4、第5两个组的可能性; (4)估计身高不小于90 cm 的可能性; (5)利用频率分布表估计身高的平均值.分析:在画频率分布直方图的过程中,一定要合理分组,确定恰当的组距,严格按步骤画出频率分布直方图. 解:(1)样本数据的极差(最大值与最小值之差)为101.5-84.4=17.1,将组距定为2,第1小组起点取为84,则组数为9,样本的频率分布表见图1. (2)频率分布直方图见图2.图1图2(4)身高不小于90 cm 的频率为第4至第9组内的频率之和0.76,即身高不小于90 cm 可能性的估计值为0.76. (5)身高的均值的估计为=1001(85×4+87×7+…+101×3)=92.86.13.对某班50人进行智力测验,其得分如下: 48 64 52 86 71 48 64 41 86 79 71 68 82 84 68 64 62 68 81 57 90 52 74 73 56 78 47 66 55 64 56 88 69 40 73 97 68 56 67 59 70 52 79 44 55 69 62 58 32 58 (1)这次测验的最大值和最小值是多少? (2)将[30,100]平均分成7个小区间,试画出该班学生智力测验成绩的频数分布折线图; (3)分析这个频数分布图,你能得到什么结论?分析:把频率分布直方图各个长方形上边的中点用线段连结起来,就得到频率分布折线图. 解:(1)最小值为32,最大值为97; (2)7个区间分别为[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),[90,100).每一小区间的长度是10,频数分别为:1,6,12,14,9,6,2.频数分布折线图如图:(3)可以看出,该班智力测验成绩大体上呈两头小、中间大、左右基本对称的钟形状态.说明该班学生智力特别好或特别差的是极少数,而智力一般的是多数.这也是一种最常见的分布.我创新,我超越14.为了解高三学生的身体状况,抽取了部分男生的体重,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为1∶2∶3,第4组与第5组的频率分别为0.187 5和0.062 5,第2组的频数为12,则抽取的男生人数是______________.解析:由题设可知,前3个小组的频率之和为1-0.187 5-0.062 5=0.75.又前3个小组的频率之比为1∶2∶3,则第2组的频率为0.75×3212++=0.25,从而抽取的男生人数为12÷0.25=48(人). 答案:48。
2.2 用样本估计总体2.2.1 用样本的频率分布估计总体分布1.(2009福建高考,文3)一个容量为100的样本,其数据的分组与各组的频数如下:组别(0,10] (10,20] (20,30] (30,40] (40,50] (50,60] (60,70] 频数12 13 24 15 16 13 7 A .0.13 B .0.39 C .0.52 D .0.642.对于样本频率分布直方图与总体密度曲线的关系,下列说法中正确的是( ) A .频率分布直方图与总体密度曲线无关 B .频率分布直方图就是总体密度曲线C .样本容量很大的频率分布直方图就是总体密度曲线D .如果样本容量无限增大,分组的组距无限减小,那么相应的频率分布折线图会越来越接近一条光滑曲线,则这条光滑曲线为总体密度曲线3.容量为100的样本数据,按从小到大的顺序分为8组,但是记录时不小心把第3组组号1 2 3 4 5 6 7 8 频数10 13 14 15 13 12 频率0.10 0.13 0.14 0.15 0.13 0.12 0.09 4.有100个数据,最大的是101,最小的是79,那么要绘制频率分布直方图,首先要求出极差(最大值与最小值的差)为______.如果选择组距为3,那么合适的分组数是____________.答案:1.C 样本数据落在(10,40]上的频数为13+24+15=52,故其频率为52100=0.52.2.D3.0.14 9 根据第8组的频率为0.09可计算出第8组的频数是9,根据总的频率之和为1,可以得出第3组的频率是1-0.10-0.13-0.14-0.15-0.13-0.12-0.09=0.14,频数为14.4.22 8 极差为101-79=22,由于22÷3=713,所以合适的分组数应该是8组.1.(2009安徽皖南八校二模,2)从某校高三年级随机抽取一个班,对该班50名学生的高校招生体检表中视力情况进行统计,其结果的频率分布直方图如图所示:若某高校A专业对视力的要求在0.9以上,则该班学生中能报A专业的人数为() A.10 B.20 C.8 D.162.学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n的样本,其频率分布直方图如图所示,其中支出在[50,60)元的同学有30人,则n的值为()A.100 B.1000 C.90 D.9003.“毒奶粉”事件引起了社会对食品安全的高度重视,各级政府加强了对食品安全的检查力度.某市工商质检局抽派甲、乙两个食品质量检查组到管辖区域内的商店进行食品质量检查.下图表示甲、乙两个检查组每天检查到的食品品种数的茎叶图,则甲、乙两个检查组每天检查到的食品种数的中位数的和是()A.56 B.57 C.58 D.594.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量.产品数量的分组区间为[45,55),[55,65),[65,75),[75,85),[85,95),由此得到频率分布直方图(如图所示),则这20名工人中一天生产该产品数量在[55,75)的人数是__________.5.为了解电视对生活的影响,就平均每天看电视的时间,一个社会调查机构对某地居民调查了10000人,并根据所得数据画出样本的频率分布直方图(如图),为了分析该地居民平均每天看电视的时间与年龄、学历、职业等方面的关系,要从这10000人中再用分层抽样方法抽出100人做进一步调查,则在[2.5,3.5)(小时)时间段内应抽出的人数共有__________人.6.对某400(1)(2)估计元件寿命在500~800 h以内的频率.答案:1.B视力在0.9以上的频率为(1+0.75+0.25)×0.2=0.4,故能报A专业的人数为0.4×50=20.2.A支出在[50,60)元的同学的概率为0.03×10=0.3,因此n=300.3=100.3.B根据中位数的定义知,甲的中位数为32,乙的中位数为25,故中位数的和是32+25=57.4.1320×(0.065×10)=13(人).5.40通过频率分布直方图可知,在[2.5,3.5)内的频率为(0.5+0.3)×0.5=0.4,频数为100×0.4=40(人).6.解:(1)(2)0.15+0.4=0.65.解法二:1-(0.2+0.15)=0.65.点评:频数分布图(表)能使我们清楚地知道数据分布在各个小组的个数;而频率分布图(表)则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.它可以使我们看到整个样本数据的频率分布.在上述图表中,各组频数之和等于样本容量,各组频率之和等于1.1.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;……;第六组,成绩大于等于18秒且小于等于19秒.下图是按上述分组方法得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y分别为( )A .0.9,35B .0.9,45C .0.1,35D .0.1,45 答案:A 由题意可知x =0.02+0.18+0.36+0.34=0.9, y =(0.36+0.34)×50=35(名).2.一个社会调查机构就某地居民的月收入调查了20000人,并根据所得数据画出了样本频率分布直方图.为了分析居民的收入与年龄、学历、职业等方面的关系,按月收入用分层抽样方法抽样,若从月收入[3000,3500)(元)段中抽取了30人,则这20000人中共抽取的人数为( )A .200B .100C .20000D .40答案:A 由题意得,月收入在[3000,3500)(元)段中的频率是0.0003×500=0.15,该收入段的人数是20000×0.15=3000,从中抽取了30人,说明从每100人中抽取1人,故共抽取20000100=200(人).3.某市某机构调查小学生课业负担的情况,设平均每人每天做作业时间为X(单位:分钟),按时间分下列四种情况统计:①0~30分钟;②30~60分钟;③60~90分钟;④90分钟以上,有1000名小学生参加了此项调查,如图是此次调查中某一项的流程图,其输出的结果是600,则平均每天做作业时间在0~60分钟内的学生的频率是( )A .0.20B .0.40C .0.60D .0.80答案:B 此框图输出的是平均每天做作业时间大于60分钟的学生的人数,故小于等于60分钟的有400人,其频率为0.40.4.如图,从参加知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如下:观察图形,估计这次知识竞赛的及格率(大于或等于60分为及格)为__________.答案:75% 频率分布直方图中大于或等于60的面积为(0.015+0.025+0.03+0.005)×10=0.75,所以及格率为75%.5.(2009浙江高考,文14)某个容量为100的样本的频率分布直方图如下,则在区间[4,5)上的数据的频数..为__________.答案:30 由题意可知区间[4,5)上的数据频率为0.30,则频数为0.30×100=30.6.在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交作品的件数按照5天一组分组统计,绘制了频率分布直方图(如图).已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列各题.(1)本次活动共有多少件作品参加评比? (2)哪组上交的作品数量最多?有多少件? (3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪一组获奖率较高?答案:解:(1)依题意可算出第三组的频率为42+3+4+6+4+1=15.设共有n 件作品,则12n =15,∴n =60(件).(2)由直方图可看出第四组上交作品数量最多,共有60×620=18(件).(3)第四组获奖率为1018=59,第六组获奖率为260×120=23=69,∴第六组获奖率较高.7.为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午8:00~10:00间各自的点击量,得如下图所示的茎叶图,根据茎叶图:(1)甲、乙两个网站点击量的极差分别是多少? (2)甲网站点击量在[10,40]间的频率是多少?(3)甲、乙两个网站哪个更受欢迎?并说明理由.答案:解:(1)甲网站的极差为73-8=65;乙网站的极差为71-5=66.(2)甲网站点击量在[10,40]间的频率为414=27=0.28571.(3)甲网站的点击量集中在茎叶图的下方,而乙网站的点击量集中在茎叶图的上方,从数据的分布情况来看,甲网站更受欢迎.点评:用茎叶图表示数据有两个突出优点:一是茎叶图上没有原始数据的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图可以随时记录数据,方便记录与表示.但茎叶图也有其局限性,当数据量很大或有多组数据时,茎叶图就不那么直观、清晰了.8.从一批灯泡中抽取50只灯泡作使用寿命的测试,所得数据如下(单位:h): 886 928 999 946 950 864 1050 927 949 852 1027 928 978 816 1000 918 1040 854 1100 900 866 905 954 890 1006 926 900 999 886 1120 893 900 800 938 864 919 863 981 916 818 946 926 895 967 921 978 821 924 651 850根据上面的数据列出频率分布表,画出频率分布直方图、频率分布折线图,并估计寿命在1000~1150 h 的灯泡在这批灯泡中所占的百分比.答案:解:频率分布直方图:频率分布折线图:估计寿命在1000~1150 h的灯泡在这批灯泡中所占的百分比为14%.。
自我小测1.为了了解某学校学生的身体发育情况,抽查了该校100名高中男生的体重情况,根据所得数据画出样本的频率分布直方图(如图),根据此图,估计该校2 000名高中男生中体重大于70.5 kg的人数为().A.300 B.360 C.420 D.4502.为了调查某厂工人生产某种产品的能力,对一天生产45件以上产品的人数进行统计,其频率分布直方图如图所示,若生产数量在[85,95]的人数是90人,则生产数量在[55,65)的人数是().A.360 B.720 C.220 D.2403.在一项农业试验中,A,B两种肥料分别被用于同类橘子树的生长.为了了解这两种肥料的效果,试验人员分别从施用这两种肥料的橘子树中随机抽取了12棵,用茎叶图给出了每一棵橘子树的产量(单位:kg):下列对茎叶图分析正确的是().A.施用肥料A的橘子树比施用B肥料的橘子树的平均产量高B.施用肥料A的橘子树比施用B肥料的橘子树的平均产量低C.施用肥料A的橘子树比施用B肥料的橘子树的产量的标准差小D.以上都不对4.根据《中华人民共和国道路交通安全法》规定:车辆驾驶员血液酒精浓度在80 mg/100 mL(含80)以上时,属醉酒驾车.某地对涉嫌酒后驾车的28 800人进行血液检测,根据检测结果绘制的频率分布直方图如下.则这28 800人中属于醉酒驾车的人数约为().A.8 640 B.5 760 C.4 320 D.2 8805.甲、乙两个班级各随机选出15名同学进行测验,成绩的茎叶图如下:则甲、乙两班的最高成绩各是______,从图中看,______班的平均成绩较高.6.从某市参加高中数学建模竞赛的1 008份试卷中随机抽取一个容量为54的样本,考查竞赛的成绩分布,将样本分成6组,绘成频率分布直方图如图所示,从左到右各小组的小矩形的高的比为1∶1∶4∶6∶4∶2.据此估计该市在这次竞赛中,成绩高于85分的学生总人数为______.7.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图).由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.8.中小学生的视力状况受到全社会的广泛关注,某市有关部门对全市4万名初中生的视力状况进行一次抽样调查统计,所得到的有关数据绘制成频率分布直方图,如图,从左至右五个小组的频率之比依次是2∶4∶9∶7∶3,第五小组的频数是30.(1)本次调查共抽调了多少名学生?(2)如果视力在4.9~5.1(含4.9,5.1)属正常,那么全市初中生视力正常的约有多少人?参考答案1.答案:B图中70.5 kg以上的人数的频率为(0.04+0.035+0.015)×2=0.18,则估计该校男生体重在70.5 kg以上的人数为2 000×0.18=360.2.答案:B由图可知,生产数量在[85,95]的频率为0.05,而=频数频率样本容量,所以一天生产45件以上产品的人数为1 800.生产数量在[55,65]的频率为0.4,则生产数量在[55,65)的人数为0.4×1 800=720.3.答案:B从茎叶图中我们可以看出,施用肥料A的橘子树的产量分布主要在茎叶图的上方,而施用肥料B的橘子树的产量分布主要在茎叶图的中部,由此我们可以估计:施用肥料A的橘子树的产量的平均数比B的小.施用肥料A的橘子树的产量分布相对较散,而施用肥料B的橘子树的产量分布相对比较集中,由此我们可以估计施用肥料B的橘子树的产量的标准差比A的小.4.答案:C由图可知,血液中酒精浓度80 mg/100 mL以上的频率为0.15,则人数为28 800×0.15=4 320.5.答案:96,92乙6.答案:2247.答案:0.0303各矩形的面积和为:0.005×10+0.035×10+a×10+0.020×10+0.010×10=1,解得a=0.030.身高在[120,130),[130,140),[140,150]三组内的学生人数分别为:30,20,10,人数的比为3∶2∶1,因此从身高在[140,150]内的学生中选取的人数应为18×16=3(人).8.答案:解:(1)因为频率之比等于频数之比,设第一小组的频数为2k,所以各组的频数依次为2k,4k,9k,7k,3k,于是3k=30,所以k=10.所以2k=20,4k=40,9k=90,7k=70,则本次调查的抽样总人数为20+40+90+70+30=250(人).(2)因为视力在4.9~5.1范围内的人有70人,所以频率=70250=0.28.所以全市初中生视力正常的约有40 000×0.28=11 200(人).。
数学·必修3(人教A版)2.2 用样本估计总体2.2.2 用样本的频率分布估计总体分布 (二)(习题课)基础达标1.在频率分布直方图中,小矩形的高表示( )A.频率/样本容量B.组距×频率C.频率 D.频率/组距答案:D2.在用样本频率分布估计总体分布的过程中,下列说法正确的是( )A.总体容量越大,估计越精确统计B.总体容量越小,估计越精确C.样本容量越大,估计越精确D.样本容量越小,估计越精确答案:C3.频率分布直方图中,各个小长方形的面积表示( )A.相应各组的频数 B.相应各组的频率C.组数 D.组距答案:B4.某班学生体检后进行体重统计,其频率分布直方图如下图所示,则体重在[45,55)的频率为( )A.0.043 B.0.43C.0.215 D.0. 021 5答案:C5.下面给出4个茎叶图则数据6,23,12,13,27,35,37,38,51可以由图________表示.答案:A巩固提升6.在某路段检测点,对200辆汽车的车速进行检测,检测结果表示为如下图所示的频率分布直方图,则车速不小于90 km/h的汽车有( )A.20辆 B.40辆 C.60辆 D.90辆答案:C7.观察新生婴儿的体重,其频率分布直方图如下图所示,则新2 700,3 000的频率为( )生婴儿体重在[)A.0.001 B.0.1 C.0.2 D.0.3答案:D8.一组数据的最大值与最小值之差为80,若取组距为9,则分成的组数应是( )A.7 B.8 C.9 D.10答案:C9.对某班50名学生在一次数学测验中的成绩进行统计分析,各分数段的人数频率分布直方图如下图所示(分数取正整数),问80分以上的优秀学生有多少人?解析:80分以上的优秀学生的频率为0.024×10+0.032×10=0.56,所以80分以上的优秀学生有28人.10.美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46, 54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,6 1,52,69,64,46,54,48.(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图;(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.解析:(1)以4为组距,列表如下:年龄分组频数频率[41.5,45.5)20.045 5[45.5,49.5)70.159 1[49.5,53.5)80.181 8[53.5,57.5)160.363 6[57.5,61.5)50.113 6[61.5,65.5)40.090 9[65.5,69.5]20.045 5合计44 1.00(2)从频率分布表中可以看出,将近60%的美国总统就任时的年龄在50岁至60岁之间,45岁以下以及65岁以上就任的总统所占的比例相对较小.1.看图要特别注意纵坐标代表的内容,一般分频数、频率、频率/组距.2.分组没有具体要求几组时可以有所不同,但一般分为5~7组为宜.3.频数和为样本数,频率和为1,频数/样本数=频率.4.注意区分频率和累积频率.5.画频率分布直方图一般要先求各组的“频率/组距”.。
第二章统计2.2 用样本估计总体2.2.1用样本的频率分布估计总体分布课时目标 1.理解用样本的频率分布估计总体分布的方法.2.会列频率分布表,画频率分布直方图,频率分布折线图,茎叶图.3.能够利用图形解决实际问题.1,用样本估计总体的两种情况(1)用样本的____________估计总体的分布.(2)用样本的____________估计总体的数字特征.2,数据分析的基本方法(1)借助于图形分析数据的一种基本方法是用图将它们画出来,此法可以达到两个目的,一是从数据中____________,二是利用图形________信息.(2)借助于表格分析数据的另一方法是用紧凑的________改变数据的排列方式,此法是通过改变数据的____________,为我们提供解释数据的新方式.3,频率分布直方图在频率分布直方图中,纵轴表示____________,数据落在各小组内的频率用________________来表示,各小长方形的面积的总和等于____.4,频率分布折线图和总体密度曲线(1)频率分布折线图连接频率分布直方图中各小长方形__________,就得到了频率分布折线图.(2)总体密度曲线随着样本容量的增加,作图时所分的____增加,组距减小,相应的频率分布折线图就会越来越接近于一条________,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比.5,茎叶图(1)适用范围:当样本数据较少时,用茎叶图表示数据的效果较好.(2)优点:它不但可以____________,而且可以__________,给数据的记录和表示都带来方便.(3)缺点:当样本数据______时,枝叶就会很长,茎叶图就显得不太方便.一、选择题1,下列说法不正确的是()A,频率分布直方图中每个小矩形的高就是该组的频率B,频率分布直方图中各个小矩形的面积之和等于1C,频率分布直方图中各个小矩形的宽一样大D,频率分布折线图是依次连接频率分布直方图的每个小矩形上端中点得到的2,一个容量为100的样本,其数据的分组与各组的频数如下:组别(0,10] (10,20] (20,30] (30,40] (40,50] (50,60] (60,70] 频数12 13 24 15 16 13 7 则样本数据落在(10,40]上的频率为()A,0.13 B.0.39 C.0.52 D.0.643,100辆汽车通过某一段公路时的时速的频率分布直方图如下图所示,则时速在[60,70)的汽车大约有()A.30辆B.40辆C,60辆D.80辆4,如图是总体密度曲线,下列说法正确的是()A,组距越大,频率分布折线图越接近于它B,样本容量越小,频率分布折线图越接近于它C,阴影部分的面积代表总体在(a,b)内取值的百分比D,阴影部分的平均高度代表总体在(a,b)内取值的百分比5,一个容量为35的样本数据,分组后,组距与频数如下:[5,10),5个;[10,15),12个;[15,20),7个;[20,25),5个;[25,30),4个;[30,35),2个.则样本在区间[20,+∞)上的频率为()A,20% B.69%C,31% D.27%6,某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是()A,90 B.75 C.60 D.45题号 1 2 3 4 5 6答案二、填空题7,将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________. 8,在如图所示的茎叶图中,甲,乙两组数据的中位数分别是________.9.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在各组上的频率为m,该组上直方图的高为h,则|a-b|=________.三、解答题10,抽查100袋洗衣粉,测得它们的重量如下(单位:g):494498493505496492485483508 511495494483485511493505488 501491493509509512484509510 495497498504498483510503497 502511497500493509510493491 497515503515518510514509499 493499509492505489494501509 498502500508491509509499495 493509496509505499486491492 496499508485498496495496505 499505496501510496487511501496(1)列出样本的频率分布表:(2)画出频率分布直方图,频率分布折线图;(3)估计重量在[494.5,506.5]g的频率以及重量不足500 g的频率.能力提升11,在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,你会得到什么结论?12,某市2010年4月1日-4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成频率分布表.(2)作出频率分布直方图.(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.答案: 2.2.1 用样本的频率分布估计总体分布 知识梳理1,(1)频率分布 (2)数字特征 2.(1)提取信息 传递 (2)表格 构成形式 3.频率/组距 小长方形的面积 1 4.(1)上端的中点 (2)组数 光滑曲线5,(2)保留所有信息 随时记录 (3)较多作业设计1,A 2,C [样本数据落在(10,40]上的频数为13+24+15=52,故其频率为52100=0.52.] 3,B [时速在[60,70)的汽车的频率为:0,04×(70-60)=0.4,又因汽车的总辆数为100, 所以时速在[60,70)的汽车大约有0.4×100=40(辆).]4,C5,C [由题意,样本中落在[20,+∞)上的频数为5+4+2=11,∴在区间[20,+∞)上的频率为1135≈0.31.]6,A [∵样本中产品净重小于100克的频率为(0.050+0.100)×2=0.3,频数为36, ∴样本总数为360.3=120.∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,∴样本中净重大于或等于98克并且小于104克的产品的个数为120×0.75=90.] 7,60解析 ∵n·2+3+42+3+4+6+4+1=27, ∴n =60.8,45,46解析 由茎叶图及中位数的概念可知x 甲中=45,x 乙中=46. 9.m h解析频率组距=h ,故|a -b|=组距=频率h =m h . 10,解 (1)在样本数据中,最大值是518,最小值是483,它们相差35,若取组距为4,由于354=834,要分9组,组数合适,于是决定取组距为4 g ,分9组,使分点比数据多一位小数,且把第一组起点稍微减小一点,得分组如下:[482.5,486.5),[486.5,490.5),…,[514.5,518.5). 列出频率分布表:分组 个数累计 频数 频率 累积频率 [482.5,486.5) 正 8 0.08 0.08 [486.5,490.5) 3 0.03 0.11[490.5,494.5) 正正正 17 0.17 0.28 [494.5,498.5) 正正正正- 21 0.21 0.49 [498.5,502.5) 正正 14 0.14 0.63 [502.5,506.5) 正 9 0.09 0.72[506.5,510.5) 正正正 19 0.19 0.91 [510.5,514.5) 正- 6 0.06 0.97[514.5,518.5] 3 0.03 1.00合计 100 1.00(2)频率分布直方图与频率分布折线图如图.(3)重量在[494.5,506.5]g 的频率为:0.21+0.14+0.09=0.44.设重量不足500 g 的频率为b ,根据频率分布表,b -0.49500-498.5≈0.63-0.48502.5-498.5,故b ≈0.55.因此重量不足500 g 的频率约为0.55. 11,解 (1)(2)电脑杂志上每个句子的字数集中在10~30之间;而报纸上每个句子的字数集中在20~40之间.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为科普读物需要通俗易懂、简明.12,解 (1)(2)(3)答对下述两条中的一条即可:①该市有一个月中空气污染指数有2天处于优的水平,占当月天数的115;有26天处于良的水平,占当月天数的1315;处于优或良的天数为28,占当月天数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115;污染指数在80以上的接近轻微污染的天数15,加上处于轻微污染的天数2,占当月天数的1730,超过50%;说明该市空气质量有待进一步改善.2.2.2用样本的数字特征估计总体的数字特征课时目标 1.会求样本的众数,中位数,平均数,标准差,方差.2.理解用样本的数字特征来估计总体数字特征的方法.3.会应用相关知识解决简单的统计实际问题.1,众数,中位数,平均数(1)众数的定义:一组数据中重复出现次数________的数称为这组数的众数.(2)中位数的定义及求法把一组数据按从小到大的顺序排列,把处于最______位置的那个数称为这组数据的中位数.①当数据个数为奇数时,中位数是按从小到大顺序排列的__________那个数.②当数据个数为偶数时,中位数为排列的最中间的两个数的________.(3)平均数①平均数的定义:如果有n个数x1,x2,…,x n,那么x=____________,叫做这n个数的平均数.②平均数的分类:总体平均数:________所有个体的平均数叫总体平均数.样本平均数:________所有个体的平均数叫样本平均数.2,标准差,方差(1)标准差的求法:标准差是样本数据到平均数的一种平均距离,一般用s表示.s=________________________________________________________________________.(2)方差的求法:标准差的平方s2叫做方差.s2=________________________________________________________________________.一、选择题1,下列说法正确的是()A,在两组数据中,平均值较大的一组方差较大B,平均数反映数据的集中趋势,方差则反映数据离平均值的波动大小C,方差的求法是求出各个数据与平均值的差的平方后再求和D,在记录两个人射击环数的两组数据中,方差大的表示射击水平高2,已知10名工人生产同一零件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设其平均数为a,中位数为b,众数为c,则有()A,a>b>c B.a>c>bC,c>a>b D.c>b>a3,甲,乙两位同学都参加了由学校举办的篮球比赛,他们都参加了全部的7场比赛,平均得分均为16分,标准差分别为5.09和3.72,则甲,乙两同学在这次篮球比赛活动中,发挥得更稳定的是()A,甲B.乙C,甲,乙相同D.不能确定4,一组数据的方差为s2,将这组数据中的每个数据都扩大3倍,所得到的一组数据的方差是()A.13s2B.s2C,3s2D.9s25,如图是2010年某校举行的元旦诗歌朗诵比赛中,七位评委为某位选手打出分数的茎叶统计图,去掉一个最高分和一个最低分,所剩数据的平均数和方差分别为()A,84,4.84 B.84,1.6C,85,1.6 D.85,0.46,如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为x A和x B,样本标准差分别为s A和s B则()A.x A>x B,s A>s BB.x A<x B,s A>s BC.x A>x B,s A<s BD.x A<x B,s A<s B题号 1 2 3 4 5 6答案二、填空题7,已知样本9,10,11,x,y的平均数是10,方差是4,则xy=________.8,甲,乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):甲10 8 9 9 9乙10 10 7 9 9如果甲,乙两人只能有1人入选,则入选的应为________.9,若a1,a2,…,a20,这20个数据的平均数为x,方差为0.20,则数据a1,a2,…,a20,x这21个数据的方差为________.三、解答题10,甲,乙两人在相同条件下各射靶10次,每次射靶的成绩情况如图所示:(1)请填写表:平均数方差中位数命中9环及9环以上的次数甲乙(2)请从下列四个不同的角度对这次测试结果进行分析:①从平均数和方差相结合看(分析谁的成绩更稳定);②从平均数和中位数相结合看(分析谁的成绩好些);③从平均数和命中9环及9环以上的次数相结合看(分析谁的成绩好些);④从折线图上两人射击命中环数的走势看(分析谁更有潜力).能力提升11,下面是一家快餐店所有工作人员(共7人)一周的工资表:总经理大厨二厨采购员杂工服务员会计3 000元450元350元400元320元320元410元(1)计算所有人员一周的平均工资;(2)计算出的平均工资能反映一般工作人员一周的收入水平吗?(3)去掉总经理的工资后,再计算剩余人员的平均工资,这能代表一般工作人员一周的收入水平吗?12,1,平均数、众数、中位数都是描述数据的集中趋势的,其中平均数是最重要的量.众数体现了样本数据的最大集中点,但它对其他数据信息的忽视使得无法客观地反映总体特征;中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也成为缺点,因为这些极端值有时是不能忽视的.由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数不具有的性质.也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低.2,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.3,极差、方差、标准差是描述数据的离散程度的,即各数据与其平均数的离散程度.标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.答案:2,2.2用样本的数字特征估计总体的数字特征知识梳理1,(1)最多 (2)中间 ①中间位置的 ②平均数 (3)①x 1+x 2+…+x n n ②总体中 样本中2,(1)1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2] (2)1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2] 作业设计1,B [A 中平均值和方差是数据的两个特征,不存在这种关系;C 中求和后还需取平均数;D 中方差越大,射击越不平稳,水平越低.]2,D [由题意a =110(16+18+15+11+16+18+18+17+15+13)=15710=15.7,中位数为16,众数为18,即b =16,c =18,∴c>b>a.]3,B [方差或标准差越小,数据的离散程度越小,表明发挥得越稳定.∵5.09>3.72,故选B .]4,D [s 20=1n [9x 21+9x 22+…+9x 2n -n(3x )2]=9·1n(x 21+x 22+…+x 2n -n x 2)=9·s 2(s 20为新数据的方差).]5,C [由题意x =15(84+84+86+84+87)=85.s 2=15[(84-85)2+(84-85)2+(86-85)2+(84-85)2+(87-85)2]=15(1+1+1+1+4)=85=1.6.]6,B [样本A 数据均小于或等于10,样本B 数据均大于或等于10,故x A <x B , 又样本B 波动范围较小,故s A >s B .] 7,91解析 由题意得8,甲解析 x 甲=9,2S 甲=0.4,x 乙=9,2S 乙=1.2,故甲的成绩较稳定,选甲.9,0.19 解析 这21个数的平均数仍为20,从而方差为121×[20×0.2+(20-20)2]≈0.19. 10,解 由折线图,知甲射击10次中靶环数分别为:9,5,7,8,7,6,8,6,7,7.将它们由小到大重排为:5,6,6,7,7,7,7,8,8,9.乙射击10次中靶环数分别为: 2,4,6,8,7,7,8,9,9,10.也将它们由小到大重排为:2,4,6,7,7,8,8,9,9,10.(1)x 甲=110×(5+6×2+7×4+8×2+9)=7010=7(环), x 乙=110×(2+4+6+7×2+8×2+9×2+10)=7010=7(环),s 2甲=110×[(5-7)2+(6-7)2×2+(7-7)2×4+(8-7)2×2+(9-7)2]=110×(4+2+0+2+4)=1.2,s 2乙=110×[(2-7)2+(4-7)2+(6-7)2+(7-7)2×2+(8-7)2×2+(9-7)2×2+(10-7)2] =110×(25+9+1+0+2+8+9)=5.4. 根据以上的分析与计算填表如下:平均数 方差 中位数 命中9环及9环以上的次数甲 7 1.2 7 1乙 7 5.4 7.5 3 (2)①∵平均数相同,2S 甲<2S 乙,∴甲成绩比乙稳定. ②∵平均数相同,甲的中位数<乙的中位数,∴乙的成绩比甲好些.③∵平均数相同,命中9环及9环以上的次数甲比乙少,∴乙成绩比甲好些.④甲成绩在平均数上下波动;而乙处于上升势头,从第四次以后就没有比甲少的情况发生,乙较有潜力.11,解 (1)平均工资即为该组数据的平均数 x =17×(3 000+450+350+400+320+320+410)=17×5 250=750(元).(2)由于总经理的工资明显偏高,所以该值为极端值,因此由(1)所得的平均工资不能反映一般工作人员一周的收入水平.(3)除去总经理的工资后,其他工作人员的平均工资为:x ′=16×(450+350+400+320+320+410)=16×2 250=375(元).这个平均工资能代表一般工作人员一周的收入水平.12,解 设第一组20名学生的成绩为x i (i =1,2,…,20),第二组20名学生的成绩为y i (i =1,2,…,20), 依题意有:x =120(x 1+x 2+…+x 20)=90,y =120(y 1+y 2+…+y 20)=80,故全班平均成绩为:140(x 1+x 2+…+x 20+y 1+y 2+…+y 20)=140(90×20+80×20)=85;又设第一组学生成绩的标准差为s 1,第二组学生成绩的标准差为s 2,则s 21=120(x 21+x 22+…+x 220-20x 2),s 22=120(y 21+y 22+…+y 220-20y 2) (此处,x =90,y =80),又设全班40名学生的标准差为s ,平均成绩为z (z =85),故有s 2=140(x 21+x 22+…+x 220+y 21+y 22+…+y 220-40z 2) =140(20s 21+20x 2+20s 22+20y 2-40z 2) =12(62+42+902+802-2×852)=51. s =51.所以全班同学的平均成绩为85分,标准差为51.。
2.2.1 用样本的频率分布估计总体分布练习
1.关于频率分布直方图中小长方形的高的说法,正确的是()
A.表示该组上的个体在样本中出现的频率
B.表示取某数的频率
C.表示该组上的个体数与组距的比值
D.表示该组上的个体在样本中出现的频率与组距的比值
2.(2011·山东青岛高三教学质量统一检测,文2)某时段内共有100辆汽车经过某一雷达地区,汽车时速的频率分布直方图如图所示,则时速超过60 km/h的汽车数量为()
A.38 B.28 C.10 D.5
3.如图是根据《山东统计年鉴2007》中的资料作成的1997年至2006年山东省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到1997年至2006年山东省城镇居民百户家庭人口数的平均数为()
A.304.6 B.303.6 C.302.6 D.301.6
4.通过全国人口普查工作,得到我国人口的年龄频率分布直方图如下图所示,那么在一个总人口数为200万的城市中,年龄在[20,60)之间的人大约有()
A.58万B.66万C.116万D.132万
5.为了了解某学校学生的身体发育情况,抽查了该校100名高中男生的体重情况,根据所得数据画出样本的频率分布直方图如图所示.根据此图,估计该校2 000名高中男生中
体重不小于70.5千克的人数为()
A.300 B.360 C.420 D.450
6.青年歌手大奖赛共有10名选手参赛,并请了7名评委.如图所示的茎叶图是7名评委给参加最后决赛的两位选手甲、乙评定的成绩,去掉一个最高分和一个最低分后,甲、乙选手剩余数据的平均成绩分别为__________、__________.
7.某棉纺厂为了解一批棉花的质量,从中随机抽测100根棉花纤维长度(棉花纤维的长度是棉花质量的重要指标).所得数据均在区间[5,40]中,其频率分布直方图如图所示,由图中数据可知a=__________,在抽测的100根中,棉花纤维的长度在[20,30)内的有__________根.
8.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图).由图中数据可知a=______.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.
9.某良种培育基地正在培育一种小麦新品种A,将其与原有的一个优良品种B进行对
照试验,两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:
品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430, 434,443,445,445,451,454;
品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407, 410,412,415,416,422,430.
(1)画出品种A和品种B小麦亩产的茎叶图.
(2)不用计算,根据茎叶图估计哪一个品种的平均产量高?用茎叶图处理现有的数据,有什么优点?
10.从高一学生中抽取50名参加调研考试,成绩的分组及各组的频数如下(单位:分):[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.
(1)列出样本的频率分布表;
(2)画出频率分布直方图;
(3)估计成绩在[70,80)分的学生所占总体的百分比;
(4)估计成绩在[70,100]分的学生所占总体的百分比.
参考答案
1.答案:D频率分布直方图中小长方形的高是频率
组距
,面积表示频率.
2.答案:A由图可知,时速超过60 km/h的汽车频率为(0.028+0.010)×10=0.38,则根据公式,频数=频率×样本容量,可得时速超过60 km/h的汽车数量为0.38×100=38.
3.答案:B观察茎叶图可知,共有4+2+4=10(百户),共有家庭人口数为291×2+295+298+302+306+310+312+314+317=3 036,所以所调查的10个百户中百户家庭人口数的平均数为303.6.
4.答案:C由频率分布直方图可知,年龄在[20,60)之间的人的频率为(0.018+0.011)×20=0.58,则估计在一个总人口数为200万的城市中,年龄在[20,60)之间的人大约有0.58×200=116(万).
5.答案:B由频率分布直方图,得这100名高中男生体重不小于70.5千克的频率是(0.04+0.035+0.015)×2=0.18,所以估计该校2 000名高中男生中体重不小于70.5千克的频率是0.18,则估计该校2 000名高中男生中体重不小于70.5千克的人数为2 000×0.18=360.
6.答案:84.2分85分甲的成绩去掉一个最高分92分和一个最低分75分后,甲的剩余数据的平均成绩为84.2分;乙的成绩去掉一个最高分93分和一个最低分79分后,乙的剩余数据的平均成绩为85分.
7.答案:0.0555由频率分布直方图可知,在区间[5,40]中,数据被分成7组,所以组距为5,且(0.01+0.01+0.04+0.06+a+0.02+0.01)×5=1,解得a=0.05;棉花纤维的长度在[20,30]内的频率为(0.06+0.05)×5=0.55,则棉花纤维的长度在[20,30]内的根数为0.55×100=55.
8.答案:0.0303所有小矩形的面积和等于10(0.005+0.010+0.020+a+0.035)=1,解得a=0.030;100名同学中,身高在[120,130)内的学生数是10×0.030×100=30,身高在[130,140)内的学生数是10×0.020×100=20,身高在[140,150]内的学生数是10×0.010×100
=10,则三组内的总学生数是30+20+10=60,抽样比等于18
60
=
3
10
,所以从身高在[140,150]
内的学生中选取的人数应为10×
3
10
=3.
9.分析:(1)茎是百位和十位,叶是个位;(2)依据茎叶图的优点写出即可.解:(1)茎叶图如图所示.
(2)由于在茎叶图中,品种A的数据靠下,相比之下,品种B的数据靠上,则品种A的平均产量高.用茎叶图处理现有的数据不仅可以看出数据的分布状况,而且可以看出每组中的具体数据.
10
(2)由题意组距为10,取小矩形的高为频率
组距
,计算得到如下的数据表:
(3)由频率分布直方图,可知成绩在[70,80)分的学生所占总体的百分比是0.03×10=0.3=30%.
(4)估计成绩在[70,100]分的学生所占总体的百分比是0.3+0.24+0.16=0.7=70%.。