2.2.1 用样本的频率分布估计总体分布
- 格式:doc
- 大小:314.50 KB
- 文档页数:7
§2.2.1用样本的频率分布估计总体分布一、学习目标1. 会用频率分布表作频率直方图和频率折线图2. 能够用频率直方图对总体分布规律进行估计。
3. 知道茎叶图的意义及画法,并能在实际问题中用茎叶图进行数据统计 二、预习课本,自主掌握1.通常我们对总体做出的估计一般分成两种。
一种是用_样本的频率分布估计总体的分布,另一种是用_样本的数字特征估计总体的数字特征2.分析数据的一种基本方法是用图将他们画出来,或者用紧凑的表格改变数据的排列方式。
作图可以达到两个目的,一是从数据中提取信息,二是_利用图形传递信息_.表格则是通过改变数据的构成形式,为我们提供_解释数据__的新方式。
3.在频率分布直方图中,纵轴表示__组距频率_____,数据落在各小组内的频率用各小长方形的面积_表示,各小长方形的面积总和等于1_.4.作频率分布直方图的步骤为(1)求极差,即_一组数据中的最大值与最小值的差;(2)决定组距与组数;(3)将数据分组(4)列频率分布表(5)绘制频率分布直方图5.连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。
随着样本容量的增加,作图时所分的组数增加,相应的频率折线图会越来越接近一条光滑曲线,它能够更加精细的反映出总体在各个范围内取值的百分比。
6.茎是指中间的一列数,叶就是从茎的旁边生长出来的数.茎叶图可用来分析单组数据,也可以对两组数据进行比较.茎叶图不仅能够保留原始数据,而且能够展示数据的分布情况.7.在样本数据较少时,用茎叶图表示数据效果的好坏,它不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便。
三、基础自测1.2000辆汽车通过某一段公路时的时速的频率分布直方图如右图所示,时速在)60,50[的汽车大约有 ( )A .30辆B .60辆C .300辆D .600辆 2.下列关于茎叶图的叙述正确的是( )(A )将数据的数按位数进行比较,将数大小基本不变或变化不大的作为一个主杆(茎),将变化大的位数作为分枝(叶),列在主杆的后面(B )茎叶图只可以分析单组数据,不能对两组数据进行比较 (C )茎叶图更不能表示三位数以上的数据(D )画图时茎要按照从小到大的顺序从下向上列出,共茎的叶可以随意同行列出3.容量为100的样本数据,按从小到大的顺序分为8组,如下表:第三组的频数和频率分别是 ( )A .14和0.14B .0.14和14C . 141和0.14 D . 31和1414.下图是样本容量为200的频率分布直方图。
2.2 用样本估计总体2.2.1 用样本的频率分布估计总体分布基础达标1.在用样本频率分布估计总体分布的过程中,下列说法正确的是( C ) (A)总体容量越大,估计越精确 (B)总体容量越小,估计越精确 (C)样本容量越大,估计越精确(D)样本容量越小,估计越精确解析:样本容量越大,估计越接近于总体,因而越精确.第三组的频数和频率分别是( A ) (A)14和0.14 (B)0.14和14 (C) 114和0.14(D)13和114解析:第三组的频数为100-(10+13+14+15+13+12+9)=14, 频率为14100=0.14, 故选A.3.(2011年安徽检测)某雷达测速区规定:凡车速大于或等于70 km/h 的汽车视为“超速”,并将受到处罚,如图是某路段的一个检测点对300辆汽车的车速进行检测所得结果的频率分布直方图,则从图中可得出将被处罚的汽车数为( C )(A)30辆 (B)40辆 (C)60辆 (D)80辆解析:车速大于或等于70 km/h 的汽车数为0.02×10×300=60(辆),故选C.4.一个容量为80的样本中数据的最大值是140,最小值是51,组距是10,则应将样本数据分为( B ) (A)10组 (B)9组(C)8组 (D)7组解析:根据列频率分布表的步骤,极差组距=140-5110=8.9.所以分为9组较为恰当.5.某超市连锁店统计了城市甲、乙的各16台自动售货机在中午12:00至13:00间的销售金额,并用茎叶图表示如图.则有( D )(A)甲城销售额多,乙城不够稳定(B)甲城销售额多,乙城稳定(C)乙城销售额多,甲城稳定(D)乙城销售额多,甲城不够稳定解析:十位数字是3、4、5时乙明显多于甲,估计乙销售额多,甲的数字过于分散,不够稳定,故选D.6.(2010年高考江苏卷)某棉纺厂为了解一批棉花的质量,从中随机抽测了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标).所得数据均在区间[5,40]中,其频率分布直方图如图所示,则在抽测的100根中,有根棉花纤维的长度小于20 mm.解析:由题意知,棉花纤维的长度小于20 mm的频率为(0.01+0.01+0.04)×5=0.3,故抽测的100根中,棉花纤维的长度小于20 mm的有0.3×100=30(根).答案:307.从甲、乙两个品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),结果如下:甲品种:271 273 280 285 285 287 292 294 295 301 303 303 307 308 310 314 319 323 325 325 328 331 334 337 352乙品种:284 292 295 304 306 307 312 313 315 315 316 318 318 320 322 322 324 327 329 331 333 336 337 343 356由以上数据设计了茎叶图如图所示根据以上茎叶图,对甲、乙两品种棉花的纤维长度作比较,写出两个统计结论:①;②.解析:由茎叶图可以看出甲品种棉花纤维的长度比较分散,乙品种棉花纤维的长度比较集中(大部分集中在312~337之间)等,通过分析可以得到答案.答案:①从茎叶图上看,甲品种棉花的纤维长度较分散,而乙品种棉花的纤维长度比较集中②甲品种棉花的纤维长度分散对称,乙品种棉花的纤维长度集中且成轴对称能力提升8.(2011年高考湖北卷)有一个容量为200的样本,其频率分布直方图如图所示,根据样本的频率分布直方图估计,样本数据落在区间[10,12)内的频数为( B )(A)18 (B)36(C)54(D)72解析:样本数据在[10,12)内的频率为1-2×(0.02+0.05+0.15+0.19)=0.18. ∴样本数据在[10,12)内的频数为200×0.18=36,故选B.9.某校举行篮球比赛,甲、乙两名运动员每场比赛的得分情况如下:甲的得分:12,15,24,25,31,31,36,36,37,39,44,49,50. 乙的得分:8,13,14,16,23,26,28,33,38,39,51. (1)画出甲、乙两名运动员得分数据的茎叶图. (2)根据茎叶图分析两名运动员的水平. 解:(1)茎叶图(2)甲、乙两名运动员得分情况都大致对称,甲运动员得分大部分在30分以上,集中在30~40之间,而乙运动员除了一个51分和8分外,大部分得分在10~39之间,分布较分散,故甲运动员总体得分比乙运动员好. 10.(2011年青岛检测)某幼儿园根据部分同年龄段女童的身高数据绘制了频率分布直方图,其中身高的变化范围是[96,106](单位:厘米),样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106] .(1)求出x 的值;(2)已知样本中身高小于100厘米的人数是36,求出样本总量N 的数值;(3)根据频率分布直方图提供的数据及(2)中的条件,求出样本中身高大于或等于98厘米并且小于104厘米的人数.解:(1)由题意:(0.050+0.100+0.150+0.125+x)×2=1. 解得:x=0.075.(2)设样本中身高小于100厘米的频率为p 1, ∴p 1=(0.050+0.100)×2=0.300, 而p 1=36,∴N=36p1=360.300=120.(3)样本中身高大于或等于98厘米并且小于104厘米的频率为p2=(0.100+0.150+0.125)×2=0.750,∴身高大于或等于98厘米并且小于104厘米的人数为n=p2N=120×0.750=90.。
2.2用样本估计总体
2.2.1用样本的频率分布估计总体分布
1关于频率分布直方图中小长方形的高的说法,正确的是()
A.表示该组上的个体在样本中出现的频率
B.表示取某数的频率
C.表示该组上的个体数与组距的比值
D.表示该组上的个体在样本中出现的频率与组距的比值
,面积表示频率.
解析:频率分布直方图中小长方形的高是频率
组距
答案:D
2(2011·山东青岛高三教学质量统一检测,文2)某时段内共有100辆汽车经过某一雷达地区,汽车时速的频率分布直方图如图所示,则时速超过60km/h的汽车数量为()
A.38
B.28
C.10
D.5
解析:由图可知,时速超过60km/h的汽车频率为(0.028+0.010)×10=0.38,则根据公式,频数=频率×样本容量,可得时速超过60km/h的汽车数量为0.38×100=38.
答案:A
3如图是根据《山东统计年鉴2007》中的资料作成的1997年至2006年山东省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百
位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到1997年至2006年山东省城镇居民百户家庭人口数的平均数为()
A.304.6
B.303.6
C.302.6
D.301.6
解析:观察茎叶图可知,共有4+2+4=10(百户),共有家庭人口数为291×2+295+298+302+306+310+312+314+317=3036,所以所调查的10个百户中百户家庭人口数的平均数为303.6.
答案:B
4通过全国人口普查工作,得到我国人口的年龄频率分布直方图如下图所示,那么在一个总人口数为200万的城市中,年龄在[20,60)之间的人大约有()
A.58万
B.66万
C.116万
D.132万
解析:由频率分布直方图可知,年龄在[20,60)之间的人的频率为(0.018+0.011)×20=0.58,则估计在一个总人口数为200万的城市中,年龄在[20,60)之间的人大约有0.58×200=116(万).
答案:C
5为了了解某学校学生的身体发育情况,抽查了该校100名高中男生的体重情况,根据所得数据画出样本的频率分布直方图如图所示.根据此图,估计该校2000名高中男生中体重不小于70.5千克的人数为()
A.300
B.360
C.420
D.450
解析:由频率分布直方图,得这100名高中男生体重不小于70.5千克的频率是(0.04+0.035+0.015)×2=0.18,所以估计该校2000名高中男生中体重不小于70.5千克的频率是0.18,则估计该校2000名高中男生中体重不小于70.5千克的人数为2000×0.18=360.
答案:B
6青年歌手大奖赛共有10名选手参赛,并请了7名评委.如图所示的茎叶图是7名评委给参加最后决赛的两位选手甲、乙评定的成绩,去掉一个最高分和一个最低分后,甲、乙选手剩余数据的平均成绩分别为、.
解析:甲的成绩去掉一个最高分92分和一个最低分75分后,甲的剩余数据的平均成绩为84.2分;乙的成绩去掉一个最高分93分和一个最低分79分后,乙的剩余数据的平均成绩为85分. 答案:84.2分85分
7某棉纺厂为了解一批棉花的质量,从中随机抽测100根棉花纤维长度(棉花纤维的长度是棉花质量的重要指标).所得数据均在区间[5,40]中,其频率分布直方图如图所示,由图中数据可知a=,在抽测的100根中,棉花纤维的长度在[20,30)内的有根.
解析:由频率分布直方图可知,在区间[5,40]中,数据被分成7组,所以组距为5,且(0.01+0.01+0.04+0.06+a+0.02+0.01)×5=1,解得a=0.05;棉花纤维的长度在[20,30]内的频率为(0.06+0.05)×5=0.55,则棉花纤维的长度在[20,30]内的根数为0.55×100=55.
答案:0.0555
8从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图).由图中数据可知a=.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为.
解析:所有小矩形的面积和等于10(0.005+0.010+0.020+a+0.035)=1,解得a=0.030;100名同学中,身高在[120,130)内的学生数是10×0.030×100=30,身高在[130,140)内的学生数是10×0.020×100=20,身高在[140,150]内的学生数是10×0.010×100=10,则三组内的总学生数是
30+20+10=60,抽样比等于18
60=3
10
,所以从身高在[140,150]内的学生中选取的人数应为
10×3
10
=3.
答案:0.0303
9某良种培育基地正在培育一种小麦新品种A,将其与原有的一个优良品种B进行对照试验,两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:
品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445, 445,451,454;
品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,
416,422,430.
(1)画出品种A和品种B小麦亩产的茎叶图.
(2)不用计算,根据茎叶图估计哪一个品种的平均产量高?用茎叶图处理现有的数据,有什么优点?
分析:(1)茎是百位和十位,叶是个位;(2)依据茎叶图的优点写出即可.
解:(1)茎叶图如图所示.
(2)由于在茎叶图中,品种A的数据靠下,相比之下,品种B的数据靠上,则品种A的平均产量高.用茎叶图处理现有的数据不仅可以看出数据的分布状况,而且可以看出每组中的具体数据.
10从高一学生中抽取50名参加调研考试,成绩的分组及各组的频数如下(单位:分): [40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.
(1)列出样本的频率分布表;
(2)画出频率分布直方图;
(3)估计成绩在[70,80)分的学生所占总体的百分比;
(4)估计成绩在[70,100]分的学生所占总体的百分比.
解:(1)频率分布表如下:
,计算得到如下的数据表:
(2)由题意组距为10,取小矩形的高为频率
组距
根据表格画出如下的频率分布直方图:
(3)由频率分布直方图,可知成绩在[70,80)分的学生所占总体的百分比是
0.03×10=0.3=30%.
(4)估计成绩在[70,100]分的学生所占总体的百分比是0.3+0.24+0.16=0.7=70%.。