2018版高中数学第二章统计2.2.1用样本的频率分布估计总体的分布学业分层测评新人教B版必修3
- 格式:doc
- 大小:339.50 KB
- 文档页数:8
2.2.1 用样本的频率分布估计总体的分布1.理解用样本的频率分布估计总体的分布的方法.2.会列频率分布表,画频率分布直方图、频率分布折线图、茎叶图.(重点)3.能够利用频率分布直方图和茎叶图解决实际问题.(难点)[基础·初探]教材整理1 频率分布表及频率分布直方图阅读教材P58~P61,完成下列问题.1.频率分布表、频率分布直方图的编制步骤(1)计算极差(全距);(2)决定组数与组距;(3)决定分点;(4)列频率分布表;(5)绘制频率分布直方图.2.频率分布直方图3.频率分布折线图、总体密度曲线(1)频率分布折线图的定义:把频率分布直方图各个小长方形上边的中点用线段连接起来,就得到频率分布折线图.(2)总体密度曲线:如果样本容量不断增大,分组的组距不断缩小,则频率分布直方图实际上越来越接近于总体的分布,它可以用一条光滑曲线y=f(x)来描绘,这条光滑曲线就叫做总体密度曲线.1.一个容量为80的样本中,数据的最大值为152,最小值为60,组距为10,应将样本数据分为( )A.10组B.9组C.8组D.7组【解析】 由题意可知,152-6010=9.2,故应将数据分为10组.【答案】 A2.从一群学生中抽取一个一定容量的样本,对他们的学习成绩进行分析.已知不超过80分的为10人,其累积频率为0.5,则样本容量是( )A.20B.40C.80D.60【解析】 样本容量=100.5=20.【答案】 A 教材整理2 茎叶图阅读教材P 62~P 63,完成下列问题. 茎叶图1.判断(正确的打“√”,错误的打“×”) (1)样本容量越大,估计的越准确.( ) (2)频率分布直方图的纵轴表示频率.( ) (3)茎叶图不能增加数据.( ) 【答案】 (1)√ (2)× (3)×2.如图221是一个班的语文成绩的茎叶图(单位:分),则优秀率(90分以上)是________,最低分是________.【解析】 由茎叶图知,样本容量为25,90分以上的有1人,故优秀率为125=4%,最低分为51分.【答案】 4% 51[小组合作型]100名考生的数学成绩,数据如下:(单位:分)135 98 102 110 99 121 110 96 100 103 125 97 117 113 110 92 102 109 104 112 105 124 87 131 97 102 123 104 104 128 109 123 111 103 105 92 114 108 104 102 129 126 97 100 115 111 106 117 104 109 111 89 110 121 80 120 121 104 108 118 129 99 90 99 121 123 107 111 91 100 99 101 116 97 102 108 101 95 107 101 102 108 117 99 118 106 119 97 126 108123 119 98 121 101 113 102 103 104 108 (1)列出频率分布表;(2)画出频率分布直方图和折线图;(3)估计该省考生数学成绩在[100,120)分之间的比例.【精彩点拨】 先求极差.根据极差与数据个数确定组距、组数,然后按频率分布直方图的画法绘制图形.【尝试解答】 100个数据中,最大值为135,最小值为80,极差为135-80=55.取组距为5,则组数为555=11.(1)频率分布表如下:布直方图的纵坐标.(2)根据频率分布表中的有关信息画出频率分布直方图及折线图,如图所示:(3)从频率分布表中可知,这100名考生的数学成绩在[100,120)分之间的频率为0.24+0.15+0.12+0.09=0.60,据此估计该省考生数学成绩在[100,120)分之间的比例为60%.(0.60=60%)1.在列频率分布表时,极差、组距、组数有如下关系: (1)若极差组距为整数,则极差组距=组数;(2)若极差组距不为整数,则极差组距的整数部分+1=组数.2.组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,使数据的分布规律能较清楚地呈现出来,组数太多或太少都会影响了解数据的分布情况,若样本容量不超过100,按照数据的多少常分为5~12组,一般样本容量越大,所分组数越多.[再练一题]1.有一容量为200的样本,数据的分组以及各组的频数如下:[-20,-15),7;[-15,-10),11;[-10,-5),15;[-5,0),40;[0,5),49;[5,10),41;[10,15),20;[15,20],17.(1)列出样本的频率分布表;(2)画出频率分布直方图和频率分布折线图;(3)求样本数据不足0的频率.【解】(1)频率分布表如下:(2)(3)样本数据不足0的频率为:0.035+0.055+0.075+0.2=0.365.上交的时间为5月1日到31日,逾期不得参加评比.评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如图222).已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:图222(1)本次活动共有多少件作品参加评比? (2)哪组上交的作品数最多,有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率较高?【导学号:00732053】【精彩点拨】 (1)根据条件:从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,计算参加评比的作品总数;(2)根据频率分布直方图判断哪组上交的作品最多,再由本组的频率计算频数;(3)先分别由第四组和第六组的频率计算该组的频数,再计算获奖率.【尝试解答】 (1)设从左到右各长方形的高分别为2x,3x,4x,6x,4x ,x .设参加评比的作品总数为a 件,依题意得:4x ×5=12a ,x =35a ,满足(2x +3x +4x +6x +4x +x )×5=1. 解得a =60(件).(2)由频率分布直方图可以看出第四组上交的作品数量最多,共有6×x ×5×a =18(件).(3)第四组和第六组上交的作品数分别为:18件,x ×5×a =3(件),则它们的获奖率分别为:1018=59;23,又59<23,所以第六组的获奖率较高.1.频率分布直方图的性质:(1)因为小矩形的面积=组距×频率/组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小;(2)在频率分布直方图中,各小矩形的面积之和等于1; (3)频数/相应的频率=样本容量.2.频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性.[再练一题]2.某工厂对一批产品进行了抽样检测.如图223是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( )图223A.90B.75C.60D.45【解析】 产品净重小于100克的频率为(0.050+0.100)×2=0.300,已知样本中产品净重小于100克的个数是36,设样本容量为n ,则36n=0.300,所以n =120,净重大于或等于98克并且小于104克的产品的个数是120×(0.1+0.15+0.125)×2=90.【答案】 A下:甲:95,81,75,91,86,89,71,65,76,88,94,110,107. 乙:83,86,93,99,88,103,98,114,98,79,78,106,101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.【精彩点拨】 题中可用十位数字为茎,个位数字为叶作茎叶图,然后根据茎叶图分析两人成绩.【尝试解答】 甲、乙两人数学成绩的茎叶图如图所示:从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98;甲同学的得分情况,也大致对称,中位数是88.乙同学的成绩比较稳定,总体情况比甲同学好.1.绘制茎叶图的关键是分清茎和叶,如本题中数据是两位数,十位数字为“茎”,个位数字为“叶”;如果是小数时,通常把整数部分作为“茎”,小数部分作为“叶”,解题时要根据数据的特点合理选择茎和叶.2.利用茎叶图进行数据分析时,一般从数据分布的对称性、中位数、稳定性等几个方面来考虑.[再练一题]3.如图224是2016年青年歌手大奖赛中七位评委为甲、乙两名选手打出的分数的茎叶图(图中m 为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a 1,a 2,则一定有( )图224A.a 1>a 2B.a 2>a 1C.a 1=a 2D.a 1,a 2的大小与m 的值有关【解析】 根据茎叶图可知,去掉一个最高分和一个最低分后,甲的平均分为a 1=80+5+4+5+5+15=84,乙的平均分为a 2=80+4+4+6+4+75=85,故a 2>a 1.【答案】 B[探究共研型]探究1 【提示】 频率分布表和频率分布直方图有以下特征:(1)频率分布表中的数字和频率分布直方图的形状都与分组数有关. 分组数的变化引起频率分布表和频率分布直方图的结构变化.(2)随机性.频率分布表和频率分布直方图由样本决定,因此它们会随着样本的改变而改变.(3)规律性.若固定分组数,随着样本容量的增加,频率分布表中各个频率会稳定在某个值的附近,从而频率分布直方图中的各个矩形的高度也会稳定在特定的值上.探究2 画频率分布直方图时,如何确定组距?【提示】组距的选择应力求“取整”,如果极差不利于分组(如不能被组数整除),可适当增大极差,如在左、右两端各增加适当范围(尽量使两端增加的量相同).探究3 影响频率分布直方图的因素有哪些?【提示】同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同,不同的形状给我们的印象也不同,这种印象有时会影响我们对总体的判断;同一个总体,由于抽样的随机性,如果随机抽取另外一个容量相同的样本,所形成的样本频率分布一般会与前一个的样本频率分布有所不同,但是,它们都可以近似地看作总体的分布.探究4 频率分布表和频率分布直方图有什么优缺点?【提示】(1)频率分布表反映具体数据在各个不同区间的取值频率,但不够直观、形象,对分析数据分布的总体态势不太方便.(2)频率分布直方图能够直观地表明数据分布的形状,一般呈中间高、两端低、左右对称的“峰”状结构.但是从直方图本身得不到具体的数据内容,也就是说,把数据表示成直方图后,原始数据不能在图中表示出来.探究5【提示】不是.绘制茎叶图时,重复出现的数据要重复记录,不能遗漏,特别是“叶”位置的数据.同一数据出现几次,就要在图中体现几次.探究6 什么情况下适合用茎叶图?【提示】(1)对于样本数据较少,但较为集中的一组数据:若数据是两位整数,则将十位数字作茎,个位数字作叶;若数据是三位整数,则将百位、十位数字作茎,个位数字作叶.样本数据为小数时作类似处理.(2)对于样本数据较少,但较为集中的两组数据,关键是找到两组数据共有的茎.中小学生的视力状况受到社会的广泛关注,某市有关部门从全市6万名高一学生中随机抽取了400名,对他们的视力状况进行一次调查统计,将所得到的有关数据绘制成频率分布直方图,如图225所示.从左至右五个小组的频率之比依次是5∶7∶12∶10∶6,则全市高一学生视力在[3.95,4.25)范围内的学生人数约有________.图225【精彩点拨】 1.注重对图形的观察:图表试题解题三个步骤:一观、二识、三解,做到观图要细、识图要全、解图要准.如本例中,要从频率分布直方图中看出组距,求出第五组的频率.2.重视对直方图性质的理解和应用:在频率分布直方图中,小长方形的高=频率组距,小长方形的面积=频率组距×组距=频率.如本例中,0.5×0.3=0.15才是第五个小组的频率.【尝试解答】 由图知,第五小组的频率为0.5×0.3=0.15,所以第一小组的频率为0.15×56=0.125,所以全市6万名高一学生中视力在[3.95,4.25)范围内的学生约有60000×0.125=7 500(人).【答案】 7 500人 [再练一题]4.某公司为了改善职工的出行条件,随机抽取100名职工,调查了他们的居住地与公司间的距离d (单位:km).由其数据绘制的频率分布直方图如图226所示,则样本中职工居住地与公司间的距离不超过4 km 的人数为________.图226【解析】 不超过4 km 的频率为(0.1+0.14)×2=0.48,故样本中职工居住地与公司间的距离不超过4 km 的人数有0.48×100=48(人).【答案】 481.一个容量为20的样本数据,分组及各组的频数如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2,则样本在区间[20,60)上的频率是( )A.0.5B.0.6C.0.7D.0.8【解析】 频率=3+4+5+42+3+4+5+4+2=1620=45=0.8.【答案】 D2.一个容量为32的样本,已知某组样本的频率为0.125,则该组样本的频数为( ) A.2 B.4 C.6D.8【解析】 频率=频数样本容量,则频数=频率×样本容量=0.125×32=4.【答案】 B3.如图227是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为( )图227A.0.2B.0.4C.0.5D.0.6 【解析】 ∵数据总个数n =10, 又落在区间[22,30)内的数据个数为4, ∴所求的频率为410=0.4,故选B.【答案】 B4.将容量为n 的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n 等于________.【导学号:00732054】【解析】 设第一组至第六组的样本数据的频数为2x,3x,4x,6x,4x ,x ,则2x +3x +4x =27,得x =3.故n =20x =60. 【答案】 605.某班50名同学参加数学测验,成绩的分组及各组的频数如下:[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8. (1)列出样本的频率分布表; (2)画出频率分布直方图. 【解】 (1)频率分布表如下:(2)。
新课导入前面研究学习了三种抽样收集数据,数据收集后,必须从中寻找包含的信息,以使我们能追求样本的估计总体,但是由于数据多而杂,所以需要通过一定的方法去分析.可以通过表、图、计算方法来分析.1. 通过实例体会分布的意义和作用;2. 在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图;3. 通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.知识与技能教学目标过程与方法通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法.情感态度与价值观通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系.重点会列频率分布表,画频率分布直方图、频率折线图和茎叶图.能通过样本的频率分布估计总体的分布. 难点教学重难点我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了了较为合理地确定出这个标准,需要做哪些工作?实际问题为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.假设我们通过抽样,得到100为居民月用水量,如下:100位居民的月均用水量(单位:t)3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.64.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2观察?上面的数字能告诉我们什么呢很容易发现的是一个居民月均用水量的最小值是0.2t,最大值是4.3t.其他值在0.2—4.3t之间.除此之外,很难从随意记录下来的数据中直接看出规律.为此,我们需要对统计数据进行整理和分析.知识要点频率分布直方图频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.方法画频率分布直方图的一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差;(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图.(1)求极差 因为用水最小值为0.2t ,最大值为4.3t 所以:4.3-0.2=4.1 说明样本数据的变化范围是4.1t.将上述抽样的100户居民月用水量,画出频率分布直方图.解:(2)决定组距与组数数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.当样本容量不超过100时,按照数据的多少,常分成5—12组.为了方便起见,组距的选择应力求“取整”.在本问题中,如果取组距为0.5(t),那么组数=极差/组距=4.1/0.5=8.2因此可将数据分成9组,这个组数是较合适的,于是去组距为0.5.组数为9.(3)将数据分组以组距为0.5将数据分组时,可以分成以下9组:[0,0.5),[0.5,1),…,[4,4.5).(4)列频率分布表按照组距为0.5将数据分组,分成以下9组:[0,0.5),[0.5,1),…,[4,4.5). 图如下:100位居民月均用水量的频率分布表分组频数频率[0,0.5)40.04[0.5,1)80.08[1,1.5)150.15[1.5,2)220.22 [2,2.5)250.25 [2.5,3)140.14 [3,3.5)60.06 [3.5,4)40.04 [4,4.5)20.02合计1001频数等于样本数,频率恒为1(5)画频率分布直方图 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/to 0.100.200.300.400.50频率/组距特征频率分布直方图的特征:从频率分布直方图可以清楚的看出数据分布的总体趋势.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.知识要点频率分布折线图连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.总体密度曲线的定义在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.茎叶图数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.特征茎叶图的特征:1. 用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.2. 茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.课堂小结1.频率分布直方图的概念频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.2.频率分布折线图的概念连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.高考链接1(2009四川)设矩形的长为a ,宽为b ,其比满足 51b :a 0.6182-=≈这种矩形给人以美感,称为黄金矩形,黄金矩形常应用用于工艺品设计中,下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:甲批次:0.598 0.625 0.628 0.595 0.639 乙批次:0.618 0.613 0.592 0.622 0.620根据上述两个样品来估计两个批次的总体平均数,与标准值0.618比较,正确结论是()AA.甲批次的总体平均数与标准值更接近B.乙批次的总体平均数与标准值跟接近C.两个批次总体平均数与标准值接近程度相同D.两个批次总体平均数与标准值接近程度不能确定解析:本题考查平均数的求法,用样本估计总体,经计算甲、乙批次的总体平均数0.6170.613甲乙,x x ==知甲批次的总体平均数与标准值0.618更接近.2(2009湖北)下图是样本容量为200的频率分布直方图.根据样本的频率分布直方图估计,样本数据落在[6,10]内的频数为_______,数据落在[2,10)内的概率约为_____. 64 0.4解析:本题考查频率分布直方图,样本数据落在[6,10)内的频数为0.08×(10-6)×200=64.样本数据落在[2,10)内的概率约为(0.02+0.08)×4=0.4.区间界限[122,126)[126,130)[130,134)[134,138)[138,142)[142,146)人数5810223320区间界限[146,150)[150,154)[154,158)人数11651.下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位c m)(1)列出样本频率分布表﹔ (2)一画出频率分布直方图;(3)估计身高小于134cm的人数占总人数的百分比.随堂练习分组频数频率[122,126)50.04[126,130)80.07[130,134)100.08[134,138)220.18[138,142)330.28[142,146)200.17[146,150)110.09[150,154)60.05[154,158)50.04合计1201解:(1)样本频率分布表如下:前面的过程省略!122 126 130 134 138 142 146 150 158 154 身高(cm )o 0.010.020.030.040.050.060.07频率/组距(2)其频率分布直方图如下:0.04+0.07+0.08=0.19,所以我们估计身高小于134cm 的人数占总人数的19%.(3)由样本频率分布表可知身高小于134cm 的男孩出现的频率为:2.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.90 100 110 120 130 140 150 次数o 0.0040.0080.0120.0160.0200.0240.028频率/组距0.0320.036解:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1. (1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:40.0824171593=+++++121500.08===第二小组频数样本容量第二小组频率又因为频率=频数/ 样本容量所以 (2)由图可估计该学校高一学生的达标率约为 171593100%88%24171593+++⨯=+++++(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.。
2.1.2 系统抽样(建议用时:45分钟)[学业达标]一、选择题1.在10 000个号码(编号为0000~9999)中,有关部门按照随机抽样的方式确定后2位数字是68的号码为中奖号码.这种确定中奖号码的方法是( )A.抽签法B.系统抽样法C.随机数表法D.其他抽样法【解析】 根据系统抽样的概念知应选B.【答案】 B2.中央电视台“动画城节目”为了对本周的热心小观众给予奖励,要从已确定编号的一万名小观众中抽出十名幸运小观众.现采用系统抽样的方法抽取,每段容量为( )A.10B.100C.1 000D.10 000【解析】 将10000个个体平均分成10段,每段取一个,故每段容量为1000.【答案】 C二、填空题3.已知某商场新进3 000袋奶粉,为检查其三聚氰胺是否达标,现采用系统抽样的方法从中抽取150袋检查,若第一组抽出的号码是11,则第61组抽出的号码为________.【解析】 分段间隔是3 000150=20,由于第一组抽出号码为11,则第61组抽出号码为11+(61-1)×20=1 211.【答案】 1 2114.一个总体中有100个个体,随机编号为00,01,02,…,99,依编号顺序平均分成10个小组,组号分别为1,2,3,…,10.现抽取一个容量为10的样本,规定如果在第1组中随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m +k 的个位数字相同.若m =6,则在第7组中抽取的号码是________.【解析】 由题意知第7组中的数为“60~69”10个数.由题意知m =6,k =7,故m +k =13,其个位数字为3,即第7组中抽取的号码的个位数为3,综上知第7组中抽取的号码为63.【答案】 63三、解答题5.某校有2 008名学生,从中抽取20人参加体检,试用系统抽样进行具体实施.【解】 (1)将每个人随机编一个号由0 001至2 008;(2)利用随机数表法找到8个号将这8名学生剔除;(3)将剩余的2 000名学生重新随机编号0 001至2 000;(4)分段,取间隔k =200020=100,将总体平均分为20段,每段含100个学生; (5)从第一段即为0 001号到0 100号中随机抽取一个号l ;(6)按编号将l,100+l,200+l ,…,1900+l 共20个号码选出,这20个号码所对应的学生组成样本.[能力提升]1.从2 015名学生中选取50名学生参加数学竞赛,若采用下面方法选取:先用简单随机抽样从2 015人中剔除15人,剩下的2 000人再按系统抽样的方法抽取50人,则在2 015人中,每个人入选的机会( )A.都相等,且为502 015B.不全相等C.均不相等D.都相等,且为140【解析】 因为在系统抽样中,若所给的总体个数不能被样本容量整除,则要先剔除几个个体,本题要先剔除15人,然后再分组,在剔除过程中,每个个体被剔除的机会相等,所以每个个体被抽到包括两个过程,一是不被剔除,二是被选中,这两个过程是相互独立的,所以,每个人入选的机会都相等,且为502 015. 【答案】 A2.一个总体中的1 000个个体编号为0,1,2,…,999,并依次将其均分为10个小组,组号为0,1,2,…,9,要用系统抽样方法抽取一个容量为10的样本,规定如果在第0组随机抽取的号码为x ,那么依次错位地得到后面各组的号码,即第k 组中抽取的号码的后两位数为x +33k 的后两位数.(1)当x =24时,写出所抽取样本的10个号码;(2)若所抽取样本的10个号码中有一个的后两位数是87,求x 的取值范围.【解】 (1)由题意此系统抽样的间隔是100,根据x =24和题意得,24+33×1=57,第二组抽取的号码是157;由24+33×2=90,则在第三组抽取的号码是290,…故依次是24,157,290,323,456,589,622,755,888,921.(2)由x +33×0=87得x =87,由x +33×1=87得x =54,由x +33×3=187得x =88…, 依次求得x 值可能为21,22,23,54,55,56,87,88,89,90.。
2.2.1 用样本的频率分布估计总体的分布[学习目标]1.理解用样本的频率分布估计总体分布的方法.2.会列频率分布表,画频率分布直方图、频率分布折线图、茎叶图.3.能够利用图形解决实际问题.[知识链接]1.已知函数f(x)=-x2-2x+3,则函数的单调递增区间为(-∞,-1),单调递减区间为(-1,+∞).2.已知一组数分别为:2,3,5,7,8,10,11,则其中位数为7;数据2,3,5,7,8,10,则其中位数为6.[预习导引]1.用样本估计总体的两种情况(1)用样本的频率分布估计总体分布.(2)用样本的数字特征估计总体数字特征.2.数据分析的基本方法(1)借助于图形分析数据的一种基本方法是用图将它们画出来,此法可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.(2)借助于表格分析数据的另一方法是用紧凑的表格改变数据的排列方式,此法是通过改变数据的构成形式,为我们提供解释数据的新方式.3.频率分布直方图和分布表的特征(1)频率分布表中的数字和频率分布直方图的形状都与分组数(组距)有关.频率分布直方图的处理还与坐标系的单位长度有关.(2)随机性:频率分布表和频率分布直方图由样本决定,因此它们会随着样本的改变而改变.(3)规律性:若固定分组数,随着样本容量的增加,频率分布表的各个频率会稳定在某个值的附近,从而频率分布直方图中的各个矩形的高度也会稳定在特定的值上.4.频率分布折线图顺次连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.5.总体密度曲线一般地,当总体中的个体数较多时,抽样时样本容量就不能太小.可以想象,随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.它能够精确地反映出总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.6.茎叶图茎叶图也是用来表示数据的一种图,茎是指中间的一列数,叶是从茎的旁边生长出来的数.中间的数字表示十位数,旁边的数字表示个位数.要点一频率分布直方图的绘制例1 调查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)如下:171 163 163 166 166 168 168 160 168 165171 169 167 169 151 168 170 168 160 174165 168 174 159 167 156 157 164 169 180176 157 162 161 158 164 163 163 167 161(1)作出频率分布表;(2)画出频率分布直方图.解(1)最低身高151 cm,最高身高180 cm,它们的差是180-151=29,即极差为29;确定组距为4,组数为8,列表如下:(2)规律方法 1.在列频率分布表时,极差、组距、组数有如下关系: (1)若极差组距为整数,则极差组距=组数.(2)若极差组距不为整数,则极差组距的整数部分+1=组数.2.组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,使数据的分布规律能较清楚地呈现出来,组数太多或太少都会影响了解数据的分布情况,若样本容量不超过100,按照数据的多少常分为5~12组,一般样本容量越大,所分组数越多. 跟踪演练1 美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄: 57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图. (2)用自己的语言描述一下历届美国总统就任时年龄的分布情况. 解 (1)以4为组距,列表如下:(2)从频率分布表中可以看出60%左右的美国总统就任时的年龄在50岁至60岁之间,45岁以下以及65岁以上就任的总统所占的比例相对较小.要点二茎叶图及其应用例2 某中学甲、乙两名同学最近几次的数学考试成绩情况如下:甲的得分:95,81,75,89,71,65,76,88,94,110,107;乙的得分:83,86,93,99,88,103,98,114,98,79,101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.解甲、乙两人数学成绩的茎叶图如图所示.从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98分;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是88分,但分数分布相对于乙来说,趋向于低分阶段.因此乙同学发挥比较稳定,总体得分情况比甲同学好.规律方法 1.画茎叶图时,用中间的数表示数据的十位和百位数,两边的数分别表示两组数据的个位数.要先确定中间的数取数据的哪几位,填写数据时边读边填.比较数据时从数据分布的对称性、中位数、稳定性等几方面来比较.2.绘制茎叶图的关键是分清茎和叶,一般地说数据是两位数时,十位数字为“茎”,个位数字为“叶”;如果是小数的,通常把整数部分作为“茎”,小数部分作为“叶”,解题时要根据数据的特点合理选择茎和叶.跟踪演练2 (2013·重庆高考)如图茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( ) A .2,5 B .5,5 C .5,8 D .8,8答案 C解析 由于甲组数据的中位数为15=10+x ,∴x =5.又乙组数据的平均数为9+15++y +18+245=16.8,∴y =8,故选C.要点三 频率分布直方图的综合应用例3 为了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少? 解 (1)频率分布直方图是以面积的形式反映了数据落在各小组内的频率大小的,因此第二小组的频率为42+4+17+15+9+3=0.08.又因为第二小组的频率=第二小组的频数样本容量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由直方图可估计该校高一年级学生的达标率为17+15+9+32+4+17+15+9+3×100%=88%.规律方法 1.频率分布直方图的性质:(1)因为小矩形的面积=组距×频率组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.(2)在频率分布直方图中,各小矩形的面积之和等于1.(3)频数相应的频率=样本容量.2.频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性.跟踪演练3 (2013·福建高考)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( )A.588 B.480C.450 D.120答案 B解析不少于60分的学生的频率为(0.030+0.025+0.015+0.010)×10=0.8,∴该模块测试成绩不少于60分的学生人数应为600×0.8=480.1.用样本频率分布估计总体频率分布的过程中,下列说法正确的是( )A.总体容量越大,估计越精确B.总体容量越小,估计越精确C.样本容量越大,估计越精确D.样本容量越小,估计越精确答案 C解析由用样本估计总体的性质可得.2.频率分布直方图中,小长方形的面积等于( )A.组距B.频率C.组数D.频数答案 B解析 根据小长方形的宽及高的意义,可知小长方形的面积为一组样本数据的频率. 3.(2013·岳阳高一检测)某校为了解高三学生的身体状况,抽取了100名女生的体重.将所得的数据整理后,画出了如图的频率分布直方图,则所抽取的女生中体重在40~45 kg 的人数是( )A .10B .2C .5D .15答案 A解析 由图可知频率=频率组距×组距,知频率=0.02×5=0.1.∴0.1×100=10人.4.一个容量为n 的样本,分成若干组,已知某组的频数和频率分别为40,0.125,则n 的值为( ) A .640 B .320 C .240 D .160 答案 B解析 依题意得40n =0.125,∴n =400.125=320.5.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是________________,________.答案 45 46解析 甲组数据为:28,31,39,42,45,55,57,58,66,中位数为45. 乙组数据为:29,34,35,42,46,48,53,55,67,中位数为46.1.总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.2.总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.。
2.2.1 用样本的频率分布估计总体的分布(建议用时:45分钟)[学业达标]一、选择题1.下列命题正确的是()A.频率分布直方图中每个小矩形的面积等于相应组的频数B.频率分布直方图的面积为对应数据的频率C.频率分布直方图中各小矩形的高(平行于纵轴的边长)表示频率与组距的比D.用茎叶图统计某运动员得分:13,51,23,8,26,38,16,33,14,28,39时,茎是指中位数26频率【解析】在频率分布直方图中,横轴表示样本数据;纵轴表示,由于小矩形的面积组距频率=组距×=频率,所以各小矩形的面积等于相应各组的频率,因此各小矩形面积之和等于组距1.【答案】 C2.将容量为100的样本数据,按由小到大排列分成8个小组,如下表所示:组号 1 2 3 4 5 6 7 8频数10 13 14 14 15 13 12 9第3组的频率和累积频率为()1 1A.0.14和0.37B. 和14 273 6C.0.03和0.06D. 和14 3714 10+13+14【解析】由表可知,第三小组的频率为=0.14,累积频率为=0.37.100 100 【答案】 A3.如图228所示是一容量为100的样本的频率分布直方图,则由图形中的数据可知样本落在[15,20)内的频数为()图228A.20B.30C.40D.50【解析】样本数据落在[15,20)内的频数为100×[1-5×(0.04+0.1)]=30.【答案】 B4.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图229所示),则该样本的中位数、众数、极差分别是()图229A.46,45,56B.46,45,53C.47,45,56D.45,47,53【解析】由题意知各数为12,15,20,22,23,23,31,32,34, 34,38,39,45,45,45,47,47,48,48,49,50,50,51,51,54,57,59,61,67,68,中位数是46,众数是45,最大数为68,最小数为12,极差为68-12=56.【答案】 A5.某学校组织学生参加英语测试,成绩的频率分布直方图如图2210,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15人,则该班的学生人数是()【导学号:00732055】图2210A.45B.50C.55D.60【解析】根据频率分布直方图的特点可知,低于60分的频率是(0.005+0.01)×20=150.3,所以该班的学生人数是=50.0.3【答案】 B二、填空题6.200辆汽车通过某一段公路时时速的频率分布直方图如图2211所示,时速在[50,60) 的汽车大约有______辆.【导学号:00732056】图2211【解析】在[50,60)的频率为0.03×10=0.3,∴汽车大约有200×0.3=60(辆).【答案】607.从甲、乙两个班中各随机选出15名同学进行随堂测验,成绩的茎叶图如图2212所示,则甲、乙两组的最高成绩分别是________,________,从图中看,________班的平均成绩较高.图2212【解析】由茎叶图可知,甲班的最高分是96,乙班的最高分是92.甲班的成绩集中在60~80之间,乙班成绩集中在70~90之间,故乙班的平均成绩较高.【答案】9692乙8.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50度至350度之间,频率分布直方图如图2213所示:图2213(1)直方图中x的值为________;(2)在这些用户中,用电量落在区间[100,250)内的户数为________.【解析】由于(0.002 4+0.003 6+0.006 0+x+0.002 4+0.001 2)×50=1,解得x=0.004 4;数据落在[100,250)内的频率是(0.003 6+0.006 0+0.004 4)×50=0.7,所以月用电量在[100,250)内的用户数为100×0.7=70.【答案】(1)0.004 4(2)70三、解答题9.为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),实验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.52.5 2.6 1.2 2.7 1.5 2.93.0 3.1 2.3 2.4服用B药的20位患者日平均增加的睡眠时间:3.2 1.7 1.90.80.9 2.4 1.2 2.6 1.3 1.41.60.5 1.80.62.1 1.1 2.5 1.2 2.70.5(1)分别计算两种药的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?【导学号:00732057】图2214【解】(1)设A药观测数据的平均数为x,B药观测数据的平均数为y.由观测结果可得1x=(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.820+2.9+3.0+3.1+3.2+3.5)=2.3,1y=(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.120+2.4+2.5+2.6+2.7+3.2)=1.6.由以上计算结果可得x>y,因此可看出A药的疗效更好.(2)由观测结果可绘制茎叶图如图:7从以上茎叶图可以看出,A药疗效的试验结果有的叶集中在茎“2.”,“3.”上,而B药107疗效的试验结果有的叶集中在茎“0.”,“1.”上,由此可看出A药的疗效更好.1010.为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图2215),图中从左到右各小长方形的面积之比为图2215(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?【解】(1)频率分布直方图是以面积的形式反映了数据落在各小组内的频率大小的,因4此第二小组的频率为=0.08.2+4+17+15+9+3第二小组的频数又因为第二小组的频率=,样本容量第二小组的频数12所以样本容量===150.第二小组的频率0.08(2)由频率分布直方图可估计,该校高一年级学生的达标率为:17+15+9+3×100%=88%.2+4+17+15+9+3[能力提升]1.如图2216是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知()图2216A.甲运动员的成绩好于乙运动员B.乙运动员的成绩好于甲运动员C.甲、乙两名运动员的成绩没有明显的差异D.甲运动员的最低得分为0分【解析】由茎叶图可以看出甲运动员的成绩主要集中在30至40之间,比较稳定,而乙运动员均匀地分布在10至40之间,所以甲运动员成绩较好.故选A.【答案】 A2.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图2217所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是()图2217频数【解析】借助已知茎叶图得出各小组的频数,再由频率=求出各小组的频率,样本容量频率进一步求出并得出答案.组距法一由题意知样本容量为20,组距为5.列表如下:分组频数频率频率组距[0,5) 1 1200.01[5,10) 1 1200.01[10,15) 4 150.04[15,20) 2 1100.02[20,25) 4 150.04[25,30) 3 3200.03[30,35) 3 3200.03[35,40] 2 1100.02合计20 16观察各选择项的频率分布直方图知选A.频率法二由茎叶图知落在区间[0,5)与[5,10)上的频数相等,故频率、也分别相等,比组距较四个选项知A正确,故选A.【答案】 A3.某校开展“爱我家乡”摄影比赛,9位评委为参赛作品A给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x应该是________.图2218【解析】当x≤4时,89+89+92+93+90+x+92+91=91,7解之得x=1.当x>4时,易证不合题意.【答案】 14.某车站在春运期间为了了解旅客购票情况,随机抽样调查了100名旅客从开始在售票窗口排队到购到车票所用的时间t(以下简称为购票用时,单位为m i n),下面是这次调查统计分析得到的频率分布表和频率分布直方图:(如图2219所示)分组频数频率一组0≤t<5 0 0二组5≤t<10 10 0.10三组10≤t<15 10 ②四组15≤t<20 ①0.50五组20≤t≤2530 0.30合计100 1.00图2219解答下列问题:(1)这次抽样的样本容量是多少?(2)在表中填写出缺失的数据并补全频率分布直方图;(3)旅客购票用时的平均数可能落在哪一组?【解】(1)样本容量是100.(2)①50②0.10所补频率分布直方图如图中的阴影部分:(3)设旅客平均购票用时为t m i n,则有0 × 0+5 × 10+10 × 10+15 × 50+20 × 30≤t1005 × 0+10 × 10+15 × 10+20 × 50+25 × 30< ,100即15≤t<20.所以旅客购票用时的平均数可能落在第四组.。
2.2.1 用样本的频率分布估计总体的分布(一)学习目标 1.体会分布的意义和作用.2.学会用频率分布表,画频率分布直方图表示样本数据.3.能通过频率分布表或频率分布直方图对数据做出总体统计.知识点一用样本估计总体思考还记得我们抽样的初衷吗?梳理用样本的____________估计总体的分布.知识点二频率分布表与频率分布直方图思考1 要做频率分布表,需要对原始数据做哪些工作?思考2 如何决定组数与组距?思考3 同样一组数据,如果组距不同,得到的频率分布直方图也会不同吗?梳理一般地,频数指某组中包含的个体数,各组频数和=样本容量;频率=频数样本容量,各组频率和等于1.在频率分布直方图中,纵轴表示____________,数据落在各小组内的频率用________________来表示,各小长方形的面积的总和等于____.类型一频率分布直方图例1 关于频率分布直方图,下列说法正确的是( )A.直方图中小长方形的高表示取某数的频率B.直方图中小长方形的高表示该组上的个体在样本中出现的频率C.直方图中小长方形的高表示该组上的个体在样本中出现的频数与组距的比值D.直方图中小长方形的高表示该组上的个体在样本中出现的频率与组距的比值反思与感悟由频率的定义不难得出,各组数据的频率之和为1,因为各组数据的个数之和为样本容量.在列频率分布表时,可以利用这种方法检查是否有数据的丢失.跟踪训练1 一个容量为20的样本数据,将其分组如下表:则样本在区间(-∞,50)上的频率为( )A.0.5 B.0.25C.0.6 D.0.7类型二频率分布直方图的绘制例2 某中学从高一年级随机抽取50名学生进行智力测验,其得分如下(单位:分):48 64 52 86 71 48 64 41 86 7971 68 82 84 68 64 62 68 81 5790 52 74 73 56 78 47 66 55 6456 88 69 40 73 97 68 56 67 5970 52 79 44 55 69 62 58 32 58根据上面的数据,回答下列问题:(1) 这次测验成绩的最高分和最低分分别是多少?(2)将区间[30,100]平均分成7个小区间,试列出这50名学生智力测验成绩的频率分布表,进而画出频率分布直方图;(3)分析频率分布直方图,你能得出什么结论?反思与感悟组距和组数的确定没有固定的标准,将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.组数太多或太少,都会影响我们了解数据的分布情况.数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.当样本容量不超过100时,按照数据的多少,常分成5至12组.跟踪训练2 一个农技站为了考察某种大麦穗生长的分布情况,在一块试验田里抽取了100株麦穗,量得长度如下(单位:cm):6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.65.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.86.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.56.8 6.0 6.3 5.5 5.0 6.3 5.2 6.0 7.0 6.46.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.7 7.46.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.65.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.05.6 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.75.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.06.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3根据上面的数据列出频率分布表、绘制出频率分布直方图,并估计在这块试验田里长度在5.75~6.35 cm之间的麦穗所占的百分比.类型三频率分布表及频率分布直方图的应用例3 从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;(2)求频率分布直方图中的a,b的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写出结论).反思与感悟在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.跟踪训练3 某学校组织学生参加数学测试,某班学生的成绩频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],若低于60分的人数是15,则该班的学生总人数是( )A.45 B.50C.55 D.601.如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在[15,20]内的频数为( )A.20 B.30 C.40 D.502.已知样本数据:10,8,6,10,13,8,10,12,11,7,8,9,11,9,12,9,10,11,12,11.那么频率为0.2的是( )A.[5.5,7.5) B.[7.5,9.5)C.[9.5,11.5) D.[11.5,13.5]3.如图是将高三某班60名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出的频率分布直方图,则此班的优秀(120分及以上为优秀)率为________.4.根据国家质量监督检验检疫总局发布的《车辆驾驶人员血液、呼气酒精含量阈值与检验》(GB19522~2004)中规定车辆驾驶人员血液酒精含量:“饮酒驾车”的临界值为20 mg/100 mL ;“醉酒驾车”的临界值为80 mg/100 mL.某地区交通执法部门统计了5月份的执法记录数据(每个分组包括最小值不包括最大值):根据上述表格,可估计该地区全年“饮酒驾车”发生的频率等于________.5.暑假期间某班为了增强学生的社会实践能力,把该班学生分成四个小组到一果园帮果农测量果树的产量,某小组来到一片种植苹果的山地,他们随机选取20株作为样本测量每一株的果实产量(单位:kg),获得的数据按照区间[40,45),[45,50),[50,55),[55,60]进行分组,得到如下频率分布表:已知样本中产量在区间[45,50)内的株数是产量在区间[50,60]内的株数的3倍.(1)分别求出a ,b ,c 的值; (2)作出频率分布直方图.1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律,我们通常用样本的频率分布表或频率分布直方图去估计总体的分布.2.频率分布表和频率分布直方图,是对相同数据的两种不同表达方式,用紧凑的表格改变数据的排列方式和构成形式,可展示数据的分布情况.通过作图既可以从数据中提取信息,又可以利用图形传递信息.3.样本数据的频率分布表和频率分布直方图,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚地看到整个样本数据的频率分布情况,并由此估计总体的分布情况.答案精析问题导学 知识点一思考 用样本去估计总体,为决策提供依据. 梳理 频率分布 知识点二思考1 分组,频数累计,计算频数和频率. 思考2 若极差组距为整数,则极差组距=组数.若极差组距不为整数,则⎣⎢⎡⎦⎥⎤极差组距+1=组数.注意:[x ]表示不大于x 的最大整数.思考3 不同.对于同一组数据分析时,要选好组距和组数,不同的组距与组数对结果有一定的影响.梳理 频率/组距 小长方形的面积 1. 题型探究 类型一例1 D [注意频率分布直方图和条形图的区别,在直方图中,纵轴(小长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的小长方形的面积.] 跟踪训练1 D [样本在区间(-∞,50)上的频率为2+3+4+520=1420=0.7.] 类型二例2 解 (1)这次测验成绩的最低分是32分,最高分是97分. (2)根据题意,列出样本的频率分布表如下:频率分布直方图如图所示.(3)从频率分布直方图可以看出,这50名学生的智力测验成绩大体上呈两头小、中间大,左右基本对称,说明这50名学生中智力特别好或特别差的占极少数,而智力一般的占多数,这是一种最常见的分布.跟踪训练2 解 (1)计算极差:7.4-4.0=3.4; (2)决定组距与组数:若取组距为0.3,因为3.40.3≈11.3,需分为12组,组数合适,所以取组距为0.3,组数为12;(3)决定分点:使分点比数据多一位小数,并且把第1小组的起点稍微减小一点,那么所分的12个小组可以是3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55; (4)列频率分布表:(5)绘制频率分布直方图如图.从表中看到,样本数据落在5.75~6.35之间的频率是0.28+0.13=0.41,于是可以估计,在这块试验田里长度在5.75~6.35 cm 之间的麦穗约占41%. 类型三例3 解 (1)根据频数分布表知,100名学生中一周课外阅读时间不少于12小时的学生共有6+2+2=10(名),所以样本中的学生一周课外阅读时间少于12小时的频率是1-10100=0.9.故从该校随机选取一名学生,估计其该周课外阅读时间少于12小时的概率为0.9. (2)课外阅读时间落在组[4,6)内的有17人,频率为0.17,所以a =频率组距=0.172=0.085.课外阅读时间落在组[8,10)内的有25人,频率为0.25,所以b =频率组距=0.252=0.125.(3)样本中的100名学生该周课外阅读时间的平均数在第4组.跟踪训练3 B [结合频率分布直方图,得分低于60分的人数占总人数的频率为20×(0.005+0.01)=0.30,所以总人数为 150.30=50,故选B.] 当堂训练1.B [样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.] 2.D [列出频率分布表,依次对照就可以找到答案,频率分布表如下:从表中可以看出频率为0.2的是[11.5,13.5],故选D.] 3.30%解析 优秀率为10×(0.022 5+0.005+0.002 5)=0.3=30%. 4.0.09解析 5月份“饮酒驾车”发生的频率等于11+5+2200=0.09.可估计全年“饮酒驾车”发生的频率为0.09.5.解 (1)易得c =1.0.由题意得⎩⎪⎨⎪⎧a =43+b ,0.3+a +0.1+b =1.0,∴a =0.4,b =0.2.(2)根据频率分布表画出频率分布直方图,如图所示.。
2.2.1 用样本的频率分布估计总体的分布1.理解用样本的频率分布估计总体的分布的方法.2.会列频率分布表,画频率分布直方图、频率分布折线图、茎叶图.(重点)3.能够利用频率分布直方图和茎叶图解决实际问题.(难点)[基础·初探]教材整理1 频率分布表及频率分布直方图阅读教材P58~P61,完成下列问题.1.频率分布表、频率分布直方图的编制步骤(1)计算极差(全距);(2)决定组数与组距;(3)决定分点;(4)列频率分布表;(5)绘制频率分布直方图.2.频率分布直方图3.频率分布折线图、总体密度曲线(1)频率分布折线图的定义:把频率分布直方图各个小长方形上边的中点用线段连接起来,就得到频率分布折线图.(2)总体密度曲线:如果样本容量不断增大,分组的组距不断缩小,则频率分布直方图实际上越来越接近于总体的分布,它可以用一条光滑曲线y=f(x)来描绘,这条光滑曲线就叫做总体密度曲线.1.一个容量为80的样本中,数据的最大值为152,最小值为60,组距为10,应将样本数据分为( )A.10组B.9组C.8组D.7组【解析】 由题意可知,152-6010=9.2,故应将数据分为10组.【答案】 A2.从一群学生中抽取一个一定容量的样本,对他们的学习成绩进行分析.已知不超过80分的为10人,其累积频率为0.5,则样本容量是( )A.20B.40C.80D.60【解析】 样本容量=100.5=20.【答案】 A 教材整理2 茎叶图阅读教材P 62~P 63,完成下列问题. 茎叶图1.判断(正确的打“√”,错误的打“×”) (1)样本容量越大,估计的越准确.( ) (2)频率分布直方图的纵轴表示频率.( ) (3)茎叶图不能增加数据.( ) 【答案】 (1)√ (2)× (3)×2.如图221是一个班的语文成绩的茎叶图(单位:分),则优秀率(90分以上)是________,最低分是________.【解析】 由茎叶图知,样本容量为25,90分以上的有1人,故优秀率为125=4%,最低分为51分.【答案】 4% 51[小组合作型]100名考生的数学成绩,数据如下:(单位:分)135 98 102 110 99 121 110 96 100 103 125 97 117 113 110 92 102 109 104 112 105 124 87 131 97 102 123 104 104 128 109 123 111 103 105 92 114 108 104 102 129 126 97 100 115 111 106 117 104 109 111 89 110 121 80 120 121 104 108 118 129 99 90 99 121 123 107 111 91 100 99 101 116 97 102 108 101 95 107 101 102 108 117 99 118 106 119 97 126 108123 119 98 121 101 113 102 103 104 108 (1)列出频率分布表;(2)画出频率分布直方图和折线图;(3)估计该省考生数学成绩在[100,120)分之间的比例.【精彩点拨】 先求极差.根据极差与数据个数确定组距、组数,然后按频率分布直方图的画法绘制图形.【尝试解答】 100个数据中,最大值为135,最小值为80,极差为135-80=55.取组距为5,则组数为555=11.(1)频率分布表如下:布直方图的纵坐标.(2)根据频率分布表中的有关信息画出频率分布直方图及折线图,如图所示:(3)从频率分布表中可知,这100名考生的数学成绩在[100,120)分之间的频率为0.24+0.15+0.12+0.09=0.60,据此估计该省考生数学成绩在[100,120)分之间的比例为60%.(0.60=60%)1.在列频率分布表时,极差、组距、组数有如下关系: (1)若极差组距为整数,则极差组距=组数;(2)若极差组距不为整数,则极差组距的整数部分+1=组数.2.组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,使数据的分布规律能较清楚地呈现出来,组数太多或太少都会影响了解数据的分布情况,若样本容量不超过100,按照数据的多少常分为5~12组,一般样本容量越大,所分组数越多.[再练一题]1.有一容量为200的样本,数据的分组以及各组的频数如下:[-20,-15),7;[-15,-10),11;[-10,-5),15;[-5,0),40;[0,5),49;[5,10),41;[10,15),20;[15,20],17.(1)列出样本的频率分布表;(2)画出频率分布直方图和频率分布折线图;(3)求样本数据不足0的频率.【解】(1)频率分布表如下:(2)(3)样本数据不足0的频率为:0.035+0.055+0.075+0.2=0.365.上交的时间为5月1日到31日,逾期不得参加评比.评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如图222).已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:图222(1)本次活动共有多少件作品参加评比? (2)哪组上交的作品数最多,有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率较高?【导学号:00732053】【精彩点拨】 (1)根据条件:从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,计算参加评比的作品总数;(2)根据频率分布直方图判断哪组上交的作品最多,再由本组的频率计算频数;(3)先分别由第四组和第六组的频率计算该组的频数,再计算获奖率.【尝试解答】 (1)设从左到右各长方形的高分别为2x,3x,4x,6x,4x ,x .设参加评比的作品总数为a 件,依题意得:4x ×5=12a ,x =35a ,满足(2x +3x +4x +6x +4x +x )×5=1. 解得a =60(件).(2)由频率分布直方图可以看出第四组上交的作品数量最多,共有6×x ×5×a =18(件).(3)第四组和第六组上交的作品数分别为:18件,x ×5×a =3(件),则它们的获奖率分别为:1018=59;23,又59<23,所以第六组的获奖率较高.1.频率分布直方图的性质:(1)因为小矩形的面积=组距×频率/组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小;(2)在频率分布直方图中,各小矩形的面积之和等于1; (3)频数/相应的频率=样本容量.2.频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性.[再练一题]2.某工厂对一批产品进行了抽样检测.如图223是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( )图223A.90B.75C.60D.45【解析】 产品净重小于100克的频率为(0.050+0.100)×2=0.300,已知样本中产品净重小于100克的个数是36,设样本容量为n ,则36n=0.300,所以n =120,净重大于或等于98克并且小于104克的产品的个数是120×(0.1+0.15+0.125)×2=90.【答案】 A下:甲:95,81,75,91,86,89,71,65,76,88,94,110,107. 乙:83,86,93,99,88,103,98,114,98,79,78,106,101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.【精彩点拨】 题中可用十位数字为茎,个位数字为叶作茎叶图,然后根据茎叶图分析两人成绩.【尝试解答】 甲、乙两人数学成绩的茎叶图如图所示:从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98;甲同学的得分情况,也大致对称,中位数是88.乙同学的成绩比较稳定,总体情况比甲同学好.1.绘制茎叶图的关键是分清茎和叶,如本题中数据是两位数,十位数字为“茎”,个位数字为“叶”;如果是小数时,通常把整数部分作为“茎”,小数部分作为“叶”,解题时要根据数据的特点合理选择茎和叶.2.利用茎叶图进行数据分析时,一般从数据分布的对称性、中位数、稳定性等几个方面来考虑.[再练一题]3.如图224是2016年青年歌手大奖赛中七位评委为甲、乙两名选手打出的分数的茎叶图(图中m 为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a 1,a 2,则一定有( )图224A.a 1>a 2B.a 2>a 1C.a 1=a 2D.a 1,a 2的大小与m 的值有关【解析】 根据茎叶图可知,去掉一个最高分和一个最低分后,甲的平均分为a 1=80+5+4+5+5+15=84,乙的平均分为a 2=80+4+4+6+4+75=85,故a 2>a 1.【答案】 B[探究共研型]探究1 【提示】 频率分布表和频率分布直方图有以下特征:(1)频率分布表中的数字和频率分布直方图的形状都与分组数有关. 分组数的变化引起频率分布表和频率分布直方图的结构变化.(2)随机性.频率分布表和频率分布直方图由样本决定,因此它们会随着样本的改变而改变.(3)规律性.若固定分组数,随着样本容量的增加,频率分布表中各个频率会稳定在某个值的附近,从而频率分布直方图中的各个矩形的高度也会稳定在特定的值上.探究2 画频率分布直方图时,如何确定组距?【提示】组距的选择应力求“取整”,如果极差不利于分组(如不能被组数整除),可适当增大极差,如在左、右两端各增加适当范围(尽量使两端增加的量相同).探究3 影响频率分布直方图的因素有哪些?【提示】同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同,不同的形状给我们的印象也不同,这种印象有时会影响我们对总体的判断;同一个总体,由于抽样的随机性,如果随机抽取另外一个容量相同的样本,所形成的样本频率分布一般会与前一个的样本频率分布有所不同,但是,它们都可以近似地看作总体的分布.探究4 频率分布表和频率分布直方图有什么优缺点?【提示】(1)频率分布表反映具体数据在各个不同区间的取值频率,但不够直观、形象,对分析数据分布的总体态势不太方便.(2)频率分布直方图能够直观地表明数据分布的形状,一般呈中间高、两端低、左右对称的“峰”状结构.但是从直方图本身得不到具体的数据内容,也就是说,把数据表示成直方图后,原始数据不能在图中表示出来.探究5【提示】不是.绘制茎叶图时,重复出现的数据要重复记录,不能遗漏,特别是“叶”位置的数据.同一数据出现几次,就要在图中体现几次.探究6 什么情况下适合用茎叶图?【提示】(1)对于样本数据较少,但较为集中的一组数据:若数据是两位整数,则将十位数字作茎,个位数字作叶;若数据是三位整数,则将百位、十位数字作茎,个位数字作叶.样本数据为小数时作类似处理.(2)对于样本数据较少,但较为集中的两组数据,关键是找到两组数据共有的茎.中小学生的视力状况受到社会的广泛关注,某市有关部门从全市6万名高一学生中随机抽取了400名,对他们的视力状况进行一次调查统计,将所得到的有关数据绘制成频率分布直方图,如图225所示.从左至右五个小组的频率之比依次是5∶7∶12∶10∶6,则全市高一学生视力在[3.95,4.25)范围内的学生人数约有________.图225【精彩点拨】 1.注重对图形的观察:图表试题解题三个步骤:一观、二识、三解,做到观图要细、识图要全、解图要准.如本例中,要从频率分布直方图中看出组距,求出第五组的频率.2.重视对直方图性质的理解和应用:在频率分布直方图中,小长方形的高=频率组距,小长方形的面积=频率组距×组距=频率.如本例中,0.5×0.3=0.15才是第五个小组的频率.【尝试解答】 由图知,第五小组的频率为0.5×0.3=0.15,所以第一小组的频率为0.15×56=0.125,所以全市6万名高一学生中视力在[3.95,4.25)范围内的学生约有60000×0.125=7 500(人).【答案】 7 500人 [再练一题]4.某公司为了改善职工的出行条件,随机抽取100名职工,调查了他们的居住地与公司间的距离d (单位:km).由其数据绘制的频率分布直方图如图226所示,则样本中职工居住地与公司间的距离不超过4 km 的人数为________.图226【解析】 不超过4 km 的频率为(0.1+0.14)×2=0.48,故样本中职工居住地与公司间的距离不超过4 km 的人数有0.48×100=48(人).【答案】 481.一个容量为20的样本数据,分组及各组的频数如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2,则样本在区间[20,60)上的频率是( )A.0.5B.0.6C.0.7D.0.8【解析】 频率=3+4+5+42+3+4+5+4+2=1620=45=0.8.【答案】 D2.一个容量为32的样本,已知某组样本的频率为0.125,则该组样本的频数为( ) A.2 B.4 C.6D.8【解析】 频率=频数样本容量,则频数=频率×样本容量=0.125×32=4.【答案】 B3.如图227是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为( )图227A.0.2B.0.4C.0.5D.0.6 【解析】 ∵数据总个数n =10, 又落在区间[22,30)内的数据个数为4, ∴所求的频率为410=0.4,故选B.【答案】 B4.将容量为n 的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n 等于________.【导学号:00732054】【解析】 设第一组至第六组的样本数据的频数为2x,3x,4x,6x,4x ,x ,则2x +3x +4x =27,得x =3.故n =20x =60. 【答案】 605.某班50名同学参加数学测验,成绩的分组及各组的频数如下:[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8. (1)列出样本的频率分布表; (2)画出频率分布直方图. 【解】 (1)频率分布表如下:(2)。
2.2.1 用样本的频率分布估计总体的分布
(建议用时:45分钟)
[学业达标]
一、选择题
1.下列命题正确的是( ) A.频率分布直方图中每个小矩形的面积等于相应组的频数 B.频率分布直方图的面积为对应数据的频率 C.频率分布直方图中各小矩形的高(平行于纵轴的边长)表示频率与组距的比
D.用茎叶图统计某运动员得分:13,51,23,8,26,38,16,33,14,28,39时,茎是指中位数26 【解析】 在频率分布直方图中,横轴表示样本数据;纵轴表示频率组距
,由于小矩形的面积=组距×频率组距
=频率,所以各小矩形的面积等于相应各组的频率,因此各小矩形面积之和等于1. 【答案】 C 2.将容量为100的样本数据,按由小到大排列分成8个小组,如下表所示:
( )
A.0.14和0.37
B.114和127
C.0.03和0.06
D.314和637
【解析】 由表可知,第三小组的频率为14100=0.14,累积频率为10+13+14100=0.37. 【答案】 A
3.如图228所示是一容量为100的样本的频率分布直方图,则由图形中的数据可知样本落在[15,20)内的频数为( )
图228
A.20
B.30
C.40
D.50
【解析】样本数据落在[15,20)内的频数为100×[1-5×(0.04+0.1)]=30.
【答案】B
4.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图229所
示),则该样本的中位数、众数、极差分别是( )
图229
A.46,45,56
B.46,45,53
C.47,45,56
D.45,47,53【解析】由题意知各数为12,15,20,22,23,23,31,32,34,34,38,39,45,45,45,47,47,48,48,49,50,50,51,51,54,57,5 9,61,67,68,中位数是46,众数是45,最大数为68,最小数为12,极差为68-12=56.
【答案】A
5.某学校组织学生参加英语测试,成绩的频率分布直方图如图2210,数据的分组依次
为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15人,则该班的学生人数
是( )
【导学号:00732055】
图2210
A.45
B.50
C.55
D.60【解析】根据频率分布直方图的特点可知,低于60分的频率是(0.005+0.01)×20=
0.3,所以该班的学生人数是
15
0.3
=50.
【答案】B
二、填空题
6.200辆汽车通过某一段公路时时速的频率分布直方图如图2211所示,时速在。