2015-2016学年高中数学 1.5.1 估计总体的分布课件 北师大版必修3
- 格式:ppt
- 大小:1.70 MB
- 文档页数:32
第一章统计5.1 估计总体的分布一用样本的频率分布估计1.频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.2.频数分布直方图是以频数为纵坐标,数据观测值为横坐标,以组距为底边,落入组入的数据频数同为高,画出一系列矩形,这样得到的图形为频数直方图,简称直方图.3.频率分布直方图是利用直方图反映样本的频率分布规律,它比频率分布表更直观地反映样本的分布规律,简称频率直方图.4.连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.例1 为了了解中年人在科技队伍中的比例,对某科研单位全体科技人员的年龄进行登记,结果如下(单位:岁)44,40,31,38,43,45,56,45,46,42,55,41,44,46,52,39,46,47,36,50,47,54,50,39,30,48,48,52,39,46,44,41,49,53,64,49,49,61,48,47,59,55,51,67,60,56,65,59,45,28.列出样本的频率分布表,绘出频率分布直方图.解: (1)求数据最大值和最小值:已知数据的最大值是67,最小值是28∴最大值与最小值之差为67-28=39(2)求组距与组数:组距为5(岁),分为8组.(3)决定分点.(4)列频分布表:(5)绘频率分布直方图如图所示:例2分组频数累计频数频率[150.5,153.5) 4 4 0.04[153.5,156.5)12 8 0.08[156.5,159.5)20 8 0.08[159.5,162.5)31 11 0.11[162.5,165.5)53 22 0.22[165.5,168.5)72 19 0.19[168.5,171.5)86 14 0.14[171.5,174.5)93 7 0.07[174.5,177.5)97 4 0.04[177.5,180.5]100 3 0.03 合计100 1 (1)根据数据画出频率分布直方图;(2)画出频率分布折线图.解:(1)频率分布直方图如图所示:(2)频率折线图如图所示:例3下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高区间界限[122,126)[126,130)[130,134)[134,138)[138,142)[142,146)人数5810223320区间界限[146,150)[150,154)[154,158)人数1165(1)列出样本频率分布表﹔(2)一画出频率分布直方图;(3)估计身高小于134cm的人数占总人数的百分比..规范解:(1)样本频率分布表如下:(2)其频率分布直方图如图所示:(3)由样本频率分布表可知身高小于134cm 的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm 的人数占总人数的19%.例4(2006年全国II 卷)一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如图1—6—10).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2500,3000)(元)月收入段应抽出 人.图1—6—10解:由直方图可得[2500,3000)(元)月收入段共有2500)]25003000(0005.0[10000=-⨯⨯,则在这段人中按分层抽样应抽出25100001002500=⨯人.练习1. 频率分布直方图的重心是( )A .众数B .中位数C .标准差D .平均数2.(2007年天津文13)(11)从一堆苹果中任取了20只,并得到它们的质量(单位:克)分组 [)90100, [)100110, [)110120, [)120130, [)130140, [)140150, 频数123101则这堆苹果中,质量不小于...120克的苹果数约占苹果总数的 %.3.在举国上下众志成城抗击“非典”的斗争中,疫情变化牵动着全国人民的心.请根据下面的疫情统计图表1—6—11回答问题.图1—6—11(1)图1—6—11是5月11日至5月29日全国疫情每天新增数据统计走势图,观察后回答:①每天新增确诊病例与新增疑似病例人数之和超过100人的天数共有__________天; ②在本题的统计中,新增确诊病例的人数的中位数是___________;③本题在对新增确诊病例的统计中,样本是_____________,样本容量是__________. (2)下表是我国一段时间内全国确诊病例每天新增的人数与天数的频率统计表.(按人数分组)分组 0~9 10~19 20~29 30~39 40~49 50~59 频数 4 5 1 0 2 频率 0.275 0.1 0.025 0 0.05 分组 60~69 70~79 80~89 90~99 100以上 合计 频数 1 1 2 0 13 频率0.0250.0251.00①100人以下的分组组距是________; ②填写本统计表中未完成的空格;③在统计的这段时期中,每天新增确诊病例人数在80人以下的天数共有_________天.4.某校抽检64名学生的体重如下(单位:千克).列出样本的频率分布表,绘出频率分布直方图.5.为了了解一大片经济林生长情况,随机测量其中的100株的底部周长,得到如下数据表(单位:cm)135 98 102 110 99 121 110 96 100 103125 97 117 113 110 92 102 109 104 112109 124 87 131 97 102 123 104 104 128105 123 111 103 105 92 114 108 104 102129 126 97 100 115 111 106 117 104 109111 89 110 121 80 120 121 104 108 118129 99 90 99 121 123 107 111 91 10099 101 116 97 102 108 101 95 107 101102 108 117 99 118 106 119 97 126 108123 119 98 121 101 113 102 103 104 108(1(2)绘制频率分布直方图;(3)估计该片经济林中底部周长小于100cm的树木约占多少,周长不小于120cm的树木约占多少.。
§5 用样本估计总体 5.1 估计总体的分布学习 目标1.理解什么是频率分布表、频率分布直方图、频率折线图.(数学抽象)2.会列频率分布表,会画频率分布直方图和频率折线图,能根据频率分布直方图解决问题.(数据分析、直观想象)3.了解用样本估计总体的意义.(数学抽象)导思 1.频率分布直方图纵轴的含义是什么?2.频率分布直方图的制作步骤是什么?3.如何画频率折线图?1.频率分布表和频率分布直方图 (1)频率分布表编制的方法步骤:(2)频率分布表与频率分布直方图有什么不同?提示:频率分布表能使我们清楚地知道数据分布在各个小组的个数,而频率分布直方图则是从各个小组数据在样本容量中所占比例大小的角度来表示数据分布的规律.2.频率折线图(1)在频率分布直方图中,按照分组原则,在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.(2)当样本容量不断增大时,样本中落在每个区间内的样本数的频率会越来越稳定于总体在相应区间内取值的概率.也就是说,一般地,样本容量越大,用样本的频率分布去估计总体的分布就越精确.(3)随着样本量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越来越接近于一条光滑曲线.频率分布表、频率分布直方图与频率折线图各有什么优缺点?提示:①频率分布表:优点:频率分布表在数量表示上比较确切;缺点:不够直观、形象,分析数据分布的总体趋势不太方便;②频率分布直方图:优点:频率分布直方图能非常直观地表明数据分布的形状,使我们能够看到在分布表中看不清楚的数据模式;缺点:从直方图本身得不出原始的数据内容,也就是说,把数据表示成直方图后,原有的具体数据信息就被抹掉了;③频率折线图:优点是它反映了数据的变化趋势.缺点:由图本身得不到原始的数据信息.1.辨析记忆(对的打“√”,错的打“×”)(1)频率分布直方图中的纵坐标指的是频率的值.()(2)频率分布直方图的宽度没有实际意义.()(3)频率分布直方图中各小矩形的面积之和可以不为1.()(4)在画频率折线图时,可以画成与横轴相连.()提示:(1)×.纵坐标指的是频率与组距的比值.(2) ×.频率分布直方图的宽度表示组距.(3)×.各小矩形的面积之和一定为1.(4) √.为了方便看图,一般习惯把频率折线图画成与横轴相连,所以横轴上左右两端点没有实际的意义.2.已知一个容量为40的样本,把它分成6组,第一组到第四组的频数分别为5,6,7,10,第五组的频率是0.2,那么第六组的频数是________,频率是________. 【解析】第五组的频数为0.2×40=8.所以第六组的频数为40-5-6-7-10-8=4.频率为440=0.1.答案:40.13.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,时速在[50,60)内的汽车有________.【解析】因为小长方形的面积即为对应的频率,时速在[50,60)内的频率为0.3,所以有200×0.3=60(辆).答案:60辆4.(教材例题改编)一个容量为n的样本,分成若干组,已知某组的频数和频率分别为50和0.25,则n=________.【解析】由题意得50n=0.25,所以n=200.答案:200类型一频率分布直方图的绘制(数据分析、直观想象)【典例】1.频率分布直方图中,小矩形的面积等于()A.组距B.频率C.组数D.频数2.调查某校高一年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)如下:171 163 163 166 166 168 168 160 168 165 171 169 167 169 151 168 170 168 160 174 165 168 174 159 167 156 157 164 169 180 176 157 162 161 158 164 163 163 167 161(1)作出频率分布表;(2)画出频率分布直方图.【思路导引】1.根据频率直方图中小矩形的几何意义,即可求解. 2.极差=180-151=29,组距为3,可分为10组.【解析】1.选B.根据小矩形的宽及高的意义,可知小矩形的面积为一组样本数据的频率.2.(1)①求极差:从数据中可看出,最大值是180,最小值是151,故极差为180-151=29.②确定组距与组数:取3为组距,则极差组距 =293 =923 ,故可将样本数据分成10组.③第一组起点定为150.5,组距为3,这样分出10组:[150.5,153.5),[153.5,156.5),[156.5,159.5),[159.5,162.5),[162.5,165.5),[165.5,168.5),[168.5,171.5),[171.5,174.5),[174.5,177.5),[177.5,180.5]. ④列频率分布表174.5~177.510.025177.5~180.510.025(2)画频率分布直方图如图所示:绘制频率分布直方图的注意事项(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照.(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多.(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点.(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个数.(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率.1.有一个容量为45的样本数据,分组后各组的频数如下:(12.5,15.5],3;(15.5,18.5],8;(18.5,21.5],9;(21.5,24.5],11;(24.5,27.5],10;(27.5,30.5],4.由此估计,不大于27.5的数据约为总体的()A.91% B.92% C.95% D.30%【解析】选A.不大于27.5的样本数为:3+8+9+11+10=41,所以约占总体百分比为4145×100%≈91%.2.某中学同年级40名男生的体重数据如下(单位:千克):616059595958585757575756 565656565656555555555454 54545353525252525251515150504948列出样本的频率分布表,画出频率分布直方图. 【解析】①计算极差:61-48=13(千克); ②决定组距与组数,取组距为2,因为132 =612 ,所以共分7组;③决定分点,使分点比数据多一位小数.并把第1小组的分点减小0.5,即分成如下7组:47.5~49.5,49.5~51.5,51.5~53.5,53.5~55.5,55.5~57.5,57.5~59.5,59.5~61.5.④列出频率分布表如下:分组(Δx i ) 频数(n i ) 频率(f i ) 47.5~49.5 2 0.05 49.5~51.5 5 0.125 51.5~53.5 7 0.175 53.5~55.5 8 0.20 55.5~57.5 11 0.275 57.5~59.5 5 0.125 59.5~61.5 2 0.05 合计401.00⑤作出频率分布直方图如下:3.某花木公司为了调查某种树苗的生长情况,抽取了一个容量为100的样本,测得树苗的高度(cm)数据的分组及相应频数如下:107~109,3株;109~111,9株;111~113,13株;113~115,16株;115~117,26株;117~119,20株;119~121,7株;121~123,4株;123~125,2株.(1)列出频率分布表;(2)画出频率分布直方图;(3)据上述图表,估计数据在109~121范围内的可能性是百分之几.【解析】(1)频率分布表如下:分组频数频率累积频率107~10930.030.03109~11190.090.12111~113130.130.25113~115160.160.41115~117260.260.67117~119200.200.87119~12170.070.94121~12340.040.98123~12520.02 1.00合计100 1.00(2)频率分布直方图如下:(3)由上述图表可知数据落在109~121范围内的频率为:0.94-0.03=0.91,即数据落在109~121范围内的可能性是91%.类型二频率折线图的画法及应用【典例】从高三学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下(单位:分):40~50,2;50~60,3;60~70,10;70~80,15;80~90,12;90~100,8.(1)列出样本的频率分布表;(2)画出频率分布直方图及频率折线图; (3)估计成绩在60~90分的学生比例.【思路导引】画频率分布直方图和折线图⇒制作好频率分布表⇒纵坐标表示频率与组距的比值.【解析】(1)样本的频率分布表如下:成绩分组(Δx i ) 频数(n i ) 频率(f i ) f i Δx i 40~50 2 0.04 0.004 50~60 3 0.06 0.006 60~70 10 0.2 0.02 70~80 15 0.3 0.03 80~90 12 0.24 0.024 90~10080.160.016(2)频率分布直方图及频率折线图如图所示:(3)成绩在60~90的频率为1-0.04-0.06-0.16=0.74, 所以可估计成绩在60~90分的学生比例为74%.本例条件不变,估计成绩在50~80分的学生的比例.【解析】成绩在50~60分的学生的频数为3,在60~70的学生的频数为10,在70~80分的学生的频数为15,所以成绩在50~80分的学生的频数为28,占总体的2850 =1425 .频率折线图的作法及应用(1)作法:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)应用:频率折线图也是用一个单位长度表示一定的数量,但是,它是根据数量的多少在图中描出各个点,然后把各个点用线段顺次连接成的折线,因此,它不但可以表现出数量的多少,而且能够以折线的起伏,清楚而直观地表示出数量的增减变化的情况.提醒:画图时,横轴和纵轴的单位可不一致.有一个容量为100的某校毕业生起始月薪的样本,数据的分组及各组的频数如下:起始月薪(百元)[13,14)[14,15)[15,16)[16,17) 频数7112623起始月薪(百元)[17,18)[18,19)[19,20)[20,21]频数1584 6(1)列出样本的频率分布表;(2)画出频率分布直方图和频率折线图;(3)根据频率分布估计该校毕业生起始月薪低于2 000元的频率.【解析】(1)样本的频率分布表为起始月薪(百元)频数频率[13,14)70.07[14,15)110.11[15,16)260.26[16,17)230.23[17,18)150.15[18,19)80.08[19,20)40.04[20,21]60.06总计100 1.00(2)频率分布直方图和频率折线图如图.(3)起始月薪低于2 000元的频率为0.07+0.11+…+0.04=0.94,故起始月薪低于2 000元的频率的估计值是0.94.【补偿训练】某学校随机抽取部分新生调查其上学路上所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图),其中,上学路上所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80), [80,100].(1)求直方图中x的值;(2)如果上学路上所需时间不少于40分钟的学生可申请在学校住宿,请估计学校1 000名新生中有多少名学生可以申请住宿.【解析】(1)由(x+0.012 5+0.006 5+0.003×2)×20=1,解得x=0.025.(2)上学所需时间不少于40分钟的学生的频率为:(0.006 5+0.003×2)×20=0.25,估计学校1 000名新生中有1 000×0.25=250名学生可以申请住宿.答:估计学校1 000名新生中有250名学生可以申请住宿.类型三用样本分布估计总体分布【典例】1.(2021·全国甲卷)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间2.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少;(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.【思路导引】1.利用频率分布直方图,计算出低于60分的人数的频率p,利用频数除以相应的频率p 得总人数.2.利用110次以上(含110次)的矩形面积除以所有的矩形面积之和,即可估计高一学生的达标率.【解析】1.选C. 低于4.5万元的比率估计为0.02×1+0.04×1=0.06=6%,故A 正确;不低于10.5万元的比率估计为(0.04+0.02×3)×1=0.1=10%,故B 正确;平均值为:(3×0.02+4×0.04+5×0.1+6×0.14+7×0.2+8×0.2+9×0.1+10×0.1+11×0.04+12×0.02+13×0.02+14×0.02)×1=7.68万元,故C 不正确;4.5万元到8.5万元的比率为:0.1×1+0.14×1+0.2×1+0.2×1=0.64=64%,故D 正确.2.(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此,第二小组的频率为:42+4+17+15+9+3=0.08. 又因为第二小组频率=第二小组频数样本容量, 所以样本容量=第二小组频数第二小组频率=120.08 =150. (2)由图可估计该学校高一学生的达标率约为17+15+9+32+4+17+15+9+3×100%=88%. (3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.用样本估计总体的常用方法(1)用频率分布表估计总体分布.根据样本数据可以制作频率分布表,利用频率分布表中的数据,如各小组的频数、频率,可以对总体中的有关量进行估计.(2)用频率分布直方图估计总体分布.根据样本数据绘制出的频率分布直方图具有直观的特点,可以直接判断出样本中数据的分布特点和变化趋势与规律,并由此对总体进行估计.(3)用频率折线图估计总体分布.由样本频率分布直方图可以绘制出频率折线图,且样本容量越大,分组的组距不断缩小,那么折线图就越接近于总体分布,从而由频率折线图对总体估计就越精确.某幼儿园根据部分同年龄段女童的身高数据绘制了频率分布直方图,其中身高的变化范围是[96,106](单位:厘米),样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].(1)求出x 的值;(2)已知样本中身高小于100厘米的人数是36,求出样本容量N 的数值;(3)根据频率分布直方图提供的数据,求出样本中身高大于或等于98厘米并且小于104厘米的学生数.【解析】(1)由题意可知:(0.050+0.100+0.150+0.125+x )×2=1,解得:x =0.075.(2)设样本中身高小于100厘米的频率为p 1,所以,p 1=(0.050+0.100)×2=0.30,而p 1=36N ,所以N =36p 1=360.30 =120. (3)样本中身高大于或等于98厘米并且小于104厘米的频率为p 2=(0.100+0.150+0.125)×2=0.75,所以身高大于或等于98厘米并且小于104厘米的学生数n =p 2N =120×0.75=90.。
用样本的频率分布直方图估计总体分布的过程与步骤一.频率分布的概念是指一个样本数据在各个小范围内所占比例的大小.可以用样本的频率分布估计总体的频率分布.二. 编制频率分布表的步骤1.频率分布表:我们把反映总体频率分布的表格称为频率分布表。
2.编制频率分布表的步骤如下:⑴找到最大最小值,求全距;决定组数,算得组距;⑵分组通常对组内数值所在区间取左闭又开区间,最后一组取闭区间;⑶登记频数,计算频率,列出频率分布表.【注意】:在决定组数以后有可能要适当的调整全距,既如果全距不利于分组(如不能被组数整除),可适当增加全距,(只能加不能减)如在左右两端各增加适当的范围(尽量使两端增加量相同).例1.从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高的样本,数据如下(单位:cm)。
试作出该样本的频率分布表.解:最大值=180,最小值=151,他们相差29,决定分为10组,则需将全距调整为30,组距为3,既每个小区间的长度为3,组距=全距/组数.可取区间[150.5,180.5]三. 作频率分布直方图的步骤我们先以上面的例1举例说明:例2.作出例1中数据的频率分布直方图.解:(1)先制作频率分布表,然后做直角坐标系,以横轴表示身高,纵轴表示频率/组距.(2)在横轴上标上150.5,153.5‥‥‥180.5表示的点(为方便起见,起始点150.5可适当前移).(3)在上面标出的各点中,分别以连接相邻两点的线段为底作矩形,高等于该组的频率/组距.1. 作频率分布直方图的步骤:把横轴分成若干段,每一线段对应一个组的组距,然后以此线段为底作一矩形,它的高等于该组的频率/组距,这样得到一系列的矩形.2.几何意义:每个矩形的面积恰好是该组上的频率.3.频率直方图的优点:更直观,形象地反映了样本的分布规律,如在164附近达到峰值。
(一般取最高矩形的中点).四.例题精析例3.下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm)(1)列出样本频率分布表﹔(2)一画出频率分布直方图;(3)估计身高小于134cm的人数占总人数的百分比.分析:根据样本频率分布表、频率分布直方图的一般步骤解题.解:(1)样本频率分布表如下:(2)其频率分布直方图如下:(3)由样本频率分布表可知身高小于134cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm的人数占总人数的19%.例4.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.第二小组的频率是多少?样本容量是多少?若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由。