高中数学 1.56 用样本估计总体课时作业 北师大版必修3
- 格式:doc
- 大小:433.01 KB
- 文档页数:8
§5 用样本估计总体5.1 估计总体的分布5分钟训练 (预习类训练,可用于课前)1.在用样本频率估计总体分布的过程中,下列说法正确的是( )A.总体容量越大,估计越精确B.总体容量越小,估计越精确C.样本容量越大,估计越精确D.样本容量越小,估计越精确答案:C2.已知样本:10,8,6,10,13,8,10,12,11,7,8,9,11,9,12,9,10,11,12,11.那么频率为0.2的范围为( )A.5.5—7.5B.7.5—9.5C.9.5—11.5D.11.5—13.5答案:D解析:只要列出频率分布表,依次对照就可以找到答案,频率分布表如下:分组 频数 频率5.5—7.5 2 0.17.5—9.5 6 0.39.5—11.5 8 0.411.5—13.5 4 0.2合计 20 1.0从表中可以看出频率为0.2的范围是11.5—13.5.3.(2007山东潍坊一模,理15)某地教育部门为了了解学生在数学答卷中的有关信息,从上次考试的10 000名考生的数学试卷中,用分层抽样的方法抽取500人,并根据这500人的数学成绩画出样本的频率分布直方图(如下图).则这10 000人中数学成绩在[140,150]段的约是___________人.答案:800解析:频率=0.008×10=0.08,∴约有10 000×0.08=800人.10分钟训练 (强化类训练,可用于课中)1.从某批零件中抽出若干个,然后再从中抽出40个进行合格检查,发现合格产品有36个,则该批产品的合格率为( )A.36%B.72%C.90%D.25%答案:C解析:用样本估计总体时,用样本的合格率代替总体的合格率.而样本合格率为4036×100%=90%. 2.观察新生婴儿的体重,其频率分布直方图如下图所示,则新生婴儿体重在(2 700,3 000)的频率为( )A.0.001B.0.1C.0.2D.0.3答案:D解析:由图可知组距频率=0.001,∴频率=0.001×300=0.3. 3.一个容量为20的样本数据,分组后组距与频数如下:(10,20],2;(20,30],3;(30,40],4;(40,50], 5;(50,60],4;(60,70],2.则样本在区间(-∞,50]上的频率是( )A.5%B.25%C.50%D.70%答案:D解析:样本在(-100,50]上的频数为2+3+4+5=14,故在(-100,50]上的频率为14÷20=70%.4.(2007天津高考,文11)从一堆苹果中任取了20只,并得到它们的质量(单位:克)数据分布表如下:分组 [90,100) [100,110) [110,120) [120,130) [130,140) [140,150) 频数1 2 3 10 3 1 则这堆苹果中,质量不小于120克的苹果数约占苹果总数的___________%.答案:70解析:本题主要考查统计知识,质量不小于120克的频数为14,所以频率为2014=70%. 5.一个容量为100的样本,数据的分组和各组的一些相关信息如下:分组 频数频率 [12,15) 6[15,18)0.08 [18,21)[21,24) 21[24,27)0.18 [27,30) 16[30,33)0.10 [33,36) 5合计 1001.00 (1)完成上表中每一行的空格;(2)画出频率分布直方图;(3)根据频率分布直方图,总体中小于21的样本数据大约占多大的百分比?解:(1)补全后的表格为:分组 频数频率 [12,15) 60.06[15,18) 8 0.08[18,21) 16 0.16[21,24) 21 0.21[24,27) 18 0.18[27,30) 16 0.16[30,33) 10 0.10[33,36) 5 0.05合计100 1.00(2)频率分布直方图为:(3)由频率分布直方图中可以看出,总体中小于21的样本数据大约占30%.30分钟训练(巩固类训练,可用于课后)1.在频率分布直方图中,各个小长方形的面积表示()A.落在相应各组的数据的频数B.相应各组的频率C.该样本所分成的组数D.该样本的样本容量答案:B解析:由直方图的概念知:频率分布直方图的纵轴(矩形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的矩形的面积.2.一个容量为35的样本数据,分组后,组距与频数如下:[5,10)5个;[10,15)12个;[15,20)7个;[20,25)5个;[25,30)4个;[30,35)2个.则样本在区间[20,+∞)上的频率为()A.20%B.69%C.31%D.27%答案:C解析:35245++=0.3143,∴选C.3.一个容量为32的样本,已知某组样本的频率为0.125,则该样本的频数为()A.2B.4C.6D.8答案:B4.(2007山东高考,8)某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;……第六组,成绩大于等于18秒且小于等于19秒.下图是按上述分组方法得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y 分别为()A.0.9,35B.0.9,45C.0.1,35D.0.1,45答案:A解析:由直方图知x=0.34+0.36+0.18+0.02=0.9,即x=0.9.50y =0.36+0.34=0.7,∴y=35.故选A. 5.有一个容量为50的样本数据分组,各组的频数如下:[12.5,15.5),3;[15.5,18.5),8;[18.5,21.5),9;[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),6;[30.5,33.5),3.根据频率分布,估计小于30的数据的频率可能是( )A.80%B.95%C.97%D.90%答案:D解析:根据所给数据可知小于30的数据个数为3+8+9+11+10=41,而在[27.5,30.5)之间的为6个,如果[27.5,30.5)之内没有小于30的,则小于30的频率为5041=82%,如果[27.5,30.5)之内的数据全部小于30,则小于30的数据个数为47,频率为5047=94%,所以,估计小于30的数据频率应在82%到94%之间,可以判断可能的频率结果应该为D 项.6.容量为100的样本数据,按从小到大的顺序分为8组,但是记录时不小心把第3组数据和第8组数据的部分信息丢失,记录如下:组号 1 2 3 4 5 6 7 8 频数 10 13 14 15 13 12 频率 0.10 0.13 0.14 0.15 0.13 0.12 0.09 则根据上表可知,第3组的频率是____________,第8组的频数是____________.答案:0.14 9解析:根据第8组的频数0.09可计算出第8组的频数是9,根据总的频率之和为1,可以得出第3组的频率是1-0.10-0.13-0.14-0.15-0.13-0.12-0.09=0.14.7.(2006全国高考卷Ⅱ,16)一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2 500,3 000)(元)月收入段应抽出____________人.答案:25解析:在[2 500,3 000)月收入段应抽出=0005.020004.00003.00002.00001.00005.0⨯++++ ×100=25(人).8.有一容量为200的样本,数据的分组以及各组的频数如下:[-20,-15)7,[-15,-10)11,[-10,-5)15,[-5,0)40,[0,5)49,[5,10)41,[10,15)20,[15,20)17.(1)列出样本的频率分布表;(2)画出频率分布直方图和折线图;(3)求样本数据不足0的频率.解:(1)频率分布表如下:分组 频数 频率[-20,-15) 7 0.035[-15,-10) 11 0.055[-10,-5) 15 0.075[-5,0) 40 0.200[0,5) 49 0.245[5,10) 41 0.205[10,15) 20 0.100[15,20) 17 0.085合计 200 1.000(2)频率分布直方图和折线图如下:(3)样本数据不足0的频率为:0.035+0.055+0.075+0.200=0.365.5.2 估计总体的数字特征5分钟训练 (预习类训练,可用于课前)1.在统计中,样本的标准差可以近似地反映( )A.平均状态B.波动大小C.分布规律D.最大值和最小值答案:B解析:由定义知,数据的标准差反映数据的波动大小.2.下列数字特征一定是数据组中数据的是( )A.众数B.中位数C.标准差D.平均数答案:A解析:根据各数字特征的意义可知唯有众数一定是原数据中的数.3.下列叙述不正确的是( ) A.样本均值可以近似地描述总体的平均水平B.极差描述了一个样本数据变化的幅度C.样本标准差描述了一组样本数据围绕样本均值波动的大小D.一个班级的数学成绩的方差越大说明成绩越稳定答案:D解析:方差越大,说明成绩越不稳定,所以D 项错.4.(2006湖南高考,文12)某高校有甲、乙两个数学建模兴趣班,其中甲班40人,乙班50人,现分析两个班的一次考试成绩,算得甲班的平均成绩是90分,乙班的平均成绩是81分,则该校数学建模兴趣班的平均成绩是___________分.答案:85解析:由题意知,所求平均成绩为:504081509040+⨯+⨯=85分. 10分钟训练 (强化类训练,可用于课中)1.与总体单位不一致的是( )A.s 2B.sC.xD.三个都不一致 答案:A解析:方差的单位是原始数据单位的平方,所以与总体单位不一致.2.有一个数据为50的样本,数据分组以及各组的频数如下,[12.5,15.5),3;[15.5,18.5),8;[18.5,21.5),9;[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),5;[30.5,33.5),4.估计小于30的数据大约占( )A.10%B.92%C.5%D.30%答案:B解析:样本容量为50,小于30的约有:3+8+9+11+10+5=46,所以,频率≈5046=0.92=92%. 3.一组观察值为4、3、5、6出现的次数分别为3、2、4、2,则样本均值为( )A.4.55B.4.5C.12.5D.1.64答案:A解析:1150242326452334=+++⨯+⨯+⨯+⨯=x ≈4.55. 4.设有n 个样本数据x 1、x 2、…、x n ,其标准差为s x ,另有n 个样本数据y 1、y 2、…、y n ,且y k =3x k +5(k=1,2,…,n),其中标准差为s y ,则下列关系正确的是( )A.s y =3s x +5B.s y =3s xC.s y =x s 3D.s y =x s 3+5答案:B解析:设x 1、x 2、…、x n 的平均数为x ,y 1、y 2、y 3、…、y n 的平均数为y ,则y =nn x x x n x x x n y y y n n n 5)(3535353212121++++=++++++=+++ =3x +5∴s y 2=[(3x 1+5-3x -5)2+(3x 2+5-3x -5)2+…+(3x n +5-3x -5)2]÷n =nx x x x x x n ])()()[(922221-++-+- =9s x 2∴s y =3s x .5.在一次数据测量中,计算出18个数据的样本均值为50,但是后来发现其中一个数据是86被误记为68,那么这18个数据的正确的样本均值应该是____________.答案:51解析:根据条件易知,实际18个数据的总和应该是:50×18+(86-68)=918,根据平均数的计算方法可得这组数据实际的均值应该是18918=51. 6.在某次考试中,要对甲、乙两同学的学习成绩进行比较,甲同学的平均分甲x =76,方差2甲s =4,乙同学的平均分乙x =77,方差2乙s =10,则___________同学平均成绩好,___________同学各科发展均衡.答案:乙 甲解析:∵甲乙x x >,s 2甲<s 2乙, ∴乙甲s s <.∴乙同学平均成绩好,甲同学各科发展均衡.7.从一批棉花中抽取9根棉花的纤维,长度如下:(单位:mm)82,202,352,321,25,293,86,206,115.求样本均值、样本方差和样本标准差.解:样本均值91=x (82+202+352+321+25+293+86+206+115)=186.9(mm) 样本方差s 2≈91[(82-186.9)2+(202-186.9)2+…+(115-186.9)2]≈12 184.1. 样本标准差s=2s =110.430分钟训练 (巩固类训练,可用于课后)1.已知样本12、7、11、12、11、12、10、10、9、8、13、12、10、9、6、11、8、9、8、10,那么频率为0.25的样本的范围是( )A.[5.5,7.5)B.[7.5,9.5)C.[9.5,11.5)D.[11.5,13.5)答案:D解析:样本容量为20,发生在[11.5,13.5)的频数为5,∴频率为205=0.25. 2.为了解我国13岁男孩的平均身高,从北方抽取了300个男孩,平均身高1.60 m;从南方抽取了200个男孩,平均身高1.50 m,由此可推断我国13岁男孩的平均身高为( )A.1.54 mB.1.55 mC.1.56 mD.1.57 m答案:C解析:2003005.12006.1300+⨯+⨯=x =1.56. 3.甲、乙两人在相同条件下,各射击10次,命中环数如下:甲:8 6 9 5 10 7 4 8 9 5乙:7 6 7 8 6 9 6 8 7 7根据上述数据估计两人的技术稳定性,结论是( )A.甲优于乙B.乙优于甲C.两人相同D.无法比较答案:B解析:1059847105968+++++++++=甲x =7.1. 107786968767+++++++++=乙x =7.1.又∵s 2乙<s 2甲,乙甲x x =,∴乙优于甲.4.从总体中抽取的样本数据有m 个a ,n 个b ,p 个c ,则总体的平均数μ的估计值为( )A.3c b a ++B.3p n m ++C.3pc nb ma ++ D.p n m pc nb ma ++++ 答案:D解析:样本均值pn m pc nb ma x ++++=,把它作为总体均值的估计. 5.(2006重庆高考,6)为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁—18岁的男生体重(kg),得到频率分布直方图如下图:根据图可得这100名学生中体重在[56.5,64.5)的学生人数是( )A.20B.30C.40D.50答案:C解析:由组距频率×组距=频率,即(0.03+0.05+0.05+0.07)×2=0.4为体重在[56.5,64.5)的频率.又频率=样本容量频数,∴人数为100×0.4=40. 6.两个样本,甲:5,4,3,2,1;乙:4,0,2,1,-2.那么样本甲和样本乙的波动大小情况是( )A.甲、乙的波动大小一样B.甲的波动比乙的波动大C.乙的波动比甲的波动大D.甲、乙的波动大小无法比较答案:C解析:平均数:51=甲x (5+4+3+2+1)=3,51=乙x (4+0+2+1-2)=1, 方差为s 2甲=51[(5-3)2+(4-3)2+…+(1-3)2]=2, s 2乙=51[(4-1)2+(0-1)2+…+(-2-1)2]=4, ∴s 2甲<s 2乙.7.一个样本方差是S 2=101[(x 1-15)2+(x 2-15)2+…+(x 10-15)2],则这个样本均值x =___________,样本容量是___________.答案:15 108.若a 1,a 2,…,a 20这20个数据的平均数为x ,方差为0.20,则a 1,a 2,…,a 20,x 这21个数据的方差约为___________.答案:0.19解析:由题意得:201[(a 1-x )2+(a 2-x )2+…+(a 20-x )2]=0.20, ∴(a 1-x )2+(a 2-x )2+…+(a 20-x )2=4,且a 1+a 2+…+a 20=20x , ∴x x x x a a a =+=++++2120212021 ,即a 1,a 2,…,a 20,x 这21个数据的平均数也是x . ∴这21个数据的方差是s 2=214])(4[2112=-+x x ≈0.19. 9.甲、乙两台机床同时加工直径100毫米的零件,为了检验产品质量,从产品中各随机抽出6件进行测量,测得数据如下(单位:毫米):甲:99,100,98,100,100,103;乙:99,100,102,99,100,100.(1)分别计算上述两组数据的平均数和方差;(2)根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求.解:(1)61100+=甲x (-1+0-2+0+0+3)=100;61100+=乙x (-1+0+2-1+0+0)=100. s 2甲=61[(-1)2+02+(-2)2+02+02+32]=37,s 2乙=61[(-1)2+02+22+(-1)2+02+02]=1. (2)由(1)知,x 甲=x 乙,s 2甲>s 2乙,∴乙机床加工的这种零件更符合要求.10.假定下述数据是甲、乙两个供货商的交货天数.甲:10,9,10,10,11,11,9,11,10,10;乙:8,10,14,7,10,11,10,8,15,12.估计两个供货商的交货情况,并问哪个供货商交货时间短一些,哪个供货商交货时间较具一致性与可靠性. 解:甲x =101(10+9+…+10)=10.1,乙x =101(8+10+…+12)=10.5, s 2甲=101[(10-10.1)2+(9-10.1)2+…+(10-10.1)2]=0.49, s 2乙=101[(8-10.5)2+(10-10.5)2+…+(12-10.5)2]=6.05. 从交货天数的平均值来看,甲供货商的供货天数短一些;从方差来看,甲供货商的交货天数较稳定,因此甲是较具一致性与可靠性的厂商.。
【成才之路】高中数学第1章 5-6用样本估计总体统计活动:结婚年龄的变化课时作业北师大版必修3一、选择题1.用样本频率估计总体分布的过程中,下列说法中正确的是( )A.总体容量越大,估计越精确B.总体容量越小,估计越精确C.样本容量越大,估计越精确D.样本容量越小,估计越精确[答案] C[解析]估计实质上是通过研究总体中样本的性状,来判断总体性状.样本容量越大,就与总体越接近,估计也越精确.故选C.2.下列叙述中正确的是( )A.从频率分布表可以看出样本数据对于平均数的波动大小B.频数是指落在各个小组内的数据C.每小组的频数与样本容量之比是这个小组的频率D.组数是样本平均数除以组距[答案] C[解析]A中表示样本数据对于平均数波动大小的为方差与标准差;B中频数为落在各小组内数据的个数;D中组数是极差除以组距.3.从一堆苹果中任取10只,称得它们的质量如下(单位:克):125 120 122 105 130 114 116 95 120 134则样本数据落在[114.5,124.5)内的频率为( )A.0.2 B.0.3C.0.4 D.0.5[答案] C[解析]数据落在[114.5,124.5)内的有:120,122,116,120,共4个,故所求频率为4 10=0.4,故选C.4.容量为20的样本数据,分组后的频数如下表:A.0.35 B.0.45 C.0.55 D.0.65 [答案] B[解析]本题考查了频数的运算,由表可知样本数据落在[10,40)的频数为2+3+4=9,故频率为920=0.45.求频率要准确确定其频数及该样本的容量.5.对某校400名学生的体重(单位:kg)进行统计,得到如图所示的频率分布直方图,则学生体重在60kg以上的人数为( )A.200 B.100C.40 D.20[答案] B[解析]由频率分布直方图可知学生体重在60kg以上的频率为(0.04+0.01)×5=0.25,故学生体重在60kg以上的人数为400×0.25=100.6.已知样本:10,8,6,10,8,13,11,10,12,7,8,9,11,9,11,12,9,10,11,12.那么频率为0.2的范围是( )A.5.5~7.5 B.7.5~9.5C.9.5~11.5 D.11.5~13.5[答案] D[解析]只要列出频率分布表,就可找到答案,频率分布表如下表.二、填空题7.某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示,则在抽样的100根中,有________根棉花纤维的长度小于20 mm.[答案] 30[解析] 本题主要考查频率分布直方图的应用,从而考查考生的识图与用图能力,同时也考查了考生的数据处理能力和分析解决问题的能力.由题意知,棉花纤维的长度小于20mm 的频率为(0.01+0.01+0.04)×5=0.3,故抽测的100根中,棉花纤维的长度小于20mm 的有0.3×100=30(根).8.将容量为n 的样本中的数据分成6组,绘制成频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n 等于________.[答案] 60[解析] 设第一组至第六组数据的频率分别为2x,3x,4x,6x,4x ,x ,则2x +3x +4x +6x +4x +x =1,解得x =120,所以前三组数据的频率分别是220,320,420,故前三组数据的频数之和等于2n 20+3n 20+4n20=27,解得n =60.三、解答题9.(2015·青岛检测)某幼儿园根据部分同年龄段女童的身高数据绘制了频率分布直方图,其中身高的变化范围是[96,106](单位:厘米),样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].(1)求出x 的值;(2)已知样本中身高小于100厘米的人数是36,求出样本总量N 的数值;(3)根据频率分布直方图提供的数据,求出样本中身高大于或等于98厘米并且小于104厘米的学生数.[分析] 根据频率之和等于1可求出x 的值,同时运用公式频数相应的频率=样本容量,可求出样本容量及相应频数.[解析] (1)由于频率分布直方图以面积的形式反映了数据落在各个小组内的频率大小,且频率之和等于1,∴0.050×2+0.100×2+0.125×2+0.150×2+x ×2=1, ∴x =0.075.(2)样本中身高小于100厘米的频率为 (0.050+0.100)×2=0.3. ∴样本容量N =360.3=120.(3)样本中身高大于或等于98厘米并且小于104厘米的频率为(0.100+0.150+0.125)×2=0.75.∴学生数为120×0.75=90人.10.在某中学举行的信息知识竞赛中,将高二年级两个班的参赛学生成绩(得分均为整数)进行整理后分成五组,绘制出如图所示的频率分布直方图.已知图中从左到右的第一、第三、第四、第五小组的频率分别是0.30、0.15、0.10、0.05,第二小组的频数是40.(1)求第二小组的频率,并补全这个频率分布直方图. (2)求这两个班参赛的学生人数是多少?(3)这两个班参赛学生的成绩的中位数应落在第几小组内?(不必说明理由)[解析] (1)因为各小组的频率之和为1.00,第一、三、四、五小组的频率分别是0.30、0.15、0.10、0.05,所以第二小组的频率为1.00-(0.30+0.15+0.10+0.05)=0.40.因为第二小组的频率为0.40,所以落在59.5~69.5内的第二小组的小长方形的高=频率组距=0.4010=0.04,由此可补全频率分布直方图(如图阴影部分所示).(2)设高二年级两个班参赛的学生人数为x 人,因为第二小组的频数为40,频率为0.40,所以40x=0.40.解得x =100(人).所以高二年级两个班参赛的学生人数为100人.(3)高二年级两个班参赛学生的成绩的中位数应落在第二小组内.一、选择题1.从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为( )A. 3 C .3 D.85[答案] B[解析] ∵x -=20×5+10×4+30×3+30×2+10×1100=100+40+90+60+10100=3,∴s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2]=1100×[20×22+10×12+30×02+30×12+10×22] =160100=85.∴s =2105,故选B.2.在抽查某批产品尺寸的过程中,样本尺寸数据的频率分布表如下,则b 等于( )C .0.25 D.0.3[答案] A[解析] 样本容量n =100.05=200,∴m =20.又20200=a ,∴a =0.1. 则b =1-(0.05+0.15+0.2+0.4+0.1)=0.1. 二、填空题3.某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是________.[答案] 600[解析] 由频率分布直方图易得,成绩低于60分的频率为0.002×10+0.006×10+0.012×10=0.2,故3 000名学生中成绩低于60分的学生数为:3 000×0.2=600(人).4.(2015·湖北文,14)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a =________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________. [答案] 3 6 000[解析] 由频率分布直方图及频率和等于1可得0.2×0.1+0.8×0.1+1.5×0.1+2×0.1+2.5×0.1+a ×0.1=1,解之得a =3.于是消费金额在区间[0.5,0.9]内频率为0.2×0.1+0.8×0.1+2×0.1+3×0.1=0.6,所以消费金额在区间[0.5,0.9]内的购物者的人数为:0.6×10 000=6 000,故应填3;6 000.三、解答题5.“八·一”前夕,某中学举行国防知识竞赛,满分为100分,80分以上为优秀,现将高一的两个班参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30、0.40、0.15、0.10、0.05.求:(1)成绩的众数、中位数. (2)平均成绩.[解析] (1)由众数的概念可知,众数是出现次数最多的数,在直方图中高度最高的小长方形的中间值即为所求,所以众数为65.∵第一个小矩形的面积为0.03×10=0.3, 第二个小矩形的面积为0.04×10=0.4,∴第二个小矩形的中间线对应的成绩65分即为中位数. (2)取每个小矩形底边的中点值乘每个小矩形面积即为平均数. ∴平均数为55×0.3+65×0.4+75×0.15+85×0.10+95×0.05=67. 6.一名射击运动员射击8次所中环数如下: 9.9,10.3,9.8,10.1,10.4,10,9.8,9.7. (1)8次射击平均环数x -是多少?标准差是多少?(2)环数落在x --s 与x -+s 之间有几次?所占百分比是多少? (提示:0.55≈0.742,0.055≈0.235,0.44≈0.663)[解析] (1)x -=10+18(-0.1+0.3-0.2+0.1+0.4+0-0.2-0.3)=10(环),s 2=18[(9.9-10)2+(10.3-10)2+…+(9.7-10)2]=18[0.01+0.09+…+0.09]=18×0.44=0.055(环2),所以s =0.055≈0.235(环).(2)x --s =9.765,x -+s =10.235.所以环数落在x --s 与x -+s 之间的有5次,所占百分比为62.5%.7.(2015·新课标Ⅱ文,18)某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A 地区用户满意度评分的频率分布直方图和B 地区用户满意度评分的频数分布表.A 地区用户满意度评分的频率分布直方图B 地区用户满意度评分的频数分布表(1)分的平均值及分散程度(不要求计算出具体值,给出结论即可);B 地区用户满意度评分的频率分布直方图(2)根据用户满意度评分,将用户的满意度分为三个等级:[解析] (1)通过两地区用户满意度评分的频率分布直方图可以看出,B 地区用户满意度评分的平均值高于A 地区用户满意度评分的平均值,B 地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(2)A地区的用户的满意度等级为不满意的概率大.记C A表示事件“A地区的用户的满意度等级为不满意”;C B表示事件“B地区的用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,P(C B)的估计值为(0.005+0.02)×10=0.25.所以A地区的用户的满意度等级为不满意的概率大.。
5 用样本估计总体[核心必知]1.众数、中位数、平均数 (1)众数的定义:一组数据中重复出现次数最多的数称为这组数的众数,一组数据的众数可以是一个,也可以是多个.(2)中位数的定义及求法:把一组数据按从小到大的顺序排列,把处于最中间位置的那个数(或中间两数的平均数)称为这组数据的中位数.(3)平均数: ①平均数的定义:如果有n 个数x 1、x 2、…、x n ,那么x =x 1+x 2+…+x nn,叫作这n 个数的平均数.②平均数的分类:总体平均数:总体中所有个体的平均数叫总体平均数. 样本平均数:样本中所有个体的平均数叫样本平均数. 2.标准差、方差 (1)标准差的求法:标准差是样本数据到平均数的一种平均距离,一般用s 表示.s =1n[x 1-x2+x 2-x2+…+x n -x2].(2)方差的求法:标准差的平方s 2叫作方差.s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2].其中,x n 是样本数据,n 是样本容量,x 是样本均值. (3)方差的简化计算公式:s 2=1n[(x 21+x 22+…+x 2n )-n x 2]=1n(x 21+x 22+…+x 2n )-x 2.3.极差一组数据的最大值与最小值的差称为这组数据的极差. 4.数字特征的意义平均数、中位数和众数刻画了一组数据的集中趋势,极差、方差刻画了一组数据的离散程度.[问题思考]1.一组数据的众数一定存在吗?假设存在,众数是唯一的吗?提示:不一定.假设一组数据中,每个数据出现的次数一样多,那么认为这组数据没有众数;不是,可以是一个,也可以是多个.2.如何确定一组数据的中位数?提示:(1)当数据个数为奇数时,中位数是按从小到大顺序排列的中间位置的那个数. (2)当数据个数为偶数时,中位数为排列在最中间的两个数的平均值.讲一讲1.据报道,某公司的33名职工的月工资(单位:元)如下:(2)假设副董事长的工资从5 000元提升到20 000元,董事长的工资从5 500元提升到30 000元,那么新的平均数、中位数、众数又是什么?(精确到元)(3)你认为哪个统计量更能反映这个公司员工的工资水平,结合此问题谈一谈你的看法. [尝试解答] (1)平均数是x =1 500+4 000+3 500+2 000×2+1 500+1 000×5+500×3+0×2033≈1 500+591=2 091(元).中位数是1 500元,众数是1 500元.(2)新的平均数是x′=1500+28 500+18 500+2 000×2+1 500+1 000×5+500×3+0×2033≈1 500+1 788=3 288(元).中位数是1 500元,众数是1 500元.(3)在这个问题中,中位数或众数均能反映该公司员工的工资水平,因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司员工的工资水平.1.众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量.2.众数考查各个数据出现的频率,大小只与这组数据中的部分数据有关,当一组数据中有不少数据多次重复出现时,其众数往往更能反映问题.3.中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响,中位数可能在所给的数据中,也可能不在所给的数据中.当一组数据中的个别数据变动较大时,可用中位数描述它的某种集中趋势.练一练1.某公司销售部有销售人员15人,销售部为了制定某种商品的月销售定额,统计了这15人某月的销售量如下:(1)求这15位销售人员该月销售量的平均数、中位数及众数;(2)假设销售部负责人把月销售额定为320件,你认为是否合理,为什么?如不合理,请你制定一个较为合理的销售定额.解:(1)平均数为115(1 800×1+510×1+250×3+210×5+150×3+120×2)=320(件),中位数为210件,众数为210件.(2)不合理,因为15人中有13人的销售量未达到320件,也就是说,虽然320是这一组数据的平均数,但它却不能反映全体销售人员的销售水平.销售额定为210件更合理些,这是由于210既是中位数,又是众数,是大部分人都能达到的定额.讲一讲2.甲、乙两机床同时加工直径为100 cm 的零件,为了检验质量,各从中抽取6件进行测量,分别记录数据为:甲:99 100 98 100 100 103 乙:99 100 102 99 100 100 (1)分别计算两组数据的平均数及方差;(2)根据计算结果判断哪台机床加工零件的质量更稳定. [尝试解答] (1)x 甲=16(99+100+98+100+100+103)=100,x 乙=16(99+100+102+99+100+100)=100,s 2甲=16[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=73,s 2乙=16[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.(2)两台机床所加工零件的直径的平均数相同,又s 2甲>s 2乙,所以乙机床加工零件的质量更稳定.在实际问题中,仅靠平均数不能完全反映问题,还要研究方差,方差描述了数据相对平均数的离散程度,在平均数相同的情况下,方差越大,离散程度越大,数据波动性越大,稳定性就越差;方差越小,数据越集中,质量越稳定.练一练2.对划艇运动员甲、乙两人在相同的条件下进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:甲:27 38 30 37 35 31乙:33 29 38 34 28 36根据以上数据,试估计两人最大速度的平均数和标准差,并判断他们谁更优秀. 解:x 甲=16×(27+38+30+37+35+31)=1986=33,s 2甲=16×[(27-33)2+(38-33)2+(30-33)2+(37-33)2+(35-33)2+(31-33)2]=946, s 甲=946≈3.96, x 乙=16×(33+29+38+34+28+36)=1986=33, s 2乙=16×[(33-33)2+(29-33)2+(38-33)2+(34-33)2+(28-33)2+(36-33)2]=766, s 乙=766≈3.56. 由上知,甲、乙两人最大速度的平均数均为33 m/s ,甲的标准差为3.96 m/s ,乙的标准差为3.56 m/s ,说明甲、乙两人的最大速度的平均值相同,但乙的成绩比甲的成绩更稳定,故乙比甲更优秀.讲一讲3.在一次科技知识竞赛中,两组学生的成绩如下表:已经算得两个组的平均分都是80分.请根据你所学过的统计知识,进一步判断这两个组在这次竞赛中的成绩谁优谁劣,并说明理由.[尝试解答] (1)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数比较看,甲组成绩好些.(2)x 甲=12+5+10+13+14+6(50×2+60×5+70×10+80×13+90×14+100×6)=150×4 000=80(分), x 乙=14+4+16+2+12+12(50×4+60×4+70×16+80×2+90×12+100×12)=150×4 000=80(分).s2甲=12+5+10+13+14+6[2×(50-80)2+5×(60-80)2+10×(70-80)2+13×(80-80)2+14×(90-80)2+6×(100-80)2]=172,s2乙=14+4+16+2+12+12[4×(50-80)2+4×(60-80)2+16×(70-80)2+2×(80-80)2+12×(90-80)2+12×(100-80)2]=256.∵s2甲<s2乙,∴甲组成绩较乙组成绩稳定,故甲组好些.(3)甲、乙两组成绩的中位数、平均数都是80分.其中,甲组成绩在80分以上(包括80分)的有33人,乙组成绩在80分以上(包括80分)的有26人.从这一角度看,甲组的成绩较好.(4)从成绩统计表看,甲组成绩大于等于90分的有20人,乙组成绩大于等于90分的有24人,∴乙组成绩集中在高分段的人数多.同时,乙组得总分值的人数比甲组得总分值的人数多6人.从这一角度看,乙组的成绩较好.要正确处理此类问题,首先要抓住问题中的关键词语,全方位地进行必要的计算、分析,而不能习惯性地仅从样本方差的大小去决定哪一组的成绩好,像这样的实际问题还得从实际的角度去分析,如本讲的“总分值人数〞;其次要在恰当地评估后,组织好正确的语言作出结论.练一练3.甲、乙两人在相同条件下各打靶10次,每次打靶的成绩情况如下图:(1)请填写下表:平均数中位数命中9环以上的次数(含9环)甲7乙(2)从以下三个不同角度对这次测试结果进行分析:①从平均数和中位数相结合看,谁的成绩好些?②从平均数和命中9环及9环以上的次数相结合看,谁的成绩好些? ③从折线图中两人射击命中环数的走势看,谁更有潜力?解:(1)由图可知,甲打靶的成绩为:2,4,6,8,7,7,8,9,9,10;乙打靶的成绩为:9,5,7,8,7,6,8,6,7,7.甲的平均数是7,中位数是7.5,命中9环及9环以上的次数是3; 乙的平均数是7,中位数是7,命中9环及9环以上的次数是1. (2)由(1)知,甲、乙的平均数相同.①甲、乙的平均数相同,甲的中位数比乙的中位数大,所以甲成绩较好. ②甲、乙的平均数相同,甲命中9环及9环以上的次数比乙多,所以甲成绩较好. ③从折线图中看,在后半部分,甲呈上升趋势,而乙呈下降趋势,故甲更有潜力. [解题高手][多解题] 一个球队所有队员的身高如下(单位:cm):178,179,181,182,176,183,176,180,183,175,181,185,180,184,问这个球队的队员平均身高是多少?(精确到1 cm)[解] 法一:利用平均数的公式计算. x -=114×(178+179+181+…+180+184)=114×2 523≈180.法二:建立新数据,再利用平均数简化公式计算. 取a =180,将上面各数据同时减去180,得到一组数据: -2,-1,1,2,-4,3,-4,0,3,-5,1,5,0,4. x -′=114×(-2-1+1+2-4+3-4+0+3-5+1+5+0+4)=114×3=314≈0.2,∴x -=x -′+a =0.2+180≈180. 法三:利用加权平均数公式计算. x -=114×(185×1+184×1+183×2+182×1+181×2+180×2+179×1+178×1+176×2+175×1)=114×2 523≈180.法四:建立新数据〔方法同法二〕,再利用加权平均数公式计算. x -′=114×[5×1+4×1+3×2+2×1+1×2+0×2+(-1)×1+(-2)×1+(-4)×2+(-5)×1]=114×3≈0.2. ∴x -=x -′+a =0.2+180≈180.1.一组数据为20,30,40,50,50,60,70,80,其中平均数,中位数和众数大小关系是( ) A .平均数>中位数>众数 B .平均数<中位数<众数 C .中位数<众数<平均数 D .众数=中位数=平均数解析:选D 可得出这组数据的平均数、中位数和众数均为50.2.样本中共有五个个体,其值分别为a,0,1,2,3.假设该样本的平均数为1,那么样本方差为( )A.65 B.65C. 2 D .2 解析:选D ∵样本的平均数为1,即15×(a +0+1+2+3)=1,∴a =-1,∴样本方差s2=15×[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2. 3.假设某校高一年级8个班参加合唱比赛的得分如茎叶图所示,那么这组数据的中位数和平均数分别是( )A .91.5和91.5B .91.5和92C .91和91.5D .92和92解析:选A 将这组数据从小到大排列,得87,89,90,91,92,93,94,96. 故平均数x =87+89+90+91+92+93+94+968=91.5,中位数为91+922=91.5.4.(某某高考)如图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,那么该运动员在这五场比赛中得分的方差为________.(注:方差s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为x 1,x 2,…,x n 的平均数)解析:该运动员五场比赛中的得分为8,9,10,13,15,平均得分x =8+9+10+13+155=11,方差s 2=15[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=6.8.答案:6.85.甲、乙两人在相同条件下练习射击,每人打5发子弹,命中环数如下:甲 6 8 9 9 8 乙107779那么两人射击成绩的稳定程度是________. 解析:∵x -甲=8,x -乙=8,s 2甲=1.2,s 2乙=1.6,∴s 2甲<s 2乙. ∴甲稳定性强. 答案:甲比乙稳定6.某农科所为寻找高产稳定的油菜品种,选了三个不同的油菜品种进行试验,每一品种在五块试验田试种.每块试验田的面积为0.7公顷,产量情况如下表:品种各试验田产量(kg)12 3 4 5 1 21.5 20.4 22.0 21.2 19.9 2 21.3 23.6 18.9 21.4 19.8 317.823.321.419.120.8解:x 1=21.0 kg ,x 2=21.0 kg ,x 3=20.48 kg ;s 21=0.572,s 22=2.572,s 23=3.5976,∴x 1=x 2>x 3,s 21<s 22<s 23. ∴第一个品种既高产又稳定.一、选择题1.在某项体育比赛中,七位裁判为一选手打出的分数为:90 89 90 95 93 94 93去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )A .92,2B .92,2.8C .93,2D .93,2.8解析:选B 去掉最高分95和最低分89后,剩余数据的平均数为x =90+90+93+94+935=92,方差为s 2=15×[(92-90)2+(92-90)2+(93-92)2+(94-92)2+(93-92)2]=15×(4+4+1+4+1)=2.8.2.一组数据为-3,5,7,x,11,且这组数据的众数为5,那么数据的中位数是( ) A .7 B .5C .6 D .11解析:选B 这组数据的众数为5,那么5出现的次数最多,∴x =5,那么这组数据按从小到大排列为-3,5,5,7,11,那么中位数为5.3.如下图,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为x A 和x B ,样本标准差分别为s A 和s B ,那么( )A.x A >x B ,s A >s BB.x A <x B ,s A >s BC.x A >x B ,s A <s BD.x A <x B ,s A <s B解析:选B A 中的数据都不大于B 中的数据,所以x A <x B ,但A 中的数据比B 中的数据波动幅度大,所以s A >s B .4.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如下图,假设得分值的中位数为m e ,众数为m 0,平均数为x ,那么( )A .m e =m 0=xB .m e =m 0<xC .m e <m 0<xD .m 0<m e <x解析:选D 易知中位数的值m e =5+62=5.5,众数m 0=5,平均数x =130×(3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×2)≈6,所以m 0<m e <x .5.一组数据的平均数是2.8,方差是3.6,假设将这组数据中的每一个数据都加上60,得到一组新数据,那么所得新数据的平均数和方差分别是( )A .57.2 3.6B .57.2 56.4C .62.8 63.6D .62.8 3.6解析:选D 设该组数据为x 1,x 2,…,x n ,那么1n(x 1+x 2+…+x n )=2.8,1n[(x 1-2.8)2+(x 2-2.8)2+…+(x n -2.8)2]=3.6,所以,所得新数据的平均数为1n [(x 1+60)+(x 2+60)+…+(x n +60)]=1n(x 1+x 2+…+x n )+60=2.8+60=62.8.所得新数据的方差为1n[(x 1+60-62.8)2+(x 2+60-62.8)2+…+(x n +60-62.8)2]=1n[(x 1-2.8)2+(x 2-2.8)2+…+(x n -2.8)2]=3.6. 二、填空题6.一个样本按从小到大的顺序排列为10,12,13,x,17,19,21,24,其中位数为16,那么x =________.解析:由中位数的定义知x +172=16,∴x =15.答案:157.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如表所示:学生1号2号3号4号5号甲班 6 7 7 8 7 乙班67679那么以上两组数据的方差中较小的一个为s 2=________. 解析:计算可得两组数据的平均数均为7, 甲班的方差s 2甲=6-72+02+02+8-72+025=25; 乙班的方差s 2乙=6-72+02+6-72+02+9-725=65. 那么两组数据的方差中较小的一个为s 2甲=25.答案:258.(某某高考)某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4 那么(1)平均命中环数为________;(2)命中环数的标准差为________.解析:(1)由公式知,平均数为110(7+8+7+9+5+4+9+10+7+4)=7;(2)由公式知,s 2=110(0+1+0+4+4+9+4+9+0+9)=4⇒s =2.答案:〔1〕7 〔2〕2 三、解答题9.为了了解市民的环保意识,某校高一(1)班50名学生在6月5日(世界环境日)这一天调查了各自家庭丢弃旧塑料袋的情况,有关数据如下表:每户丢弃旧塑料袋个数2 3 4 5 户数6161513(1)求这50户居民每天丢弃旧塑料袋的平均数、众数和中位数; (2)求这50户居民每天丢弃旧塑料袋的标准差.解:(1)平均数x =150×(2×6+3×16+4×15+5×13)=18550=3.7.众数是3,中位数是4.(2)这50户居民每天丢弃旧塑料袋的方差为s2=150×[6×(2-3.7)2+16×(3-3.7)2+15×(4-3.7)2+13×(5-3.7)2]=150×48.5=0.97,所以标准差s≈0.985.10.某校甲班、乙班各有49名学生,两班在一次数学测验中的成绩(总分值100分)统计如下表:(1)请你对下面的一段话给予简要分析:甲了85分,在班里算是上游了!〞(2)请你根据表中数据,对这两个班的测验情况进行简要分析,并提出教学建议.解:(1)由中位数可知,85分排在第25名之后,从名次上讲,85分不算是上游.但也不能单以班的小刚回家对妈妈说:“昨天的数学测验,全班平均79分,得70分的人最多,我得名次来判断学习成绩的好坏,小刚得了85分,说明他对这阶段的学习内容掌握较好.(2)甲班学生成绩的中位数为87分,说明高于或等于87分的学生占一半以上,而平均分为79分,标准差很大,说明低分也多,两极分化严重,建议对学习有困难的同学多给一些帮助;乙班学生成绩的中位数和平均分均为79分,标准差小,说明学生成绩之间差别较小,成绩很差的学生少,但成绩优异的学生也很少,建议采取措施提高优秀率.。
高中数学 1.56 用样本估计总体课时作业北师大版必修3课时目标1.通过实例体会分布的意义和作用,会作频率分布直方图和频率折线图,会用样本的频率分布估计总体的分布.2.会用样本的数字特征估计总体的数字特征.3.体会样本估计总体的思想、初步了解频率分布的随机性.1.频率分布直方图中,数据落在各个区间内频率的大小,是该区间所对应的_______.2.当样本量较大时,样本中落在每个区间内样本数的频率会稳定于______________.3.我们可以用样本平均数和样本标准差,来分别估计______________________.一、选择题1.下列说法不正确的是( )A.频率分布直方图中每个小矩形的高就是该组的频率B.频率分布直方图中各个小矩形的面积之和等于1C.频率分布直方图中各个小矩形的宽一样大D.频率分布折线图是从所加的左边区间的中点开始,用线段依次连接频率分布直方图的每个小矩形上端中点,直至右边所加区间的中点得到的2.一个容量为20的样本数据,分组后组距与频数如下表:组距[10,20)[20,30)[30,40)[40,50)[50,60)[60,70)频数23454 2 则样本在[10,50)上的频率为( )A.0.5 B.0.24 C.0.6 D.0.73.100辆汽车通过某一段公路时的时速的频率分布直方图如下图所示,则时速在[60,70)的汽车大约有( )A.30辆 B.40辆C.60辆 D.80辆4.为了让人们感受丢弃塑料袋对环境造成的影响,某班环保小组的六名同学记录了自己家中一周内丢弃的塑料袋的数量,结果如下(单位:个):33,25,28,26,25,31.如果该班有45名学生,那么根据提供的数据估计本周全班同学各家总共丢弃塑料袋的数量约为( )A.900个 B.1 080个C.1 260个 D.1 800个5.某工厂对一批产品进行了抽样检测.下图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( )A.90 B.75C.60 D.45题号1234 5答案二、填空题6.在样本的频率分布直方图中,共有5个小长方形,已知中间一个小长方形面积是其余4个小长方形面积之和的13,且中间一组的频数为10,则这个样本容量是________.7.某中学举办电脑知识竞赛,满分为100分,80分以上为优秀(含80分).现将高一两个班参赛学生的成绩进行整理后分成5组,绘制成频率分布直方图如下图所示.已知图中从左到右的第一、三、四、五小组的频率分别为0.30、0.15、0.10、0.05,而第二小组的频数是40,则参赛的人数是________,成绩优秀的频率是________.8.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是____________.9.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在各组上的频率为m,该组上直方图的高为h,则|a-b|=________.三、解答题10.美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54, 42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.11.抽查100袋洗衣粉,测得它们的重量如下(单位:g):494 498 493 505 496 492 485 483 508 511495 494 483 485 511 493 505 488 501 491493 509 509 512 484 509 510 495 497 498504 498 483 510 503 497 502 511 497 500493 509 510 493 491 497 515 503 515 518510 514 509 499 493 499 509 492 505 489494 501 509 498 502 500 508 491 509 509499 495 493 509 496 509 505 499 486 491492 496 499 508 485 498 496 495 496 505499 505 496 501 510 496 487 511 501 496(1)列出样本的频率分布表:(2)画出频率分布直方图,频率分布折线图;(3)估计重量在[494.5,506.5]g的频率以及重量不足500 g的频率.能力提升12.在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,你会得到什么结论?13.某市2010年4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成频率分布表.(2)作出频率分布直方图.(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.绘制频率分布直方图的具体步骤:①求极差:找出一组数据中的最大值和最小值,最大值与最小值的差是极差(正值).②确定组距与组数:组数与样本容量有关,当样本容量不超过100时,按照数据的多少,常分成5~12组;组距的选择力求“取整”,组数=极差组距.③将数据分组:将数据分成互不相交的组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间.④列频率分布表:一般分“分组”、“频数累计”、“频数”、“频率”四列,最后一行是合计.注意频数的合计是样本容量,频率的合计是1.⑤绘制频率分布直方图:根据频率分布表绘制频率分布直方图,其中纵轴表示频率与组距的比值,其相应组距上的频率等于该组距上的矩形的面积,即每个矩形的面积=组距×频率组距=频率.这样频率分布直方图就以面积的形式反映了数据落在各个小组的频率的大小,各小矩形的面积的总和等于1.答案 知识梳理1.频率直方图的面积 2.总体在相应区间内取值的概率 3.总体的平均数和标准差 作业设计 1.A 2.D3.B [时速在[60,70)的汽车的频率为:0.04×(70-60)=0.4,又因汽车的总辆数为100,所以时速在[60,70)的汽车大约有0.4×100=40(辆).]4.C [样本的平均数为28,估计总共:45×28=1 260个.]5.A [∵样本中产品净重小于100克的频率为(0.050+0.100)×2=0.3,频数为36,∴样本总数为360.3=120.∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,∴样本中净重大于或等于98克并且小于104克的产品的个数为120×0.75=90.] 6.40解析 可知中间长方形的面积是所有长方形面积的14,即频率为14,∴样本容量为1014=40.7.100 0.15 8.45,46解析 由茎叶图及中位数的概念可知 x 甲中=45,x 乙中=46. 9.m h 解析频率组距=h ,故|a -b|=组距=频率h =mh. 10.解 (1)以4为组距,列表如下:分组 频数累计 频数频率 [41.5,45.5)2 0.045 5 [45.5,49.5)正 7 0.159 1 [49.5,53.5)正 8 0.181 8 [53.5,57.5)正正正 160.363 6 [57.5,61.5)正 5 0.113 6 [61.5,65.5)40.090 9[65.5,69.5]2 0.045 5合计441.00(2)从频率分布表中可以看出,将近60%的美国总统就任时的年龄在50岁至60岁之间,45岁以下以及65岁以上就任的总统所占的比例相对较小.11.解 (1)在样本数据中,最大值是518,最小值是483,它们相差35,若取组距为4,由于354=834,要分9组,组数合适,于是决定取组距为4 g ,分9组,使分点比数据多一位小数,且把第一组起点稍微减小一点,得分组如下:[482.5,486.5),[486.5,490.5),…,[514.5,518.5). 列出频率分布表:分组 个数累计频数频率累积频率[482.5,486.5) 正 8 0.080.08 [486.5,490.5) 3 0.030.11 [490.5,494.5) 正正正170.170.28 [494.5,498.5) 正正正正-21.210.49 [498.5,502.5) 正正 14.140.63 [502.5,506.5) 正 9 0.090.72 [506.5,510.5) 正正正190.190.91 [510.5,514.5) 正- 6 0.060.97 [514.5,518.5]3 0.031.00 合计1001.00(2)频率分布直方图与频率分布折线图如图.(3)重量在[494.5,506.5]g 的频率为:0.21+0.14+0.09=0.44. 设重量不足500 g 的频率为b ,根据频率分布表,b -0.49500-498.5≈0.63-0.48502.5-498.5,故b ≈0.55.因此重量不足500 g 的频率约为0.55.12.解 (1)(2)电脑杂志上每个句子的字数集中在10~30之间;而报纸上每个句子的字数集中在20~40之间.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为科普读物需要通俗易懂、简明.13.解 (1)频率分布表:(2)频率分布直方图如图所示. (3)答对下述两条中的一条即可:①该市有一个月中空气污染指数有2天处于优的水平,占当月天数的115;有26天处于良的水平,占当月天数的1315;处于优或良的天数为28,占当月天数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115;污染指数在80以上的接近轻微污染的天数15,加上处于轻微污染的天数2,占当月天数的1730,超过50%;说明该市空气质量有待进一步改善.。
5 用样本估计总体学习目标 1.学会列频率分布表,会画频率分布直方图.2.会用频率分布表或分布直方图估计总体分布,并作出合理解释.3.在解决问题过程中,进一步体会用样本估计总体的思想,认识统计的实际作用,初步经历收集数据到统计数据的全过程.知识点一总体的分布思考如果把我国初生婴儿的性别作为总体,那么它的分布是指什么?梳理一般地,总体分布是指总体中个体所占的比例.知识点二用频率分布表或频率分布直方图估计总体分布思考1 要做频率分布表,需要对原始数据做哪些工作?思考2 如何决定组数与组距?思考3 同样一组数据,如果组距不同,得到的频率分布直方图也会不同吗?梳理1.频率分布直方图在频率分布直方图中,纵轴表示f iΔx i,数据落在各小组内的频率用频率分布直方图的________来表示,各小长方形的面积的总和等于____.2.频率折线图在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的________开始,用线段依次连接各个矩形的____________,直至右边所加区间的________,就可以得到一条折线,我们称之为频率折线图.3.随着样本容量不断增大,样本中落在每个区间内的样本数的________会越来越稳定于总体在相应区间内取值的________.随着样本量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小.相应的频率折线图就会越来越接近于一条光滑曲线.知识点三总体的数字特征思考如果想知道某一历史时期黄河流域男性平均身高,有可能获得总体数据吗?怎么办?梳理一般地,1.现实中的总体所包含的个体数往往很难获得,总体的平均数与标准差是未知的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.2.在抽样过程中,抽取的样本是具有随机性的,因此样本的数字特征也有随机性.用样本的数字特征估计总体的数字特征,是一种统计思想,没有唯一答案.类型一用频率分布表及频率分布直方图估计总体分布例1 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位:cm).(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计身高小于134 cm的人数占总人数的百分比.反思与感悟频率分布表和频率分布直方图之间的密切关系是显然的,它们只不过是相同的数据的两种不同的表达方式,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚地看到整个样本数据的频率分布情况,并由此估计总体的分布情况.跟踪训练1 为了了解中学生身体发育情况,对某中学17岁的60名女生的身高(单位:cm)进行了测量,结果如下:154 159 166 169 159 156 166 162 158 159156 166 160 164 160 157 151 157 161 162158 153 158 164 158 163 158 153 157 168162 159 154 165 166 157 155 146 151 158160 165 158 163 163 162 161 154 165 161162 159 157 159 149 164 168 159 153 160列出样本的频率分布表;绘出频率分布直方图和频率折线图.类型二估计总体数字特征例2 为了解A,B两种轮胎的性能,某汽车制造厂分别从这两种轮胎中随机抽取了8个进行测试,下面列出了每种轮胎行驶的最远里程数(单位:1 000 km)轮胎A96,112,97,108,100,103,86,98轮胎B108,101,94,105,96,93,97,106(1)分别计算A,B两种轮胎行驶的最远里程的平均数、中位数;(2)分别计算A,B两种轮胎行驶的最远里程的极差、标准差;(3)根据以上数据你认为哪种型号的轮胎性能更加稳定?反思与感悟平均数、中位数、众数、极差、方差等统计量是将多个数据“加工”成一个数据,能更清楚地反映这组数据的某些重要特征,要理解这些统计量表达的信息.跟踪训练2 为迎接5月31日世界无烟日的到来,小华对10名戒烟成功者戒烟前和戒烟5个星期后的体重(单位:kg)作了认真统计,并记录如下表所示:(1)求这10人在戒烟前和戒烟后的体重的平均数;(2)求这10人在戒烟前和戒烟后的体重的方差;(3)通过上述数据,你能得到什么结论?1.用样本频率分布估计总体频率分布的过程中,下列说法正确的是( )A.总体容量越大,估计越精确B.总体容量越小,估计越精确C.样本容量越大,估计越精确D.样本容量越小,估计越精确2.下列说法不正确的是( )A.频率分布直方图中每个小矩形的高就是该组的频率B.频率分布直方图中各个小矩形的面积之和等于1C.频率分布直方图中各个小矩形的宽一样大D.频率分布折线图是从所加的左边区间的中点开始,用线段依次连接频率分布直方图的每个小矩形上端中点,直至右边所加区间的中点得到的3.某校为了了解高三学生的身体状况,抽取了100名女生的体重.将所得的数据整理后,画出了如图的频率分布直方图,则所抽取的女生中体重在40~45 kg的人数是( )A.10 B.2 C.5 D.154.一个容量为20的样本数据,分组后组距与频数如下表:则样本在[10,50)上的频率为( )A.0.5 B.0.24C.0.6 D.0.75.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(2)在这些用户中,用电量落在区间[100,250)内的户数为________.1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律,我们通常用样本的频率分布表或频率分布直方图去估计总体的分布.2.用同样的方法先后从总体中抽取两个大小相同的样本,但两次得到的样本频率分布表、样本频率分布直方图、样本的平均数和标准差仍然可能互不相同,是样本的随机性造成的,是不可避免的.只要抽样的方法比较合理,就能反映总体的信息,当样本量很大时,就比较接近总体的真实情况.答案精析问题导学 知识点一思考 是指男女性别的比例. 知识点二思考1 分组,频数累计,计算频数和频率. 思考2 若极差组距为整数,则极差组距=组数.若极差组距不为整数,则⎣⎢⎡⎦⎥⎤极差组距+1=组数.注意:[x ]表示不大于x 的最大整数.思考3 不同.对于同一组数据分析时,要选好组距和组数,不同的组距与组数对结果有一定的影响. 梳理1.面积 1 2.中点 顶端中点 中点 3.频率 概率 知识点三思考 时代变迁,已经不可能获得所有数据,但可以根据出土的同时期样本数据计算平均身高来估计. 题型探究例1 解 (1)样本频率分布表如下:(2)频率分布直方图如下:(3)由样本频率分布表可知身高小于134 cm 的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm 的人数占总人数的19%.跟踪训练1 解 第一步,求极差:上述60个数据中最大为169,最小为146.故极差为169-146=23(cm).第二步,确定组距和组数,可取组距为3 cm , 则组数为233=723,可将全部数据分为8组.第三步,确定区间界限:[145.5,148.5),[148.5,151.5),[151.5,154.5),[154.5,157.5),[157.5,160.5),[160.5,163.5),[163.5,166.5),[166.5,169.5). 第四步,列频率分布表:第五步,根据上述数据绘制频率分布直方图:第六步,在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线即为频率折线图.例2 解 (1)A 轮胎行驶的最远里程的平均数为 96+112+97+108+100+103+86+988=100,中位数为100+982=99;B 轮胎行驶的最远里程的平均数为108+101+94+105+96+93+97+1068=100,中位数为101+972=99.(2)A 轮胎行驶的最远里程的极差为112-86=26, 标准差为s = -2+122+-2+82+0+32+-2+-28=2212≈7.43;B 轮胎行驶的最远里程的极差为108-93=15,标准差为s = 82+12+-2+52+-2+-2+-2+628=1182≈5.43.(3)由于A 和B 的最远行驶里程的平均数相同,而B 轮胎行驶的最远里程的极差和标准差较小,所以B 轮胎性能更加稳定.跟踪训练2 解 (1)将数据按从小到大的顺序重新排列; 戒烟前:52,52,55,55,60,60,64,67,69,80; 戒烟后:52,54,55,57,58,62,67,68,70,81. 求得x戒烟前=61.4(kg),x戒烟后=62.4(kg).(2)s 2戒烟前=110[(67-61.4)2+(80-61.4)2+…+(60-61.4)2]=70.44,s2戒烟后=110[(70-62.4)2+(81-62.4)2+…+(58-62.4)2]=73.84.(3)从戒烟前后两组数据的统计量知:从平均数看,戒烟后这10人的平均体重增加了1 kg;从方差看,戒烟后数据的波动比戒烟前数据的波动大,说明戒烟对不同的人所发生的变化程度是不同的,通过对这两组数据的统计分析,得出结论:吸烟有害健康,戒烟对身体健康是有益的.当堂训练1.C 2.A 3.A 4.D5.(1)0.004 4 (2)70解析(1)(0.002 4+0.003 6+0.006 0+x+0.002 4+0.001 2)×50=1,∴x=0.004 4.(2)(0.003 6+0.004 4+0.006 0)×50×100=70.。
用样本估计总体同步练习(二)◆知识检测1.从某批零件中抽取若干个,然后再从中抽取40个进行合格检查,发现合格产品有36个,则该批产品的合格率为()A、36%B、72%C、90%D、25%2.从一个养鱼池中捕得m条鱼,做上记号后再放入池中,数日后又捕得n条鱼,其中k条有记号,估计池中有多少条鱼。
3.已知样本:10,8,6,13,8,10,12,11,7,8,9,11,9,12,9,10,11,11,12,那么频率为0.2的范围是()A、5.5-7.5B、7.5-9.5C、9.5-11.5D、11.5-13.54.一个容量为20的样本数据,分组后组距为10,区间与频率分布如下:◆ 能力提高1. 已知样本:10,8,6,10,13,8,10,12,11,7,8,9,12,9,10,11,12,12.那么频率为0.3的范围是( )A .5.5~7.5 B. 7.5~9.5 C.9.5~11.5 D.11.5~13.5 2. 观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿的体重在[2700,3000]的频率为( )A .0.001B .0.01C .0.003D .0.33. 在抽查某产品尺寸的过程中,将尺寸分为若干组,[)b a ,是其中一组,抽查出的个体数在该组上的频率为m ,该组上的直方图的高为h ,则b a -为( )A .hmB .m h C .hmD .与h m ,无关 4. 如右图是高一某班60名学生参加某次数学考试所得的成绩(成绩均为整数)整理后画出的频率分布直方图,则此班成绩的众数为_______,中位数约为_______,优良(120分以上为优良)率为________.5. 灯泡厂从某日生产的一批灯泡中抽取10个进行寿命测试,得灯泡寿命数据(天)如下:30 35 25 25 30 34 26 25 29 21则这批灯泡的平均寿命估计x =______,估计标准差S =________. 6. 某渔场对鱼的重量抽样统计如下表:(1)填写表中的频率.(2)画出频率分布直方图和频率分布折线图.(3)估计鱼的平均体重.(4)若该渔场共打上来6000条鱼,试估计有多少条鱼重量在2.0~3.5斤之间?◆技能培养对50台某种电子设备的寿命逐台进行测试,得到下列数据(单位:h):910,1220,1280,20,2330,900,860,1450,1220,550,160,2020,2590,1730,490, 1620,560,530,500,240,1280,60,190,290,740,1160,220,910,40,1410,3650, 3410,70,510,1270,610,310,220,370,60,1750,890,790,1280,570,760,50,15 30,1860,1280(1)列出样本的频率分布表.(2)画出频率分布直方图和频率分布折线图.(3)估计这批电子设备的平均寿命和寿命小于2000小时的百分比.◆拓展空间在估计总体分布时,我们常常画出样本的频率分布直方图或频率折线图,如果样本容量无限增大,,分组的组距无限减小,那么频率折线图就会无限接近于总体密度曲线,请查阅有关资料,了解总体密度曲线的意义和作用.。
1.5 用样本估计总体教学目标1、知识与技能(1)理解样本标准差的意义和作用,学会计算数据的标准差。
(2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(平均数、标准差),并作合理的解释。
2、过程与方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学思想方法。
3、情感态度价值观通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系。
教学重点、难点教学重点:利用样本估计总体的数字特征。
教学难点: 样本标准差的计算。
教学过程:统计的基本思想就是用样本估计总体,如何能更合理、更直观,这里有两种估计手段:用样本的频率分布估计总体的分布用样本的数字特征(平均数、标准差等)估计总体的数字特征。
下面我们先来看第一种:(一)课题引入1895年,在英国伦敦有106块男性头盖骨被挖掘出土。
经考证,头盖骨的主人死于1665~1666年之间的大瘟疫。
人类学家分别测量了这些头盖骨的宽度,数据如下所示(单位mm):146 141 139 140 145 141 142 131 142 140 144 140 138 139 147 139 141 137 141 132 140 140 141 143 134 146 134 142 133 149 140 140 143 143 149 136 141 143 143 141 138 136 138 144 136 145 143 137 142 146 140 148 140 140 139 139 144 138 146 153 148 152 143 140 141 145 148 139 136 141 140 139 158 135 132 148 142 145 145 121 129 143 148 138 149 146 141 142 144 137 153 148 144 138 150 148 138 145 145 142 143 143 148 141 145 141请大家思考:用什么统计图可以直观表示上述数据的分布状况?你能根据上述估计在1665~1666年之间英国男性头盖骨宽度的分布情况吗?(二)探求新知问题1、我们学习了哪些统计图?不同的统计图适合描述什么样的数据?问题2、这道题目,我们用什么统计图描述比较合适?问题3、如何画频数分布条形图?关键:确定组距和组数组距:把所有数据等距离地分成若干组,每个小组的两个端点之间的距离(组内数据的取值范围)纵坐标表示频数,横坐标表示组距问题4、你能不能画出给定数据的频率分布直方图?基本步骤是什么?1、计算最大值和最小值的差;2、决定组距和组数,通常第一组起点稍微减小一点;组距:把所有数据等距离地分成若干组,每个小组的两个端点之间的距离(组内数据的取值范围)3、列频率分布表对落在各个小组内的数据进行累计,得到各个小组内的数据的个数(叫做频数),再计算出每一组出现的频率,整理可得频率分布表;4、画频率分布直方图纵坐标表示频率与组距的比值,小长方形的面积=组距×=频率。
3编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高中数学第一章统计1.5 用样本估计总体第2课时自我小测北师大版必修3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高中数学第一章统计1.5 用样本估计总体第2课时自我小测北师大版必修3的全部内容。
版必修31.样本4,2,1,0,-2的标准差是().A.1 B.2 C.3 D.42.某商场买来一车苹果,从中随机抽取了10个苹果,其重量(单位:克)分别为150,152,153,149,148,146,151,150,152,147,由此估计这车苹果单个重量的平均值是().A.150。
2克 B.149.8克 C.149。
4克 D.147.8克3.甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如下表:s,s2,s3).1A.s3>s1>s2B.s2>s1>s3 C.s1>s2>s3D.s2>s3>s14.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为x A和错误!B,样本标准差分别为s A和s B,则().A。
错误!A>错误!B,s A>s B B.错误!A<错误!B,s A>s BC。
x A>错误!B,s A<s B D.错误!A<错误!B,s A<s B5.若10个数据的平均数是3,标准差是2,则方差是________;这10个数据的平方和是________.6.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:7.为了了解汽车在某一路段上的速度,交警对这段路上连续驶过的50辆汽车的速度(单位:km/h)进行了统计,得到的数据如下表所示:((2)试估计在这段路上,汽车行驶速度的标准差.8.某学校高一(1)(2)两班各有49名学生,两班在一次数学测验中的成绩统计如下:(1(1)班的小刚回家对妈妈说:“昨天的数学测验,全班平均分79分,得70分的人最多,我得了85分,在班里算是上游了!”(2)请你根据表中的数据,对这两个班的数学测验情况进行简要分析,并提出建议.参考答案1.答案:B2.解析:错误!=错误!=149。
用样本估计总体自主学习1.通过实例体会分布的意义和作用,会作频率分布直方图和频率折线图,会用样本的频率分布估计总体的分布.2.会用样本的数字特征估计总体的数字特征.3.体会样本估计总体的思想、初步了解频率分布的随机性.1.频率分布直方图中,数据落在各个区间内频率的大小,是该区间所对应的____________________.2.当样本量较大时,样本中落在每个区间内样本数的频率会稳定于________________________.3.我们可以用样本平均数和样本标准差,来分别估计________________________.对点讲练画频率分布直方图和频率分布折线图例1某中学同年级40名男生的体重数据如下(单位:千克):61605959595858575757575656565656565655 5555555454545453535252525252515151505049 48列出样本的频率分布表,画出频率分布直方图,画出频率分布折线图.点评(1)组数的决定方法是:设数据总数目为n,一般地,当n≤50时,则分为5~8组;当50≤n≤100时,则分为8~12组较为合适.(2)分点数的决定方法是:若数据为整数,则分点数据减去0.5;若数据是小数点后一位的数,则分点减去0.05,以此类推.(3)画频率分布直方图小长方形高的方法是:假设频数为1的小长方形的高为h,则频数为k的小长方形高为kh.(4)横轴中第一组数据的起始数若较大,开始一段要画成弯曲线,若画成直线就不合适,要保持同轴上长度单位的一致.变式迁移1有一容量为200的样本,数据的分组以及各组的频数如下:[-20,-15),7;[-15,-10),11;[-10,-5),15;[-5,0),40;[0,5),49;[5,10),41;[10,15),20;[15,20),17.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)求样本数据不足0的频率.用样本的频率分布估计总体分布例2对某电子元件进行寿命追踪调查,情况如下:寿命(h)100~200200~300300~400400~500500~600个数2030804030(1)列出频率分布表;(2)画出频率分布直方图及折线图;(3)估计电子元件寿命在400 h 以上的概率.点评(1)频率分布直方图能够很容易地表示大量情况,非常直观地表明分布的情况,使我们能够看到题意中看不清楚的信息和数据模式.(2)频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性,利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性.如果样本容量越大,这种估计也就越准确.变式迁移2为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该校全体高一学生的达标率是多少?估计总体的数字特征例3为迎接5月31日世界无烟日的到来,小华对10名戒烟成功者戒烟前和戒烟5个人员 A B C D E F G H I J戒烟前67806952526055556460戒烟后70816855576254526758(1)求这10人在戒烟前和戒烟后的体重的平均数;(2)求这10人在戒烟前和戒烟后的体重的方差;(3)通过上述数据,你能得到什么结论?变式迁移3为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换,已知某校使用的100只日光灯在必须换掉前的使用天数如下表:天数151~180181~210211~240241~270271~300301~330331~360361~390灯管数111182025167 2(1)试估计这种日光灯的平均使用寿命;(2)若定期更换,可选择多长时间统一更换合适?(1)频率分布直方图中,包含大量数据,我们可以根据样本的分布估计总体.(2)平均数、众数和中位数反映样本数据的集中程度和趋势,方差和标准差刻画样本数据的离散程度.可以灵活选用这些数字特征对总体进行估计.课时作业一、选择题1.关于频率分布直方图中的有关数据,下列说法正确的是()A.小矩形的高表示取某数的频率B.小矩形的高表示该组上的个体在样本中出现的频率C.小矩形的高表示该组上的个体数与组距的比值D.小矩形的高表示该组上个体在样本中出现的频率与组距的比值2.一个容量为20的样本数据,分组后组距与频数如下表:组距[10,20)[20,30)[30,40)[40,50)[50,60)[60,70)频数23454 2则样本在[10,50)上的频率为()A.0.5 B.0.24 C.0.6 D.0.73.某路段检查站监控录像显示,在某时段内,有1 000辆汽车通过该站,现在随机抽取其中的200辆汽车进行车速分析,分析的结果表示为如图的频率分布直方图,则估计在这一时段内通过该站的汽车中速度不小于90 km/h的约有()A.100辆B.200辆C.300辆D.400辆4.为了让人们感受丢弃塑料袋对环境造成的影响,某班环保小组的六名同学记录了自己家中一周内丢弃的塑料袋的数量,结果如下(单位:个):33,25,28,26,25,31.如果该班有45名学生,那么根据提供的数据估计本周全班同学各家总共丢弃塑料袋的数量约为() A.900个B.1 080个C.1 260个D.1 800个题号123 4答案二、填空题5.在样本的频率分布直方图中,共有5个小长方形,已知中间一个小长方形面积是其余4个小长方形面积之和的13,且中间一组的频数为10,则这个样本容量是________.6.某中学举办电脑知识竞赛,满分为100分,80分以上为优秀(含80分).现将高一两个班参赛学生的成绩进行整理后分成5组,绘制成频率分布直方图如图所示.已知图中从左到右的第一、三、四、五小组的频率分别为0.30、0.15、0.10、0.05,而第二小组的频数是40,则参赛的人数是________,成绩优秀的频率是________.7.从甲、乙、丙三个厂家生产的同一种产品中抽取8件产品,对其使用寿命(单位:年)进行追踪调查的结果如下:甲:3,4,5,6,8,8,8,10;乙:4,6,6,6,8,9,12,13;丙:3,3,4,7,9,10,11,12.三个厂家广告中都称该产品的使用寿命是8年,请根据结果判断厂家在广告中分别运用了平均数,众数,中位数中的哪一种集中趋势的特征数.甲:________,乙:________,丙:________.三、解答题8.在生产过程中,测得纤维产品的纤度(表示纤维粗细的一种量)共有100个数据,将数据分组如下表:分组频数频率[1.30,1.34)4[1.34,1.38)25[1.38,1.42)30[1.42,1.46)29[1.46,1.50)10[1.50,1.54)2合计100(1)完成频率分布表,并画出频率分布直方图;(2)估计纤度落在[1.38,1.50)中的频率及纤度小于1.40的频率.9.甲、乙两人在相同条件下各射靶10次,每次射靶的成绩情况如图所示.(1)请填写下表:平均数方差中位数命中9环及9环以上次数极差甲71乙 5.4(2)根据你所学过的统计知识,利用上述某些数据评价甲、乙两人的射击水平.§6用样本估计总体自学导引1.频率直方图的面积2.总体在相应区间内取值的概率3.总体的平均数和标准差对点讲练例1解(1)计算:61-48=13;(2)决定组距与组数,取组距为2,∵13 2=612,∴共分7组;(3)决定分点,使分点比数据多一位小数.并把第1小组的分点减小0.5,即分成如下7组:47.5~49.5,49.5~51.5,51.5~53.5,53.5~55.5,55.5~57.5,57.5~59.5,59.5~61.5.(4)列出频率分布表如下:分组频数累计频数频率47.5~49.520.0549.5~51.550.12551.5~53.570.17553.5~55.580.2055.5~57.511 0.275 57.5~59.5 5 0.125 59.5~61.5 2 0.05 合计40401.00(5)作出频率分布直方图如下:(6)取各小长方形上边的中点并用线段连接就构成了频率分布折线图. 变式迁移1 解 (1)频率分布表如下:分组 频数 频率 累积频率 [-20,-15) 7 0.035 0.035 [-15,-10) 11 0.055 0.090 [-10,-5) 15 0.075 0.165 [-5,0) 40 0.200 0.365 [0,5) 49 0.245 0.610 [5,10) 41 0.205 0.815 [10,15) 20 0.100 0.915 [15,20) 17 0.085 1.00 合计2001.00(2)频率分布直方图如图所示.(3)样本数据不足0的频率为7+11+15+40200=0.365.例2 解 (1)频率分布表如下:寿命(h) 频数 频率 100~200 20 0.10 200~300 30 0.15 300~400 80 0.40 400~500 40 0.20 500~600300.15合计200 1.00(2)频率分布直方图及折线图如下图:(3)由频率分布表可知,寿命在400 h 以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400 h 以上的概率为0.35.变式迁移2 解 (1)由于频率分布直方图以面积的形式反映了数据落在各个小组内的频率大小,因此第二小组的频率为42+4+17+15+9+3=0.08.又因为第二小组频率=第二小组频数样本容量,所以样本容量=第二小组频数第二小组频率=120.08=150.(2)由图可估计该校高一学生的达标率约为 17+15+9+32+4+17+15+9+3×100%=88%.故第二小组的频率是0.08,样本容量是150,高一学生达标率是88%. 例3 解 (1)将数据按从小到大的顺序重新排列; 戒烟前:52,52,55,55,60,60,64,67,69,80; 戒烟后:52,54,55,57,58,62,67,68,70,81. 求得x戒烟前=61.4(kg),x 戒烟后=62.4(kg).(2)s 2戒烟前=70.44,s 2戒烟后=73.84.(3)从戒烟前后两组数据的统计量知:从平均数看戒烟后这10人的平均体重增加了1 kg ;从方差看,戒烟后数据的波动比戒烟前数据波动大,说明戒烟对不同的人所发生的变化程度是不同的,通过对这两组数据的统计分析,得出结论:吸烟有害健康,戒烟对身体健康是有益的.变式迁移3 解 (1)各组中值分别为165,195,225,255,285,315,345,375,由此可算得平均数约为165×1%+195×11%+225×18%+255×20%+285×25%+315×16%+345×7%+375×2%=267.9≈268(天).(2)将组中值对于此平均数求方差: 1100×[1×(165-268)2+11×(195-268)2+18×(225-268)2+20×(255-268)2+25×(285-268)2+16×(315-268)2+7×(345-268)2+2×(375-268)2]=2 128.60(天2)故标准差为 2 128.60≈46(天).答估计这种日光灯的平均使用寿命约为268天,标准差约为46天,故可在222天到314天左右统一更换较合适.课时作业1.D 2.D 3.C4.C5.40解析可知中间长方形的面积是所有长方形面积的14,即频率为14,∴样本容量为1014=40.6.1000.157.众数平均数中位数8.解(1)分组频数频率[1.30,1.34)40.04[1.34,1.38)250.25[1.38,1.42)300.30[1.42,1.46)290.29[1.46,1.50)100.10[1.50,1.54)20.02合计100 1.00(2)纤度落在[1.38,1.50)中的频率约为0.30+0.29+0.10=0.69,纤度小于1.40的频率约为0.04+0.25+12×0.30=0.44.9.解(1)根据图象及表格我们可以依次在表中填写:甲:1.2,7,4;乙:7,7.5,3,8(2)我们可以从以下五个方面制定规则进行分析:①从平均数和方差看(分析谁的成绩稳定些);②从极差和平均数看(分析谁的成绩稳定些);③从平均数和中位数看(分析谁的成绩好些);④从平均数和命中9环及9环以上的次数相结合看(分析谁的成绩好些);⑤从折线图上,两人射击命中环数的走势看(分析谁更有潜力);在规则①下,因为平均数相同,甲的方差小于乙的方差,所以甲的成绩比乙稳定.在规则②下,因为平均数相同,乙的极差比甲大,所以甲的成绩比乙稳定.在规则③下,因为平均数相同,甲的中位数小于乙的中位数,所以乙的成绩比甲好些.在规则④下,由于平均数相同,命中9环及9环以上的次数甲比乙少,所以乙的成绩比甲好些.在规则⑤下,甲成绩的平均数上下波动,而乙处于上升势头,从第4次以后就没有比甲少的情况发生,即乙更有潜力.。
用样本估计总体同步练习1.为了解我国13岁男孩的平均身高,从北方抽取了300个男孩,平均身高1.60m;从南方抽取了200个男孩,平均身高为1.50m,由此可推断我国13岁男孩的平均身高为()A、1.54mB、1.55mC、1.56mD、1.57m2.下列说法正确的是()A、样本中所有个体的总和是总体B、方差的平方根叫做标准美C、样本平均数与总体平均数相等D、在一组数据中,出现次数最多的数据叫做这组数据的众数3.下列说法正确的是()A、在两组数据中,平均值较大的一组方差较大B、平均数反映数据的集中趋势,方差则反映数据离平均值的波动大小C、方差的求法是求出各个数据与平均值的差的平方后再求和D、在记录两个人射击环数的两组数据中,方差大的表示射击水平高4.样本101,98,102,100,99的标准差为()A、2B、0C、1D、210.为了了解中学生的身高情况,对育才中学同龄的50名男学生的身高进行了测量,结果如下:(单位:cm):175 168 180 176 167 181 162 173 171 177171 171 174 173 174 175 177 166 163 160166 166 163 169 174 165 175 165 170 158174 172 166 172 167 172 175 161 173 167170 172 165 157 172 173 166 177 169 181列出样本的频率分布表,画出频率分布直方图。
11.已知50个数据的分组以及各组的频数如下:153.5-155.5 2 161.5-163.5 10155.5-157.5 7 163.5-165.5 6157.5-159.5 9 165.5-167.5 4159.5-161.5 11 167.5-169.5 1 (1)列出频率分布表;(2)列出累积频率分布表;(3)画出频率分布直方图和频率分布折线图;(4)画出累积频率分布图。
§5用样本估计总体§6统计活动:结婚年龄的变化课时目标1.通过实例体会分布的意义和作用,会作频率分布直方图和频率折线图,会用样本的频率分布估计总体的分布.2.会用样本的数字特征估计总体的数字特征.3.体会样本估计总体的思想、初步了解频率分布的随机性.1.频率分布直方图中,数据落在各个区间内频率的大小,是该区间所对应的_______.2.当样本量较大时,样本中落在每个区间内样本数的频率会稳定于______________.3.我们可以用样本平均数和样本标准差,来分别估计______________________.一、选择题1.下列说法不正确的是( )A.频率分布直方图中每个小矩形的高就是该组的频率B.频率分布直方图中各个小矩形的面积之和等于1C.频率分布直方图中各个小矩形的宽一样大D.频率分布折线图是从所加的左边区间的中点开始,用线段依次连接频率分布直方图的每个小矩形上端中点,直至右边所加区间的中点得到的组距[10,20)[20,30)[30,40)[40,50)[50,60)[60,70)频数23454 2A.0.5 B.0.24 C.0.6 D.0.73.100辆汽车通过某一段公路时的时速的频率分布直方图如下图所示,则时速在[60,70)的汽车大约有( )A.30辆 B.40辆C.60辆 D.80辆4.为了让人们感受丢弃塑料袋对环境造成的影响,某班环保小组的六名同学记录了自己家中一周内丢弃的塑料袋的数量,结果如下(单位:个):33,25,28,26,25,31.如果该班有45名学生,那么根据提供的数据估计本周全班同学各家总共丢弃塑料袋的数量约为( )A.900个 B.1 080个C.1 260个 D.1 800个5.某工厂对一批产品进行了抽样检测.下图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( )A.90 B.75题号1234 5答案6.在样本的频率分布直方图中,共有5个小长方形,已知中间一个小长方形面积是其余4个小长方形面积之和的13,且中间一组的频数为10,则这个样本容量是________.7.某中学举办电脑知识竞赛,满分为100分,80分以上为优秀(含80分).现将高一两个班参赛学生的成绩进行整理后分成5组,绘制成频率分布直方图如下图所示.已知图中从左到右的第一、三、四、五小组的频率分别为0.30、0.15、0.10、0.05,而第二小组的频数是40,则参赛的人数是________,成绩优秀的频率是________.8.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是____________.9.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在各组上的频率为m,该组上直方图的高为h,则|a-b|=________.三、解答题10.美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54, 42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.11.抽查100袋洗衣粉,测得它们的重量如下(单位:g):494 498 493 505 496 492 485 483 508 511495 494 483 485 511 493 505 488 501 491493 509 509 512 484 509 510 495 497 498504 498 483 510 503 497 502 511 497 500493 509 510 493 491 497 515 503 515 518510 514 509 499 493 499 509 492 505 489494 501 509 498 502 500 508 491 509 509499 495 493 509 496 509 505 499 486 491492 496 499 508 485 498 496 495 496 505499 505 496 501 510 496 487 511 501 496(1)列出样本的频率分布表:(2)画出频率分布直方图,频率分布折线图;(3)估计重量在[494.5,506.5]g的频率以及重量不足500 g的频率.能力提升12.在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,你会得到什么结论?13.某市2010年4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成频率分布表.(2)作出频率分布直方图.(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.绘制频率分布直方图的具体步骤:①求极差:找出一组数据中的最大值和最小值,最大值与最小值的差是极差(正值).②确定组距与组数:组数与样本容量有关,当样本容量答案 知识梳理1.频率直方图的面积 2.总体在相应区间内取值的概率 3.总体的平均数和标准差 作业设计 1.A 2.D3.B [时速在[60,70)的汽车的频率为:0.04×(70-60)=0.4,又因汽车的总辆数为100,所以时速在[60,70)的汽车大约有0.4×100=40(辆).]4.C [样本的平均数为28,估计总共:45×28=1 260个.]5.A [∵样本中产品净重小于100克的频率为(0.050+0.100)×2=0.3,频数为36,∴样本总数为360.3=120.∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,∴样本中净重大于或等于98克并且小于104克的产品的个数为120×0.75=90.] 6.40解析 可知中间长方形的面积是所有长方形面积的14,即频率为14,∴样本容量为1014=40.7.100 0.15 8.45,46解析 由茎叶图及中位数的概念可知 x 甲中=45,x 乙中=46. 9.m h 解析频率组距=h ,故|a -b|=组距=频率h =mh. 10.解分组 频数累计 频数频率 [41.5,45.5)2 0.045 5 [45.5,49.5)正 7 0.159 1 [49.5,53.5)正 8 0.181 8 [53.5,57.5)正正正 160.363 6 [57.5,61.5)正 5 0.113 6 [61.5,65.5)40.090 9[65.5,69.5]2 0.045 5合计441.00(2)从频率分布表中可以看出,将近60%的美国总统就任时的年龄在50岁至60岁之间,45岁以下以及65岁以上就任的总统所占的比例相对较小.11.解 (1)在样本数据中,最大值是518,最小值是483,它们相差35,若取组距为4,由于354=834,要分9组,组数合适,于是决定取组距为4 g ,分9组,使分点比数据多一位小数,且把第一组起点稍微减小一点,得分组如下:[482.5,486.5),[486.5,490.5),…,[514.5,518.5). 列出频率分布表:分组 个数累计频数频率累积频率[482.5,48 6.5) 正 8 0.080.08 [486.5,490.5) 3 0.030.11 [490.5,49 4.5) 正正正170.170.28 [494.5,498.5) 正正正正-21.210.49 [498.5,50 2.5) 正正 14.140.63 [502.5,50 6.5) 正 9 0.090.72 [506.5,510.5) 正正正190.190.91 [510.5,514.5) 正- 6 0.060.97 [514.5,518.5]3 0.031.00 合计1001.00(2)频率分布直方图与频率分布折线图如图.(3)重量在[494.5,506.5]g 的频率为:0.21+0.14+0.09=0.44. 设重量不足500 g 的频率为b ,根据频率分布表,b -0.49500-498.5≈0.63-0.48502.5-498.5,故b ≈0.55.因此重量不足500 g 的频率约为0.55.12.解 (1)(2)电脑杂志上每个句子的字数集中在10~30之间;而报纸上每个句子的字数集中在20~40之间.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为科普读物需要通俗易懂、简明.13.解 (1)频率分布表:(2)频率分布直方图如图所示. (3)答对下述两条中的一条即可:①该市有一个月中空气污染指数有2天处于优的水平,占当月天数的115;有26天处于良的水平,占当月天数的1315;处于优或良的天数为28,占当月天数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115;污染指数在80以上的接近轻微污染的天数15,加上处于轻微污染的天数2,占当月天数的1730,超过50%;说明该市空气质量有待进一步改善.。