高中数学课时分层作业6总体分布的估计(含解析)苏教版必修3
- 格式:doc
- 大小:285.50 KB
- 文档页数:6
2016-2017学年高中数学学业分层测评6 苏教版必修3编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2016-2017学年高中数学学业分层测评6 苏教版必修3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2016-2017学年高中数学学业分层测评6 苏教版必修3的全部内容。
学业分层测评(六)(建议用时:45分钟)[学业达标]一、填空题1。
下列伪代码的条件语句中,判断的条件是________.【解析】由伪代码知判断的条件为“x>0”,故填x>0.【答案】x>02.根据如图所示的伪代码,当输入a,b分别为2,3时,最后输出的m的值为________.【解析】此题伪代码的含义是输出两数的较大者,所以m=3.【答案】33.为了在执行下面的伪代码之后输出y=25,输入的x应该是________。
【解析】伪代码对应的函数是y=错误!由错误!或错误!得x=-6或x=6.【答案】-6或64。
下列伪代码,若输入2,3,则伪代码执行结果为________。
【解析】由于2<3,故由程序知t←2,a←3,b←2.故输出的b,a分别为2,3。
【答案】2,35.给出下面伪代码:如果输入x1=3,x2=5,那么执行此伪代码后的输出结果是________。
【解析】x1=3,x2=5,不满足条件x1=x2,因此不执行语句x1←x1+x2,而直接执行y←x1+x2,所以y=8,最后输出8.【答案】86.(2015·泰州高一月考)下面伪代码的输出结果为________。
【导学号:90200020】【解析】由于5>0,故程序执行“Else”后面的语句,从而y=-20+3=-17,所以a =5-(-17)=22,故输出a的值为22.【答案】227。
2.2 总体分布的估计1、为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位: )的分组区间为, ,,,,将其按从左到右的顺序分别编号kPa [)12,13[)13,14[)14,15[)15,16[]16,17为第一组,第二组,…,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A.6B.8C.12D.182、某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15人,则该班的学生人数是( )A.45B.50C.55D.603、有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12)内的频数为( )A.18B.36C.54D.724、从甲、乙两种玉米苗中各抽6株,分别测得它们的株高如图所示(单位:cm).根据数据估计( )A.甲种玉米比乙种玉米不仅长得高而且长得整齐B.乙种玉米比甲种玉米不仅长得高而且长得整齐C.甲种玉米比乙种玉米长得高但长势没有乙整齐D.乙种玉米比甲种玉米长得高但长势没有甲整齐5、10个小球分别编号为1,2,3,4,其中1号球4个,2号球2个,3号球3个,4号球1个,数字0.4是指1号球占总体的( )A.频数B.频率C.频率/组距D.累积频率6、为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg) ,得到频率分布直方图如下:[注:每组中包含最小值,不包含最大值]根据上图可得这100名学生中体重在的学生人数是( )[56.5,64.5)A.20B.30C.40D.507、已知样本: ,那么频率为的样本的范12,7,11,12,11,12,10,10,9,8,13,12,10,9,6,11,8,9,8,100.25围是( )A. [) 5.5,7.5B. [) 7.5,9.5C. [) 9.5,11.5D. [) 11.5,13.58、一个容量为20的样本数据,分组情况及各组的频数如下:,则样本数据在上的频(](](](](](]10,20,2;20,30,3;30,40,4;40,50,5;50,60,4;60,70,2(],30-∞率为( )A. 120B. 14C. 12D. 7109、—个容量为的样本,分成若干组.已知某组的频数和频率分别为40和0.125,则的值是n n ( )A.640B.320C.240D.16010、如图是某赛季甲、乙两名篮球运动员参加的每场比赛得分的茎叶图,则甲、乙两人这几场比赛得分的中位数之和是( )A.65B.64C.63D.6211、某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40, 50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如下图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为__________.12、为了了解商场某日旅游鞋的销售情况,抽取了部分顾客购鞋的尺寸,将所得的数据整理后,画出频率分布直方图(如下图),已知从左至右前3个小组的频率之比为1 : 2 : 3,第4小组与第5小组的频率分别为0.175和0.075,第2个小组的频数为10,则抽取的顾客人数是__________.13、某中学举办电脑知识竞赛, 满分为100分,80分以上为优秀(含80分).现将高一两个班参赛学生的成绩进行整理后分成5组, 绘制成频率分布直方图如下.已知图中从左到右的第一、三、四、五小组的频率分别为0.30、0.15、0.10、0.05,而第二小组的频数是40,则参赛的人数是__________,成绩优秀的频率是__________.14、200辆汽车通过某一路段时时速频率分布直方图如图所示,则时速在的汽车大[)50, 60约有__________辆.[注:每组中包含最小值,不包含最大值]15、为检测某种产品的质量,抽取了一个容量为100的样本.数据的分组情况与频数如下:;[)[)10.75,10.85,310.85,10.95,9;[)[)10.95,11.05,13;11.05,11.15,16;[)[)11.15,11.25,26;11.25,11.35,20;[)[)11.35,11.45,7;11.45,11.55,4.[)11.55,11.65,21.列出频率分布表(含累积频率).2.画出频率分布直方图以及频率分布折线图.3.据上述图表,估计数据落在范围内的可能性是百分之几?[)10.95,11.354.估计数据小于11.20的可能性是百分之几?答案以及解析1答案及解析:答案:C解析:由题图可知,第一组和第二组的频率之和为,故该试验共选取的()0.240.16 1 0.40+⨯=志愿者有人.所以第三组共有人,其中有疗效的人数为人.20500.40=500.3618⨯=18612-=2答案及解析:答案:B解析:的频率为,的频率为,低于分的频率为[)20,400.005200.1⨯=[40,60)0.01200.2⨯=60,∴总人数为.故选B.0.10.20.3+=15500.3=3答案及解析:答案:B解析:4答案及解析:答案:D解析:5答案及解析:答案:B解析:因为1号球的频数为4,则1号球占总体的频率为.40.410=6答案及解析:答案:C解析:根据题图可知.体重在的频率为,[)56.5,64.520.0320.0520.0520.070.4⨯+⨯+⨯+⨯=则体重在的学生人数为.[)56.5,64.50.410040⨯=7答案及解析:答案:D解析:的频数为2,频率为0.1; 的频数为6,频率为0.3; 的频数为[)5.5,7.5[)7.5,9.5[)9.5,11.57,频率为0.35; 的频数为5,频率为0.25.[)11.5,13.58答案及解析:答案:D 解析:根据频率的计算公式:求解.9答案及解析:答案:B 解析:根据频率的计算公式:求解.由,400.125n =得.320n =10答案及解析:答案:B解析:甲的中位数为28,乙的中位数为36,∴甲、乙比赛得分的中位数之和为64.11答案及解析:答案:480解析:从频率分布直方图可以看出:分数大于或等于60分的频率为,故所求学生人数为.()0.030 0.0250.0150.010100.8+++⨯=6000.8 480⨯=12答案及解析:答案:40解析:前3个小组的频率和为.又因为前3个小组的频率之比为10.0750.1750.75--=,所以第2个小组的频率为.又知第2个小组的频数为10,则1:2:320.75 0.256⨯=即为所抽取的顾客人数.10400.25=13答案及解析:答案:100; 0.15解析:频率和为1,则第二小组的频率为,()10.300.150.100.050.4-+++=则参赛的人数是,成绩优秀的频率为.401000.4=0.100.050.15+=14答案及解析:答案:60解析:时速在的汽车的频率为,故时速在的汽车大约有[)50, 600.03100.3⨯=[)50, 60 (辆).0.320060⨯=15答案及解析:答案:1. 画出频率分布表如下:2.如图:3.由上述图标可知数据落在范围内的频率为,[)10.95,11.350.870.120.7575%-==即数据落在范围内的可能性是75%.[)10.95,11.354.数据小于11.20的可能性即数据在11.20的频率,也就是数据在11.20处的累积频率,设为,x 则,()()()()0.4111.2011.150.670.4111.2511.15x -÷-=-÷-所以,从而估计数据小于的可能性是.0.410.13,0.54x x -==11.2054%解析:。
某制造商为年全运会生产一批直径为的乒乓球,现随机抽样检查只,测得每只球的直径(单位:,保留两位小数)如下...问题:上述个数据中最大值与最小值分别是多少,它们相差多少?提示:最大值为,最小值为,其差为.问题:将上述数据分组统计,分组情况为[,),[),[),[],求各组个数.提示:各组数据的个数为.问题:试求出各组数据所占的比例?提示:分别为.问题:能否用一个直观图来表示问题中各组数据的分布情况?提示:可以..频率分布表()定义:当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表.()绘制的步骤:①求全距,决定组数和组距,组距=.②分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间.③登记频数,计算频率,列出频率分布表..频率分布直方图()定义:我们用直方图反映样本的频率分布规律,这样的直方图称为频率分布直方图.()绘制步骤:①先制作频率分布表.②建立直角坐标系:把横轴分成若干段,每一段对应一个组的组距,并标上一些关键点.③画矩形:在横轴上,以连结相邻两点的线段为底,以纵轴上为高作矩形,这样得一系列矩形,就构成了频率分布直方图..频率分布折线图()定义:把频率分布直方图中各相邻的矩形的上底边的中点顺次连结起来,就得到频率分布折线图.()总体分布密度曲线:频率折线图的优点是它反映了数据的变化趋势,如果将样本容量取得足够大,分组的组距取得足够小,则相应的频率折线图将趋于一条光滑曲线,称这条光滑曲线为总体分布的密度曲线..在频率分布表中,除最后一个区间是闭区间,其他区间均为左闭右开区间,这样做的目的是为了不重不漏,避免丢失样本数据..在频率分布直方图中,各个小矩形的面积之和为..频率分布直方图直观地显示了数据分布信息,从而为分析估计总体提供了依据..频率分布折线图反映了数据的变化趋势,可用来对数据进行估计和预测.[例] 从某校参加年全国高中数学联赛预赛的名同学中,等可能抽取若干名同学,将他们的成绩制成频率分布表,下面给出了此表中部分数据.()根据表中已知数据,依次写出在①、②、③处的数值;()补全在区间[]上的频率分布直方图;()若成绩不低于分的同学能参加决赛,那么可以估计该校大约有多少学生能参加决赛?。
时间(小时)6.总体分布的估计(时间:120分钟;满分:160分)一、填空题(本大题共14小题,每小题5分,共70分,)1. 10名工人某天生产同一零件,生产的件数是 15 ,17 , 14 , 10 , 15 , 17 ,17 , 16, 14 , 12.设其平均数为a,中位数为b,众数为c ,则有 .(1) c b a >> (2)a c b >> (3)b a c >> (4)a b c >> 2. 在用样本估计总体分布的过程中,下列说法正确的是 . (1)总体容量越大,估计越精确 (2)总体容量越小,估计越精确 (3)样本容量越大,估计越精确 (4)样本容量越小,估计越精确3. 某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用右侧的条形图表示. 根据条形图可得这50名学生这一天平 均每人的课外阅读时间为 .4. 已知数据12n x x x ,,,的平均数为5x =,则数据137x +,237x +,…,37n x +的平均数为 .5. 若M 个数的平均数是X, N 个数的平均数是 Y,则这M+N 个数的平均数是 .6. 10个正数的平方和是370,方差是33,那么平均数为 .7.下列说法正确的是 .(1)甲乙两个班期末考试数学平均成绩相同,这表明这两个班数学学习情况一样 (2)期末考试数学成绩的方差甲班比乙班的小,这表明甲班的数学学习情况比乙班好(3)期末考试数学平均成绩甲、乙两班相同,方差甲班比乙班大,则数学学习甲班比乙班好(4)期末考试数学平均成绩甲、乙两班相同,方差甲班比乙班小,则数学学习甲班比乙班好8.数据a 1,a 2,a 3,…,a n 的方差为σ2,则数据2a 1,2a 2,2a 3,…,2a n 的方差为 .9.统计量是指不含有任何未知参数的样本的函数。
已知1234,,,X X X X 是抽自总体X 的一组样本,则①1X ;②1X +1;③123(,,,)aX bXc Xa b c αα++其中为未知参数,其中是统计量的有个.10.某题的得分情况如下:其中众数是.11.从存放号码分别为1,2,…,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码统计结果如下:则取到号码为奇数的频率是.Array 12.为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图,如右,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a, b的值分别为.13.期中考试以后,班长算出了全班40个人数学成绩的平均分为M,如果把M当成一个同学的分数,与原来的40个分数一起,算出这41个分数的平均值为N,那么M:N为.14.数据a1,a2,a3,…,a n的方差为σ2,平均数为μ,则数据ka1+b,ka2+b,ka3+b,…,ka n+b(kb≠0)的标准差为,平均数为.二、解答题(本大题共6小题,共90分,解答应写出文字说明、证明过程或演算步骤...................)15.(本题满分14分)(1)完成下面的频率分布表.(2)根据下表,画出频率分布直方图.(3)根据下表,估计数据落在[10.95,11.35]16.(本题满分14分)在参加世界杯足球赛的32支球队中,随机抽取20名队员,调查其年龄为25,21,23,25,27,29,25,28,30,29,26,24,25,27,26,22,24,25,26,28。
2.2总体分布的估计(二)【新知导读】1.下列说法正确的是()A.直方图的高表示取某数的频率B.直方图的高表示该组个体在样本中出现的频率C.直方图的高表示该组个体在样本中出现的频率与组据的比D.直方图的高表示该组个体在样本中出现的频数与组据的比2.在频率分布直方图中,各小长方形的面积表示 ( )A.落在相应组的数据的频数 B.相应各组的频率C.该样本所分成的组数 D.该样本的样本容量3.在调查某产品尺寸过程中,将其尺寸分成若干组,[,]a b是其中的一组.已知该组的频率为m,该组的直方图的高为h,则a b-等于 ( )A.mh B.hmC.mhD.m h+【范例点睛】例1 .有一个容量为100的某高校毕业生起始月薪的样本,数据的分组及各组的频数如下:毕业生起始月薪低于2000元的可能性.例2.有一个容量为50的样本,数据分组及各组的频数如下:[12.5,15.5),3;[15.5,18.5),8;[18.5,21.5),9;[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),5;[30.5,33.5),4.(1)列出样本频率分布图表;(2)画出频率分布直方图;(3)画出数据频率折线图.【课外链接】1.某中学举行的电脑知识竞赛,满分100分,80分以上为优良,现将高一两个班参赛学生的成绩进行整理后分成5组,绘制如右的频率分布直方图(如图).已知图中从左到右的第一、第三、第四、第五小组的频率分别是0.30、0.15、0.10、0.05.第二小组的频数是40,则参赛的人数和成绩优良的频率分别是()A.100,0.15 B.100,0.30 C.80,0.15 D.80,0.30【随堂演练】1.某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用右侧的条形图表示.根据条形图可得这50名学生这一天平均每天的课外阅读时间为()A.0.6小时 B.0.9小时 C.1.0小时 D.1.5小时2.一般家庭用电(千瓦时)与气温(C )有一定的关系.图(1)表示某年12个月中每月的平均气温.图(2)所示某家庭在这年12个月中每月的用电量.根据这些信息,以下关于该家庭用电量与气温间的关系叙述中,正确的是()A.气温最高时,用电量最多B.气温最低时,用电量最少C.当气温大于某一值时,用电量随气温增高而增加D.当气温小于某一值时,用电量随气温降低而增加3.关于样本频率分布折线图与总体密度曲线的关系,下列说法正确的是()A.频率分布折线图与总体密度曲线无关。
苏教版高中数学用样本估计总体____________________________________________________________________________________________________________________________________________________________________1.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图,理解数形结合的数学思想和逻辑推理的数学方法.2.通过对样本分析和总体估计的过程,感受数学对实际生活的需要,通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地作出总体估计,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系.3.能利用频率分布直方图估计总体的众数、中位数、平均数;能用样本的众数、中位数、平均数估计总体的众数、中位数、平均数,并结合实际,对问题作出合理判断,制定解决问题的有效方法;初步体会、领悟“用数据说话”的统计思想方法;通过对有关数据的搜集、整理、分析、判断,培养学生“实事求是”的科学态度和严谨的工作作风.4.正确理解样本数据标准差的意义和作用,学会计算数据的标准差;能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;会用样本的基本数字特征估计总体的基本数字特征,形成对数据处理过程进行初步评价的意识.1.分析数据的方法(1)借助于图形.用图将各个数据画出来,作图可以达到两个目的,一是从数据中__________;二是利用图形__________.(2)借助于表格.用紧凑的表格改变数据的______方式,为我们提供_____数据的新方式.提取信息传递信息构成解释2.频率分布直方图(1)绘制步骤:①求______,即一组数据中的最大值与最小值的差.②决定______与______.组距与组数的确定没有具体的标准,一般来说,数据分组的组数与样本容量有关,样本容量越大,所分组数越____.当样本容量不超过100时,按照数据的多少,常分为5~12组.③将数据______.④列出__________表.⑤画出频率分布直方图.其中横轴表示_____,纵轴表示_____________的比.(2)意义:频率分布直方图中,每个小矩形的面积表示相应组的______,所有小矩形的面积的总和等于____.(3)频率分布的估计:频率分布是指各个小组数据在容量中所占______的大小,可以用______的频率分布估计总体的频率分布,频率分布表是反映样本的频率分布的表格.通过频率分布直方图和频率分布表可以看到样本的频率分布.极差组距组数多分组频率分布数据频率与组距频率 1 比例样本3. 频率分布直方图的特征:直观、形象地反映了样本的分布规律;可以大致估计出总体的分布.但是从频率分布直方图中得不出原始的数据内容,把数据绘制成频率分布直方图后,原有的具体数据信息就被抹掉了.4.频率分布折线图和总体密度曲线(1)类似于频数分布折线图,连接频率分布直方图中各个小长方形上端的中点,就得到频率分布折线图.一般地,当总体中的个体数较多时,抽样时样本容量就不能太小.例如,如果要抽样调查一个省乃至全国的居民的月均用水量,那么样本容量就应比调查一个城市的时候大.可以想像,随着样本容量的增加.作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.频率分布折线图反映了数据的变化趋势.总体密度曲线反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.(2)估计方法:实际上,尽管有些总体密度曲线是客观存在的,但是在实际应用中我们并不知道它的具体表达形式,需要用______来估计.由于样本是随机的,不同的样本得到的频率分布折线图______;即使对于同一个样本,不同的分组情况得到的频率分布折线图也不同.频率分布折线图是随__________和分组情况的变化而变化的,因此不能用样本的___________________得到准确的总体密度曲线.样本不同样本容量频率分布折线图5.茎叶图(1)制作方法:将所有两位数的十位数字作为_____,个位数字作为___,茎相同者共用一个茎,茎按从_________的顺序从上向下列出,共茎的叶可以按从大到小(或从小到大)的顺序同行列出(也可以没有大小顺序).(2)优缺点:在样本数据_______时,用茎叶图表示数据的效果较好.它不但可以保留所有信息,而且可以随时______,这对数据的记录和表示都能带来方便.但是当样本数据______时,茎叶图就显得不太方便,因为每一个数据都要在图中占据一个空间,如果数据很多,枝叶就会很长.茎叶小到大较少记录较多6. 茎叶图的特征:统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;茎叶图中的数据可以随时记录,随时添加,方便记录与表示.但是茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两位以上的数据虽然能够记录,但是没有表示两位数记录那么直观、清晰.7.规律总结[总结1] 估计总体分布的步骤是:(1)选择适当的抽样方法从总体中抽取样本,即收集数据.(2)利用样本数据画出统计图或计算数字特征.(3)结合统计图分析样本取值的分布规律.(4)用样本取值的分布规律估计总体分布,由于是用科学抽样抽取的样本,那么样本与总体取值的分布规律近似,有时也可看成相同.(5)利用总体分布解决有关问题.[总结2] 频率分布表、频率分布直方图、频率分布折线图和茎叶图的比较(1)四种图表的区别与联系名称区别频率分布表从数量上比较准确地反映样本的频率分布规律频率分布直方图反映样本的频率分布情况频率分布折线图直观地反映了数据的变化趋势总体密度曲线虽客观存在,但要准确画出难度较大,只能用样本频率分布估计.样本容量越大,估计越准确这四种图表都是描述样本数据分布情况,估计总体频率分布规律的,其联系如下:(2)四种图表的优缺比较优点缺点频率分布表表示数量较确切分析数据分布的总体态势不方便频率分布直方图表示数据分布情况非常直观原有的具体数据信息被抹掉了频率分布折线图能反映数据的变化趋势不能显示原有数据信息茎叶图一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况样本数据较多或数据位数较多时,不方便表示数据8.众数(1)定义:一组数据中出现次数______的数称为这组数据的众数.(2)特征:一组数据中的众数可能______一个,也可能没有,反映了该组数据的____________.[破疑点] 众数体现了样本数据的最大集中点,但它对其他数据信息的忽视使其无法客观地反映总体特征.最多不止集中趋势9.中位数(1)定义:一组数据按从小到大的顺序排成一列,处于______位置的数称为这组数据的中位数.(2)特征:一组数据中的中位数是______的,反映了该组数据的______________.在频率分布直方图中,中位数左边和右边的直方图的面积______.[破疑点] 中位数不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点.中间唯一集中趋势相等10.平均数(1)定义:一组数据的和与这组数据的个数的商.数据x1,x2,…,x n的平均数为x n=_________________.(2)特征:平均数对数据有“取齐”的作用,代表该组数据的_____________.任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的______,但平均数受数据中_________的影响较大,使平均数在估计总体时可靠性降低.x1+x2+…+x nn平均水平信息极端值11.标准差(1)定义:标准差是样本数据到平均数的一种平均距离,一般用s表示,通常用以下公式来计算s=__________________________.可以用计算器或计算机计算标准差.(2)特征:标准差描述一组数据围绕______波动的大小,反映了一组数据变化的幅度和离散程度的大小.标准差较大,数据的离散程度较______;标准差较小,数据的离散程度较______.1n[x1-x2+x2-x2+…+x n-x2]平均数大小12.方差(1)定义:标准差的平方,即s2=________________________________________.(2)特征:与____________的作用相同,描述一组数据围绕平均数波动程度的大小.(3)取值范围:___________.1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2] 标准差[0,+∞)数据组x 1,x 2,…,x n 的平均数为x ,方差为s 2,标准差为s ,则数据组ax 1+b ,ax 2+b ,…,ax n +b(a ,b 为常数)的平均数为a x +b ,方差为a 2s 2,标准差为as.6.用样本估计总体现实中的总体所包含的个体数往往很多,总体的平均数、众数、中位数、标准差、方差是不知道的,因此,通常用样本的平均数、众数、中位数、标准差、方差来估计.这与用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.用样本的数字特征估计总体的数字特征分两类:用样本平均数估计总体平均数;用样本标准差估计总体标准差,样本容量越大,估计就越精确.类型一绘制频率分布直方图例1:抽查100袋洗衣粉,测量它们的净重如下(单位:g):494498493505496492485483508511 495494483485511493505488501491 493509509512484509510495497498 504498483510503497502511497500 493509510493491497515503515518 510514509499493499509492505489 494501509498502500508491509509 499495493509496509505499486491 492496499508485498496495496505 499505496501510496487511501496(1)列出样本的频率分布表;(2)画频率分布直方图及频率分布折线图;(3)估计净重在494.5~506.5 g 之间的频率.[解析](1)在样本数据中,最大值是518,最小值是483,所以极差为35.取组距为 4 g ,由于354=834,故要分成9组.使分点比数据多一位小数,且把第1组的起点稍微减小一点,得分组如下:[482.5,486.5),[486.5,490.5),[490.5,494.5),…,[514.5,518.5].列出频率分布表如下:分组频数累计频数频率[482.5,486.5)80.08 [486.4,490.5)30.03 [490.5,494.5)正正正170.17 [494.5,498.5)正正正正210.21[498.5,502.5)正正140.14[502.5,506.5)正90.09[506.5,510.5)正正正190.19[510.5,514.5)正60.06[514.5,518.5]30.03 合计100 1.00(2)频率分布直方图及频率分布折线图如下图:(3)净重在494.5~506.5 g之间的频率为0.21+0.14+0.09=0.44.练习1:为了解某中学高一年级男生的体重情况,抽取了同年级40名男生的体重,数据如下(单位:千克):62605959595858575757575656565656565655555555545454545353525252525251515150504948列出样本的频率分布表,绘出频率分布直方图,并估计体重在58千克以上的男生比例.[答案](1)计算极差:62-48=14.(2)决定组距与组数:取组距为 2.又因为极差组距=142=7,故共分成7组.(3)将数据分组:以组距为2将数据分组时,可以分成以下7组:[48,50),[50,52)、[52,54),[54,56),[56,58),[58,60),[60,62].(4)列出频率分布表如下:分组频数频率[48,50) 2 0.05[50,52) 5 0.125[52,54) 7 0.175[54,56) 8 0.2[56,58) 11 0.275[58,60) 5 0.125[60,62] 2 0.05合计40 1.00(5)绘出频率分布直方图(如下图所示):从频率分布表中可看出,样本数据落在58以上的频率为0.125+0.05=0.175,由此可估计,体重在58千克以上的男生比例约为17.5%.练习2:在2014年第十六届亚运会中,各个国家和地区金牌获得情况的条形统计图,如图所示.第十六届亚运会各个国家和地区金牌获得情况统计图从图中可以看出中国是亚洲第一体育强国,中国所获得金牌数占全部金牌数的比例约是() A.41.7% B.59.8% C.67.3% D.34.4%[答案] D练习3:频率分布直方图中,各小矩形面积的和等于()A.0 B.12C.1 D.不确定[答案] C练习4:在画频率分布直方图时,某组的频数为10,样本容量为50,总体容量为600,则该组的频率是()A.15B.16C.110D.不确定[答案] A类型二茎叶图的画法及应用例2:某中学甲、乙两名同学最近几次的数学考试成绩情况如下:甲的得分:95,81,75,89,71,65,76,88,94,110,107;乙的得分:83,86,93,99,88,103,98,114,98,79,101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.[解析][答案]甲、乙两人数学成绩的茎叶图如图所示.从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,大多集中在80~100之间,中位数是98分.甲同学的得分情况除一个特殊得分外,也大致对称,多集中在70~90之间,中位数是88分,但分数分布相对于乙来说,趋向于低分阶段.因此,乙同学发挥比较稳定,总体得分情况比甲同学好.练习2:在某电脑杂志的一篇文章中,每个句子的字数如下10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.(1)画出两组数据的茎叶图;(2)比较分析两组数据,能得出什么结论?[答案](1)依题意,画出茎叶图如下图所示:(2)电脑杂志文章中每个句子的字数集中在10~30之间,中位数为22.5,而报纸文章中每个句子的字数集中在20~40之间,中位数为27.5.还可以看出,电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.这与电脑杂志作为科普读物需要简明、通俗易懂的要求相吻合.类型三茎叶图与频率分布直方图的综合应用例3:(2015·湖北武汉调研)某学校随机抽取20个班,调查各班中有网购经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是()[解析]借助已知茎叶图得出各小组的频数,再由频率=频数样本容量求出各小组的频率,进一步求出频率组距并得出答案.方法一:由题意知样本容量为20,组距为 5.列表如下:分组频数频率频率组距[0,5)11200.01[5,10)11200.01[10,15)4150.04[15,20)21100.02[20,25)4150.04[25,30)33200.03[30,35)33200.03[35,40]21100.02合计201观察各选择项的频率分布直方图知选 A.方法二:由茎叶图知落在区间[0,5)与[5,10)上的频数相等,故频率、频率组距也分别相等.比较四个选项知A正确,故选 A.[答案] A练习1:某学校为调查高三年级学生的身高情况,按随机抽样的方法抽取80名学生,得到男生身高情况的频率分布直方图1和女生身高情况的频率分布直方图 2.已知图1中身高在170 cm~175 cm的人数为16.问:在抽取的学生中,男、女生各有多少人?[答案]因为身高在170 cm~175 cm的男生的频率为0.08×5=0.4,设男生的总人数为n1,则0.4=16n1,解得n1=40,即抽取的学生中,男生的人数为40,女生的人数为80-40=40.练习2:没有信息的损失,所有的原始数据都可以从图中得到的统计图是()A.总体密度曲线B.茎叶图C.频率分布折线图D.频率分布直方图[答案] B类型四中位数、众数、平均数的应用例4:据报道,某公司的33名职工的月工资(以元为单位)如下:职务董事长副董事长董事总经理经理管理员职员人数 1 1 2 1 5 3 20工资 5 500 5 000 3 500 3 000 2 500 2 000 1 500(1)求该公司的职工月工资的平均数、中位数、众数;(2)假设副董事长的工资从 5 000元提升到20 000元,董事长的工资从 5 500元提升到30 000元,那么新的平均数、中位数、众数又是什么?(精确到1元)(3)你认为哪个统计量更能反映这个公司职工的工资水平?结合此问题谈一谈你的看法.[解析](1)平均数是x=1 500+4 000+3 500+2 000×2+1 500+1 000×5+500×3+0×2033≈1 500+591=2 091(元).中位数是 1 500元,众数是 1 500元.(2)平均数是x′=1 500+28 500+18 500+2 000×2+1 500+1 000×5+500×3+0×2033≈1 500+1 788=3 288(元).中位数是 1 500元,众数是 1 500元.(3)在这个问题中,中位数或众数均能反映该公司职工的工资水平.因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数偏差较大,所以平均数不能反映这个公司职工的工资水平.练习1:某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):甲群13,13,14,15,15,15,15,16,17,17;乙群54,3,4,4,5,5,6,6,6,57.(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好反映甲群市民的年龄特征?(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好反映乙群市民的年龄特征?[答案](1)甲群市民年龄的平均数为13+13+14+15+15+15+15+16+17+1710=15(岁),中位数为15岁,众数为15岁.平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.(2)乙群市民年龄的平均数为54+3+4+4+5+5+6+6+6+5710=15(岁),中位数为5岁,众数为6岁.由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.类型五标准差、方差的应用从甲、乙两种玉米的苗中各抽10株,分别测它们的株高如下:(单位:cm)甲:25414037221419392142乙:27164427441640401640问:(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?[解析]看哪种玉米的苗长得高,只要比较甲、乙两种玉米的苗的均高即可;要比较哪种玉米的苗长得齐,只要看两种玉米的苗高的方差即可,因为方差是体现一组数据波动大小的特征数.(1)x甲=110(25+41+40+37+22+14+19+39+21+42)=110×300=30(cm),x乙=110(27+16+44+27+44+16+40+40+16+40)=110×310=31(cm).所以x甲<x乙.(2)s2甲=110[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=110(25+121+100+49+64+256+121+81+81+144)=110×1042=104.2(cm 2),s 2乙=110[(2×272+3×162+3×402+2×442)-10×312]=110×1288=128.8(cm 2).所以s2甲<s 2乙. [答案](1)乙种玉米的苗长得高,(2)甲种玉米的苗长得齐.练习1:甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如下表:甲的成绩环数7 8 9 10 频数 5555乙的成绩环数7 8 9 10 频数 6446丙的成绩环数7 8 9 10 频数4664s 1,s 2,s 3分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有()A .s 3>s 1>s 2B .s 2>s 1>s 3C .s 1>s 2>s 3D .s 2>s 3>s 1[答案]B练习2:(2015·天津高一检测)一次数学知识竞赛中,两组学生成绩如下表:分数50 60 70 80 90 100 人数甲组2 5 10 13 14 6 乙组441621212已经算得两个组的平均分都是80分,请根据你所学过的统计知识,进一步判断这两个组这次竞赛中成绩谁优谁次,并说明理由.[答案](1)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数比较看,甲组成绩好些.(2)s2甲=12+5+10+13+14+6×[2×(50-80)2+5×(60-80)2+10×(70-80)2+13×(80-80)2+14×(90-80)2+6×(100-80)2]=150×(2×900+5×400+10×100+13×0+14×100+6×400)=172.s 2乙=150×(4×900+4×400+16×100+2×0+12×100+12×400)=256.因为s2甲<s2乙,所以甲组成绩较乙组成绩稳定.(3)甲、乙两组成绩的中位数、平均数都是80分,其中甲组成绩在80分以上(含80分)的有33人,乙组成绩在80分以上(含80分)的有26人,从这一角度看,甲组成绩总体较好.(4)从成绩统计表看,甲组成绩大于或等于90分的人数为20人,乙组成绩大于或等于90分的人数为24人,所以乙组成绩在高分阶段的人数多,同时,乙组得满分的比甲组得满分的多6人,从这一角度看,乙组成绩较好.类型六频率分布直方图与数字特征的综合应用例6:(1)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差(2)某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.①求这次测试数学成绩的众数.②求这次测试数学成绩的中位数.③求这次测试数学成绩的平均分.[解析](1)x甲=15(4+5+6+7+8)=6,x乙=15(5×3+6+9)=6,甲的中位数是6,乙的中位数是 5.甲的成绩的方差为15(22×2+12×2)=2,乙的成绩的方差为15(12×3+32×1)=2.4.甲的极差是4,乙的极差是 4.所以A,B,D错误,C正确.(2)①由图知众数为70+802=75.②由图知,设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03(x-70),所以x≈73.3.③由图知这次数学成绩的平均分为:40+502×0.005×10+50+602×0.015×10+60+702×0.02×10+70+802×0.03×10+80+902×0.025×10+90+1002×0.005×10=72.[答案](1)C (2)见解析练习1:(2015·山东淄博高三模拟)参加市数学调研抽测的某校高三学生成绩分布的茎叶图1和频率分布直方图2均受到不同程度的破坏,但可见部分信息如下,据此解答如下问题:求参加数学抽测的人数n,抽测成绩的中位数及分数分布在[80,90),[90,100]内的人数.[答案]分数在[50,60)内的频率为2,由频率分布直方图可以看出,分数在[90,100]内的同样有2人.由2n=10×0.008,得n=25.由茎叶图可知抽测成绩的中位数为73.∴分数在[80,90)之间的人数为25-(2+7+10+2)=4.参加数学竞赛人数n=25,中位数为73,分数在[80,90),[90,100]内的人数分别为4人,2人.1.在用样本的频率分布估计总体的频率分布的过程中,下列说法正确的是()A.总体的容量越大,估计越准确B.总体的容量越小,估计越准确C.样本的容量越大,估计越准确D.样本的容量越小,估计越准确[答案] C2.在频率分布表中,下列说法正确的是( )A.起始点不同,不影响分组数B.分组数越多,就越能反映总体的情况C.各组频率之和一定是 1D.不同起始点的频率分布表,各组频率一定不同[答案] C3.下列关于茎叶图的叙述正确的是( )A.茎叶图可以展示未分组的原始数据,它与频率分布表以及频率分布直方图的处理方式不同B.对于重复的数据,只算一个C.茎叶图中的叶是“茎”十进制的上一级单位D.制作茎叶图的程序是:第1步画出茎;第2步画出叶;第3步将“叶子”任意排列[答案] A4.(2014·高考山东卷)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组,下图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A.6 B.8 C.12 D.18[答案] C5.甲、乙两中学生在一年里学科平均分相等,但他们的方差不相等,正确评价他们的学习情况是( )A.因为他们平均分相等,所以学习水平一样B.成绩平均分虽然一样,方差较大的,说明潜力大,学习态度端正C.表面上看这两个学生平均成绩一样,但方差小的成绩稳定D.平均分相等,方差不等,说明学习不一样,方差较小的同学,学习成绩不稳定,忽高忽低[答案] C6.在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88,若样本B数据恰好是样本A都加上2后所得数据,则A、B两样本的下列数字特征对应相同的是( ) A.众数 B.平均数C.中位数D.标准差[答案] D7.如图,是某篮球运动员在一个赛季的30场比赛中得分的茎叶图,则得分的中位数与众数分别为( )A.3与3 B.23与3C.3与23 D.23与23[答案] D8.(2015·沈阳铁路实验中学期末考试)已知样本9,10,11,x,y的平均数是10,方差是2,则xy=( )A.98 B.88C.76 D.96[答案] D9.某篮球运动员在2014赛季各场比赛得分情况如下:12,15,24,25,31,31,36,36,37,39,44,49,50.制作茎叶图,并分析这个运动员的整体水平及发挥的稳定程度.[解析] 该运动员得分茎叶图如下:从这张图中可以粗略地看出,该运动员得分大多能在20分到40分之间,且分布较为对称,集中程度高,说明其发挥比较稳定.10.从某校参加数学竞赛的试卷中抽取一个样本,考查竞赛的成绩分布,将样本分成6组,得到频率分布直方图如图,从左到右各小组的小长方形的高的比为,最右边的一组的频数是8.请结合直方图的信息,解答下列问题:(1)样本容量是多少?(2)成绩落在哪个范围的人数最多?并求出该小组的频数和频率.(3)估计这次数学竞赛成绩的众数、中位数和平均数.[解析](1)从左到右各小组的频率分别为117,117,317,617,417,217,样本容量为8217=68.(2)成绩落在70~80之间的人数最多;频率为617;频数为68×617=24.(3)众数的估计值是75,中位数的估计值是70+12-117-117-317617×10=4556≈75.83.平均数的估计值是117×45+117×55+317×65+617×75+417×85+217×95=75._________________________________________________________________________________ _________________________________________________________________________________基础巩固(1)基础巩固一、选择题1.下列关于频率分布直方图的说法正确的是()A.直方图的高表示取某数的频率B.直方图的高表示该组上的个体在样本中出现的频率C.直方图的高表示取某组上的个体在样本中出现的频数与组距的比值D.直方图的高表示取该组上的个体在样本中出现的频率与组距的比值[答案] D[解析]要注意频率直方图的特点.在直方图中,纵轴(矩形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的矩形的面积.[点评]注意区别直方图与条形图.2.下列说法正确的是()A.对于样本数据增加时,频率分布表不能增加变化B.对于样本数据增加时,茎叶图不能增加变化C.对于样本数据增加时,频率折线图不会跟着变化D.对于样本数据增加时,频率分布直方图变化不太大[答案] D3.一个容量为80的样本中数据的最大值是140,最小值是51,组距是10,则应将样本数据分为()A.10组B.9组C.8组D.7组[答案] B[解析]根据列频率分布表的步骤,极差组距=140-5110=8.9.所以分为9组较为恰当.4.(2013·福建卷)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测度成绩不低于60分的学生人数为()A.588 B.480C.450 D.120[答案] B[解析]本题考查频率分布直方图及频数的求法.成绩在[40,60)的频率P1=(0.005+0.015)×10。
2.2总体分布的估计(一)【新知导读】1.在用样本频率估计总体分布的过程中,下列说法正确的是()A.总体容量越大,估计越精确B.总体容量越小,估计越精确C.样本容量越大,估计越精确D.样本容量越小,估计越精确2.一个容量为20的样本数据,分组后,组据与频数如下:[10,20),2;[20,30),3;[30,40),4;[40, 50),5;[50,60),4;[60,70],2;则样本在区间(8,50)上的频率为()A.5% B.25% C.50% D.70%3.已知样本10,8,6,10,8,13,11,10,11,7,8,9,12,9,11,12,9,10,11,12,那么频率为0.2的范围是 ( )A.5.5~7.5 B.7.5~9.5 C.9.5~11.5 D.11.5~13.5【范例点睛】例1 .张老师为了分析一次数学考试情况,全班抽了50人,将分数分成5组,第一组到第三组的频数10,23,11,第四组的频率为0.08,那么落在89.5~99.5的频数是多少?频率是多少?全校300人中分数在89.5~99.5中的约有多少人?方法点评:(1)频率=频数/样本容量,已知其中任意两个量就可以求出第三个量.(2)各小组的频数和等于样本容量,频率和等于1.(3)由样本的频率可估计总体的频率,从而估计出总体的频数.【课外链接】1.某容量为50的某个样本数据被拆分为5组,若前两组的频率和为0.3,其余3组的频率组成公比为2的等比数列,则剩下的三组中频率最小的一组的频率是( )A.0.2 B.0.12 C.0.21 D.0.1【随堂演练】1.对某班40名同学的一次数学测试成绩进行统计,频率分布表中80.5~90.5这一组的频率为0. 20,那么这40名同学的数学成绩在80.5~90.5这个分数段的人数是()A.20 B.10 C.8 D.122.对样本数据:25,21,23,25,27,29,25,28,30,29,2622,24,25,26,28,26,24,25,27,在列频率分布表时,如果取组据为2,那么落在24.5~26.5这一组的频率是 ( )A.0.3 B.0.4 C.0.5 D.0.63.有一个容量为45的样本数据,分组后各组的频数如下:(12.5,15,5),3;(15.5,18.5),8;(18.5,21.5),9;(21.5.24.5),11;(24.5,27.5),10;(27.5,30.5),4;估计不大于27.5数据约为总体的()A.91% B.92% C.95% D.30%4.一个容量为n的样本,已知某组的频率为0.25,频数为10,则n=__________.5.把容量为64的样本分成8组,第1组到第4组的频数分别是5,6,11,10,第5组到第7组的频率都是0.125,那么第8组的频数是_________,频率为_________.6.将容量为100的样本数据,按从小到大的顺序分为8个组,如下表:则第三组的频率是____________.7.将一个容量为100的样本数据,按照从小到大的顺序分为8个组,如下表:若第6组的频率是第3组频率的2倍,则第6组的频率是多少?8.下表给出了某地区1500名12岁男孩中所随机抽样得出的120人的身高资料(单位:cm),请完成下表.9.对50台电子设备的寿命逐台进行测试,得到下列数据(单位:小时):910 1220 1280 20 2330 900 860 1450 1220 550 160 2020 1590 1730 490 1620 560 530 500 240 1280 190 290 740 1160 220 910 40 1410 3650 3410 70 510 1270 610 310 220 370 60 1750 890 790 1280 570 760 50 1530 1860 1280 30.(1)列出样本的频率分布表;(2)根据所得结果估计,寿命小于2500小时的频率约为多少?2.2总体分布的估计(一) 【新知导读】 1.C 2.D 3.D 【范例点睛】例1.频率是每一小组的频数与数据总数的比值,第四组的频率是0.08,则第四组的频数是4,从而可求出第五组的频数、频率,并由样本估计出全校300人中分数在89.5~99.5之间的人数.第四组的频数为0.08504⨯=,第五组的频数为50-10-23-11-4=2,频率为20.0450=,所以全校在89.5~99.5之间的约有0.0430012⨯=人. 【课外链接】 1.D【随堂演练】1.C2.B 3.A 4.40 5.8,0.125 6.0.14 7.0.14 8.9.(1)频率分布表如下表:(2)由表可知,寿命小于2500小时的频率约占32%+28%+20%+12%+4%=96%.。
高中数学学习材料鼎尚图文*整理制作抽样方法与总体分布的估计一、填空题 1、为调查参加运动会的1000名运动员的年龄情况,从中抽查了100名运动员的年龄,就这个问题来说,下列说法正确的是A.1000名运动员是总体B.每个运动员是个体C.抽取的100名运动员是样本D.样本容量是100 2、一个容量为n 的样本,分成若干组,已知某数的频数和频率分别为40、0.125,则n 的值为A.640B.320C.240D.1603、某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是 A.分层抽样法,系统抽样法 B.分层抽样法,简单随机抽样法 C.系统抽样法,分层抽样法 D.简单随机抽样法,分层抽样法4、某单位有职工100人,不到35岁的有45人,35岁到49岁的有25人,剩下的为50岁以上的人,用分层抽样法从中抽取20人,各年龄段分别抽取的人数为A.7,5,8B.9,5,6C.6,5,9D.8,5,75、某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间为2015105人数(人)时间(h )0 0.5 1.0 1.5 2.0 A.0.6 h B.0.9 h C.1.0 hD.1.5 h二、填空题6、某单位有老年人27人,中年人54人,青年人81人,为了调查他们的健康状况,需从他们中抽取一个容量为36的样本,在简单随机抽样、系统抽样、分层抽样这三种方法中较合适的抽样方法是___________7、用系统抽样法要从160名学生中抽取容量为20的样本,将160名学生随机地从1~160编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为126,则第1组中用抽签的方法确定的号码是___________.8、某单位有职工160名,其中业务人员120名,管理人员16名,后勤人员24名.为了解职工的某种情况,要从中抽取一个容量为20的样本.若用分层抽样的方法,抽取的业务人员、管理人员、后勤人员的人数应分别为____________.9、下图是容量为100的样本的频率分布直方图,试根据图形中的数据填空:频率组距0.090.080.02(1)样本数据落在范围[6,10)内的频率为___________;26101418样本数据(2)样本数据落在范围[10,14]内的频数为___________;(3)总体在范围[2,6]内的概率约为___________10、一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k小组中抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是___________三、解答题11、某班学生在一次数学考试中成绩分布如下表:分数段[0,80)[80,90)[90,100)人数 2 5 6分数段[100,110)[110,120 [120,130))人数8 12 6分数段[130,140)[140,150)人数 4 2那么分数在[100,110]中的频率和分数不满110分的累积频率分别是多少?(精确到0.01)12、某工厂生产的产品,可分为一等品、二等品、三等品三类,根据抽样检验的记录有一等品54个、二等品140个、三等品6个.(1)估计三种产品的概率; (2)画出频率分布条形图. 13、从一个养鱼池中捕得m 条鱼,作上记号后再放入池中,数日后又捕得n 条鱼,其中k 条有记号,请估计池中有多少条鱼14、对某电子元件进行寿命追踪调查,情况如下:寿命(h ) 100~200 200~300 300~400 400~500 500~600 个 数 20 30 80 40 30 (1)列出频率分布表;(2)画出频率分布直方图和累积频率分布图;(3)估计电子元件寿命在100~400 h 以内的概率; (4)估计电子元件寿命在400 h 以上的概率.答案:1、D2、B3、B4、B5、B6、解析:要研究的总体里各部分情况差异较大,因此用分层抽样.答案:分层抽样7、解析:不妨设在第1组中随机抽到的号码为x ,则在第16组中应抽出的号码为120+x .设第1组抽出的号码为x ,则第16组应抽出的号码是8×15+x =126,∴x =6. 答案:68、解析:分层抽样应按各层所占的比例从总体中抽取.∵120∶16∶24=15∶2∶3,又共抽出20人,∴各层抽取人数分别为20×2015=15人,20×202=2人,20×203=3人.答案:15人、2人、3人 9、(1)0.32 (2)36 (3)0.0810、剖析:此问题总体中个体的个数较多,因此采用系统抽样.按题目中要求的规则抽取即可.∵m =6,k =7,m +k =13,∴在第7小组中抽取的号码是63. 答案:6311、解析:由频率计算方法知:总人数=45.分数在[100,110)中的频率为458=0.178≈0.18. 分数不满110分的累积频率为458652+++=4521≈0.47. 答案:0.18 0.47 12、解:(1)0.27,0.7,0.03.(2)频率分布条形图如下.0.70.270.03频率一等品 二等品 三等品产品等级13、解:设池中有N 条鱼,第一次捕得m 条作上记号后放入水池中,则池中有记号的鱼占Nm ;第二次捕得n 条,则这n 条鱼是一个样本,其中有记号的鱼占n k .我们用样本来估计总体分布,令nk=Nm ,∴N =k mn.14、解:(1)频率分布表如下:寿命(h ) 频 数 频 率 累积频率 100~200 20 0.10 0.10 200~300 30 0.15 0.25 300~400 80 0.40 0.65 400~500 40 0.20 0.85 500~600 30 0.15 1 合 计 200 1(2)频率分布直方图如下:100 200 300 400 500 600 寿命(h )频率组距200 300 400 500 600 寿命(h )1.000.800.600.400.20累积频率(3)由累积频率分布图可以看出,寿命在100~400 h 内的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100~400 h 内的概率为0.65.(4)由频率分布表可知,寿命在400 h 以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400 h 以上的概率为0.35.。
总体分布的估计 例题解析【例1】为了了解某地区高三学生的身体发育情况,抽查了地区内100名年龄为17.5岁~18岁的男生的体重情况,结果如下:(单位:kg )试根据上述数据画出样本的频率分布直方图,并对相应的总体分布作出估计. 解析:按照下列步骤获得样本的频率分布: (1)求最大值与最小值的差.在上述数据中,最大值是76,最小值是55,它们的差(又称为极差)是76-55=21所得的差告诉我们,这组数是据的变动范围有多大. (2)确定组距与组数.如果将组距定为2,那么由21÷2=10.5,组数为11,这个组数是适合的.于是组距为2,组数为11.(3)决定分点.根据本例中数据的特点,第1小组的起点可取为54.5,第1小组的终点可取为56.5,为了避免一个数据既是起点,又是终点从而造成重复计算,我们规定分组的区间是“左闭右开”的.这样,所得到的分组是[54.5,56.5),[56.5,58.5),…,[74.5,76.5). (4)列频率分布表. 频率分布表(5)绘制频率分布直方图. 频率分布直方图如下图所示.体重频率组距由于图中各小长方形的面积等于相应各组的频率,这个图形的面积的形式反映了数据落在各个小组的频率的大小.在反映样本的频率分布方面,频率分步表比较确切,频率分布直方图比较直观,它们起着相互补充的作用.在得到了样本的频率后,就可以对相应的总体情况作出估计.例如可以估计,体重在[64.5,66.5)kg 的学生最多,约占学生总数的16%;体重小于58.5 kg 的学生较少,约占8%;等等.点评: 1.一般地,列频率分布表的步骤如下:(1)求全距,决定组数和组距,组距=全距/组数;(2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;(3)登记频数,计算频率,列出频率分布表.2.一般地,画频率分布直方图方法如下:把横轴分为若干段,每一段对应一组的组距,然后以线段为底,作一矩形,它的高等于该组的频率/组距,作出一系列的矩形;每个矩形的面积恰好是该组的频率,这些矩形就构成了频率分布直方图.【例2】为制定本市初中七、八、九年级学生校服的生产计划,有关部门准备对180名初中男生的身高作调查,现有三种调查方案:①测量少体校中180名男子篮球、排球队员的身高;②查阅有关外地180名男生身高的统计资料;③在本市的市区和郊县各任选一所完全中学、两所初级中学,在这六所学校有关的年级(1)班中,用抽签的方法分别选出10名男生,然后测量他们的身高.(1)为了达到估计本市初中这三个年级男生身高分布的目的,你认为采用上述哪一种调查方案比较合理,为什么?(2)下表中的数据是使用某种调查方法获得的:(注:每组可含最低值、不含最高值)根据表中的数据填写表中的空格.根据填写的数据绘制频数分布直方图.解析:(1)在统计中收集数据必须用随机抽样的方法所抽取的数据才具有代表性.①中,少体校的男子篮球、排球的运动员的身高一定高于一般的情况,因此无法用测量的结果去估计总体的结果.②中,用外地学生的身高也不能准确地反映本地学生身高的实际情况. ③中的抽样方法符合随机的抽样,因此用方案③比较合理.(2)①上表中的频数从上到下依次为15,33,96,33,3.②直方图如下.数身高(cm)点评:统计中数据的获得要合理、公平、具有代表性,这是解决问题的第一关,它直接影响着统计的结果,影响正确结论的得出,也就影响着正确决策的制定.【例3】从某校参加初中毕业考试的学生中,抽取了30名学生的数学成绩,分数如下:90,85,84,86,87,98,79,85,90,93,68,95,85,71,78,61,94,88,77,100,70,97,85,68,99,88,85,92,93,97.这个样本数据的频率分布表如下:填空:(1)这个样本数据的众数是分.答案:85(2)列频率分布表时,所取的组距为分.答案:5(3)在这个频率分布表中,数据落在94.5~99.5分范围内的频数为 . 答案:5(4)在这个频率分布表中,数据落在74.5~79.5分范围内的频率为 . 答案:0.100(5)在这个频率分布表中,频率最大的一组数据的范围是 分. 答案:84.5~89.5(6)估计这个学校初中毕业考试的数学成绩在80分以上(含80分)的约占 %. 答案:73.3(7)画出频率分布直方图和折线图. 答案:频率分布直方图和折线图如下:数频率 组距分数频率组距点评:题目重点考查对统计初步各个概念的理解以及对频率分布表的认识,是基础但也是非常重要的内容.一般地,将频率分布直方图中各个矩形上底的中点顺次连结起来,就得到一条折线,我们称之为本组数据的频率分布折线图.如果将样本的容量取得足够大,分组的组距取得足够小,则这条折线将趋近于一条曲线,我们称之为总体分布的密度曲线.【例4】甲、乙两篮球运动员上一个赛季的得分如下: 甲:21,25,31,31,14,34,32,41,50,23,8. 乙:13,34,35,34,23,24,41,50,32,37,32. 试比较两人的得分水平. 解析:画茎叶图,由图可知,乙运动员的得分大致对称,其平均数、众数、中位数都是30多分,比甲稳定.甲乙840131 5 323 41 1 4 234 5 4 7 2141点评:用茎叶图刻画数据有两个优点,一是所有信息从图中可以得到,二是茎叶图便于记录和表示,但茎叶图对于表示三位数以上的数据是不够方便的.。
高中数学课时分层作业6总体分布的估计(含解析)苏教版必修3
课时分层作业(六) 总体分布的估计
(建议用时:60分钟)
[基础达标练]
一、选择题
1.一个容量为20的样本,已知某组的频率为0.25,则该组的频数为( ) A .5 B .10 C .15
D .20
A [该组的频数为20×0.25=5.]
2.某班学生在一次数学考试中的成绩分布如下表:
A .6
B .7
C .13
D .32
C [分数低于100的共2+5+6=13(人).]
3.在样本的频率分布直方图中,共有5个小矩形,若正中间一个小矩形的面积等于其他4个小矩形的面积和的1
4
,且样本容量为100,则正中间的一组的频数为( )
A .10
B .20
C .25
D .50
B [在频率分布直方图中,各小矩形的面积表示相应组的频率,且和为1.设正中间的一组面积为S ,则有S +4S =1,得S =0.2,即该组的频率为0.2.又样本容量为100,所以该组的频数为100×0.2=20.]
4.将容量为100的样本数据,从小到大排列,分成8个组,如表:
则第A .0.15 B .0.4 C .0.3
D .0.2
A[8个小组的频数之和等于样本容量100,故第5组的频数x=100-(10+13+14+14+13+12+9)=15.
所以第5组数据的频率为15
100
=0.15.]
5.某学校为了了解学生每周在校用餐的开销情况,抽出了一个容量为500的学生样本,已知他们的开销都不低于20元且不超过60元,样本的频率分布直方图如图,则其中支出在[50,60]元的同学人数为( )
A.170 B.120
C.180 D.150
D[开销在[50,60]元的频率为1-(0.01+0.024+0.036)×10=0.3,所以支出在[50,60]元的同学有0.3×500=150(人).]
二、填空题
6.一个频数分布表(样本容量为30)不小心被损坏了一部分,若样本中数据在[20,60)内的频率为0.6,则样本中在[40,60)内的数据的频率为________.
0.2 [样本中在[40,60)内的数据的个数为30×0.6-8-4=6,故样本中在[40,60)内的
数据的频率为6
30
=0.2.]
7.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图所示),由图中数据可知a=________.
0.030 [因为频率分布直方图中各小长方形的面积之和为1,所以10×(0.005+0.035+a+0.020+0.010)=1,解得a=0.030.]
8.为了解某一段公路上汽车通过时的车速情况,现随机抽测了通过这段公路的200辆汽车的时速,所得数据均在区间[40,80)内,其频率分布直方图如图所示,则在抽测的这200辆
汽车中,时速在区间[40,60)内的汽车有________辆.
80 [时速在区间[40,60)内的车辆的频率:10×(0.01+0.03)=0.4,时速在[40,60)内的车辆数:0.4×200=80.]
三、解答题
9.为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110)为达标,则可估计该校全体高一年级学生的达标率是多少? 思路点拨:利用小矩形的面积就是样本数据落在相应组内的频率来解决问题.
[解] (1)由于频率分布直方图是以面积的形式来反映数据落在各小组内的频率大小的, 因此第二小组的频率为42+4+17+15+9+3=0.08.
因为第二小组的频率=第二小组的频数
样本容量,
所以样本容量=第二小组的频数第二小组的频率=12
0.08
=150.
(2)由频率分布直方图可估计该校全体高一年级学生的达标率为17+15+9+32+4+17+15+9+3
×100%=88%.
10.已知50个数据的分组以及各组的频率如下: [153.5,155.5),2 [155.5,157.5),7 [157.5,159.5),9 [159.5,161.5),11 [161.5,163.5),10 [163.5,165.5),6 [165.5,167.5),4 [167.5,169.5],1
(1)列出频率分布表;
(2)画出频率分布直方图和频率分布折线图.
[解](1)频率分布表如下
分组频数频率
[153.5,155.5)20.04
[155.5,157.5)70.14
[157.5,159.5)90.18
[159.5,161.5)110.22
[161.5,163.5)100.20
[163.5,165.5)60.12
[165.5,167.5)40.08
[167.5,169.5]10.02
合计50 1.00
(2)
[能力提升练]
1.在抽查某批产品尺寸的过程中,样本尺寸数据的频率分布表如下,则m等于( )
分组[100,200
)
[200,300
)
[300,400
)
[400,500
)
[500,600
)
[600,700
]
频数1030408020m 频率0.050.150.20.4 a b
C.20 D.10
C[∵频率、频数的关系为频率=频数
样本容量
,
∴
80
0.4
=
20
a
,∴a=0.1.
∵表中各组的频率之和等于1,∴b=1-0.9=0.1,∴m=20.]
2.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到
右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )
A.20 B.18
C.16 D.12
D[志愿者的总人数为20
(0.16+0.24)×1
=50,
所以第三组人数为50×0.36=18,
有疗效的人数为18-6=12.]
3.对某项活动中800名志愿者的年龄抽样统计后,得到如图所示的频率分布直方图,但是年龄在[25,30)内的数据不慎丢失,依据此图可得.年龄在[25,30)内对应小长方形的高度为________.
0.04 [设年龄在[25,30)内对应小长方形的高度为x,则有5×(0.01+x+0.07+0.06+0.02)=1,解得x=0.04,所以年龄在[25,30)内对应小长方形高度为0.04.] 4.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为________.
480 [不少于60分的学生的频率为(0.030+0.025+0.015+0.010)×10=0.8,所以该
模块测试成绩不少于60分的学生人数应为600×0.8=480.]
5.某班100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].
(1)求图中a的值;
(2)若在同一组数据中,将该组区间的中点值作为这组数据的平均分,根据频率分布直方图,估计这100名学生语文成绩的平均分;
(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如表所示,求数学成绩在[50,90)之外的人数.
分数段[50,60)[60,70)[70,80)[80,90)
x∶y 1∶12∶13∶44∶5 [解
(2)估计这次语文成绩的平均分x=55×0.05+65×0.4+75×0.3+85×0.2+95×0.05=73.
所以这100名学生语文成绩的平均分为73分.
(3)分别求出语文成绩在分数段[50,60),[60,70),[70,80),[80,90)的人数依次为
0.05×100=5,0.4×100=40,0.3×100=30,0.2×100=20.
所以数学成绩分数段在[50,60),[60,70),[70,80),[80,90)的人数依次为5,20,40,25.
所以数学成绩在[50,90)之外的人数有100-(5+20+40+25)=10(人).。