优化方案2014数学(人教A理)一轮课件:9.2用样本估计总体
- 格式:ppt
- 大小:611.02 KB
- 文档页数:37
第二节用样本估计总体[备考方向要明了]考什么怎么考1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(平均数、标准差),并给出合理解释.4.会用样本的频率分布估计总体的分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题. 1.由于高考对统计考查的覆盖面广,几乎对所有的统计考点都有涉及,其中频率分布直方图、均值与方差、茎叶图是核心,题型多是选择题或填空题,难度不大,如2012年某某T5,某某T6等.2.近几年来,对概率统计的综合问题考查的力度有所加大,题目难度中低档,如2012年某某T17等.[归纳·知识整合]1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差);(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.3.茎叶图的优点茎叶图的优点是可以保留原始数据,而且可以随时记录,方便记录与表示. 4.标准差和方差(1)标准差是样本数据到平均数的一种平均距离. (2)标准差:s =1n[x 1-x-2+x 2-x-2+…+x n -x-2].(3)方差:s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2](x n 是样本数据,n 是样本容量,x 是样本平均数).5.利用频率分布直方图估计样本的数字特征(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值.(2)平均数:平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)众数:在频率分布直方图中,众数是最高的矩形的中点的横坐标. [探究] 1.在频率分布直方图中如何确定中位数?提示:在频率分布直方图中,中位数左边和右边的直方图的面积是相等的. 2.利用茎叶图求数据的中位数的步骤是什么?提示:(1)将茎叶图中数据按大小顺序排列;(2)找中间位置的数.[自测·牛刀小试]1.(2012·某某高考)在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( )A .众数B .平均数C .中位数D .标准差解析:选D 只有标准差不变,其中众数、平均数和中位数都加2. 2.(2011·某某模拟)如图是根据某校10位高一同学的身高(单位:cm)画出的茎叶图,其中左边的数字从左到右分别表示学生身高的百位数字和十位数字,右边的数字表示学生身高的个位数字,从图中可以得到这10位同学身高的中位数是( )A .161B .16215 5 5 7 8 16 1 3 3 5 1712C .163D .164解析:选B 由给定的茎叶图可知,这10位同学身高的中位数为161+1632=162.3.某校举行2013年元旦汇演,七位评委为某班的小品打出的分数如下茎叶统计图,去掉一个最高分和一个最低分,所剩数据的方差为________.解析:由茎叶图知,去掉一个最高分和一个最低分,所剩数据为84,84,86,84,87,所以由公式得方差为1.6.答案:1.64.从一堆苹果中任取10只,称得它们的质量如下(单位:克):125,120,122,105,130,114,116,95,120,134,则样本数据落在[114.5,124.5)内的频率为________.解析:数据落在[114.5,124.5)内的有:120,122,116,120共4个,故所求频率为410=0.4.答案:0.45.(2012·某某模拟)将容量为n 的样本中的数据分为6组,绘制频率分布直方图,若第一组至第六组的数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和为27,则n =________.解析:由已知,得2+3+42+3+4+6+4+1·n =27,即920·n =27,解得n =60. 答案:60频率分布直方图的应用[例1] (1)在样本频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形面积和的14,且样本容量为160,则中间一组的频数为( )A .32B .0.2C .40D .0.25(2)某区高二年级的一次数学统考中,随机抽取200名同学的成绩,成绩全部在50分至100分之间,将成绩按如下方7 9 8 4 4 6 4 7 93式分成5组:第一组,成绩大于等于50分且小于60分;第二组,成绩大于等于60分且小于70分;……第五组,成绩大于等于90分且小于等于100分,据此绘制了如图所示的频率分布直方图.则这200名同学中成绩大于等于80分且小于90分的学生有______名.[自主解答] (1)由频率分布直方图的性质,可设中间一组的频率为x ,则x +4x =1,解得x =0.2.故中间一组的频数为160×0.2=32.(2)由题知,成绩大于等于80分且小于90分的学生所占的频率为1-(0.005×2+0.025+0.045)×10=0.2,所以这200名同学中成绩大于等于80分且小于90分的学生有200×0.2=40名.[答案] (1)A (2)40 ——————————————————— 频率分布直方图反映了样本的频率分布(1)在频率分布直方图中纵坐标表示频率组距,频率=组距×频率组距.(2)频率分布表中频率的和为1,故频率分布直方图中各长方形的面积和为1.1.已知一个样本容量为100的样本数据的频率分布直方图如图所示,样本数据落在[6,10)内的样本频数为________,样本数据落在[2,10)内的频率为________.解析:样本数据落在[6,10)内的样本频数为0.08×4×100=32,样本数据落在[2,10)内的频率为(0.02+0.08)×4=0.4.答案:32 0.4数字特征的应用[例2] (2012·某某高考)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差[自主解答] 由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A 错;甲、乙的成绩的中位数分别为6,5,B 错;甲、乙的成绩的方差分别为15×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,15×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=125,C 对;甲、乙的成绩的极差均为4,D 错.[答案] C ———————————————————样本数字特征及公式推广(1)平均数和方差都是重要的数字特征,是对总体一种简明的阐述.平均数、中位数、众数描述总体的集中趋势,方差和标准差描述波动大小.(2)平均数、方差公式的推广若数据x 1,x 2,…,x n 的平均数为x -,方差为s 2,则数据mx 1+a ,mx 2+a ,…,mx n +a 的平均数为m x -+a ,方差为m 2s 2.2.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e ,众数为m 0,平均值为x ,则( )A .m e =m 0=xB .m e =m 0<xC .m e <m 0<xD .m 0<m e <x解析:选D 由图可知,30名学生的得分情况依次为:2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分.中位数为第15,16个数(分别为5,6)的平均数即m e =5.5,5出现次数最多,故m 0=5,x =2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×1030≈5.97.于是得m 0<m e <x .茎叶图的应用[例3] 某校高三年级进行了一次数学测验,随机从甲、乙两班各抽取6名同学,所得分数的茎叶图如图所示.甲班乙 班2 9 1 7 0 8 03 6 62 7 2 586(1)根据茎叶图判断哪个班的平均分数较高,并说明理由;(2)现从甲班这6名同学中随机抽取两名同学,求他们的分数之和大于165分的概率. [自主解答] (1)因为乙班的成绩集中在80分,且没有低分,所以乙班的平均分比较高. (2)设从甲班中任取两名同学,两名同学分数之和超过165分为事件A .从甲班6名同学中任取两名同学,则基本事件空间中包含了15个基本事件,又事件A 中包含4个基本事件,所以,P (A )=415.即从甲班中任取两名同学,两名同学分数之和超过165分的概率为415.———————————————————茎叶图的优缺点由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较繁琐.3.(2012·某某高考)如图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.(注:方差s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为x 1,x 2,…,x n的平均数)解析:该运动员五场比赛中的得分为8,9,10,13,15,平均得分x =8+9+10+13+155=11,方差s 2=15[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=6.8.0 8 9 135答案:6.84.随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图(中间的数字表示身高的百位、十位数,旁边的数字分别表示身高的个位数)如图所示.甲班乙班2 18 1981017256698842163598 15 7(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差.解:(1)由茎叶图可知乙班身高比较集中在170~181之间,所以乙班的平均身高较高.(2)甲班的方差为:1×[(182-170)2+(179-170)2+(178-170)2+(171-170)2+(170-170)2+(168-10170)2+(168-170)2+(164-170)2+(162-170)2+(158-170)2]=54.2.2个异同——众数、中位数和平均数的异同,标准差和方差的异同(1)众数、中位数和平均数的异同①众数、中位数和平均数都是描述一组数据集中趋势的量,平均数是最重要的量.②由于平均数与每一个样本数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数和中位数都不具有的性质.③众数考查各数据出现的频率,其大小只与这组数据中部分数据有关.当一组数据中有不少数据多次重复出现时,其众数往往更能反映问题.④某些数据的改动对中位数可能没有影响,中位数可能出现在所给的数据中,也可能不在所给的数据中.当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势.(2)标准差和方差的异同标准差和方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大;标准差、方差越小,数据的离散程度则越小.因为方差与原始数据的单位不同,且平方后可能夸大了偏差程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.2个区别——直方图与条形图的区别不要把直方图错以为条形图,两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,纵坐标刻度为频率/组距,这是密度,连续随机变量在某一点上是没有频率的.易误警示——频率分布直方图中的易误点[典例] (2012·某某高考)如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的X 围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5℃的城市个数为11,则样本中平均气温不低于25.5℃的城市个数为________.[解析] 最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右边矩形面积为0.18×1=0.18,50×0.18=9.[答案] 9 [名师点评]1.忽视频率分布直方图中纵轴的含义为频率/组距,误认为是每组相应的频率值,导致失误;2.不清楚直方图中各组的面积之和为1,导致某组的频率不会求;3.不理解由直方图求样本平均值的方法,误用每组的频率乘以每组的端点值而导致失误;4.由直方图确定众数时应为最高矩形中点对应的横坐标值,中位数应为左右两侧的频率均等各为12.[变式训练]对某种电子元件的使用寿命进行跟踪调查,所得样本的频率分布直方图如图所示,由图可知,这一批电子元件中使用寿命在100~300 h 的电子元件的数量与使用寿命在300~600 h 的电子元件的数量的比是________.解析:寿命在100~300 h 的电子元件的频率为⎝ ⎛⎭⎪⎫12 000+32 000×100=420=15;寿命在300~600 h 的电子元件的频率为⎝ ⎛⎭⎪⎫1400+1250+32 000×100=45. 则它们的电子元件数量之比为15∶45=14.答案:14一、选择题(本大题共6小题,每小题5分,共30分)1.(2012·某某高考)容量为20的样本数据,分组后的频数如下表: 分组 [10,20) [20,30) [30,40) [40,50) [50,60) [60,70) 频数234542则样本数据落在区间[10,40)的频率为( ) A .0.35 B .0.45 C .0.55 D .0.65解析:选B 求得该频数为2+3+4=9,样本容量是20,所以频率为920=0.45.2.某校100名学生的数学测试成绩分布直方图如图所示,分数不低于a 即为优秀,如果优秀的人数为20人,则a 的估计值是( )A .130B .140C .134D .137解析:选C 由题意知,优秀的频率为0.2,故a 的值在130~140之间,则(140-a )×0.015=0.1,解得a =133.4.3.(2012·某某高考)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A .46,45,56B .46,45,53C .47,45,56D .45,47,53解析:选A 从茎叶图中可以看出样本数据的中位数为中间两个数的平均数,即45+472=46,众数为45,极差为68-12=56.4.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:学生 1号 2号 3号 4号 5号 甲班 6 7 7 8 7 乙班67679A.25B.725C.35D .2 解析:选A x 甲=7,s 2甲=15[(6-7)2+(7-7)2+(7-7)2+(8-7)2+(7-7)2]=25,x乙=7,s 2乙=15[(6-7)2+(7-7)2+(6-7)2+(7-7)2+(9-7)2]=65,两组数据的方差中较小的一个为s 2甲,即s 2=25.5.某单位举办技能比赛,9位评委给生产科打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若记分员计算无误,则数字x 应该是( )评委给生产科打出的分数8 9 8 792x3421A.2 B .3 C .4 D .5解析:选A 若数字90+x 是最高分,则为x 1=17(88+89+91+92+92+93+94)≈91.3,不合题意,因此最高分为94分,此时平均分x 2=17(88+89+91+92+92+93+90+x ),∴17(635+x )=91,解得x =2. 6.(2012·某某高考)小波一星期的总开支分布如图(1)所示,一星期的食品开支如图(2)所示,则小波一星期的鸡蛋开支占总开支的百分比为( )A .30%B .10%C .3%D .不能确定解析:选C 由图(1)得到小波一星期的总开支,由图(2)得到小波一星期的食品开支,从而再借助图(2)计算出鸡蛋开支占总开支的百分比.由图(2)知,小波一星期的食品开支为30+40+100+80+50=300元,由图(1)知,小波一星期的总开支为30030%=1 000元,则小波一星期的鸡蛋开支占总开支的百分比为301 000×100%=3%.二、填空题(本大题共3小题,每小题5分,共15分) 7.(2013·某某模拟)学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为n 且支出在[20,60)元的样本,其频率分布直方图如图所示,其中支出在[50,60)元的同学有30人.则n 的值为________.解析:支出在[50,60)的频率为1-0.36-0.24-0.1=0.3,因此30n=0.3,故n =100.答案:100147888.(2013·某某模拟)为了分析某篮球运动员在比赛中发挥的稳定程度,统计了该运动员在6场比赛中的得分,用茎叶图表示如图,则该组数据的方差为________.解析:该运动员6场的总得分为14+17+18+18+20+21=108,平均得分为1086=18分,方差=16[(14-18)2+(17-18)2+(18-18)2+(18-18)2+(20-18)2+(21-18)2]=5.答案:59.为了了解某某市今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图所示),已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为120,则抽取的学生人数是________.解析:由频率分布直方图知:学生的体重在65~75 kg 的频率为(0.012 5+0.037 5)×5=0.25,则学生的体重在50~65 kg 的频率为1-0.25=0.75.从左到右第2个小组的频率为0.75×26=0.25,所以抽取的学生人数是120÷0.25=480. 答案:480三、解答题(本大题共3小题,每小题12分,共36分)10.(2012·某某高考)若某产品的直径长与标准值的差的绝对值不超过1 mm 时,则视为合格品,否则视为不合格品,在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5 000件进行检测,结果发现有50件不合格品.计算这50件不合格品的直径长与标准值的差(单位:mm),将所得数据分组,得到如下频率分布表:分组 频数频率 [-3,-2)0.10 [-2,-1) 8(1,2]0.50 (2,3] 10(3,4]合计501.00(1)将上面表格中缺少的数据补充完整;(2)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率;(3)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品.据此估算这批2 0 1产品中的合格品的件数.解:(1)频率分布表分组 频数 频率 [-3,-2) 5 0.10 [-2,-1) 8 0.16 (1,2] 25 0.50 (2,3] 10 0.20 (3,4] 2 0.04 合计501.00(2)由频率分布表知,该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率约为0.50+0.20=0.70.(3)设这批产品中的合格品数为x 件,依题意有505 000=20x +20,解得x =5 000×2050-20=1 980.所以该批产品的合格品件数估计是1 980件.11.(2012·某某高考)某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中x 的值;(2)从成绩不低于80分的学生中随机选取2人,该2人中成绩在90分以上(含90分)的人数记为ξ,求ξ的数学期望.解:(1)由题意得:10x =1-(0.006×3+0.01+0.054)×10=0.18, 所以x =0.018.(2)∵成绩不低于80分的学生共有(0.018+0.006)×10×50=12人,其中90分以上(含90分)的共有0.006×10×50=3人,因此ξ的可能值为0,1,2三个值,P (ξ=0)=C 29C 212=611,p (ξ=1)=C 19C 13C 212=922,P (ξ=2)=C 23C 212=122,∴ξ的分布列为:∴E (ξ)=0×611+1×922+2×22=2.12.某中学共有1 000名学生参加了该地区高三第一次质量检测的数学考试,数学成绩如下表所示:样的方法抽取100名同学进行问卷调查,甲同学在本次测试中数学成绩为95分,求他被抽中的概率;(2)已知本次数学成绩的优秀线为110分,试根据所提供数据估计该中学达到优秀线的人数;(3)作出频率分布直方图,并估计该学校本次考试的数学平均分(同一组中的数据用该组区间的中点值作代表).解:(1)分层抽样中,每个个体被抽到的概率均为样本容量总体中个体总数,故甲同学被抽到的概率P =110. (2)由题意得x =1 000-(60+90+300+160)=390. 故估计该中学达到优秀线的人数m =160+390×120-110120-90=290.(3)频率分布直方图如图所示.该学校本次考试的数学平均分.x=60×15+90×45+300×75+390×105+160×1351 000=90.估计该学校本次考试的数学平均分为90分.1.(2012·某某高考)从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲乙两组数据的平均数分别为x甲,x乙,中位数分别为m甲,m乙,则( )A.x甲<x乙,m甲>m乙B.x甲<x乙,m甲<m乙C.x甲>x乙,m甲>m乙D.x甲>x乙,m甲<m乙解析:选B 由茎叶图可知甲数据集中在10至20之间,乙数据集中在20至40之间,明显x甲<x乙,甲的中位数为20,乙的中位数为29,即m甲<m乙.2.某乡镇供电所为了调查农村居民用电量情况,随机抽取了500户居民去年的月均用电量(单位:kW/h),将所得数据整理后,画出频率分布直方图如下,其中直方图从左到右前3个小矩形的面积之比为1∶2∶3,试估计:(1)该乡镇月均用电量在[39.5,43.5)内的居民所占百分比约是多少?(2)该乡镇居民月均用电量的中位数约是多少?(精确到0.01)解:(1)设直方图从左到右前3个小矩形的面积分别为P,2P,3P.由直方图可知,最后两个小矩形的面积之和为(0.087 5+0.037 5)×2=0.25.因为直方图中各小矩形的面积之和为1,所以P +2P +3P =0.75,即P =0.125. 所以3P +0.087 5×2=0.55.由此估计,该乡镇居民月均用电量在[39.5,43.5)内的居民所占百分比约是55%. (2)显然直方图的面积平分线位于正中间一个矩形内,且该矩形在面积平分线左侧部分的面积为0.5-P -2P =0.5-0.375=0.125,设样本数据的中位数为39.5+x .因为正中间一个矩形的面积为3P =0.375,所以x ∶2=0.125∶0.375,即x =23≈0.67.从而39.5+x ≈40.17,由此估计,该乡镇居民月均用电量的中位数约是40.17(kW/h). 3.为了解学生身高情况,某校以10%的比例对全校700名学生按性别进行分层抽样调查,测得身高情况的统计图如图所示.(1)估计该校男生的人数;(2)估计该校学生身高在170~185 cm 之间的概率;(3)从样本中身高在180~190 cm 之间的男生中任选2人,求至少有1人身高在185~190 cm 之间的概率.解:(1)样本中男生人数为40,分层抽样比为10%. 故估计全校男生人数为400.(2)由统计图知,样本中身高在170~185 cm 之间的学生有14+13+4+3+1=35人,样本容量为70.故该校学生身高在170~185 cm 之间的概率P 1=3570=0.5.(3)由统计图知,样本中身高在180~185 cm 之间的男生有4人(不妨设为A 、B 、C 、D ),样本身高在185~190 cm 之间的男生有2人(不妨设为E ,F )从身高在180~190 cm 之间的6人中任选2人有15种结果,其中至少1人身高在185~190 cm 之间的结果有9种,9 15=35.故所求事件的概率P2=。