人教B版(2019)数学必修(第二册):5.1.4 用样本估计总体 学案
- 格式:docx
- 大小:162.30 KB
- 文档页数:9
用样本估计总体【学习目标】1.理解样本数据标准差的意义和作用,会计算数据标准差,对样本数据中提取基本的数字作合理的解释。
2.会用样本的基本数字特征估计总体的基本数字特征。
3.培养统计意识,形成尊重事实、用数据说话的态度,认识数据处理的实际意义。
【学习重难点】根据有关问题查找资料或调查,用随机抽样的方法选取样本,能用样本的平均数和方差对总体、个体有合理的估计和推测。
【学习过程】一、问题提出1.对一个未知总体,我们常用样本的频率分布估计总体的分布,其中表示样本数据的频率分布的基本方法有哪些?频率分布直方图、频率分布表、频率分布折线图、茎叶图2.美国NBA在2006-2007年度赛季中,甲、乙两名篮球运动员在随机抽取的12场比赛中的得分情况如下:甲运动员得分:12,15,20,25,31,30,36,36,37,39,44,49。
乙运动员得分:8,13,14,16,23,26,28,38,39,51,31,39。
如果要求我们根据上面的数据,估计、比较甲,乙两名运动员哪一位发挥得比较稳定,就得有相应的数据作为比较依据,即通过样本数据对总体的数字特征进行研究,用样本的数字特征估计总体的数字特征。
二、能力探究用样本的平均数来估测总体的平均数“珍惜能源,从我做起,节约用电,人人有责”。
为了解某小区居民节约用电情况,物业公司随机抽取了今年某一天本小区10户居民的日用电量,数据如下:(1)求这组数据的平均数;(2)已知去年同一天这10户居民的平均日用电量为7.8度,请你估计,这天与去年同日相比,该小区200户居民这一天节约了多少度电?分析:(1)用算术平均数公式可计算出平均数;(2)由10户居民的平均日用电量估计该小区200户居民的平均日用电量,所以该小区节约的用电量等于用电户数与两年同一天的日平均用电量之差的积。
解:(1)这组数据的平均数为:x=4.4+4.0+5.0+5.6+3.4+4.8+3.4+5.2+4.0+4.210=44 10=4.4(度)(2)200×(7.8-4.4)=680(度),即该小区200户居民这一天大约节约了680度电。
5.1.4 用样本估计总体5.2 数学探究活动:由编号样本估计总数及其模拟(略)素养目标·定方向课程标准学法解读1.能用样本的数字特征估计总体的数字特征. 2.能用样本的分布估计总体的分布.通过用样本估计总体,提升学生的数据分析、数学运算和逻辑推理素养.必备知识·探新知知识点用样本估计总体(1)前提样本的容量恰当,抽样方法合理. (2)必要性①在容许一定误差存在的前提下,可以用样本估计总体,这样能节省人力和物力. ②有时候总体的数字特征不可能获得,只能用__样本__估计总体. (3)误差估计一般是有__误差__的.但是,大数定律可以保证,当样本的容量__越来越大__时,估计的误差很小的可能性将越来越大.思考:用样本估计总体出现误差的原因有哪些?提示:样本抽取的随机性;样本抽取的方法不合适,导致代表性差;样本容量偏少等. 知识点用样本的数字特征来估计总体的数字特征(1)一般来说,在估计总体的数字特征时,只需直接算出样本对应的__数字特征__即可. (2)样本是用分层抽样得到的,由每一层的数字特征估计总体的数字特征.以分两层抽样的情况为例.条件假设第一层有m 个数,分别为x 1,x 2,…,x m ,平均数为x -,方差为s 2;第二层有n 个数,分别为y 1,y 2,…,y n ,平均数为y -,方差为t 2 结论如果记样本的平均值为a ,样本方差为b ,则a -=m x -+n y-m +n,b 2=1m +n ×⎣⎡⎦⎤(ms 2+nt 2)+mn m +n (x --y -)2知识点用样本的分布来估计总体的分布如果总体在每一个分组的频率记为π1,π2,…,πn ,样本在第一组对应的频率记为p 1,p 2,…,p n ,一般来说,1n ∑i =1n(πi -p i )2不等于零.当样本的容量__越来越大__时,上式很小的可能性将越来越大.关键能力·攻重难题型探究题型用样本的特征数估计总体的特征数角度1 简单随机抽样的数字特征 ┃┃典例剖析__■典例1 甲、乙两机床同时加工直径为100 cm 的零件,为检验质量,各从中抽取6件测量,数据为甲:99 100 98 100 100 103 乙:99 100 102 99 100 100 (1)分别计算两组数据的平均数及方差;(2)根据计算结果判断哪台机床加工零件的质量更稳定. [解析] (1)x -甲=16(99+100+98+100+100+103)=100,x -乙=16(99+100+102+99+100+100)=100.s 2甲=16[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=73, s 2乙=16[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.(2)两台机床所加工零件的直径的平均值相同,又s 2甲>s 2乙,所以乙机床加工零件的质量更稳定. 规律方法:(1)利用样本的原始数据求得的样本数字特征是准确值,可用以估计总体. (2)此类问题需计算样本的平均值和方差来估计总体. ┃┃对点训练__■1.为了快速了解某学校学生体重(单位:kg)的大致情况,随机抽取了10名学生称重,得到的数据整理成茎叶图如图所示.估计这个学校学生体重的平均数和方差.4 5 9 7 9 6 6 5 1 8 9 6[解析] 将样本中的每一个数都减去50,可得 -5,-1,-3,-1,-4,-4,1,8,9,10,这组数的平均数为-5-1-3-1-4-4+1+8+9+1010=1,方差为62+22+42+22+52+52+02+72+82+9210=30.4,因此可估计这个学校学生体重的平均数为51,方差为30.4. 角度2 分层抽样的数字特征 ┃┃典例剖析__■典例2 在对树人中学高一年级学生身高(单位:cm)的调查中,采用分层抽样的方法,抽取了男生23人,其平均数和方差分别为170.6和12.59,抽取了女生27人,其平均数和方差分别为160.6和38.62,你能由这些数据计算出样本的方差,并对高一年级全体学生身高的方差作出估计吗?[解析] 把样本中男生的身高记为x 1,x 2,…,x 23,其平均数记为x -,方差记为s 2x ;把样本中女生的身高记为y 1,y 2,…,y 27,其平均数记为y -,方差记为s 2y ,把样本的平均数记为a -,方差记为s 2.则a -=23×170.6+27×160.623+27=165.2,s 2=23×[s 2x +(x --a -)2]+27×[s 2y+(y --a -)2]23+27=23×[12.59+(170.6-165.2)2]+27×[38.62+(160.6-165.2)2]50=51.486 2,即样本的方差为51.486 2.因此估计高一年级全体学生身高的方差为51.486 2.规律方法:1.求分层随机抽样的平均数的步骤 (1)求样本中不同层的平均数;(2)应用分层随机抽样的平均数公式进行求解. 2.求分层随机抽样的方差的步骤 (1)求样本中不同层的平均数; (2)求样本中不同层的方差;(3)应用分层随机抽样的方差公式进行求解. ┃┃对点训练__■2.为了解某公司员工的身体情况,利用分层抽样的方法抽取了9名男员工的身高和体重数据,计算得到他们的体质指数的平均数为25.1,方差为6,抽取了5名女员工的身高和体重数据,计算得到她们的体质指数的平均数为20.3,方差为3.求样本平均数与方差.[解析] 样本平均数x -=9×25.1+5×20.39+5≈23.4,方差s 2=9×[6+(25.1-23.4)2]+5×[3+(20.3-23.4)2]9+5≈10.2. 题型用样本的分布估计总体的分布┃┃典例剖析__■典例3 我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x (吨),一位居民的月用水量不超过x 的部分按平价收费,超出x 的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a 的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由; (3)若该市政府希望使85%的居民每月的用水量不超过标准x (吨),估计x 的值,并说明理由.[解析] (1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a +0.20+0.26+0.5×a +0.06+0.04+0.02=1,解得a =0.30. (2)由(1)可知,100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12. 由以上样本的频率,可以估计全市30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85, 而前5组的频率之和为:0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以2.5≤x <3, 由0.3×(x -2.5)=0.85-0.73, 所以x =2.9,所以估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.规律方法:(1)由于频率分布表、频率分布直方图丢失了样本的原始数据,以此求得数字特征都是样本数字特征的估计值.(2)可用样本的分布估计总体的分布. ┃┃对点训练__■3.某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层随机抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如图所示的频率分布直方图:(1)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (2)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.[解析] (1)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,分数在区间[40,50)内的人数为100-100×0.9-5=5. 所以总体中分数在区间[40,50)内的人数估计为400×5100=20.(2)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60, 所以样本中分数不小于70的男生人数为60×12=30.所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.所以根据分层随机抽样原理,总体中男生和女生人数的比例估计为3∶2.易错警示┃┃典例剖析__■典例4 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:成绩/m 1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90 人数23234111[错解] 根据以上数据可得众数为1.75,中位数为1.70+1.752=1.725,平均数为1.69.[辨析] 所求数据要注意单位问题,另外中位数计算错误.[正解] 在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75 m .表中的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是 1.70 m ;这组数据的平均数是x -=117(1.50×2+1.60×3+…+1.90×1)=28.7517≈1.69(m).故17名运动员成绩的众数、中位数、平均数依次为1.75 m,1.70 m,1.69 m .。
高中必修二数学教案《用样本估计总体》教材分析义务教育阶段,学生学习了统计内容,对数据统计全过程有所体验。
高中阶段要求进一步培养学生的随机思想,发展学生的统计观念。
其中包括:统计意识、统计方法及对统计结果的正确认识。
本节课《用样本估计总体》是抽样方法及数据的数字特征内容后的又一重要内容,通过本节课的学习,学生进一步掌握了对样本数据处理的重要方法之一——画频率分布直方图,以及用样本估计总体的思想,同时为学生在后续学习统计案例和应用统计知识解决实际问题打下良好的基础。
学情分析学生在初中就知道了分布的初步概念,在前面也刚学习过概率及抽样的相关知识,对用样本估计总体有一定的认识,对用表和图来反映知识有很强的意识,具有一定的作图能力和较为周全的分析问题能力,而学生的理解能力不足,发现问题能力上可能很难满足本节课的要求。
但学生对新知识兴趣高,肯下功夫,思维活跃,会为本节课的顺利推进提供一定的保障。
教学目标1、通过实例理解样本数据标准差的意义和作用,学会计算数据标准差。
2、进一步体会用样本估计总体的思想,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性。
教学重点用样本的数字特征估计总体的数字特征、通过频率分布或频率分布直方图对数据作出总体估计。
教学难点通过频率分布或频率分布直方图,对数据作出总体估计。
教学方法讲授法、讨论法、练习法教学过程一、情境导学以下是某学校高一年级98位学生的身高(单位:cm);已知这组数的总体平均数为163.5,总体方差为56.3。
用简单随机抽样的方法,从总体中抽取容量为10的样本3次,分别计算样本平均数与样本方差,并与总体对应的值进行比较。
二、学习新知1、用样本的数字特征估计总体的数字特征一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本的特征能够反映总体的特征。
特别地,样本平均值(也称为样本均值)、方差(也称为样本方差)与总体对应的值相差不会太大。
5.1.4 用样本估计总体(教师独具内容)课程标准:1.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义.2.结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义.3.结合实例,能用样本估计总体的取值规律.4.结合实例,能用样本估计百分位数,理解百分位数的统计含义.5.结合具体实例,掌握分层抽样的样本均值和样本方差.教学重点:用样本的数字特征估计总体的数字特征,用样本的分布估计总体的分布.教学难点:利用样本估计总体的思想解决一些简单的实际问题.知识点一 用样本的数字特征估计总体的数字特征一般情况下,如果样本的容量□01恰当,抽样方法又□02合理的话,样本的特征能够反映□03总体的特征.在容许一定误差存在的前提下,可以用样本的数字特征去估计□04总体的数字特征. 知识点二 分层抽样的平均数和方差已知由两层构成的样本中,假设第一层有m 个数,分别为x 1,x 2,…,x m ,平均数为x -,方差为s 2;第二层有n 个数,分别为y 1,y 2,…,y n ,平均数为y -,方差为t 2.则x -=1m ∑m i =1x i ,s 2=1m ∑m i =1(x i -x -)2, y -=□011n ∑n i =1y i ,t 2=□021n∑n i =1 (y i -y -)2. 如果记样本均值为a -,样本方差为b 2,则a -=□031m +n⎝⎛⎭⎫∑m i =1x i +∑n i =1y i =□04m x -+n y -m +n,b 2=□05m [s 2+(x --a -)2]+n [t 2+(y --a -)2]m +n=□061m +n ⎣⎢⎡⎦⎥⎤(ms 2+nt 2)+mn m +n (x --y -)2. 知识点三 用样本的分布来估计总体的分布如果样本的容量□01恰当,抽样方法又□02合理的话,样本的分布与□03总体分布会差不多.如果容许有一定误差,则可以用样本的分布去估计□04总体的分布.1.中位数不受几个极端数据(即排序靠前或靠后的数据)的影响,容易计算.它仅利用了数据中排在中间数据的信息.当样本数据质量比较差,即存在一些错误数据时,应该用抗极端性很强的中位数表示数据的中心值.2.如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中极端数据的信息.3.平均数与标准差在估计总体时的差异(1)平均数提供了样本数据的重要信息,但是平均数有时也会使人对总体作出片面的判断,样本中的最大值和最小值对平均数的影响较大,所以平均数有时难以概括样本数据的实际状态.(2)当样本的平均数相等或相差无几的时候,就要用样本数据的离散程度来估计总体的数字特征,而样本数据的离散程度,就由标准差来衡量.(3)标准差反映了各个样本数据聚集于样本平均数周围的程度.标准差越小,表明各个样本数据在样本平均数的周围越集中;反之,表明各个样本数据在样本平均数的周围越分散.4.茎叶图不仅能够保留原始数据,而且能够展示数据的分布情况.当样本数据较少时,用茎叶图表示数据的效果较好.它不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来了方便.但当样本数据较多时,茎叶图就显得不太方便.因为每一个数据都要在图中占据一个空间,如果数据很多,枝叶就会很长.5.频率分布直方图直观、形象地反映了样本的分布规律.但是从频率分布直方图中得不出原始的数据内容.把数据绘制成频率分布直方图后,原有的具体数据信息就被抹掉了.6.随着样本容量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越来越接近于一条光滑曲线.1.判一判(正确的打“√”,错误的打“×”)(1)一组样本数据的众数可能不止一个,而中位数是唯一的.( )(2)由样本的频率分布直方图,不能估计总体的众数、中位数和平均数.( )(3)当样本数据较多时,用茎叶图表示样本数据较好.( )(4)用样本频率估计总体分布的过程中,总体容量越小,估计越精确.( ) 答案 (1)√ (2)× (3)× (4)×2.做一做(1)我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为( )A .134石B .169石C .338石D .1365石 (2)某医院急救中心随机抽取20位病人等待急诊的时间记录如下表: 等待时间(分钟)[0,5) [5,10) [10,15) [15,20) [20,25] 频数4 85 2 1用上述分组资料计算出病人平均等待时间的估计值x -=________.(3)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中每周自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据频率分布直方图,则这200名学生中每周的自习时间不少于22.5小时的人数是________.答案(1)B(2)9.5(3)140题型一用样本平均数、方差估计总体例1甲、乙两台机床在相同的条件下同时生产一种零件,现在从中各抽测10个,它们的尺寸(单位:mm)如下茎叶图所示:(1)分别计算这两个样本的平均数和方差;(2)如果图纸上的设计尺寸为10 mm,从计算结果看,用哪台机床加工这种零件较合适?[解](1)由茎叶图可得样本数据分别为甲:8.9,9.7,9.9,9.9,10.0,10.1,10.1,10.2,10.3,10.9.乙:9.6,9.7,9.8,9.9,10.0,10.0,10.1,10.2,10.3,10.4.x-甲=110×(8.9+9.7+9.9+9.9+10.0+10.1+10.1+10.2+10.3+10.9)=10,x-乙=110×(9.6+9.7+9.8+9.9+10.0+10.0+10.1+10.2+10.3+10.4)=10,所以s2甲=110×[(8.9-10)2+(9.7-10)2+(9.9-10)2+(9.9-10)2+(10.0-10)2+(10.1-10)2+(10.1-10)2+(10.2-10)2+(10.3-10)2+(10.9-10)2]=0.228,s 2乙=110×[(9.6-10)2+(9.7-10)2+(9.8-10)2+(9.9-10)2+(10.0-10)2+(10.0-10)2+(10.1-10)2+(10.2-10)2+(10.3-10)2+(10.4-10)2]=0.06.(2)因为x -甲 =x -乙=10,s 2甲>s 2乙,所以用乙机床加工这种零件较合适.用样本估计总体时,样本的平均数、方差只是总体的平均数、方差的近似值.在实际中,当所得数据的平均数不同时,需先分析平均水平,再计算方差,分析稳定情况.从同一地块甲、乙两种玉米的苗中共抽18株,分别测得它们的株高(单位:cm)如下茎叶图所示:(1)哪种玉米的苗长得高?哪种玉米的苗长得齐?(2)这18株玉米株高的平均值和方差分别是多少?解 (1)由茎叶图可得所抽取的甲、乙两种玉米苗的株高分别为甲:15,21,22,25,37,39,40,41.乙:16,16,16,27,27,40,40,40,44,44.x -甲=18×(15+21+22+25+37+39+40+41)=30,x -乙=110×(16+16+16+27+27+40+40+40+44+44)=31.因为x -甲<x -乙,所以乙种玉米的苗长得高.s 2甲=18×[(15-30)2+(21-30)2+(22-30)2+(25-30)2+(37-30)2+(39-30)2+(40-30)2+(41-30)2]=93.25.s 2乙=110×[(16-31)2+(16-31)2+(16-31)2+(27-31)2+(27-31)2+(40-31)2+(40-31)2+(40-31)2+(44-31)2+(44-31)2]=128.8.因为s 2甲<s 2乙,所以甲种玉米的苗长得齐.(2)因为x -甲=30,s 2甲=93.25,甲种玉米抽了8株,x -乙=31,s 2乙=128.8,乙种玉米抽了10株,所以这18株玉米株高的平均值x -=818×30+1018×31≈30.56,这18株玉米株高的方差s 2=818×[93.25+(30-30.56)2]+1018×[128.8+(31-30.56)2]≈113.25.题型二 用频率分布直方图估计数据的数字特征例2 从高三抽出50名学生参加数学竞赛,由成绩得到如图的频率分布直方图.试利用频率分布直方图求:(1)这50名学生成绩的众数与中位数;(2)这50名学生成绩的平均数(答案精确到0.1).[解] (1)由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小长方形框的中间值的横坐标即为所求,所以由频率分布直方图得众数应为75.由于中位数是所有数据中的中间值,故在频率分布直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而就是小矩形的面积和相等.因此在频率分布直方图中将频率分布直方图中所有小矩形的面积一分为二的直线所对应的成绩即为所求.∵0.004×10+0.006×10+0.02×10=0.04+0.06+0.2=0.3,∴前三个小矩形面积的和为0.3,而第四个小矩形面积为0.03×10=0.3,0.3+0.3>0.5,∴中位数应位于第四个小矩形内.设其底边为x ,高为0.03,令0.03x =0.2得x ≈6.7,故中位数约为70+6.7=76.7.(2)样本平均值应是频率分布直方图的“重心”,即所有数据的平均值,取每个小矩形底边的中点值乘以每个小矩形的面积即可.∴平均数为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.021×10)+95×(0.016×10)≈73.7.(1)利用频率分布直方图估计一组数据的数字特征:①众数的估计值是最高小矩形的底边中点的横坐标;②中位数左右两侧直方图的面积相等;③平均数大约等于每个小矩形的面积与小矩形底边中点的横坐标之积的和.(2)利用频率分布直方图求得的众数、中位数、平均数均为估计值,往往与实际数据得出的结果不一致,但它们能粗略估计其众数、中位数和平均数.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.求:(1)高一参赛学生成绩的众数、中位数;(2)高一参赛学生成绩的平均数.解(1)由图可知众数为65,又∵第一、二个小矩形的面积分别为0.3,0,4,且0.3+0.4=0.7>0.5,∴设中位数为60+x,则0.3+x×0.04=0.5,得x=5,∴中位数为60+5=65.(2)依题意,平均数为55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67,∴高一参赛学生成绩的平均数为67.题型三用频率分布直方图估计总体的分布例3为了迎接某市作为全国文明城市的复查,爱卫会随机抽取了60位路人进行问卷调查,调查项目是自己对该市各方面卫生情况的满意度(假设被问卷的路人回答是客观的),以分数表示问卷结果,并统计他们的问卷分数,把其中不低于50分的分成五段:[50,60),[60,70),…,[90,100]后画出如图所示的部分频率分布直方图,观察图形信息,回答下列问题:(1)求出问卷调查分数低于50分的被问卷人数;(2)估计全市市民满意度在60分及以上的百分比.[解](1)因为各组的频率和等于1,故低于50分的频率为f=1-(0.015×2+0.030+0.025+0.005)×10=0.1,故低于50分的人数为60×0.1=6.(2)依题意,60分及以上的频率和为(0.015+0.030+0.025+0.005)×10=0.75,所以抽样满意度在60分及以上的百分比为75%.于是,可以估计全市市民满意度在60分及以上的百分比约为75%.频率分布直方图的应用频率分布指的是一个样本数据在各个小范围内所占比例的大小,一般用频率分布直方图反映样本的频率分布,其中:(1)频率分布直方图中纵轴表示频率组距;(2)频率分布直方图中,各个小长方形的面积等于频率,各个小长方形的面积之和为1;(3)长方形的高的比也就是频率之比;(4)频数相应的频率=样本容量.为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率约是多少?解(1)频率分布直方图是以面积的形式来反映数据落在各小组内的频率大小的,因此第二小组的频率为42+4+17+15+9+3=0.08.因为第二小组的频率=第二小组的频数样本容量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由直方图可估计该校全体高一年级学生的达标率约为17+15+9+32+4+17+15+9+3×100%=88%.1.在频率分布直方图中,各个长方形的面积表示()A.落在相应各组的数据的频数B.相应各组数据的频率C.该样本所分成的组数D.该样本的样本容量答案 B解析在频率分布直方图中,横轴是组距,纵轴是频率组距,故每个小长方形的面积是相应各组数据的频率.故选B.2.某班全体学生参加物理测试成绩的频率分布直方图如图所示,则估计该班物理测试成绩的平均数是()A.70 B.75C.68 D.66答案 C解析平均数就是频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标再求和,即0.005×20×30+0.010×20×50+0.020×20×70+0.015×20×90=68.3.为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校400名授课教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示如图.据此可估计该校上学期400名教师中,使用多媒体进行教学次数在[16,30)内的人数为()A.100 B.160C.200 D.280答案 B解析由茎叶图可知在20名教师中,上学期使用多媒体进行教学的次数在[16,30)内的人数为8,据此可以估计400名教师中,使用多媒体进行教学次数在[16,30)内的人数为820×400=160.4.某社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本频率分布直方图(如图所示).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10000人中再用分层抽样方法抽出100人进行调查,则在[2500,3000)(单位:元)的月收入段应抽出________人.答案25解析因为月收入在[2500,300)的频率为0.0005×500=0.25,所以10000人中月收入在[2500,3000)的人数为0.25×10000=2500.所以用分层抽样方法抽出100人,月收入在[2500,3000)的人数为10010000×2500=25.5.一个水库养了某种鱼10万条,从中捕捞了20条,称得它们的质量(单位:kg)如下茎叶图所示:计算样本的平均数,并根据结果估计水库中所有鱼的总质量.解 由茎叶图可得样本数据分别为:1.04,1.07,1.09,1.10,1.11,1.12,1.14,1.15,1.15,1.16,1.16,1.18,1.19,1.21,1.21,1.24,1.25,1.25,1.29,1.32.所以样本的平均数x -=120×(1.04+1.07+1.09+1.10+1.11+1.12+1.14+1.15×2+1.16×2+1.18+1.19+1.21×2+1.24+1.25×2+1.29+1.32)=1.1715.水库中鱼的总质量约为1.1715×100000=117150(kg).答:样本的平均数为1.1715,估计水库中所有鱼的总质量约为117150 kg.。
用样本估计总体【学习目标】1.理解用样本的数字特征估计总体的数字特征的方法,会分析实际问题。
2.能够利用频率分布直方图、茎叶图等解决统计问题。
【学习重难点】1.用样本的数字特征估计总体的数字特征。
2.用样本分布估计总体分布。
【学习过程】问题导学预习教材P77-P83的内容,思考以下问题: 1.如何用样本平均数估计总体平均数?2.样本方差、标准差公式是什么?它们的区别与联系是什么?3.在电视大奖赛中,计算评委打分的平均值时,为什么要去掉一个最高分和一个最低分?4.如何用频率分布直方图估计平均数、中位数、众数?5.同样一组数据,如果组距不同,得到的频率分布直方图也会不同吗? 【新知初探】1.简单随机抽样的数字特征一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本的特征能够反映总体的特征。
特别地,样本平均数(也称为样本均值)、方差(也称为样本方差)与总体对应的值相差不会太大。
一般来说,在估计总体的数字特征时,只需直接算出样本对应的数字特征即可。
2.分层抽样的数字特征我们以分两层抽样的情况为例。
假设第一层有m 个数,分别为x 1,x 2,…,x m ,平均数为x -,方差为s 2;第二层有n 个数,分别为y 1,y 2,…,y n ,平均数为y -,方差为t 2.则x -=1m ∑i =1m x i ,s 2=1m ∑i =1m (x i -x -)2,y -=1n ∑i =1n y i ,t 2=1n ∑i =1n (y i -y -)2.如果记样本均值为a -,样本方差为b 2,则可以算出111m ni i i i mx ny a x y m n m n ==+⎛⎫=+= ⎪++⎝⎭∑∑ , ()22222222()()1()m s x a n t y a mn b ms nt x y m nm n m n ⎡⎤⎡⎤+-++-⎡⎤⎣⎦⎣⎦==++-⎢⎥+++⎣⎦【自我检测】1.判断正误(正确的打“√”,错误的打“×”) (1)样本的平均数描述了样本数据的平均水平。
( ) (2)方差越大、数据越集中在平均数左右。
( ) (3)中位数是样本数据中最中间位置的数据。
( ) 2.下列说法不正确的是( )A .频率分布直方图中每个小矩形的高就是该组的频率B .频率分布直方图中各个小矩形的面积之和等于1C .频率分布直方图中各个小矩形的宽一样大D .频率分布折线图是依次连接频率分布直方图的每个小矩形上边的中点得到的3.如图是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知( )A .甲运动员的成绩好于乙运动员B .乙运动员的成绩好于甲运动员C .甲、乙两名运动员的成绩没有明显的差异D .甲运动员的最低得分为0分4.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm ),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100cm 。
探究一、用样本的数字特征估计总体的数字特征1.甲、乙两机床同时加工直径为100cm 的零件,为检验质量,从中抽取6件测量数据为:甲:99 100 98 100 100 103乙:99 100 102 99 100 100 (1)分别计算两组数据的平均数及方差;(2)根据计算说明哪台机床加工零件的质量更稳定。
[规律方法](1)在实际问题中,仅靠平均数不能完全反映问题,还要研究其偏离平均值的离散程度(即方差或标准差),方差大说明取值分散性大,方差小说明取值分散性小或者取值集中、稳定。
(2)关于统计的有关性质及规律:①若x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,…,mx n +a 的平均数是m x -+a ;②数据x 1,x 2,…,x n 与数据x 1+a ,x 2+a ,…,x n +a 的方差相等; ③若x 1,x 2,…,x n 的方差为s 2,那么ax 1,ax 2,…,ax n 的方差为a 2s 2. [跟踪训练]1.某校高二年级在一次数学选拔赛中,由于甲、乙两人的竞赛成绩相同,从而决定根据平时在相同条件下进行的六次测试确定出最佳人选,这六次测试的求两人比赛成绩的平均数以及方差,并且分析成绩的稳定性,从中选出一位参加数学竞赛。
2.在对树人中学高一年级学生身高(单位:cm)的调查中,采用分层抽样的方法,抽取了男生23人,其平均数和方差分别为170.6和12.59,抽取了女生27人,其平均数和方差分别为160.6和38.62,你能由这些数据计算出样本的方差,并对高一年级全体学生身高的方差作出估计吗?探究二、频率分布直方图与数字特征的综合应用2.已知一组数据:125121123125127129125128130129126124125127126122124125126128(2)作出频率分布直方图;(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数。
(1)利用频率分布直方图求数字特征:①众数是最高的矩形的底边的中点;②中位数左右两侧直方图的面积相等;③平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和。
(2)利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能粗略估计其众数、中位数和平均数。
3.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组,绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.求:(1)高一参赛学生的成绩的众数、中位数;(2)高一参赛学生的平均成绩。
【达标反馈】1.甲乙两名学生六次数学测验成绩(百分制)如图所示。
①甲同学成绩的中位数大于乙同学成绩的中位数;②甲同学的平均分比乙同学高;③甲同学的平均分比乙同学低;④甲同学成绩的方差小于乙同学成绩的方差。
上面说法正确的是()B.①②④C.②④D.①③2.如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在[15,20]内的频数为()A.20B.30C.40D.503.如图茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,若乙的平均分是89,则污损的数字是________。
4.甲、乙两人在相同条件下各打靶10次,每次打靶的成绩情况如图所示:平均数方差中位数命中9环及以上甲71.21乙5.43(2)请从四个不同的角度对这次测试进行分析:①从平均数和方差结合分析偏离程度;②从平均数和中位数结合分析谁的成绩好些;③从平均数和命中9环以上的次数相结合看谁的成绩好些;④从折线图上两人射击命中环数及走势分析谁更有潜力。
【参考答案】【自我检测】 1.答案:(1)√ (2)× (3)×2.解析:选A .频率分布直方图中每个小矩形的高=频率组距。
3.解析:选A .由茎叶图可以看出甲的成绩都集中在30~50分,且高分较多。
而乙的成绩只有一个高分52分,其他成绩比较低,故甲运动员的成绩好于乙运动员的成绩。
4.解析:60×(0.015+0.025)×10=24. 答案:24探究一、用样本的数字特征估计总体的数字特征1.【解】(1)甲=16(99+100+98+100+100+103)=100,乙=16(99+100+102+99+100+100)=100, s 2甲=16[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=73,s 2乙=16[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.(2)由(1)知甲=乙,比较它们的方差,因为s 2甲>s 2乙,故乙机床加工零件的质量更稳定。
[跟踪训练]1.解:设甲、乙两人成绩的平均数分别为甲,乙,则甲=130+16(-3+8+0+7+5+1)=133,乙=130+16(3-1+8+4-2+6)=133, s 2甲=16[(-6)2+52+(-3)2+42+22+(-2)2]=473, s 2乙=16[02+(-4)2+52+12+(-5)2+32]=383。
因此,甲与乙的平均数相同,由于乙的方差较小,所以乙的成绩比甲的成绩稳定,应该选乙参加竞赛比较合适。
2.解:把样本中男生的身高记为x1,x2,…,x23,其平均数记为,方差记为s2x;把样本中女生的身高记为y1,y2,…,y27,其平均数记为,方差记为s2y,把样本的平均数记为,方差记为s2.则=23×170.6+27×160.623+27=165.2,s2==23×[12.59+(170.6-165.2)2]+27×[38.62+(160.6-165.2)2]50=51.4862.即样本的方差为51.4862.因此估计高一年级全体学生身高的方差为51.4862.探究二、频率分布直方图与数字特征的综合应用频数累计(2)(3)在[124.5,126.5)中的数据最多,取这个区间的中点值作为众数的近似值,得众数为125.5,事实上,众数的精确值为125.图中虚线对应的数据是124.5+2×58=125.75,事实上,中位数为125.5.使用“组中值”求平均数:=121.5×0.1+123.5×0.15+125.5×0.4+127.5×0.2+129.5×0.15=125.8,事实上,平均数的精确值为=125.75.3.解:(1)由题图可知众数为65,又因为第一个小矩形的面积为0.3,所以设中位数为60+x ,则0.3+x ×0.04=0.5,得x =5, 所以中位数为60+5=65. (2)依题意,平均成绩为:55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67, 所以高一参赛学生的平均成绩约为67. 【达标反馈】1.解析:选A .甲的中位数为81,乙的中位数为87.5,故①错,排除B 、D ;甲的平均分=16(76+72+80+82+86+90)=81,乙的平均分′=16(69+78+87+88+92+96)=85,故②错,③对,排除C ,故选A .2.解析:选B .样本数据落在[15,20]内的频数为: 100×[1-5×(0.04+0.10)]=30.3.解析:设污损的叶对应的成绩为x ,由茎叶图可得,89×5=83+83+87+x +90+99,所以x =3.故污损的数字是3.答案:34.解:(1)乙的打靶环数依次为2,4,6,8,7,7,8,9,9,10.所以乙=110(2+4+6+8+7+7+8+9+9+10)=7;乙的打靶环数从小到大排列为2,4,6,7,7,8,8,9,9,10,所以中位数是7+82=7.5;甲的打靶环数从小到大排列为5,6,6,7,7,7,7,8,8,9,所以中位数为7.于是填充后的表格如(2)①甲、乙的平均数相同,均为7,但s 2甲<s 2乙,说明甲偏离平均数的程度小,而乙偏离平均数的程度大。