§222用样本的数字特估计总体的数字特征.
- 格式:ppt
- 大小:624.00 KB
- 文档页数:33
2.2.2用样本的数字特征估计总体的数字特征 (两课时)零号作业一、众数、中位数、平均数1、众数:(1)定义:一组数据中出现次数最多的数称为这组数据的众数.(2)特征:一组数据中的众数可能不止一个,也可能没有,反映了该组数据的集中趋势 [破疑点] 众数体现了样本数据的最大集中点,但它对其他数据信息的忽视使其无法客观地反映总体特征.(3)在直方图中为最高矩形下端中点的横坐标 2、中位数:(1)定义:一组数据按从小到大的顺序排成一列,处于中间位置的数称为这组数据的中位数. (2)特征:一组数据中的中位数是唯一的,反映了该组数据的集中趋势.在频率分布直方图中,中位数左边和右边的直方图的面积相等.[破疑点] 中位数不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点.(3) 直方图面积平分线与横轴交点的横坐标.左右两边面积各占一半3、平均数:(1)定义:一组数据的和与这组数据的个数的商.数据x 1,x 2,…,x n 的平均数为xn=x 1+x 2+…+x nn(2)特征:平均数对数据有“取齐”的作用,代表该组数据的平均水平.任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中极端值的影响较大,使平均数在估计总体时可靠性降低.(3) 直方图中每个小矩形的面积与小矩形底边中点的横坐标的乘积之和. 二、标准差、方差1、标准差(1)定义:标准差是样本数据到平均数的一种平均距离,一般用s 表示,通常用以下公式来计算s =1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]可以用计算器或计算机计算标准差.(2)特征:标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度和离散程度的大小.标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较_ 小.2.方差(1)定义:标准差的平方,即s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2](2)特征:与标准差的作用相同,描述一组数据围绕平均数波动程度的大小. (3)取值范围:[0,+∞)3、数据组x 1,x 2,…,x n 的平均数为x ,方差为s 2,标准差为s ,则数据组ax 1+b ,ax 2+b ,…,ax n +b (a ,b 为常数)的平均数为a x +b ,方差为a 2s 2,标准差为4、规律总结(1)用样本的数字特征估计总体的数字特征,是指用样本的众数、中位数、平均数和标准差等统计数据,估计总体相应的统计数据. 样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息. 平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数据的离散程度.用样本的数字特征估计总体的数字特征,是指用样本的众数、中位数、平均数和标准差等统计数据,估计总体相应的统计数据(2)平均数对数据有“取齐”的作用,代表一组数据的平均水平.标准差描述一组数据围绕平均数波动的幅度.在实际应用中,我们常综合样本的多个统计数据,对总体进行估计,为解决问题作出决策.(3)标准差越大离散程度越大,数据较分散;标准差越小离散程度越小,数据较集中在平均数周围.列出一组样本数据的频率分布表步骤说明:1、对同一个总体,可以抽取不同的样本,相应的平均数与标准差都会发生改变.如果样本的代表性差,则对总体所作的估计就会产生偏差;如果样本没有代表性,则对总体作出错误估计的可能性就非常大,由此可见抽样方法的重要性.2.在抽样过程中,抽取的样本是具有随机性的,如从一个包含6个个体的总体中抽取一个容量为3的样本就有20中可能抽样,因此样本的数字特征也有随机性.用样本的数字特征估计总体的数字特征,是一种统计思想,没有惟一答案.3.在实际应用中,调查统计是一个探究性学习过程,需要做一系列工作,我们可以把学到的知识应用到自主研究性课题中去.一号作业11、众数(1)定义:一组数据中出现次数______的数称为这组数据的众数.(2)特征:一组数据中的众数可能______一个,也可能没有,反映了该组数据的____________.在直方图中为最高矩形下端中点的____________最多不止集中趋势横坐标2.中位数(1)定义:一组数据按从小到大的顺序排成一列,处于______位置的数称为这组数据的中位数.(2)特征:一组数据中的中位数是______的,反映了该组数据的______________.在频率分布直方图中,中位数左边和右边的直方图的面积______..中间唯一集中趋势相等3.平均数(1)定义:一组数据的和与这组数据的个数的商.数据x1,x2,…,x n的平均数为x n=_________________.(2)特征:平均数对数据有“取齐”的作用,代表该组数据的_____________.任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的______,但平均数受数据中_________的影响较大,使平均数在估计总体时可靠性降低.直方图中每个小矩形的面积与小矩形底边中点的横坐标的. ______x1+x2+…+x nn平均水平信息极端值乘积之和4.标准差(1)定义:标准差是样本数据到平均数的一种平均距离,一般用s表示,通常用以下公式来计算s=__________________________.可以用计算器或计算机计算标准差.(2)特征:标准差描述一组数据围绕______波动的大小,反映了一组数据变化的幅度和离散程度的大小.标准差较大,数据的离散程度较______;标准差较小,数据的离散程度较______.1n[(x1-x)2+(x2-x)2+…+(x n-x)2]平均数大小5.方差(1)定义:标准差的平方,即s2=________________________________________.(2)特征:与____________的作用相同,描述一组数据围绕平均数波动程度的大小.(3)取值范围:___________.1n[(x1-x)2+(x2-x)2+…+(x n-x)2] 标准差[0,+∞)数据组x1,x2,…,x n的平均数为x,方差为s2,标准差为s,则数据组ax1+b,ax2+b,…,ax n+b(a,b为常数)的平均数为a x+b,方差为a2s2,标准差为as.典例讲解中位数、众数、平均数的应用例1据报道,某公司的33名职工的月工资(以元为单位)如下:(1)求该公司的职工月工资的平均数、中位数、众数;(2)假设副董事长的工资从5 000元提升到20 000元,董事长的工资从5 500元提升到30 000元,那么新的平均数、中位数、众数又是什么?(精确到1元)(3)你认为哪个统计量更能反映这个公司职工的工资水平?结合此问题谈一谈你的看法.[解析](1)平均数是x=1 500+4 000+3 500+2 000×2+1 500+1 000×5+500×3+0×2033≈1 500+591=2 091(元).中位数是1 500元,众数是1 500元.(2)平均数是x′=1 500+28 500+18 500+2 000×2+1 500+1 000×5+500×3+0×2033≈1 500+1 788=3 288(元).中位数是1 500元,众数是1 500元.(3)在这个问题中,中位数或众数均能反映该公司职工的工资水平.因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数偏差较大,所以平均数不能反映这个公司职工的工资水平.练习1:某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):甲群13,13,14,15,15,15,15,16,17,17;乙群54,3,4,4,5,5,6,6,6,57.(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好反映甲群市民的年龄特征?(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好反映乙群市民的年龄特征?[答案](1)甲群市民年龄的平均数为13+13+14+15+15+15+15+16+17+1710=15(岁),中位数为15岁,众数为15岁.平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.(2)乙群市民年龄的平均数为54+3+4+4+5+5+6+6+6+5710=15(岁),中位数为5岁,众数为6岁.由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.例2:(1)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差(2)某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.①求这次测试数学成绩的众数.②求这次测试数学成绩的中位数.③求这次测试数学成绩的平均分.[解析](1)x甲=15(4+5+6+7+8)=6,x乙=15(5×3+6+9)=6,甲的中位数是6,乙的中位数是5.甲的成绩的方差为15(22×2+12×2)=2,乙的成绩的方差为15(12×3+32×1)=2.4.甲的极差是4,乙的极差是4.所以A,B,D错误,C正确.(2)①由图知众数为70+802=75.②由图知,设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03(x-70),所以x≈73.3.③由图知这次数学成绩的平均分为:40+502×0.005×10+50+602×0.015×10+60+702×0.02×10+70+802×0.03×10+80+902×0.025×10+90+1002×0.005×10=72.[答案](1)C (2)见解析练习1:参加市数学调研抽测的某校高三学生成绩分布的茎叶图1和频率分布直方图2均受到不同程度的破坏,但可见部分信息如下,据此解答如下问题:求参加数学抽测的人数n,抽测成绩的中位数及分数分布在[80,90),[90,100]内的人数.[答案]分数在[50,60)内的频率为2,由频率分布直方图可以看出,分数在[90,100]内的同样有2人.由2n=10×0.008,得n=25.由茎叶图可知抽测成绩的中位数为73.∴分数在[80,90)之间的人数为25-(2+7+10+2)=4.参加数学竞赛人数n=25,中位数为73,分数在[80,90),[90,100]内的人数分一号作业21.对于数据3,3,2,3,6,3,10,3,6,3,2.①这组数据的众数是3;②这组数据的众数与中位数的数值都不相等;③这组数据的中位数与平均数的数值相等;④这组数据的平均数与众数的值相等.其中正确的结论的个数() A.1B.2 C.3 D.42、为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如下图所示,假设得分值的中位数为m e,众数为m O,平均值为x,则()A.m e=m O=x B.m e=m O<x C.m e<m O<x D.m O<m e<x3、某市要对两千多名出租车司机的年龄进行调查,现从中随机抽出100名司机,已知抽到的司机年龄都在[20,45)岁之间,根据调查结果得出司机的年龄情况残缺的频率分布直方图如图所示,利用这个残缺的频率分布直方图估计该市出租车司机年龄的中位数大约是() A.31,6岁B.32.6岁C.33.6岁D.36.6岁4、阶段考试以后,班长算出了全班40个人数学成绩的平均分为M,如果把M当成一个同学的分数,与原来的40个分数一起,算出这41个分数的平均分为N,那么M N为________.1、A 2 D 3、C 4、 15、为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4服用B药的20位患者日平均增加的睡眠时间:3.2 1.7 1.90.80.9 2.4 1.2 2.6 1.3 1.4 1.60.5 1.80.6 2.1 1.1 2.5 1.2 2.70.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据绘制茎叶图,从茎叶图看,哪种药的疗效更好?[解析](1)设A药观测数据的平均数为x,B药观测数据的平均数为y.由观测结果可得x=120×(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,y=120×(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.由以上计算结果可得x>y,因此可看出A药的疗效更好.(2)由观测结果可绘制如下茎叶图:从以上茎叶图可以看出,A药疗效的试验结果有710的叶集中在茎2,3上,而B药疗效的试验结果有710的叶集中在茎0,1上,由此可看出A药的疗效更好.标准差、方差的应用例3、从甲、乙两种玉米的苗中各抽10株,分别测它们的株高如下:(单位:cm)甲:25414037221419392142乙:27164427441640401640问:(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?[解析]看哪种玉米的苗长得高,只要比较甲、乙两种玉米的苗的均高即可;要比较哪种玉米的苗长得齐,只要看两种玉米的苗高的方差即可,因为方差是体现一组数据波动大小的特征数.(1)x甲=110(25+41+40+37+22+14+19+39+21+42)=110×300=30(cm),x乙=110(27+16+44+27+44+16+40+40+16+40)=110×310=31(cm).所以x甲<x乙.(2)s2甲=110[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=110(25+121+100+49+64+256+121+81+81+144)=110×1042=104.2(cm2),s2乙=110[(2×272+3×162+3×402+2×442)-10×312]=110×1288=128.8(cm2).所以s2甲<s2乙.[答案](1)乙种玉米的苗长得高,(2)甲种玉米的苗长得齐.练习1:甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如下表:s1,s2,s3分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有() A.s3>s1>s2B.s2>s1>s3C.s1>s2>s3D.s2>s3>s1[答案] B练习2:一次数学知识竞赛中,两组学生成绩如下表:已经算得两个组的平均分都是80分,请根据你所学过的统计知识,进一步判断这两个组这次竞赛中成绩谁优谁次,并说明理由.[答案](1)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数比较看,甲组成绩好些.(2)s2甲=12+5+10+13+14+6×[2×(50-80)2+5×(60-80)2+10×(70-80)2+13×(80-80)2+14×(90-80)2+6×(100-80)2]=150×(2×900+5×400+10×100+13×0+14×100+6×400)=172.s2乙=150×(4×900+4×400+16×100+2×0+12×100+12×400)=256.因为s2甲<s2乙,所以甲组成绩较乙组成绩稳定.(3)甲、乙两组成绩的中位数、平均数都是80分,其中甲组成绩在80分以上(含80分)的有33人,乙组成绩在80分以上(含80分)的有26人,从这一角度看,甲组成绩总体较好.(4)从成绩统计表看,甲组成绩大于或等于90分的人数为20人,乙组成绩大于或等于90分的人数为24人,所以乙组成绩在高分阶段的人数多,同时,乙组得满分的比甲组得满分的多6人,从这一角度看,乙组成绩较好.一号作业31. 若样本数据x 1,x 2,……,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为( )A .8B .15C .16D .322.为了稳定市场,确保农民增收,某农产品7个月份的每月市场收购价格与其前三个月的市场收购价格有关,并使其与前三个月的市场收购价格之差的平方和最小,下表列出的是该产品今年前6个月的市场收购价格:则前7A.757 B.767 C .11D.7873. 某班级有50名学生,其中有30名男生和20名女生.随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是( )A .这种抽样方法是一种分层抽样B .这种抽样方法是一种系统抽样C .这五名男生成绩的方差大于这五名女生成绩的方差D .该班男生成绩的平均数小于该班女生成绩的平均数4.由正整数组成的一组数据x 1,x 2,x 3,x 4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列)1、C2、B3、C4、1,1,3,3。
2.2.2 用样本的数字特征估计总体的数字特征整体设计教学分析教科书结合实例展示了频率分布的众数、中位数和平均数.对于众数、中位数和平均数的概念,重点放在比较它们的特点,以及它们的适用场合上,使学生能够发现,在日常生活中某些人通过混用这些(描述平均位置的)统计术语进行误导.另一方面,教科书通过思考栏目让学生注意到,直接通过样本计算所得到的中位数与通过频率直方图估计得到的中位数不同.在得到这个结论后,教师可以举一反三,使学生思考对于众数和平均数,是否也有类似的结论.进一步,可以解释对总体众数、总体中位数和总体平均数的两种不同估计方法的特点.在知道样本数据的具体数值时,通常通过样本计算中位数、平均值和众数,并用它们估计总体的中位数、均值和众数.但有时我们得到的数据是整理过的数据,比如在媒体中见到的频数表或频率表,用教科书中的方法也可以得到总体的中位数、均值和众数的估计.教科书通过几个现实生活的例子,引导学生认识到:只描述平均位置的特征是不够的,还需要描述样本数据离散程度的特征.通过对如何描述数据离散程度的探索,使学生体验创造性思维的过程.教科书通过例题向学生展示如何用样本数字特征解决实际问题,通过阅读与思考栏目“生产过程中的质量控制图”,让学生进一步体会分布的数字特征在实际中的应用.三维目标1.能利用频率分布直方图估计总体的众数、中位数、平均数;能用样本的众数、中位数、平均数估计总体的众数、中位数、平均数,并结合实际,对问题作出合理判断,制定解决问题的有效方法;初步体会、领悟“用数据说话”的统计思想方法;通过对有关数据的搜集、整理、分析、判断,培养学生“实事求是”的科学态度和严谨的工作作风.2.正确理解样本数据标准差的意义和作用,学会计算数据的标准差;能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;会用样本的基本数字特征估计总体的基本数字特征,形成对数据处理过程进行初步评价的意识.3.在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法;会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系.重点难点教学重点:根据实际问题对样本数据中提取基本的数据特征并作出合理解释,估计总体的基本数字特征;体会样本数字特征具有随机性.教学难点:用样本平均数和标准差估计总体的平均数与标准差;能应用相关知识解决简单的实际问题.课时安排2课时教学过程第2课时标准差导入新课思路1平均数为我们提供了样本数据的重要信息,但是,有时平均数也会使我们作出对总体的片面判断.某地区的统计显示,该地区的中学生的平均身高为176 cm,给我们的印象是该地区的中学生生长发育好,身高较高.但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质.因此,只有平均数难以概括样本数据的实际状态.所以我们学习从另外的角度来考察样本数据的统计量——标准差.(教师板书课题)思路2在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员:7,8,7,9,5,4,9,10,7,4;乙运动员:9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥得更稳定些吗?如果你是教练,选哪位选手去参加正式比赛?我们知道,x甲=7,x乙=7.两个人射击的平均成绩是一样的.那么,是否两个人就没有水平差距呢?从上图直观上看,还是有差异的.很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据——标准差.推进新课新知探究提出问题(1)如何通过频率分布直方图估计数字特征(中位数、众数、平均数)?(2)有甲、乙两种钢筋,现从中各抽取一个标本(如下表)检查它们的抗拉强度(单位:kg/mm2),哪种钢筋的质量较好?(3)某种子公司为了在当地推行两种新水稻品种,对甲、乙两种水稻进行了连续7年的种植对比实验,年亩产量分别如下:(千克)甲:600, 880, 880, 620, 960, 570, 900(平均773)乙:800, 860, 850, 750, 750, 800, 700(平均787)请你用所学统计学的知识,说明选择哪种品种推广更好?(4)全面建设小康社会是我们党和政府的工作重心,某市按当地物价水平计算,人均年收入达到1.5万元的家庭即达到小康生活水平.民政局对该市100户家庭进行调查统计,它们的人均收入达到了1.6万元,民政局即宣布该市民生活水平已达到小康水平,你认为这样的结论是否符合实际?(5)如何考查样本数据的分散程度的大小呢?把数据在坐标系中刻画出来,是否能直观地判断数据的离散程度?讨论结果:(1)利用频率分布直方图估计众数、中位数、平均数:估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点)估计中位数:中位数把频率分布直方图分成左右两边面积相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. (2)由上图可以看出,乙样本的最小值100低于甲样本的最小值110,乙样本的最大值145高于甲样本的最大值135,这说明乙种钢筋没有甲种钢筋的抗拉强度稳定.我们把一组数据的最大值与最小值的差称为极差(range ).由上图可以看出,乙的极差较大,数据点较分散;甲的极差小,数据点较集中,这说明甲比乙稳定.运用极差对两组数据进行比较,操作简单方便,但如果两组数据的集中程度差异不大时,就不容易得出结论.(3)选择的依据应该是,产量高且稳产的品种,所以选择乙更为合理.(4)不符合实际.样本太小,没有代表性.若样本里有个别高收入者与多数低收入者差别太大.在统计学里,对统计数据的分析,需要结合实际,侧重于考察总体的相关数据特征.比如,市民平均收入问题,都是考察数据的分散程度.(5)把问题(3)中的数据在坐标系中刻画出来.我们可以很直观地知道,乙组数据比甲组数据更集中在平均数的附近,即乙的分散程度小, 如何用数字去刻画这种分散程度呢? 考察样本数据的分散程度的大小,最常用的统计量是方差和标准差.标准差:考察样本数据的分散程度的大小,最常用的统计量是标准差(standard deviation).标准差是样本数据到平均数的一种平均距离,一般用s 表示.所谓“平均距离”,其含义可作如下理解:假设样本数据是x 1,x 2,…,x n ,x 表示这组数据的平均数.x i 到x 的距离是|x i -x |(i=1,2,…,n). 于是,样本数据x 1,x 2,…,x n 到x 的“平均距离”是S=nx x x x x x n ||||||21-++-+- . 由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差: s=])()()[(122221x x x x x x nn -++-+- . 意义:标准差用来表示稳定性,标准差越大,数据的离散程度就越大,也就越不稳定.标准差越小,数据的离散程度就越小,也就越稳定.从标准差的定义可以看出,标准差s≥0,当s=0时,意味着所有的样本数据都等于样本平均数.标准差还可以用于对样本数据的另外一种解释.例如,在关于居民月均用水量的例子中,平均数x =1.973,标准差s=0.868,所以x +s=2.841,x +2s=3.709;x -s=1.105,x -2s=0.237.这100个数据中,在区间[x -2s,x +2s ]=[0.237,3.709]外的只有4个,也就是说,[x -2s, x +2s ]几乎包含了所有样本数据.从数学的角度考虑,人们有时用标准差的平方s 2——方差来代替标准差,作为测量样本数据分散程度的工具:s 2=n1[(x 1-x )2+(x 2-x )2+…+(x n -x )2].显然,在刻画样本数据的离散程度上,方差与标准差是一样的.但在解决实际问题时,一般多采用标准差.需要指出的是,现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的.如何求得总体的平均数和标准差呢?通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.两者都是描述一组数据围绕平均数波动的大小,实际应用中比较广泛的是标准差.如导入中的运动员成绩的标准差的计算器计算.用计算器计算运动员甲的成绩的标准差的过程如下:即s甲=2.用类似的方法,可得s乙≈1.095.由s甲>s乙可以知道,甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定.应用示例思路1例1 画出下列四组样本数据的条形图,说明它们的异同点.(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6;(3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8.分析:先画出数据的条形图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差.解:四组样本数据的条形图如下:四组数据的平均数都是5.0,标准差分别是:0.00,0.82,1.49,2.83.它们有相同的平均数,但它们有不同的标准差,说明数据的分散程度是不一样的.例2 甲、乙两人同时生产内径为25.40 mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm):甲25.46 25.32 25.45 25.39 25.3625.34 25.42 25.45 25.38 25.4225.39 25.43 25.39 25.40 25.4425.40 25.42 25.35 25.41 25.39乙25.40 25.43 25.44 25.48 25.4825.47 25.49 25.49 25.36 25.3425.33 25.43 25.43 25.32 25.4725.31 25.32 25.32 25.32 25.48从生产的零件内径的尺寸看,谁生产的质量较高?分析:每一个工人生产的所有零件的内径尺寸组成一个总体.由于零件的生产标准已经给出(内径25.40 mm),生产质量可以从总体的平均数与标准差两个角度来衡量.总体的平均数与内径标准尺寸25.40 mm 的差异大时质量低,差异小时质量高;当总体的平均数与标准尺寸很接近时,总体的标准差小的时候质量高,标准差大的时候质量低.这样,比较两人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数与标准差的大小即可.但是,这两个总体的平均数与标准差都是不知道的,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本的平均数、标准差,以此作为两个总体之间差异的估计值.解:用计算器计算可得甲x ≈25.401,乙x ≈25.406;s 甲≈0.037,s 乙≈0.068.从样本平均数看,甲生产的零件内径比乙的更接近内径标准(25.40 mm),但是差异很小;从样本标准差看,由于s 甲<s 乙,因此甲生产的零件内径比乙的稳定程度高得多.于是,可以作出判断,甲生产的零件的质量比乙的高一些.点评:从上述例子我们可以看到,对一名工人生产的零件内径(总体)的质量判断,与所抽取的零件内径(样本数据)直接相关.显然,我们可以从这名工人生产的零件中获取许多样本.这样,尽管总体是同一个,但由于样本不同,相应的样本频率分布与平均数、标准差等都会发生改变,这就会影响到我们对总体情况的估计.如果样本的代表性差,那么对总体所作出的估计就会产生偏差;样本没有代表性时,对总体作出错误估计的可能性就非常大.这也正是我们在前面讲随机抽样时反复强调样本代表性的理由.在实际操作中,为了减少错误的发生,条件许可时,通常采取适当增加样本容量的方法.当然,关键还是要改进抽样方法,提高样本的代表性. 变式训练某地区全体九年级的3 000名学生参加了一次科学测试,为了估计学生的成绩,从不同学校的不同程度的学生中抽取了100名学生的成绩如下:100分12人,90分30人,80分18人,70分24人,60分12人,50分4人.请根据以上数据估计该地区3 000名学生的平均分、合格率(60或60分以上均属合格). 解:运用计算器计算得:100450126024701880309012100⨯+⨯+⨯+⨯+⨯+⨯=79.40, (12+30+18+24+12)÷100=96%,所以样本的平均分是79.40分,合格率是96%,由此来估计总体3 000名学生的平均分是79.40分,合格率是96%.思路2例1 甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm 2),试根据解:甲品种的样本平均数为10,样本方差为[(9.8-10)2 +(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷5=0.02.乙品种的样本平均数也为10,样本方差为[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]÷5=0.24.因为0.24>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定.例 2 为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换.已知某校使用的分析:用每一区间内的组中值作为相应日光灯的使用寿命,再求平均寿命.解:各组中值分别为165,195,225,255,285,315,345,375,由此算得平均数约为165×1%+195 ×11%+225×18%+255×20%+285×25%+315×16%+345×7%+375×2%=267.9≈268(天).这些组中值的方差为1001×[1×(165-268)2+11×(195-268)2+18×(225-268)2+20×(255-268)2+ 25×(285-268)2+16×(315-268)2+7×(345-268)2+2×(375-268)2]=2 128.60(天2).故所求的标准差约6.2128≈46(天).答:估计这种日光灯的平均使用寿命约为268天,标准差约为46天.知能训练(1)在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为____________.(2)若给定一组数据x 1,x 2,…,x n ,方差为s 2,则ax 1,ax 2,…,ax n 的方差是____________.(3)在相同条件下对自行车运动员甲、乙两人进行了6次测试,测得他们的最大速度(单位:m/s)答案:(1)9.5,0.016 (2)a 2s 2(3)甲x =33,乙x =33,33734722=>=乙甲s s , 乙的成绩比甲稳定,应选乙参加比赛更合适.拓展提升某养鱼专业户在一个养鱼池放入一批鱼苗,一年以后准备出售,为了在出售以前估计卖掉鱼后有多少收入,这个专业户已经了解到市场的销售价是每千克15元,请问,这个专业户还应该了解什么?怎样去了解?请你为他设计一个方案.解:这个专业户应了解鱼的总重量,可以先捕出一些鱼(设有x 条),作上标记后放回鱼塘,过一段时间再捕出一些鱼(设有a 条),观察其中带有标记的鱼的条数,作为一个样本来估计总体,则鱼塘中鱼的总条数鱼的条数鱼塘中所有带有标记条鱼中带有标记的条数)(x a a 这样就可以求得总条数,同时把第二次捕出的鱼的平均重量求出来,就可以估计鱼塘中的平均重量,进而估计全部鱼的重量,最后估计出收入.课堂小结1.用样本的数字特征估计总体的数字特征分两类:用样本平均数估计总体平均数,平均数对数据有“取齐”的作用,代表一组数据的平均水平.用样本标准差估计总体标准差.样本容量越大,估计就越精确,标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度.2.用样本估计总体的两个手段(用样本的频率分布估计总体的分布;用样本的数字特征估计总体的数字特征),需要从总体中抽取一个质量较高的样本,才能不会产生较大的估计偏差,且样本容量越大,估计的结果也就越精确.作业习题2.2A 组4、5、6、7,B 组1、2.设计感想统计学科,最大的特点就是与现实生活的密切联系,也是新教材的亮点.仅仅想借助“死记硬背一些概念及公式,简单模仿课本例题”来学习,是绝对不行的.用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差,其原因在于样本的随机性.这种偏差是不可避免的.虽然我们从样本数据得到的分布、均值和标准差并不是总体的真正分布、均值和标准差,而只是总体的一个估计,但这种估计是合理的,特别是当样本的容量很大时,它们确实反映了总体的信息.教师建议:亲身经历“提出问题,收集数据,分析数据,并作出合理决策”过程,在此过程中不仅可以加深对概念等知识的深刻理解,更重要的是发展了思维,培养了分析及解决问题能力,同时在情感、意志等领域也得到了协调发展,这才是学校学习的科学而全面的目标,习题设置有层次,尽量源于教材,又高于教材,这也是高考命题原则.。
222用样本的数字特征估计总体的数字特征教学设计一、教学目标:知识与技能(1)正确理解样本数据标准差的意义和作用,学会计算数据的标准差。
(2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释。
(3)会用样本的基本数字特征估计总体的基本数字特征。
(4 )形成对数据处理过程进行初步评价的意识。
过程与方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法。
情感态度与价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系。
二、教学重点与难点重点:用样本平均数和标准差估计总体的平均数与标准差。
难点:能应用相关知识解决简单的实际问题。
三、教学过程(一)创设情境,弓I入新课在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下:甲运动员:7, 8, 6, 8, 6, 5, 8, 10, 7, 4;乙运动员:9, 5, 7, 8, 7, 6, 8, 6, 7, 7.观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究。
——用样本的数字特征估计总体的数字特征(板出课题)。
一众数、中位数、平均数的概念众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛.众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.中数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.1(X i X2 …X n)平均数:一组数据的算术平均数,即x= n练习:在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下表所示:解:在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是 1.75 .上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是 1.70 ;平均数x胡.69米(二)研探新知1、众数、中位数、平均数探究:P74(1)怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?(2)能否用一个数值来描写样本数据的离散程度?(让学生回忆初中所学的一些统计知识,思考后展开讨论)初中我们曾经学过众数,中位数,平均数等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息。
§2.2.2用样本的数字特征估计总体的数字特征学习目标:(1)正确理解样本数据规范差的意义和作用,学会计算数据的规范差。
(2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、规范差),并做出合理的解释。
(3)会用样本的基本数字特征估计总体的基本数字特征。
(4)形成对数据处理过程进行初步评价的意识。
学习重点与难点1.重点:用样本平均数和规范差估计总体的平均数与规范差。
2.难点:能应用相关知识解决简单的实际问题。
一、新课探究1.众数、中位数、平均数的概念。
①众数:。
②中位数:。
(当数据个数为奇数时,中位数是按从小到大的顺序排列中间的那个数.当数据个数为偶数时,中位数是按从小到大的顺序排列的最中间两个数的两个数的平均数).③平均数:n x x x x x n++++= (321)求下列各组数据的众数、中位数、平均数(1)1 ,2,3,3,3,4,6,7,7,8,8,8 (2)1 ,2,3,3,3,4,6,7,8,9,92.如何从频率分布直方图中估计众数、中位数、平均数呢?①众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。
②中位数就是频率分布直方图面积的一半所对应的值 ③平均数则是每组频率的中间值乘频数再相加3.规范差、方差的概念。
(1)样本方差描述了一组数据围绕平均数波动的大小.一般用2s 表示。
一般地,设样本的数据为123,,,n x x x x ,样本的平均数为x ,则定义2s =,(2)2S 算术平方根,,即为样本规范差。
其计算公式为:显然,规范差较大,数据的离散程度较大;规范差较小,数据的离散程度较小。
在刻画样本数据的分散程度上,方差和规范差是一样的,但在解决实际问题时,一般多采用规范差。
二、典型例题1.如图所示是一样本的频率分布直方图,则由图形中的数])()()[(122221x x x x x x n s n++++-=据,可以估计众数与中位数,平均数分别是多少?2在某中学举行的电脑知识竞赛中,将九年级两个班参赛的学生成绩(得分均为整数)进行整理后分成五组,绘制如图所示的频率分布直方图.已知图中从左到右的第一、第三、第四、第五小组的频率分别是。