人教版高中数学必修三 第二章 统计数据的数字特征用样本估计总体
- 格式:doc
- 大小:174.00 KB
- 文档页数:8
2.2.2 用样本的数字特征估计总体的数字特征第1课时众数、中位数、平均数学情分析:本节课的学习者是高一学生,他们在初中已经学习过统计的初步知识,他们的观察、猜想能力较强。
但演绎推理、归纳、运用数学意识的思想比较薄弱,思维的广阔性、紧密性、灵活性比较欠缺,自主探究和合作学习能力需要在课堂教学中进一步加强和引导。
一、三维目标:1、知识与技能(1)能利用频率分布直方图估计总体的众数、中位数、平均数;(2)能用样本的众数、中位数、平均数估计总体的众数、中位数、平均数,并结合实际,对问题作出合理判断,制定解决问题的有效方法;。
(3)形成对数据处理过程进行初步评价的意识。
2、过程与方法初步体会、领悟“用数据说话”的统计思想方法;通过对有关数据的搜集、整理、分析、判断,培养学生“实事求是”的科学态度和严谨的工作作风.3、情感态度与价值观在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法;会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系.二、重点与难点重点:根据实际问题对样本数据中提取基本的数据特征并作出合理解释,估计总体的基本数字特征;体会样本数字特征具有随机性.难点:能应用相关知识解决简单的实际问题。
三、教学过程导入新课在日常生活中,我们往往并不需要了解总体的分布形态,而是更关心总体的某一数字特征,例如:买灯泡时,我们希望知道灯泡的平均使用寿命,我们怎样了解灯泡的使用寿命呢?当然不能把所有灯泡一一测试,因为测试后灯泡则报废了.于是,需要通过随机抽样,把这批灯泡的寿命看作总体,从中随机取出若干个个体作为样本,算出样本的数字特征,用样本的数字特征来估计总体的数字特征. (板书课题)新知探究提出问题(1)什么是众数、中位数、平均数?(1)如何绘制频率分布直方图?(3)如何从频率分布直方图中估计众数、中位数、平均数?活动:那么学生回忆初中所学的一些统计知识,思考后展开讨论,教师提示引导.讨论结果:(1)初中我们曾经学过众数(在一组数据中,出现次数最多的数称为众数)、中位数(在按大小顺序排列的一组数据中,居于中间的数称为中位数)、平均数(一般是一组数据和的算术平均数)等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息.(2)画频率分布直方图的一般步骤为:计算一组数据中最大值与最小值的差,即求极差;决定组距与组数;将数据分组;列频率分布表;画频率分布直方图.(3)教材前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25 t(最高的矩形的中点),它告诉我们,该市的月均用水量为2.25 t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少.请大家翻回到课本看看原来抽样的数据,有没有 2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失了,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.提问:那么如何从频率分布直方图中估计中位数呢?分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等.由此可以估计出中位数的值为2.02.思考:2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中的原因吗?(原因同上:样本数据的频率分布直方图把原始的一些数据给遗失了)课本显示,大部分居民的月均用水量在中部(2.02 t左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的.思考:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?(让学生讨论,并举例)对极端值不敏感有利的例子:考察课本中表21中的数据,如果把最后一个数据错写成22,并不会对样本中位数产生影响.也就是说对极端数据不敏感的方法能够有效地预防错误数据的影响,而在实际应用中,人为操作的失误经常造成错误数据.对极端值不敏感有弊的例子:某人具有初级计算机专业技术水平,想找一份收入好的工作,这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:很可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的数据不敏感.这里更好的方法是同时用平均工资和中位数来作为参考指标,选择平均工资较高且中位数较大的公司就业.对极端值不敏感的方法,不能反映数据中的极端情况.同样的,可以从频率分布直方图中估计平均数,上图就显示了居民用水的平均数,它等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.由估计可知,居民的月均用水量的平均值为2.02 t.显示了居民月均用水量的平均数,它是频率分布直方图的“重心”.由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变.这是中位数、众数都不具有的性质.也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.从图上可以看出,用水量最多的几个居民对平均数影响较大,这是因为他们的月均用水量与平均数相差太多了.利用频率分布直方图估计众数、中位数、平均数:估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点)估计中位数:中位数把频率分布直方图分成左右两边面积相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.总之,众数、中位数、平均数都是对数据中心位置的描述,可以作为总体相应特征的估计.样本众数易计算,但只能表达样本数据中的很少一部分信息,不一定唯一;中位数仅利用了数据中排在中间数据的信息,与数据的排列位置有关;平均数受样本中的每一个数据的影响,绝对值越大的数据,对平均数的影响也越大.三者相比,平均数代表了数据更多的信息,描述了数据的平均水平,是一组数据的“重心”.应用示例例1 下面是某校学生日睡眠时间抽样频率分布表(单位:h),试估计该校学生的日平均睡眠时间.分析:要确定这100名学生的平均睡眠时间,就必须计算其总睡眠时间,由于每组中的个体睡眠时间只是一个范围,可以用各组区间的组中值近似地表示.解法一:总睡眠时间约为6.25×5+6.75×17+7.25×33+7.75×37+8.25×6+8.75×2=739(h),故平均睡眠时间约为7.39 h.解法二:求组中值与对应频率之积的和6.25×0.05+6.75×0.17+7.25×0.33+7.75×0.37+8.25×0.06+8.75×0.02=7.39(h). 答:估计该校学生的日平均睡眠时间约为7.39 h.例2 某单位年收入在10 000到15 000、15 000到20 000、20 000到25 000、25 000到30 000、30 000到35 000、35 000到40 000及40 000到50 000元之间的职工所占的比分别为10%,15%,20%,25%,15%,10%和5%,试估计该单位职工的平均年收入.分析:上述百分比就是各组的频率.解:估计该单位职工的平均年收入为12 500×10%+17500×15%+22 500×20%+27 500×25%+32 500×15%+37 500×10%+45 000×5%=26 125(元).答:估计该单位人均年收入约为26 125元.知能训练从甲、乙两个公司各随机抽取50名员工月工资:甲公司:800 800 800 800 800 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 0001 2001 2001 2001 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 2001 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 5001 500 1 500 1 500 1 500 1 500 1 5002 000 2 000 2 0002 000 2 000 2 500 2 500 2 500乙公司:700 700 700 700 700 700 700 700 700700 700 700 700 700 700 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 000 1 000 6 000 8 000 10 000试计算这两个公司50名员工月工资平均数、众数、中位数,并估计这两个企业员工平均工资. 答案:甲公司:员工月工资平均数1 240,众数1 200,中位数1 200;乙公司:员工月工资平均数1 330,众数1 000,中位数1 000;从总体上看乙公司员工月工资比甲公司少,原因是乙公司有几个收入特高的员工影响了工资平均数.拓展提升“用数据说话”, 这是我们经常可以听到的一句话.但是,数据有时也会被利用,从而产生误导.例如,一个企业中,绝大多数是一线工人,他们的年收入可能是一万元左右,另有一些经理层次的人,年收入可以达到几十万元.这时,年收入的平均数会比中位数大得多.尽管这时中位数比平均数更合理些,但是这个企业的老板到人力市场去招聘工人时,也许更可能用平均数来回答有关工资待遇方面的提问.你认为“我们单位的收入水平比别的单位高”这句话应当怎么解释?这句话的目的是谨防利用人们对统计术语的模糊认识进行误导(蒙骗).使学生能够正确理解在日常生活中像“我们单位的收入水平比别的单位高”这类话的模糊性,这里的“收入水平”是指员工收入数据的某个中心点,即可以是中位数、平均数或众数,不同的解释有不同的含义.在这里应该注意以下几点:1.样本众数通常用来表示分类变量的中心值,容易计算,但是它只能表达样本数据中的很少一部分信息,通常用于描述分类变量的中心位置.2.中位数不受少数几个极端数据(即排序靠前或排序靠后的数据)的影响,容易计算,它仅利用了数据中排在中间数据的信息.当样本数据质量比较差,即存在一些错误数据(如数据的录入错误、测量错误等)时,应该用抗极端数据强的中位数表示数据的中心值,可以利用计算机模拟样本,向学生展示错误数据对样本中位数的影响程度.3.平均数受样本中的每一个数据的影响,“越离群”的数据,对平均数的影响也越大.与众数和中位数相比,平均数代表了数据更多的信息.当样本数据质量比较差时,使用平均数描述数据的中心位置可能与实际情况产生较大的误差.可以利用计算机模拟样本,向学生展示错误数据对样本平均数的影响程度.在体育、文艺等各种比赛的评分中,使用的是平均数.计分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止个别裁判的人为因素而给出过高或过低的分数对选手的得分造成较大的影响,从而降低误差,尽量保证公平性4.如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中极端数据的信息,帮助我们作出决策.5.使用者常根据自己的利益去选取使用中位数或平均数来描述数据的中心位置,从而产生一些误导作用.课堂小结1.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(平均数),会用样本的基本数字特征估计总体的基本数字特征;2.平均数对数据有“取齐”的作用,代表一组数据的平均水平;3.形成对数据处理过程进行初步评价的意识.作业习题2.2A组3.设计感想本堂课在初中学习的众数、中位数、平均数的基础上,学习了利用频率分布直方图估计众数、中位数、平均数,这是一种近似估计,但都能说明总体的分布特征,各有优缺点,讲解时紧扣课本内容,讲清讲透,使学生活学活用,会画频率分布直方图,会利用频率分布直方图估计众数、中位数、平均数,对总体作出正确的估计.。
课题:2.2.2 用样本的数字特征估计总体的数字特征(一)教学设计一、教材解析(一)教材地位与作用本节课选自人教B版必修3,第二章第二节第二讲,是一节探究课,是在第一讲中已经学习了用频率分布表、频率分布直方图、折线图、茎叶图的基础上从形的角度通过抽样估计整体,并结合初中学习的数字特征众数、中位数、平均数来研究数据进而估计整体,用频率分布直方图研究整体特征非常直接呈现出数据的分布及集中趋势,但原始数据丢失;怎样将频率分布直方图和数字特征很好的结合起来是我们本节课主要突破的问题。
教学重点:从频率分布直方图中估计总体的数字特征教学难点:从频率分布直方图中估计总体的中位数、平均数本节课在重难点的突破上采用类比的思想,引导学生用频率的思想重新定义众数、中位数、平均数,再类比到频率分布直方图,使学生能够更好地理解教材上所给出的运算方法。
(二)教学目标(1)会借助频率分布直方图从“形”的角度估计总体的数字特征,并作出合理的解释,体会数形结合的数学思想.(2)在解决统计问题的过程中,通过自主探索与合作交流,经历数字特征的生成过程,会用样本的数字特征估计总体的数字特征,体会用样本估计总体的思想.二、设计思路(一)教学设计构成本学案是按照罗定邦中学“1+1主体建构”的课堂模式要求,三案并举,包括:自主学习案、合作探究案、课后作业案。
自主学习案是学生课前预习,自主完成并检测,合作探究案是提前预习+课堂小组讨论、讲解点评,课后练习案是课后巩固提升,自主完成。
(二)教学媒体利用本节课我们要运用多媒体课件、平板电脑、定邦云平台,在自主自测和例题反馈当堂检测部分将运用定邦教育云平台上传答案并统计学生的做题情况,及时反馈、分析、有针对想的讲解。
让学生在生动具体的情境中感悟知识的发生和发展过程,优化学生的认识结构.三、教学过程设计(一)教学流程设计(二)教学过程设计一、 情境引入 我们第9周刚进行了期中考试,在理科班617位同学的数学成绩中随机抽取100位同学的数学成绩对全级数学成绩分析,100名同学的数学成绩如下。
数据的数字特征用样本估计总体一.课前热身二.知识结构图三.新知识全解(基本知识的详解及解决方法)知识点1.用样本的数字特征估计总体的数字特征:初中学过样本的众数(样本观测值中出现次数最多的数)样本中位数和平均值的数字特征,它们只能作为个体相应特征的估计。
这些数字特征刻划一组数据集中趋势的统计量。
刻划数据离散程度的统计量,如极差与方差刻划数据离散程度的度量,其理想形式应满足以下三条原则:(1)应充分利用所得到的数据,以便提供更确切的信息;(2)仅用一个数值来刻画数据的离散程度;(3)对于不同的数据集,当离散程度大时,该数据值亦大。
极差显然不满足上面的第一条原则,它只是利用了数据中最大和最小的两个值,而且对极值过于敏感,但由于只设计两个数据,便于得到,所以极差在实际中也经常应用。
方差虽然满足上面的三条原则,然而它有局限性:方差的单位是原始观测数据相同的单位,解决这个局限性的一种方法是取方差的正的平方根:nx x x x x x s s n 222212)()()(-+-+-==称为标准差,标准差的单位与原始测量单位相同。
在统计中,我们通常用标准差来刻画数据的离散程度。
例1(2002新课程)甲乙两种冬小麦实验品种连续5年的平均单位面积产量如下(单位:t/2km )其中产量比较稳定的冬小麦品种是( )分析:方差、标准差分别反映数据的稳定程度,集中与离散的程度。
解:102.10101.109.98.951=++++⨯=)(甲x ; ;)(乙108.97.98.103.104.951=++++⨯=x即甲乙两种冬小麦的平均产量的均值都等于10,其方差分别为02.004.0001.001.004.0512=++++⨯=)(甲s 244.004.009.064.009.036.0512=++++⨯=)(乙s即22乙甲s s <,表示甲种小麦的产量比较稳定。
变式练习1 某学校的日睡眠时间的抽样频率分布见下表:试估计该校学生的平均睡眠时间。
2.2.2 用样本的数字特征估计总体的数字特征1.掌握众数、中位数、平均数、标准差、方差的定义和特征.2.会求众数、中位数、平均数、标准差、方差,并能用之解决有关问题.1.众数(1)定义:一组数据中出现次数______的数称为这组数据的众数.(2)特征:一组数据中的众数可能________个,也可能没有,反映了该组数据的__________.众数体现了样本数据的最大集中点,但它对其他数据信息的忽视使其无法客观地反映总体特征.【做一做1】 数据组8,-1,0,4,17,4,3的众数是__________.2.中位数(1)定义:一组数据按从小到大的顺序排成一列,处于______位置的数称为这组数据的中位数.(2)特征:一组数据中的中位数是______的,反映了该组数据的__________.在频率分布直方图中,中位数左边和右边的直方图的面积______.中位数不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点.【做一做2】 数据组-5,7,9,6,-1,0的中位数是__________. 3.平均数(1)定义:一组数据的和与这组数据的个数的商.数据x 1,x 2,…,x n 的平均数为x =____________.(2)特征:平均数对数据有“取齐”的作用,代表该组数据的________.任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的______,但平均数受数据中________的影响较大,使平均数在估计总体时可靠性降低.【做一做3】 10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,则其平均数是__________.4.标准差(1)定义:标准差是样本数据到平均数的一种平均距离,一般用s 表示,通常用以下公式来计算s =______________________________. 可以用计算器或计算机计算标准差.(2)特征:标准差描述一组数据围绕________波动的大小,反映了一组数据变化的幅度和离散程度的大小.标准差较大,数据的离散程度较____;标准差较小,数据的离散程度较____.【做一做4】 一组数据的单位是m ,平均数是x ,标准差为s ,则( ) A .x 与s 的单位都是km B .x 与s 的单位都是cm C .x 与s 的单位都是mD .x 与s 的单位不同5.方差(1)定义:标准差的平方,即 s 2=________________________.(2)特征:与________的作用相同,描述一组数据围绕平均数波动程度的大小. (3)取值范围:________.数据组x 1,x 2,…,x n 的平均数为x ,方差为s 2,标准差为s ,则数据组ax 1+b ,ax 2+b ,…,ax n +b (a ,b 为常数)的平均数为a x +b ,方差为a 2s 2,标准差为as .【做一做5】 下列刻画一组数据离散程度的是( ) A .平均数 B .方差 C .中位数 D .众数 6.用样本估计总体现实中的总体所包含的个体数往往很多,总体的平均数、众数、中位数、标准差、方差是不知道的,因此,通常用______的平均数、众数、中位数、标准差、方差来估计.这与上一节用______的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.用样本的数字特征估计总体的数字特征分两类:用样本平均数估计总体平均数;用样本标准差估计总体标准差.样本容量越大,估计就越精确.【做一做6-1】 下列判断正确的是( ) A .样本平均数一定小于总体平均数 B .样本平均数一定大于总体平均数 C .样本平均数一定等于总体平均数D .样本容量越大,样本平均数越接近总体平均数【做一做6-2】 电池厂从某日生产的电池中抽取10个进行寿命测试,得数据如下(单位:小时):30,35,25,25,30,34,26,25,29,21,则该日生产电池的平均寿命估计为( )A .27B .28C .29D .30答案:1.(1)最多 (2)不止一 集中趋势 【做一做1】 42.(1)中间 (2)唯一 集中趋势 相等【做一做2】 3 将该组数据按从小到大排列为-5,-1,0,6,7,9,则中位数是0+62=3.3.(1)x 1+x 2+…+x nn(2)平均水平 信息 极端值【做一做3】 14.7 平均数是110(15+17+14+10+15+17+17+16+14+12)=14.7.4.(1)1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2] (2)平均数 大 小 【做一做4】 C x 与s 的单位都与数据组中的数据单位相同,是m. 5.(1)1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2](2)标准差 (3)[0,+∞)【做一做5】 B 方差刻画一组数据离散程度的大小. 6.样本 样本 【做一做6-1】 D【做一做6-2】 B 这10个数据的平均数是110(30+35+25+25+30+34+26+25+29+21)=28,则该日生产的电池的平均寿命估计为28小时.1.理解众数、中位数、平均数剖析:(1)众数体现了样本数据的最大集中点,容易计算,但它只能表达样本数据中很少一部分信息,显然对其他数据信息的忽略使其无法客观地反映总体特征.(2)中位数不受少数几个极端值的影响,容易计算,但它对极端值的不敏感有时也会成为缺点.(3)由于平均数与每一个样本的数据有关,“越离群”的数据,对平均数的影响也越大,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质.也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低.如在体育、文艺等各种比赛的评分中,使用的是平均数,计分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止由于个别裁判的人为因素而给出过高或过低的分数,对选手的得分造成较大的影响,从而降低误差,尽量保证公平性.(4)在一组数据中,它们的众数、中位数、平均数可能相同,也可能不同,而实际问题中,计算平均数时应该注意按实际要求进行计算.(5)实际问题中求得的平均数、众数和中位数应带上单位. 2.众数、中位数、平均数与频率分布直方图的关系剖析:(1)在样本数据的频率分布直方图中,众数的估计值就是最高矩形的中点的横坐标.(2)在频率分布直方图中,中位数左右两侧的直方图的面积相等,但是因为样本数据的频率分布直方图只是直观地表明分布的特征,因而从直方图本身得不出原始的数据内容,所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数的值不一致.(3)平均数显然是频率分布直方图的“重心”.我们知道,n 个样本数据x 1,x 2,…,x n 的平均数x =1n (x 1+x 2+x 3+…+x n ),则就有n x =x 1+x 2+x 3+…+x n ,所以x 对数据有“取齐”的作用,代表了一组数据的数值平均水平.在频率分布直方图中,平均数是直方图的平衡点,假设横轴表示一块放置直方图的跷跷板,则支点取在平均数处时跷跷板达到平衡.3.理解方差与标准差剖析:(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.(2)标准差、方差的取值范围是[0,+∞).标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性. (3)因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.题型一 计算方差(标准差)【例题1】 从某项综合能力测试中抽取100人的成绩,统计如下表,则这100人成绩的标准差为________.反思:求一组数据的方差和标准差的步骤如下: ①先求平均数x .②代入公式得方差和标准差s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 题型二 众数、中位数、平均数的应用【例题2】 某工厂人员及月工资构成如下:(1)指出这个问题中的众数、中位数、平均数.(2)这个问题中,平均数能客观地反映该工厂的月工资水平吗?为什么? 分析:由平均数的定义→计算平均数→已知数据从小到大排列→得中位数、众数→结论反思:(1)如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中的极端数据信息,帮助我们作出决策.(2)众数、中位数、平均数三者比较,平均数更能体现每个数据的特征,它是各个数据的重心.题型三 方差的应用【例题3】 甲、乙两台包装机同时包装质量为200克的糖果,从中各抽出10袋,测得其实际质量分别如下(单位:克):甲:203 204 202 196 199 201 205 197 202 199 乙:201 200 208 206 210 209 200 193 194 194 (1)分别计算两个样本的平均数与方差.(2)从计算结果看,哪台包装机包装的10袋糖果的平均质量更接近于200克?哪台包装机包装的10袋糖果的质量比较稳定?反思:研究两个样本的波动情况或比较它们的稳定性、可靠性、平整性等性能好坏的这类题,先求平均数,比较一下哪一个更接近标准.若平均数相等,则再比较两个样本方差的大小来作出判断.在计算过程中,要仔细观察所给样本数据的特征,选择恰当的公式来计算平均数和方差,这样可避免计算的烦琐,降低错误率.题型四 易错辨析【例题4】 小明是班里的优秀学生,他的历次数学成绩是96,98,95,93分,但最近的一次考试成绩只有45分,原因是他带病参加了考试.期末评价时,怎样给小明评价?错解:这五次数学考试的平均分是96+98+95+93+455=85.4,则按平均分给小明一个“良好”.错因分析:这种评价是不合理的,尽管平均分是反映一组数据平均水平的重要特征,但任何一个数据的改变都会引起它的变化,而中位数则不受某些极端值的影响.本题中的5个成绩从小到大排列为:45,93,95,96,98,中位数是95,较为合理地反映了小明的数学水平,因而应该用中位数来衡量小明的数学成绩.答案:【例题1】2105这100人的总成绩为5×20+4×10+3×30+2×30+1×10=300,平均成绩为300100=3,则该100人成绩的标准差为1100[(5-3)2×20+(4-3)2×10+(3-3)2×30+(2-3)2×30+(1-3)2×10] =2105. 【例题2】 解:(1)由表格可知,众数为2 000元.把23个数据按从小到大(或从大到小)的顺序排列,排在中间的数应是第12个数,其值为2 200,故中位数为2 200元.平均数为(22 000+15 000+11 000+20 000+1 000)÷23=69 000÷23=3 000(元).(2)虽然平均数为3 000元/月,但由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.【例题3】 解:(1)x 甲=110(3+4+2-4-1+1+5-3+2-1)+200=200.8.x 乙=110(1+0+8+6+10+9+0-7-6-6)+200=201.5.s 2甲=7.96,s 2乙=38.05.(2)∵200<x 甲<x 乙,∴甲台包装机包装的10袋糖果的平均质量更接近于200克.∵s 2甲<s 2乙,∴甲台包装机包装的10袋糖果的质量比较稳定.【例题4】 正解:小明5次考试成绩,从小到大排列为45,93,95,96,98,中位数是95,应评定为“优秀”.1.如图,是某篮球运动员在一个赛季的30场比赛中得分的茎叶图,则得分的中位数与众数分别为()A.3与3 B.23与3 C.3与23 D.23与232.(2011·北京海淀二模,理5)某赛季甲、乙两名篮球运动员各13场比赛的得分情况用茎叶图表示如下:根据上图,对这两名运动员的成绩进行比较,下列四个结论中,不正确的是() A.甲运动员得分的极差大于乙运动员得分的极差B.甲运动员得分的中位数大于乙运动员得分的中位数C.甲运动员的得分平均值大于乙运动员的得分平均值D.甲运动员的成绩比乙运动员的成绩稳定3.抛硬币20次,抛得正面朝上12次,反面朝上8次.如果抛到正面朝上得3分,抛到反面朝上得1分,则平均得分是__________,得分的方差是__________.4.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则x2+y2=__________.5.某校高二年级在一次数学选拔赛中,由于甲、乙两人的竞赛成绩相同,从而决定根赛.答案:1.D中位数是指一组数据按从小到大(或从大到小)的顺序依次排列,处在中间位置的一个数(或最中间两个数据的平均数),从茎叶图中可知中位数为23;众数是指一组数据中出现次数最多的数,从茎叶图中可知23出现了3次,次数最多,因此众数也是23,所以选D.2.D甲运动员比赛得分的最高分为47,最低分为18,极差为29,乙运动员比赛得分的最高分为33,最低分为17,极差为16,所以A项正确;甲运动员比赛得分的中位数为30,乙运动员比赛得分的中位数为26,所以B项正确;甲运动员的得分平均值x甲=113(18+18+19+20+21+26+30+32+33+35+40+41+47)=34313,乙运动员的得分平均值x乙=113(17+17+19+19+22+25+26+27+29+29+30+32+33)=32513,甲运动员的得分平均值大于乙运动员的得分平均值,所以C项正确;由茎叶图知甲得分较为分散,乙得分较为集中,故甲的成绩没有乙的成绩稳定.3.2.20.96总得分为12×3+8×1=44,则平均分是4420=2.2,方差s2=120[(3-2.2)2×12+(1-2.2)2×8]=0.96.4.208由平均数为10,得(x+y+10+11+9)×15=10,则x+y=20;又由于方差为2,则[(x-10)2+(y-10)2+(10-10)2+(11-10)2+(9-10)2]×15=2,整理得x2+y2-20(x+y)=-192,则x2+y2=20(x+y)-192=20×20-192=208. 5.解:设甲乙两人成绩的平均数分别为x甲,x乙,则x甲=130+1(380751)6-+++++=133,x乙=130+1(318426)6-++-+=133,2 s 甲=2222221[(6)5(3)42(2)]6-++-+++-=473,2 s 乙=2222221[0(4)51(5)3]6+-+++-+=383.因此,甲与乙的平均数相同,由于乙的方差较小,所以乙的成绩比甲的成绩稳定,应该选乙参加竞赛比较合适.。
(3)
例5:已知一组数据x1,x2,…,x5的平均数为
如图所示的是表示甲、乙两名篮球运动员每场比赛得分情况的茎叶图,则甲和乙得
.甲、乙两名中学生在一年里各学科成绩的平均分相等,方差不相等,正确评价它们学
.成绩虽然一样,方差较大的,说明潜力大,学习态度扎实
.表面上看这两个学生平均成绩一样,但方差小的学习成绩稳定
.说明他们学习水平不一样,方差较小的同学,学习成绩不稳定,成绩忽高忽低
)
名学生右眼视力的检查结果如下表所示:
0.50.60.70.8 1.0
4468该班学生右眼视力的众数和中位数分别是()。
2.2.2用样本的数字特征估计总体的数字特征(众数,中位数,平均数)学习目标一.能力目标:(1). 能利用频率颁布直方图估计总体的众数,中位数,平均数.(2). 能用样本的众数,中位数,平均数估计总体的众数,中位数,平均数,并结合实际,对问题作出合理判断,制定解决问题的有效方法。
(3)初步体会、领悟“用数据说话”的统计思想方法。
二.情感目标:通过对有关数据的搜集、整理、分析、判断培养学生“实事求是”的科学态度和严谨的工作作风。
三.学习重点、难点(1).根据实际问题对样本数据中提取基本的数据特征并作出合理解释,估计总体的基本数字特征。
(2).体会样本数字特征具有随机性。
四.基本流程五. 教学情景设计例1: 从甲乙两个公司各随机抽取50名员工月工资:甲公司:800 800 800 800 800 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1500 1500 1500 1500 1500 1500 1500 2000 2000 2000 2000 2000 2500 2500 2500乙公司:700 700 700 700 700 700 700 700 700 700 700 700 700 700 700 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 10001000 1000 1000 1000 1000 1000 1000 1000 10001000 1000 6000 8000 10000试计算这两个公司50名员工月工资平均数,众数,中位数,并估计这两个企业员工平均工资。
2.2.2用样本的数字特征估计总体的数字特征一、教材分析(一)教材地位与作用本节课选自人教A版必修三,第二章第二节第二讲,是一节典型的概念课,是在已经学习了抽样方法、用图、表来组织样本数据,用样本的频率分布估计总体分布的基础上,进一步挖掘样本,从形的角度,利用样本的频率分布直方图来估计总体的数字特征,从而使我们能从整体上更好地把握总体的规律,并体会用样本估计总体的思想,以及统计思维与确定性思维的差异.本课所学内容有良好的实际应用价值,它能为我们对相关问题作出统计推断和决策提供数理依据.因此学好本节课能帮助学生逐步建立用样本估计总体的统计思想,提高学生数据处理、解决实际问题的能力。
(二)教学目标1、理解众数、中位数、平均数在样本数据中所代表的含义;2、会运用频率分布直方图估计众数、中位数、平均数;从“形”的角度估计总体的数字特征,并作出合理的解释,体会数形结合的数学思想.3、理解在利用众数、中位数、平均数估计总体的数字特征时各自的优缺点;能通过对生活实例的分析认识数字特征的作用和局限性,会应用数字特征解决简单的实际问题并作出合理的决策. 感受统计在实际问题中的应用价值,体会数学知识与现实生活的联系.4、掌握用样本的众数、中位数、平均数估计总体数字特征的方法,形成数学思想方法. 在解决统计问题的过程中,通过自主探索与合作交流,经历数字特征的生成过程,会用样本的数字特征估计总体的数字特征,体会用样本估计总体的思想. 体验数形结合的思想方法,化归转化的思想方法在数学学习中的应用。
(三)教学重、难点教学重点:众数、中位数、平均数在样本数据中所代表的含义,利用频率分布直方图估计样本数字特征,并利用它们估计总体数字特征,形成初步评价意识。
教学难点:如何从样本的频率分布直方图中提取数字特征,并以此估计总体的基本数字特征。
二、学情分析1.学生已有的认知基础通过小学、初中和高中前期的学习,学生已有“统计初步知识”的数学现实,能从样本中直接提取样本的数字特征,能够用频率分布直方图来呈现数据的分布形态,现实生活中很多数量化的实际问题也为学生的认知提供了经验基础。
数学人教B 必修3第二章2.2.2 用样本的数字特征估计总体的数字特征1.通过随机抽样,会用样本平均数估计总体平均数,会用样本标准差估计总体标准差. 2.掌握几个数据的标准差及方差的计算方法,理解数据标准差的意义和作用.1.众数、中位数、平均数(1)在一组数据中,出现____最多的数据叫做这组数据的众数. 即:众数是在样本数据中,频率分布______所对应的样本数据.(2)将一组数据按大小依次排列,把处在____位置的一个数据(或____两个数据的平均数)叫做这组数据的中位数.(3)如果有n 个数x 1,x 2,x 3,…,x n ,那么x =____________________,叫做这n 个数的平均数.中所有个体的平均数叫做总体平均数. 中所有个体的平均数叫做样本平均数.【做一做1】10名工人某天生产同一零件,生产的件数分别是15,17,14,10,15,17,17,16,14,12.设平均数为a ,中位数为b ,众数为c ,则有( ).A .a <b <cB .a >b >cC .a <c <bD .c >a >b 2.样本方差、样本标准差数据的离散程度可以用____、____或______来描述.我们知道,样本方差描述了一组数据围绕______波动的大小.一般地,设样本的元素为x 1,x 2,…,x n ,样本的平均数为x ,定义s 2=(x 1-x )2+(x 2-x )2+…+(x n -x )2n,s =(x 1-x )2+(x 2-x )2+…+(x n -x )2n .其中s 2表示________,s 表示__________.因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.【做一做2-1】样本101,98,102,100,99的标准差为( ). A . 2 B .0 C .1 D .2【做一做2-2】若k 1,k 2,…,k 6的方差为3,则2(k 1-3),2(k 2-3),…,2(k 6-3)的方差为__________.1.平均数、中位数、众数的区别与联系剖析:平均数在度量一组数据的集中化趋势的统计量中是应用最广泛的.计算平均数时全部数据都参加运算,因此,用它来反映一组数据的集中化趋势的代表性比较好.但是它也有缺点,主要的问题是平均数是根据一组数据中的全部数据来计算的,会受到数据中那些没有代表性的极端值的影响.因此,有时在计算平均数时,先剔除个别缺乏代表性的特殊值,所得到的结果可能会更具有代表性.中位数主要受一组数据中的中间位置上的数值的影响,用中位数来反映一组数据中各数据大小的一般水平并不很精确.但中位数计算简单,与平均数相比,中位数不受数据中两端异常的特殊值的影响.从这个意义出发,它可以作为数据平均指标的代表值.众数并没有通常意义上的“平均”的含义.但众数在数据中出现的次数最多,说明该数值在数据中最具有代表性.众数不会受到数据中极端值的影响,但并不是每一组数据都是具有众数的.对于分组数据而言,众数常常依赖于分组的情况,分组数改变时,众数可能就有较大的变化,稳定性较差.同时众数也可能是不唯一的.2.方差、极差和标准差的特点剖析:方差、极差和标准差是从不同角度描述一组数据的离散趋势的.它们各自的特点及应用如下:虽然极差没有充分利用数据,不能提供更确切的信息,但由于只涉及两个数据,计算非常简便,所以极差在实际现场检查时经常利用,但极差没有考虑各中间值.方差充分利用了所得到的数据,提供了更确切的信息.在统计中,方差能够较好地区别出不同组数据的分散情况或程度,但方差的单位是原始观测数据的单位的平方.而标准差能够和方差一样区分数据的分散情况,且其单位与原始观测数据的单位相同.(1)当标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性.(2)数据组x1,x2,…,x n的平均数为x,方差为s2,标准差为s,则数据组ax1+b,ax2+b,…,ax n+b(a,b为常数)的平均数为a x+b,方差为a2s2,标准差为as.题型一用众数、中位数、平均数估计总体(1)指出这个问题中的众数、中位数、平均数.(2)这个问题中,平均数能客观地反映该工厂的工资水平吗?为什么?分析:本题着眼于众数、中位数、平均数各自的特点,以及适用对象.反思:平均数受数据中的极端值的影响较大,降低了对总体估计的可靠性,这时平均数反而不如众数、中位数更客观.题型二用方差或标准差估计总体【例2】某化肥厂甲、乙两个车间包装化肥,在自动包装传送带上每隔30分钟抽取一袋称其重量,分别记录抽查数据如下(单位:kg):甲:102 101 99 98 103 98 99 乙:110 115 90 85 75 115 110估计甲、乙两车间所包装化肥每袋的重量,并说明哪个车间的技术好.分析:根据公式计算得平均数和方差,分析甲、乙两车间每袋重量的集中趋势和离散程度.反思:对于常用的平均数、方差、标准差的公式要能够熟练记忆,不能记错公式,造成计算上的失误,使得统计的结果失去真实的意义.另外,应用求得的标准差的结论时,要特别注意标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小.题型三 样本数字特征的应用【例3】画出下列四组数据的频率分布条形图,并说明它们的异同点. (1)5,5,5,5,5,5,5,5,5; (2)4,4,4,5,5,5,6,6,6; (3)3,3,4,4,5,6,6,7,7; (4)2,2,2,2,5,8,8,8,8.分析:比较四组数据的异同可从它们的平均数、标准差这些数字特征入手,分析它们的集中趋势或离散程度.反思:频率分布条形图可以将我们所要求的平均数、众数、中位数、标准差等数据一一用图形直观显示出来,帮助我们获取有用的信息,特别是在对两组数据间进行比较时,应用非常方便.题型四 易错辨析【例4】若10个正整数的平方和是208,平均数是4,则这组数据的方差为多少?将这组数据同时减去3,则新数据的平均数为多少?方差为多少?错解:s 2=110(x 21+x 22+…+x 210-10x )=16.8,这组数据都减去3后,平均数为4-3=1,方差为16.8-9=7.8.错因分析:对平均数、方差的公式不清楚,致使计算结果不正确.1能反映一组数据的离散程度的是( ). A .频数 B .平均数 C .标准差 D .极差2已知某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图如下,则( ).A .甲的中位数为21,乙的众数为26B .甲的众数为21,乙的中位数为25C .甲的中位数为21,乙的众数为31D .甲的众数为21,乙的中位数为313甲、乙两名同学在五次考试中数学成绩统计用茎叶图表示如下,则下列说法正确的是( ).A .甲的平均成绩比乙的平均成绩高B .甲的平均成绩比乙的平均成绩低C .甲成绩的方差比乙成绩的方差大D .甲成绩的方差比乙成绩的方差小4已知一个样本数据是1,3,2,5,x ,它的平均数是3,则这个样本的标准差是__________. 5一组数据的每一个数据都减去80,得一组新数据.若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是______、______.答案: 基础知识·梳理1.(1)次数 最大值 (2)中间 中间 (3)1n(x 1+x 2+…+x n ) 总体 样本 【做一做1】 A 众数c =17,中位数b =15,平均数a =110×(10+12+14×2+15×2+16+17×3)=14.7,所以a <b <c .2.极差 方差 标准差 平均数 样本方差 样本标准差【做一做2-1】 A 样本平均数x =15×(101+98+102+100+99)=100,方差s 2=15×[(101-100)2+(98-100)2+(102-100)2+(100-100)2+(99-100)2]=2,∴s = 2.【做一做2-2】 12 设k 1,k 2,…,k 6的平均数为k , 则16[(k 1-k )2+(k 2-k )2+…+(k 6-k )2]=3, 而2(k 1-3),2(k 2-3),…,2(k 6-3)的平均数为2(k -3),则所求方差为16[4(k 1-k )2+4(k 2-k )2+…+4(k 6-k )2]=4×3=12.典型例题·领悟【例1】 解:(1)由表格可知:众数为200,中位数为220,平均数为(2 200+250×6+220×5+200×10+100)÷23=300(元/周).(2)虽然平均数为300元/周,但从表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该厂的工资水平.【例2】 解:x 甲=17×(102+101+99+98+103+98+99)=100.x 乙=17×(110+115+90+85+75+115+110)=100.s 2甲=17×(4+1+1+4+9+4+1)=247, s 2乙=17×(102+152+102+152+252+152+102)=1 6007>s 2甲, ∵x 甲=x 乙=100,∴两车间所包装化肥每袋重量平均数都是100 kg.∵s 2甲<s 2乙,∴s 甲<s 乙,∴甲车间包装化肥的技术好.【例3】 解:四组数据的频率分布条形图如图所示.四组数据的平均数都是5,标准差分别是0.00,0.82,1.49,2.83.虽然它们有相同的平均数,但是它们的标准差不同,说明数据的离散程度是不一样的.【例4】 正解:由方差公式s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],展开整理可得s 2=1n[(x 21+x 22+…+x 2n )-n (x )2], 这里由题设n =10,x 21+x 22+…+x 210=208,x =4,所以s 2=110(208-10×42)=4.8.一组数据同时减去a 后,平均数为x -a ,方差不变,所以都减去3后,平均数为1,方差为4.8. 随堂练习·巩固1.C 本题考查数据的基本特征量以及它们的含义,因为标准差反映数据的波动大小及离散程度,所以应选C.2.C3.C 由图可知甲的五次成绩分别为99,98,105,118,115,则可得甲的五次成绩的平均数为107,方差为66.8;乙的五次成绩分别为95,106,108,112,114,则可得乙的平均成绩为107,方差为44.4.2 由15(1+3+2+5+x )=3,解得x =4,因为s 2=15[(1-3)2+(3-3)2+(2-3)2+(5-3)2+(4-3)2]=2,所以标准差s = 2.5.81.2 4.4 设这组数据为x 1,x 2,…,x n ,都减去80后,新数据为x 1′,x 2′,…,x n ′,则x 1′+x 2′+…+x n ′n =1.2.所以x 1+x 2+…+x n n =x 1′+x 2′+…+x n ′+80nn=1.2+80=81.2,又方差是刻画数据离散程度的量,故各数据减(或加)上同一个数后,方差的大小不变.。
《2.2.2 用样本的数字特征估计总体的数字特征》教学设计一、学情分析我校是面上中学,学生入学分数比较低,他们基础较差,在初中掌握的数学知识不够牢固,应用能力比较薄弱,针对这种情况,本节课分为两个课时,第一个课时先复习初中旧知识的方式引入新课,放慢教学速度,先教众数、中位数、平均数,方差和标准差只能是第二个课时才学习,我们的学生解决实际应用题这一方面最为薄弱,我们以多训练计算为主,同时也把如何理解众数、中位数、平均数的实际应用进行讲解。
现在的高中生对计算机的应用比较熟悉,为了鼓励和激发学生的学习积极性,我利用上一节课中处理类似大数据的例题,让学生亲自动手演练如何用Excel处理一百个数据的众数、中位数、平均数,学生在课前做了认真的准备,方法非常好用而且全面,取得了很不错的效果。
二、教材分析本节课是人教A和B版中必修三第二章第二节的内容,本节课在必修三中是一点很重要的知识点,现在高考中,越来越重视图表的题型,本节课刚好是针对在频率分布直方图中求众数、中位数、平均数,是高中阶段比较基础而且重要的一节课,如何让学生掌握好这节课是需要认真的准备的,我根据高考的频率分布直方图中的常考题型特点,设计了这节课的内容,还配套了比较基础的课后练习。
三、教学目标1.通过复习初中数学的众数、中位数、平均数公式,理解并记住在频率分布直方图中求众数、中位数、平均数的公式;2.能熟练地掌握用计算机的Excel处理大数据,从样本的原始数据中求出众数、中位数、平均数的各种方法;能利用频率分布直方图估计总体的众数、中位数、平均数;能用样本的众数、中位数、平均数估计总体的众数、中位数、平均数,并结合实际,对问题作出合理判断;3.初步体会、领悟“用数据说话”的统计思想方法;通过对有关数据的搜集、整理、分析、判断,培养学生积极参与自主学习和动手的能力,培养学生能够提升数据处理的能力,进一步发展数学运算能力,养成通过数据思考问题的习惯,形成一丝不苟、严谨求实的科学精神。
数据的数字特征用样本估计总体一.课前热身二.知识结构图三.新知识全解(基本知识的详解及解决方法)知识点1.用样本的数字特征估计总体的数字特征:初中学过样本的众数(样本观测值中出现次数最多的数)样本中位数和平均值的数字特征,它们只能作为个体相应特征的估计。
这些数字特征刻划一组数据集中趋势的统计量。
刻划数据离散程度的统计量,如极差与方差刻划数据离散程度的度量,其理想形式应满足以下三条原则:(1)应充分利用所得到的数据,以便提供更确切的信息;(2)仅用一个数值来刻画数据的离散程度;(3)对于不同的数据集,当离散程度大时,该数据值亦大。
极差显然不满足上面的第一条原则,它只是利用了数据中最大和最小的两个值,而且对极值过于敏感,但由于只设计两个数据,便于得到,所以极差在实际中也经常应用。
方差虽然满足上面的三条原则,然而它有局限性:方差的单位是原始观测数据相同的单位,解决这个局限性的一种方法是取方差的正的平方根:nx x x x x x s s n 222212)()()(-+-+-==称为标准差,标准差的单位与原始测量单位相同。
在统计中,我们通常用标准差来刻画数据的离散程度。
例1(2002新课程)甲乙两种冬小麦实验品种连续5年的平均单位面积产量如下(单位:t/2km )其中产量比较稳定的冬小麦品种是( )分析:方差、标准差分别反映数据的稳定程度,集中与离散的程度。
解:102.10101.109.98.951=++++⨯=)(甲x ; ;)(乙108.97.98.103.104.951=++++⨯=x即甲乙两种冬小麦的平均产量的均值都等于10,其方差分别为02.004.0001.001.004.0512=++++⨯=)(甲s 244.004.009.064.009.036.0512=++++⨯=)(乙s即22乙甲s s <,表示甲种小麦的产量比较稳定。
变式练习1 某学校的日睡眠时间的抽样频率分布见下表:试估计该校学生的平均睡眠时间。
变式练习2 甲乙两台机床同时生产一种零件10天中,两台机床每天的次品数分别是: 甲:0 1 0 2 2 0 3 1 2 4 乙:2 3 1 1 0 2 1 1 0 1分别计算这两组数据的平均值与标准差,从计算结果看,哪台机床的性能较好? 变式练习3 下列数据是30个不同的国家中每100000名男性患某种疾病的死亡率: 27.0 23.9 41.6 33.1 40.6 18.8 13.7 28.9 13.2 14.5 27.0 34.8 28.9 3.2 50.1 5.6 8.7 15.2 7.1 5.2 16.5 13.8 19.2 11.2 15.7 10.0 5.6 1.5 33.8 9.2 请由这些数据计算平均数、中位数和标准差,并对它们的含义进行解释。
知识点2 、用样本的频率分布估计总体分布频率分布表和频率分布图,从各个小组数据在样本容量所占比例大小的角度,来表示数据分布的规律。
它可以使我们看到正个样本数据的频率分布情况,步骤如下: (1)求极差 (2)决定组距和组数 (3)将数据分组 (4)频率分布表 (5)画频率分布直方图频率分布折线图:连接频率分布直方图中各小长方形上端点的中点,就得到频率分布折线图。
一般的,当总体中的个数较多,抽样时样本容量就不能太小,随着样本容量的增加,作图时所分的组数也增加,相应的频率折线图会越来越接近一条光滑的曲线。
例1 公交车的数量太多容易造成资源的浪费,太少难以满足乘客的需求,为此,公交公司在某站台随机调查了80名乘客,他们的侯车时间如下所示(单位:min )17 14 20 12 10 24 18 17 1 22 13 19 28 5 34 7 25 18 28 1 15 31 12 11 10 16 12 9 10 13 19 10 12 12 16 22 17 23 16 15 16 11 9 3 13 2 18 22 19 9 23 28 15 21 28 12 11 14 15 3 11 6 2 18 25 5 12 15 20 16 12 28 20 12 28 15 8 32 18 9 (1)将数据进行适当的分组,并画出相应的频率分布直方图和频率折线图: (2)这80名乘客候车时间的平均数是多少?标准差呢? (3)你能为公交公司提出什么建议?分析:样本数据较多,我们可以利用计算器计算平均数和标准差。
解:(1)①由数据最大值、最小值得到:最大值为34,最小值1,极差=34-1=33;②确定组距为5(min ),6.6533==组距极差,分成7组;③第一组起点0;④由各组累计频数的算法,得到各组的频数。
频率分布见下表:频率分布直方图如图所示:频率折线图略(2)这80名乘客的乘车时间的平均值是15.5min;标准差是7.5;(3)公交公司可适当的增加公交车的数量。
变式练习4、(2007年淄博一模)下图是容量为100的样本的频率分布直方图,试根据图中的数据,回答下列问题:(1)样本数据在[)6,2内的频率为();(2)样本数据在[)10,6内的频率为();易错剖析:在画频率分布直方图时应注意纵坐标为组距频率,而不是频率,每个小矩形的宽度为i x ∆(分组的宽度),高为iix f ∆,小矩形的面积恰好为相应的频率i f ,图中所有小矩形的面积之和,也就是落在各个宽度的区间内的频率之和等于1。
例3、对于某电子元件进行寿命追踪调查,情况如下:(1)列出频率分布表; (2)画出频率分布直方图;(3)估计元件寿命,在100~400以内的百分比为多少? (4)估计电子元件寿命在400以上的百分比为多少? 分析:利用样本频率分布估计总体频率分布。
解:(1)频率分布表为: 频率分布直方图,如图所示:(3)由频率分布表或由频率分布直方图,可知寿命在100h~400h内的百分比约为65%;(4)由频率分布表或由频率分布直方图可知寿命在400h以上的电子元件的百分比约35%;点拨:利用样本在某一范围内的频率,也可以近似地估计总体在这一范围内的频率。
变式练习5:在一批棉花中抽测了60根棉花的纤维长度,结果如下(单位:mm)82 202 352 321 25 293 293 86 28 206323 355 357 33 325 113 233 294 50 296115 236 357 326 52 301 140 328 238 35858 255 143 360 340 302 370 343 260 30359 146 60 263 170 305 380 346 61 305175 348 264 383 62 306 195 350 265 385作出这个样本的频率分布直方图,棉花的纤维长度是棉花质量的重要指标,你能从图中分析出这批棉花的质量状况吗?四、问题探究(重点、难点、疑点以及解决方法)样本的数字特征包括众数中位数、平均数标准差、方差,它们各有优缺点,我们要考虑所选样本代表性,就要从数字特征入手,但众多的数字特征哪一个能更好的用来评价我们所选取的样本哪?这便成为了我们首先要考虑的问题。
每个样本的数字特征它从不同的方面来刻画样本中数据,所以我们要来研究一下它们的共性与差异。
探究1:数字特征的优缺点①众数体现了样本数据的最大中点,但它忽视了其它的数据信息,无法客观反映总体特征;②中位数是样本数据所有点频率的等分线,它不受少数极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点;③由于平均数与样本的每一个数据有关,所以任何一个数据的改变都会引起平均数的变化,这是众数,中位数都不具备的性质,也正是这个原因,与众数、中位数比较起来,平均数可以放映出更多关于样本数据全体的信息。
但平均数据中的极端值的影响较大,使平均数在估计总体时可靠性降低;④标准差、方差描述一组数据围绕平均数波动的大小,但方差与原始数据的单位不同且平方后夸大了偏差程度,在实际问题中一般都用标准差。
例4、在一次人才招聘会上,有一家公司的招聘员告诉你“我们公司的收入水平很很高”,去年在50名员工中,最高年收入达到了100万,他们的年收入的平均数是3.5万”如果你希望获得年薪2.5万⑴你是否能够判断自己可以成为此公司的一名高收入者?⑵如果招聘员继续告诉你“员工收入的变化范围是从0.5万到100万”这个信息是否足以作出自己是否受聘的决定?为什么?⑶如果招聘员继续给你提供了如下信息:“员工收入的中间50%(即最少的25%和最多的25%后所剩的)变化范围是1万到3万”你又该如何使用这条信息来作出是否受聘的决定?⑷你能估计出收入的中位数是多少吗?为什么均值比估计出的中位数高很多?分析:理解数字特征的作用。
解:⑴不能,因为平均收入和最高收入相差太多,说明高收入的职工只占极少数,现在已经知道至少有一个人的收入为X 50=100万元。
那么其他员工的收入之和为Y =3.5×50-100=75万元 ,每人平均只有1.53万元。
如果再有几个收入特别高者,那么初进公司的员工的收入将会很低。
⑵不能,要看中位数是多少。
⑶能,可以确定又75%的员工工资在1万元以上,其中25%的员工工资在3万元以上。
⑷收入的中位数大约是2万元,因为有年收入100万元这个极端值的影响,使得年平均收入比中位数高许多。
例5、(2007年普通高等学校招生全国统一考试(海南)第11题).甲、乙、丙三名射箭运动123s s s ,,分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有( )A.312s s s >> B.213s s s >> C.123s s s >> D.231s s s >>解:5.8205105958571=⨯+⨯+⨯+⨯=x ,118.1])5.810(5)5.89(5)5.88(5)5.87(5[20122221=-⨯+-⨯+-⨯+-⨯⨯=s 5.8206104948672=⨯+⨯+⨯+⨯=x,204.1])5.810(6)5.89(4)5.88(4)5.87(6[20122222=-⨯+-⨯+-⨯+-⨯⨯=s 5.8204106968473=⨯+⨯+⨯+⨯=x,025.1])5.810(4)5.89(6)5.88(6)5.87(4[20122223=-⨯+-⨯+-⨯+-⨯⨯=s 答案:B变式练习5:在去年的足球甲A 联赛上,一队每场比赛平均失球数是1.5,全年比赛失球个数的标准差为1.1;二队每场比赛平均失球数是2.1,全年比赛失球个数的标准差为0.4。
你认为下列说法中哪一种是正确的,为什么? ⑴平均说来一队比二队防守技术好; ⑵二队比一队技术水平更稳定;⑶一队有时表现很差,有时表现又非常好; ⑷二队很少不失球。