用样本的数字特征估计2
- 格式:ppt
- 大小:1.03 MB
- 文档页数:16
2.2.2 用样本的数字特征估计总体的数字特征(二) 标准差 ●学习目标1、能从样本数据中求出标准差,并做出合理解释;2、进一步体会用样本估计总体的思想,会用样本的标准差估计总体的特征;3、注意对样本标准差的随机性的体会,并能够正确利用标准差解决一些简单的实际问题. ●学习重点从样本数据中求出标准差并做出合理解释;样本估计总体的思想. ●学习难点体会统计的作用和样本标准差的随机性,并利用标准差解决一些简单的实际问题. ●学习过程 一.温故知新1、众数、中位数和平均数都是描述一组数据_________的量.2、两名射击运动员在一次射击测试中各射靶10次,每次命中的环数如下: 甲:7 8 7 9 5 4 9 10 7 4 乙:9 5 7 8 7 6 8 6 7 7 分别求出这两名运动员射击成绩的众数、中位数和平均数,对这次射击情况应如何评价?二.走进课堂1、极差:反映一组数据的变化的___________,它对一组数中的______非常敏感,由此可以得到一种“______________,______________”的统计策略.2、标准差:考察样本数据的______________最常用的统计量,是样本数据到_______的一种____________,一般用s 表示.(1)标准差的表达式:______________________s =;变形得:s = (2)标准差的大小,受样本中每个数据的影响,如果数据间变异大,则标准差也大,反之则小.因此,标准差越大,数据的离散程度_____,标准差越小,数据的离散程度_____; (3)标准差的取值范围是:______s ∈;(4)标准差常被理解为稳定性,标准差的单位与原数值的单位相同. 如何对上面甲、乙两名射击运动员做出评价?3、方差:即标准差的平方2s .(1)方差的表达式:2________________________________s =;(2)方差也是反映数据离散程度的特征数字,它的单位是原数值的单位的平方. 【夯实基础】(1)甲、乙两支女子曲棍球队在去年的国际联赛中,甲队平均每场进球数为3.2,全年比赛进球个数的标准差为3;乙队平均每场进球数为1.8,全年比赛进球个数的标准差为0.3,下列说法正确的有( )①甲队的技术比乙队好; ②乙队发挥比甲队稳定 ③乙队几乎每场都进球; ④甲队的表现时好时坏A.1个 B.2个 C.3个 D.4个 (2)某班有50名学生,某次数学考试的成绩经计算得到的平均分数是70分,标准差是s ,后来发现记录有误,某甲得70分却记为40分,某乙50分误记为80分,更正后重新计算得标准差为1s ,则s 与1s 之间的大小关系是( )A.s =1s B.s <1s C.s >1s D.不能确定 (3)已知一个样本为:x ,1,y ,5,其中x ,y 是方程组222,10x y x y +=⎧⎨+=⎩的解,则这个样本的标准差是( )A.2 C.5(4)一组数据的方差是2s ,将这组数据中的每一个数都乘以2,得到一组新数据,其方差是( ) A.212s B.22s C.24s D.2s(5)一组数据中的每一个数都减去80,得一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是( )A.81.2,4.4 B.78.8,4.4 C.81.2,84.4 D.78.8,75.6 (6)五个数1,2,3,4,a 的平均数是3,,则a =____,这五个数的标准差是_____.(7)若1a ,2a ,…,20a ,这20个数据的平均数为x ,方差为0.20,则数据1a ,2a ,…,20a ,x 这21个数据的方差约为__________(保留2位有效 ).4、典例精析【例1】从一批棉花中抽取9根棉花的纤维,长度如下:(单位:mm ) 82,202,352,321,25,293,86,206,115. 求样本的平均数、样本的方差和样本的标准差.【例2】现有A 、B 两个班级,每个班级有45名学生参加一次测验,每名参加者可获得0,1B 班的测试结果如右图:(1)你认为哪个班级的成绩比较稳定?(2)若两班共有60人及格,则参加者最少获得 多少分才可能及格?5、课堂小结:(1)众数、中位数和平均数都是描述一组数据集中趋势的特征数;标准差、方差都是用来描述一组数据波动情况的特征数,标准差更具无偏性.(2)当两个样本的平均数相等或相差无几时,就要用标准差来反映样本数据的离散程度. 作业:。
用样本的数字特征估计总体的数字特征
在统计学中,样本是从总体中抽取的部分数据。
样本的数字特征是通过对样本数据的分析和计算得出的描述性统计量,可以用来估计总体的数字特征。
本文将介绍常用的样本数字特征,并讨论如何利用这些特征来估计总体的数字特征。
一、样本的数字特征
1. 平均数:样本的平均数是样本数据的总和除以样本的个数。
平均数是样本数据的中心位置的度量,可以用来估计总体的平均数。
2. 中位数:样本的中位数是将样本数据按照大小排列后,位于中间位置的数字。
中位数是样本数据的中心位置的度量,可以用来估计总体的中位数。
3. 众数:样本的众数是样本数据中出现次数最多的数字。
众数可以表示样本数据的最常见的数值,可以用来估计总体的众数。
4. 方差:样本的方差是样本数据与样本均值之差的平方的平均值。
方差反映了样本数据的离散程度,可以用来估计总体的方差。
5. 标准差:样本的标准差是样本方差的平方根。
标准差也反映了样本数据的离散程度,可以用来估计总体的标准差。
三、注意事项
1. 样本的数字特征只能提供对总体数字特征的估计,估计的准确程度取决于样本的大小和抽样方法的随机性。
样本越大,估计的准确性一般越高。
2. 在利用样本数字特征估计总体数字特征时,需要考虑样本的代表性。
抽样时要保证样本能够代表总体的各个特征和属性。
3. 样本数字特征只能给出对总体数字特征的一种估计,通过使用统计方法和推断技巧,可以给出估计结果的置信区间和可靠程度。
2。
2。
2 用样本的数字特征估计总体的数字特征一、教学目标1.能从样本数据中提取基本的数字特征,并做出合理的解释. 2.会求样本的众数、中位数、平均数.3.能从频率分布直方图中,求得众数、中位数、平均数. 二、教学重难点重点:根据实际问题,对样本数据提取基本的数字特征并做出合理解释,估计总体的基本数字特征;体会样本数字特征具有随机性.难点:在频率分布直方图中分析众数、中位数、平均数. 三、众数、中位数、平均数的概念 1。
众数的概念一组数据中重复出现次数_____的数叫做这组数的众数 2。
中位数的定义把一组数据按大小顺序排列,把处于_____位置的那个数称为这组数据的中位数; 当数据个数为奇数时,中位数是按大小顺序排列的____的那个数;当数据个数为偶数时,中位数是按大小顺序排列的最中间两个数的_________。
3.平均数的概念 如果有n 个数12,,,n x x x ,那么这n 个数的算术平均数就是这组数平均数,即例1:在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下: 甲运动员:7,8,6,8,6,5,8,10,7,4 乙运动员:9,5,7,8,7,6,8,6,7,7观察上述样本数据,分别求这些运动员成绩的众数,中位数与平均数? 甲运动员命中环数:众数: 中位数:平均数:786865810746.910x +++++++++==乙运动员命中环数:众数: 中位数:平均数:9578768677710x +++++++++==例2、在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下表所示:分别求这些运动员成绩的众数,中位数与平均数 。
众数(最多的): ;中位数(最中间的): 平均数 :四、众数、中位数、平均数与频率分布直方图的关系 思考1:如何从频率分布直方图中估计出众数的值?例3:在上一节调查的100位居民的月均用水量的问题中,这些样本数据的频率分布直方图如下所示:观察图形,估计出众数的思考2:如何从频率分布直方图中估计出中位数的值?在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数反映到频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值. 所以,中位数在频率分布直方图中,就是使其左右小矩形面积和相等 思考3:如何从频率分布直方图中估计出平均数的值?例4:射击选手甲10次的射击情况,求其命中环数的平数2.54.5所以,平均数为:456272831010x ++⨯+⨯+⨯+=1122314567810101010101010=⨯+⨯+⨯+⨯+⨯+⨯即:平均数等于每个命中环数乘以该数的频率之和例5:100位居民月均用水量的频率分布表,求其平均数的估计值0.250.040.750.08 1.250.15 1.750.22 2.250.252.750.14 3.250.06 3.750.04 4.250.022.02x=⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=所以,平均数的估计值=小矩形底边中点的横坐标乘以对应频率之和 思考4:怎么在样本的频率分布直方图中估计出平均数的值?平均数的估计值=每个小矩形的面积乘以小矩形底边中点的横坐标之和 五、反思与感悟 :众数:最高矩形端点的横坐标;中位数:直方图面积平分线与横轴交点的横坐标;平均数:每个小矩形的面积与小矩形底边中点的横坐标的乘积之和。
数学(高二上)导学案必修三第二章第二节课题:用样本估计总体二、合作探究归纳展示任务1 标准差问题平均数向我们提供了样本数据的重要信息,但是平均数有时也会使我们作出对总体的片面判断,因为这个平均数掩盖了一些极端的情况,而这些极端情况显然是不能忽视的.因此,只有平均数还难以概括样本数据的实际状态.如:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲:7879549107 4乙:9578768677如果你是教练,你应当如何对这次射击作出评价?思考1甲、乙两人本次射击的平均成绩分别为多少环?答经计算得:x甲=110(7+8+7+9+5+4+9+10+7+4)=7,同理可得x乙=7.思考2观察下图中两人成绩的频率分布条形图,你能说明其水平差异在哪里吗?答直观上看,还是有差异的.如:甲成绩比较分散,乙成绩相对集中.思考3对于甲乙的射击成绩除了画出频率分布条形图比较外,还有没有其它方法来说明两组数据的分散程度?答还经常用甲乙的极差与平均数一起比较说明数据的分散程度.甲的环数极差=10-4=6,乙的环数极差=9-5=4.它们在一定程度上表明了样本数据的分散程度,与平均数一起,可以给我们许多关于样本数据的信息.显然,极差对极端值非常敏感,注意到这一点,我们可以得到一种“去掉一个最高分,去掉一个最低分”的统计策略.思考4 如何用数字去刻画这种分散程度呢?答 考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s 表示 . 思考5 所谓“平均距离”,其含义如何理解?答 假设样本数据是x 1,x 2,…,x n ,x 表示这组数据的平均数.x i 到x 的距离是|x i -x |(i =1,2,…,n ).于是,样本数据是x 1,x 2,…,x n 到x 的“平均距离”是S =|x 1-x |+|x 2-x |+…+|x n -x |n .由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差: s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 思考6 标准差的取值范围如何?若s =0表示怎样的意义?答 从标准差的定义可以看出,标准差s ≥0,当s =0时,意味着所有的样本数据等于样本平均数. 任务2 方差思考1 方差的概念是怎样定义的?答 人们有时用标准差的平方s 2—方差来代替标准差,作为测量样本数据分散程度的工具,方差:s 2=1n ·[(x 1-x )2+(x 2-x )2+…+(x n -x )2].思考2 对于一个容量为2的样本:x 1,x 2(x 1<x 2),它们的平均数和标准差如果分别用x 和a 表示,那么x 和a 分别等于什么? 答 x =12(x 1+x 2),a =12(x 2-x 1).思考3 在数轴上,x 和a 有什么几何意义?由此说明标准差的大小对数据的离散程度有何影响?答 x 和a 的几何意义如下图所示.说明了标准差越大离散程度越大,数据较分散;标准差越小离散程度越小,数据较集中在平均数周围.思考4 现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的.如何求得总体的平均数和标准差呢?答 通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.例1求出问题中的甲乙两运动员射击成绩的标准差,并说明他们的成绩谁比较稳定?解x甲=110(7+8+7+9+5+4+9+10+7+4)=7,同理可得x乙=7.根据标准差的公式,s甲=110[(7-7)2+(8-7)2+…+(4-7)2]=2;同理可得s乙≈1.095.所以s甲>s乙.因此说明甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定.跟踪训练1如图所示是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.答案 6.8任务3标准差及方差的应用例2画出下列四组样本数据的条形图,说明它们的异同点.(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6;(3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8.解四组样本数据的条形图如下:四组数据的平均数都是5.0,标准差分别是:0.00,0.82,1.49,2.83.它们有相同的平均数,但它们有不同的标准差,说明数据的分散程度是不一样的.跟踪训练2从甲、乙两种玉米中各抽10株,分别测得它们的株高如下:甲:25、41、40、37、22、14、19、39、21、42;乙:27、16、44、27、44、16、40、40、16、40;(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?解(1)x甲=110(25+41+40+37+22+14+19+39+21+42)=30,x乙=110(27+16+44+27+44+16+40+40+16+40)=31,x甲<x乙.即乙种玉米的苗长得高.(2)由方差公式得:s2甲=110[(25-30)2+(41-30)2+…+(42-30)2]=104.2,同理s2乙=128.8,∴s2甲<s2乙.即甲种玉米的苗长得齐.答乙种玉米苗长得高,甲种玉米苗长得齐.例3甲、乙两人同时生产内径为25.40 mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm):甲25.4625.3225.4525.3925.3625.3425.4225.4525.3825.4225.3925.4325.3925.4025.44的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.3.在抽样过程中,抽取的样本是具有随机性的,因此样本的数字特征也有随机性.用样本的数字特征估计总体的数字特征,是一种统计思想,没有唯一答案.四、作业布置 1、基础知识:1.下列说法正确的是( )A .在两组数据中,平均值较大的一组方差较大B .平均数反映数据的集中趋势,方差则反映数据离平均值的波动大小C .方差的求法是求出各个数据与平均值的差的平方后再求和D .在记录两个人射击环数的两组数据中,方差大的表示射击水平高 答案 B2.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:则7个剩余分数的方差为( )A.1169B.367C .36D.677答案 B3.已知一组数据x 1,x 2,x 3,x 4,x 5的平均数是x =2,方差是13,那么另一组数据3x 1-2,3x 2-2,3x 3-2,3x 4-2,3x 5-2的平均数和方差分别为( )A .2,13B .2,1C .4,13D .4,3答案 D4.某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4.则:(1)平均命中环数为________; (2)命中环数的标准差为________.。
用样本的数字特征估计总体的数字特征在统计学中,我们经常需要对总体的数字特征进行估计。
由于总体往往很大或者难以获得全部数据,我们通常只能通过抽样得到部分数据。
这时,我们可以利用样本的数字特征来估计总体的数字特征,从而对总体进行推断。
本文将介绍用样本的数字特征估计总体的数字特征的方法和相关概念。
一、样本与总体的概念在统计学中,总体是指研究对象的全部个体或观察值的集合。
总体通常是我们想要了解的全部群体,比如全国人口总数、某一批产品的质量总体等。
样本是从总体中选取的、具有代表性的一部分个体或观察值的集合。
样本的选择要求有代表性,即能够反映总体的一般情况。
在实际应用中,由于种种原因往往难以获得全部总体数据,因此我们通常只能依靠样本数据来进行统计推断。
二、样本的数字特征样本的数字特征是用来表示样本数据的数字指标,通常包括中心位置的指标(均值、中位数)、离散程度的指标(标准差、方差)和形状的指标(偏度、峰度)等。
这些数字特征可以帮助我们了解样本数据的集中趋势、变异程度和分布形状,从而为估计总体的数字特征提供依据。
1. 中心位置的指标中心位置的指标用来表示样本数据的集中趋势,反映了样本数据的平均水平。
常用的中心位置指标包括均值和中位数。
均值是样本数据的平均值,可用于表示样本数据的平均水平。
中位数是将样本数据按照大小顺序排列后位于中间位置的数值,能较好地反映样本数据的中心位置。
2. 离散程度的指标离散程度的指标用来表示样本数据的分散程度,反映了样本数据的离散程度。
常用的离散程度指标包括标准差和方差。
标准差是样本数据偏离均值的平均距离的平方根,是对样本数据的分散程度的度量。
方差是标准差的平方,是样本数据离均值的平均偏差的度量。
3. 形状的指标1. 点估计点估计是利用样本的数字特征估计总体的数字特征的一种方法。
点估计通常是利用样本的数字特征来估计总体的数字特征的一个数值。
比较常用的点估计方法包括样本均值估计总体均值、样本标准差估计总体标准差等。
学科核心素养下高中数学教学设计———以“用样本估计总体”为例文|傅焕铭一、教材分析我们收集的原始数据往往多而杂,需要对原始数据进行分析、处理,找到数据背后蕴藏的信息。
对总体统计特征的刻画包括两个层面:一是总体统计特征的全面刻画,即刻画出总体中所有个体的取值规律,这个规律可以用总体的频率分布表和频率分布直方图描述或近似描述;二是总体部分统计特征的刻画,如平均数、众数、方差、标准差等数字特征。
二、教学目标(一)核心素养学生初步习得科学处理数据的能力。
(二)教学目标(1)学生用频率分布直方图估计样本的众数、中位数、平均数等数据特征。
(2)学生能自行独立计算样本数据的标准差、方差,并知道分别刻画统计的什么特征。
(3)学生会用样本的频率分布估计总体分布,会用样本特征估计总体特征,理解用样本估计总体的思想,并能利用所学知识解决生活中的一些现实问题。
三、教学重难点教学重点:学生能从频率分布直方图上估计出样本数据特征。
教学难点:学生理解总体分布的概念,形成统计思维。
四、教学过程师:同学们,前面我们已经研究过通过抽样调查来研究数据的方法,了解了提高样本代表性的一些具体方法,收集数据后,我们要从中找到数据背后包含的信息,方可达到用样本估计总体的目的。
今天我们就一起研究“用样本估计总体”。
(一)课前导学师:同学们,根据自学任务,思考下列问题并完成检测。
任务1:样本数字特征有哪些?如何求?这些特征在频率分布直方图上如何估计?任务2:样本数字特征是如何反映样本数据的集中趋势和离散程度的?(设计意图:通过出示自学任务,引导学生自学,相机进行自学效果检测。
学生根据自学情况,检测新知中还有哪些内容没有理解和掌握,从而有针对性地学习本节内容,实现高效学习。
同时也旨在培养学生良好的学习习惯,指导学生学会学习数学的方法。
)(二)课堂设计探究一:样本的数字特征11.探究:众数、中位数、平均数的概念。
师:请同学们根据概念解释,完成概念名词的填空,并揣摩这些概念的含义。
第2课时标准差导入新课思路1平均数为我们提供了样本数据的重要信息,但是,有时平均数也会使我们作出对总体的片面判断.某地区的统计显示,该地区的中学生的平均身高为176 cm,给我们的印象是该地区的中学生生长发育好,身高较高.但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质.因此,只有平均数难以概括样本数据的实际状态.所以我们学习从另外的角度来考察样本数据的统计量——标准差.(教师板书课题)思路2在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员:7,8,7,9,5,4,9,10,7,4;乙运动员:9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥得更稳定些吗?如果你是教练,选哪位选手去参加正式比赛?我们知道,x甲=7,x乙=7.两个人射击的平均成绩是一样的.那么,是否两个人就没有水平差距呢?从上图直观上看,还是有差异的.很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据——标准差.推进新课新知探究提出问题(1)如何通过频率分布直方图估计数字特征(中位数、众数、平均数)?(2)有甲、乙两种钢筋,现从中各抽取一个标本(如下表)检查它们的抗拉强度(单位:kg/mm2),通过计算发现,两个样本的平均数均为125.甲110 121312512125135125135125乙115 112513115125125145125145哪种钢筋的质量较好?(3)某种子公司为了在当地推行两种新水稻品种,对甲、乙两种水稻进行了连续7年的种植对比实验,年亩产量分别如下:(千克)甲:600, 880, 880, 620, 960, 570, 900(平均773)乙:800, 860, 850, 750, 750, 800, 700(平均787)请你用所学统计学的知识,说明选择哪种品种推广更好?(4)全面建设小康社会是我们党和政府的工作重心,某市按当地物价水平计算,人均年收入达到1.5万元的家庭即达到小康生活水平.民政局对该市100户家庭进行调查统计,它们的人均收入达到了1.6万元,民政局即宣布该市民生活水平已达到小康水平,你认为这样的结论是否符合实际?(5)如何考查样本数据的分散程度的大小呢?把数据在坐标系中刻画出来,是否能直观地判断数据的离散程度?讨论结果:(1)利用频率分布直方图估计众数、中位数、平均数:估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点) 估计中位数:中位数把频率分布直方图分成左右两边面积相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. (2)由上图可以看出,乙样本的最小值100低于甲样本的最小值110,乙样本的最大值145高于甲样本的最大值135,这说明乙种钢筋没有甲种钢筋的抗拉强度稳定.我们把一组数据的最大值与最小值的差称为极差(range ).由上图可以看出,乙的极差较大,数据点较分散;甲的极差小,数据点较集中,这说明甲比乙稳定.运用极差对两组数据进行比较,操作简单方便,但如果两组数据的集中程度差异不大时,就不容易得出结论. (3)选择的依据应该是,产量高且稳产的品种,所以选择乙更为合理.(4)不符合实际.样本太小,没有代表性.若样本里有个别高收入者与多数低收入者差别太大.在统计学里,对统计数据的分析,需要结合实际,侧重于考察总体的相关数据特征.比如,市民平均收入问题,都是考察数据的分散程度.(5)把问题(3)中的数据在坐标系中刻画出来.我们可以很直观地知道,乙组数据比甲组数据更集中在平均数的附近,即乙的分散程度小, 如何用数字去刻画这种分散程度呢? 考察样本数据的分散程度的大小,最常用的统计量是方差和标准差.标准差:考察样本数据的分散程度的大小,最常用的统计量是标准差(standard deviation).标准差是样本数据到平均数的一种平均距离,一般用s 表示. 所谓“平均距离”,其含义可作如下理解:假设样本数据是x 1,x 2,…,x n ,x 表示这组数据的平均数.x i 到x 的距离是|x i -x |(i=1,2,…,n).于是,样本数据x 1,x 2,…,x n 到x 的“平均距离”是S=nx x x x x x n ||||||21-++-+- .由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差: s=])()()[(122221x x x x x x nn -++-+- .意义:标准差用来表示稳定性,标准差越大,数据的离散程度就越大,也就越不稳定.标准差越小,数据的离散程度就越小,也就越稳定.从标准差的定义可以看出,标准差s≥0,当s=0时,意味着所有的样本数据都等于样本平均数.标准差还可以用于对样本数据的另外一种解释.例如,在关于居民月均用水量的例子中,平均数x =1.973,标准差s=0.868,所以x +s=2.841,x +2s=3.709; x -s=1.105,x -2s=0.237.这100个数据中,在区间[x -2s,x +2s ]=[0.237,3.709]外的只有4个,也就是说,[x -2s, x +2s ]几乎包含了所有样本数据.从数学的角度考虑,人们有时用标准差的平方s 2——方差来代替标准差,作为测量样本数据分散程度的工具: s 2=n1[(x 1-x )2+(x 2-x )2+…+(x n -x )2].显然,在刻画样本数据的离散程度上,方差与标准差是一样的.但在解决实际问题时,一般多采用标准差.需要指出的是,现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的.如何求得总体的平均数和标准差呢?通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.两者都是描述一组数据围绕平均数波动的大小,实际应用中比较广泛的是标准差.如导入中的运动员成绩的标准差的计算器计算.用计算器计算运动员甲的成绩的标准差的过程如下:即s 甲=2.用类似的方法,可得s 乙≈1.095.由s 甲>s 乙可以知道,甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定. 应用示例思路1例1 画出下列四组样本数据的条形图,说明它们的异同点. (1)5,5,5,5,5,5,5,5,5; (2)4,4,4,5,5,5,6,6,6; (3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8. 分析:先画出数据的条形图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差.解:四组样本数据的条形图如下:四组数据的平均数都是5.0,标准差分别是:0.00,0.82,1.49,2.83. 它们有相同的平均数,但它们有不同的标准差,说明数据的分散程度是不一样的.例2 甲、乙两人同时生产内径为25.40 mm 的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm): 甲25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.44 25.40 25.42 25.35 25.41 25.39 乙25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.49 25.36 25.3425.33 25.43 25.43 25.32 25.47 25.31 25.32 25.32 25.32 25.48从生产的零件内径的尺寸看,谁生产的质量较高?分析:每一个工人生产的所有零件的内径尺寸组成一个总体.由于零件的生产标准已经给出(内径25.40 mm),生产质量可以从总体的平均数与标准差两个角度来衡量.总体的平均数与内径标准尺寸25.40 mm 的差异大时质量低,差异小时质量高;当总体的平均数与标准尺寸很接近时,总体的标准差小的时候质量高,标准差大的时候质量低.这样,比较两人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数与标准差的大小即可.但是,这两个总体的平均数与标准差都是不知道的,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本的平均数、标准差,以此作为两个总体之间差异的估计值. 解:用计算器计算可得甲x ≈25.401,乙x ≈25.406;s 甲≈0.037,s 乙≈0.068.从样本平均数看,甲生产的零件内径比乙的更接近内径标准(25.40 mm),但是差异很小;从样本标准差看,由于s 甲<s 乙,因此甲生产的零件内径比乙的稳定程度高得多.于是,可以作出判断,甲生产的零件的质量比乙的高一些.点评:从上述例子我们可以看到,对一名工人生产的零件内径(总体)的质量判断,与所抽取的零件内径(样本数据)直接相关.显然,我们可以从这名工人生产的零件中获取许多样本.这样,尽管总体是同一个,但由于样本不同,相应的样本频率分布与平均数、标准差等都会发生改变,这就会影响到我们对总体情况的估计.如果样本的代表性差,那么对总体所作出的估计就会产生偏差;样本没有代表性时,对总体作出错误估计的可能性就非常大.这也正是我们在前面讲随机抽样时反复强调样本代表性的理由.在实际操作中,为了减少错误的发生,条件许可时,通常采取适当增加样本容量的方法.当然,关键还是要改进抽样方法,提高样本的代表性. 变式训练某地区全体九年级的3 000名学生参加了一次科学测试,为了估计学生的成绩,从不同学校的不同程度的学生中抽取了100名学生的成绩如下:100分12人,90分30人,80分18人,70分24人,60分12人,50分4人.请根据以上数据估计该地区3 000名学生的平均分、合格率(60或60分以上均属合格). 解:运用计算器计算得:100450126024701880309012100⨯+⨯+⨯+⨯+⨯+⨯=79.40,(12+30+18+24+12)÷100=96%,所以样本的平均分是79.40分,合格率是96%,由此来估计总体3 000名学生的平均分是79.40分,合格率是96%.思路2例1 甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm 2),试根据这组数据估计哪一种水稻品种的产量比较稳定.品种 第1年 第2年 第3年 第4年 第5年 甲 9.8 9.9 10.1 10 10.2 乙9.410.310.89.79.8解:甲品种的样本平均数为10,样本方差为 [(9.8-10)2 +(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷5=0.02. 乙品种的样本平均数也为10,样本方差为 [(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]÷5=0.24. 因为0.24>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定.例2 为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换.已知某校使用的100只日光灯在必须换掉前的使用天数如下,试估计这种日光灯的平均使用寿命和标准差.天数151—180 181—210 211—240 241—270 271—300 301—330 331—360 361—390灯泡数1111820251672分析:用每一区间内的组中值作为相应日光灯的使用寿命,再求平均寿命. 解:各组中值分别为165,195,225,255,285,315,345,375,由此算得平均数约为165×1%+195 ×11%+225×18%+255×20%+285×25%+315×16%+345×7%+375×2%=267.9≈268(天). 这些组中值的方差为1001×[1×(165-268)2+11×(195-268)2+18×(225-268)2+20×(255-268)2+25×(285-268)2+16×(315-268)2+7×(345-268)2+2×(375-268)2]=2 128.60(天2). 故所求的标准差约6.2128≈46(天).答:估计这种日光灯的平均使用寿命约为268天,标准差约为46天. 知能训练 (1)在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为____________.(2)若给定一组数据x 1,x 2,…,x n ,方差为s 2,则ax 1,ax 2,…,ax n 的方差是____________. (3)在相同条件下对自行车运动员甲、乙两人进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:甲 27 38 30 37 35 31 乙 33 29 38 34 28 36试判断选谁参加某项重大比赛更合适? 答案:(1)9.5,0.016 (2)a 2s 2(3)甲x =33,乙x =33,33734722=>=乙甲s s ,乙的成绩比甲稳定,应选乙参加比赛更合适. 拓展提升某养鱼专业户在一个养鱼池放入一批鱼苗,一年以后准备出售,为了在出售以前估计卖掉鱼后有多少收入,这个专业户已经了解到市场的销售价是每千克15元,请问,这个专业户还应该了解什么?怎样去了解?请你为他设计一个方案.解:这个专业户应了解鱼的总重量,可以先捕出一些鱼(设有x 条),作上标记后放回鱼塘,过一段时间再捕出一些鱼(设有a 条),观察其中带有标记的鱼的条数,作为一个样本来估计总体,则鱼塘中鱼的总条数鱼的条数鱼塘中所有带有标记的条鱼中带有标记的条数)(x aa =这样就可以求得总条数,同时把第二次捕出的鱼的平均重量求出来,就可以估计鱼塘中的平均重量,进而估计全部鱼的重量,最后估计出收入. 课堂小结1.用样本的数字特征估计总体的数字特征分两类:用样本平均数估计总体平均数,平均数对数据有“取齐”的作用,代表一组数据的平均水平.用样本标准差估计总体标准差.样本容量越大,估计就越精确,标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度. 2.用样本估计总体的两个手段(用样本的频率分布估计总体的分布;用样本的数字特征估计总体的数字特征),需要从总体中抽取一个质量较高的样本,才能不会产生较大的估计偏差,且样本容量越大,估计的结果也就越精确. 作业习题2.2A 组4、5、6、7,B 组1、2.设计感想统计学科,最大的特点就是与现实生活的密切联系,也是新教材的亮点.仅仅想借助“死记硬背一些概念及公式,简单模仿课本例题”来学习,是绝对不行的.用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差,其原因在于样本的随机性.这种偏差是不可避免的.虽然我们从样本数据得到的分布、均值和标准差并不是总体的真正分布、均值和标准差,而只是总体的一个估计,但这种估计是合理的,特别是当样本的容量很大时,它们确实反映了总体的信息.教师建议:亲身经历“提出问题,收集数据,分析数据,并作出合理决策”过程,在此过程中不仅可以加深对概念等知识的深刻理解,更重要的是发展了思维,培养了分析及解决问题能力,同时在情感、意志等领域也得到了协调发展,这才是学校学习的科学而全面的目标,习题设置有层次,尽量源于教材,又高于教材,这也是高考命题原则.。