【配套K12】江苏省宿迁市高中数学 第2章 统计 2.3 总体特征数的估计(2)练习 苏教版必修3
- 格式:doc
- 大小:218.50 KB
- 文档页数:7
2.3总体特征数的估计(一)【新知导读】1.电池厂从某日生产的电池中抽取10个进行寿命测试,得数据如下(单位:小时):30,35,25,25,30,34,26,25,29,21,则该电池的平均寿命估计是( ) A .27 B .28 C .29 D .302.如果1a 、2a 、3a 、4a 、5a 、6a 的平均数为3,那么12(3)a -、22(3)a -、32(3)a -、42(3)a -、52(3)a -、62(3)a -的平均数为 ( )A .0B .3C .6D .13.2004奥运首金获得者杜丽在决赛中的成绩如下表:下列说法正确的是( )A .平均成绩是(9.4+10.62+10.7+10.42+10.1+10.2+10.82)10=10.5⨯⨯⨯÷B .众数是10.8环C .极差是1.2环D .中位数是10.5环,比平均成绩高0.1环 【范例点睛】例1 李先生是一家快餐店的经理,下面是该快餐店所有工作人员8月份的工资表:(2) 计算出平均工资能反映打工人员这个月收入的一般水平吗?(3) 去掉李某工资后,再计算剩余人员的平均工资,这能代表一般打工人员当月的收入水平吗? 【课外链接】1.如果数据1x 、2x 、3x 、...n x 的平均数是10,则数据172x -,272x -,372x -,...,72n x -的平均数为___________________ . 【随堂演练】1.从测量所得数据中取出a 个x ,b 个y ,c 个z ,d 个ω组成一个样本,则这个样本的平均数x 是( )A .4x y z ω+++ B .4a b c d +++ C .ax by cz d a b c d ω++++++ D .4ax by cz d ω+++2.期中考试之后,班长算出了全班40个人数学成绩的平均分为M ,如果把M 当成一个同学的分数,与原来的40个分数一起,算出这41个分数的平均值为N ,那么MN为( ) A .4041 B .1 C .4140 D .2 3.设n 个实数1x ,2x ,...,n x 的算术平均数为x ,若a x ≠,设2212()()p x x x x =-+-+323()...()n x x x x -++-,2222123()()()...()n q x a x a x a x a =-+-+-+-,则一定有( )A .p q >B .p q <C .p q = D.p =4.某商店备有100千克蔬菜,上午按1.2元/千克的价格售出50千克,中午按1元/千克的价格售出30千克,下午按0.8元/千克的价格售出20千克,那么这批蔬菜的平均售价是每千克____________元.5.一位教师出了一份含有3个问题的测验卷,每个问题1分.班级中30%的学生得了3分,50%的学生得了2分,10%的学生得了1分,另外还有10%的学生得0分,则全班的平均分是_________. 6.已知一个数列有11项,其平均值为1.78,且该数列的前10项的平均值为1.74,则该数列的第11项的值为 __________.7.有一容量为100的某校毕业生起始月薪的样本.数据的分组及各组的频数如下:从上表中,估计该校毕业生起始月薪平均值是______________.8.某校在一次学生身体素质调查中,在甲、乙两班中随机抽10名男生测验100m 短跑,测得成绩如下 (单位:s ):问哪个班男生100m 短跑平均水平高一些?9.一个球队所有队员的身高如下:(单位:cm)178,179,181,182, 176,183,180,183,175,181,185,180,184.问这个球队的队员的平均身高是多少(精确到1cm)?10.学校对王老师与张老师的工作态度、教学成绩及业务学习三个方面做了一个初步的评估,成绩如下表:(1)如果以工作态度、教学成绩及业务学习三个方面的平均分来计算他们的成绩,作为评优的依据,你认为谁会被评为优秀?(2)如果三项成绩的比例依次为20%、60%、20%来计算他们的成绩,结果又会如何?2.3总体特征数的估计(一) 【新知导读】 1.B 2.A 3.C 【范例点睛】 例1.(1)平均工资1(3000450350400320320410)7507x =++++++=元. (2)由(1)所得的平均工资不能反映打工人员这个月的收入水平,这是因为李某工资值为异常值. (3)除李某外的人员平均工资为1(450350400320320410)3756x =+++++=元,则平均工资能代表一般打工人员的当月收入水平. 【课外链接】 1.68 【随堂演练】 1.C 2.B 3.B4.1.06 5.2分 6.2.18 7.1648元. 8. 解:1(15.114.814.114.615.314.814.914.715.214.5)14.810x +++++++++=甲=()s ,1(15.015.014.214.516.115.214.814.915.115.2)15.0()10x s +++++++++=乙=.x x <乙甲,∴甲班男生短跑水平高些.9.解:1(17817918118217618317618018317518118514x =++++++++++++ 180+)184180≈(cm) .10.解: (1)王老师的平均分是(989596)396++÷≈.张老师的均分是:(909998)395.7++÷≈.王老师的平均分较高,评王老师为优秀.(2)王老师的平均分是(9820%9560%9620%)95.8⨯+⨯+⨯=,张老师的平均分为(90⨯20%9960%+⨯9820%)97+⨯=.张老师的得分高,评张老师为优秀.。
2.3 总体特征数估计名师导航三点剖析在初中我们知道,总体平均数(又称为总体期望值)描述了一个总体平均水平,由于对很多总体来说,它平均数不易求得,常用容易求得样本平均数:)(121n x x x n x +++= 对它进展估计,而且常用两个样本平均数大小去近似地比拟相应两个总体平均数大小.一、平均数1.平均数定义假设给定一组数据x 1,x 2,…,x n ,那么称 (i=1,2,3,…,n)为这组数据x 1,x 2,…,x n 平均数(或均值).通常用样本平均数来估计总体平均数.当所给数据中没有重复数据时,我们一般用此公式来求这组数据平均数.这里(x 1+x 2+…+x n ).平均数反映了一组数据集中趋势,我们常用一组数据平均数来衡量这组数据水平.当一组数据中重复数据过多时,假设用上面公式求这组数据平均数,其过程就会显得比拟复杂与冗长,为了简化计算过程,我们引入下面这种计算平均数方法:一般地,假设取值为x 1,x 2,…,x n 频率分别为p 1,p 2,…,p n ,那么其平均数为x 1p 1+x 2p 2+…+x n p n .这一公式实质上就是公式一个变形,它主要用于含有重复数据数据组求平均数.除此之外,当所给数据在某一常数a 上下波动时,我们也可利用公式:a +'=x x ,其中 (x 1′+x 2′+…+x n ′),x1′=x1-a,x2′=x2-a,x3′=x3-a,…,x n′=x n-a;常数a通常取接近于这组数据平均数较“整〞数.例如:求数据70,71,72,73平均数时,我们可以先求出0,1,2,3平均数,然后将此平均数加上70即得该组数据平均数.2.平均数性质(1)假设给定一组数据x1,x2,…,x n平均数为x,那么ax1,ax2,…,ax n平均数为a x;(2)假设给定一组数据x1,x2,…,x n平均数为x,那么ax1+b,ax2+b,…,ax n+b平均数为a x+b;二、极差、方差与标准差在初中我们知道,极差、方差与标准差是描述一个样本与总体波动大小特征数.1.极差定义一组数据最大值与最小值差叫极差.极差也可以对两组数据集中程度进展比照,且比拟简单.但两组数据集中程度差异不大时,利用它就不易得出结论了.而且它只利用了数据中最大值与最小值,对极值过于敏感.但由于只涉及到了两个数据,便于得到.所以极差在实际中也经常用到.例如:数据:25,41,37,22,14,19,39,21,42,40中最大值为42,最小值为14,它极差为42-14=28.2.方差定义在一组数据x1,x2,…,x n中,各数据与它们平均数x差平方平均数,叫做这组数据方差,记作s2,即假设给定一组数据x1,x2,…,x n,那么s2=.为了更好地比拟两组数据集中程度,我们可以利用这两组数据方差对两组数据进展比拟.方差较大数据波动较大;方差较小数据波动较小.当所给数据有单位时,所求得平均数与原数据单位一样,不要漏写单位.方差单位为所给数据单位平方.3.方差性质(1)假设给定一组数据x1,x2,…,x n,方差为s2,那么ax1,ax2,…,ax n方差为a2s2;(2)假设给定一组数据x1,x2,…,x n,方差为s2,那么ax1+b,ax2+b,…,ax n+b方差为a2s2,特别地,当a=1时,那么有x1+b,x2+b,…,x n+b方差为s2,这说明将一组数据每一个数据都减去一样一个常数,其方差是不变,即不影响这组数据波动性;(3)方差刻画了数据相对于均值平均偏离程度.对于不同数据集,当离散程度越大时,方差越大;(4)方差单位是原始测量数据单位平方,对数据中极值较为敏感.4.标准差刻画数据离散程度度量,其理想形式应满足以下三条原那么:(1)应充分利用所得到数据,以便提供更确切信息;(2)仅用一个数值来刻画数据离散程度;(3)对于不同数据,当离散程度大时,该数值也大.我们上面提到极差显然不满足第一条原那么,因为它只利用了数据中最大与最小两个值.方差虽然满足上面三条原那么,然而它有局限性:方差单位是原始数据单位平方,而刻画离散程度一种理想度量应与原始观测数据具有一样单位.解决这一局限性方法就是取方差算术平方根.方差算术平方根称作标准差,记作s,即标准差单位与原始测量数据单位一样,可以减弱极值影响.问题探究问题1:甲、乙两台机床同时生产直径为40㎜零件.为了检验产品质量,从两台机床生产产品中各抽取10件进展了测量,结果如下:39.839.939.839.8甲/mm39.939.939.9乙/mm能用几种方法比拟这两台机床性能?探究:经简单计算可以得出:甲、乙两台机床生产这10件产品直径平均数都为40mm.所以,不能从平均数这一角度来比拟这两台机床性能,即不能从数据平均水平上来比拟,只能从数据离散程度上进展比拟.要从数据离散程度上进展比拟,常见方法有以下几种:方法一:利用初中所学折线统计图.由折线统计图我们可以直观地表示出这两组数据离散程度,甲机床生产产品波动幅度比乙大.所以,乙机床性能好于甲.方法二:利用这两组数据极差进展比拟.甲:40.2-39.8=0.04;乙:40.1-39.9=0.02.显然,乙组数据极差小于甲组数据极差.所以,乙机床性能好于甲.2=0.026(mm2),标准差为s甲=0.161(mm);乙方差为s乙甲2=0.006(mm2),标准差为s乙=0.077(mm).由上可知:不管是方差还是标准差甲均比乙大,这就说明乙机床生产产品要更标准些.所以,乙机床性能好于甲.问题2:某校拟派一名跳高运发动参加一项校际比赛,对甲、乙两名跳高运发动进展了8次选拔比赛,他们成绩(单位:m)如下:甲:1.70,1.65,1.68,1.69,1.72,1.73,1.68,1.67;乙:1.60,1.73,1.72,1.61,1.62,1.71,1.70,1.75.经预测,跳高就很可能获得冠军.该校为了获取冠军,可能选哪位选手参赛?假设预测跳高1.70 m方可获得冠军呢?探究:参加比赛选手成绩得突出,且成绩稳定,这就需要比拟这两名选手平均成绩与成绩方差.甲平均成绩与方差如下:(1.70+1.65+1.68+1.69+1.72+1.73+1.68+1.67)=1.69,1[(1.70-1.69)2+(1.65-1.69)2+…+(1.67-1.69)2]=0.000 s甲2=86.乙平均成绩与方差如下:(1.60+1.73+1.72+1.61+1.62+1.71+1.70+1.75)=1.68,1[(1.60-1.68)2+(1.73-1.68)2+…+(1.75-1.68)2]=0.003 s乙2=815.显然,甲平均成绩好于乙平均成绩,而且甲方差小于乙方差,说明甲成绩比乙稳定.由于甲平均成绩高于乙,且成绩稳定,所以假设跳高1.70 m以上,虽然乙平均成绩不如甲,成绩稳定性也不如甲,假设跳高方可获得冠军时,应派乙参加比赛.精题精讲例1.在去年足球甲A联赛上,一队每场比赛平均失球数是1.5,全年比赛失球个数标准差为1.1;二队每场比赛平均失球数为2.1,全年比赛失球个数标准差为0.4.你认为以下说法中哪一种是正确?(1)平均说来一队比二队技术好;(2)二队比一队技术水平更稳定;(3)一队有时表现很差,有时表现又非常好;(4)二队很少不失球.思路解析此题主要考察对平均数与标准差概念理解.平均数反映了一组数据平均水平,而方差那么反映了一组数据波动性大小.一队每场比赛平均失球数比二队每场比赛平均失球数少,说明一队技术比二队技术好;一队全年比赛失球个数标准差较大,说明一队表现时好时坏,起伏较大;二队平均失球数多,全年比赛失球个数标准差很小,说明二队表现较稳定,经常失球.答案:(1)(2)(3)(4)都正确.例2.下面是某一个工厂所有工作人员在某个月工资,总经理6 000元,技术工人甲900元,技术工作人员乙800元,杂工640元,效劳员甲700元,效劳员乙640元,会计820元.(1)计算所有工作人员平均工资.(2)去掉总经理后,再计算平均工资.(3)在(1)与(2)中两种平均工资哪一种能代表一般工人收入水平,为什么?思路解析计算平均工资是用工资总数除以领工资人数即可.答案:(1)所有工作人员平均工资为(6 000+900+800+640+700+640+820)=1 500(元).(2)去掉总经理后平均工资为(900+800+640+700+640+820)=750(元).(3)能代表一般工人收入水平是去掉总经理后平均工资750元.因为除去总经理之外,工作人员工资均在900元以下,因此不能以1 500元来代表职工平均工资水平.绿色通道一般地,在一组数据中,平均数、众数、中位数能够反映该组数据集中趋势与平均水平,但有时需要去掉极端值(极大值或极小值),这样计算平均数那么更能反映平均水平,这就是有些比赛活动中往往会去掉一个最大值与一个最小值再去计算平均成绩原因.例3.甲、乙两工人同时加工一种圆柱零件,在他们所加工零件中各抽取10个进展直径检测,测得数据如下(单位:mm):甲:19.9,19.7,19.8,20.0,19.9,20.2,20.1,20.3,20.2,20.1;乙:20.0,20.2,19.8,19.9,19.7,20.2,20.1,19.7,20.2,20.4.(1)分别计算上面两个样本平均数与方差;(2)假设零件规定直径为20.0±0.5(mm),根据两个样本平均数与方差,说明谁加工零件质量较稳定.思路解析利用平均数与方差计算公式进展计算,再比拟谁零件质量较稳定.由于方差能说明一组数据波动性大小,那么可通过比拟这两个样本方差大小来比拟两人加工零件稳定性.答案:(1)x甲=20.02,x乙=20.02,利用s2=,可得s甲2=0.033 6,s乙2=0.041 6.∵s甲2<s乙2,∴甲工人加工零件质量比拟稳定.绿色通道比拟两人加工零件质量稳定性,这里通过平均数比拟不出来,需要使用方差来比拟,方差越大说明波动性较大,质量越不稳定.一般地,方差与标准差通常用来反映一组数据波动大小.在统计中,样本方差与标准差通常用来估计总体数据波动大小.例4.从2001年2月21日0时起,中国电信执行新收费标准,其中本地网营业区内通话费是:前3min为0.2元(缺乏3min按3min 计算),以后每分钟加收0.1元(缺乏1min按1min计算).某星期天,一位学生调查了A、B、C、D、E五位同学某天打本地网营业区内通话时间情况,原始数据如表1.表1表2(1)问D同学这天通话费是多少?(2)设通话时间为t min,试根据表1填写频数(落在某一时间段上通话次数)分布表(表2).(3)调整前执行原收费标准是:每3 min为0.2元(缺乏3 min 按3 min计算).问:这五位同学这天实际平均通话费与用原收费标准算出平均通话费相比,是增多了,还是减少了?假设增多,多多少?假设减少,少多少?思路解析在解答此题时,要认真分析题中所给条件,分清不同时间段话费情况,再进一步结合所学数学知识,这样就不难求出结果.答案:(1)0.2+0.1+0.2+2×0.1+0.2=0.9(元),∴D同学这天通话费是0.9元.(2)表2时间段频数累计频数0<t≤323<t≤454<t≤525<t≤61(3)设这五位同学这天实际平均通话费为x元,按原收费标准算出平均通话费为x'元,1(2×0.2+5×0.3+2×0.4+0.5)=0.64,那么x=51(2×0.2+8×0.4)=0.72,x'=5x'-x=0.72-0.64=0.08(元).∴这五位同学这天实际平均通话费比按原标准算出平均通话费减少了0.08元.绿色通道统计学习重在应用,要学会从实际生活之中抽取数据,处理数据,解决实际问题.此题中对于收费方式正确理解是解决问题关键.。
2.3 总体特征数的估计一组数据中重复出现次数最多的数称为这组数的众数. 2.中位数把一组数据按从小到大的顺序排列,把处于中间位置的那个数称为这组数据的中位数.当数据个数为奇数时,中位数是按从小到大的顺序排列的中间的那个数.当数据个数为偶数时,中位数是按从小到大的顺序排列的最中间两个数的平均数.3.平均数(1)若给定一组数据a 1,a 2,…,a n ,则称a =1n ∑i =1n a i =a 1+a 2+…+a nn为这n 个数据的平均数或均值.(2)若一组数据中取值为a 1,a 2,…,a n 的频率分别为p 1,p 2,…,p n ,则其平均数为a 1p 1+a 2p 2+…+a n p n .4.方差与标准差一般地,设样本数据分别是x 1,x 2,…,x n ,样本的平均数为x ,则称s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]为这个样本的方差,其算术平方根s =分别简称样本方差、样本标准差.5.极差一组数据的最大值与最小值的差称为极差.1.下面是高一(8)班十位同学的数学测试成绩:82,91,73,84,98,99, 101,118,98,110,则该组数据的中位数是________.98 [将这组数据从小到大排列为73,82,84,91,98,98,99, 101,110,118,则最中间的两个数为98,98,故中位数为98.]2.在一段时间里,一个学生记录了其中10天他每天完成家庭作业所需要的时间(单位:分钟),结果如下:80,70,70,70,60,60,80,60,60,70.在这段时间里,该学生平均每天完成家庭作业所需时间是________分钟. 68 [平均每天所需时间为80×2+70×4+60×410=68.]3.某老师从星期一到星期五收到的信息数分别为10,6,8,5,6,则该组数据的方差s 2=________.3.2 [5个数据的平均数x =10+6+8+5+65=7.所以s 2=15[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=3.2.]4.已知一个样本中的数据为1,2,3,4,5,则该样本的标准差为________. 2 [平均数x =15(1+2+3+4+5)=3,所以s =15[(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2] = 2.]平均数、众数、中位数【例1】 (1)一个球队所有队员的身高如下(单位:cm):178,178,182,182,178,180,178,180,181,180,181,180,180,182.则这个球队的队员平均身高是________cm(精确到1 cm).(2)有容量为100的样本,数据分组及各组的频数、频率如下:[12.5,14.5),6,0.06;[14.5,16.5),16,0.16;[16.5,18.5),18,0.18;[18.5,20.5),22,0.22;[20.5,22.5),20,0.20;[22.5,24.5),10,0.10;[24.5,26.5],8,0.08.则该样本数据的平均数为________.(1)180 (2)19.42 [(1)法一:利用平均数的定义计算: 平均身高x =114(178+178+182+182+178+180+178+180+181+180+181+180+180+182)=114×2 520=180(cm).法二:利用加权平均数公式计算: 平均身高x =114(178×4+182×3+180×5+181×2)=114×2 520=180(cm).法三:利用新数据法进行计算:取a =180,将各数据同时减去180,得到一组新数据: -2,-2,2,2,-2,0,-2,0,1,0,1,0,0,2. 这组新数据的平均数为x ′=114(-2×4+2×3+0×5+1×2)=0,所以平均身高x =a +x ′=180+0=180(cm).(2)利用频率平均数公式计算:样本数据平均数x =13.5×0.06+15.5×0.16+17.5×0.18+19.5×0.22+21.5×0.20+23.5×0.10+25.5×0.08=19.42.]1.一般情况下,要计算一组数据的平均数,可使用平均数公式x =1n(x 1+x 2+…+x n )来计算.2.如果x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,…,mx n +a 的平均数是m x +A .当数据较大,且大部分数据在某一常数左右波动时,本例中“法三”可以减少运算量,故此法比较简便.3.一般地,如果在n 个数中,x 1出现的频数为f 1,x 2出现的频数为f 2,…,x k 出现的频数为f k (其中f 1+f 2+…+f k =n ),那么x =1n(x 1f 1+x 2f 2+…+x k f k )=1n i =1kx i f i 叫做这n 个数的频数平均数,也称加权平均数,其中f 1,f 2,…,f k 叫做权.4.一般地,若取值为x 1,x 2,…,x n 的频率分别为p 1,p 2,…,p n ,那么其平均数为x =x 1p 1+x 2p 2+…+x n p n .如本例(2)中求平均数方法.提醒:当条件给出某几个范围内的数据的频率或频数时,可用组中值求平均数. 1.某商场买来一车苹果,从中随机抽取了10个苹果,其重量(单位:克)分别为150,152,153,149,148,146,151,150,152,147,由此估计这车苹果单个重量的平均值是________.149.8克 [平均数为x =150+152+153+149+148+146+151+150+152+14710=149.8(克).]2.将一组数据同时减去3.1,得到一组新数据,若原数据的平均数为x ,则新数据的平均数是________.x -3.1 [设原来数据为a 1,a 2,…,a n ,则a 1+a 2+…+a n =n x ,从而新数据的平均数为(a 1-3.1)+(a 2-3.1)+…+(a n -3.1)n=n x -3.1nn=x -3.1.]极差、方差与标准差(1)极差;(2)方差;(3)标准差.[解] (1)该组数据中最大值为9,最小值为5,故该组数据的极差为9-5=4. (2)求方差可以有三种方法:法一:因为x =110(7×4+6×2+8×2+5+9)=7,所以s 2=110×[(7-7)2+(6-7)2+…+(7-7)2]=1.2,法二:同“法一”,求得x =7,所以s 2=110[(72+62+82+…+72)-10×72]=1.2,法三:将各数据减去7,得一组新数据:0,-1,1,1,-2,2,0,0,-1,0,则x ′=0,所以x =x ′+7=7.所以s 2=110[02+(-1)2+12+…+02]-10×02=1.2.(3)由(2)知,标准差s =s 2= 1.2=305. 1.极差是数据的最大值与最小值的差,它反映了一组数据变化的最大幅度,它对一组数据中的极端值非常敏感.2.方差的计算(1)s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2];(2)s 2=1n (x 21+x 22+…+x 2n -n x 2); (3)s 2=1n(x 21+x 22+…+x 2n )-x 2. 3.方差的性质(1)数据x 1,x 2,…,x n 与数据x 1+a ,x 2+a ,…,x n +a 的方差相等.(2)若数据x 1,x 2,…,x n 的方差为s 2,则数据ax 1+b ,ax 2+b ,…,ax n +b 的方差为a 2s 2(a ,b ∈R ).(3)标准差、方差的范围为[0,+∞). 4.标准差的计算方差的算术平方根即标准差,要求标准差先求出方差,再开方取其算术平方根即可. 提醒:方差、标准差的单位不一致要注意区别.3.若一组样本数据2,3,7,8,a 的平均数为5,则该组数据的标准差s =________. 1305 [由平均数为5,得a =5×5-(2+3+7+8)=5,则s 2=15(32+22+22+32+02)=265,s =265=1305.] 4.已知样本x 1,x 2,x 3,x 4,x 5的方差为3,则样本4x 1+1,4x 2+1,4x 3+1,4x 4+1,4x 5+1的标准差是________.4 3 [根据方差的性质知4x 1+1,4x 2+1,4x 3+1,4x 4+1,4x 5+1的方差为42×3=48. 所以其标准差为48=4 3.]平均数、方差与标准差的应用了8次选拔比赛,他们的成绩(单位:m)如下:甲:1.70,1.65,1.68,1.69,1.72,1.73,1.68,1.67; 乙:1.60,1.73,1.72,1.61,1.62,1.71,1.70,1.75.经预测,成绩超过1.65 m 就很有可能获得冠军,该校为了获取冠军,可能选哪位选手参赛?若预测成绩超过了1.70 m 方可获得冠军呢?思路点拨:[解] 甲的平均成绩和方差:x 甲=18×(1.70+1.65+…+1.67)=1.69,s 2甲=18×[(1.70-1.69)2+(1.65-1.69)2+…+(1.67-1.69)2]=0.000 6.乙的平均成绩和方差:x 乙=18×(1.60+1.73+…+1.75)=1.68,s 2乙=18×[(1.60-1.68)2+(1.73-1.68)2+…+(1.75-1.68)2]=0.003 15.显然,甲的平均成绩高于乙的平均成绩,而且甲的方差小于乙的方差,说明甲的成绩比乙稳定,由于甲的平均成绩高于乙,且成绩稳定,所以若成绩超过1.65 m就很可能获得冠军,应派甲参赛.在这8次选拔比赛中乙有5次成绩在1.70 m以上,虽然乙的平均成绩不如甲,成绩的稳定性也不如甲,但当成绩超过1.70 m方可获得冠军时,应派乙参加比赛.在实际问题中,仅靠平均数不能完全反映问题,还要研究其偏离平均值的离散程度(方差或标准差),方差(标准差)越大,说明取值分散性越大,方差(标准差)越小,说明取值分散性越小,取值比较集中、稳定.5.假定以下数据是甲、乙两个供货商的交货天数:甲:10,9,10,10,11,11,9,11,10,10;乙:8,10,14,7,10,11,10,8,15,12.根据以上数据估计两个供货商的交货情况:哪个供货商交货时间短一些?哪个供货商是比较具有一致性与可靠性的供货商?思路点拨:先分别计算出甲、乙两组数据的平均数及方差,再作判断.[解] x甲=110(10+9+…+10)=10.1,s2甲=110(102+92+…+102)-10.12=0.49;x乙=110(8+10+…+12)=10.5,s2乙=110(82+102+…+122)-10.52=6.05>s2甲.从交货天数的平均值来看,甲供货商的交货时间短一些;从方差来看,甲供货商的交货时间较稳定.因此甲供货商是比较具有一致性与可靠性的供货商.6.从甲、乙两种玉米中各抽10株,分别测得它们的株高如下(单位:cm):甲:25,41,40,37,22,14,19,39,21,42;乙:27,16,44,27,44,16,40,40,16,40.问:(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?思路点拨:看哪种玉米的苗长得高,只要比较甲、乙两种玉米的平均高度即可;要比较哪种玉米的苗长得齐,只要看两种玉米高的方差即可,因为方差是体现一组数据波动大小的特征数.[解] (1)x甲=110(25+41+40+37+22+14+19+39+21+42)=30(cm),x乙=110(27+16+44+27+44+16+40+40+16+40)=31(cm),因为x甲<x乙.故乙种玉米苗长得高.(2)s2甲=110[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=104.2(cm2).s 2乙=110[(27-31)2+(16-31)2+(44-31)2+(27-31)2+(44-31)2+(16-31)2+(40-31)2+(40-31)2+(16-31)2+(40-31)2]=128.8(cm 2).因为s 2甲<s 2乙,所以甲种玉米的苗长得齐.1.本节课的重点是会求样本的众数、中位数、平均数、标准差、方差,难点是理解用样本的数字特征来估计总体数字特征的方法.2.本节课要掌握以下几类问题(1)当平均数大于中位数时,说明数据中存在较大的极端值;反之,说明数据中存在较小的极端值.(2)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.1.已知1,2,3,4,x 1,x 2,x 3的平均数是8,那么x 1+x 2+x 3的值是( ) A .56 B .48 C .46D .24C [由条件知,1+2+3+4+x 1+x 2+x 3=8×7, 所以x 1+x 2+x 3=46.]2.某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4. 则:(1)平均命中环数为________; (2)命中环数的标准差为________. (1)7 (2)2 [(1)x =110(7+8+7+9+5+4+9+10+7+4)=7. (2)s 2=110[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4,所以s =s 2=4=2.]3.已知一个样本为1,3,2,5,x ,它的平均数是3,则这个样本的标准差是________. 2 [x =1+3+2+5+x5=3,∴x =4. 由方差公式有:s 2=15[(1-3)2+(3-3)2+(2-3)2+(5-3)2+(4-3)2]=2,∴s = 2.]4.有两位射击运动员在一起射击,测试中各射靶10次,每次命中的环数如下: 甲:8,7,9,7,5,4,10,9,7,4;乙:5,9,8,7,7,6,6,8,7,7.如果这是一次选拔性考核,应当选择谁?思路点拨:平均数反映总体的平均水平,而方差反映了总体的稳定程度,我们可用平均数与方差从不同的方面估计总体.[解] x甲=110(8+7+9+7+5+4+10+9+7+4)=7,x乙=110(5+9+8+7+7+6+6+8+7+7)=7.s2甲=110[(8-7)2+(7-7)2+(9-7)2+(7-7)2+(5-7)2+(4-7)2+(10-7)2+(9-7)2+(7-7)2+(4-7)2]=4.s2乙=110[(5-7)2+(9-7)2+(8-7)2+(7-7)2+(7-7)2+(6-7)2+(6-7)2+(8-7)2+(7-7)2+(7-7)2]=1.2.由x甲=x乙知两个射击运动员的平均成绩是一样的.由s2甲>s2乙知,甲的成绩不如乙的成绩稳定.综合考虑,应选择乙.。
2.3.1 平均数及其估计[新知初探]1.平均数的概念一组数据的总和除以数据的个数所得的商就是这组数据的平均数(或均值),一般记为:a =a 1+a 2+…+a nn.[点睛](1)平均数反映了一组数据的集中趋势,它是一组数据的“重心”,是度量一组数据波动大小的基准.(2)用样本平均数可估计总体平均数.(3)用平均数可以比较两组数据的总体情况,如成绩、产量等. 2.平均数的计算(1)定义法:已知x 1,x 2,x 3,…,x n 为某样本的n 个数据,则这n 个数据的平均数为x =x 1+x 2+x 3+…+x nn.(2)利用平均数性质:如果x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,…,mx n +a 的平均数是m x +a .(3)加减常数法:数据x 1,x 2,…,x n 都比较大或比较小,且x 1,x 2,…,x n 在固定常数a 附近波动,将原数据变化为x 1±a ,x 2±a ,…,x n ±a ,新数据的平均数为x ′,则所求原数据的平均数为x ′±a .(4)加权平均数法:样本中,数据x 1有m 1个,x 2有m 2个,…,x k 有m k 个,则x =m 1x 1+m 2x 2+…+m k x km 1+m 2+…+m k.(5)频率法:一般地,若取值为x 1,x 2,…,x n 的频率分别为p 1,p 2,…,p n ,则其平均数x =p 1x 1+p 2x 2+…+p n x n .(6)组中值法:若样本为n 组连续型数据,则样本的平均数=组中值与对应频率之积的和.[小试身手]1.(江苏高考)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________. 解析:x =4+6+5+8+7+66=6.答案:62.若数据x 1,x 2,x 3,…,x n 的平均数为2,则数据2x 1-1,2x 2-1,2x 3-1,…,2x n -1的平均数为________.答案:33.数据2,2,-4,-4,-4,3,3,3,3的平均数为________. 答案:49[典例] (1)某班45名同学的年龄(单位:岁)如下: 14 15 14 16 15 17 16 15 16 16 15 15 17 13 14 15 16 16 15 14 15 15 14 15 16 17 16 15 15 15 16 15 13 16 15 15 17 14 15 16 16 15 14 15 15, 求全班的平均年龄.(2)从高三年级中抽出50名学生参加数学竞赛,由成绩得到如图所示的频率分布直方图.试利用频率分布直方图估计高三年级学生的平均成绩. [解] (1)法一:利用平均数的公式计算.x =145×(14+15+…+15)=145×684=15.2(岁).法二:利用平均数的简化公式计算. 取a =15,将已知各数减去15,得-1 0 -1 1 0 2 1 0 1 1 0 0 2 -2平均数的计算-1 0 1 1 0 -1 0 0 -1 0 1 2 1 0 0 0 1 0 -2 1 0 0 2 -1 0 1 1 0 -1 0 0x′=145×(-1+0+…+0)=145×9=0.2(岁).x=x′+a=0.2+15=15.2(岁).法三:利用加权平均数公式计算.x=145×(13×2+14×7+15×20+16×12+17×4)=145×684=15.2(岁).即全班的平均年龄是15.2岁.(2)样本平均数是频率分布直方图的“重心”,即所有数据的平均数,取每个小矩形底边的中点值乘以每个小矩形的面积再求和即可.故平均成绩为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.024×10)+95×(0.016×10)=76.2.[活学活用]1.某医院的急诊中心的记录表明以往到这个中心就诊的病人需等待的时间的分布如下:则到这个中心就诊的病人平均需要等待的时间估计为________.解析:x=2.5×0.2+7.5×0.4+12.5×0.25+17.5×0.1+22.5×0.05=9.5.答案:9.52.某班进行一次考核,满分5分,3分(包括3分)以上为合格,得1分,2分,3分,4分,5分的人数占该班人数的比例分别为5%,10%,35%,40%和10%,试求该班的平均得分.解:由于本题没有给出该班同学的人数,故无法用定义法求解.而题中给出了相应分数及所占比例,故可用频率平均数公式计算.x =1×0.05+2×0.10+3×0.35+4×0.40+5×0.10=3.4,故该班的平均分数为3.4分.[典例] 若x 1,x 2,…,x n 的平均数为x ,数据y 1,y 2,…,y n 的平均数为y ,求下列几组数据的平均数.(1)2x 1,2x 2,…,2x n ;(2)kx 1+a ,kx 2+a ,…,kx n +a ; (3)x 1+y 1,x 2+y 2,…,x n +y n .[解] 据题意x =1n(x 1+x 2+x 3+…+x n ),y =1n(y 1+y 2+…+y n ),设第一组数据平均数为z ,第二组数据平均数为甲,第三组数据平均数为乙. (1)z =1n (2x 1+2x 2+…+2x n )=2·1n(x 1+x 2+…+x n )=2x ,(2)甲=1n[(kx 1+a )+(kx 2+a )+…+(kx n +a )]=1n[k (x 1+x 2+…+x n )+na ]=k ·1n(x 1+x 2+…+x n )+a =k x +a .(3)乙=1n[(x 1+y 1)+(x 2+y 2)+…+(x n +y n )]=1n [(x 1+x 2+…+x n )+(y 1+y 2+…+y n )]=1n(x 1+x 2+…+x n )+1n(y 1+y 2+…+y n )=x +y .平均数的性质[活学活用]已知数据x 1,x 2,…,x n 的平均数为12,数据y 1,y 2,y 3,…,y n 的平均数为2,则数据2x 1+3,2x 2+3,…,2x n +3的平均数为________,数据ax 1+by 1,ax 2+by 2,…,ax n +by n 的平均数为________.答案:4 12a +2b层级一 学业水平达标1.已知1,2,3,4,a ,b ,c 的平均数是8,则a +b +c =________. 解析:据题意17(1+2+3+4+a +b +c )=8,∴a +b +c =46. 答案:462.已知2,4,2x,4y 四个数的平均数是5,而5,7,4x,6y 四个数的平均数是9,则xy 的值是________.解析:据题意⎩⎪⎨⎪⎧14+4+2x +4y =5,14+7+4x +6y =9,解之得⎩⎪⎨⎪⎧x =3,y =2.∴xy =6. 答案:63.在一次知识竞赛中,抽取40名选手,成绩分布如下:则选手的平均成绩是________.解析:x =140(6×2+7×5+8×7+9×11+10×15)=8.8.答案:8.81. 一位同学种了甲、乙两种树苗各1株,分别观察了9次、10次后,得到树苗高度的数据的茎叶图如图(单位:厘米).则甲种树苗高度平均为________;乙种树苗的高度平均为________;甲、乙两种树苗高度平均为________.解析:根据茎叶图可得,观察甲树苗9次得到的树苗高度分别为:14,20,21,23,24,30,32,33,37;观察乙树苗10次得到的树苗高度分别为:10,11,14,24,26,30,44,46,46,47,易得甲树苗高度平均为2349=26,乙树苗高度平均为29810=29.8,甲、乙两种树苗高度平均为119(234+298)=28.答案:26 29.8 285.50名同学参加数学竞赛,成绩的分组及各组的频数如下:(单位:分)[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.列出样本的频率分布表并求这50名同学的平均分.解:频率分布表如下:法一:总成绩约为45×2+55×3+65×10+75×15+85×12+95×8=3 810(分),故50名同学的数学平均分约为3 810÷50=76.2(分).法二:求组中值与对应频率之积的和.45×0.04+55×0.06+65×0.2+75×0.3+85×0.24+95×0.16=76.2(分).层级二应试能力达标1.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,那么由此求出的平均数与实际平均数的差是________.答案:-32.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是________.答案:91.5,91.53.一个企业,30%的员工年收入为1万元,65%的员工年收入为3万元,5%的员工年收入为11万元,则这个企业员工的年平均收入是________万元,年收入的中位数是________万元.解析:年平均收入为1×0.3+3×0.65+11×0.05=2.8,中位数为3. 答案:2.8 34.已知x 是x 1,x 2,…,x 100的平均数,a 是x 1,x 2,…,x 40的平均数,b 是x 41,x 42,…,x 100的平均数,则下列各式正确的是________.(填序号)①x =40a +60b 100;②x =60a +40b100;③x =a +b ;④x =a +b2.答案:①5.已知数据x 1,x 2,…,x 8的平均数为6,则数据2x 1-6,2x 2-6,…,2x 8-6的平均数为________. 答案:66.已知样本数据x 1,x 2,…,x n 的平均数为h ,y 1,y 2,…,y m 的平均数为k ,则把两组数据合并成一组以后,这组样本的平均数为____________.答案:nh +mk n +m7.一个高中研究性学习小组对本地区2014年至2016年快餐公司发展情况进行了调查,制成了该地区快餐公司个数情况的条形图和快餐公司盒饭年销售量的平均数情况条形图(如图),根据图中提供的信息可以得出这三年中该地区每年平均销售盒饭________万盒.解析:2014年:30×1.0=30(万),2015年:45×2.0=90(万),2016年:90×1.5=135(万),x =13(30+90+135)=85(万).答案:858.某餐厅共有7名员工,所有员工的工资情况如下表:解答下列问题:(1)餐厅所有员工的平均工资是________.(2)所有员工工资的中位数是________.(3)用平均数还是用中位数描述该餐厅员工工资的一般水平比较恰当?________.(4)去掉经理的工资后,其他员工的平均工资是________,是否也能反映该餐厅员工工资的一般水平?________.(填“能”或“不能”)解析:(1)平均工资为(3 000+700+500+450+360+340+320)÷7=810.(2)由表格可知中位数为450.(3)用中位数描述该餐厅员工工资的一般水平比较恰当.(4)去掉经理的工资后,其他员工的平均工资为(700+500+450+360+340+320)÷6=445.平均工资能反映该餐厅员工工资的一般水平.答案:(1)810 (2)450 (3)中位数(4)445 能9.为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A 药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.52.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4服用B药的20位患者日平均增加的睡眠时间:3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.41.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?解:(1)设A 药观测数据的平均数为x ,B 药观测数据的平均数为y . 由观测结果可得x =120×(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,y =120×(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.由以上计算结果可得x >y ,因此可看出A 药的疗效更好. (2)由观测结果可绘制如下茎叶图:以上茎叶图可以看出,A 药疗效的试验结果有710的叶集中在茎2,3上,而B 药疗效的试验结果有710的叶集中在茎0,1上,由此可看出A 药的疗效更好.10.有一组数据:x 1,x 2,…,x n (x 1<x 2<…<x n )的算术平均数为10,若去掉其中最大的一个,余下数据的算术平均数为9;若去掉其中最小的一个,余下数据的算术平均数为11.(1)求出第一个数x 1关于n 的表达式及第n 个数x n 关于n 的表达式;(2)若x 1,x 2,…,x n 都是正整数,试求第n 个数x n 的最大值,并举出满足题目要求且x n 取到最大值的一组数据.解:(1)依条件得⎩⎪⎨⎪⎧x 1+x 2+…+x n =10n , ①x 1+x 2+…+x n -1=n -, ②x 2+x 3+…+x n =n -, ③由①-②得x n =n +9.又由①-③得x 1=11-n .(2)由于x 1是正整数,故x 1=11-n ≥1⇒1≤n ≤10,故x n =n +9≤19.当n =10时,x 1=1,x 10=19,x 2+x 3+…+x 9=80,此时,x 2=6,x 3=7,x 4=8,x 5=9,x 6=11,x 7=12,x 8=13,x 9=14.。
2.3.2 方差与标准差平均数向我们提供了样本数据的重要信息,但是,平均数有时也会使我们作出对总体的片面判断,某地区的统计报表显示,此地区的年平均家庭收入是10万元,给人的印象是这个地区的家庭收入普遍较高.但是,如果这个平均数是从200户贫困家庭和20户极富有的家庭收入计算出来的,那么,它就既不能代表贫困户家庭的年收入,也不能代表极富有家庭的年收入.因为这个平均数掩盖了一些极端的情况,而这些极端情况显然是不能忽视的.因此,只有平均数还难以概括样本数据的实际状态案例探究甲、乙两班学生各50人,其语文平均成绩都是80分,但甲班最高成绩98分,最低42分,而乙班最高成绩86分,最低60分.初步看出,两班语文成绩是不一样的,甲班学生的语文成绩个别差异程度大、水平参差不齐;而乙班学生的语文成绩差异程度小,语文水平整齐度大些.如果你是老师,你应当如何对这两个班的成绩作出评价呢?分析:我们把一组数据的最大值与最小值的差称为极差,由数据可知甲班的极差较大,数据点较分散,乙班的极差较小,数据点分布较集中,这说明乙班成绩比甲班稳定,运用极差对两组数据进行比较,操作简单方便,但如果两组数据的集中程度差异不大时,就不容易得出结论.我们还可以考虑每一个学生的成绩与平均成绩的离差,离差越小,稳定性就越高.结合上节有关离差的讨论,可用每个同学的成绩与平均成绩的差的平方和表示.由于两组数据的容量可能不同,因此应将上述平方和除以数据的个数,我们把由此所得的值称为这组数据的方差(variance).因为方差与原始数据的单位不同,且平方后可能夸大了离差的程度,我们将方差开方后的值称为这组数据的标准差(standard deviation).标准差也可以刻画数据的稳定程度.一般地,设一组数据x1,x2,…,x n,其平均数为x,则称S2=∑=-niix xn12) (1为这个样本的方差,其算术平方根S=n xx ni i∑=-12)((*)为样本的标准差,分别简称样本方差、样本标准差.根据上述方差计算公式可算出甲、乙两个班样本的方差,从而比较哪个班成绩好些.计算标准差时,首先要计算数据的平均数x,接着要计算各数据与平均数之间的离差平方,即(x i-x)2,最后由公式(*)计算标准差S.例如,4名儿童的身高分别是110厘米,100厘米,120厘米和150厘米,若求4名儿童身高数据的标准差时,其基本步骤如下:(1)求平均数:x=4150 120100110+++=120(厘米)(2)求离差平方和:∑(x i-x)2=(110―120)2+(100―120)2+(120―120)2+(150―120)2=100+400+0+900=1 400(平方厘米) (3)求标准差S :S=41400=350(厘米)这样,我们大体可认为,这4名儿童身高差异程度,从平均角度来看,约相差18.71厘米.自党导引1.天气预报说今天最高气温7 ℃,最低气温-2 ℃,则今天气温的极差为多少? 答案:2.据统计,某小区居民中年龄最大的为89岁,年纪最小的为1岁,那么小区人口年龄的极差为多少? 答案:88岁3.你认为下面几种说法中正确的是( ) A .一组数据的平均值总是正数 B .一组数据的方差有可能是负数C .用一组数据中的每个数分别减去平均值,再将得到的差相加,和一定为零D .一组数据的标准差一定比方差小 答案:C4.我们可以用一组数据中的最大值减去最小值所得的差来反映这组数据的变化范围.用这种方法得到的差称为极差.5.方差实际上是一种表示一组数据的离散程度的量,我们可以用“先平均,再求差,然后平方,最后再平均”的方法得到.6.标准差与方差有什么关系?这二者与原数据在单位上有什么关系?答案:标准差是方差的算术平方根,标准差与原数据具有相同的单位,方差的单位是原单位的平方.7.反映数据离散程度的指标是什么?在一次数学测试中,甲、乙两班的平均成绩相同,甲班成绩的方差为42,乙班成绩的方差为35,这样的结果说明两个班的数学学习状况各有什么特点?答案:反映数据离散程度的指标是方差和标准差.甲班的方差大于乙班的方差,说明甲班的学生成绩较分散,优生和成绩差的学生较多.而乙班的学生成绩较集中,优生和成绩差的学生较少.8.观察下面的折线图,回答问题:(1)a 组数据的极差较大.(2)a组数据的方差较大.9.比较下面两幅频数分布图中的数据,哪组的平均值较大?哪组的标准差较大?答案:b组的平均值较大,a组的标准差较大.10.观察下面的几组图,分别指出各组中哪一组的标准差较大,并说说为什么.(1)(2)(3)答案:(1)标准差相同,因为虽然数据排列不同,但其实是相同的两组数据;(2)b 组的标准差较大,因为a组有一些数距离平均值较近;(3)b组的标准差较大,因为b组中每个数据都是a组中的两倍,因此标准差也是它的两倍疑难剖析【例1】某校团委举办了英语口语竞赛.甲、乙两个团小组成绩如下:甲组:76 90 84 86 81 87 86乙组:82 84 85 89 80 94 76(1)分别求出甲、乙两个团小组的平均分、标准差(精确到0.01);(2)说明哪个团小组成绩比较稳定?思路分析:由于所给数据较整,用定义公式求x及S.再由所学统计知识即可作此判断.解:(1)∵7868781868490761++++++=x=84.29,7769480898584822++++++=x =84.29,,233.47)86()87()81()86()84()90()76(212121212121211≈-+-+-+-+-+-+-=x x x x x x x S ,47.57)67()94()08()98()85()84()82(222222222222222≈-+-+-+-+-+-+-=x x x x x x x S (2)∵S 1<S 2,∴甲小组的成绩比较稳定.思维启示:方差的概念是本单元的一个重点,也是本章的重点和难点,中考命题常常涉及到方差的概念比较抽象,理解有一定的困难,因此在复习时要多接触一些实例,以加深理解计算方差的公式.【例2】 某校从甲、乙两名优秀选手中选1名选手参加全市中学生田径百米比赛,该校预先对这两名选手测试了8次,测试成绩如下表:根据测试成绩,请你运用所学过的统计知识作出判断,派哪一位选手参加比赛更好?为什么?思路分析:首先计算甲、乙两选手的成绩的平均数,然后看每位同学成绩的方差 ,利用方差比较两位同学成绩的稳定性解:设甲的平均数是x 1,乙的平均数是x 2,甲的方差是S 甲2,乙的方差是S 乙2,则由题意可求得: x 1=82.124.125.121.135.12132.121.12+++++++=12.5;x 2=85.123.128.122.12138.124.1212+++++++=12.5;S 甲2=[(12.1-12.5)2+(12.2-12.5)2+(13-12.5)2+(12.5-12.5)2+(13.1-12.5)2+(12.5-12.5)2+(12.4-12.5)2+(12.2-12.5)2]=0.12S 乙2=[(12-12.5)2+(12.4-12.5)2+(12.8-12.5)2+(13-12.5)2+(12.2-12.5)2+(12.8-12.5)2+(12.3-12.5)2+(12.5-12.5)2]=0.10.∵S 甲2>S 乙2,∴虽然甲乙两人的平均成绩相同,但乙的成绩较稳定,应选乙选手参加比赛.思维启示:在显示数据离散程度(波动大小)的一类数中,方差是刻画总体或样本波动大小的一个重要特征数据,其定义是用各偏差的平方的平均数建立起来的,对于一组数据,除需了解它们的平均水平外,还常常需要了解它们的波动大小(即偏离平均数的大小).对于两组可比的数据,平均数只能反映它们的集中趋势,而比较它们的波动大小,就要通过计算标准差或方差的大小来确定.还应注意,只有当两组数据的平均数相等或比较接近时,方差或标准差才能反映数据波动大小的实际情况——方差或标准差越大(小),波动也越大(小).【例3】 为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换,已知某校使用的100只日光灯在必须更换掉前的使用天数如下表:(1)试估计这种日光灯的平均使用寿命;(2)若定期更换,可选择多长时间统一更换合适?思路分析:总体的平均数与标准差往往是很难求,甚至是不可能求的,通常的做法就是用样本的平均数与标准差去估计总体的平均数与标准差,只要样本的代表性好,这种做法就是合理的.解:(1)各组中值分别为165,195,225,255,285,315,345,375,由此可算得平均数约为10025285202551822511195165⨯+⨯+⨯+⨯++1002375734516315⨯+⨯+⨯=267.9≈268(天).(3)将组中值对于此平均数求方差:⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡-⨯+-⨯+-⨯+-⨯+-⨯+-⨯+-⨯+-⨯⨯22222222)268375(2)268345(7)268315(16)268285(25)268225(20)268225(18)268195(11)268165(11001=2 128.60(天2) 故标准差为60.1282≈46(天)答:估计这种日光灯的平均使用寿命约为268天,故可在222天到314天左右统一更换较合适.思维启示:(1)在刻画样本数据的分散程度上,方差与标准差是一样的,但在解决实际问题时,一般多采用标准差.(2)平均数和标准差是工业生产中检测产品 质量的重要指标,当样本的平均数或标准差超过了规定界限的时候,说明这批产品的质量可能距生产要求有较大的偏离,应该进行检查,找出原因,从而及时解决问题.在Excel 中,可分别用函数“VARP( )”和“STDEVP( )”计算方差和标准差.也可用计算器,在“统计”模式下输入数据,按“SHIFT SVAR 2”键,得标准差,再按x 2键即为方差.拓展迁移【拓展点1】 标准差的取值范围是什么?标准差为0的样本数据有什么特点?答案:非负,标准差为0意味着所有的样本数据都相等.【拓展点2】甲乙两人同时生产内径为25.4mm的一种零件,为了对两人的生产质量进行评比,从他们生产的零件中各抽取20件,量得其内径尺寸如下(单位mm):甲25.46 25.32 25.45 25.39 25.36 25.3425.42 25.45 25.38 25.42 25.39 25.4325.39 25.40 25.44 25.40 25.42 25.3525.41 25.39乙25.40 25.43 25.44 25.48 25.48 25.4725.49 25.49 25.36 25.34 25.33 25.4325.43 25.32 25.47 25.31 25.32 25.3225.32 25.48从生产的零件内径的尺寸看,谁生产的质量较高?思考:两个总体的平均数与标准差知不知道?25.40 mm是不是它们的平均数?答案:每一个工人生产的所有零件的内径尺寸组成一个总体.由于零件的生产标准已经给出(内径25.40mm),生产质量可以从总体的平均数与标准差两个角度来衡量.总体的平均数与内径标准尺寸25.40 mm的差异大时质量低,差异小时质量高,当总体的平均数与标准尺寸很接近时,总体的标准差小时质量高,标准差大时质量低.这样,比较两人的生产质量,只要比较他们所生产的零件尺寸所组成的两个总体的平均数与标准差的大小即可.但是,这两个总体的平均数与标准差都是不知道的,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本的平均数、标准差,以此作为两个总体之间差异的估计值.∵x甲=25.400 5, x乙=25.405 5,S甲≈0.037,S乙≈0.068,∴S甲<S乙.因此,甲生产的质量较高.。
2.3.2 方差与标准差整体设计教材分析“方差与标准差”这节课在上节课平均数的基础上,从实例“有甲、乙两种钢筋,检查它们的抗拉强度”中平均数不是反映总体质量、水平的唯一特征数,在平均值相差不大的情况下,数据的稳定程度可以作为评价对象质量高低的又一重要因素,从而说明引入方差、标准差的必要性,同时使学生养成从多个角度看问题的习惯,锻炼了学生的创造性思维.为了让学生充分体会“稳定性”的意义,教材中用数轴表示两组数据,形象地表现出数据的“聚散”程度,并用极差反映数据的稳定性.当两组数据的极差相差不大时,就不适宜用极差来表示稳定性,这时可用“方差与标准差”作为比较数据稳定性的特征数.初中已学过方差概念,现在的教学不能停留在原有的水平上,要将用方差刻画数据的稳定程度的理由讲清楚,充分揭示用方差作为比较数据稳定性水平的特征数的思维过程.通过方差的单位与原数据的单位的比较,通过实际问题的分析,让学生了解到用方差反映稳定性水平的不足之处是与原数据单位不一致,且平方后可能夸大偏差的程度等,从而引入“标准差”的概念,这一过程应让学生在形成问题和解决问题的过程中加以探索.三维目标1.通过对具体案例的分析掌握样本数据的平均数、方差与标准差的基本概念和计算方法,培养学生分析问题和解决问题的能力,激发学生探究数学问题的兴趣和动机.2.在解决统计问题的过程中,进一步体会用样本估计总体的思想,形成对数据处理过程进行初步评价的意识.3.引导学生对一些生活中实际问题的学习, 进一步培养学生的数学素养和增强学生的数学应用意识及认真、耐心、细致的学习态度和学习习惯.4.渗透数学来源于实践,反过来又作用于实践的观点.重点难点教学重点:1.通过实例理解样本数据方差与标准差的意义和作用,学会计算数据的样本方差与标准差.2.根据方差与标准差对事件进行科学的决策,形成对数据处理过程进行初步评价的意识.教学难点:1.方差与标准差的计算方法及运算的准确性.2.用样本的基本数字特征估计总体的基本数字特征,从中进一步理解统计的基本思想.课时安排1课时教学过程导入新课平均数向我们提供了样本数据的重要信息,但是,平均数有时也会使我们作出对总体的片面判断.某地区的统计报表显示,此地区的年平均家庭收入是10万元,给人的印象是这个地区的家庭收入普遍比较高.但是,如果这个平均数是从200户贫困家庭和20户极富有的家庭收入计算出来的,那么它就既不能代表贫困家庭的年收入,也不能代表极富有家庭的年收入.因为这个平均数掩盖了一些极端情况.而这些极端情况显然是不能被忽视的.因此,只有平均数还难以概括样本数据的实际情况.举例:有甲、乙两种钢筋,现从中各抽取一个样本(如下表)检查他们的抗拉强度(单位:kg/mm2),通过计算发现,两个样本的平均数均为125.哪种钢筋的质量较好?两种钢筋的平均数都是125,那么,它们有没有什么差异呢?推进新课作出图形,作直观比较:直观上看,还是有差异的.乙的强度比较分散,甲的强度相对集中.因此,我们还需要从另外的角度来考察这两组数据.例如,在作统计图、表时提到过的极差甲的强度极差=135-110=25,乙的强度极差=145-100=45.它在一定程度上表明了样本数据的分散程度,与平均数一起,可以给我们许多关于样本数据的信息,显然,极差对极端值非常敏感,注意到这一点,我们可以得到一种“去掉一个最高分,去掉一个最低分”的统计策略.新知探究1.方差(variance)的概念:考察样本数据的分散程度的大小,最常用的统计量是方差,一般用s2表示.假设样本数据是x1,x2,…,x n,x表示这组数据的平均数.结合上节课有关离差的讨论可知,离差越小,稳定性就越高. 因此,通常用如下公式计算方差:且平方后可能夸大了离差的程度,因此将其算术平方),分别简称样本方差、样本标准差.x i-x(i=1,2,…,n);的平方;S4 算出S3中n个平方数的平均数;S5 算出S4中平均数的算术平方根,即为样本标准差.关于方差、标准差的一点说明:(1)方差、标准差是用来描述样本数据的离散程度的,它反映了各个样本数据聚集于样本平均数周围的程度.方差与标准差越小,表明各个样本数据在样本平均数的周围越集中;反之,方差标准差越大,表明各个样本数据在样本平均数的周围越分散.(2)在实际应用中,方差与标准差常被理解为稳定性.例如在上面的比较两种钢筋的抗拉强度时,方差与标准差越小意味着该产品的质量越稳定;在描述成绩时,方差与标准差越小,说明成绩越稳定.(3)学生思考“标准差的取值范围是什么?标准差为0的样本数据有什么特点?”由标准差的定义容易得出标准差是非负的;标准差为0意味着所有的样本数据都相等的特性,且与样本平均数也相等,可以构造一个样本容量为2的样本:x1,x2(x1<x2),这样可以体会出两个样本数据分散程度与样本标准差之间的关系.应用示例例1 根据下列四组样本数据,说明它们的异同点.(1) 5 5 5 5 5 5 5 5 5;(2) 4 4 4 5 5 5 6 6 6;(3) 3 3 4 4 5 6 6 7 7;(4) 2 2 2 2 5 8 8 8 8.分析:从数据的数字特征出发.解:四组数据的平均数都是5.0,标准差分别是0.00,0.82,1.49,2.83.虽然它们有相同的平均数,但是它们有不同的标准差,说明数据的分散程度是不一样的.点评:样本的方差、标准差能说明数据的分散程度.例2 甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm2),试根据这组数据估计哪一种水稻品种的产量比较稳定.分析:巩固求方差和标准差的方法.解:甲品种的样本平均数为10,样本方差为[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷5=0.02,乙品种的样本平均数也为10,样本方差为[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]÷5=0.24.因为0.24>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定.点评:1.本题若仅由x甲=x乙,易产生这两种水稻的产量一样稳定的错觉.这表明在实际问题中,仅靠期望值(即平均数)不能完全反映问题,还要研究其偏离平均值的离散程度(及方差或标准差):标准差大说明取值分散性大,标准差小说明取值分散性小或者说取值比较稳定、集中.2.要对“根据这组数据估计…”的统计意义作必要的说明:第一,统计研究是以一定的样本为依据的,对于确定的样本得到确定的统计结果;第二,统计结果具有随机性,选择不同的样本可能得到不同的统计结果.最后还可让学生思考除了品种的优劣,影响水稻产量还有哪些因素?根据一组数据得到的结果是否可靠?这些问题的提出会激发学生对统计学理论的兴趣.例3 为了保护学生的视力,教室内的日光灯在使用了一段时间后必须更换.已知某校使用的100只日光灯在必须换掉前的使用天数如下,试估计这种日光灯的平均使用寿命和标准差.分析:用每一个区间内的组中值作为相应日光灯的使用寿命,再求平均使用寿命. 解:各组中值分别为165.5,195.5,225.5,255.5,285.5,315.5,345.5,375.5,由此算得平均数约为165.5×1%+195.5×11%+225.5×18%+255.5×20%+285.5×25%+315.5×16%+345.5×7%+375.5×2%=268.4≈268(天).这些组中值的方差为1001×[1×(165.5-268.4)2+11×(195.5-268.4)2+18×(225.5-268.4)2+20×(255.5-268.4)2+25×(285.5-268.4)2+16×(315.5-268.4)2+7×(345.5-268.4)2+2×(375.5-268.4)2]=2 128.60(天2), 故所求的标准差约为6.2128≈46(天).答:估计这种日光灯的平均寿命约为268天,标准差约为46天.点评:此例的目的是:掌握连续性随机变量的平均值和标准差的一种估计方法,即组中值估计法.因为前一节例3已介绍了连续性随机变量的平均值的估计方法,所以处理此例时应让学生回忆前例并主动探索解决问题的方法.例4 容量是40的样本中各数据与30的差的平方和是250,样本标准差是1.5,求样本平均数.分析:根据样本平均数、样本方差、样本标准差的公式解题.2=250,40)+40×302=250.① 40-x )2]=1.52=2.25, )+40x 2=90, ,② 即x 2-60x +896=0,( x -32)( x -28)=0, 所以,x =32或x =28.点评:理解样本方差的含义,抓住关键点:x 1+x 2+…+x 40=40x ,通过数形结合,结合消元x 1+x 2+…+x 40合理解决问题.例5 已知一组数据的方差是s 2,将这组数据的每个数据都加上10,求所得新数据的方差.分析:利用方差公式解题.解:设原数据:x 1,x 2,…,x n ,平均数是x ,方差是s 2, 则新数据为:x 1+10,x 2+10,…,x n +10,平均数为则方差为n 1[(x 1+10-x -10)2+(x 2+10-x -10)2+…+(x n +10-x -10)2] =n1[(x 1-x )2+(x 2-x )2+…+(x n -x )2]=s 2.变式训练某班有50名学生,某次数学考试的成绩经计算得到的平均分数是70分,标准差是s ,后来发现登记有误,某甲得70分却记为40分,某乙50分误记为80分,更正后重新计算得标准差为s 1,则s 与s 1之间的大小关系是( )A.s=s 1B.s<s 1C.s>s 1D.不能确定解析:由题意,平均数不变,所以只要看与平均数的离差的平方的变化情况.因为方差刻画了数据相对于平均值的平均偏离程度.s 中有:(40-70)2+(80-70)2=1 000,s 1中有:(70-70)2+(50-70)2=400所以s>s 1.答案:C点评:由本例及变式可推理归纳方差的性质:(1)若给定一组数据x 1,x 2,…,x n ,方差为s 2,则ax 1,ax 2,…,ax n 的方差为a 2s 2;(2)若给定一组数据x 1,x 2,…,x n ,方差为s 2,则ax 1+b,ax 2+b,…,ax n +b 的方差为a 2s 2,特别地,当a=1时,则有x 1+b,x 2+b,…,x n +b 的方差为s 2,这说明将一组数据的每一个数据都减去相同的一个常数,其方差是不变的,即不影响这组数据的波动性;(3)方差刻画了数据相对于平均值的平均偏离程度.对于不同的数据集,当离散程度越大时,方差越大;(4)方差的单位是原始测量数据单位的平方,对数据中的极值较为敏感.知能训练课本本节练习解答:1.甲、乙两个班的样本平均数为160,但甲班的极差为3,乙班的极差为30,故甲班的波动较小.2.已知 s 2=3=81[(k 1-k )2+(k 2-k )2+…+(k 8-k )2],而883)...(28)3(2...)3(2)3(2821821⨯-+++=-+-+-k k k k k k =2k -3, s 12=18[(2k 1-6-2k+6)2+(2k 2-6-2k+6)2+…+(2k 8-6-2k+6)2]=4s 2=12.3.甲较稳定.4.甲的平均值为10,方差为0.055;乙的平均值为10,方差为0.105.点评:从练习中再次体会数据的离散程度影响对事件的客观判断,体会从平均数、离散程度的角度对事件作出科学判断的方法.课堂小结1.数据的离散程度影响对事件的客观判断,体会从平均数、离散程度的角度对事件作出科学判断的方法,方差与标准差越小,表明各个样本数据在样本平均数的周围越集中;反之,方差与标准差越大,表明各个样本数据在样本平均数的两边越分散;2.衡量离散程度的常用计算方法——方差与标准差,熟悉用计算器计算方差与标准差的方法,切实掌握相关的计算公式、方法、步骤并对有关数据进行合理解释;3.样本的有效选择对判断有重要影响,知道影响判断、决策的因素是多方面的,在对总体作出判断之前,要充分考虑各种因素,切实体会统计的思想方法;4.样本数据既具有随机性又具有规律性,在很广泛的条件下,简单随机抽样样本的数字特征如众数、中位数、平均数、方差与标准差随样本容量的增加及时稳定于总体相应的数字特征,总体的数字特征是一定的,不存在随机性.作业课本习题2.3 3、5、7.设计感想本节课一定要让学生体会平均数反映的是一组数据的平均水平,而方差和标准差则反映比如选择运动员参加大型比赛时,学习上也是如此,稳定了习题详解万元.7.4,两者之差为3.4,确定全距为3.5,以.x =1001(4.25×1+4.75×2+5.25×15+5.75×28+6.25×33+6.75×18+7.25×3)=6.03,估计试验田里麦穗的平均长度约为6.0 cm.3.(1)甲机床次品数的平均值为1.5,乙机床次品数的平均值为1.2,故乙机床次品数的平均值较小;(2)甲的方差为1.65,乙的方差为0.82,故乙机床的生产状况较为稳定.4.估计甲机床平均次品率约为(0×0.7+1×0.1+2×0.1+3×0.1)÷1 000=0.06%,乙机床平均次品率约为(0×0.5+1×0.3+2×0.2+3×0)÷1 000=0.07%,故甲机床的产品质量较好.5.(1)此样本中金属棒的平均长度约为5.99;(2)频率分布表如下:频率直方图如下:(3)6×(1-0.2%)≈5.99,6×(1+0.2%)≈6.01,故合格的金属棒有15根,合格率约为15÷40≈37.5%.6.(1)频率分布表如下:频率分布直方图如下:(2)由组中值估计的总体平均数为 (57×5+65×14+73×25+81×11+89×5)×601=72.6,约73次. 实际总体平均数约为72,误差约为1.7.施了新化肥的土地的平均每块土地产量为20.52 kg ,未施新化肥的土地平均每块土地产量为17.36 kg ,且施了新化肥的土地产量的方差约为83.33,未施新化肥的土地产量的方差约为154.88,说明用了新化肥不仅平均产量高,而且产量稳定,故可认为新化肥取得了成功.。
高中数学第二章统计2.3 总体特征数的估计练习苏教版必修3编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高中数学第二章统计2.3 总体特征数的估计练习苏教版必修3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高中数学第二章统计2.3 总体特征数的估计练习苏教版必修3的全部内容。
2.3 总体特征数的估计一、填空题1. 某学校有甲、乙两个数学建模兴趣班,其中甲班有40人,乙班有50人.现分析两个班的一次考试成绩,算得甲班的平均成绩是90分,乙班的平均成绩是81分,则该校数学建模兴趣班的平均成绩是________分.2。
若一组数据2,x,4,6,10的平均值是5,则此组数据的标准差是________.3. 某校举行一年一度的校园文化艺术节文艺演出,七位评委为某班的小品打出的分数的茎叶统计图如图所示,去掉一个最高分和一个最低分,所剩数据的平均分为__________.4. 一组数据的方差为4,若将这组数据扩大2倍,则新数据的方差为________.5。
已知x1,x2,…,x n的方差为2,则2x1+3,2x2+3,…,2x n+3的标准差为__________.6. 如图表示甲、乙两名篮球运动员每场得分情况的茎叶图,若甲、乙得分的中位数分别是a,b,则a+b=__________.7。
若甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则下列说法正确的是________.(填序号)①甲、乙两人的成绩的平均数相同;② 甲的成绩的中位数不小于乙的成绩的中位数;③ 甲的成绩的方差小于乙的成绩的方差;④ 甲的成绩的极差小于乙的成绩的极差.8. 已知一组从小到大排列的数据为-3,0,5,x,9,16,且这组数据的中位数为7,那么这组数据的平均数为________.9. 某市教育部门每年年底都要邀请有关人员,对本市的教育进行满意度综合测评,2015年底邀请2 500名市人大代表对其进行了综合测评,经统计,得到了如图所示的频率分布直方图,根据频率分布直方图,估计综合测评的平均分为________.10。
2.2总体分布的估计(一)【新知导读】1.在用样本频率估计总体分布的过程中,下列说法正确的是()A.总体容量越大,估计越精确B.总体容量越小,估计越精确C.样本容量越大,估计越精确D.样本容量越小,估计越精确2.一个容量为20的样本数据,分组后,组据与频数如下:[10,20),2;[20,30),3;[30,40),4;[40, 50),5;[50,60),4;[60,70],2;则样本在区间(8,50)上的频率为()A.5% B.25% C.50% D.70%3.已知样本10,8,6,10,8,13,11,10,11,7,8,9,12,9,11,12,9,10,11,12,那么频率为0.2的范围是 ( )A.5.5~7.5 B.7.5~9.5 C.9.5~11.5 D.11.5~13.5【范例点睛】例1 .张老师为了分析一次数学考试情况,全班抽了50人,将分数分成5组,第一组到第三组的频数10,23,11,第四组的频率为0.08,那么落在89.5~99.5的频数是多少?频率是多少?全校300人中分数在89.5~99.5中的约有多少人?方法点评:(1)频率=频数/样本容量,已知其中任意两个量就可以求出第三个量.(2)各小组的频数和等于样本容量,频率和等于1.(3)由样本的频率可估计总体的频率,从而估计出总体的频数.【课外链接】1.某容量为50的某个样本数据被拆分为5组,若前两组的频率和为0.3,其余3组的频率组成公比为2的等比数列,则剩下的三组中频率最小的一组的频率是( )A.0.2 B.0.12 C.0.21 D.0.1【随堂演练】1.对某班40名同学的一次数学测试成绩进行统计,频率分布表中80.5~90.5这一组的频率为0. 20,那么这40名同学的数学成绩在80.5~90.5这个分数段的人数是()A.20 B.10 C.8 D.122.对样本数据:25,21,23,25,27,29,25,28,30,29,2622,24,25,26,28,26,24,25,27,在列频率分布表时,如果取组据为2,那么落在24.5~26.5这一组的频率是 ( )A.0.3 B.0.4 C.0.5 D.0.63.有一个容量为45的样本数据,分组后各组的频数如下:(12.5,15,5),3;(15.5,18.5),8;(18.5,21.5),9;(21.5.24.5),11;(24.5,27.5),10;(27.5,30.5),4;估计不大于27.5数据约为总体的()A.91% B.92% C.95% D.30%4.一个容量为n的样本,已知某组的频率为0.25,频数为10,则n=__________.5.把容量为64的样本分成8组,第1组到第4组的频数分别是5,6,11,10,第5组到第7组的频率都是0.125,那么第8组的频数是_________,频率为_________.6.将容量为100的样本数据,按从小到大的顺序分为8个组,如下表:则第三组的频率是____________.7.将一个容量为100的样本数据,按照从小到大的顺序分为8个组,如下表:若第6组的频率是第3组频率的2倍,则第6组的频率是多少?8.下表给出了某地区1500名12岁男孩中所随机抽样得出的120人的身高资料(单位:cm),请完成下表.9.对50台电子设备的寿命逐台进行测试,得到下列数据(单位:小时):910 1220 1280 20 2330 900 860 1450 1220 550 160 2020 1590 1730 490 1620 560 530 500 240 1280 190 290 740 1160 220 910 40 1410 3650 3410 70 510 1270 610 310 220 370 60 1750 890 790 1280 570 760 50 1530 1860 1280 30.(1)列出样本的频率分布表;(2)根据所得结果估计,寿命小于2500小时的频率约为多少?2.2总体分布的估计(一) 【新知导读】 1.C 2.D 3.D 【范例点睛】例1.频率是每一小组的频数与数据总数的比值,第四组的频率是0.08,则第四组的频数是4,从而可求出第五组的频数、频率,并由样本估计出全校300人中分数在89.5~99.5之间的人数.第四组的频数为0.08504⨯=,第五组的频数为50-10-23-11-4=2,频率为20.0450=,所以全校在89.5~99.5之间的约有0.0430012⨯=人. 【课外链接】 1.D【随堂演练】1.C2.B 3.A 4.40 5.8,0.125 6.0.14 7.0.14 8.9.(1)频率分布表如下表:(2)由表可知,寿命小于2500小时的频率约占32%+28%+20%+12%+4%=96%.。
2.3 总体特征数的估计互动课堂疏导引导1.平均数及其估计 (1)平均数定义若给定一组数据x 1,x 2,…,x n ,则称x =n1∑=ni 1x i (i=1,2,3,…,n)为这组数据x 1,x 2,…,x n的平均数(或均值).通常用样本平均数来估计总体平均数.当所给数据中没有重复数据时,我们一般用此公式来求这组数据的平均数.这里∑=ni 1x i =n1(x 1+x 2+……x n ).平均数反映了一组数据的集中趋势,我们常用一组数据的平均数来衡量这组数据的水平.当一组数据中的重复数据过多时,若用上面公式求这组数据的平均数,其过程就会显得比较复杂和冗长,为了简化计算过程,我们引入下面这种计算平均数的方法:一般地,若取值为x 1,x 2,…,x n 的频率分别为p 1,p 2, …,p n ,则其平均数为x 1p 1+x 2p 2+…+x n p n .这一公式实质上就是公式na a a n+++ 21的一个变形,它主要用于含有重复数据的数据组求平均数.除此之外,当所给数据在某一常数a 的上下波动时,我们也可利用公式:x ='x +a,其中'x =n1(x 1′+x 2′+…+x n ′),x 1′=x 1-a,x 2′=x 2-a,x 3′=x 3-a,…,x n ′=x n -a ;常数a 通常取接近于这组数据的平均数较“整”的数.例如:求数据70,71,72,73的平均数时,我们可以先求出0,1,2,3的平均数,然后将此平均数加上70即得该组数据的平均数. (2)平均数的性质①若给定一组数据x 1,x 2,…,x n 的平均数为x ,则ax 1,ax 2, …,ax n 的平均数为a x ;②若给定一组数据x 1,x 2, …,x n 的平均数为x ,则ax 1+b,ax 2+b, …,ax n +b 的平均数为a x +b ; (3)用样本平均数估计总体平均数从一个总体中随机抽取一个容量一定的包含大量数据的样本,利用样本平均数的计算公式求出样本平均数,由此得出的总体平均数就是所求样本平均数. 在这里两次从总体中抽取容量相等的样本,分别求出样本平均数,两个样本平均数会不相同,所以用样本平均数估计总体平均数时,样本平均数只是总体平均数的近似值.案例1 下面是某一个工厂所有工作人员在某个月的工资,总经理6 000元,技术工人甲900元,技术工作人员乙800元,杂工640元,服务员甲700元,服务员乙640元,会计820元. (1)计算所有工作人员的平均工资. (2)去掉总经理后,再计算平均工资.(3)在(1)和(2)中两种平均工资哪一种能代表一般工人的收入水平,为什么?【探究】计算平均工资是用工资总数除以领工资的人数即可. 【解析】(1)所有工作人员平均工资为x =71(6 000+900+800+640+700+640+820)=1 500(元). (2)去掉总经理后平均工资为'x =61(900+800+640+700+640+820)=750(元). (3)能代表一般工人的收入水平的是去掉总经理后的平均工资750元.因为除去总经理之外,工作人员的工资均在900元以下,因此不能以1 500元来代表职工的平均工资水平.规律总结 一般地,在一组数据中,平均数、众数、中位数能够反映该组数据的集中趋势和平均水平,但有时需要去掉极端值(极大值或极小值),这样计算平均数则更能反映平均水平,这就是有些比赛活动中往往会去掉一个最大值和一个最小值再去计算平均成绩的原因. 2.方差与标准差设一组样本数据x 1,x 2,…,x n ,其平均数为x ,则称s 2=n1∑=ni 1(x i -x )2为这个样本的方差,其算术平方根s=∑=-ni x x n 12)(1为样本的标准差,分别简称样本方差、样本标准差.疑难疏引 (1)为了更好地比较两组数据的集中程度,我们可以利用这两组数据的方差对两组数据进行比较.方差较大的数据波动较大;方差较小的数据波动较小.当所给的数据有单位时,所求得的平均数与原数据的单位相同,不要漏写单位.方差的单位为所给数据单位的平方,方差的算术平方根称作标准差,它与原数据单位相同,因而能更好地刻画数据的离散程度. (2)方差的性质①若给定一组数据x 1,x 2,…,x n ,方差为s 2,则ax 1,ax 2,…,ax n 的方差为a 2s 2;②若给定一组数据x 1,x 2,…,x n ,方差为s 2,则ax 1+b,ax 2+b,…,ax n +b 的方差为a 2s 2,特别地,当a=1时,则有x 1+b,x 2+b,…,x n +b 的方差为s 2,这说明将一组数据的每一个数据都减去相同的一个常数,其方差是不变的,即不影响这组数据的波动性;③方差刻画了数据相对于均值的平均偏离程度.对于不同的数据集,当离散程度越大时,方差越大;④方差的单位是原始测量数据单位的平方,对数据中的极值较为敏感. (3)我们可以通过计算样本方差和标准差对总体方差和标准差进行估计,也可以通过对两个总体的样本方差的大小差异情况,对两个总体的波动情况进行推断和比较,当甲x =,2甲s <2乙s 时,甲为优秀.(4)样本方差.标准差计算的简化.方差的计算公式s 2可简化为: (Ⅰ)s 2=n 1[21x +22x +…+2n x ]-nx 2,或写成s 2=n1(21x +22x +…2n x )-x 2.即方差等于原数据平方的平均数减去平均数的平方.(Ⅱ)s 2=n1[(2'1x +2'2x +…+2'n x )-n 2'x ].当一组数据中的数据较大时,直接计算它们的方差则比较麻烦,如果数据相互比较接近,为了减少参与计算的数据,可仿照简化平均数的计算方法,将每个数据同时减去一个与它们的平均数接近的常数a,得到一组新数据x 1′=x 1-a,x 2′=x 2-a,…,x n ′=x n -a,那么,s 2=n1[(2'2x +2'2x +…+2'n x )-n 2'x ]也可写成s 2=n1(2'1x +2'2x +…+2'n x )-2'x .即方差等于新数据的平方的平均数减去新数据平均数的平方.原数据x 1,x 2,…,x n 的方差与新数据x′1=x 1-a,x′2=x 2-a, …,x′n =x n -a 的方差相等,即x′1,x′2…,x′n 的方差s′2=n1·[(x′1-'x )2+(x′2-'x )2+…+(x′n -'x )2]等于原数据x 1,x 2,…,x n 的方差s 2.案例2 某班40人随机平均分成两组,两组学生一次考试的成绩情况如下表:组别 统计量 平均 标准差 第一组 90 6 第二组 80 4求全班平均成绩和标准差.【探究】设第一组20名学生的成绩为 x i (i=1,2…,20),第二组20名学生的成绩为y i =(i=1,2,…,20), 依题意有:90=201(x 1+x 2+…+x 20), 80=201(y 1+y 2+…+y 20),故全班平均成绩为: 401(x 1+x 2+…+x 20+y 1+y 2+…+y 20)=401(90×20+80×20)=85; 又设第一组学生成绩的标准差为s 1,第二组学生成绩的标准差为s 2,则21s =201(21x +22s +…+220x -20x 2), 22s =201(y 12+y 22+…+220y -20y 2)(此处,x =90,x =80) 又设全班40名学生的标准差为s,平均成绩为z (z =85), 故有s 2=401(21x +22x +…+220x +y 12+y 22+…+220y -40z 2) =401(2021s +20x 2+2022s +20y 2-40z 2) =21(62+42+902+802-2×852)=51. s=51.规律总结 平均数与方差,都是重要的数字特征数,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,所以,不仅需要掌握其计算公式和方法,还要学会通过这些数据分析其含义,从而为正确决策提供依据.案例3 某校拟派一名跳高运动员参加一项校际比赛,对甲、乙两名跳高运动员进行了8次选拔比赛,他们的成绩(单位:m)如下:甲:1.70,1.65,1.68,1.69,1.72,1.73,1.68,1.67; 乙:1.60,1.73,1.72,1.61,1.62,1.71,1.70,1.75. 经预测,跳高1.65 m 就很可能获得冠军.该校为了获取冠军,可能选哪位选手参赛?若预测跳高1.70 m 方可获得冠军呢? 【探究】参加比赛的选手的成绩得突出,且成绩稳定,这就需要比较这两名选手的平均成绩和成绩的方差.甲的平均成绩和方差如下:甲x =81(1.70+1.65+1.68+1.69+1.72+1.73+1.68+1.67)=1.69,2甲s =81[(1.70-1.69)2+(1.65-1.69)2+…+(1.67-1.69)2]=0.000 6. 乙的平均成绩和方差如下:乙x =81(1.60+1.73+1.72+1.61+1.62+1.71+1.70+1.75)=1.68,2乙s =81[(1.60-1.68)2+(1.73-1.68)2+…+(1.75-1.68)2]=0.003 15. 显然,甲的平均成绩好于乙的平均成绩,而且甲的方差小于乙的方差,说明甲的成绩比乙稳定.由于甲的平均成绩高于乙,且成绩稳定,所以若跳高1.65 m 就很可能获得冠军,应派甲参赛.在这8次选拔赛中乙有5次成绩在1.70 m 以上,虽然乙的平均成绩不如甲,成绩的稳定性也不如甲,若跳高1.70 m 方可获得冠军时,应派乙参加比赛.规律总结 在实际问题中,仅靠平均数不能完全反映问题,还要研究其偏离平均值的离散程度(即方差或标准差).方差(标准差)大,说明取值分散性大,方差(标准差)小,说明取值分散性小或说取值比较集中、稳定. 活学巧用1.(2004北京春季高考,理10文10)期中考试以后,班长算出了全班40个人数学成绩的平均分为M.如果把M 当成一个同学的分数,与原来的40个分数一起,算出这41个分数的平均值为N,那么M∶N 为( ) A.4140 B.1 C.4041 D.2 解析:考查阅读理解能力,分析问题、解决问题的能力及统计初步知识. 设40位同学的成绩为x i (i=1,2,…,40), 则M=404021x x x +++ ,N=414021Mx x x ++++故M∶N=1. 答案:B2.某工人在30天中加工一种零件的日产量有2天是51件,3天是52件,6天是53件,8天是54件,7天是55件,3天是56件,1天是57件.计算该工人30天的平均日产量. 解:在上面30个数据中,51出现2次,52出现3次,53出现6次,54出现8次,55出现7次,56出现3次,57出现1次.由于这组数据都比50稍大一点,故将数据51,52,53,54,55,56,57同时减去50,得到1,2,3,4,5,6,7.它们出现的次数依次是2,3,6,8,7,3,1. 那么,这组新数据的平均数是'x =3011830173221=⨯++⨯+⨯ ≈4,∴x ='x +a≈54(件),即这个工人30天的平均日产量为54件.点评:“同时减去50”改为“同时减去53”更方便.3.某餐厅共有8名员工,某月工资如下图所示,则下列说法中不正确的是( )A.该餐厅员工工资的一般水平不是1 125元,尽管平均数是1 125B.因为众数为320元,所以该餐厅员工工资的一般水平是320元C.因为中位数为410元,所以该餐厅员工工资的一般水平是410元D.去掉一个最大数6 000元,去掉一个最小数320元,剩下6个数的平均数为447元,该餐厅员工工资的一般水平一定是477元 答案:D4.某班一次数学测验的成绩如下:得100分的6人,得90分的15人,得80分的18人,得70分的6人,得60分的3人,得50分的2人,试计算这次测验全班的平均成绩. 解法一:x =501(6×100+15×90+18×80+6×70+3×60+2×50)=81.8(分). 解法二:取a=80,将原数据都减去80得新数据及出现次数为 新数据 20 10 0 -10 -20 -30 出现次数 6 15 18 6 3 2 ∴'x =501[6×20+15×10+18×0+6×(-10)+3×(-20)+2×(-30)]=1.8. ∴x ='x +a=1.8+80=81.8(分),即这次测验全班的平均成绩为81.8分.5.计算下面数据的方差(结果保留到小数点后第1位): 3,-1,2,1,-3,3.解析:这组数据的平均数不是整数,选用公式s 2=n1[(21x +22x +…+2n x )-n x 2]比较方便. s 2=61[32+(-1)2+22+12+(-3)2+32-6×(633-121-3+++)2]=61[9+1+4+1+9+9-6×(65)2]=61×33-3625≈5.5-0.7=4.8.6.在去年的足球甲A 联赛上,一队每场比赛平均失球数是1.5,全年比赛失球个数的标准差为1.1;二队每场比赛平均失球数为2.1,全年比赛失球个数的标准差为0.4.你认为下列说法中哪一种是正确的?(1)平均说来一队比二队技术好; (2)二队比一队技术水平更稳定;(3)一队有时表现很差,有时表现又非常好; (4)二队很少不失球. 解:本题主要考查对平均数和标准差的概念的理解.平均数反映了一组数据的平均水平,而方差则反映了一组数据的波动性的大小.一队每场比赛平均失球数比二队每场比赛平均失球数少,说明一队的技术比二队的技术好;一队全年的比赛失球个数的标准差较大,说明一队的表现时好时坏,起伏较大;二队的平均失球数多,全年比赛失球个数的标准差很小,说明二队的表现较稳定,经常失球. 答案:(1)(2)(3)(4)都正确7.(2005山东青岛第二次质量检测)对于一组数据x i (i=1,2,3…,n),如果将它们改变为x i -c(i=1,2,3, …,n),其中c≠0,则下面结论中正确的是( ) A.平均数与方差均不变B.平均数变了,而方差保持不变C.平均数不变,而方差变了D.平均数与方差数均发生了变化解析:x =n 1∑=ni 1x i ,'x =n1∑=ni 1(x i -c)=n1∑=ni 1x i -n1·nc=x -c,而s 2=n1∑=ni 1(x-x i )2,s′2=n1∑=ni 1['x -(x i -c)]2=n1∑=ni 1[x -c-(x i -c)]2=n1∑=ni 1(x -x i )2=s 2,所以其平均数变了,而方差保持不变.故选B. 答案:B8.(2005江苏南通调研考试)一组数据中的每一个数据都减去80,得一组新数据,若这组数据的平均数是1.2,方差是4.4,则原来一组数据的平均数和方差分别是( ) A.81.2,4.4 B.78.8,4.4 C.81.2,84.4 D.78.8,75.6 解析:由平均数与方差公式:x =nx x x n+++ 21,s 2=nx x x x x x n 22221)()()(+++-+- 知,在每一个数都减去80后,平均数也减去80,而方差不变,所以选A. 答案:A9.某班有48名学生,在一次考试中统计出平均分为70分,方差为75,后来发现有2名同学的成绩有误,甲实得80分却记为50分,乙实得70分却记为100分,更正后平均分和方差分别是( )A.70,25B.70,50C.70,1.04D.65,25 解析:易得x 没有改变,x =70, 而s 2=4811[]48[(21x +22x +…+502+1002+…+248x )-48x 2]=75, s′2=481[(21x +22x +…+802+702+…+248x )-48x 2] =481[(75×48+48x 2-12 500+11 300)-48x 2] =75-481200 =75-25=50. 答案:B 10.甲、乙两台机床同时生产直径为40㎜的零件.为了检验产品的质量,从两台机床生产的产品中各抽取10件进行了测量,结果如下:甲/mm 40.0 39.8 40.1 40.2 39.9 乙/mm 40.0 40.0 39.9 40.0 39.9 乙/mm 40.1 40.1 40.1 40.0 39.9 能用几种方法比较这两台机床的性能? 分析:经简单计算可以得出:甲、乙两台机床生产的这10件产品的直径的平均数都为40 mm.所以,不能从平均数这一角度来比较这两台机床的性能,即不能从数据的平均水平上来比较,只能从数据的离散程度上进行比较.要从数据的离散程度上进行比较,常见的方法有以下几种:解法一:利用初中所学的折线统计图.由折线统计图我们可以直观地表示出这两组数据的离散程度,甲机床生产的产品波动幅度比乙大.所以,乙机床的性能好于甲.解法二:利用这两组数据的极差进行比较.甲:40.2-39.8=0.04;乙:40.1-39.9=0.02.显然,乙组数据的极差小于甲组数据的极差.所以,乙机床的性能好于甲.解法三:利用这两组数据的方差或标准差进行比较.由方差和标准差的计算公式不难得出甲的方差为2甲s =0.026(mm 2),标准差为s 甲=0.161(mm);乙的方差为2乙s =0.006(mm 2),标准差为s乙=0.077(mm).由上可知:不论是方差还是标准差甲的均比乙的大,这就说明乙机床生产的产品要更标准些.所以,乙机床的性能好于甲.。
2.3总体特征数的估计(二)
【新知导读】
1.人数相等的甲乙两班学生参加了同一次数学测验,班级平均分和方差如下:80x 甲=,80x 乙=,
2240S =甲,2180S =乙,则成绩较为整齐的是( )
A .甲班
B .乙班
C .两班一样整齐
D .无法确定 2.在一次歌手大奖赛上,七位评委为歌手打出的分数如下:
9.4 8.4 9. 4 9.9 9.6 9.4 9.7 ,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为 ( )
A .9.4,0.484
B .9.4,0.016
C .9.5,0.04
D .9.5,0.016
3.已知样本方差由10
2
21
1(5)10i i S x ==-∑求得,则1210...x x x +++=______________ 【范例点睛】
例1 从甲乙两种玉米苗中各抽10株,分别测得它们的株高如下(单位:cm): 甲:25 41 40 37 22 14 19 39 21 42 乙:27 16 44 27 44 16 40 40 16 40
问:(1)哪株玉米的苗长得高?(2)哪株玉米的苗长得整齐?
思路点拨:看哪种玉米的苗长得高,只要比较甲、乙两种玉米的平均高度即可;要比较哪种玉米的苗长得比较整齐,只要看两种玉米的苗高的方差即可,因为方差是体现一组数据波动大小的特征数. 【课外链接】
1. 对于一组数据1x ,2x ,3x ,...,n x ,证明:对任意实数c ,22c S S ≤.其中2
2
1
1()n k k S x x n ==-∑,
2
21
1()n
c k k S x c n ==-∑.
【随堂演练】
1.对一组数据(1,2,...,)i x i n =,如果它们改变为(1,2,...,)i x c i n -=,其中0c ≠,则下列结论正确的是( )
A .平均数和方差均不变
B .平均数不变,方差改变
C .平均数改变,方差不变
D .平均数、方差都改变
2.设有样本1x ,2x ,...,n x ,其标准差为x S ,另有样本12,y y ,...,n y ,且
35(1,2,...,k k y x k n =+=,其标准差为
y S ,则下列关系正确的是 ( )
A .35y x S S =+
B .3y x S S =
C .y x S =
D .5y x S =+ 3.甲、乙两人在相同条件下,射击10次,命中环数如下:
甲:8 6 9 5 10 7 4 8 9 5 乙:7 6 5 8 6 9 6 8 7 7 根据以上数据估计两人的技术稳定性,结论是 ( ) A .甲优于乙 B .乙优于甲 C .两人相同 D .无法比较
4.今年5月份甲、乙两种股票连续10天开盘价格如下表:(单位:元)
则在这10天中,甲、乙两种股票波动较大的是_______________.
5.若样本1a ,2a ,3a ,...,n a 的平均数5x =,方差2
0.025S =,则样本14a ,24a ,34a , ...,4n a 的平均数x '=___________ ,2
S '=_________.
6.甲、乙、丙三位棉农种植的棉花.连续五年的单位面积产量(千克/亩)统计如下表:
则产量较稳定的是棉农 __________.
7.对划艇运动员甲乙两人在相同的条件下进行了6次测试,测得他们最大速度的数据如下: 甲:27,38,30,37,35,31 乙:33,29,38,34,28,36
根据以上数据,试判断他们谁更优秀.
8.甲乙在相同的条件下各射靶10次,每次射靶的成绩如图所示:(1)请填写下表:
(2)根据你所学的统计学知识,从不同的角度对这次测试结果进行分析.
9.某风景区对5个旅游景点的门票价格进行了调整,据统计,调整前后各景点的游客人数基本不变,有关数据如下表所示:
(1)该景区称调整前后这5个景点门票的平均收费不变,平均总收入持平,问风景区是怎样计算
的?
(2)另一方面,游客认为调价后风景区的平均日收入相对于调价前,实际上增加了9.4%,问游客
是怎样计算的?
(3)你认为风景区和游客哪一方的说法能反映整体实际?
10.在某次有奖销售中,每10万份奖券中有一个头奖(奖金10000元) ,2个二等奖(奖金5000元),500个三等奖(奖金100元),10000个四等奖(奖金5元) .试求每张奖券平均获利多少?(假设所有奖券全部卖完,每张奖券面值3元.)
2.3总体特征数的估计(二) 【新知导读】 1.B 2.D 3.50 【范例点睛】
例1.(1)110x 甲=(25+41+40+37+22+14+19+39+21+42)=30(cm) ,(2716x +乙1
=
10
)442744164040164031++++++++=(cm) .x x ∴<乙甲.
(2)
2110S ⎡=
++++++⎣
222222
甲(25-30)(41-30)(40-30)(37-30)(22-30)(14-30)+2(19-30)222(3930)(2130)(4230)⎤-+-+-⎦
=104.2(2
cm ). 22
1103110
S ⎡⎤=
⨯⨯⨯⨯-⨯⎣⎦2222乙(227+316+340+244)=128. 8(2cm ). 22S S ∴<乙甲.
答案:(1)乙种玉米苗长得高;(2)甲种玉米苗长得整齐.
【课外链接】
证明:2
22
11
11()()n n c k k k i S x c x x x c n n ===-=-+-∑∑
2
2111()2()()()n n
k k k k x x x c x x n x c n ==⎡⎤=-+--+-⎢⎥⎣⎦
∑∑2220()s x c s =+--≥ 【随堂演练】
1.C 2.B 3.B 4.乙 5.20,0.4 6.乙
7.解:x 甲=
1(273830373531)336+++++=,215
S ⎡=+⎣22
甲(27-33)+(38-33) 2221(3733)(3533)(3133)9418.85⎤+-+-+-=⨯=⎦2
(30-33);
x 乙=1(332938342836)336+++++=,215S ⎡=+⎣22
乙(33-33)+(29-33) 2221(3433)(2833)(3633)7615.25⎤+-+-+-=⨯=⎦2
(38-33).
x x ∴乙甲=,22S S >乙甲,由此说明,甲乙两人的最大速度的平均值相同,但乙比甲更稳定,故乙
比甲更优秀. 8.解:(1)
(2)①甲、乙平均数相同,22
S S <乙甲,∴甲的成绩比乙稳定;
②甲、乙平均数相同,甲的中位数<乙的中位数,∴乙的成绩比甲好些; ③
甲、乙平均数相同,命中9环以上的次数甲比乙少,∴乙的成绩比甲好些;
④甲的成绩在平均数上下波动;而乙处于上升势头,从第4次以后就没有出现比甲少的情况发生,所以认为乙比甲更有潜力.
9.解:(1)风景区是这样计算的:调整前的平均价格:1010152025
165
++++=元,调整后的
平均价格:
55152530
165
++++=元.因为调整前后的平均价格不变,平均日人数不变,所以
平均日收入持平. (2)游客是这样计算的:
原平均日总收入:101101152203252160⨯+⨯+⨯+⨯+⨯=(千元) ,现平均日总收入:
5151152253302175⨯+⨯+⨯+⨯+⨯=(千元),
所以平均日总收入增加了:175160
9.4%160
-≈. (3)游客的说法较能反映整体实际.
10.解:设每张奖券的奖金为T ,则T 的频率分布为
平均获利=1000050001005100000100000100000100000⨯+⨯+⨯+⨯+0100000
⨯
1.2=,每张奖券获利3-1.2=1.8元.。