- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
s′2= [(x1+100- -100)2+(x2+100- -100)2+…+
(x10+111000- -100)2]x
x
= [(x1- )x2+(x2- )2+…+(x10- )2]=s2.
1
10
x
x
x
2.(2016·揭阳模拟)甲、乙、丙、丁四人参加某运动 会射击项目选拔赛,四人的平均成绩和方差如表所示:
(3)平均数、方差的公式推广
①若数据x1,x2,…,xn的平均数为 ,那么mx1+a, x
mx2+a,mx3+a,…,mxn+a的平均数是m +a. ②数据x1,x2,…,xn的方差为s2. x
(ⅰ)数据x1+a,x2+a,…,xn+a的方差也为s2;
(ⅱ)数据ax1,ax2,…,axn的方差为a2s2.
【解析】由频率分布直方图可知45岁以下的教师的频 率为5×(0.040+0.080)=0.6,所以共有 80×0.6=48(人). 答案:48
4.(2016·天津模拟)甲、乙两人在10天中每天加工零 件的个数用茎叶图表示如图,中间一列的数字表示零件 个数的十位数,两边的数字表示零件个数的个位数,则 这10天甲、乙两人日加工零件的平均数分别为 ________和________.
第三节 用样本估计总体
【知识梳理】 1.常用统计图表 (1)频率分布表的画法: 第一步:求_____,决定组数和组距,组距=__极__差_; 第二步:___极__差,通常对组内数值所在区间取组左数闭右开 区间,最后分一组组取闭区间; 第三步:登记频数,计算频率,列出频率分布表.
(2)频率分布直方图:反映样本频率分布的直方图.如图:
A.8
B.15
C.16
D.32
(2)(2015·广东高考)某工厂36名工人的年龄数据如下 表.
工人
工人
工人
工人
编号 年龄 编号 年龄 编号 年龄 编号 年龄
1 40 10 36 19 27 28 34
2 44 11 31 20 43 29 39
3 40 12 38 21 41 30 43
工人 年龄 工人 年龄 工人 年龄 工人 年龄
【规律方法】众数、中位数、平均数、方差的意义及 常用结论 (1)平均数与方差都是重要的数字特征,是对总体的一 种简明的描述,它们所反映的情况有着重要的实际意义, 平均数、中位数、众数描述其集中趋势,方差和标准差 描述波动大小.
(2)方差的简化计算公式:s2= n1[(x12 x22 xn2 ) nx2], 或平写方成的平s2=均n1数(x减12 去x平22 均数 x的n2平) 方x2,. 即方差等于原数据
个
数据(或两个数据
的
平均数)
优点与缺点
是样本数据所占 频率的等分线,它 不受少数几个极 端值的影响,这在 某些情况下是优 点,但它对极端值 的不敏感有时也 会成为缺点
数字特征 定义与求法
优点与缺点
平均数
平均数和每一个数据
如果有n个数据 有关,可以反映样本
x1,x2,…,xn,那么 这n个数的平均数
22 64
(2)①由题条件知所抽样本编号是一个首项为2,公差为 4的等差数列,故其所有样本编号依次为2,6,10,14,18, 22,26,30,34,对应样本的年龄数据依次为44,40,36, 43,36,37,44,43,37.
②由①知可得其样本的平均值为
x 44 40 36 43 36 37 44 43 37 40,
高分99,
则 [87+94+90+91+90+(90+x)+91]=91, 1
所以7 x=4.
所以s2= [(87-91)2+(94-91)2+(90-91)2+(91-91)2 +(90-911)2+(94-91)2+(91-91)2]=
7 36 . 7
【加固训练】
1.(2014·陕西高考)某公司10位员工的月工资(单位:
【解题导引】(1)应用标准差、方差公式和性质计算标
准差.
(2)①根据年龄数据求出工人编号,再由系统抽样的特
点求出样本编号后再求对应的年龄数据;②根据①中的
数据直接利用公式计算;③先求出 -s与 +s的值,再
求出年龄在 -s与 +s之间的人数,最x 后计算x 所占的百
分比.
x
x
【规范解答】(1)选C.样本数据x1,x2,…,x10的标准差 s=8,则s2=64,而样本数据2x1-1,2x2-1,…,2x10-1的方 差为22×64,所以其标准差为 =16.
数据全体的信息,但 平均数受数据中极端 值的影响较大,使平
x
=_____________
1 n
(x1
x
2
x
n
)
均数在估计总体时可 靠性降低
(2)标准差、方差 ①标准差:表示样本数据到平均数的一种平均距离, 一般用s表示,
s=___n1_[__x_1__x__2 ___x_2 __x_2______x_n__x__2_]__.
编号
编号
编号
编号
4 41 13 39 22 37 31 38
5 33 14 44 42 33 53
7 45 16 39 25 37 34 37
8 42 17 38 26 44 35 49
9 43 18 36 27 42 36 39
①用系统抽样法从36名工人中抽取容量为9的样本,且 在第一分段里用随机抽样法抽到的年龄数据为44,列 出样本的年龄数据; ②计算①中样本的平均值和方差; ③36名工人中年龄在 -s与 +s之间有多少人?所占 的百分比是多少(精确x到0.01x%)?
感悟考题 试一试 2.(2015·重庆高考)重庆市2013年各月的平均气温(℃) 数据的茎叶图如图:
则这组数据的中位数是 ( )
A.19
B.20
C.21.5 D.23
【解析】选B.由中位数的概念可知,该组数据按从小到
大顺序排列的第6和第7个数据的平均数即为要求的中
位数,为20.
3.(2016·合肥模拟)某校为了了解教科研工作开展状 况与教师年龄之间的关系,将该校不小于35岁的80名教 师按年龄分组,分组区间为[35,40),[40,45),[45,50), [50,55),[55,60),由此得到 频率分布直方图如图,则这80 名教师中年龄小于45岁的有 ________人.
②方差:标准差的平方s2叫做方差.
s2=__n1[___x1___x_2___x_2__x__2 ______x_n __x_2_]_,其中
xi(i=1,2,3,…,n)是_________,n是_________, 样本数据 样本容量
是___________. x 样本平均数
【特别提醒】 1.频率分布直方图中纵轴表示的应为 频率
A.甲成绩的平均数小于乙成绩的平均数 B.甲成绩的中位数等于乙成绩的中位数 C.甲成绩的方差小于乙成绩的方差 D.甲成绩的极差小于乙成绩的极差
【解析】选C.由题意可知,甲的成绩为4,5,6,7,8,乙的
成绩为5,5,5,6,9.所以甲、乙成绩的平均数均为6,A错;
甲、乙成绩的中位数分别为6,5,B错;甲、乙成绩的方
差分别为s甲2= ×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(81
6)2]=2,s乙2= ×5 [(5-6)2+(5-6)2+(5-6)2+(6-6)2+(96)2]= C对;甲1 、乙成绩的极差均为4,D错.
5 12, 5
考向二 茎叶图及其应用 【典例2】(1)(2016·内江模拟)某中学高三从甲、乙 两个班中各选出7名学生参加数学竞赛,他们取得的成 绩(满分100分)的茎叶图如图,其中甲班学生成绩的众 数是85,乙班学生成绩的中位 数是83,则x+y的值为_______.
【变式训练】(2016·开封模拟)将某选手的9个得分去 掉1个最高分,去掉1个最低分,7个剩余分数的平均分为 91,现场作的9个分数的茎叶图后来有1个数据模糊,无 法辨认,在图中以x表示:
则7个剩余分数的方差为 ( )
A. 116 9
C.36
B. 36 7
D. 6 7 7
【解析】选B.根据茎叶图,去掉1个最低分87,1个最
所以 x s 110 , x s 130, 所以年龄在 3-s与 +s3之间的共有23人,
所占百分比为x : ×1x00%≈63.89%. 23 36
【母题变式】
1.若本例题(2)中条件不变,求年龄在[30,40)的频率?
【解析】年龄在[30,40)的工人有16人,因此年龄在 [30,40)的频率是
方差为:
9
s2= [(44-40)2+(40-40)2+(36-40)2+(43-40)2+(361
40)29+(37-40)2+(44-40)2+(43-40)2+(37-40)2]
= [42+02+(-4)2+32+(-4)2+(-3)2+42+32+(-3)2]=
1
100 .
9
9
③由②知s= 10, 3
横轴表示样本数据,纵轴表示__频__率__,每个小矩形的 面积表示样本落在该组内的___组__距.
频率
(3)茎叶图的画法:
第一步:将每个数据分为茎(高位)和叶(低位)两部分;
第二步:将最小茎与最大茎之间的数按_____次序排成 大小