第十一章 统计、统计案例
第一部分 六年高考荟萃
2010年高考题
一、选择题
1.(2010陕西文)4.如图,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为
A B x x 和,样本标准差分别
为sA 和
(A) A x (B) A x (C) A x (D)
A x A x <102.(2010人,老年职工若样(A )【答案】 B
解析:青年职工、中年职工、老年职工三层之比为7:5:3,所以样本容量为
7
15
7
15
3.(2010山东文)(6)在某项体育比赛中,七位裁判为一选手打出的分数如下: 90 89 90 95 93 94 93
去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为 (A )92 , 2 (B) 92 , 2.8 (C) 93 , 2 (D) 93 , 2.8
答案:B
4.(2010广东理)7.已知随机变量X 服从正态分布N(3.1),且(24)P X ≤≤=0.6826,则p (X>4)=( )
A 、0.1588
B 、0.1587
C 、0.1586 D0.1585 7.B .1
(34)(24)2
P X P X ≤≤=
≤≤=0.3413, (4)0.5(24)P X P X >=-≤≤=0.5-0.3413=0.1587.
5.(2010四川文)(4)一个单位有职工800人,期中具有高级职称的160人,具有中级职
称的320
(A ) 6 6.(2010(A )36种【答案】
7.(2010山东理)
8.(2010山东理)
9.(2010湖北理)6.将参加夏令营的600名学生编号为:001,002,……600,采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495住在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数一次为
A.26, 16, 8, B.25,17,8
C.25,16,9 D.24,17,9
二、填空题
1.(2010安徽文)(14)某地有居民100 000户,其中普通家庭99 000户,高收入家庭1 000户.从普通家庭中以简单随机抽样方式抽取990户,从高收入家庭中以简单随机抽样方式
抽取l00户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收人家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是 .
【答案】5.7%
【解析】该地拥有3套或3套以上住房的家庭可以估计有:5070
9900010005700
?+?=户,所以所占比例的合理估计是
990100
÷=.
5700100000 5.7%
【方法总结】本题分层抽样问题,首先根据拥有3套或3套以上住房的家庭所占的比例,得出100 000户,居民中拥有3套或3套以上住房的户数,它除以100 000得到的值,为该地拥有3套或3套以上住房的家庭所占比例的合理估计.
2.(2010浙江文)(11)在如图所示的茎叶图中,甲、乙两组数据的中位数分别是
【答案】45 46
(2010北京理)(11)从某小学随机抽取100名同学,
将他们的身高(单位:厘米)数据绘制成频率分布直方
图(如图)。由图中数据可知a=。若要从身
高在[ 120 , 130),[130 ,140) , [140 , 150]三组内
的学生中,用分层抽样的方法选取18人参加一项活动,
则从身高在[140 ,150]内的学生中选取的人数应
为。
【答案】0.030 3
3.(2010福建文)14.将容量为n的样本中的数据分成6组,绘制频率分布直方图。若第一组至第六组数据的频率之比为2:3:4:6:4:1,且前三组数据的频数之和等于27,则n等于。
【答案】60
【解析】设第一组至第六组数据的频率分别为2,3,4,6,4,
x x x x x x,则
23464
x x x x x x
+++++=,解得
1
20
x=,所以前三组数据的频率分别是
234
,,
202020
,
故前三组数据的频数之和等于234
202020
n n n
++=27,解得n=60。
【命题意图】本小题考查频率分布直方图的基础知识,熟练基本公式是解答好本题的关键。
4.(2010江苏卷)4、某棉纺厂为了了解一批棉花的质量,
从中随机抽取了100根棉花纤维的长度(棉花纤维的长度
是棉花质量的重要指标),所得数据都在区间[5,40]中,其
频率分布直方图如图所示,则其抽样的100根中,有____
根在棉花纤维的长度小于20mm。
【解析】考查频率分布直方图的知识。
100×(0.001+0.001+0.004)×5=30
三、解答题
1.(2010湖南文)17. (本小题满分12分)
为了对某课题进行研究,用分层抽样方法从三所高校A,B,C的相关人员中,抽取若干人组成研究小组、有关数据见下表(单位:人)
(I)求x,y ;
(II)若从高校B、C抽取的人中选2人作专题发言,求这二人都来自高校C的概率。
2.(2010陕西文)19 (本小题满分12分)
为了解学生身高情况,某校以10%的比例对全校700名学生按性别进行出样检查,测得身高情况的统计图如下:
()估计该校男生的人数;
()估计该校学生身高在170~185cm之间的概率;
()从样本中身高在180~190cm之间的男生中任选2人,求至少有1人身高在185~190cm 之间的概率。
解()样本中男生人数为40 ,由分层出样比例为10%估计全校男生人数为400。()有统计图知,样本中身高在170~185cm之间的学生有14+13+4+3+1=35人,样本容量为70 ,所以样本中学生身高在170~185cm之间的频率故有f估计该校学生身高在170~180cm之间的概率
()样本中身高在180~185cm之间的男生有4人,设其编号为
样本中身高在185~190cm之间的男生有2人,设其编号为
从上述6人中任取2人的树状图为:
故从样本中身高在180~190cm之间的男生中任选2人得所有可能结果数为15,求至少有1
人身高在185~190cm之间的可能结果数为9,因此,所求概率
3.(2010辽宁文)(18)(本小题满分12分)
为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做实验,将这200只家兔随机地分成两组。每组100只,其中一组注射药物A,另一组注射药物B。下表
mm)1和表2分别是注射药物A和药物B后的实验结果。(疱疹面积单位:2
(Ⅰ)完成下面频率分布直方图,并比较注射两种药物后疱疹面积的中位数大小;
列联表,并回答能否有99.9%的把握认为“注射药物A后的疱(Ⅱ)完成下面22
疹面积与注射药物B后的疱疹面积有差异”。
附:2
2
()()()()()
n ad bc K a b c d a c b d -=++++
解: (Ⅰ)
图1注射药物A 后皮肤疱疹面积的频率分布直方图 图2注射药物B 后皮肤疱疹面积的频率分布直方图
可以看出注射药物A 后的疱疹面积的中位数在65至70之间,而注射药物B 后的疱疹面积的中位数在70至75之间,所以注射药物A 后疱疹面积的中位数小于注射药物B 后疱疹面积的中位数。 (Ⅱ)表3
56.2495
105100100)30356570(2002
2
≈????-??=K
由于828.102
>K ,所以有99.9%的把握认为“注射药物A 后的疱疹面积与注射药物
B后的疱疹面积有差异”.
4.(2010辽宁理)(18)(本小题满分12分)
为了比较注射A, B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B。
(Ⅰ)甲、乙是200只家兔中的2只,求甲、乙分在不同组的概率;
(Ⅱ)下表1和表2分别是注射药物A和B后的试验结果.(疱疹面积单位:mm2)表1:注射药物A后皮肤疱疹面积的频数分布表
(ⅰ)完成下面频率分布直方图,并比较注射两种药物后疱疹面积的中位数大小;
(ⅱ)完成下面2×2列联表,并回答能否有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.
表3: 解:
面积的中位数在70至75之间,所以注射药物A 后疱疹面积的中位数小于注射药物B 后疱疹面积的中位数。 ……8分
(
ii )表3:
2
2
200(70653530)24.5610010010595
K ??-?=≈???
由于K 2
>10.828,所以有99.9%的把握认为“注射药物A 后的疱疹面积于注射药物B 后的疱疹面积有差异”。 ……12分 5. (2010安徽文)18、(本小题满分13分)
某市2010年4月1日—4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):
61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91, 77,86,81,83,82,82,64,79,86,85,75,71,49,45, (Ⅰ) 完成频率分布表; (Ⅱ)作出频率分布直方图;
(Ⅲ)根据国家标准,污染指数在0~50之间时,空气质量为优:在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染。 请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.
【命题意图】本题考查频数,频率及频率分布直方图,考查运用统计知识解决简单实际问题的能力,数据处理能力和运用意识.
【解题指导】(1)首先根据题目中的数据完成频率分布表,作出频率分布直方图,根据污染指数,确定空气质量为优、良、轻微污染、轻度污染的天数。
(Ⅲ)(1) 天处于14
15
。
(2) 15,说明
/组距,它们与频数成正比,小矩形的面积等于这一组的频率.对于开放性问题的回答,要选择适当的数据特征进行考察,根据数据特征分析得出实际问题的结论. 6. (2010天津文)(18)(本小题满分12分)
有编号为1A ,2A ,…10A 的10个零件,测量其直径(单位:cm ),得到下面数据: 其中直径在区间[1.48,1.52]内的零件为一等品。
(Ⅰ)从上述10个零件中,随机抽取一个,求这个零件为一等品的概率; (Ⅱ)从一等品零件中,随机抽取2个.
(ⅰ)用零件的编号列出所有可能的抽取结果;
(ⅱ)求这2个零件直径相等的概率。本小题主要考查用列举法计算随机事件所含的基本事件数及事件发生的概率等基础知识,考查数据处理能力及运用概率知识解决简单的实际问题的能力。满分12分
【解析】(Ⅰ)解:由所给数据可知,一等品零件共有6个.设“从10个零件中,随机抽
63 随
机
:
{}{12,,A A {}{24,,A A }6A 共
有15种.
.
7. (况,他们的重量(单位:克)重量的分组区间为(490,]495,(495,]500,……(510,]515,由此得到样本的频率分布直方图,如图4所示.
(1)根据频率分布直方图,求重量超过505克的产品数量.
(2)在上述抽取的40件产品中任取2件,设Y 为重量超过505克的产品数量,求Y 的
分布列.
(3)从流水线上任取5件产品,求恰有2件产品合格的重量超过505克的概率.
8. (2010湖北文)17.(本小题满分12分)
为了了解一个小水库中养殖的鱼有关情况,从这个水库中多个不同位置捕捞出100条鱼,称得每条鱼的质量(单位:千克),并将所得数据分组,画出频率分布直方图(如图所
示)
(Ⅰ)在答题卡上的表格中填写相应的频率;
(Ⅱ)估计数据落在(1.15,1.30)中的概率为多少;
(Ⅲ)将上面捕捞的100条鱼分别作一记号后再放回水库,几
天后再从水库的多处不同位置捕捞出120条鱼,其中带有记号
的鱼有6条,请根据这一情况来估计该水库中鱼的总条数。
9. (2010湖南理)17.(本小题满分12分)
图4是某城市通过抽样得到的居民某年的月均用水量(单位:吨)的频率分布直方图(Ⅰ)求直方图中x的值
(II)若将频率视为概率,从这个城市随机抽取3位居民(看作有放回的抽样),求月均用水量在3至4吨的居民数X的分布列和数学期望。
10. (2010安徽理)21、(本小题满分13分)
品酒师需定期接受酒味鉴别功能测试,一种通常采用的测试方法如下:拿出n瓶外观相同但品质不同的酒让其品尝,要求其按品质优劣为它们排序;经过一段时间,等其记忆淡忘之后,再让其品尝这n瓶酒,并重新按品质优劣为它们排序,这称为一轮测试。根据一轮测试中的两次排序的偏离程度的高低为其评为。
现设4n =,分别以1234,,,a a a a 表示第一次排序时被排为1,2,3,4的四种酒在第二次排序时的序号,并令
12341234X a a a a =-+-+-+-,
则X 是对两次排序的偏离程度的一种描述。 (Ⅰ)写出X 的可能值集合;
(Ⅱ)假设1234,,,a a a a 等可能地为1,2,3,4的各种排列,求X 的分布列; (Ⅲ)某品酒师在相继进行的三轮测试中,都有2X ≤,
(i)试按(Ⅱ)中的结果,计算出现这种现象的概率(假定各轮测试相互独立); (ii)你认为该品酒师的酒味鉴别功能如何?说明理由。
2009年高考题
一、选择题
1.(2009山东卷理)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的
[100,100小于104A.90 答案解析 则
36
=n
104120×2.(20092
矩形给人以美感,称为黄金矩形。黄金矩形常应用于工艺品设计中。下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本: 甲批次:0.598 0.625 0.628 0.595 0.639 乙批次:0.618 0.613 0.592 0.622 0.620
根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是 A.甲批次的总体平均数与标准值更接近
B.乙批次的总体平均数与标准值更接近
C.两个批次总体平均数与标准值接近程度相同
D.两个批次总体平均数与标准值接近程度不能确定 答案 A
解析 甲批次的平均数为0.617,乙批次的平均数为0.613
3.(2009宁夏海南卷理)对变量x, y 有观测数据理力争(1x ,1y )(i=1,2,…,10),得散点图1;对变量u ,v 有观测数据(1u ,1v )(i=1,2,…,10),得散点图2. 由这两个散
A.变量x C.变量x 答案 C
解析 4.(2009,这种矩形给人以美感,称为黄金矩形。黄金矩形常应用于工艺品设计中。下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本: 甲批次:0.598 0.625 0.628 0.595 0.639 乙批次:0.618 0.613 0.592 0.622 0.620
根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是 A.甲批次的总体平均数与标准值更接近 B.乙批次的总体平均数与标准值更接近 C.两个批次总体平均数与标准值接近程度相同
D.两个批次总体平均数与标准值接近程度不能确定
答案 A
解析甲批次的平均数为0.617,乙批次的平均数为0.613
备考提示用以上各数据与0.618(或0.6)的差进行计算,以减少计算量,说明多思则少算。
5.(2009陕西卷文)某单位共有老、中、青职工430人,其中青年职工160人,中年职工人数是老年职工人数的2倍。为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为
A.9
B.18
C.27
D. 36
答案 B
解析由比例可得该单位老年职工共有90人,用分层抽样的比例应抽取18人.
6.(2009福建卷文)一个容量100的样本,其数据的分组与各组的频数如下表
组别(0,10](20,20](20,30)(30,40)(40,50](50,60](60,70]频数12 13 24 15 16 13 7
则样本数据落在(10,40)上的频率为
A. 0.13
B. 0.39
C. 0.52
D. 0.64
答案 C
10,40的有:13+24+15=52,由频率=频数÷总数可得0.52. 解析由题意可知频数在(]
7.(2009上海卷理)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”。根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是
A.甲地:总体均值为3,中位数为4
B.乙地:总体均值为1,总体方差大于0
C.丙地:中位数为2,众数为3
D.丁地:总体均值为2,总体方差为3
答案D
解析根据信息可知,连续10天内,每天的新增疑似病例不能有超过7的数,选项A 中,中位数为4,可能存在大于7的数;同理,在选项C中也有可能;选项B中的总体方差大于0,叙述不明确,如果数目太大,也有可能存在大于7的数;选项D中,根据方差公式,如果有大于7的数存在,那么方差不会为3,故答案选D.
二、填空题
8.(2009年广东卷文)某单位200名职工的年龄分布情况如图2,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1-200编号,并按编号顺序平均分为40组(1-5号,6-10号…,196-200号).若第5组抽出的号码为22,则第8组抽出的号码应是。若用分层抽样方法,则40岁以下年龄段应抽取人.
40.
9.(
直
图表解决实际问题的水平和能力
10.(2009江苏卷)某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练
习,每人投10次,投中的次数如下表:
则以上两组数据的方差中较小的一个为s= .