统计与概率高考题2(2015—2018年文科)
1.(2018全国卷Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:3
m)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头50天的日用水量频数分布表
日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)[0.6,0.7)频数 1 3 2 4 9 26 5
使用了节水龙头50天的日用水量频数分布表
日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)频数 1 5 13 10 16 5
(1)在下图中作出使用了节水龙头50天的日用水量数据的频率分布直方图:
(2)估计该家庭使用节水龙头后,日用水量小于0.35 3
m的概率;
(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中
的数据以这组数据所在区间中点的值作代表.)
2.(2018全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1217,,…,)建立模
型①:?30.413.5=-+y
t ;根据2010年至2016年的数据(时间变量t 的值依次为127,,…,)建立模型②:?9917.5=+y
t . (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.
3.(2018全国卷Ⅲ)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m
和不超过m的工人数填入下面的列联表:
超过m不超过m
第一种生产方式
第二种生产方式
(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?
附:
2
2
()
()()()()
n ad bc
K
a b c d a c b d
-
=
++++
,
2
()0.0500.0100.001
3.841 6.63510.828
P K k
k
≥
4.(2018)电影公司随机收集了电影的有关数据,经分类整理得到下表:
好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.
(1)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概
率;
(2)随机选取1部电影,估计这部电影没有获得好评的概率;
(3)电影公司为增加投资回报,拟改变投资策略,这将导致不同类型电影的好评率发生
变化.假设表格中只有两类电影的好评率数据发生变化,那么哪类电影的好评率增加
0.1,哪类电影的好评率减少0.1,使得获得好评的电影总部数与样本中的电影总部数
的比值达到最大?(只需写出结论)
5.(2017新课标Ⅰ)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天依次抽取的16个零件的尺寸:
经计算得16119.9716i i x x ===∑
,s ==0.212≈
18.439≈,16
1
()(8.5) 2.78i i x x i =--=-∑,其中i x 为抽取的
第i 个零件的尺寸,i =1,2, (16)
(1)求(,)i x i (1,2,,16)i =???的相关系数r ,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若||0.25r <,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).
(2)一天抽检零件中,如果出现了尺寸在(3,3)x s x s -+之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查. (ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?
(ⅱ)在(3,3)x s x s -+之外的数据称为离群值,试剔除离群值,估计这条生产线当天生
产的零件尺寸的均值与标准差.(精确到0.01)
附:样本(,)i i x y (1,2,,)i n =???
的相关系数()()
n
i
i
x x y y r --=
∑,
0.09≈.
6.(2017新课标Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:
新养殖法
旧养殖法
箱产量/kg
箱产量/kg
(1)记A 表示事件“旧养殖法的箱产量低于50kg”,估计A 的概率;
(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:
(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较。 附:
2
2
()()()()()n ad bc K a b c d a c b d -=
++++
7.(2017新课标Ⅲ)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:
以最高气温位于各区间的频率代替最高气温位于该区间的概率。
(1)求六月份这种酸奶一天的需求量不超过300瓶的概率;
(2)设六月份一天销售这种酸奶的利润为Y(单位:元),当六月份这种酸奶一天的进货量
为450瓶时,写出Y的所有可能值,并估计Y大于零的概率.
8.(2017)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:
(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)的人数;
(Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
9.(2016年全国I卷)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期更换的易损零件数,得下面柱状图:
记x表示1台机器在三年使用期需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:元),n表示购机的同时购买的易损零件数.
(I)若n=19,求y与x的函数解析式;
(II)若要求“需更换的易损零件数不大于n”的频率不小于0.5,求n的最小值;
(III)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为
决策依据,购买1台机器的同时应购买19个还是20个易损零件?
10.(2016年全国II卷)某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:
随机调查了该险种的200名续保人在一年的出险情况,得到如下统计表:
P A的估计值;
(Ⅰ)记A为事件:“一续保人本年度的保费不高于基本保费”。求()
(Ⅱ)记B为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的160%”.求P B的估计值;
()
(III)求续保人本年度的平均保费估计值.
11.(2016年全国III卷)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
注:年份代码1–7分别对应年份2008–2014.
(Ⅰ)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
(Ⅱ)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
附注:参考数据:
7
1
9.32
i
i
y
=
=
∑,7
1
40.17
i i
i
t y
=
=
∑72
1
()0.55
i
i
y y
=
-=
∑7 2.646.
参考公式:相关系数1
22
11
()()
()(y y)
n
i i
i
n n
i i
i i
t t y y
r
t t
=
==
--
--
∑
∑∑
回归方程y a bt
=+中斜率和截距的最小二乘估计公式分别为:
1
2
1
()()
()
n
i i
i
n
i
i
t t y y
b
t t
=
=
--
=
-
∑
∑
,
=.
a y bt
-
12.(2016年)某市民用水拟实行阶梯水价.每人用水量中不超过w 立方米的部分按4元/
立方米收费,超出w 立方米的部分按10元/立方米收费.从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:
用水量(立方米)
(Ⅰ)如果w 为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4
元/立方米,w 至少定为多少?
(Ⅱ)假设同组中的每个数据用该组区间的右端点值代替.当w =3时,估计该市居民
该月的人均水费.
13.(2015新课标1)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单
位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的年宣传费i x 和年销售量i y (i =1,2,···,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
x
y
w
8
21
()i i x x =-∑
8
21
()i i w w =-∑
8
1
()()i i i x x y y =--∑
8
1
()()i
i
i w w y
y =--∑
46.6
563
6.8
289.8 1.6
1469 108.8
表中i i w x =w =
1
8
8
1
i i w =∑.
(Ⅰ)根据散点图判断,y a bx =+与y c x =+哪一个适宜作为年销售量y 关于年
宣传费x 的回归方程类型?(给出判断即可,不必说明理由) (Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y 关于x 的回归方程;
(Ⅲ)已知这种产品的年利率z 与x 、y 的关系为0.2z y x =-.根据(Ⅱ)的结果回
答下列问题:
(ⅰ)年宣传费49x =时,年销售量及年利润的预报值是多少? (ⅱ)年宣传费x 为何值时,年利率的预报值最大?
附:对于一组数据11(,)u v ,22(,)u v ,???,(,)n n u v ,其回归线v u αβ=+的斜率和截
距的最小二乘估计分别为1
2
1()()
?()n
i
i
i n
i i u u v v u u β
==--=-∑∑,??v u α
β=-.
14.(2015新课标Ⅱ)某公司为了解用户对其产品的满意度,从,A B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得分A地区用户满意评分的频率分布直方图和B地区用户满意度评分的频数分布表.
B地区用户满意度评分的频数分布表
满意度评
[50,60) [60,70) [70,80) [80,90) [90,100) 分分组
频数 2 8 14 10 6 (Ⅰ)在答题卡上作出B地区用户满意度评分的频数分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);
(Ⅱ)根据用户满意度评分,将用户的满意度分为三个等级;
满意度评分低于70分70分到80分不低于90分
满意度等级不满意满意非常满意估计哪个地区用户的满意度等级为不满意的概率大?说明理由.
15.(2015)某超市随机选取1000位顾客,记录了他们购买甲、乙、丙、丁四种商品的情况,整理成下统计表,其中“√”表示购买,“×”表示未购买.
(Ⅰ)估计顾客同时购买乙和丙的概率;
(Ⅱ)估计顾客在甲、乙、丙、丁中同时购买3种商品的概率;
(Ⅲ)如果顾客购买了甲,则该顾客同时购买乙、丙、丁中哪种商品的可能性最大?