当前位置:文档之家› (完整版)2020年高考文科数学《概率与统计》题型归纳与训练,推荐文档

(完整版)2020年高考文科数学《概率与统计》题型归纳与训练,推荐文档

(完整版)2020年高考文科数学《概率与统计》题型归纳与训练,推荐文档
(完整版)2020年高考文科数学《概率与统计》题型归纳与训练,推荐文档

1

1 5

2 5

25

8 25

9 2020 年高考文科数学《概率与统计》题型归纳与训练

【题型归纳】 题型一 古典概型 例 1

从甲、乙等5 名学生中随机选出2 人,则甲被选中的概率为(

).

A.

B.

C.

D.

【答案】 【解析】 法有:

可设这 5 名学生分别是甲、乙、丙、丁、戊,从中随机选出 2 人的方

(甲,乙),(甲,丙),(甲,丁),(甲,戊),(乙,丙),(乙,丁),(乙,戊), (丙,丁),(丙,戊),(丁,戊),共有10 种选法,其中只有前 4 种是甲被选中,所以所求概率为 4

2

.故选 B.

10 5

例 2 将 2 本不同的数学书和 1 本语文书在书架上随机排成一行,则 2 本数学书相邻的概率为 .

【答案】 【解析】根据题意显然这是一个古典概型,其基本事件有:数 1,数 2,语; 数 1,语,数 2;数 2,数 1,语; 数 2,语,数 1;语,数 2,数 1; 语,数 1,数 2 共

B

2

3

2

1

4

π 8

1 2

??? = 4 p 2 - 4(3 p - 2) ≥ 0

? x + x = -2 p < 0 1 2 ? ? x x

= 3 p - 2 > 0 1 2

有 6 种,其中 2 本数学书相邻的有 4 种,则其概率为:

【易错点】列举不全面或重复,就是不准确 【思维点拨】直接列举,找出符合要求的事件个数. 题型二 几何概型 例 1

如图所示,正方形

ABCD 内的图形来自中国古代的太极 A

D

图,正方形内切圆中的黑色部分和白色部分关于正方形的中心

成中心对称.在正方形内随机取一点,则此点取自黑色部分的概

B

C

率是( ).

A.

B.

C.

D.

【答案】

【解析】不妨设正方形边长为a ,由图形的对称性可知,太极图中黑白部分面积相等,即各占圆面积的一半.由几何概型概率的计算公式得,所求概率为

.故选 B.

例 2 在区间[0, 5] 上随机地选择一个数的概率为

.

,则方程 x 2 +2 px +3 p - 2 = 0 有两个负根

【答案】

【解析】方程 x 2

+2 px +3 p - 2 = 0 有两个负根的充要条件是 即

B

π 4

p 2

3

p = 4 = 6 2 3

1 ? a ?

2 ?? ?

2

? 2 ? = 8

a 2

3

400

或 p ≥ 2 ,又因为 p ∈[0, 5] ,所以使方程 x 2 +2 px +3 p - 2 = 0 有两个负根的 p

【易错点】“有两个负根”这个条件不会转化.

【思维点拨】“有两个负根”转化为函数图像与 x 轴负半轴有两个交点.从而得到参数 p 的范围.在利用几何概型的计算公式计算即可. 题型三 抽样与样本数据特征 例 1

某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200 ,

, 300 ,100 件.为检验产品的质量,现用分层抽样的方法从以上所有的产品

中抽取60 件进行检验,则应从丙种型号的产品中抽取

件.

【答案】18

【解析】按照分层抽样的概念应从丙种型号的产品中抽取300 ? 60 1000

= 18 (件).

例 2

已知样本数据

x 1 , x 2 , ??? , x n 的均值 x = 5 ,则样本数据2x 1 +1 , 2x 2 +1 , ??? , 2x n +1 的均值为 .

【答案】11 【解析】

因为样本数据x 1 , x 2 , ??? , x n 的均值x = 5 ,又样本数据2x 1 +1 ,

2x 2 +1

, ??? , 2x n +1的和为2(x 1 + x 2 + + x n )+ n ,所以样本数据的均值为2x +1 =11.

例 3 某电子商务公司对10000 名网络购物者 2018 年度的消费情况进行统计,

3 2.

发现消费金额(单位:万元)都在区间[0.3,0.9] 内,其频率分布直方图如图所示. (1)直方图中的a = .

(2)在这些购物者中,消费金额在区间[0.5,0.9] 内的购物者的人数为.

a

/万万

【答案】a = 3 人数为0.6 ?10000 = 6000

【解析】由频率分布直方图及频率和等于1,可得

0.2 ? 0.1+ 0.8? 0.1+1.5? 0.1+ 2 ? 0.1+ 2.5? 0.1+a ? 0.1 = 1 ,解之得a = 3 .

于是消费金额在区间[0.5,0.9]内频率为0.2 ?0.1+ 0.8?0.1+ 2 ?0.1+ 3?0.1 = 0.6 ,

所以消费金额在区间[0.5,0.9]内的购物者的人数为0.6?10000=6000.

例4 某城市100户居民的月平均用电量(单位:度),以[160,180),

[180, 200),[200, 220),[220, 240),[240, 260),[260, 280),[280, 300]分组的频率分布直方图如图所示.

4

5

2

220 + 240 = 230

得 x = 0.0075 .

又(0.002 + 0.0095 + 0.011+ 0.0125)? 20 = 0.7 > 0.5 ,

160 180 200 220 240 260 280 300 万万万万万万/万

(1) 求直方图中 x 的值;

(2) 求月平均用电量的众数和中位数;

(3)在月平均用电量为[220, 240), [240, 260), [260, 280), [280, 300]的四组用户中, 用分层抽样的方法抽取11户居民,则从月平均用电量在[220, 240)的用户中应抽 取多少户?

【答案】见解析

【解析】(1)由(0.002 + 0.0095 + 0.011+ 0.0125 + x + 0.005 + 0.0025)? 20 = 1 ,

(2)由图可知,月平均用电量的众数是

.

因为(0.002 + 0.0095 + 0.011)? 20 = 0.45 < 0.5 ,

所以月平均用电量的中位数在[220, 240)内.

设中位数为a ,由(0.002 +0.0095 +0.011)?20 +0.0125?(a -220)=0.5 ,

得a = 224 ,所以月平均用电量的中位数是224 .

(3)月平均用电量为[220,240)的用户有0.0125? 20 ?100 = 25 (户);

月平均用电量为[240,260)的用户有0.0075?20?100=15(户);

月平均用电量为[260,280)的用户有0.005?20?100=10(户);

月平均用电量为[280, 300]的用户有0.0025? 20 ?100 = 5 (户).

所以从月平均用电量在[220,240)的用户中应抽取25?1 = 5 (户).

5

【易错点】没有读懂题意,计算错误.不会用函数思想处理问题

【思维点拨】根据题意分情况写出函数解析式;2 牵涉到策略问题,一般可以转化为比较两个指标的大小.

题型四回归与分析

例1 下图是我国2008 年至2014 年生活垃圾无害化处理量(单位:亿吨)的折线图

6

7

∑ i =1

n

n

(t - t ) (y - y)

2 ∑ 2

i i

i =1

∑ i =1

7

( y - y )

2

i n

n

万 1.80 万

万 1.60 万万

万 1.40 万

万 1.20 万万

1.00

y

0.80

3

4

5

6

7年份代码t

(1) 由折线图看出,可用线性回归模型拟合 y 与t 的关系,请用相关系数加以说

(2) 建立 y 关于t 的回归方程(系数精确到0.01 ),预测2016 年我国生活垃圾无

害化处理量.

参考数据: 7 y = 9.32 , 7 t y = 40.17 ,

= 0.55 , ≈ 2.646 .

i

i =1

i i

i =1

n

∑(t i - t )( y i - y )

参考公式:相关系数r =

i =1

回归方程 y = a

+ b t 中斜率和截距的最小二乘估计公式分别为:

∑(t i - t )( y i - y )

b

= i =1 a = y - bt .

∑(t

i

- t )2

i =1

【答案】见解析

7

2

【解析】(1)由折线图中数据和附注中参考数据得t = 4 , ∑(t i - t ) = 28 ,

i =1 7

8

∑ i =1

7 7

(t - t ) ? ( y - y )

2

∑ 2

i

i

i =1 ∑ i =1

7 (t - t ) 2

i

i =1 ∑ i =1

7

( y - y )

2

i

7 ∑ 7

(t - t ) 2 i i =1

i

= 0.55 ,

∑7

(t - t )(y - y )= ∑7

t y - t ∑7

y = 40.17 - 4 ? 9.32 = 2.89 ≈

2.89

≈ . , r

0.99 i i

i i

i

0.55? 2 ? 2.646

i =1

i =1

i =1

因为 y 与t 的相关系数近似为0.99 ,说明 y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合 y 与t 的关系.

7

7

7

7 ∑(t i - t )( y i - y )

7∑t i y i - ∑t i ?∑ y i

(1)变量 y 与t 的相关系数r =

i =1

=

i =1

i =1

7 ?

?

7

7

7

又∑t i = 28 , ∑ y i = 9.32 , ∑t i y i = 40.17 2

= 5.292 ,

i =1

i =1

i =1

= 0.55 ,

所以r = 7 ? 40.17 - 28? 9.32 ≈ 0.99

7 ? 5.292 ? 0.55

,故可用线性回归模型拟合变量 y 与t 的关系.

t y - 7t ? y

1

1

7

7

i i

40.17 - 7 ? 4 ? 7 ? 9.32

(2) t = 4 , y =

y ,所以b ?= i =1 =

= 0.10 ,

7 i =1 i

7 i =1

t 2 -

7t 2 28

a ? = y -

b ?x = 1

? 9.32 - 0.10 ? 4 ≈ 0.93 ,所以线性回归方程为 y ? = 0.1t + 0.93 .

7

当t = 9 时, y ?= 0.1? 9 + 0.93 = 1.83 .因此,我们可以预测 2016 年我国生活垃圾无害化处理1.83 亿吨.

【易错点】没有读懂题意,计算错误.

∑(

7

2

y - y i

) i =1

∑ i =1

7

( y - y )

2

i

【思维点拨】将题目的已知条件分析透彻,利用好题目中给的公式与数据.

题型五独立性检验

例1 甲、乙、丙、丁四位同学各自对A、B 两变量的线性相关性作试验,并用回归分析方法分别求得相关系数r 与残差平方和m 如下表:

则哪位同学的试验结果体现A、B 两变量更强的线性相关性?( ) A.甲B.乙C.丙

D.丁

【答案】D

【解析】D 因为r>0 且丁最接近1,残差平方和最小,所以丁相关性最高

【易错点】不理解相关系数和残差平方和与相关性的关系

【思维点拨】相关系数r 的绝对值越趋向于1,相关性越强.残差平方和m 越小相关性越强

【巩固训练】

题型一古典概型

9

10

15

1 14

1 12

1

1. 将一颗质地均匀的骰子(一种各个面上分别标有1,2, 3, 4,5, 6 个点的正方体玩具)

先后抛掷2 次,则出现向上的点数之和小于10 的概率是 .

【答案】 5

6

【解析】将先后两次点数记为(x , y ),则基本事件共有6 ? 6 = 36 (个), 其中点数之和大于等于10有(4,6),(5,5),(5,6),(6,4),(6,5),(6,6),共6 种, 则点数之和小于10 共有30 种,所以概率为

30 = 5

. 36 6

2. 我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德巴赫

猜想是“每个大于 2 的偶数可以表示为两个素数的和”,如30 = 7 + 23 .在不超过30 的素数中,随机选取两个不同的数,其和等于 30 的概率是( ).

A.

B .

C .

D .

【答案】C

【解析】不超过 30 的素数有 2、3、5、7、11、13、17、19、23、29,共 10 个, 随机选取两数有45 (种)情况,其中两数相加和为 30 的有 7 和 23,11 和

19,13 和 17,共 3 故选C .

3. 袋中有形状、大小都相同的 4 只球,其中1 只白球,1 只红球, 2 只黄球,从

中一次随机摸出

【答案】 只球,则这 2 只球颜色不同的概率为 .

【解析】1 只白球设为 a ,1 只红球设为 b , 2 只黄球设c 为 , d ,

2 P = 5

6

18

1

则摸球的所有情况为(a,b),(a, c),(a, d ),(b,c),(b,d ),(c, d ),共6 件,

满足题意的事件为(a,b),(a, c),(a, d ),(b,c),(b,d ),共5

题型二几何概型

1.某公司的班车在7:00,8:00,8:30 发车,学.小明在7:50 至8:30 之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10 分钟的概率是().

A.F(1) 1

3B. 1

2

F(1)C.F(2) 2

3

D. 3

4

【答案】B

【解析】如图所示,画出时间轴.

7:30 7:40 7:50 8:00 8:10 8:20 8:30

B

小明到达的时间会随机的落在图中线段AB 中,而当他的到达时间落在线段AC 或DB 时,才能保证他等车的时间不超过10 分钟.

根据几何概型,所求概率P =10 +10 =1 .故选B.

40 2

2.从区间[0,1]随机抽取2n 个数x1,x2 ,…,x n ,y1 ,y2 ,…,y n ,构成n 个数对(x1, y1),(x2 , y2),…,

(x

n ,y

n

),其中两数的平方和小于1 的数对共有m 个,则用随机模拟的方法得到的

圆周率π的近似值为().

11

p 2 =p

3

p 1 =p

3

p 1 =p

2

AB

4n 2n 4m

A.m

B. m

C.

2m

n

n D. 【答案】C

【解析】由题意得:(x i△△△△y i)(i =1 2 ???n)

在如图所示方格中,而平方和小于1 的

π

4 =m π =4m

点均在如图所示的阴影中,由几何概型概率计算公式知1 n ,所以

C.

n .故选

3.下图来自古希腊数学家希波克拉底所研究的几何图形,此图由三个半圆构成,

三个半圆的直径分别为直角三角形ABC 的斜边BC ,直角边,A C ,

的三边所围成的区域记为Ⅰ,黑色部分记为Ⅱ,其余部分记为Ⅲ,在整个图形中随机取一点,此点取自Ⅰ,Ⅱ,Ⅲ的概率分别记为p1,,p3,则

A.B.C.D.

【答案】A

【解析】概率为几何概型,总区域面积一定,只需比较Ⅰ,Ⅱ,Ⅲ区域面积即可.设直角三角形ABC 的三个角 A ,B ,C 所对的边长分别为a ,b ,c ,则区域Ⅰ

的面积为S1=1

ab ,2

p 2

p 1 =p

2

+p

3

△ABC

12

13

? ? ? ? ? ?

2

区域Ⅱ的面积为 1 ? 1

?2 1 ? 1 ?2 1 1 ? 1 ?2

1

S 2 = 2 π 2 c ? + 2 π 2 b ? + 2 ab - 2 π 2 a ? = 2 ab ,

2 区域Ⅲ的面积为 S = 1 π? 1 c ? + 1 π? 1 b ? - 1 ab = 1 πa 2 - 1 ab .

3 2 2

? 2 2 ? 2

8 2 ? ? ? ?

显然 p 1 = p 2 .故选 A .

题型三 抽样与样本的数据特征

1. 已知一组数据4 ,

6 , 5 , 8 ,

7 , 6 ,那么这组数据的平均数为 .

【答案】10

【解析】平均数

x = 1 (4 + 6 + 5 + 8 + 7 + 6)= 6 . 6

2. 某电子商务公司对 10000 名网络购物者 2014 年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3, 0.9] 内,其频率分布直方图如图所示.

(Ⅰ)直方图中的a =

(Ⅱ)在这些购物者中,消费金额在区间[0.5, 0.9] 内的购物者的人数为

.

【答案】3;6000

【解析】频率和等于 1 可得0.2 ? 0.1 + 0.8 ? 0.1 + 1.5 ? 0.1 + 2 ? 0.1 + 2.5 ? 0.1 + a ? 0.1 = 1 , 解之得a = 3 .于是消费金额在区间[0.5, 0.9] 内频率为0.2 ? 0.1 + 0.8 ? 0.1 + 2 ? 0.1 + 3 ? 0.1 = 0.6 , 所以消费金额在区间[0.5, 0.9] 内的购物者的人数为: 0.6 ?10000 = 6000 ,故应填

3;6000.

3.我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居

民生活用水收费方案,拟确定一个合理的月用水量标准x (吨)、一位居民的月

用水量不超过x 的部分按平价收费,超出x 的部分按议价收费.为了了解居民用水

情况,通过抽样,获得了某年100 位居民每人的月均用水量(单位:吨),将数

据按照[0, 0.5),[0.5,1),???,[4, 4.5)分成9 组,制成了如图所示的频率分布直方图.

(1)求直方图中a 的值;

(2)设该市有30 万居民,估计全市居民中月均用水量不低于3 吨的人数,请说

明理由;

(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.

【答案】见解析

【解析】(1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为

0.08?0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)中的频率分别为0.08 ,0.20 ,0.26 ,0.06 ,0.04 ,0.02 .

由0.04+0.08+0.5?a + 0.20 + 0.26 + 0.5?a + 0.06 + 0.04 + 0.02 = 1 ,解得 a = 0.30 .

(2)由(1),100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.

由以上样本的频率分布,可以估计全市30 万居民中月均用水量不低于 3 吨的人14

数为300000? 0.12 = 36000 .

(3)因为前 6 组的频率之和为0.04 - 0.08 - 0.15 - 0.20 - 0.26 - 0.15=0.88 > 0.85 ,而前5 组的频率之和为0.04+0.08+0.15 -0.20 -0.26=0.73 < 0.85 ,所以2.5 …x < 3.

由0.3?(x - 2.5)= 0.85 - 0.73 ,解得x = 2.9 .

题型四回归与分析

1.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5 户家庭,

得到如下统计数据表:

区一户收入为15 万元家庭年支出为()

A.11.4 万元B.11.8 万元C.12.0 万元D.12.2 万元

【答案】B

所以回归直线方程为y?=0.76x+0.4.当社区一户收入为15 万元,家庭年支出为

(万元).故选B.

0.4 = 11.8

y?=0.76?15+

15

16

y ∑

2. 为了研究某班学生的脚长x (单位:厘米)和身高 y (单位:厘米)的关系,

从该班随机抽取10 名学生,根据测量数据的散点图可以看出 与x 之间有线性相

关关系,设其回归直线方程为 y ?= b ?x + a ?.已知∑x i i =1

10

= 225 , y i = 1600 , b ?= 4 .该

i =1

班某学生的脚长为 24,据此估计其身高为( ).

A . 160

B . 163

C . 166

D .170

【答案】C 【解析】 故选 C .

x = 22.5 , y = 160 ,所以a

= 160 - 4? 22.5 = 70 , x = 24 时, y = 4 ? 24 + 70 = 166 .

3. 某公司为确定下一年投入某种产品的宣传费,需了解年宣传费 x (单位:千元)

对年销售量 y (单位: )和年利润 z (单位:千元)的影响,对近 8 年的年宣

传费x i

和年销售量

计量的值.

y i (i = 1, 2,???,8)

数据作了初步处理,得到下面的散点图及一些统

万万万万/万万

10 t

17

(u 2,v 2 ) (u 1,v 1 ) y = c + d x x = 49

表中

(1) 根据散点图判断, y = a + bx 与y = c + d x 哪一个适宜作为年销售量y 关于年

宣传费x 的回归方程类型(给出判断即可,不必说明理由)?

(2) 根据(1)的判断结果及表中数据,建立 y 关于x 的回归方程;

(3) 已知这种产品的年利润z 与x , y 的关系式为 z = 0.2y - x

,根据(2)的结果

回答下列问题:

(ⅰ)年宣传费 时,年销售量及年利润的预报值是多少?

(ⅱ)年宣传费x 为何值时,年利润的预报值最大?

附:对于一组数据 ,

? ? ? , (u n , v n ),其回归直线v =+ u 的斜率

和截距的最小二乘估计分别为

【答案】见解析

【解析】(1)由散点图变化情况可知选择 较为适宜.

w i = x i

? =

i =1

∑(u i - u )(v i - v ) n

∑ i =1

n

(u - u )

2

i

.

x y

w

∑( )2

x

- x i

i =1

∑( )( - ) w - w y y i i

i =1

∑8

( )2

w

- w i

i =1 ∑( - )( -

) 8

x x y y

i

i

i =1

46.

6

56

3 6.

8

289.8 1.6 1469 108.8

1 8

w = ∑w i

8 i =1

18

563 - 68? 6.8 = 100.6 c = y - d = ∑(w - w

1.6

)

∑8

(w - w )(y - y

i

i

) 108.8

(2)由题意知d =

i =1

= = 68 .又

8

2

i

一定过点(, y ),

i =1

所以 ,

所以 y 与x 的回归方程为 y = 100.6 + 68 x .

(3)(ⅰ)由(2)知,当 x = 49 时,

y = 100.6 + 68? 49 = 576.6(t ),

(千元),

所以当年宣传费为 x = 49 时,年销售量为576.6(t ),利润预估为66.32 千元.

(ⅱ)由(2)知, z = 0.2 y - x = 0.2 (100.6 + 68 x )- x =

-

(

x - 6.8)

2

+ 6.82 + 20.12 ,所以当 x = 6.8 时,年利润的预估值最大,

即 x = 6.82 = 46.24 (千元). 题型五 独立性检验

1. 某医疗研究所为了检验某种血清预防感冒的作用,把 500 名使用血清的人与另

外 500 名未使用血清的人一年中的感冒记录作比较,提出假设 H :“这种血清不能起到预防感冒的作用”,利用 2×2 列联表计算的 K 2≈3.918,则下列表述中正确的是( )

A. 有 95℅的把握认为“这种血清能起到预防感冒的作用”

B. 若有人未使用该血清,那么他一年中有 95℅的可能性得感冒

y = c + d x 66.32 z = 0.2 ? 576.6 - 49 = 20.12 = 13.6 x - x +

19

a a +

b

c c + d

kg C. 这种血清预防感冒的有效率为 95℅

D. 这种血清预防感冒的有效率为 5℅

【答案】A

【解析】由题可知,在假设

成立情况下,

P (K 2

≥ 3.841) 的概率约为 0.05,即在 犯错的概率不错过 0.05 的前提下认为“血清起预防感冒的作用”,即有 95℅的把

握认为“这种血清能起到预防感冒的作用”.这里的 95℅是我们判断 不成立的概

率量度而非预测血清与感冒的几率的量度,故 B 错误.C ,D 也犯有 B 中的错误.

故选 A

2. 观察下面频率等高条形图,其中两个分类变量

x ,y 之间关系最强的是( )

A .

B .

C .

D .

【答案】D

【解析】在频率等高条形图中, 与 相差很大时,我们认为两个分类变

量有关系,四个选项中,即等高的条形图中 x 1, x 2 所占比例相差越大,则分类变

量 x , y 关系越强,故选D .

3. 淡水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽

取了100 个网箱,测量各箱水产品的产量(单位: )的频率分布直方图如图所

示.

H H

万万

万万

万万

万万万万

/k g

万万万万

(1)设两种养殖方法的箱产量相互独立,记 A 表示事件:旧养殖法的箱产量低于50kg ,新养殖法的箱产量不低于50kg ,估计 A 的概率;

(2)填写下面列联表,并根据列联表判断是否有99% 的把握认为箱产量与养殖方法有关;

(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01 ).

附:

20

相关主题
文本预览
相关文档 最新文档