当前位置:文档之家› 高考理科数学专题突破练习统计与统计案例

高考理科数学专题突破练习统计与统计案例

高考理科数学专题突破练习统计与统计案例
高考理科数学专题突破练习统计与统计案例

专题突破练20 统计与统计案例

1.(2019四川成都二模,理18)为了让税收政策更好地为社会发展服务,国家在修订《中华人民共和国个人所得税法》之后,发布了《个人所得税专项附加扣除暂行办法》,明确“专项附加扣除”就是子女教育、继续教育、大病医疗、住房贷款利息、住房租金、赡养老人等费用,并公布了相应的定额扣除标准,决定自2019年1月1日起施行.某企业为了调查内部职员对新个税方案的满意程度与年龄的关系,通过问卷调查,整理数据得如下2×2列联表:

(1)根据列联表,能否有99%的把握认为满意程度与年龄有关?

(2)为了帮助年龄在40岁以下的未购房的8名员工解决实际困难,该企业拟按员工贡献积分x (单位:分)给予相应的住房补贴y (单位:元),现有两种补贴方案,方案甲:y=1 000+700x ;方案

乙:y={3 000,0

5 600,510.已知这8名员工的贡献积分为2分,3分,6分,7分,7分,11分,12分,12分,将采

用方案甲比采用方案乙获得更多补贴的员工记为“A 类员工”.为了解员工对补贴方案的认可度,现从这8名员工中随机抽取4名进行面谈,求恰好抽到3名“A 类员工”的概率.

附:K 2=n (ad -bc )2

(a+b )(c+d )(a+c )(b+d )

,其中n=a+b+c+d.

参考数据:

2.下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.

为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,…,17)建立模型①;y ^

=-30.4+13.5t ;根据2010年至2016年的数据(时间变量t 的值依次为1,2,…,7)建立模型②:y ^

=99+17.5t. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.

3.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:

旧养殖法

新养殖法

(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;

(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;

(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).

附:

K2=n(ad-bc)2

(a+b)(c+d)(a+c)(b+d)

.

4.为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:

经计算得x=1

16∑

i=1

16

x i=9.97,s=√1

16

i=1

16

(x i-x)2=√1

16

(∑

i=1

16

x i2-16x2)≈0.212,√∑

i=1

16

(i-8.5)2≈18.439,∑

i=1

16

(x i-x)(i-

8.5)=-2.78,其中x i为抽取的第i个零件的尺寸,i=1,2, (16)

(1)求(x i,i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).

(2)一天内抽检零件中,如果出现了尺寸在(x-3s,x+3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.

①从这一天抽检的结果看,是否需对当天的生产过程进行检查?

②在(x-3s,x+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)

附:样本(x i,y i)(i=1,2,…,n)的相关系数r=

i=1

n

(x i-x)(y i-y)

√∑i=1(x i-x)2√∑

i=1

(y i-y)2

√0.008≈0.09.

5.(2019山东实验等四校联考,理19)随着科技的发展,网络已逐渐融入了人们的生活.网购是非常方便的购物方式,为了了解网购在我市的普及情况,某调查机构进行了有关网购的调查问卷,并从参与调查的市民中随机抽取了男女各100人进行分析,从而得到下表(单位:人).

(1)完成上表,并根据以上数据判断能否在犯错误的概率不超过0.01的前提下认为我市市民网购与性别有关?

(2)①现从所抽取的女市民中利用分层抽样的方法抽取10人,再从这10人中随机选取3人赠送优惠券,求选取的3人中至少有2人经常网购的概率;

②将频率视为概率,从我市所有参与调查的市民中随机抽取10人赠送礼品,记其中经常网购的人数为

X ,求随机变量X 的数学期望和方差.

参考公式:K 2=

n (ad -bc )2

(a+b )(c+d )(a+c )(b+d )

,n=a+b+c+d.

6.随着食品安全问题逐渐引起人们的重视,有机、健康的高端绿色蔬菜越来越受到消费者的欢迎,同时生产—运输—销售一体化的直销供应模式,不仅减少了成本,而且减去了蔬菜的二次污染等问题. (1)在有机蔬菜的种植过程中,有机肥料使用是必不可少的.根据统计某种有机蔬菜的产量与有机肥料的用量有关系,每个有机蔬菜大棚产量的增加量y (百斤)与使用堆沤肥料x (千克)之间对应数据如下表:

依据表中的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x+a ^

;并根据所求线性回归方程,估计如果每个有机蔬菜大棚使用堆沤肥料10千克,则每个有机蔬菜大棚产量增加量y 是多少百斤?

(2)某大棚蔬菜种植基地将采摘的有机蔬菜以每份三斤称重并保鲜分装,以每份10元的价格销售到生鲜超市.“乐购”生鲜超市以每份15元的价格卖给顾客,如果当天前8小时卖不完,则超市通过促销以每份5元的价格卖给顾客(根据经验,当天能够把剩余的有机蔬菜都低价处理完毕,且处理完毕后,当天不再进货).该生鲜超市统计了100天有机蔬菜在每天的前8小时内的销售量(单位:份),制成如下表格(注:x ,y ∈N *,且x+y=30):

若以100天记录的频率作为每日前8小时销售量发生的概率,该生鲜超市当天销售有机蔬菜利润的期望值为决策依据,当购进17份比购进18份的利润的期望值大时,求x 的取值范围.

附:b ^

=

∑i=1

n

(x i -x )(y i -y )

∑i=1

n

(x i -x )

2

=

∑i=1

n

x i y i -nx y

∑i=1n

x i 2-nx 2

,a ^

=y ?b ^

x .

7.(2019陕西第二次质检,理18)某市场研究人员为了了解产业园引进的甲公司前期的经营状况,对该公司2018年连续6个月的利润进行了统计,并根据得到的数据绘制了相应的折线图,如图所示.

(1)由折线图可以看出,可用线性回归模型拟合月利润y(单位:百万元)与月份代码x之间的关系,求y 关于x的线性回归方程,并预测该公司2019年3月份的利润;

(2)甲公司新研制了一款产品,需要采购一批新型材料,现有采购成本分别为10万元/包和12万元/包的A,B两种型号的新型材料可供选择,按规定每种新型材料最多可使用4个月,但新材料的不稳定性会导致材料损坏的年限不相同,现对A,B两种新型材料对应的产品各100件进行科学模拟测试,得到两种新型材料使用寿命的频数统计如下表:

经甲公司测算,平均每包新型材料每月可以带来5万元收入,不考虑除采购成本之外的其他成本,假设每包新型材料的使用寿命都是整数月,且以频率作为每包新型材料使用寿命的概率,如果你是甲公司的负责人,以每包新型材料产生利润的期望值为决策依据,你会选择采购哪款新型材料?

参考数据:∑i=1

6

y i =96,∑i=1

6

x i y i =371.

附:b ^

=∑i=1n

(x i -x )(y i -y )

∑i=1

n

(x i -x )

2

=∑i=1n

x i y i -nx y

∑i=1n

x i 2-nx

2

,a ^

=y ?b ^

x .

8.(2019山东青岛二模,理20)“爱国,是人世间最深层、最持久的情感,是一个人立德之源、立功之本.”在中华民族几千年绵延发展的历史长河中,爱国主义始终是激昂的主旋律.爱国汽车公司拟对“东方红”款高端汽车发动机进行科技改造,根据市场调研与模拟,得到科技改造投入x (亿元)与科技改造直接收益y (亿元)的数据统计如下:

当0

=4.1x+11.8;

模型②:y ^=21.3√x -14.4;当x>17时,确定y 与x 满足的线性回归方程为:y ^=-0.7x+a ^

.

(1)根据下列表格中的数据,比较当0

附:刻画回归效果的相关指数R 2=1-∑i=1

n

(y i

-y ^i

)

2

∑i=1

n

(y i -y )

2

,√17≈4.1.

(2)为鼓励科技创新,当科技改造的投入不少于20亿元时,国家给予公司补贴收益10亿元,以回归方程为预测依据,比较科技改造投入17亿元与20亿元时公司实际收益的大小;

(附:用最小二乘法求线性回归方程y ^=b ^x+a ^

的系数公式

b ^

=∑i=1

n

x i y i -nx ·y

i=1

n

x i 2-nx

2

=

∑i=1

n

(x i -x )(y i -y )

∑i=1

n

(x i -x )

2

;a ^

=y ?b ^

x )

(3)科技改造后,“东方红”款汽车发动机的热效率X大幅提高,X服从正态分布N(0.52,0.012),公司对科技改造团队的奖励方案如下:若发动机的热效率不超过50%,不予奖励;若发动机的热效率超过50%但不超过53%,每台发动机奖励2万元;若发动机的热效率超过53%,每台发动机奖励5万元.求每台发动机获得奖励的数学期望.

(附:随机变量ξ服从正态分布N(μ,σ2),则P(μ-σ<ξ<μ+σ)=0.682 6,P(μ-2σ<ξ<μ+2σ)=0.954 4.)

参考答案

专题突破练20 统计与统计案例

1.解 (1)根据列联表可以求得K 2的观测值: k=

80(25×30-10×15)235×45×40×40

=

807

≈11.429>6.635,

故有99%的把握认为满意程度与年龄有关.

(2)据题意,该8名员工的贡献积分及按甲乙两种方案所获补贴情况为:

由表可知,“A 类员工”有5名,设从这8名员工中随机抽取4名进行面谈,恰好抽到3名“A 类员工”的概率为P ,则P=

C 53C 3

1C 8

4=3

7.

2.解(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为y^=-

30.4+13.5×19=226.1(亿元).

利用模型②,该地区2018年的环境基础设施投资额的预测值为y^=99+17.5×9=256.5(亿元).

(2)利用模型②得到的预测值更可靠.

理由如下:

(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-

30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性

模型y^=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.

(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.

(以上给出了2种理由,答出其中任意一种或其他合理理由均可)

3.解(1)记B表示事件“旧养殖法的箱产量低于50 kg”,C表示事件“新养殖法的箱产量不低于50 kg”.

由题意知P(A)=P(BC)=P(B)P(C).

旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62,故

P(B)的估计值为0.62.

新养殖法的箱产量不低于50 kg的频率为(0.068+0.046+0.010+0.008)×5=0.66,故P(C)的估计值为0.66.

因此,事件A的概率估计值为0.62×0.66=0.409 2.

(2)根据箱产量的频率分布直方图得列联表

K 2

=

200×(62×66-34×38)2100×100×96×104

≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方

法有关.

(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg 的直方图面积为(0.004+0.020+0.044)×5=0.34<0.5,

箱产量低于55 kg 的直方图面积为(0.004+0.020+0.044+0.068)×5=0.68>0.5,故新养殖法箱产量的中位数的估计值为50+

0.5-0.340.068

≈52.35(kg).

4.解 (1)由样本数据得(x i ,i )(i=1,2,…,16)的相关系数为

r=

∑i=116

(x i -x )(i -8.5)

√∑i=1

(x i -x )2√∑i=1

(i -8.5)2

=0.212×

√16×18.439

≈-0.18.

由于|r|<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.

(2)①由于x =9.97,s ≈0.212,由样本数据可以看出抽取的第13个零件的尺寸在(x -3s ,x +3s )以外,因此需对当天的生产过程进行检查.

②剔除离群值,即第13个数据,剩下数据的平均数为1

15(16×9.97-9.22)=10.02,这条生产线当天生产的零件尺寸的均值的估计值为10.02.∑i=116

x i 2=16×0.2122+16×9.972≈1 591.134,剔

除第13个数据,剩下数据的样本方差为1

15(1 591.134-9.222-15×10.022)≈0.008,这条生产线当天生产的零件尺寸的标准差的估计值为√0.008≈0.09. 5.解 (1)

k 2

=

200×(50×30-50×70)2120×80×100×100

=

253

≈8.333>6.635,

故能在犯错误的概率不超过0.01的前提下认为我市市民网购与性别有关. (2)①由题意,所抽取的10名女市民中,经常网购的有10×70

100=7人, 偶尔或不用网购的有10-7=3人,

所以选取的3人中至少有2人经常网购的概率P=

C 72C 31+C 7

3C 10

3=49

60.

②由2×2列联表可知,抽到经常网购的市民频率为120

200=0.6.

将频率视为概率,从我市所有参与调查的市民中随机抽取1人,恰好抽到经常网购市民的概率为0.6.由题意X~B (10,0.6),E (X )=10×0.6=6,D (X )=10×0.6×(1-0.6)=2.4. 6.解 (1)x =

2+4+5+6+8

5

=5,

y =

3+4+4+4+5

5

=4.

∑i=15

x i y i =2×3+4×4+5×4+6×4+8×5=106,

∑i=15

x i 2=22+42+52+62+82=145,

b ^

=106-5×5×4145-5×52

=0.3,a ^

=y ?b ^

x =4-0.3×5=2.5,

所以y 关于x 的线性回归方程为y ^

=0.3x+2.5.

当x=10时,y ^

=0.3×10+2.5=5.5百斤,所以如果每个有机蔬菜大棚使用堆沤肥料10千克,估计每个有机蔬菜大棚产量的增加量y 是5.5百斤.

(2)若该超市一天购进17份这种有机蔬菜,Y 1表示当天的利润(单位:元),那么Y 1的分布列为

Y 1的数学期望是E (Y 1)=65×10

100+75×x

100+85×

90-x 100

=

8 300-10x 100

;

若该超市一天购进18份这种有机蔬菜,Y 2表示当天的利润(单位:元),那么Y 2的分布列为

Y 2的数学期望是E (Y 2)=60×10

100+70×x

100+80×16

100+90×74-x 100

=

8 540-20x 100

;

又购进17份比购进18份的利润的期望值大,故8 300-10x 100

>

8 540-20x 100

,求得x>24,故x 的取

值范围是(24,30),x ∈N *.

7.解 (1)由折线图可知统计数据(x i ,y i )共6组,即(1,11),(2,13),(3,16),(4,15),(5,20),(6,21),计算可得x =1

6(1+2+3+4+5+6)=3.5, y =16∑i=16

y i =16×96=16,

∑i=1

n

x i 2-n x 2

=12+22+32+42+52+62-6×3.52=17.5.

故b ^

=

371-6×3.5×16

17.5=2,

故a ^

=y ?b ^

x =16-2×3.5=9,

∴x 关于y 的线性回归方程为y ^

=2x+9,故x=11时,则y ^

=2×11+9=31,即预测公司2019年3月份(即x=11时)的利润为31百万元.

(2)由频率估计概率,A 型材料可使用1个月,2个月,3个月、4个月的概率分别为0.2,0.35,0.35,0.1,

∴A 型材料利润的数学期望为(5-10)×0.2+(10-10)×0.35+(15-10)×0.35+(20-10)×0.1=1.75万元;

B 型材料可使用1个月,2个月,3个月、4个月的概率分别为0.1,0.3,0.4,0.2,

∴B 型材料利润的数学期望为(5-12)×0.1+(10-12)×0.3+(15-12)×0.4+(20-12)×0.2=1.50万元;

∵1.75>1.50,∴应该采购A 型材料. 8.解 (1)由表格中的数据,有182.4>79.2,即

182.4

∑i=1

7

(y i -y )2

>

79.2

∑i=1

7

(y i -y )2

,

所以模型①的R 2小于模型②,说明回归模型②刻画的拟合效果更好.

所以当x=17亿元时,科技改造直接收益的预测值为y ^

=21.3×√17-14.4≈21.3×4.1-14.4=72.93(亿元).

(2)由已知可得:x-20=1+2+3+4+5

=3,所以x=23,

5

y-60=8.5+8+7.5+6+6

=7.2,所以y=67.2.

5

所以a^=y+0.7x=67.2+0.7×23=83.3.

所以当x>17亿元时,y与x满足的线性回归方程为:y^=-0.7x+83.3.

所以当x=20亿元时,科技改造直接收益的预测值y^=-0.7×20+83.3=69.3,

所以当x=20亿元时,实际收益的预测值为69.3+10=79.3亿元>72.93亿元,

所以科技改造投入20亿元时,公司的实际收益的更大.

=0.977

(3)因为P(0.52-0.020.50)=1+0.9544

2

2,P(X≤0.50)=1-0.9544

=0.022 8.

2

=0.158 7,所以

因为P(0.52-0.010.53)=1-0.6826

2

P(0.50

设每台发动机获得的奖励为Y(万元),则Y的分布列为:

所以每台发动机获得奖励的数学期望为E(Y)=0×0.022 8+2×0.818 5+5×0.158 7=2.430 5(万元).

最全高考数学统计专题解析版【真题】

最全高考数学统计专题解析版【真题】 -CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

第十一章统计、统计案例 第一部分六年高考荟萃 2013年高考题 1 .(2013年高考陕西卷(理))某单位有840名职工, 现采用系统抽样方法, 抽取 42人做问卷调查, 将840人按1, 2, , 840随机编号, 则抽取的42人中, 编号 落入区间[481, 720]的人数为()A.11 B.12 C.13 D.14 2 .(2013年普通高等学校招生统一考试安徽数学(理)试题(纯WORD版))某班级有 50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名 女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名 女生的成绩分别为88,93,93,88,93.下列说法一定正确的是()A.这种抽样方法是一种分层抽样 B.这种抽样方法是一种系统抽样 C.这五名男生成绩的方差大于这五名女生成绩的方差 D.该班级男生成绩的平均数小于该班女生成绩的平均数 3 .(2013年普通高等学校招生统一考试福建数学(理)试题(纯WORD版))某校从高 一年级学生中随机抽取部分学生,将他们的模块测试成绩分为6组:[40,50), [50,60), [60,70), [70,80), [80,90), [90,100)加以统计,得到如图所示的频率分布 直方图,已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60 分的学生人数为()A.588 B.480 C.450 D.120 4 .(2013年高考江西卷(理))总体有编号为01,02,…,19,20的20个个体组成。利用下 面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字 7816 6572 0802 6314 0702 4369 9728 0198 3204 9234 4935 8200 3623 4869 6938 7481 )A.08 B.07 C.02 D.01 5.(2013年高考上海卷(理))盒子中装有编号为1,2,3,4,5,6,7,8,9的九个球,从中任意取出两个,则这两个球的编号之积为偶数的概率是 ___________(结果用最简分数表示)

高三数学概率统计知识点归纳

高三数学概率统计知识 点归纳 内部编号:(YUUT-TBBY-MMUT-URRUY-UOOY-DBUYI-0128)

概率统计知识点归纳 平均数、众数和中位数 平均数、众数和中位数.要描述一组数据的集中趋势,最重要也是最常见的方法就是用这“三数”来说明. 一、正确理解平均数、众数和中位数的概念 平均数平均数是反映一组数据的平均水平的特征数,反映一组数据的集中趋势.平均数的大小与一组数据里的每一个数据都有关系,任何一个数据的变化都会引起平均数的变化. 2.众数在一组数据中出现次数最多的数据叫做这一组数据的众数.一组数据中的众数有时不唯一.众数着眼于对各数出现的次数的考察,这就告诉我们在求一组数据的众数时,既不需要排列,又不需要计算,只要能找出样本中出现次数最多的那一个(或几个)数据就可以了.当一组数据中有数据多次重复出现时,它的众数也就是我们所要关心的一种集中趋势. 3.中位数中位数就是将一组数据按大小顺序排列后,处在最中间的一个数(或处在最中间的两个数的平均数).一组数据中的中位数是唯一的. 二、注意区别平均数、众数和中位数三者之间的关系 平均数、众数和中位数都是描述一组数据的集中趋势的量,但它们描述的角度和适用的范围又不尽相同.在具体问题中采用哪种量来描述一组数据的集中趋势,那得看数据的特点和要关注的问题. 三、能正确选用平均数、众数和中位数来解决实际问题 由于平均数、众数和中位数都是描述一组数据的集中趋势的量,所以利用平均数、众数和中位数可以来解决现实生活中的问题.

极差、方差、标准差 极差、方差和标准差都是用来研究一组数据的离散程度的,反映一组数据的波动范围或波动大小的量. 极差 一组数据中最大值与最小值的差叫做这组数据的极差,即极差=最大值-最小值.极差能够反映数据的变化范围,差是最简单的一种度量数据波动情况的量,它受极端值的影响较大. 二、方差 方差是反映一组数据的整体波动大小的特征的量.它是指一组数据中各个数据与这组数据的平均数的差的平方的平均数,它反映的是一组数据偏离平均值的情况.方差越大,数据的波动越大;方差越小,数据的波动越小. 求一组数据的方差可以简记先求平均,再求差,然后平方,最后求平均数.一组数据x1、x2、x3、…、xn 的平均数为x ,则该组数据方差的计算公式为: ])()()[(1222212x x x x x x n S n -++-+-= . 三、标准差 在计算方差的过程中,可以看出方差的数量单位与原数据的单位不一致,在实际的应用时常常将求出的方差再开平方,此时得到量为这组数据的标准差. 即标准差=方差. 四、极差、方差、标准差的关系 方差和标准差都是用来描述一组数据波动情况的量,常用来比较两组数据的波动大小.两组数据中极差大的那一组并不一定方差也大.在实际问题中有时用到标准差,是因为标准差的单位和原数据的单位一致,且能缓解方差过大或过小的现象.

全国各地高考数学统计与概率大题专题汇编.doc

1.【2015·新课标II】某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下: A地区:62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 82 76 89 B地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79 (Ⅰ)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,得出结论即可); 价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率. 2.【2015·福建】某银行规定,一张银行卡若在一天内出现3次密码尝试错误,该银行卡将被锁定,小王到银行取钱时,发现自己忘记了银行卡的密码,但是可以确定该银行卡的正确密码是他常用的6个密码之一,小王决定从中不重复地随机选择1个进行尝试.若密码正确,则结束尝试;否则继续尝试,直至该银行卡被锁定. (Ⅰ)求当天小王的该银行卡被锁定的概率; (Ⅱ)设当天小王用该银行卡尝试密码次数为X,求X的分布列和数学期望.

3.【2015·山东】若n是一个三位正整数,且n的个位数字大于十位数字,十位数字大于百位数字,则称n为“三位递增数”(如137,359,567等).在某次数学趣味活动中,每位参加者需从所有的“三位递增数”中随机抽取1个数,且只能抽取一次.得分规则如下:若抽取的“三位递增数”的三个数字之积不能被5整除,参加者得0分;若能被5整除,但不能被10 分;若能被10整除,得1分. 整除,得1 (I)写出所有个位数字是5的“三位递增数” ; (II)若甲参加活动,求甲得分X的分布列和数学期望EX. 4.【2015·安徽】已知2件次品和3件正品放在一起,现需要通过检测将其区分,每次随机检测一件产品,检测后不放回,直到检测出2件次品或者检测出3件正品时检测结束. (Ⅰ)求第一次检测出的是次品且第二次检测出的是正品的概率; (Ⅱ)已知每检测一件产品需要费用100元,设X表示直到检测出2件次品或者检测出3件正品时所 需要的检测费用(单位:元),求X的分布列和均值(数学期望).

高三数学《统计》知识总结

高三数学《统计》知识总结 一、相关性检验(检验两个变量之间是否具有相关关系) 1.相关关系的分类 相关关系包括正相关和负相关。 2.线性相关关系 从散点图上看,如果两个变量对应的点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线. 3.回归方程 两个具有线性相关关系的变量的一组数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程为?y =?b x +?a ,则,,其中,?b 是回归方程的回归系数,?a 是在y 轴上的截距,(x ,y )是样本点的中心. 4.样本相关系数 ,用它来衡量两个变量间的线性相关关系. (1)由于相关系数r 的分子与线性回归方程中的斜率?b 的分子一样,因此,当时,两个变量正相关; 当时两个变量负相关. (3) 1r ≤, 当r 越接近1,表明两个变量的线性相关性越强;当r 越接近0,表明两个变量的线性相关性越弱. 二、独立性检验 1.2×2列联表 2.K 2统计量 K 2=n (ad -bc )2 (a +b )(c +d )(a +c )(b +d ) (其中n =a +b +c +d 为样本容量) 。规定:,,,a b c d 都要大于5 3.两个临界值: 在独立性检验中,统计量K 2有两个临界值:3.841和6.635.当K 2>3.841时,有95%的把握说明两个 事件有关,当K 2>6.635时,有99%的把握说明两个事件有关,当K 2≤3.841时,认为两个事件无关. 注:有95%(或99%)的把握说事件A 与B 有关,也可说推断犯错误的可能性为5%(或1%). 12 1()()()n i i i n i i x x y y b x x ==--=-∑∑$1221n i i i n i i x y nx y x nx ==-=-∑∑$a y bx =-$()()n i i x x y y r --=∑0r >0r <

高考数学概率与统计专题复习

高考复习专题之:概率与统计 一、概率:随机事件A 的概率是频率的稳定值,反之,频率是概率的近似值. 1.随机事件A 的概率0()1P A ≤≤,其中当()1P A =时称为必然事件;当()0P A =时称为不可能事件P(A)=0; 注:求随机概率的三种方法: (一)枚举法 例1如图1所示,有一电路AB 是由图示的开关控制,闭合a ,b ,c , d , e 五个开关中的任意两个开关,使电路形成通路.则使电路形成通 路的概率是 . 分析:要计算使电路形成通路的概率,列举出闭合五个开关中的任意 两个可能出现的结果总数,从中找出能使电路形成通路的结果数,根据概率的意义计算即可。 解:闭合五个开关中的两个,可能出现的结果数有10种,分别是a b 、a c 、a d 、a e 、bc 、bd 、be 、cd 、ce 、de ,其中能形成通路的有6种,所以p(通路)= 106=5 3 评注:枚举法是求概率的一种重要方法,这种方法一般应用于可能出现的结果比较少的事件的概率计算. (二)树形图法 例2小刚和小明两位同学玩一种游戏.游戏规则为:两人各执“象、虎、鼠”三张牌,同时各出一张牌定胜负,其中象胜虎、虎胜鼠、鼠胜象,若两人所出牌相同,则为平局.例如,小刚出象牌,小明出虎牌,则小刚胜;又如, 两人同时出象牌,则两人平局.如果用A 、B 、C 分别表示小刚的象、虎、鼠三张牌,用A 1、B 1、C 1分别表示小明 的象、虎、鼠三张牌,那么一次出牌小刚胜小明的概率是多少? 分析:为了清楚地看出小亮胜小刚的概率,可用树状图列出所有可能出现的结果,并从中找出小刚胜小明可能出现的结果数。 解:画树状图如图树状图。由树状图(树形图)或列表可知,可能出现的结果有9种,而且每种结果出现的可能性相同,其中小刚胜小明的结果有3种.所以P (一次出牌小刚胜小明)= 31 点评:当一事件要涉及两个或更多的因素时,为了不重不漏地列出所有可能的结果,通过画树形图的方法来计算概率 (三)列表法 例3将图中的三张扑克牌背面朝上放在桌面上,从中随机摸出两张,并用这两张扑克牌上的数字组成一个两位数.请你用画树形(状)图或列表的方法求:(1)组成的两位数是偶数的概率;(2)组成的两位数是6的倍数的概率. 分析:本题可通过列表的方法,列出所有可能组成的两位数的可能情况,然后再找出组成的两位数是偶数的可能情况和组成两位数

高考数学统计及统计案例

§10.2统计及统计案例 考纲解读 分析解读

从近几年的高考试题来看,本部分在高考中的考查点如下:1.主要考查分层抽样的定义,频率分布直方图,平均数、方差的计算,识图能力及借助概率知识分析、解决问题的能力;2.在频率分布直方图中,注意小矩形的高=频率/组距,小矩形的面积为频率,所有小矩形的面积之和为1;3.分析两个变量间的相关关系,通过独立性检验判断两个变量是否相关.本节内容在高考中分值为17分左右,属中档题.

(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6, 所以样本中分数小于70的频率为1-0.6=0.4. 所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4. (2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9, 分数在区间[40,50)内的人数为100-100×0.9-5=5. 所以总体中分数在区间[40,50)内的人数估计为400× =20. (3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60, 所以样本中分数不小于70的男生人数为60× =30. 所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2. 所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2. 五年高考 考点一 抽样方法 1.(2015北京,4,5分)某校老年、中年和青年教师的人数见下表.采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )

2019年高考数学一轮复习专题10.2统计与统计案例测

专题10.2 统计与统计案例 一、填空题:请把答案直接填写在答题卡相应的位置........ 上(共10题,每小题6分,共计60分). 1.交通部门对某路段公路上行驶的汽车速度实施监控,从速度在 的汽车中抽取150辆进行分析,得到数据的频率分布直方图如图所示,则速度在 以下的汽车有辆. ) 【答案】75 2.某校高一年级有学生人,高二年级有学生人,现采用分层抽样的方法从全校学生中抽出人,其中从高一年级学生中抽出人,则从高三年级学生中抽取的人数为 ▲ . 【答案】17 【解析】高一高二人数之比为10:9,因此高二抽出的人数为18人,高三抽出的人数为55-20-18=17人 3.若一组样本数据9,8,x ,10,11的平均数为10,则该组样本数据的方差为▲. 【答案】2 【解析】由题意得,因此方差为 4.某校共有教师200人,男学生800人,女学生600人,现用分层抽样的方法从所有师生中抽取一个容量为的样本,已知从男学生中抽取的人数为100人,那么 ▲ . 【答案】200 【解析】男学生占全校总人数,那么 5.从某校高三年级随机抽取一个班,对该班50名学生的高校招生体检表中的视力情况进行统计,其频率分布直方图如图所示。若某高校A 专业对视力的要求在0.9以上,则该班学生中能报A 专业的人数为.

【答案】20 【解析】根据频率分布直方图,得视力在0.9以上的频率为(1.00+0.75+0.25)×0.2=0.4, ∴该班学生中能报A专业的人数为50×0.4=20. 6.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本.用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是________.若用分层抽样方法,则40岁以下年龄段应抽取________人. 【答案】37,20 7.下图是2014年在怀化市举行的演讲比赛,七位评委为第一位演讲者打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数与方差分别为. 【答案】, 【解析】去掉一个最高分和一个最低分之后,剩余的五个数据依次是、、、、,平均数为

高考数学复习专题:统计与概率(经典)

11 12 13 3 5 7 2 2 4 6 9 1 5 5 7 图1 统计与概率专题 一、知识点 1、随机抽样:系统抽样、简单随机抽样、分层抽样 1、用简单随机抽样从100名学生(男生25人)中抽选20人进行评教,某男生被抽到的概率是( ) A . 1001 B .251 C .5 1 D . 5 1 2、为了解1200名学生对学校教改试验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段的间隔k 为( ) A .40 B .30 C .20 D .12 3、某单位有职工160人,其中业务员有104人,管理人员32人,后勤服务人员24人,现用分层抽样法从中抽取一容量为20的样本,则抽取管理人员( ) A .3人 B .4人 C .7人 D .12人 2、古典概型与几何概型 1、一枚硬币连掷3次,只有一次出现正面的概率是( ) A .83 B .32 C .31 D .4 1 2、如图所示,在正方形区域任意投掷一枚钉子,假设区域内每一点被投中的可能性相等,那么钉子投进阴影区域的概率为____________. 3、线性回归方程 用最小二乘法求线性回归方程系数公式1 2 211 ???n i i i n i x y nx y b a y bx x nx ==-==--∑∑,. 二、巩固练习 1、随机抽取某中学12位高三同学,调查他们春节期间购书费用(单位:元),获得数据的茎叶图如图1, 这12位同学购书的平均费用是( ) A.125元 B.5.125元 C.126元 D.5.126元 2、200辆汽车通过某一段公路时的时速频率分布直方图如图所示,时速在[50,60) 的汽车大约有( ) A .30辆 B . 40辆 C .60辆 D .80辆 3、某校有高级教师26人,中级教师104人,其他教师若干人.为了了解该校教师 的工资收入情况,若按分层抽样从该校的所有教师中抽取56人进行调查,已知从其 他教师中共抽取了16人,则该校共有教师 ______人. 4、执行下边的程序框图,若0.8p =,则输出的n = . 0.04 0.030.020.01频率 组距时速8070605040开始 10n S ==, S p

通用版2020版高考数学大二轮复习专题突破练20统计与统计案例理

专题突破练20 统计与统计案例 1.(2019四川成都二模,理18)为了让税收政策更好地为社会发展服务,国家在修订《中华人民共和国个人所得税法》之后,发布了《个人所得税专项附加扣除暂行办法》,明确“专项附加扣除”就 是子女教育、继续教育、大病医疗、住房贷款利息、住房租金、赡养老人等费用,并公布了相应的定额扣除标准,决定自2019年1月1日起施行.某企业为了调查内部职员对新个税方案的满意程度与年龄的关系,通过问卷调查,整理数据得如下2×2列联表: (1)根据列联表,能否有99%的把握认为满意程度与年龄有关? (2)为了帮助年龄在40岁以下的未购房的8名员工解决实际困难,该企业拟按员工贡献积分x(单位:分)给予相应的住房补贴y(单位:元),现有两种补贴方案,方案甲:y=1 000+700x;方案 乙:y=已知这8名员工的贡献积分为2分,3分,6分,7分,7分,11分,12分,12分,将采用方案甲比采用方案乙获得更多补贴的员工记为“A类员工”.为了解员工对补贴方案的认可度,现从这8名员工中随机抽取4名进行面谈,求恰好抽到3名“A类员工”的概率. 附:K2=-,其中n=a+b+c+d. 参考数据:

2.下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图. 为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为 … 7 建立模型①;=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为 … 7 建立模型②:=99+17.5t. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.

2015高考数学总复习专题系列——统计.板块五.独立性检验.学生版

一.随机抽样 1.随机抽样:满足每个个体被抽到的机会是均等的抽样,共有三种经常采用的随机抽样方法: ⑴简单随机抽样:从元素个数为N 的总体中不放回地抽取容量为n 的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样. 抽出办法:①抽签法:用纸片或小球分别标号后抽签的方法. ②随机数表法:随机数表是使用计算器或计算机的应用程序生成随机数的功能生成的一张数表.表中每一位置出现各个数字的可能性相同. 随机数表法是对样本进行编号后,按照一定的规律从随机数表中读数,并取出相应的样本的方法. 简单随机抽样是最简单、最基本的抽样方法. ⑵系统抽样:将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本的抽样方法. 抽出办法:从元素个数为N 的总体中抽取容量为n 的样本,如果总体容量能被样本容量整 除,设N k n =,先对总体进行编号,号码从1到N ,再从数字1到k 中随机抽取一个数s 作 为起始数,然后顺次抽取第2(1)s k s k s n k +++-, ,,个数,这样就得到容量为n 的样本.如果总体容量不能被样本容量整除,可随机地从总体中剔除余数,然后再按系统抽样方法进行抽样. 系统抽样适用于大规模的抽样调查,由于抽样间隔相等,又被称为等距抽样. ⑶分层抽样:当总体有明显差别的几部分组成时,要反映总体情况,常采用分层抽样,使总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样,这种抽样方法叫做分层抽样. 分层抽样的样本具有较强的代表性,而且各层抽样时,可灵活选用不同的抽样方法,应用广泛. 2.简单随机抽样必须具备下列特点: ⑴简单随机抽样要求被抽取的样本的总体个数N 是有限的. ⑵简单随机样本数n 小于等于样本总体的个数N . ⑶简单随机样本是从总体中逐个抽取的. ⑷简单随机抽样是一种不放回的抽样. ⑸简单随机抽样的每个个体入样的可能性均为n N . 3.系统抽样时,当总体个数N 恰好是样本容量n 的整数倍时,取N k n =; 若N n 不是整数时,先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量n 整除.因为每个个体被剔除的机会相等,因而整个抽样过程中每个个体被抽取的机会仍 知识内容 板块五.独立性检验

高考二轮数学专题:概率统计的解题技巧

概率统计的解题技巧 【考点透视】 1.了解随机事件的发生存在着规律性和随机事件概率的意义. 2.了解等可能性事件的概率的意义,会用排列组合的基本公式计算一些等可能性事件的概率. 3.了解互斥事件、相互独立事件的意义,会用互斥事件的概率加法公式与相互独立事件的概率乘法公式计算一些事件的概率. 4.会计算事件在n 次独立重复试验中恰好发生k 次的概率. 5. 掌握离散型随机变量的分布列. 6.掌握离散型随机变量的期望与方差. 7.掌握抽样方法与总体分布的估计. 8.掌握正态分布与线性回归. 【例题解析】 考点1. 求等可能性事件、互斥事件和相互独立事件的概率 解此类题目常应用以下知识: (1)等可能性事件(古典概型)的概率:P (A )=)()(I card A card =n m ; 等可能事件概率的计算步骤: ①计算一次试验的基本事件总数n ; ②设所求事件A ,并计算事件A 包含的基本事件的个数m ; ③依公式()m P A n =求值; ④答,即给问题一个明确的答复. (2)互斥事件有一个发生的概率:P (A +B )=P (A )+P (B ); 特例:对立事件的概率:P (A )+P (A )=P (A +A )=1. (3)相互独立事件同时发生的概率:P (A ·B )=P (A )·P (B ); 特例:独立重复试验的概率:P n (k )=k n k k n p p C --)1(.其中P 为事件A 在一次试验中发生的概率,此式为二项式[(1-P)+P]n 展开的第k+1项. (4)解决概率问题要注意“四个步骤,一个结合”: ①求概率的步骤是: 第一步,确定事件性质???? ???等可能事件 互斥事件 独立事件 n 次独立重复试验 即所给的问题归结为四类事件中的某一种. 第二步,判断事件的运算?? ?和事件积事件 即是至少有一个发生,还是同时发生,分别运用相加或相乘事件. 第三步,运用公式()()()()()()()()(1) k k n k n n m P A n P A B P A P B P A B P A P B P k C p p -? =???+=+? ??=??=-??等可能事件: 互斥事件: 独立事件: n 次独立重复试验:求解 第四步,答,即给提出的问题有一个明确的答复. 例1.在五个数字12345,,,,中,若随机取出三个数字,则剩下两个数字都是奇数的概率是

高三数学统计习题精选精讲

一.抽样方法: 1.简单随机抽样: 设一个总体的个数为N ,如果通过逐个抽样的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率都相等,就称这样的抽样为简单随机抽样。 抽签法和随机数表法是实施简单随机抽样的两种常用的方法。 2。分层抽样: 当已知总体由差异明显的几部分组成时,常常总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫分层抽样,其中所分成的各个部分叫做层。 二、利用样本频率估计总体分布: 由于总体分布通常不易知道,我们往往用样本的频率分布估计总体分布。一般地,样本容量越大,这种估计就越精确。 1、频率分布条形图: 当总体中的个体取不同数值很少时,其频率分布表由所取的样本的不同数值及相应的频率表示,其几何表示就是相应的条形图。 2、频率分布直方图: 当总体中的个体取不同数值很多时或者可以在实数区内取值时,用频率分布直方图表示相应样本的频率分布。 注:频率分布条形图和频率分布直方图不同。频率分布直方图的纵轴(矩形的高)表示频率,而频率分布直方图的纵轴(矩形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的矩形的面积。 三.期望与方差: 1.期望:123,,,n a a a a 的期望:12n a a a x n ++ +=; 2.方差: 123,,, n a a a a 的方差为:2222121[()()()]n S a x a x a x n =-+-++- 3.均方差:123,,, n a a a a 的均方差:????? ?-++-+-= )(...)()(122 221x a x a x a n n s 注:对于“已知123,,,n a a a a 的期望为多少,求12,,,n a a b a a b a a b ?+?+?+的期望和方差分别是多少?”问题,关键是利用 上述公式变形、整理得到所求的结果。 平均数、众数和中位数 这里说的“三数”是指平均数、众数和中位数.要描述一组数据的集中趋势,最重要也是最常见的方法就是用这“三数”来说明.学习平均数、众数和中位数应注意以下几个问题: 一、正确理解平均数、众数和中位数的概念 1.平均数 平均数是反映一组数据的平均水平的特征数,反映一组数据的集中趋势.平均数的大小与一组数据里的每一个数据都有关系,任何一个数据的变化都会引起平均数的变化. 2.众数 在一组数据中出现次数最多的数据叫做这一组数据的众数.一组数据中的众数有时不唯一.众数着眼于对各数出现的次数的考察,这就告诉我们在求一组数据的众数时,既不需要排列,又不需要计算,只要能找出样本中出现次数最多的那一个(或几个)数据就可以了.当一组数据中有数据多次重复出现时,它的众数也就是我们所要关心的一种集中趋势. 3.中位数 中位数就是将一组数据按大小顺序排列后,处在最中间的一个数(或处在最中间的两个数的平均数).一组数据中的中位数是唯一的. 二、注意区别平均数、众数和中位数三者之间的关系 平均数、众数和中位数都是描述一组数据的集中趋势的量,但它们描述的角度和适用的范围又不尽相同.在具体问题中采用哪种量来描述一组数据的集中趋势,那得看数据的特点和我们要关注的问题. 三、能正确选用平均数、众数和中位数来解决实际问题 由于平均数、众数和中位数都是描述一组数据的集中趋势的量,所以利用平均数、众数和中位数可以来解决现实生活中的问题.下面举几例说明.

2020高考数学专题10 概率与统计(解析版)

专题10 概率与统计 1.【2019年高考全国Ⅲ卷理数】《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为 A .0.5 B .0.6 C .0.7 D .0.8 【答案】C 【解析】由题意得,阅读过《西游记》的学生人数为90-80+60=70,则其与该校学生人数之比为70÷100=0.7.故选C . 【名师点睛】本题考查抽样数据的统计,渗透了数据处理和数学运算素养.采取去重法,利用转化与化归思想解题. 2.【2019年高考全国Ⅱ卷理数】演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是 A .中位数 B .平均数 C .方差 D .极差 【答案】A 【解析】设9位评委评分按从小到大排列为123489x x x x x x <<<<

高考数学专题8之统计

壹 高考数学专题八之统计 【知识概要】 一、抽样方法 ●1. 简单随机抽样——设一个总体的总数为N ,若通过逐个抽取的方法从总体中抽取一个样本,且每次抽取时,各个个体被抽到的概率相等,这样的抽样方法叫简单随机抽样。 特点:不放回抽样;逐个抽取;被抽取的样本的总数是有限的。 主要方法:抽签法;随机数表法。 ●2. 系统抽样——将总体平均分成几个部分,然后按照预先定出的规则,从每个部分中抽取一个个体,得到所需的样本,这样的抽样方法叫简单系统抽样。 特点:等概率抽样;等距离(或按预先定出的规则)抽样;不放回抽样。 系统抽样的步骤: ①采用随机的方式将总体中的个体编号; ②将整个的编号按一定的间隔(设为k ),当N n (N 为总体中的个体数,n 为 样本容量)是整数时,;N k n = 当N n 不是整数时,从总体中剔除一些个体,使剩 下的总体中个体的个数1N 能被n 整除,这时1 N k n =,并将剩下的总体重新编号; ③在第一段中用简单随机抽样确定起始的个体标号l ; ④将编号为,,2,,(1)l l k l k l n k +++-L 的个体抽出。 ●3. 分层抽样——当总体由差异明显的几个部分组成时,将总体中的个体按不同的特点分成层次比较分明的几部分,然后按各部分在总体中所占的比进行抽样,这样的抽样方法叫分层抽样。 特点:每层抽取的样本数=?每层的个数所要抽取的总体数总体样本个数 ;等概率抽样; 不放回抽样。 分层抽样的步骤: ①将总体按一定标准分层; ②计算各层的个数与总体的个数的比; ③按各层个数占总体的个数的比确定各层应抽取的样本容量; ④在每一层进行抽样(可用简单随机抽样或系统抽样)。 二、总体分布的估计和总体特征数的估计 ●1. 频率分布表的有关概念 (1)频数: 在一组数据中,某范围内的数据出现的次数; (2)频率: 频数除以数据的总个数; (3)全距: 数据中最大与最小值的差; (4)组距=全距组数 ; (5)分组要求:通常对组内数值所在区间取左开右闭区间,最后一组取闭区间,并且使分点比数据多一位小数。

最全高考数学统计专题解析版【真题】

第十一章统计、统计案例 第一部分六年高考荟萃 2013年高考题 1 .(2013年高考陕西卷(理))某单位有840名职工, 现采用系统抽样方法, 抽取42人做 问卷调查, 将840人按1, 2, , 840随机编号, 则抽取的42人中, 编号落入区间[481, 720]的人数为()A.11 B.12 C.13 D.14 2 .(2013年普通高等学校招生统一考试安徽数学(理)试题(纯WORD版))某班级有50 名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数 学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为 88,93,93,88,93.下列说法一定正确的是()A.这种抽样方法是一种分层抽样 B.这种抽样方法是一种系统抽样 C.这五名男生成绩的方差大于这五名女生成绩的方差 D.该班级男生成绩的平均数小于该班女生成绩的平均数 3 .(2013年普通高等学校招生统一考试福建数学(理)试题(纯WORD版))某校从高一 年级学生中随机抽取部分学生,将他们的模块测试成绩分为6组:[40,50), [50,60), [60,70), [70,80), [80,90), [90,100)加以统计,得到如图所示的频率分布直方图, 已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A.588 B.480 C.450 D.120 4 .(2013年高考江西卷(理))总体有编号为01,02,…,19,20的20个个体组成。利用下面 的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始 由左到右依次选取两个数字,则选出来的第5个个体的编号为 7816 6572 0802 6314 0702 4369 9728 0198 3204 9234 4935 8200 3623 4869 6938 7481 ()A.08 B.07 C.02 D.01 5.(2013年高考上海卷(理))盒子中装有编号为1,2,3,4,5,6,7,8,9的九个球,从中任意

高考数学统计测试题专题1

高考数学统计测试题专题1 2020.03 1,某工厂生产A、B、C三种不同型号的产品,产品数量这比依次为1600,1600,4800.现用分层抽样的方法抽出一个容量为N的样本,样本中 A种型号的产品共有16件,那么此样本的容量N=__________件. 2,在用样本估计总体分布的过程中,下列说法正确的是 ( ) A.总体容量越大,估计越精确 B.总体容量越小,估计越精确 C.样本容量越大,估计越精确 D.样本容量越小,估计越精确 3,我校高中生共有2700人,其中高一年级900人,高二年级1200人,高三 年级600人,现采取分层抽样法抽取容量为135的样本,那么高一、高二、 高三各年级抽取的人数分别为 ( ) A.45,75,15 B.45,45,45 C.30,90,15 D.45,60,30 4,某校期末考试后,为了分析该校高一年级1000名学生的学习成绩,从 中随机抽取了100名学生的成绩单,就这个问题来说,下面说法正确的 是﹙﹚ A.1000名学生是总体 B.每个学生是个体 C.100名学生的成绩是一个个体 D.样本的容量是100 5,某小礼堂有25排座位,每排有20个座位.一次心理讲座时礼堂中坐满 了学生,会后为了了解有关情况,留下了座位号是15的所有的25名学生 测试.这里运用的抽样方法是 ( ) A.抽签法 B.随机数表法 C.系统抽样法 D.分层抽样法

6,一个容量为n的样本,分成若干组,已知某组的频数和频率分别是40,0.125,则n=___. 7,某校500名学生中,O型血有200人,A型血有125人,B型血有125人,AB型血有50人,为了研究血型与色弱的关系,需从中抽取一个容量为20的样本.按照分层抽样方法抽取样本,各种血型的人分别多少?写出抽样过程. 8,下列两个变量之间的关系是相关关系的是 ( ) A.正方体的棱长和体积 B.单位圆中角的度数和所对弧长 C.单产为常数时,土地面积和总产量 D.日照时间与水稻的亩产量 9,某工厂生产的产品用传送带将其送入包装车间之前,质检员每隔5分钟从传送带某一位置取一件产品检测,则这种抽样方法是_____________. 10,抽样调查在抽取调查对象时 ( ) A.按一定的方法抽取 B.随意抽取 C.全部抽取 D.根据个人的爱好抽取 11,中央电视台动画城节目为了对本周的热心小观众给予奖励,要从已确定编号的一万名小观众中抽出十名幸运小观众.现采用系统抽样法抽取,其组容量为 ( ) A.10 B.100 C.1000 D.10000

高三文科数学统计概率汇总

高三文科数学统计概率汇总

————————————————————————————————作者:————————————————————————————————日期:

统计概率考点总结 【考点一】分层抽样 01、交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社 区做分层抽样调查。假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人。若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为() A、101 B、808 C、1212 D、2012 02、某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为280的 样本,则此样本中男生人数为____________. 03、一支田径运动队有男运动员56人,女运动员42人。现用分层抽样的方法抽取若干人,若抽取的男运 动员有8人,则抽取的女运动员有______人。 04、某单位有840名职工, 现采用系统抽样方法, 抽取42人做问卷调查, 将840人按1, 2, , 840随机 编号, 则抽取的42人中, 编号落入区间[481, 720]的人数为() A.11 B.12 C.13 D.14 05、将参加夏令营的600名学生编号为:001,002,……600,采用系统抽样方法抽取一个容量为50的样 本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495住在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为() A.26, 16, 8B.25,17,8 C.25,16,9 D.24,17,9 【考点二】频率分布直方图(估计各种特征数据) 01、从某小区抽取100户居民进行月用电量调查,发现其用电 量都在50到350度之间,频率分布直方图所示. (I)直方图中x的值为________; 100,250内的户数为_____. (II)在这些用户中,用电量落在区间[) 02、下图是样本容量为200的频率分布直方图。根据样本的频率分布直 方图估计,样本数据落在[6,10]内的频数为,数据落在(2, 10)内的概率约为

高考数学专题概率统计(小题)

1 十年真题节选第九部分:概率统计(小题) 1.(2011新课标)有3个兴趣小组,甲、乙两位同学各自参加其中一个小组,每位同学参加 各个小组的可能性相同,则这两位同学参加同一个兴趣小组的概率为( ) A .13 B .12 C .23 D .34 2.(2012新课标)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不 全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线112y x = +上,则这组样本数据的样本相关系数为 A .?1 B .0 C .12 D .1 3.(2013新课标1)从中任取个不同的数,则取出的个数之差的绝对值为的 概率是( ) A . B . C . D . 4.(2013新课标1)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部 分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是 A .简单随机抽样 B .按性别分层抽样 C .按学段分层抽样 D .系统抽样 5.(2014新课标1)4位同学各自在周六、周日两天中任选一天参加公益活动,则周六、周 日都有同学参加公益活动的概率为 A .18 B .38 C .58 D .78 6.(2016年全国I)某公司的班车在7:30,8:00,8:30发车,小明在7:50至8:30之间到达发车 站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是 A .13 B .12 C .23 D .34 7.(2017新课标Ⅰ)如图,正方形ABCD 内的图形来自中国古代的太极图, 正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对 称.在正方形内随机取一点,则此点取自黑色部分的概率是 A . 14 B .8π C .12 D .4π 1,2,3,4222121314 16

高考数学概率统计专题复习(专题训练)

高考数学《概率统计》复习 知识结构 1.注意:互斥事件不一定是对立事件,但对立事件一定是互斥事件。 2. (1)试验的所有可能结果为有限个,每次试验只出现其中的一个结果;(2)每一个试验结果 出现的可能性相等。(3)古典概型的概率公式:P(A)=事件A包含的可能结果数 试验的所有可能结果数 = m n. 3.几何概型:如果每个事件发生的概率只与构成该事件区域的长度(或面积或体积)成比例,则称这样的概率模型为几何概型。几何概型的概率公式:设某一事件(也是S中的某一区域), S包含A,它的量度大小(长度、面积或体积)为 ()A μ ,考虑到均匀分布性,事件A发生的 概率 () () () A P A S μ μ = . 4.统计学中的几个基本概念:

(1)样本平均数:样本中所有个体的平均数叫做样本平均数。 (2)平均数计算公式:一般地,如果有n 个数n x x x ,,,21???,则n 21n x x x x +???++=. (3)加权平均数:如果n 个数中,出现次,出现次,…,出现次 (这里n f f f k =+???++21),那么,根据平均数的定义,这n 个数的平均数可以表示为n 2211n n f x f x f x x +???++=,这样求得的平均数叫做加权平均数,其中k f f f ,,,21???叫做权。 (4)众数:在一组数据中,出现次数最多的数据叫做这组数据的众数。 (5)中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数。 (6)方差:在一组数据n x x x ,,,21???中,各数据与它们的平均数的差的平方的平均数,叫做这组数据的方差,通常用“s 2”表示。方差是用来衡量一组数据波动大小的量,方差越大,表明这组数据偏离平均数越大,即波动越大,数据越不稳定;反之,方差越小,表明这组数据分布比较集中,各数据偏离平均数越小,即波动越小,数据越稳定。 (7)方差计算公式:])()()[(1222212x x x x x x n s n -+???+-+-=. 简化计算公式,有:])[(122222212x n x x x n s n -+???++= 也可写成22222212])[(1x x x x n s n -+???++=. 此公式的记忆方法是:方差等于原数据平方的平均数减去平均数的平方。 (8)标准差:方差的算数平方根叫做这组数据的标准差,用“s ”表示,即 ])()()[(1222212x x x x x x n s s n -+???+-+-== (9)如果一组数据n x x x x ???、 、、321的平均数为x ,方差为2s ,标准差为s , 则数据b ax b ax b ax b ax n +???+++、 、、321的平均数为b x a +,方差为22s a ,标准差为as . 5.抽样方法:简单随机抽样、系统抽样、分层抽样。 (1)简单随机抽样:设一个总体的个体数为N ,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。如从含有N 个个体的总体中抽取一个容量为n 的样本时,每次抽取一个个体时任一个体被抽到的概率为N 1;在1x 1f 2x 2f k x k f x x

相关主题
文本预览
相关文档 最新文档