当前位置:文档之家› 北京市高中数学 统计案例课后练习 新人教A版选修23

北京市高中数学 统计案例课后练习 新人教A版选修23

北京市高中数学 统计案例课后练习 新人教A版选修23
北京市高中数学 统计案例课后练习 新人教A版选修23

专题统计案例课后练习

题一:为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如下2×2列联表:

理科文科合计

男131023

女72027

合计203050

根据表中数据,得到χ2=50×(13×20-10×7)2

23×27×20×30

≈4.844,则认为选修文科与性别有关系出错

的可能性约为________.

题二:在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且在犯错误概率不超过0.01的前提下认为这个结论是成立的,则下列说法中正确的是( ) A.100个吸烟者中至少有99人患有肺癌

B.1个人吸烟,那么这人有99%的概率患有肺癌

C.在100个吸烟者中一定有患肺癌的人

D.在100个吸烟者中可能一个患肺癌的人也没有

题三:在一次对性别与说谎是否相关的调查中,得到如下数据:

说谎不说谎合计

男6713

女8917

合计141630

根据表中数据,得到如下结论中正确的一项是( )

A.在此次调查中有95%的把握认为是否说谎与性别有关

B.在此次调查中有99%的把握认为是否说谎与性别有关

C.在此次调查中有99.5%的把握认为是否说谎与性别有关

D.在此次调查中没有充分的证据显示说谎与性别有关

题四:通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:

男女合计

爱好4020[

源:

Z+x

60

x+k .Co m]

不爱好 20 30 50 合计

60

50

110

由χ2=

n (n 11n 22-n 12n 21)

2

n 1+n 2+n +1n +2

算得,

χ2

=110×(40×30-20×20)2

60×50×60×50

≈7.8.

根据具体数据算出的χ2

,得到的正确结论是( )

A .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”

B .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”

C .有99%以上的把握认为“爱好该项运动与性别有关”

D .有99%以上的把握认为“爱好该项运动与性别无关”

题五:已知数组(x 1,y 1),(x 2,y 2),…,(x 10,y 10)满足线性回归方程y ^=b ^x +a ^

,则“(x 0,y 0)满足线性回归方程y ^=b ^x +a ^

”是“x 0=1210

10

y y y ++…+,y 0=

1210

10

x x x ++…+”的( )

A .充分不必要条件

B .必要不充分条件

C .充要条件

D .既不充分也不必要条件

题六:某考察团对全国10大城市的居民人均工资收入x (万元/年)与居民人均消费y (万元/年)进行统计调查,发现y 与x 具有相关关系,且y 对x 的回归方程为y ^

=0.66x +1.562.若某城市居民人均消费为7.675(万元/年),估计该城市人均消费占人均工资收入的百分比约为________.

题七:某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:

该兴趣小组确定的研究方案是:先从这六组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验.

(1)求选取的2组数据恰好是相邻两个月的概率;

(2)若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出y 关于x 的线性回归方程y ^

=bx +a ;

(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想.

参考公式:b =1

1

2

222

1

1

()()

,()n n

i i

i

i

i i n

n

i

i

i i x y nx y x x y y b a y bx x

nx

x

x ====---=

=

=---∑∑∑∑

题八:已知x ,y 的一组数据如下表:

x 1 3 6 7 8 y

1

2

3

4

5

(1)从x ,y 中各取一个数,求x +y ≥10的概率;

(2)对于表中数据,甲、乙两同学给出的拟合直线分别为y =13x +1与y =12x +1

2,试利用“最小

平方法(也称最小二乘法)”判断哪条直线拟合程度更好.

题九:已知x ,y 之间的数据如表所示,则回归直线过点________.

x 1 2 3 4 5 y

1.2

1.8

2.5

3.2

3.8

题十:在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =1

2x +1上,则这组样本数据的样本相关系数

为( )

A .-1

B .0 C.1

2

D .1

题十一: 有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:

优秀 非优秀 总计 甲班 10

b

乙班 c 30

总计

105

已知在全部105人中随机抽取1人,成绩优秀的概率为7,则下列说法正确的是( )

A .列联表中c 的值为30,b 的值为35

B .列联表中c 的值为15,b 的值为50

C .根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”

D .根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系” 题十二: 某网站就“民众是否支持加大修建城市地下排水设施的资金投入”进行投票.按照北京暴雨前后两个时间收集有效投票,暴雨后的投票收集了50份,暴雨前的投票也收集了50份,所得统计结果如下表:

支持 不支持 总计 北京暴雨后 x

y

50 北京暴雨前 20

30

50 总计

A B

100

已知工作人员从所有投票中任取一个,取到“不支持投入”的投票的概率为2

5.

(1)求列联表中的数据x ,y ,A ,B 的值;

(2)绘制条形统计图,通过图形判断本次暴雨是否影响到民众对加大修建城市地下排水设施的投入的态度?

(3)能够有多大把握认为北京暴雨对民众是否赞成加大对修建城市地下排水设施的投入有关? 附:K 2

n (ad -bc )2

(a +b

)(c +d )(a +c

)(b +d )

P (K 2≤k )

0.15 0.10 0.05 0.025 0.010 0.005 0.001 k

2.072

2.706

3.841

5.024

6.635

7.879

10.828

题十三: 在研究色盲与性别的关系调查中,调查了男性480人,其中有38人患色盲,调查的520名女性中,有6人患色盲.

(1)根据以上数据建立一个2×2列联表;

(2)若认为“性别与患色盲有关系”,求出错的概率.

题十四: 某班主任对全班50名学生进行了作业量多少的调查.数据如下表:

认为作业多

认为作业不多

总计 喜欢玩游戏 18 9 不喜欢玩游戏

8 15 总计

(1)请完善上表中所缺的有关数据;

(2)试通过计算说明能否认为喜欢玩游戏与作业量的多少有关系?

附:χ2

=n (n 11n 22-n 12n 21)2

n 1+n 2+n +1n +2

.

题十五:某学生对其亲属30人的饮食习惯进行了一次调查,并用茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主.)

(1)根据茎叶图,帮助这位学生说明其亲属30人的饮食习惯; (2)根据以上数据完成下列2×2的列联表:

主食蔬菜

主食肉类

合计 50岁以下 50岁以上 合计

(3)能否有99%的把握认为其亲属的饮食习惯与年龄有关,并写出简要分析.

题十六: 通过随机询问某校110名高中学生在购买食物时是否看营养说明,得到如下的列联表:

男 女 总计 看营养说明

50

30

80

不看营养说明

10 20 30 总计

60

50

110

(1)从这50名女生中按是否看营养说明采取分层抽样的方法抽取一个容量为5的样本,则样本中看与不看营养说明的女生各有多少名?

(2)从(1)中的5名女生样本中随机选取两名作深度访谈,求选到看与不看营养说明的女生各一名的概率;

(3)根据以上列联表,问有多大把握认为“性别与在购买食物时是否看营养说明”有关? 参考公式:K 2

=n (ad -bc )2(a +b

)(c +d )(a +c

)(b +d )

,其中n =a +b +c +d .

参考数据:

P (K 2≥k 0)

0.10 0.05 0.025 0.010 0.005 k 0

2.706

3.841

5.024

6.635

7.879

题十七:某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,所得数据如下表:

x 6 8 10 12 y

2

3

5

6

则y 对x A.y ^

=2.3x -0.7 B.y ^

=2.3x +0.7 C.y ^

=0.7x -2.3

D.y ^

=0.7x +2.3

题十八:某种产品的广告费支出x 与销售额y (单位:万元)之间有如下对应数据:

x 2 4 5 6 8 y

30

40

60

50

70

(1)求回归直线方程;

(2)试预测广告费支出为10万元时,销售额多大?

(3)在已有的五组数据中任意抽取两组,求至少有一组数据其预测值与实际值之差的绝对值不超过5的概率.( 参考数据:∑i =15

x 2

i =145,∑i =15

y 2

i =13 500,∑i =1

5

x i y i =1 380 )

专题 统计案例

课后练习参考答案

题一: 5%

详解: 因为χ2

=4.844>3.841,所以有95%的把握认为选修文科与性别有关系.

故认为选修文科与性别有关系出错的可能性约为5%.

题二: D.

详解:

统计的结果只是说明事件发生可能性的大小,具体到一个个体不一定发生. 题三: D. 详解:

由于K 2

=30×(6×9-7×8)2

13×17×14×16

≈0.0024,由于K 2

很小,因此,在此次调查中没有充分的证据显示

说谎与性别有关.故选D.

题四: C.

详解:

根据独立性检验的定义,由χ2

≈7.8>6.635可知我们在犯错误的概率不超过0.01的前提下,即有99%以上的把握认为“爱好该项运动与性别有关”,故选C.

题五: B.

详解: x 0,y 0为这10组数据的平均值,又因为线性回归方程y ^=b ^x +a ^

必过样本中心点(x ,y ),因此(x ,y )一定满足线性回归方程,但满足线性回归方程的除了(x ,y )外,可能还有其他样本点.

题六: 83%.

详解:因为当y ^

=7.675时,x =7.675-1.5620.66≈9.262,

则7.6759.262

≈0.829≈83%. 题七: (1) 13. (2) y ^=

187x -30

7

. (3)该小组所得线性回归方程是理想的. 详解: (1)设抽到相邻两个月的数据为事件A .因为从6组数据中选取2组数据共有15种情况,每种情况都是等可能出现的,其中抽到相邻两个月的数据的情况有5种,所以P (A )=515=1

3

.

(2)由数据求得x =11,y =24,

由公式求得b =187,再由a =y -b x =-30

7,

得y 关于x 的线性回归方程为y ^=187x -30

7.

(3)当x =10时,y ^=1507,|150

7-22|<2;

同样,当x =6时,y ^=787,|78

7-12|<2,

所以,该小组所得线性回归方程是理想的.

题八: (1)

925. (2) y =12x +1

2

的拟合程度更好. 详解:(1)从x ,y 中各取一个数组成数对(x ,y ),共有25对,其中满足x +y ≥10的有(6,4),(6,5),(7,3),(7,4),(7,5),(8,2),(8,3),(8,4),(8,5),共9对.故所求概率P =

9

25

. (2)用y =13x +1作为拟合直线时,所得y 值与y 的实际值的差的平方和为S 1=? ??

??43-12+(2-2)2

+(3

-3)2

+? ????103-42+? ????113-52=73

.

用y =12x +12作为拟合直线时,所得y 值与y 的实际值的差的平方和为S 2=(1-1)2+(2-2)2

+? ??

?

?72-32

+(4-4)2

+? ????92-52=12

.

∵S 2

2

的拟合程度更好.

题九: (3,2.5).

详解:

x =3,y =2.5,

∴样本点中心为(3,2.5),回归直线过样本点中心.

题十: D.

详解:因为所有的点都在直线上,所以它就是确定的函数关系,所以相关系数为1.

题十一: C.

详解: 由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c =20,b =45,选项A 、B 错误.根据列联表中的数据,得到K 2

=105×(10×30-20×45)

2

55×50×30×75

≈6.109>3.841,因此有

95%的把握认为“成绩与班级有关系”.

题十二: (1) y =10,B =40,x =40,A =60.

(2)由图可以看出暴雨影响到民众对加大修建城市地下排水设施的投入的态度.

(3)至少有99.9%的把握认为北京暴雨对民众是否赞成加大对修建城市地下排水设施的投入有关. 详解:(1)设“从所有投票中抽取一个,取到不支持投入的投票”为事件A ,

由已知得P (A )=

y +30100

=2

5

,所以y =10,B =40,x =40,A =60. (2)由(1)知北京暴雨后支持率为4050=4

5,

不支持率为1-45=1

5,

北京暴雨前支持率为2050=2

5,

不支持率为1-25=3

5

.

条形统计图如图所示,由图可以看出暴雨影响到民众对加大修建城市地下排水设施的投入的态度.

(3)K 2

=100(30×40-20×10)2

50×50×40×60=1000 00050×20×60=50

3

≈16.78>10.828.

故至少有99.9%的把握认为北京暴雨对民众是否赞成加大对修建城市地下排水设施的投入有关.

题十三: (1)2×2列联表如下:

患色盲 不患色盲 总计

男 38 442 女 6 514 520 总计

44

956

1 000

(2) 0.1%.

详解:(1)2×2列联表如下:

患色盲 不患色盲 总计 男 38 442 480 女 6 514 520 总计

44

956

1 000

(2)假设H 0:“性别与患色盲没有关系”,根据(1)中2×2列联表中数据,可求得K 2

=1 000×(38×514-6×442

)

2

480×520×44×956

≈27.14,又P (K 2

≥10.828)=0.001,即H 0成立的概率不超过0.001,

故若认为“性别与患色盲有关系”,则出错的概率为0.1%.

题十四: (1)

认为作业多

认为作业不多

总计 喜欢玩游戏 18 9 27 不喜欢玩游戏

8 15 23 总计

26

24

50

(2)有95%把握认为喜欢玩游戏与作业量的多少有关系.

详解:(1)

认为作业多

认为作业不多

总计 喜欢玩游戏 18 9 27 不喜欢玩游戏

8 15 23 总计

26

24

50

(2)将表中的数据代入公式

χ2

=n (n 11n 22-n 12n 21)2

n 1+n 2+n +1n +2

得到

χ2

50×(18×15-8×9)2

26×24×27×23

≈5.059>3.841,

所以有95%把握认为喜欢玩游戏与作业量的多少有关系.

题十五: (1)30位亲属中50岁以上的人多以食蔬菜为主,50岁以下的人多以食肉为主.

(2)

主食蔬菜

主食肉类

合计 50岁以下 4 8 12 50岁以上 16 2 18 合计

20

10

30

(3)有99%的把握认为亲属的饮食习惯与年龄有关.

详解: (1)30位亲属中50岁以上的人多以食蔬菜为主,50岁以下的人多以食肉为主.

(2)

主食蔬菜

主食肉类

合计 50岁以下 4 8 12 50岁以上 16 2 18 合计

20

10

30

(3)K 2

=30(8-128)2

12×18×20×10=30×120×120

12×18×20×10=10>6.635,有99%的把握认为亲属的饮食习惯与年龄

有关.

题十六: (1)看营养说明的女生有3名,样本中不看营养说明的女生2名. (2) 35

.

(3)有99%的把握认为“性别与在购买食物时是否看营养说明”有关.

详解:(1)根据分层抽样可得:样本中看营养说明的女生有5

50×30=3名,样本中不看营养说明的女

生有5

50

×20=2名.

(2)记样本中看营养说明的3名女生为a 1,a 2,a 3,不看营养说明的2名女生为b 1,b 2,从这5名女生中随机选取2名,共有10个等可能的基本事件:a 1,a 2;a 1,a 3;a 1,b 1;a 1,b 2;a 2,a 3;a 2,

b 1;a 2,b 2;a 3,b 1;a 3,b 2;b 1,b 2.

其中事件A “选到看与不看营养说明的女生各一名”包含了6个基本事件:a 1,b 1;a 1,b 2;a 2,

b 1;a 2,b 2;a 3,b 1;a 3,b 2.

所以所求的概率为P (A )=610=3

5

.

(3)根据题中的列联表得K 2

=110×(50×20-30×10)2

80×30×60×50=539

72

≈7.486.

由P (K 2≥6.635)=0.010,P (K 2

≥7.879)=0.005可知,有99%的把握认为“性别与在购买食物时是

否看营养说明”有关. 题十七: C.

详解:∵∑i =1

4

x i y i =6×2+8×3+10×5+12×6=158,

x =

6+8+10+124=9,y =2+3+5+6

4

=4.

∴b ^

=158-4×9×436+64+100+144-4×81=0.7,

a ^

=4-0.7×9=-2.3.

故线性回归直线方程为y ^

=0.7x -2.3.

题十八: (1)回归直线方程为y ^

=6.5x +17.5. (2) 82.5万元. (3)

910

. 详解:(1)x =2+4+5+6+85=25

5

=5,

y =

30+40+60+50+705=250

5

=50,

又已知∑i =1

5

x 2

i =145,∑i =1

5

x i y i =1 380,

于是可得:b ^

∑i =1

5

x i y i -5x y

∑i =1

5

x 2i -5x 2

=1380-5×5×50145-5×5×5

=6.5, a ^

=y -b ^

x =50-6.5×5=17.5,

因此,所求回归直线方程为y ^

=6.5x +17.5.

(2)根据上面求得的回归直线方程,当广告费支出为10万元时,y ^

=6.5×10+17.5=82.5(万元),

即这种产品的销售收入大约为82.5万元. (3)

x 2 4 5 6 8 y

30 40 60 50 70 y ^

30.5

43.5

50

56.5

69.5

基本事件:(30,40),(30,60),(30,50),(30,70),(40,60),(40,50),(40,70),(60,50),(60,70),(50,70)共10个.

两组数据其预测值与实际值之差的绝对值都超过5有(60,50),

所以至少有一组数据其预测值与实际值之差的绝对值不超过5的概率为1-1

10

9

10

.

统计与统计案例真题与解析

统计与统计案例 A 级 基础 一、选择题 1.某校为了解学生学习的情况,采用分层抽样的方法从高一1 000人、高二1 200人、高三n 人中抽取81人进行问卷调查,已知高二被抽取的人数为30,那么n =( ) A .860 B .720 C .1 020 D .1 040 2.为规范学校办学,某省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应是( ) A .13 B .19 C .20 D .51 3.“关注夕阳、爱老敬老”——某爱心协会从2013年开始每年向敬老院捐赠物资和现金,下表记录了第x 年(2013年是第一年)与捐赠的现金y (单位:万元)的对应数据,由此表中的数据得到了y 关于x 的线性回归方程y ^ =mx +0.35,则预测2019年捐赠的现金大约是( ) A.5万元 C .5.25万元 D .5.5万元 4.如图所示的茎叶图记录了甲乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )

A.3,5 B.5,5 C.3,7 D.5,7 5.(2019·衡水中学检测)某超市从2019年甲、乙两种酸奶的日销售量(单位:箱)的数据中分别随机抽取100个,并按(0,10],(10,20],(20,30],(30,40],(40,50]分组,得到频率分布直方图如下: 记甲种酸奶与乙种酸奶的日销售量(单位:箱)的方差分别为s21,s22,则频率分布直方图(甲)中的a的值及s21与s22的大小关系分别是() A.a=0.015,s21s22 C.a=0.015,s21>s22D.a=0.15,s21

高中数学 专题 统计与统计案例

一、选择题 1.利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽出一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽到产品的最大编号为( ) A .73 B .78 C .77 D .76 解析:样本的分段间隔为80 16=5,所以13号在第三组,则最大的编号为13+(16-3)×5 =78.故选B. 答案:B 2.某课外小组的同学们在社会实践活动中调查了20户家庭某月的用电量如下表所示: 则这20A .180,170 B .160,180 C .160,170 D .180,160 解析:用电量为180度的家庭最多,有8户,故这20户家庭该月用电量的众数是180,排除B ,C ;将用电量按从小到大的顺序排列后,处于最中间位置的两个数是160,180,故这20户家庭该月用电量的中位数是170.故选A. 答案:A 3.(2017·高考全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图,根据该折线图,下列结论错误的是( ) A .月接待游客量逐月增加 B .年接待游客量逐年增加 C .各年的月接待游客量高峰期大致在7,8月 D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳

解析:根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都在减少,所以A 错误.由图可知,B 、C 、D 正确. 答案:A 4.(2018·宝鸡质检)对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为( ) A .5 B .7 C .10 D .50 解析:根据题中的频率分布直方图可知,三等品的频率为1-(0.050 0+0.062 5+0.037 5)×5=0.25,因此该样本中三等品的件数为200×0.25=50. 答案:D 5.(2018·兰州模拟)已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据: 根据表中提供的全部数据,用最小二乘法得出y 与x 的线性回归方程为y ^ =6.5x +17.5,则表中m 的值为( ) A .45 B .50 C .55 D .60 解析:∵x =2+4+5+6+8 5=5, y = 30+40+50+m +705=190+m 5 , ∴当x =5时,y =6.5×5+17.5=50, ∴190+m 5=50,解得m =60. 答案:D

高中数学专题――概率统计专题.

专题二概率统计专题 【命题趋向】概率与统计是高中数学的重要学习内容,它是一种处理或然问题的方法,在工农业生产和社会生活中有着广泛的应用,渗透到社会的方方面面,概率与统计的基础知识成为每个公民的必备常识.概率与统计的引入,拓广了应用问题取材的范围,概率的计算、离散型随机变量的分布列和数学期望的计算及应用都是考查应用意识的良好素材.在高考试卷中,概率与统计的内容每年都有所涉及,以解答题形式出现的试题常常设计成包含离散型随机变量的分布列与期望、统计图表的识别等知识为主的综合题,以考生比较熟悉的实际应用问题为载体,以排列组合和概率统计等基础知识为工具,考查对概率事件的识别及概率计算.解答概率统计试题时要注意分类与整合、化归与转化、或然与必然思想的运用.由于中学数学中所学习的概率与统计内容是最基础的,高考对这一部分内容的考查注重考查基础知识和基本方法.该部分在高考试卷中,一般是2—3个小题和一个解答题. 【考点透析】概率统计的考点主要有:概率与统计包括随机事件,等可能性事件的概率,互斥事件有一个发生的概率,古典概型,几何概型,条件概率,独立重复试验与二项分布,超几何分布,离散型随机变量的分布列,离散型随机变量的期望和方差,抽样方法,总体分布的估计,正态分布,线性回归等.【例题解析】 题型1 抽样方法 -)中,在公证部门监督下按照随机抽取的方法确【例1】在1000个有机会中奖的号码(编号为000999 定后两位数为的号码为中奖号码,该抽样运用的抽样方法是() A.简单随机抽样B.系统抽样C.分层抽样D.以上均不对 分析:实际“间隔距离相等”的抽取,属于系统抽样. 解析:题中运用了系统抽样的方法采确定中奖号码,中奖号码依次为:088,188,288,388,488,588,688,788,888,988.答案B. 点评:关于系统抽样要注意如下几个问题:(1)系统抽样是将总体分成均衡几个部分,然按照预先定出的规则从每一部分抽取一个个体,得到所需要的样本的一种抽样方法.(2)系统抽样的步骤:①将总体中的个体随机编号;②将编号分段;③在第一段中用简单随机抽样确定起始的个体编号;④按事先研究的规则抽取样本.(3)适用范围:个体数较多的总体. 例2(2008年高考广东卷理3)某校共有学生2000名,各年级男、女生人数如表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为() A.24B.18C.16D.12 Array 分析:根据给出的概率先求出x的值,这样就可以知道三年级的学生人数,问题就解决了. x=?=,这样一年级和二年级学生的解析:C 二年级女生占全校学生总数的19%,即20000.19380 +++=,三年级学生有500人,用分层抽样抽取的三年级学生应是总数是3733773803701500 64 50016 ?=.答案C. 2000 点评:本题考查概率统计最基础的知识,还涉及到一点分析问题的能力和运算能力,题目以抽样的等可能性为出发点考查随机抽样和分层抽样的知识. 例3.(2009江苏泰州期末第2题)一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系, 2500,3500(元)月收入段应抽要从这10000人中再用分层抽样方法抽出100人作进一步调查,则在[) 出人.

高中数学概率统计专题

高中数学概率统计专题文档编制序号:[KKIDT-LLE0828-LLETD298-POI08]

高三文科数学:概率与统计专题 一、选择题: 1.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是 A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数2.有3个兴趣小组,甲、乙两位同学各自参加其中一个小组,每位同学参加各个小组的可能性相同,则这两位同学参加同一个兴趣小组的概率为 A.1 3 B. 1 2 C. 2 3 D. 3 4 3、在一组样本数据(x1,y1),(x2,y2),…,(x n,y n)(n≥2,x1,x2,…,x n不全相 等)的散点图中,若所有样本点(x i,y i)(i=1,2,…,n)都在直线y=1 2x+1上,则这组样本 数据的样本相关系数为 (A)-1 (B)0 (C)1 2(D)1 4.如果3个整数可作为一个直角三角形三条边的边长,则称这3个数为一组勾股数,从1,2,3,4,5中任取3个不同的数,则3个数构成一组勾股数的概率为 (A)10 3 (B) 1 5 (C) 1 10 (D) 1 20 5.如图,正方形ABCD内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,学科&网则此点取自黑色部分的概率是 A.1 4B. π 8 C.1 2 D.π4

6.如图所示的茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,则甲的平均成绩超过乙的平均成绩的概率是( ) 二、填空题: 7、从1,2,3,4,5中任意取出两个不同的数,其和为5的概率是_______。 8、将2本不同的数学书和1本语文书在书架上随机排成一行,则2本数学书相邻的概率为_____. 9.某单位为了了解用电量y (度)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温,制作了对照表: 方程y ^=b ^x +a ^由表中数据得回归直线 中的b ^=-2,预测当气温为-4 ℃时,用电量约为________度. 三、解答题 10.某花店每天以每枝5元的价格从农场购进若干枝玫瑰花,然后以每枝10元的价格出售。如果当天卖不完,剩下的玫瑰花做垃圾处理。 (Ⅰ)若花店一天购进17枝玫瑰花,求当天的利润y (单位:元)关于当天需求量n (单位:枝,n ∈N )的函数解析式。 (Ⅱ)花店记录了100天玫瑰花的日需求量(单位:枝),整理得下表: 日需求量 n 14 15 16 17 18 19 20 频数 10 20 16 16 15 13 10 (1)假设花店在这100天内每天购进17枝玫瑰花,求这100天的日利润(单位:元)的平均数; (2)若花店一天购进17枝玫瑰花,以100天记录的各需求量的频率作为各需求量 气温(℃) 18 13 10 -1 用电量(度) 24 34 38 64

高中数学统计与概率知识点(原稿)

高中数学统计与概率知识点(文) 第一部分:统计 一、什么是众数。 一组数据中出现次数最多的那个数据,叫做这组数据的众数。 众数的特点。 ①众数在一组数据中出现的次数最多;②众数反映了一组数据的集中趋势,当众数出现的次数越多,它就越能代表这组数据的整体状况,并且它能比较直观地了解到一组数据的大致情况。但是,当一组数据大小不同,差异又很大时,就很难判断众数的准确值了。此外,当一组数据的那个众数出现的次数不具明显优势时,用它来反映一组数据的典型水平是不大可靠的。 3.众数与平均数的区别。 众数表示一组数据中出现次数最多的那个数据;平均数是一组数据中表示平均每份的数量。 二、.中位数的概念。 一组数据按大小顺序排列,位于最中间的一个数据(当有偶数个数据时,为最中间两个数据的平均数)叫做这组数据的中位数。 三 .众数、中位数及平均数的求法。 ①众数由所给数据可直接求出;②求中位数时,首先要先排序(从小到大或从大到小),然后根据数据的个数,当数据为奇数个时,最中间的一个数就是中位数;当数据为偶数个时,最中间两个数的平均数就是中位数。③求平均数时,就用各数据的总和除以数据的个数,得数就是这组数据的平均数。 四、中位数与众数的特点。 ⑴中位数是一组数据中唯一的,可能是这组数据中的数据,也可能不是这组数据中的数据; ⑵求中位数时,先将数据有小到大顺序排列,若这组数据是奇数个,则中间的数据是中位数;若这组数据是偶数个时,则中间的两个数据的平均数是中位数; ⑶中位数的单位与数据的单位相同; ⑷众数考察的是一组数据中出现的频数; ⑸众数的大小只与这组数的个别数据有关,它一定是一组数据中的某个数据,其单位与数据的单位相同; (6)众数可能是一个或多个甚至没有; (7)平均数、众数和中位数都是描述一组数据集中趋势的量。

专题突破练20 统计与统计案例

专题突破练20 统计与统计案例 1. (2020吉林辽源高三检测,18)某城市在进行创建文明城市的活动中,为了解居民对“创建文明城市”的满意程度,组织居民给活动打分(分数为整数.满分为100分).从中随机抽取一个容量为120的样本.发现所有数据均在[40,100]内.现将这些分数分成以下6组并画出了样本的频率分布直方图,但不小心污损了部分图形,如图所示.观察图形,回答下列问题: (1)算出第三组[60,70)的频数,并补全频率分布直方图; (2)请根据频率分布直方图,估计样本的众数、中位数和平均数.(每组数据以区间的中点值为代表) 2.下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图. 为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,…,17)建立模型①;y ^ =-30.4+13.5t ;根据2010年至2016年的数据(时间变量t 的值依次为1,2,…,7)建立模型②:y ^ =99+17.5t. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.

3.(2020河南郑州高三检测,19)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图: (1)根据茎叶图判断哪种生产方式的效率更高?并说明理由; (2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m 的工人数填入下面的列联表: (3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异? 附:K2=n(ad-bc)2 (a+b)(c+d)(a+c)(b+d) ,其中n=a+b+c+d.

高中数学统计案例分析及知识点归纳总结

统计 一、知识点归纳 1、抽样方法: ①简单随机抽样(总体个数较少) ②系统抽样(总体个数较多) ③分层抽样(总体中差异明显) 注意:在N 个个体的总体中抽取出n 个个体组成样本,每个个体被抽到的机会(概率)均为N n 。 2、总体分布的估计: ⑴一表二图: ①频率分布表——数据详实 ②频率分布直方图——分布直观 ③频率分布折线图——便于观察总体分布趋势 注:总体分布的密度曲线与横轴围成的面积为1。 ⑵茎叶图: ①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众位数等。 ②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写。 3、总体特征数的估计: ⑴平均数:n x x x x x n ++++= 321; 取值为n x x x ,,,21 的频率分别为n p p p ,,,21 ,则其平均数为n n p x p x p x +++ 2211; 注意:频率分布表计算平均数要取组中值。 ⑵方差与标准差:一组样本数据n x x x ,,,21 方差:2 1 2)(1 ∑=-= n i i x x n s ; 标准差:2 1 )(1∑=-= n i i x x n s 注:方差与标准差越小,说明样本数据越稳定。 平均数反映数据总体水平;方差与标准差反映数据的稳定水平。 ⑶线性回归方程 ①变量之间的两类关系:函数关系与相关关系; ②制作散点图,判断线性相关关系 ③线性回归方程:a bx y +=∧ (最小二乘法) 1 221n i i i n i i x y nx y b x nx a y bx ==? -? ?=??-??=-??∑∑ 注意:线性回归直线经过定点),(y x 。

概率统计-历届全国高中数学联赛真题专题分类汇编

概率统计 1、(2009一试8)某车站每天8 00~900∶∶,900~1000∶∶都恰有一辆客车到站,但到站的时刻是随机的,且两者到站的时间是相互独立的,其规律为 一旅客820∶【答案】27 【解析】旅客候车的分布列为 候车时间的数学期望为10305070902723361218 ?+?+?+?+?= 2、(2010一试6)两人轮流投掷骰子,每人每次投掷两颗,第一个使两颗骰子点数和大于6者为胜,否则轮由另一人投掷.先投掷人的获胜概率是 . 【答案】 12 17 3、(2012一试8)某情报站有,,,A B C D 四种互不相同的密码,每周使用其中的一种密码,且每周都是从上周未使用的三种密码中等可能地随机选用一种.设第1周使用A种密码,那么第7周也使用A种密码的概率是.(用最简分数表示) 【答案】 61 243 【解析】用k P 表示第k 周用 A 种密码的概率,则第k 周末用A 种密码的概率为 1k P -.于是,有11(1),3k k P P k N *+=-∈,即1111()434k k P P +-=--由11P =知,14k P ? ?-???? 是首项为34,公

比为13-的等比数列.所以1131()443k k P --=-,即1311()434k k P -=-+,故761243 P = 4、(2014一试8)设D C B A ,,,是空间四个不共面的点,以 2 1 的概率在每对点之间连一条边,任意两点之间是否连边是相互独立的,则B A ,可用(一条边或者若干条边组成的)空间折线连接的概率是__________. 【答案】 3 4 2221219B C D -?-=点相连,且与,中至少一点相连,这样的情况数为()() 22(3)AB AD DB 无边,也无CD 边,此时AC,CB 相连有2种情况,,相连也有2种情况, ,,,,AC CB AD DB A B 但是其中均相连的情况被重复了一次,故可用折线连接的情况数为 222+2-1=7. 483++==.644以上三类情况数的总和为329748,故A,B 可用折线连接的概率为 5、(2015一试5)在正方体中随机取三条棱,它们两两异面的概率为. 【答案】 2 55 【解析】设正方体为ABCD-EFGH ,它共有12条棱,从中任意选出3条棱的方法共有3 12C =220种. 下面考虑使3条棱两两异面的取法数,由于正方体的棱共确定3个互不平行的方向(即AB 、AD 、AE 的方向),具有相同方向的4条棱两两共面,因此取出的3条棱必属于3个不同的方向.可先取定AB 方向的棱,这有4种取法.不妨设取的棱就是AB ,则AD 方向只能取棱EH 或棱FG ,共2种可能,当AD 方向取棱是EH 或FG 时,AE 方向取棱分别只能是CG 或DH. 由上可知,3条棱两两异面的取法数为4×2=8,故所求的概率为82 22055 =.

(最全)高中数学概率统计知识点总结

概率与统计 一、普通的众数、平均数、中位数及方差 1、 众数:一组数据中,出现次数最多的数。 2、平均数:①、常规平均数:12n x x x x n ++???+= ②、加权平均数:112212n n n x x x x ωωωωωω++???+=++???+ 3、中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数。 4、方差:2222121 [()()()]n s x x x x x x n = -+-+???+- 二、频率直方分布图下的频率 1、频率 =小长方形面积:f S y d ==?距;频率=频数/总数 2、频率之和:121n f f f ++???+=;同时 121n S S S ++???+=; 三、频率直方分布图下的众数、平均数、中位数及方差 1、众数:最高小矩形底边的中点。 2、平均数: 112233n n x x f x f x f x f =+++???+ 112233n n x x S x S x S x S =+++???+ 3、中位数:从左到右或者从右到左累加,面积等于0.5时x 的值。 4、方差:22221122()()()n n s x x f x x f x x f =-+-+???+- 四、线性回归直线方程:???y bx a =+ 其中:1 1 2 22 1 1 ()() ?() n n i i i i i i n n i i i i x x y y x y nxy b x x x nx ====---∑∑== --∑∑ , ??a y bx =- 1、线性回归直线方程必过样本中心(,)x y ; 2、?0:b >正相关;?0:b <负相关。 3、线性回归直线方程:???y bx a =+的斜率?b 中,两个公式中分子、分母对应也相等;中间可以推导得到。 五、回归分析 1、残差:??i i i e y y =-(残差=真实值—预报值)。分析:?i e 越小越好; 2、残差平方和:21?()n i i i y y =-∑, 分析:①意义:越小越好; ②计算:222211221 ????()()()()n i i n n i y y y y y y y y =-=-+-+???+-∑ 3、拟合度(相关指数):221 2 1 ?()1() n i i i n i i y y R y y ==-∑=- -∑,分析:①.(]20,1R ∈的常数; ②.越大拟合度越高; 4、相关系数 :()() n n i i i i x x y y x y nx y r ---?∑∑= = 分析:①.[r ∈-的常数; ②.0:r >正相关;0:r <负相关 ③.[0,0.25]r ∈;相关性很弱; (0.25,0.75)r ∈;相关性一般; [0.75,1]r ∈;相关性很强; 六、独立性检验 1、2×2列联表: 2、独立性检验公式 ①.2 2() ()()()() n ad bc k a b c d a c b d -= ++++ ②.犯错误上界P 对照表 3、独立性检验步骤

2021届高三新题数学9月(适用新高考)专题二十 统计与统计案例(原卷版)

专题二十 统计与统计案例 一、单选题 1.(2020·河南宛城·南阳华龙高级中学月考(文))在一组样本数据()11,x y ,()22,x y ,…,(),n n x y (2n ≥, 1x ,2x ,……,n x 不全相等)的散点图中,若所有样本点()(),1,2,,i i x y i n =???都在直线2 15 y x = +上,则这组样本数据的样本相关系数为( ) A .-1 B .0 C . 12 D .1 二、多选题 2.(2020·江苏省丰县中学期末)某俱乐部为了解会员对运动场所的满意程度,随机调查了50名会员,每位会员对俱乐部提供的场所给出满意或不满意的评价,得到如图所示的列联表,经计算2K 的观测值 5.059k ≈,则可以推断出( ) 附: A .该俱乐部的男性会员对运动场所满意的概率的估计值为 2 3 ; B .调查结果显示,该俱乐部的男性会员比女性会员对俱乐部的场所更满意; C .有97.5%的把握认为男性会员、女性会员对运动场所的评价有差异; D .有99%的把握认为男性会员、女性会员对运动场所的评价有差异. 第II 卷(非选择题)

三、解答题 3.(2020·河南宛城·南阳华龙高级中学月考(文))微信是现代生活中进行信息交流的重要工具.据统计,某公司200名员工中0090的人使用微信,其中每天使用微信时间少于一小时的有60人,其余的员工每天使用微信时间不少于一小时,若将员工分成青年(年龄小于40岁)和中年(年龄不小于40岁)两个阶段,那么使用微信的人中0075是青年人.若规定:每天使用微信时间不少于一小时为经常使用微信,那么经常使用微信的员工中 2 3 都是青年人. (1)若要调查该公司使用微信的员工经常使用微信与年龄的关系,完成22?列联表: (2)由列联表中所得数据判断,能否在犯错误的概率不超过0.001的前提下认为“经常使用微信与年龄有关”? 2 2 ()()()()() n ad bc k a b c d a c b d -=++++ 4.(2020·江苏泰州·期末)某企业的甲、乙两种产品在东部地区三个城市以及西部地区两个城市的销售量x , y 的数据如下:

高中数学:统计与统计案例练习

高中数学:统计与统计案例练习 A组 一、选择题 1.某校为了解学生平均每周的上网时间(单位:h),从高一年级1 000名学生中随机抽取100名进行了调查,将所得数据整理后,画出频率分布直方图(如图),其中频率分布直方图从左到右前3个小矩形的面积之比为1∶3∶5,据此估计该校高一年级学生中平均每周上网时间少于4 h的学生人数为() A.200 B.240 C.400 D.480 解析:选C设频率分布直方图中从左到右前3个小矩形的面积分别为P,3P,5P.由频率分布直方图可知,最后2个小矩形的面积之和为(0.015+0.035)×2=0.1.因为频率分布直方图中各个小矩形的面积之和为1,所以P+3P+5P=0.9,即P=0.1.所以平均每周上网时间少于4 h的学生所占比例为P+3P=0.4,由此估计学生人数为0.4×1 000=400. 2.AQI(Air Quality Index,空气质量指数)是报告每日空气质量的参数,描述了空气清洁或污染的程度.AQI共分六级,一级优(0~50),二级良(51~100),三级轻度污染(101~150),四级中度污染(151~200),五级重度污染(201~300),六级严重污染(大于300).如图是昆明市2019年4月份随机抽取的10天的AQI茎叶图,利用该样本估计昆明市2020年4月份空气质量优的天数为() A.3 B.4 C.12 D.21

解析:选C从茎叶图知,10天中有4天空气质量为优,所以空气质量为优的频率为4 10= 2 5, 所以估计昆明市2020年4月份空气质量为优的天数为30×2 5=12,故选C. 3.(成都模拟)某城市收集并整理了该市2018年1月份至10月份各月最低气温与最高气温(单位:℃)的数据,绘制了下面的折线图. 已知该城市各月的最低气温与最高气温具有较好的线性关系,则根据折线图,下列结论错误的是() A.最低气温与最高气温为正相关 B.10月的最高气温不低于5月的最高气温 C.月温差(最高气温减最低气温)的最大值出现在1月 D.最低气温低于0 ℃的月份有4个 解析:选D在A中,最低气温与最高气温为正相关,故A正确;在B中,10月的最高气温不低于5月的最高气温,故B正确;在C中,月温差(最高气温减最低气温)的最大值出现在1月,故C正确;在D中,最低气温低于0 ℃的月份有3个,故D错误.故选D. 4.(承德模拟)为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述中错误的是() A.是否倾向选择生育二胎与户籍有关 B.是否倾向选择生育二胎与性别无关

高中数学概率统计教案

专题二 概率统计(文科) (一)统计 【背一背基础知识】 一.抽样方法 抽样方法包含简单随机抽样、系统抽样、分层抽样三种方法,三种抽样方法都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围. 二.用样本估计总体 1.频率分布直方图:画一个只有横、纵轴正方向的直角坐标系,把横轴分成若干段,每一段对应一个组的组距,然后以此段为底作一矩形,它的高等于该组的 频率 组距 ,这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率,这些矩形就构成了频率分布直方图.在频率分布直方图中,每个小矩形的面积等于相应数据的频率,各小矩形的面积之和等于 1; 2.茎叶图:茎叶图是一种将样本数据有条理地列出来,从中观察样本分布情况的图.在茎叶图中,“茎”表示数的高位部分,“叶”表示数的低位部分. 3.样本的数字特征: (1)众数:一组数据中,出现次数最多的数据就是这组数据的众数(一组数据中的众数可能只有一个,也可能有多个).在频率分布直方图中,最高的矩形的中点的横坐标即为该组数据的众数; (2)中位数:将一组数据由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是这组数据的中位数;如果数据的个数是偶数,则中间两个数据的平均数就是这组数据的中位数.在频率分布直方图中,中位数a 对应的直线x a =的左右两边的矩形面积之和均为0.5,可以根据这个特点求频率分布直方图中的中位数; (3)平均数:设n 个数分别为1x 、2x 、L 、n x ,则()121 n x x x x n = +++L 叫做这n 个数的算数平均数.在频率分布直方图中,它等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和; (4)方差:设n 个数分别为1x 、2x 、L 、n x ,则 ()()() 2222 121n s x x x x x x n ? ?=-+-++-????L 叫做这n 个数的方差,方差衡量样本的稳定

高中数学必修三 概率与统计

高中数学必修三:概率与统计 1.要从已编号(1-50)的50枚最新研制的某型号导弹中随机抽取5枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的5枚导弹的编号可能是( ). A.5,10,15,20,25B.3,13,23,33,43C.1,2,3,4,5D.2,4,8,16,32 2.从鱼塘捕得同一时间放养的草鱼240尾,从中任选9尾,称得每尾鱼的质量分别是1.5,1.6,1.4,1.6,1.3,1.4,1.2,1.7,1.8(单位:千克).依此估计这240尾鱼的总质量大约是( ).A.300克B.360千克C.36千克D.30千克 3.以下茎叶图记录了甲.乙两组各五名学生在一次英语听力测试中的成绩(单位:分) 已知甲组数据的中位数为15,乙组数据的平均数为16.8,则,x y的值分别为()A.2,5B.5,5C.5,8D.8,8 4.为了考查两个变量x和y之间的线性关系,甲、乙两位同学各自独立作了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1,l2,已知两人得的试验数据中,变量x和y的数据的平均值都分别相等,且值分别为s与t,那么下列说法正确的是( ). A.直线l1和l2一定有公共点(s,t)B.直线l1和l2相交,但交点不一定是(s,t) C.必有直线l1∥l2 D.直线l1和l2必定重合 5..设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为$y=0.85x-85.71,则下列结论中不正确的是( ).A.y与x具有正的线性相关关系B.回归直线过样本点的中心(x,y)C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重比为58.79kg

高中数学统计、统计案例知识点总结和典例

统计 一.简单随机抽样:抽签法和随机数法 1.一般地,设一个总体含有N个个体(有限),从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等(n/N),就把这种抽样方法叫做简单随机抽样。 2.一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本,这种抽样方法叫做抽签法。 抽签法的一般步骤:a、将总体的个体编号。 b、连续抽签获取样本号码。 3. 利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法。 随机数表法的步骤:a、将总体的个体编号。b、在随机数表中选择开始数字。c、读数获取样本号码。 4. 抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型。 二.系统抽样: 1.一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。 系统抽样的一般步骤: (1)采用随机抽样的方法将总体中的N个个编号。 (2)将整体按编号进行分段,确定分段间隔k=N/n。(k∈N,L≤k). (3)在第一段用简单随机抽样确定起始个体的编号L(L∈N,L≤k)。 (4)按照一定的规则抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号L+K,再加上K得到第3个个体编号L+2K,这样继续下去,直到获取整个样本。 在确定分段间隔k时应注意:分段间隔k为整数,当N/n不是整数时,应采用等可能剔除的方剔除部分个体,以获得整数间隔k。 三.分层抽样: 1.一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。 分层抽样的步骤: (1)分层:按某种特征将总体分成若干部分。(2)按比例确定每层抽取个体的个数。 (3)各层分别按简单随机抽样的方法抽取。(4)综合每层抽样,组成样本。 2.分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点: (1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,面层之间的样本差异要大,且互不重叠。 (2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样。 (3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样。 四.用样本的频率分布估计总体分布: 1.频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。 其一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图 2.频率分布折线图、总体密度曲线 频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。

高中数学概率与统计测试题

概率与统计 1.如果一个整数为偶数的 概率为 (1)a+b 为偶数的概率; (2)a+b+c 为偶数的概率。 0.6 ,且 a,b,c 均为整数,求 2.从 10 位同学 (其中 6 女,4 男)中随机选出 3 位参加测验,每位女同学能通过测验的概率 43 均为,每位男同学能通过测验的概率均为,求55 (1)选出的 3 位同学中,至少有一位男同学的概率; (2)10 位同学中的女同学甲和男同学乙同时被选中且通过测验的概率。 3.袋中有 6 个白球, 4 个红球,甲首先从中取出 3 个球,乙再从余下的 7 个球中取出 4 个球,凡取得红球多者获胜。试求 (1)甲获胜的概率; (2)甲,乙成平局的概率。 4.箱子中放着 3 个 1 元硬币, 3 个 5 角硬币, 4 个 1 角硬币,从中任取 3 个,求总钱数超过 1 元 8 角的概率。 5.有 10 张卡片,其号码分别位 1,2,3?,10,从中任取 3 张。 (1)求恰有 1 张的号码为 3 的倍数的概率; (2)记号码为 3 的倍数的卡片张数为ξ,求ξ的数学期望。 6.某种电子玩具按下按钮后,会出现白球或绿球,已知按钮第一次按下后,出现红球与绿球 1 的概率都是,从按钮第二次按下起,若前次出现红球,则下次出现红球、绿球的概率2 1 2 3 2 分别为, ;若前次出现绿球,则下次出现红球、绿球的概率分别为, ,记第 n(n ∈ 3 3 5 5 N,n ≥1) 次按下后,出现红球的概率为P n

(1)求P2的值; (2)当 n∈N,n ≥2 时,求用P n 1表示P n的表达式; (3)求P n关于 n 的表达式。 7.有甲、乙两个盒子 ,甲盒子中有 8 张卡片 ,其中两张写有数字 0,三张写有数字 1 ,三张写有数字 2 ;乙盒子中有 8 张卡片,其中三张写有数字 0,两张写有数字1,三张写有数字 2 , (1) 如果从甲盒子中取两张卡片,从乙盒子中取一张卡片,那么取出的 3 张卡片都写有 1 的概率是多少? (2)如果从甲、乙盒子中各取一张卡片,设取出的两张卡片数字之和为ξ,求ξ的分布列和期望。 8.甲、乙两位同学做摸球游戏,游戏规则规定:两人轮流从一个放有 1 个白球, 3 个黑球, 2 个红球且只有颜色不同的 6 个小球的暗箱中取球,每次每人只取一球,每取出一个后立即放回,另一个人接着取,取出后也立即放回,谁先取到红球,谁为胜者,现甲先取 (1) 求甲摸球次数不超过三次就获胜的概率; (2) 求甲获胜的概率。 9.设有均由 A,B,C 三个部件构成的两种型号产品甲和乙,当A或 B 是合格品并且 C 是合格 品时,甲是正品;当 A, B 都是合格品或者 C 是合格品时,乙是正品。若 A 、 B、C 合格的概率均是 P,这里 A ,B,C 合格性是互相独立的。 (1) 产品甲为正品的概率P1是多少? (2)产品乙为正品的概率P2 是多少? (3)试比较P1与P2的大小。 10.一种电路控制器在出厂时每四件一等品装成一箱,工人在装箱时不小心把两件二等品和两件一等品装入了一箱,为了找出该箱的二等品,我们对该箱中的产品逐一取出进行测试。 (1) 求前二次取出的都是二等品的概率; (2) 求第二次取出的是二等品的概率; (3)用随机变量ξ表示第二个二等品被取出时共取的件数,求ξ的分布列及数学

通用版2020版高考数学大二轮复习专题突破练20统计与统计案例理

专题突破练20 统计与统计案例 1.(2019四川成都二模,理18)为了让税收政策更好地为社会发展服务,国家在修订《中华人民共和国个人所得税法》之后,发布了《个人所得税专项附加扣除暂行办法》,明确“专项附加扣除”就 是子女教育、继续教育、大病医疗、住房贷款利息、住房租金、赡养老人等费用,并公布了相应的定额扣除标准,决定自2019年1月1日起施行.某企业为了调查内部职员对新个税方案的满意程度与年龄的关系,通过问卷调查,整理数据得如下2×2列联表: (1)根据列联表,能否有99%的把握认为满意程度与年龄有关? (2)为了帮助年龄在40岁以下的未购房的8名员工解决实际困难,该企业拟按员工贡献积分x(单位:分)给予相应的住房补贴y(单位:元),现有两种补贴方案,方案甲:y=1 000+700x;方案 乙:y=已知这8名员工的贡献积分为2分,3分,6分,7分,7分,11分,12分,12分,将采用方案甲比采用方案乙获得更多补贴的员工记为“A类员工”.为了解员工对补贴方案的认可度,现从这8名员工中随机抽取4名进行面谈,求恰好抽到3名“A类员工”的概率. 附:K2=-,其中n=a+b+c+d. 参考数据:

2.下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图. 为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为 … 7 建立模型①;=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为 … 7 建立模型②:=99+17.5t. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.

高中数学统计与统计案例概率知识点上课讲义

高中数学统计与统计案例概率知识点

统计与统计案例概率(文科) 知识点 1.抽样调查 (1)抽样调查 通常情况下,从调查对象中按照一定的方法抽取一部分,进行______,获取数据,并以此对调查对象的某项指标作出______,这就是抽样调查. (2)总体和样本 调查对象的称为总______体,被抽取的称为样______本. (3)抽样调查与普查相比有很多优点,最突出的有两点: ①______ ②节约人力、物力和财力. 2.简单随机抽样 (1)简单随机抽样时,要保证每个个体被抽到的概率. (2)通常采用的简单随机抽样的方法:_____ 3.分层抽样 (1)定义:将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样. (2)分层抽样的应用范围: 当总体是由差异明显的几个部分组成时,往往选用分层抽样. 4.系统抽样 系统抽样是将总体中的个体进行编号,等距分组,在第一组中按照简单随机抽样抽取第一个样本,然后按______(称为抽样距)抽取其他样本.这种抽样方法有时也叫等距抽样或机

械抽样. 5.统计图表 统计图表是______数据的重要工具,常用的统计图表有______ 6.数据的数字特征 (1)众数、中位数、平均数 众数:在一组数据中,出现次数最多的数据叫作这组数据的众数. 中位数:将一组数据按大小依次排列,把处在______位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数. 平均数:样本数据的算术平均数,即x =1n (x 1+x 2+…+x n ). 在频率分布直方图中,中位数左边和右边的直方图的面积应该______ (2)样本方差 标准差s = 1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2], 其中x n 是样本数据的第n 项,n 是,______x 是______ 标准差是刻画数据的离散程度的特征数,样本方差是标准差的______.通常用样本方差估计总体方差,当______时,样本方差很接近总体方差. 7.用样本估计总体 (1)通常我们对总体作出的估计一般分成两种,一种是______,另一种______. (2)在频率分布直方图中,纵轴表示,______数据落在各小组内的频率用______表示,各小长方形的面积总和等于.______ (3)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图. (4)当样本数据较少时,用茎叶图表示数据的效果较好,它没有信息的缺失,而且______,方便表示与比较.

相关主题
文本预览
相关文档 最新文档