当前位置:文档之家› 用样本的频率分布估计总体分布 (1)

用样本的频率分布估计总体分布 (1)

用样本的频率分布估计总体分布 (1)
用样本的频率分布估计总体分布 (1)

第1课时用样本的频率分布估计总体分布

[核心必知]

1.预习教材,问题导入

根据以下提纲,预习教材P65~P70,回答下列问题.

(1)画频率分布直方图的步骤有哪些?

提示:求极差→决定组距与组数→决定组距与组数→将数据分组→列频率分布表→画频率分布直方图.

(2)频率分布直方图的纵轴表示什么?各矩形面积之和等于什么?

提示:频率分布直方图的纵轴表示频率/组距,各小长方形面积之和为1.

(3)频率分布折线图和总体密度曲线各指什么?

提示:连接频率分布直方图中各小长方形上端的中点就得到频率分布折线图;当频率分布直方图中组数增加,组距减小,相应的频率分布折线图会越来越接近于一条光滑的曲线,称之为总体密度曲线.

2.归纳总结,核心必记

(1)用样本估计总体、数据分析的基本方法

①用样本估计总体的两种情况

(ⅰ)用样本的频率分布估计总体分布.

(ⅱ)用样本的数字特征估计总体的数字特征.

②数据分析的基本方法

(ⅰ)借助于图形

分析数据的一种基本方法是用图将它们画出来,此方法可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.

(ⅱ)借助于表格

分析数据的另一种方法是用紧凑的表格改变数据的排列方式,此方法是通过改变数据的构成形式,为我们提供解释数据的新方式.

(2)绘制频率分布直方图的步骤

(3)频率分布折线图和总体密度曲线

(4)茎叶图

①茎叶图的制作方法(以两位数据为例):

将所有两位数的十位数字作为茎,个位数字作为叶,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出.

②茎叶图的优缺点

在样本数据较少时,用茎叶图表示数据的效果较好.它不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便.但是当样本数据较多时,茎叶图就显得不太方便,因为每一个数据都要在图中占据一个空间,如果数据很多,茎叶就会很长.

[问题思考]

(1)频率分布直方图直观形象地表示了频率分布表,在频率分布直方图中是用哪些量来表示各组频率的?

提示:在频率分布直方图中用每个矩形的面积表示相应组的频率,即频率

组距×组距=频率,

各组频率的和等于1,因此各小矩形的面积的和等于1.

(2)茎叶图中对“叶”和“茎”有什么要求?

提示:茎叶图中,“叶”是数据的最后一个数字,其前面的数字作为“茎”.

[课前反思]

通过以上预习,必须掌握的几个知识点:

(1)绘制频率分布直方图的步骤: ;

(2)频率分布折线图和总体密度曲线的制作方法:;

(3)茎叶图的制作方法:.

[思考]频率分布表、频率分布直方图各有什么优缺点?

名师指津:(1)频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便.

(2)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式.但是从直方图本身得不出原始数据内容,也就是说,把数据表示成直方图后,原有的具体数据信息就被抹掉了.

讲一讲

1.美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:

57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51, 54,51,60,62,43,55,56,61,52,69,64,46,54,48

将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.

[尝试解答]以4为组距,列表如下:

频率分布直方图如图(1)所示,频率分布折线图如图(2)所示.

(1)频率分布表中极差、组距、组数的关系 ①若极差组距为整数,则极差组距

=组数;

②若极差组距不为整数,则极差组距的整数部分+1=组数.

(2)确定频率分布直方图中组距和组数的注意点

组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,纵使数据的分布规律能较清楚地呈现出来,组数太多或太少,都会影响我们了解数据的分布情况,若样本容量不超过100,按照数据的多少常分为5~12组,一般样本容量越大,所分组数越多.

练一练

1.有一容量为50的样本,数据的分组及各组的数据如下:[10,15),4;[15,20),5;[20,25),10;[25,30),11;[30,35),9;[35,40),8;[40,45],3.

(1)列出样本频率分布表; (2)画出频率分布直方图及折线图.

解:(1)由所给的数据,不难得出以下样本的频率分布表:

数据段 [10,15) [15,20) [20,25) [25,30) 频数 4 5 10 11 频率 0.08 0.10 0.20 0.22 数据段 [30,35) [35,40) [40,45] 总计 频数

9

8

3

50

频率0.180.160.06 1

(2)频率分布直方图如图(1)所示,频率分布折线图如图(2)所示.

观察下面茎叶图,它的中间部分像一棵树的茎,两边部分像这棵树的茎上长出来的叶子.

[思考]怎样理解认识茎叶图?

名师指津:茎叶图也是用来表示数据的一种图,它的思路是将数组中的数按位数进行比较,将高位数字作为一个主干(茎),将低位数字作为分枝(叶),列在主干的一侧,这样就可以清楚地看到每个主干后面有几个数,每个数具体是多少.

讲一讲

2.某赛季甲、乙两名篮球运动员每场比赛得分情况如下:

甲的得分:12,15,24,25,31,31,36,36,37,39,44,49,50;

乙的得分:8,13,14,16,23,26,28,33,38,39,51.

(1)画出甲、乙两名运动员得分数据的茎叶图;

(2)根据茎叶图分析甲、乙两运动员的水平.

[尝试解答](1)作出茎叶图如图所示:

(2)由(1)中的茎叶图可以看出,甲运动员的得分情况是大致对称的,中位数是36;乙运

动员的得分情况除一个特殊得分外,也大致对称,中位数是26.因此甲运动员的发挥比较稳定,总体得分情况比乙运动员好.

画茎叶图的步骤

第一步,将数据分为“茎”(高位)和“叶”(低位)两部分;第二步,将表示“茎”的数字按大小顺序由上到下排成一列;第三步,将各个数据的“叶”按次序写在其茎的左、右两侧.

练一练

2.甲、乙两名同学最近几次的数学考试成绩情况如下:

甲的得分:95,81,75,89,71,65,76,88,94,110,107;

乙的得分:83,86,93,99,88,103,98,114,98,79,101.

画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.

解:甲、乙两人数学成绩的茎叶图如图所示.

从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98分;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是88分,但分数分布相对于乙来说,趋向于低分阶段.因此乙同学发挥比较稳定,总体得分情况比甲同学好.

讲一讲

3.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.

(1)求直方图中x的值;

(2)在这些用户中,求用电量落在区间[100,250)内的户数.

[思路点拨](1)根据各小长方形的面积和为1求解.

(2)先求数据落在[100,250)内的频率,再由频率公式求值.

[尝试解答] (1)由频率分布直方图知[200,250)小组的频率为1-(0.002 4+0.003 6+0.006 0+0.002 4+0.001 2)×50=0.22,于是x =0.22

50

=0.004 4.

(2)∵数据落在[100,250)内的频率为 (0.003 6+0.006 0+0.004 4)×50=0.7, ∴所求户数为0.7×100=70.

频率分布直方图的性质

(1)每个小矩形的面积表示样本数据落在该组内的频率. (2)所有小矩形的面积和等于1.

(3)利用一组的频数和频率,可以求样本容量.

提醒:频率分布直方图中的纵轴不是频率,而是频率/组距. 练一练

3.为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.

(1)第二小组的频率是多少?样本容量是多少?

(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少? 解:(1)频率分布直方图是以面积的形式反映了数据落在各小组内的频率大小的,因此第二小组的频率为4

2+4+17+15+9+3

=0.08.

又因为第二小组的频率=第二小组的频数

样本容量,

所以样本容量=第二小组的频数第二小组的频率=12

0.08=150.

(2)由直方图可估计该校高一年级学生的达标率为 17+15+9+3

2+4+17+15+9+3

×100%=88%.

——————————————[课堂归纳·感悟提

升]———————————————

1.本节课的重点是会列频率分布表,会画频率分布直方图、频率分布折线图、茎叶图,难点是理解用样本的频率分布估计总体分布的方法.

2.本节课要重点掌握的规律方法 (1)绘制频率分布直方图的步骤,见讲1. (2)绘制茎叶图的步骤及其意义,见讲2.

(3)会应用频率分布直方图的意义解决问题,见讲3. 3.本节课的易错点

将频率分布直方图中的纵轴的单位看错而致错是本节课的主要易错点,如讲3.

课下能力提升(十二) [学业水平达标练]

题组1 列频率分布表、画频率分布直方图

1.用样本频率分布估计总体频率分布的过程中,下列说法正确的是( ) A .总体容量越大,估计越精确 B .总体容量越小,估计越精确 C .样本容量越大,估计越精确 D .样本容量越小,估计越精确

解析:选C 由用样本估计总体的性质可得.

2.在画频率分布直方图时,某组的频数为10,样本容量为50,总体容量为600,则该组的频率是( )

A.15

B.16

C.1

10

D .不确定 解析:选A 该组的频率为

1050=1

5

,故选A. 3.调查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位: cm)如下:

171 163 163 166 166 168 168 160 168 165

171169167169151168170168160174

165168174159167156157164169180

176157162161158164163163167161

(1)作出频率分布表;

(2)画出频率分布直方图.

解:(1)最低身高151 cm,最高身高180 cm,它们的差是180-151=29,即极差为29;确定组距为4,组数为8,列表如下:

分组频数频率

[149.5,153.5)10.025

[153.5,157.5)30.075

[157.5,161.5)60.15

[161.5,165.5)90.225

[165.5,169.5)140.35

[169.5,173.5)30.075

[173.5,177.5)30.075

[177.5,181.5]10.025

合计40 1

(2)

题组2茎叶图及应用

4.如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为()

A.0.2 B.0.4 C.0.5 D.0.6

解析:选B∵数据总个数n=10,又落在区间[22,30)内的数据个数为4,∴所求的频

率为4

10=0.4.故选B.

5.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是()

A.46,45,56 B.46,45,53

C.47,45,56 D.45,47,53

解析:选A直接列举求解.由题意知各数为

12,15,20,22,23,23,31,32,34,34,38,39,45,45,45,47,47,48,48,49,50,50,51,51,54,57,59,61,67,68,中位数是46,众数是45,最大数为68,最小数为12,极差为68-12=56.

题组3频率分布直方图的应用

6.(2016·金华高一检测)如图所示是一容量为100的样本的频率分布直方图,则由图形中的数据,样本落在[15,20)内的频数为()

A.20 B.30 C.40 D.50

解析:选B样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.

7.某车站在春运期间为了了解旅客购票情况,随机抽样调查了100名旅客从开始在售票窗口排队到购到车票所用的时间t(以下简称为购票用时,单位为min),下面是这次调查统计分析得到的频率分布表和频率分布直方图(如图所示).

分组频数频率

一组0≤t<500

二组5≤t<10100.10

三组10≤t<1510②

四组15≤t<20①0.50

五组20≤t≤25300.30

合计100 1.00

解答下列问题:

(1)这次抽样的样本容量是多少?

(2)在表中填写出缺失的数据并补全频率分布直方图; (3)旅客购票用时的平均数可能落在哪一组? 解:(1)样本容量是100. (2)①50 ②0.10

所补频率分布直方图如图中的阴影部分.

(3)设旅客平均购票用时为t min ,则有 0×0+5×10+10×10+15×50+20×30

100≤t <

5×0+10×10+15×10+20×50+25×30

100

即15≤t <20.所以旅客购票用时的平均数可能落在第四组.

[能力提升综合练]

1.将容量为100的样本数据,按由小到大排列分成8个小组,如下表所示:

组号 1 2 3 4 5 6 7 8 频数

10

13

14

14

15

13

12

9

第3A .0.14和0.37 B.114和1

27

C .0.03和0.06 D.314和6

37

解析:选A 由表可知,第三小组的频率为14

100=0.14,累积频率为10+13+14100=0.37.

2.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( )

A B

C D

解析:选A由分组可知C,D两项一定不对;由茎叶图可知[0,5)有1人,[5,10)有1人,∴第一、二小组频率相同,频率分布直方图中矩形的高应相同,可排除B.故选A.

3.为了解电视对生活的影响,一个社会调查机构就平均每天看电视的时间对某地10 000名居民进行了调查,并根据所得数据画出了样本的频率分布直方图(如图),为了分析该地居民平均每天看电视的时间与年龄、学历、职业等方面的关系,要从10 000人中再用分层抽样的方法抽出100人做进一步调查,则在[2.5,3)(小时)时间段内应抽出的人数是()

A.25 B.30 C.50 D.75

解析:选A抽出的100人中平均每天看电视的时间在[2.5,3)(小时)时间段内的频率是0.5×0.5=0.25,所以这10 000人中平均每天看电视时间在[2.5,3)(小时)时间段内的人数为

10 000×0.25=2 500,又抽样比为100

10 000=

1

100,故在[2.5,3)(小时)时间段内应抽出人数为 2

500×1

100=25.

4.某工厂对一批产品进行了抽样检测.如图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是()

A.90 B.75 C.60 D.45

解析:选A∵样本中产品净重小于100克的频率为(0.050+0.100)×2=0.3,频数为

36,∴样本总数为36

0.3=120.∵样本中净重大于或等于98克并且小于104克的产品的频率为

(0.100+0.150+0.125)×2=0.75,∴样本中净重大于或等于98克并且小于104克的产品的个数为120×0.75=90.

5.为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校200名教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示如图:

据此可估计该校上学期200名教师中,使用多媒体进行教学次数在[15,25)内的人数为________.

解析:在抽取的20名教师中,在[15,25)内的人数为6,据此可估计该校上学期200名教师中,使用多媒体进行教学的次数在[15,25)内的人数为60.

★答案★:60

6.在我市2016年“创建文明城市”知识竞赛中,考评组从中抽取200份试卷进行分析,其分数的频率分布直方图如图所示,则分数在区间[60,70)上的人数大约有________.

解析:根据频率分布直方图,分数在区间[60,70)上的频率为0.04×10=0.4,∴分数在区间[60,70)上的人数为200×0.4=80.

★答案★:80

7.在某电脑杂志的一篇文章中,每个句子的字数如下:

10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17

在某报纸的一篇文章中,每个句子的字数如下:

27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22

(1)将这两组数据用茎叶图表示;

(2)将这两组数据进行比较分析,你会得到什么结论?

解:(1)

(2)电脑杂志上每个句子的字数集中在10~30之间;而报纸上每个句子的字数集中在

20~40之间.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为科普读物更加通俗易懂、简单明了.

8.某市2016年4月1日-4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):

61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49, 45.

(1)完成频率分布表; (2)作出频率分布直方图;

(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.

请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价. 解:(1)频率分布表:

分组 频数 频率 [41,51) 2 230 [51,61) 1 130 [61,71) 4 430 [71,81) 6 630 [81,91) 10 1030 [91,101) 5 530 [101,111]

2

230

(2)

(3)答对下述两条中的一条即可:

①该市一个月中空气污染指数有2天处于优的水平,占当月天数的1

15;有26天处于良

的水平,占当月天数的1315;处于优或良的天数为28,占当月天数的14

15

.说明该市空气质量基

本良好.

②轻微污染有2天,占当月天数的1

15;污染指数在80以上的接近轻微污染的天数15,

加上处于轻微污染的天数2,占当月天数的17

30,超过50%.说明该市空气质量有待进一步改

善.

样本及抽样分布知识讲解

第六章 样本及抽样分布 【内容提要】 一、简单随机样本与统计量 1. 总体 用来表征某一随机试验的数量指标X ,其概率分布称为总体的分布。 2. 简单随机样本 在相同条件下,对总体X 进行n 次独立的重复观察,将所得结果12,,...,n X X X 称为从总体X 中抽取的容量为n 的简单随机样本,试验结束后,可得一组数值12,,...,n x x x ,称其为 12,,...,n X X X 的观察值。 注:若12,,...,n X X X 为总体X 的简单随机样本,则12,,...,n X X X 相互独立,且与总体X 同分布。 3. 统计量 设12,,...,n X X X 为总体X 的简单随机样本,12(,,...,)n T g X X X =为样本12,,...,n X X X 的实值函数,且不含任何未知参数,则称12(,,...,)n T g X X X =为一个统计量,将样本值12,,...,n x x x 代入后算出的函数值12(,,...,)n t g x x x =称为该统计量的值。 注:设12,,...,n X X X 为总体X 的简单随机样本,12,,...,n x x x 为相应的样本值,则常用的统计量有: 4. 经验分布函数 设12,,...,n X X X 为总体X 的简单随机样本,12,,...,n x x x 为相应的样本值,将样本值 按由小到大的顺序重新编号12,1r x x x r n ***<

用样本估计总体教案

2.2.1用样本的频率分布估计总体分布 一、教学目标分析 1.知识与技能目标 (1)通过实例体会分布的意义和作用。 (2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图。 (3)通过实例体会频率分布直方图的特征,能准确地做出总体估计。 2、过程与方法目标: 通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法。 3、情感态度与价值观目标: 通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系。 二、教学的重点和难点 重点:会列频率分布表,画频率分布直方图。 难点:能通过样本的频率分布估计总体的分布。 三、教法与学法分析 1、教法:遵循观察、探究、发现、总结式的教学模式。重点以引导学生为主,让他们能积极、主动的进行探索,获取知识。由于内容较繁琐,所以要借助多媒体辅助教学。 2、学法:根据本节知识的特点,由于学生已具备一定的基础知识,可采取研究性学习的学习方法。 四、教学过程 (一)情境引入 1.随机抽样有哪几种基本的抽样方法? 简单随机抽样、系统抽样、分层抽样. 2.随机抽样是收集数据的方法,如何通过样本数据所包含的信息,估计总体的基本特征,即 用样本估计总体,是我们需要进一步学习的内容. 3.高二某班有50名学生,在数学必修②结业考试后随机抽取10名,其考试成绩如下: 82,75,61,93,62,55,70,68,85,78. 如果要求我们根据上述抽样数据,估计该班对数学模块②的总体学习水平,就需要有相应的数学方法作为理论指导,本节课我们将学习用样本的频率分布估计总体分布. (二)新课讲解 知识探究(一):频率分布表 【问题】我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费. 通过抽样调查,获得100位居民2007年的月均用水量如下表(单位:t): 3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2

样本及抽样分布

第六章样本及抽样分布 【基本要求】1、理解总体、个体和样本的概念; 2、理解样本均值、样本方差和样本矩的概念并会计算; 3、理解统计量的概念,掌握几种常用统计量的分布及其结论; 4、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布——2 分布,t分布, F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【学时分配】4学时 【授课内容】 §6.0 前言 前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性;而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。 §6.1 随机样本 1

一、总体与样本 1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每个男大学生就是个体。 但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几项数量指标X(可以是向量)和该数量指标X在总体的分布情况。在上述例子中X是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X的这样或那样的数值,因而这个数量指标X是一个随机变量(或向量),而X的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标X可能取值的全体组成的集合等同起来。 定义1:把研究对象的全体(通常为数量指标X可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。 我们对总体的研究,就是对相应的随机变量X的分布的研究,所谓总体的分布也就是数量指标X的分布,因此,X的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体X。根据总体中所包括个体的总数,将总体分为:有限总体和无限总体。 例1:考察一块试验田中小麦穗的重量: X=所有小麦穗重量的全体(无限总体);个体——每个麦穗重x 2

用样本频率分布体分布

用样本频率分布体分布

————————————————————————————————作者:————————————————————————————————日期:

2.2.1 用样本的频率分布估计总体的分布 荣成二中宋海燕 目的要求 通过实例体会分布的意义和作用,在表示数据的过程中,学会列出频率分布表、画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点。 教学过程 1.实例引课 为了解某地区女中学生的身体发育情况,不仅要了解其平均身高,还要了解身高在哪个范围内的学生多,哪个范围内的学生少. 为了解某次考试成绩,不仅应知道平均成绩,还应知道90分以上占多少,80分~90分占多少,……,不及格占多少等. 要解决上面的两个问题,需要从总体中得到一个包含大量数据的样本,并且把这些数据形成频率分布,就可以比较清楚地看出样本数据的特征,从而估计总体的分布情况。 2.引出课题:用样本的频率分布估计总体的分布 看下面的例子 某钢铁加工厂生产内径为25.40mm的钢管,为了掌握产品的生产状况,需要定期对产品进行检测。又由于产品的数量巨大,不可能一一检测所有的钢管,因而通常采用随机抽样的办法。如果把这些钢管的内径看成总体,我们可以从中随机抽取的100件钢管进行检测,把这100件钢管的质量分布情况作为总体的质量分布情况来看待。根据规定,钢管内径的尺寸在区间25.325~25.475内为优等品,我们特别希望知道所有生产的钢管中优等品所占的比例,这时就可以用样本的分布情况估计总体的分布情况。 下面的数据是一次抽样中的100件钢管的内径尺寸:(幻灯示). 25.39 25.36 25.34 25.42 25.45 25.38 25.39 25.42 25.47 25.35 25.41 25.43 25.44 25.48 25.45 25.43 25.46 25.40 25.51 25.45 25.40 25.39 25.41 25.36 25.38 25.31 25.56 25.43 25.40 25.38 25.37 25.44 25.33 25.46 25.40 25.49 25.34 25.42 25.50 25.37 25.35 25.32 25.45 25.40 25.27 25.43 25.54 25.39 25.45 25.43 25.40 25.43 25.44 25.41 25.53 25.37 25.38 25.24 25.44 25.40 25.36 25.42 25.39 25.46 25.38 25.35 25.31 25.34 25.40 25.36 25.41 25.32 25.38 25.42 25.40 25.33 25.37 25.41 25.49 25.35 25.47 25.34 25.30 25.39 25.36 25.46 25.29 25.40 25.37 25.33 25.40 25.35 25.41 25.37 25.47 25.39 25.42 25.47 25.38 25.39 上面的100个数据有点散乱,从中很难看出产品质量的分布情况,必须对样本数据用统计的方法加以概括和整理。下面我们列出这组样本数据的频率分布表、频率分布直方图,步骤如下: (1)计算级差(一组数据中最大值与最小值的差) 25.26-25.24=0.32 (2)决定组距与组数(样本容量不超过100时,组数常分为5~12组) 如果组距定为0.03,那么 级差/组距=0.32/0.03=10 2/3 于是应将样本数据分成11组(组距还可以定为其他的数值) (3)决定分点

用样本估计总体

用样本估计总体一、基础知识 1.频率分布直方图 (1)纵轴表示频率 组距 ,即小长方形的高= 频率 组距 ; (2)小长方形的面积=组距×频率 组距 =频率; (3)各个小方形的面积总和等于1 . 2.频率分布表的画法 第一步:求极差,决定组数和组距,组距=极差组数 ; 第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表. 3.茎叶图 茎叶图是统计中用来表示数据的一种图, 茎是指中间的一列数,叶就是从茎的旁 边生长出来的数. 4.中位数、众数、平均数的定义 (1)中位数 将一组数据按大小依次排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数. (2)众数 一组数据中出现次数最多的数据叫做这组数据的众数. (3)平均数 一组数据的算术平均数即为这组数据的平均数,n个数据x1,x2,…,x n的 平均数x=1 n(x1+x2+…+x n).

5.样本的数字特征 如果有n个数据x1,x2,…,x n,那么这n个数的 (1)平均数x=1 n(x1+x2+…+x n). (2)标准差s=1 n[(x1-x) 2+(x 2 -x)2+…+(x n-x)2]. (3)方差s2=1 n[(x1-x) 2+(x 2 -x)2+…+(x n-x)2]. 二、常用结论 1.频率分布直方图中的常见结论 (1)众数的估计值为最高矩形的中点对应的横坐标. (2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. (3)中位数的估计值的左边和右边的小矩形的面积和是相等的. 2.平均数、方差的公式推广 (1)若数据x1,x2,…,x n的平均数为x,则mx1+a,mx2+a,mx3+a,…,mx n+a的平均数是m x+a. (2)若数据x1,x2,…,x n的方差为s2,则数据ax1+b,ax2+b,…,ax n+b 的方差为a2s2. 考点一茎叶图 [典例](优质试题·山东高考)如图所示的茎叶图记录了甲、 乙两组各5名工人某日的产量数据(单位:件).若这两组数据 的中位数相等,且平均值也相等,则x和y的值分别为() A.3,5B.5,5 C.3,7 D.5,7 [解析]由两组数据的中位数相等可得65=60+y,解得y=5,又它们的平

习题六 样本及抽样分布.

习题六样本及抽样分布 一、填空题 1.设来自总体的一个样本观察值为:2.1,5.4,3.2,9.8,3.5,则样本均值 = 4.8 ,样本方差 =; 2.在总体中随机地抽取一个容量为 36 的样本,则均值落在4与6之间的概率 = 0.9332 ; 3.设某厂生产的灯泡的使用寿命 (单位:小时,抽取一容量为9的样本,得到 ,则; 4.设为总体的一个样本,则 0.025 ; 5.设为总体的一个样本,且服从分布,这里, ,则1/3 ; 6.设随机变量相互独立,均服从分布且与分别是来自总体的简单随机样本,则统计量服从参数为 9 的 t 分布。 7.设是取自正态总体的简单随机样本且 ,则 0.05 , 0.01 时,统计量服从分布,其自由度为 2 ;

8.设总体 X 服从正态分布,而是来自总体的简单随机样 本,则随机变量 服从 F 分布,参数为 10,5 ; 9.设随机变量则 F(n,1 ; 10.设随机变量且,A为常数,则 0.7 二、选择题 1.设是来自总体的简单随机样本,是样本均值, 记 则服从自由度的分布的随机变量是( A ); A. B. C. D. 2.设是经验分布函数,基于来自总体的样本,而是总体的分布函数,则下列命题错误的为,对于每个给定的( B ) A.是分布函数 B.依概率收敛于 C.是一个统计量 D.其数学期望是

3.设总体服从0-1分布,是来自总体的样本,是样本均值,则下列各选项中的量不是统计量的是( B ) A. B. C. D. 4.设是正态总体的一个样本,其中已知而未知,则下列各选项中的量不是统计量的是( C )。 A. B. C. D. 5.设和分别来自两个正态总体和的样本,且相互独立,分别为两个样本的样本方差,则服从的统计量是( B ) A. B. C. D. 6.设是正态总体的一个样本,和分别为样本均值和样本方差,则下面结论不成立的有( D ) A.相互独立; B.与相互独立; C.与相互独立D.与相互独立。

用样本估计总体分布

用样本的频率分布估计总体分布(第1课时) 教学目标: 1.通过实例体会分布的意义和作用,通过对现实生活的探究,感知应用数学知识解决问题的方法. 2.通过表示样本数据的过程,学会列频率分布表,画频率分布直方图,理解数形结合的数学思想. 3.通过对样本分析和总体估计的过程,感受数学在实际生活中的作用,认识数学知识源于生活并指导生活的事实. 教学重点: 会列频率分布表,画频率分布直方图,了解样本频率分布与总体分布之间的关系 教学难点: 掌握频率分布直方图的正确画法,体会分布的意义与作用 教学方法:引导——探究教学法 教学过程: 一、创设情境,呈现问题 问题情境:我国是世界上严重缺水的国家之一,城市缺水问题较为突出,武汉市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费. 如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢? 二、操作讨论,构建新知 <知识探究1 改良频数分布表→频率分布表> 问题1:如果标准太低,会影响居民的日常生活;如果标准太高,则不利于节水.那么你认为,为了较合理地确定出这个标准,需要了解哪些相关信息,做哪些工作? 【学生活动1】探究讨论,得到结论: ①为了制定一个较为合理的标准a,需要知道每个家庭的用水量 ②如何获得家庭用水量的有关信息?对家庭进行调查,采用抽样调查的方式 ③抽样时,样本容量定为多少比较合适?武汉市1000万人口,抽样10000比较合适 课堂上为了处理数据的方便,我们理想化地抽取100个数据的样本,比如: 通过抽样调查,获得100户居民的月均用水量如下表(单位:t) 3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2 问题2:从表中随意记录下的数据中很难直接看出规律,因此需要对统计数据进行整理分析. 回顾你看到全班的期末考试成绩单后是怎样分析的?

用样本的频率分布估计总体分布(一)(解析版)

用样本的频率分布估计总体分布(一) 班级:____________ 姓名:__________________ 一、选择题 1.下列说法中错误的是() ①用样本的频率分布估计总体频率分布的过程中,样本容量越大,估计越精确; ②一个容量为n的样本,分成若干组,已知某组的频数和频率分别是40,0.125,则n的值为240; ③频率分布直方图中,小长方形的高等于该小组的频率; ④将频率分布直方图中各小长方形上端的一个端点顺次连接起来,就可以得到频率分布折线图; ⑤每一个总体都有一条总体密度曲线,它反映了总体在各个范围内取值的百分比. A.①③B.②③④ C.②③④⑤D.①②③④⑤ 解析:选C.样本越多往往越接近于总体,所以①正确;②中n=40÷0.125=320;③中频率分布直方图中,小长方形的高等于该小组的频率÷组距;④中应将频率分布直方图中各小长方形上端的中点顺次连接 起来得到频率分布折线图;⑤中有一些总体不存在总体密度曲线,如“掷硬币”这样的离散型总体(结果是固定的,只有正面和反面两种可能,且可能性相等),故②③④⑤错误. 2.观察新生儿的体重,其频率分布直方图如图所示,则新生儿体重在[2 700,3 000)g的频率为() A.0.1 B.0.2 C.0.3 D.0.4 解析:选C.由题图可得,新生儿体重在[2 700,3 000)g的频率为0.001×300=0.3,故选C. 3.在样本的频率分布直方图中,某个小长方形的面积是其他小长方形面积之和的1 4,已知样本容量 是80,则该组的频数为() A.20 B.16 C.30 D.35 解析:选B.设该组的频数为x,则其他组的频数之和为4x,由样本容量是80,得x+4x=80,解得x =16,即该组的频数为16,故选B. 4.某厂对一批产品进行抽样检测,如图是抽检产品净重(单位: 克)的频率分布直方图,样本数据分组为[76,78),[78,80),…,[84, 86].若这批产品有120个,估计其中净重大于或等于78克且小于84 克的产品的个数是() A.12 B.18 C.25 D.90 解析:选D.净重大于或等于78克且小于84克的频率为(0.100+0.150+0.125)×2=0.75,所以在该范围内的产品个数为120×0.75=90. 5.对于向量a,b,c和实数 ,下列命题中正确的是()

(完整版)样本及抽样分布.doc

第六章样本及抽样分布 【基本要求】 1、理解总体、个体和样本的概念; 2、理解样本均值、样本方差和样本矩的概念并会计算; 3、理解统计量的概念,掌握几种常用统计量的分布及其结论; 4、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布—— 2 分布,t分布, F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【学时分配】 4 学时 【授课内容】 §6.0前言 前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一 门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性; 而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的 一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来 选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理 统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。 § 6.1随机样本 1

一、总体与样本 1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是 个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每 个男大学生就是个体。 但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几 项数量指标 X ( 可以是向量 ) 和该数量指标X在总体的分布情况。在上述例子中 X 是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X 的这样或那样的数值,因而这个数量指标X 是一个随机变量(或向量),而 X 的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标 X 可能取值的全体组成的集合等同起来。 定义 1:把研究对象的全体(通常为数量指标X 可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。 我们对总体的研究,就是对相应的随机变量X 的分布的研究,所谓总体的分布也就是数量指 标 X 的分布,因此, X 的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体 X 。根据总体中所包括个体的总数,将总体分为:有限总体 和无限总体。 例 1:考察一块试验田中小麦穗的重量: X =所有小麦穗重量的全体(无限总体);个体——每个麦穗重x 2

用样本估计总体知识讲解

用样本估计总体 【学习目标】 1.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图. 2.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计. 3.正确理解样本数据标准差的意义和作用,学会计算数据的标准差. 4.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释. 5.会用样本的基本数字特征估计总体的基本数字特征. 【要点梳理】 要点一、频率分布的概念 频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为: 1.计算一组数据中最大值与最小值的差,即求极差 2.决定组距与组数 3.将数据分组 4.列频率分布表 5.画频率分布直方图 要点诠释: 频率分布直方图的特征: 1.从频率分布直方图可以清楚的看出数据分布的总体趋势. 2.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了. 要点二、频率分布折线图、总体密度曲线 1.频率分布折线图的定义: 连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图. 2.总体密度曲线的定义: 在样本频率分布直方图中,样本容量越大,所分组数越多,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线. 要点诠释: 总体密度曲线能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息,能够精确的反映一个总体在各个区域内取值的规律. 要点三、茎叶图 当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图. 要点诠释: 茎叶图的特征: (1)用茎叶图表示数据有两个优点:一是在统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示. (2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰. 要点四、众数、中位数与平均数 1.众数 一组数据中出现次数最多的数据叫做众数.如果变量是分类的,用众数是很有必要的.例如班委会要作出

《用样本的频率分布估计总体分布》教学设计

课题:用样本的频率分布估计总体分布 本节内容为人教A版《普通高中课程标准实验教科书》必修3第2章第2节第1小节——《用样本的频率分布估计总体分布》的第一课时. 一、教材分析 1.内容与目标 《数学课程标准》强调统计思想与使用统计思想解决实际问题的水平,要求学生系统地经历提出问题、收集数据、整理分析数据、做出推理与决策的全过程.通过本节的学习,让学生体会统计思想与确定性思想的差异,并能从所获得的数据中提取有价值的信息,做出合理的决策. 统计与现实生活的联系是非常紧密的,所以本节内容对学生来说应该是充满趣味性和吸引力的.教科书选择居民生活用水定额管理问题,引导学生从具体的问题中总结、抽象出一般规律,让学生体会其中的统计原理,感受统计与实际生活的联系以及在解决现实问题中的作用. 本节内容在高中统计部分占有十分重要的地位.一方面它与前面学习的抽样方法之间有着紧密的联系,是学习完抽样方法后的第一节课;另一方面本节内容本身就是利用样本估计总体的一个重要方法,它是后面即将要学习的用样本的数字特征估计总体数字特征的基础. 通过以上分析,确定教学目标如下: (1)通过实例体会分布的意义和作用. (2)在分析样本数据的过程中,学会列频率分布表,画频率分布直方图,理解数形结合的数学思想和逻辑推理的数学方法. (3)通过对样本分析和总体估计的过程,体会频率分布直方图的特征,利用它分析样本的分布,准确地做出总体估计,理解到数学知识源于生活并指导生活,体会数学知识与现实世界的联系. 2.重点与难点 本节的引言首先说明了用统计方法解决实际问题的一般框架,明确了估计总体分布和总体数字特征的重要性.接着通过对“居民生活用水定额管理问题”的探究,引出对总体分布的估计问题及估计总体分布的途径的讨论,这个问题贯穿本节始终.通过对该问题的探究,让学生学习列频率分布表和画频率分布直方图,最后又围绕这个问题的解决方案,让学生尝试用直方图来解决实际问题,体会用样本估计总体的思想. 根据以上分析,本节课的教学重点确定为: (1)列频率分布表,画频率分布直方图; (2)了解频率分布与总体分布之间的关系,体会用样本估计总体的思想. 本节课的教学难点确定为: (1)在用样本的频率分布估计总体分布的过程中合理分组; (2)理解分布的意义与作用. 3.学情与对策

用样本的频率分布估计总体分布2课时

2.2.1用样本的频率分布估计总体分布(2课时) 一、学习目标: 1.知识与技能 (1)通过实例体会分布的意义和作用. (2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图. (3)通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计. 2.过程与方法 通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法. 3.情感态度与价值观 通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系. 二、学习重点与难点 重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图. 难点:能通过样本的频率分布估计总体的分布. 三、课堂过程 【创设情境】 在NBA的2004赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕ 甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50 乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33 请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定? 如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布(板出课题). 【探究新知】 我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了了较为合理地确定出这个标准,需要做哪些工作?(让学生展开讨论) 为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况. 分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.表格则是通过改变数据的构成形式,为我们提供解释数据的新方式. 下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.可以让我们更清楚的看到整个样本数据的频率分布情况. 〈一〉频率分布的概念: 频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为: (1)计算一组数据中最大值与最小值的差,即求极差 (2)决定组距与组数 (3)将数据分组

样本与抽样分布

第六章样本与抽样分布 §6.1 数理统计的基本概念 一.数理统计研究的对象 例:有一批灯泡,要从使用寿命这个数量指标来看其质量,设寿命用X表示。 (1)若规定寿命低于1000小时的产品为次品。此问题是求P(X 1000)=F(10000),求F(x)? (2)从平均寿命、使用时数长短差异来看其质量,即求E(x)?、D(x)?。 要解决二个问题

1.试验设计抽样方法。 2.数据处理或统计推断。 方法具有“从局部推断总体”的特点。 二.总体(母体)和个体 1.所研究对象的全体称为总体,把组成总体的每一个对象成员(基本单元)称为个体。 说明: (1)对总体我们关心的是研究对象的某一项或某几项数量指标(或属性指标)以及他们在整体中的分布。所以总体是个体的数量指标的全体。 (2)为研究方便将总体与一个R.V X

对应(等同)。 a.总体中不同的数量指标的全体, 即是R.V.X的全部取值。 b.R.V X的分布即是总体的分布 情况。 例:一批产品是100个灯泡,经测试其寿命是: 1000小时1100小时 1200小时 20个30个50个 X 1000 1100 1200 P 20/100 30/100

50/100 (设X表示灯泡的寿命)可知R.V.X的分布律, 就是总体寿命的分布,反之亦然。 常称总体X,若R.VX~F(x),有时也用F(x)表示一个总体。 (3)我们对每一个研究对象可能要观测两个或多个数量指标,则可用多维随机向量(X,Y,Z, …)去描述总体。 2.总体的分类 有限总体 无限总体

三.简单随机样本. 1.定义6.1 :从总体中抽得的一部分个体组成的集合称为子样(样本),取得的个体叫样品,样本中样品的个数称为样本容量(也叫样本量)。每个样品的测试值叫观察值。 取得子样的过程叫抽样。 样本的双重含义: (1)随机性: 用(X 1,X 2, ……X n) n维随机向量表 示。 X i表示第i个被抽到的个体,是随机变量。(i=1,2,…n)

用样本估计总体

用样本估计总体 1.作频率分布直方图的步骤 (1)求极差(即一组数据中最大值与最小值的差). (2)决定组距与组数. (3)将数据分组. (4)列频率分布表. (5)画频率分布直方图. 2.频率分布折线图和总体密度曲线 (1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图. (2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.

3.茎叶图 统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数. 4.标准差和方差 (1)标准差是样本数据到平均数的一种平均距离. (2)标准差: s=1 n[(x1-x) 2+(x 2 -x)2+…+(x n-x)2]. (3)方差:s2=1 n[(x1-x) 2+(x 2 -x)2+…+(x n-x)2](x n是样本数据,n是样本容 量,x是样本平均数). 知识拓展 1.频率分布直方图的特点 (1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示频率 组距 ,频率=组距 ×频率组距 . (2)在频率分布直方图中,各小长方形的面积总和等于1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比. (3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观. 2.平均数、方差的公式推广 (1)若数据x1,x2,…,x n的平均数为x,那么mx1+a,mx2+a,mx3+a,…,mx n +a的平均数是m x+a. (2)数据x1,x2,…,x n的方差为s2. ①数据x1+a,x2+a,…,x n+a的方差也为s2; ②数据ax1,ax2,…,ax n的方差为a2s2.

《用样本的频率分布估计总体分布》教学设计高品质版

《用样本的频率分布估计总体分布》教学设计 一、设计思路 本课设计是根据高中数学课程标准的要求来制定的,学习本节课的主要内容是学习画样本的频率分布直方图和用样本的频率分布直方图估计总体分布这一统计思想方法,通过本节的学习,应使学生感受分布的意义与作用,初步体会统计知识在解决实际问题中的作用,初步感受统计思维的特点 二、教材分析与学情分析 1、教材分析 本小节是高中数学人教A版的必修三第二章的内容,其主要介绍表示样本分布的方法,包括频率分布表、频率分布直方图、频率分布折线图和茎叶图,并介绍了频率折线图与总体密度之间的关系。由于作统计图、表的操作性很强,所以教学中要使学生在明确图、表含义的前提下,让学生自己动手作图。同时让学生理解:对于一个总体的分布,我们往往从总体抽取一个样本,用样本的频率分布估计总体分布。学生在初中已经学过把样本数据表示成频数分布表和频数分布图的形式,能从图表上直观的看出数据的分布情况,为学习本节内容在基础知识上有了铺垫。 2、学情分析 这节内容要求高一年级的学生掌握,而学生已有一定的统计学基础知识及分析问题和解决问题的能力,对常见的数学思想已有初步的认识和应用。通过对样本分析和总体估计的过程,使学生感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系。当然在教学中也要考虑到个别学生由于基础差在学习上可能比较吃力,所以讲新课前可以让学生到现实生活中对某些生活现象进行数据统计分析,让学生对统计学产生一定的兴趣,并且体会统计学在实际生活中的作用及基本操作。在教学中,应该让学生利用上一节对特定实际问题所收集的样本,模仿居民生活用水定额管理问题的解决思路,给出相应实际问题的解答。通过此过程初步培养学生运用统计思想表述,思考和解决现实世界中的问题的能力。 三、教学方法和手段: 1、引导启发式:数学学科源于实际用于实际,而统计学的基础知识初中已讲过,且统计学是用来解决实际问题,所以本堂课教学主要还是着重于设计问题引导启发学生。 2、讨论探究式:新课标改革的目的之一在于变学生机械接受灌输的学习状态为主动探究式学习。我打算以学习任务驱动,以问题探究与动手操作为方式,以问题解决为主线,通过各种展示方式创设情景,让学生分小组讨论且引导学生通过对问题的交流讨论和实验探究,学会画图和表并理解分布的作用和意义,了解学习统计知识的基本研究方法。同时小组之间的共同探讨可以激发学生的学习兴趣,活跃课堂气氛,拓展学生的思维广度和深度。 通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法。 四、教学流程 1、课前准备:复习初中讲过的统计相关内容,预习高中课本65页至70页内容并完成学案基 本内容。 2、导入新课:老师提出问题:“我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理地确定出这个标准,需要做哪些工作?”(让学生展开讨论)

抽样分布和样本分布

抽样分布和样本分布 导读:我根据大家的需要整理了一份关于《抽样分布和样本分布》的内容,具体内容:你们知道各是什么吗?以下是有我为大家整理的,希望能帮到你。抽样分布:从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。抽样分布是统... 你们知道各是什么吗?以下是有我为大家整理的,希望能帮到你。抽样分布: 从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。抽样分布是统计推断的理论基础。 如果从容量为的有限总体抽样,若每次抽取容量为的样本,那么一共可以得到N取n的组合个样本(所有可能的样本个数)。抽样所得到的每一个样本可以计算一个平均数,全部可能的样本都被抽取后可以得到许多平均数。如果将抽样所得到的所有可能的样本平均数集合起来便构成一个新的总体,平均数就成为这个新总体的变量。由平均数构成的新总体的分布,称为平均数的抽样分布。随机样本的任何一种统计数都可以是一个变量,这种变量的分布称为统计数的抽样分布。 样本分布: 总体是指考察的对象的全体,个体是总体中的每一个考察的对象,样本是总体中所抽取的一部分个体,而样本容量则是指样本中个体的数目样本分布是用来估计总体分布的。样本分布有区别于总体分布,它是从总体中按一定的分组标志选出来的部分样本容量。

实际中很多不确定现象都可以用随机变量描述,而应用中的一个十分重要的问题是找到随机变量的分布或其数字特征。例如:某进出口贸易公司进口了10万台微型计算器,按产品技术规定,使用寿命小于4000小时即为次品,且次品率大于1% 就不接受这批产品。如何得知这批产品的次品率呢?是否要测量每一台计算器呢?显然,这是不现实的,解决这个问题的好办法就是随机抽样,然后根据抽样检验得到的次品率来估计整批产品的次品率。也就是从10万台产品中按随机原则,抽取一部分(假如100件)产品组成一个样本,由样本(100件产品)次品率推断整批产品的次品率。 这里,我们把被观察对象的全体(本例中的10万台计算器)称作总体,把从总体中随机抽取的(被抽中的100台计算器)小群体称作样本,而样本中所包含的个体单位数目称为样本容量(100个)。 对于这批计算器,我们关心的是它的使用寿命(低于4000小时的比例有多少)的分布,设X表示"任一台计算器的使用寿命",它是一个随机变量,我们把随机抽中的100件产品看作是100个随机变量X1,X2......,X100,每一个计算器的使用寿命都是一个随机变量,一旦测试完毕,测试的结果就是100个观测值x1,x2,......x100, 统计抽样的任务就是根据测试结果x1,x2,......x100来估计总体X的分布情况。 我们作如下概括:设X是一个随机变量,X1,X2......,Xn是一组相互独立与X具有相同分布的随机变量,称X为总体,X1,X2......,Xn为来自总体的简单随机样本,简称样本,n为样本容量,称样本观察值为样本值,由于按随机原则取样,在试验之前,人们无法知道试验的结果,

(完整word版)习题六样本及抽样分布

习题六 样本及抽样分布 一、填空题 1.设来自总体X 的一个样本观察值为:2.1,5.4,3.2,9.8,3.5,则样本均值 = 4.8 ,样本方差 =22.716; 2.在总体~(5,16)X N 中随机地抽取一个容量为 36 的样本,则均值X 落在4与6之间的概率 = 0.9332 ; 3. 设某厂生产的灯泡的使用寿命2~(1000,)X N σ (单位:小时),抽取一容量为9的样本,得到940,100x s ==,则(940)P X <= ; 4.设127,,...,X X X 为总体2 ~(0,0.5)X N 的一个样本,则7 21 (4)i i P X =>=∑ 0.025 ; 5.设126,,...,X X X 为总体~(0,1)X N 的一个样本,且cY 服从2χ分布,这里, 22123456()()Y X X X X X X =+++++,则c =1/3 ; 6.设随机变量,X Y 相互独立,均服从2(0,3)N 分布且129,,...,X X X 与129,,...,Y Y Y 分 别是来自总体,X Y 的简单随机样本,则统计量U =服从参数为 9 的 t 分布。 7.设1234,,,X X X X 是取自2~(0,2)X N 正态总体的简单随机样本且 22!234(2)(34),Y a X X b X X =-+-,则a = 0.05 ,b = 0.01 时,统计量Y 服从 2χ分布,其自由度为 2 ; 8.设总体 X 服从正态分布2~(0,2)X N ,而1215,,...,X X X 是来自总体的简单随机 样本,则随机变量 22 110 22 1115...2(...) X X Y X X ++=++ 服从 F 分布,参数为 10,5 ; 9.设随机变量21 ~()(1),,X t n n Y X >=则~Y F(n,1) ; 10.设随机变量~(,)X F n n 且()0.3P X A >=,A 为常数,则1 ()P X A > = 0.7 二、选择题 1.设12,,...,n X X X 是来自总体2(,)N μσ的简单随机样本,X 是样本均值, 记22222 21 23111 111(),(),(),11n n n i i i i i i S X X S X X S X n n n μ====-=-=---∑∑∑ 2 241 1(),n i i S X n μ==-∑则服从自由度1n -的t 分布的随机变量是T =( A ); A . B C D 2.设()n F x 是经验分布函数,基于来自总体X 的样本,而()F x 是X 总体的 分布函数,则下列命题错误的为,对于每个给定的,()n x F x ( B ) A .是分布函数 B .依概率收敛于()F x C .是一个统计量 D .其数学期望是()F x

相关主题
文本预览
相关文档 最新文档