2021_2022学年高中数学第1章统计55.1估计总体的分布5.2估计总体的数字特征学案北师大版必
- 格式:doc
- 大小:791.00 KB
- 文档页数:12
.
下载后可自行编辑修改,页脚下载后可删除。 5.1 估计总体的分布 5.2 估计总体的数字特征
学
习
目 标 核 心 素 养
1.理解并会运用样本的频率分布估计总体的分布,通过实例体会分布的意义和作用.(重点)
2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图及频率折线图.(难点)
3.能根据给出的频率分布直方图解决具体问题.(难点) 1.通过运用样本的频率分布估计总体分布,体会分布的意义和作用,提升数学抽象素养.
2.通过列频率分布表,画频率分布直方图及折线图提升数据分析素养.
一、根本概念
1.频率分布表和频率分布直方图
(1)频率分布表编制的方法步骤:
计算极差――→决定组数与组距――→决定分点――→列出
频率分布表
(2)
2.频率分布折线图
(1)在频率分布直方图中,按照分组原那么,在左边和右边各加一个区间,从所加的左边区间的中点开场,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.
(2)当样本容量不断增大时,样本中落在每个区间内的样本数的频率会越来越稳定于总体在相应区间内取值的概率.也就是说,一般地,样本容量越大,用样本的频率分布去估计总体的分布就越准确.
(3)随着样本量的增大,所划分的区间数也可以随之增多,而每个区间的长度那么会相应随之减小,相应的频率折线图就会越来越接近于一条光滑曲线.
二、用样本的平均数、方差与标准差估计总体的数字特征 .
下载后可自行编辑修改,页脚下载后可删除。 利用随机抽样得到样本,从样本数据得到的分布、平均数和标准差(通常称之为样本分布、样本平均数和样本标准差)并不是总体真正的分布、平均数和标准差,而只是总体的一个估计,但这个估计是合理的,特别是当样本容量很大时,它们确实反映了总体的信息.
n个样本数据x1,x2,…,xn的平均数
x=1n(x1+x2+…+xn),那么有nx=x1+x2+…+xn.
设样本的元素为x1,x2,…,xn,样本的平均数为x,那么样本的方差s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2] .
样本方差的算术平方根即为样本的标准差,即s=
1n[]x1-x2+x2-x2+…+xn-x2.
思考:在频率分布直方图中,如何求众数、中位数、平均数?
[提示] ①在频率分布直方图中,众数是最高矩形中点的横坐标;
②中位数左边和右边的直方图的面积应该相等;
③平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
1.当收集到的数据量很大时,比拟适宜的统计图是( )
A.茎叶图 B.频率分布直方图
C.频率折线图 D.频率分布表
B [当收集到的数据量很大时,一般用频率分布直方图.]
2.在抽查产品的尺寸过程中,将其尺寸分成假设干组,[a,b)是其中的一组,抽查出的个体在该组上的频率为m,该组上的直方图的高为h,那么|a-b|=( )
A.hm B.mh C.hm D.h+m
B [频率组距=h,故|a-b|=组距=频率h=mh.]
3.频率分布直方图中,小矩形的面积等于( )
A.组距 B.频率
C.组数 D.频数
B [根据小矩形的宽及高的意义,可知小矩形的面积为一组样本数据的频率.]
4.某中学举办电脑知识竞赛,总分值为100分,80分以上为优秀(含80分).现将高一两个班参赛学生的成绩进展整理后分成5组,绘制成频率分布直方图如下图. .
下载后可自行编辑修改,页脚下载后可删除。
图中从左到右的第一、三、四、五小组的频率分别为0.30、0.15、0.10、0.05,而第二小组的频数是40,那么参赛的人数是________,成绩优秀的频率是________.
[设参赛的人数为n,第二小组的频率为1-(0.30+0.15+0.10+0.05)=0.4,
依题意40n=0.4,
∴n=100,优秀的频率是0.10+0.05=0.15.]
画频率分布直方图、折线图
【例1】 一个样本:30,29,26,24,25,27,26,22,24,25,26,28,25,21,23,25,27,29,25,28.
(1)列出样本的频率分布表;
(2)画出频率分布直方图和频率折线图;
(3)根据频率分布直方图,估计总体出现在23~28内的频率是多少.
[解] (1)计算极差:30-21=9.
决定组距和组数:取组距为2.
∵92=412,∴共分5组.
决定分点,使分点比数据多一位小数.
并把第1小组的分点减小0.5,即分成如下5组:
),[22.5,24.5),[24.5,26.5),
[26.5,28.5),[28.5,30.5].
列出频率分布表如下:
分组 频数 频率 频率/组距
[20.5,22.5) 2
[22.5,24.5) 3
[24.5,26.5) 8
[26.5,28.5) 4 .
下载后可自行编辑修改,页脚下载后可删除。 [28.5,30.5] 3
合计 20
(2)作出频率分布直方图如下:
取各小长方形上的中点并用线段连接就构成了频率折线图,如上图.
(3)由频率分布表和频率分布直方图观察得:
样本值出现在23~28之间的频率为0.15+0.40+0.2=0.75,所以可以估计总体中出现在23~28之间的数的频率约为0.75.
绘制频率分布直方图的具体步骤
1.求极差
一组数据的最大值与最小值的差称为极差.
2.决定组距与组数
数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.当样本容量不超过120时,按照数据的多少,常分成5~12组.为方便起见,组距的选择应力求“取整〞.
3.将数据分组
通常对组内数值所在区间取左闭右开区间,最后一组取闭区间.
1.为了了解中学生的身高情况,对实验中学同龄的50名男学生的身高进展了测量,结果如下(单位:cm):
175 168 170 176 167
181 162 173 171 177
171 171 174 173 174
175 177 166 163 160
166 166 163 169 174
165 175 165 170 158
174 172 166 172 167
172 175 161 173 167
170 172 165 157 172
173 166 177 179 181 .
下载后可自行编辑修改,页脚下载后可删除。 列出频率分布表,画出频率分布直方图及频率折线图.
[解] 在这个样本中,最大值为181,最小值为157,它们的极差为24,可以取组距为4,根据题意列出样本的频率分布表如下表:
分组 频数 频率
3
4
12
12
13
4
2
合计 50
由上表画出频率分布直方图及频率折线图如图.
频率分布直方图的应用
【例2】 为了了解高一学生的体能情况,某校抽取局部学生进展一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图如下图,图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)假设次数在110以上(含110次)为达标,试估计该校全体高一学生的达标率是多少?
[解] (1)由于频率分布直方图以面积的形式反映了数据落在各个小组内的频率大小,因此第二小组的频率为42+4+17+15+9+3=0.08. .
下载后可自行编辑修改,页脚下载后可删除。 又因为第二小组频率=第二小组频数样本容量,
所以样本容量=第二小组频数第二小组频率=120.08=150.
(2)由图可估计该校高一学生的达标率约为
17+15+9+32+4+17+15+9+3×100%=88%.
频率分布直方图的性质
1.因为小矩形的面积=组距×频率÷组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.
2.在频率分布直方图中,各小矩形的面积之和等于1.
3.频数÷相应的频率=样本容量.
2.(1)某班50名学生在一次百米跑测试中,成绩全部介于13 s与19 s之间,将测试结果按如下方式分成六组:第一组,成绩大于或等于13 s且小于14 s;第二组,成绩大于或等于14 s且小于15 s;…;第六组,成绩大于或等于18 s且小于或等于19 s,如下图是按上述分组方法得到的频率分布直方图.设成绩小于17 s的学生人数占全班总人数的百分比为x,成绩大于或等于15 s且小于17 s的学生人数为y,那么从频率分布直方图中分析出x和y分别为 ( )
A.0.9,35 B.0.9,45
C.0.1,35 D.0.1,45
(2)某商场在端午节的促销活动中,对某日9时至14时的销售额进展统计,其频率分布直方图如下图.9时至10时的销售额为3万元,那么11时至12时的销售额为________万元. .
下载后可自行编辑修改,页脚下载后可删除。
(1)A (2)12 [由频率分布直方图知x=0.34+0.36+0.18+0.02=0.9,因为y50=0.36+0.34=0.7,所以y=35.应选A.
(2)由频率分布直方图知,9时至10时的销售额的频率为0.1,故销售总额为30.1=30(万元),又11时至12时的销售额的频率为0.4,故销售额为0.4×30=12万元.故填12万元.]
估计总体的数字特征
[探究问题]
1.如何从频率分布直方图中估计中位数?
提示:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值.
2.在条形统计图中怎样估计众数?
提示:众数是最高矩形的中点的横坐标.
3.怎样估计平均数?
提示:平均数的估计值等于频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积的总和.
【例3】 一组数据:
125,121,123,125,127,129,125,128,130,129,126,124,125,127,126,122,124,125,126,128.
(1)填写下面的频率分布表:
分组 频数 频率
[121,123)
[123,125)
[125,127)
[127,129)
[129,131]
合计