统计图表、数据的数字特征和用样本估计总体
- 格式:ppt
- 大小:2.78 MB
- 文档页数:84
用样本估计总体一、用样本的频率分布估计总体分布(1)频数、频率将一批数据按要求分为若干个组,各组内数据的个数,叫做该组的频数。
每组数除以全体数据的个数的商叫做该组的频率。
频率反映数据在每组中所占比例的大小。
(2)样本的频率分布根据随机所抽样本的大小,分别计算某一事件出现的频率,这些频率的分布规律(取值状况),就叫做样本的频率分布。
为了能直观地显示样本的频率分布情况,通常我们会将样本的容量、样本中出现该事件的频数以及计算所得的频率列在一张表中,叫做样本频率分布表。
(3)用样本频率分布估计总体的分布从一个总体得到一个包含大量数据的样本时,我们很难从一个个数字中直接看出样本所含的信息。
如果把这些数据形成频数分布或频率分布,就可以比较清楚地看出样本数据的特征,从而估计总体的分布情况。
用样本估计总体,是研究统计问题的一个基本思想方法,而对于总体分布,我们总是用样本的频率分布对它进行估计。
(4)频率分布直方图的特点从频率分布直方图可以清楚地看出数据分布的总体态势,但是从直方图本身得不出原始的数据内容,所以,把数据表示成直方图后,原有的具体数据信息就被抹掉了。
(5)频率分布折线图把频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,如图所示。
为了方便看图,一般习惯于把频率分布折线图画成与横轴相连,所以横轴上的左右两端点没有实际意义。
(6)总体密度曲线①如果样本容量越大,所分组数越多,频率分布直方图中表示的频率分布就越接近于总体在各个小组内所取值的个数与总数比值的大小。
设想如果样本容量不断增大,分组的组距不断缩小,则频率分布直方图实际上是越来越接近于总体的分布,它可以用一条光滑曲线来描绘,这条光滑曲线就叫做总体密度曲线。
y f x()②总体密度曲线精确地反映了一个总体在各个区域内取值的百分比。
a b内的百分比就是图中带斜线部分的面积。
对本例来说,总体密度曲线呈产品尺寸落在(,)中间高两边低的“钟”形分布,总体的数据大致呈对称分布,并且大部分数据都集中在靠近中间的区间内。
授课主题用样本估计总体教学目标1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.3.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.4.会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.教学内容1.频率分布直方图(1)列出样本数据的频率分布表和频率分布直方图的步骤:①计算极差:找出数据的最大值与最小值,计算它们的差;②决定组距与组数:当样本容量不超过100时,按照数据的多少分成5~12组,且=极差组距组数;③将数据分组:通常对组内数值所在区间区左闭右开区间,最后一组取闭区间;也可以将样本数据多取一位小数分组.④列频率分布表:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.⑤绘制频率分布直方图:以数据的值为横坐标,以频率组距的值为纵坐标绘制直方图。
(2)频率分布直方图的特点:①==⨯频率小长方形的面积组距频率组距,②个小长方形的面积等于1,③1==频率小长方形的高,所有小长方形的高的和组距组距.(3)频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.(4)总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线()y f x=来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地n;n①众数、中位数、平均数都是描述一组数据集中趋势的量,平均数是最重要的量;x的平均数为x,则一组数,,n的平均数为用样本的标准差估计总体的标准差)数据的离散程度可以用极差、方差或标准差来描述;定义样本方差为222212()()()n x x x x x x s n-+-++-=;简化公式:22222121[()]n s x x x nx n=+++-=2222121()n x x x x n+++-(方差等于原数据平方的平均数减去平均数的平方)(4)样本的标准差是方差的算术平方根.样本标准差22212()()()0n x x x x x x s s n-+-++-=≥,.标准差越大数据离散程度越大,数据家分散;标准差越小,数据集中在平均数周围. (5)方差相关结论:①如果一组数12,,,n x x x 的方差为2s ,则一组数12,,,n x a x a x a +++的方差为2s ;②如果一组数12,,,n x x x 的方差为2s ,则一组数12,,,n kx kx kx 的方差为22k s 。
课时作业组——基础对点练.为了解学生“阳光体育”活动的情况,随机统计了名学生的“阳光体育”活动时间(单位:分钟),所得数据都在区间[]内,其频率分布直方图如图所示.已知活动时间在[)内的频数为,则的值为()....解析:根据频率分布直方图,知组距为,所以活动时间在[)内的频率为.因为活动时间在[)内的频数为,所以==.答案:.为了了解某校九年级名学生的体能情况,随机抽查了部分学生,测试分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,根据统计图的数据,下列结论错误的是( ).该校九年级学生分钟仰卧起坐的次数的中位数估计值为次.该校九年级学生分钟仰卧起坐的次数的众数估计值为次.该校九年级学生分钟仰卧起坐的次数超过次的人数约有人.该校九年级学生分钟仰卧起坐的次数少于次的人数约有人解析:由题图可知中位数是次,众数是次,分钟仰卧起坐的次数超过次的频率为,所以估计该校九年级学生分钟仰卧起坐的次数超过次的人数约有人;分钟仰卧起坐的次数少于次的频率为,所以该校九年级学生分钟仰卧起坐的次数少于次的人数约有人.故是错误的,选.答案:.(·西安检测)已知甲、乙两组数据的茎叶图如图所示,若它们的中位数相同,则甲组数据的平均数为( )....解析:由茎叶图知,乙组数据的中位数为=,所以=,所以甲组数据的平均数为=,故选.答案:.(·湖南五市十校联考)某中学奥数培训班共有人,分为两个小组,在一次阶段测试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是,乙组学生成绩的中位数是,则-的值是( )....解析:由甲组学生成绩的平均数是,可得=,解得=.由乙组学生成绩的中位数是,可得=,所以-=,故选.答案:.为了解某校高三学生数学调研测试的情况,学校决定从甲、乙两个班中各抽取名学生的数学成绩(满分分)进行深入分析,得到如图所示的茎叶图,茎叶图中某学生的成绩因特殊原因被污染了,如果甲、乙两个班被抽取的学生的平均成绩相同,则被污染处的数值为( )....解析:由茎叶图可知,乙班的名学生的成绩同时减去,分别为-,-,-,-,=+=,对于甲班,设被污染处的数值为,甲班的名学生的成绩同时减去,所以乙分别为-,-,-,-,-+,所以=+=,所以=,即被污染处的数值为.甲答案:.(·广州检测)在样本的频率分布直方图中,共有个小长方形,若中间一个小长方形的面积等于其他个小长方形的面积和的,且样本容量为,则中间一组的频数为.解析:依题意,设中间小长方形的面积为,则其余小长方形的面积和为,所以=,=,中间一组的频数为×=.。