《统计》统计与概率课件(用样本估计总体)
- 格式:pptx
- 大小:2.91 MB
- 文档页数:34
《用样本估计总体》讲义在我们的日常生活和各种科学研究中,常常需要从部分数据(样本)来推断整体的情况(总体)。
这就好像我们通过观察一小部分苹果的质量,来推测整批苹果的质量好坏;或者根据部分学生的考试成绩,来估计整个班级的学习水平。
这种用样本估计总体的方法,是统计学中非常重要的一种手段。
一、为什么要用样本估计总体首先,我们来思考一下,为什么不能直接研究总体呢?这往往是因为总体的数量太大、获取全部数据的成本太高或者根本就不可能获取到全部数据。
比如说,要调查全国所有成年人的身高,这几乎是不可能完成的任务。
但如果我们抽取一部分具有代表性的成年人作为样本,通过对这些样本的测量和分析,就能够对全国成年人的身高情况做出一个相对准确的估计。
用样本估计总体还有一个重要的原因,那就是能够节省时间和资源。
想象一下,如果要对一个大型工厂生产的所有零件进行质量检测,那需要耗费大量的人力、物力和时间。
而通过抽取一定数量的零件作为样本进行检测,就能在较短的时间内,以较小的成本对整批零件的质量有一个大致的了解。
二、样本与总体的关系样本是从总体中抽取出来的一部分个体或观测值。
总体则是我们所关心的研究对象的全体。
样本应该具有代表性,也就是说,样本的特征应该能够反映总体的特征。
举个例子,如果要研究一个城市居民的收入水平,不能只抽取高收入人群作为样本,也不能只抽取低收入人群,而应该按照一定的比例,从不同收入层次的人群中抽取样本,这样得到的样本才能较好地代表总体的收入情况。
样本的大小也会影响估计的准确性。
一般来说,样本越大,估计的准确性就越高。
但样本大小也不是越大越好,因为过大的样本会增加调查的成本和难度。
所以,在实际应用中,需要根据具体情况,选择合适的样本大小。
三、抽样方法为了获得具有代表性的样本,我们需要采用合适的抽样方法。
常见的抽样方法有简单随机抽样、分层抽样和系统抽样。
简单随机抽样是最基本的抽样方法,就是从总体中随机地抽取个体,每个个体被抽取的概率相等。
授课主题用样本估计总体教学目标1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.3.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.4.会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.教学内容1.频率分布直方图(1)列出样本数据的频率分布表和频率分布直方图的步骤:①计算极差:找出数据的最大值与最小值,计算它们的差;②决定组距与组数:当样本容量不超过100时,按照数据的多少分成5~12组,且=极差组距组数;③将数据分组:通常对组内数值所在区间区左闭右开区间,最后一组取闭区间;也可以将样本数据多取一位小数分组.④列频率分布表:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.⑤绘制频率分布直方图:以数据的值为横坐标,以频率组距的值为纵坐标绘制直方图。
(2)频率分布直方图的特点:①==⨯频率小长方形的面积组距频率组距,②个小长方形的面积等于1,③1==频率小长方形的高,所有小长方形的高的和组距组距.(3)频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.(4)总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线()y f x=来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地n;n①众数、中位数、平均数都是描述一组数据集中趋势的量,平均数是最重要的量;x的平均数为x,则一组数,,n的平均数为用样本的标准差估计总体的标准差)数据的离散程度可以用极差、方差或标准差来描述;定义样本方差为222212()()()n x x x x x x s n-+-++-=;简化公式:22222121[()]n s x x x nx n=+++-=2222121()n x x x x n+++-(方差等于原数据平方的平均数减去平均数的平方)(4)样本的标准差是方差的算术平方根.样本标准差22212()()()0n x x x x x x s s n-+-++-=≥,.标准差越大数据离散程度越大,数据家分散;标准差越小,数据集中在平均数周围. (5)方差相关结论:①如果一组数12,,,n x x x 的方差为2s ,则一组数12,,,n x a x a x a +++的方差为2s ;②如果一组数12,,,n x x x 的方差为2s ,则一组数12,,,n kx kx kx 的方差为22k s 。