第二章 总体比例
- 格式:ppt
- 大小:325.50 KB
- 文档页数:33
统计学原理公式第二章数据描述1、组距=上限―下限2、简单平均数: x=Σx/n3、加权平均数:x=Σxf/Σf4、全距: R=xmax-xmin5、方差和标准差:方差是将各个变量值和其均值离差平方的平均数。
其计算公式:22未分组的计算公式:σ=Σ(x-x)/n22分组的计算公式:σ=Σ(x-x)f/Σf 样本标准差则是方差的平方根:21/2未分组的计算公式:s=[Σ(x-x)/(n-1)]2 1/2分组的计算公式:s=[Σ(x-x)f/(Σf-1)]1/2σ=[Σ(x-x)/n] 6、离散系数:总体数据的离散系数:Vσ=σ/x 样本数据的离散系数:Vs=s/x 10、标准分数:标准分数也称标准化值或Z分数,它是变量值与其平均数的离差除以标准差后的值,用以测定某一个数据在该组数据的相对位置。
其计算公式为:Zi=(xi-x)/s标准分数的最大的用途是可以把两组数组中的两个不同均值、不同标准差的数据进行对比,以判断它们在各组中的位置。
第三章参数估计1、统计量的标准误差:(样本误差)(1)在重复抽样时;样本标准误差:σx=σ/n 或σx=s/n 样本的比例误差可表示为:1/21/2σp=[π(1-π)/n] 或σp=[p(1-p)/n] (2)不重复抽样时: 22σx=σ/n×(N-n/N-1) 2σp=p(1-p)/n×(N-n/N-1)2、估计总体均值时样本量的确定,在重复抽样的条件下:222n= Zσ/E3、估计总体比例时样本量的确定,在重复抽样的条件下:22n=Z×p(1-p)/E 4、(1)在大样本情况下,样本均值的抽样分布服从正态分布,因此采用正态分布的检验统计量,当总体方差已知时,总体均值检验统计量为:Z=(x-μ)/( σ/n)(2)当总体方差未知时,可以用样本方差来代替,此时总体均值检验的统计量为:Z=(x-μ)/( s/n) 5、小样本的检验:在小样本(n<30)情况下,检验时,首先假定总体均值服从正态分布。
抽样期末知识点汇总一.绪论(一)抽样调查抽样调查是指非全面调查的总称。
只要是从研究的对象中抽取部分单位加以调查,用来说明全体,就统称为抽样调查。
(广义)选样方法:非概率抽样&概率抽样1.非概率抽样抽样方法:目的抽样、判断抽样、任意抽样、方便抽样、配额抽样(盖洛普民意测验、自愿样本原因:(1)受客观条件限制,无法进行严格的随机抽样。
(2)为了快速获得调查结果。
(3)在调查对象不确定,或无法确定的情况下采用,例如,对某一突发(偶然)事件进行现场调查等。
(4)总体各单位间离散程度不大,且调查员具有丰富的调查经验时。
优点:成本低,而且容易完成;缺点:不能对估计的精度作出客观、准确的说明。
2.概率抽样(狭义抽样调查)按照概率统计的原理,从研究的总体中按随机原则来抽选样本,通过对样本的调查获取数据,以此来对总体的特征作出估计推断;对推断中可能出现的抽样误差可以从概率的意义上加以控制。
特点:(1)对于一个具体的调查,要求总体中的每一个单元都有一个已知的非零概率被抽中。
(2)抽取样本的方法必须是随机的。
(3)根据样本来计算估计值的方法,应符合抽样的方法确定合适的估计量。
(4)能够以一定的概率控制抽样误差的范围。
概率抽样:等概率抽样&不等概率抽样(二)抽样调查的常用概念1. 目标总体:可简称为总体,是指所要研究对象的全体,或者说是希望从中获取信息的总体,它是由研究对象中所有性质相同的个体所组成,组成总体的各个个体称作总体单元或单位。
2.抽样总体:指从中抽取样本的总体。
3.抽样框:抽样总体的具体表现。
通常抽样框是一份包含所有抽样单元的名单。
4.总体参数:总体的特征。
5. 统计量(估计量):样本观察值的函数。
6.抽样误差:由于抽样的非全面性和随机性所引起的偶然性误差。
7.非抽样误差:由随机抽样的偶然性因素以外的原因所引起的误差。
8.抽样误差表现形式:抽样实际误差、抽样标准误和抽样极限误差。
9. 抽样标准误(S ),抽样方差(V ),V=S 210.偏差:样本估计量的数学期望与总体真值间的离差,ˆˆE()-()ˆB θθθ=。
样本比例估计总体比例在统计学的广阔领域中,样本比例估计总体比例是一项极为重要的任务。
它就像是在茫茫大海中,通过手中的一小片拼图去推测整幅画面的模样。
为了理解这一概念,咱们先从“样本”和“总体”说起。
总体,简单来讲,就是我们所关心的整个群体。
比如说,一个城市所有居民的收入情况,这就是一个总体。
而样本呢,是从这个总体中抽取出来的一部分。
就好像从一大桶豆子中抓出一小把来观察。
那为什么我们不直接研究总体,而要通过样本去估计总体呢?这主要是因为在很多情况下,要对整个总体进行研究,要么太耗费时间,要么成本太高,甚至根本就不可能实现。
比如要了解全国所有成年人的身高情况,这几乎是无法做到的,所以我们只能抽取一部分人作为样本进行研究。
样本比例,就是样本中具有某种特征的个体所占的比例。
比如说,在抽取的 100 个人中,有 30 个人喜欢运动,那么样本中喜欢运动的人的比例就是 30%。
而通过这个样本比例来估计总体比例,就是我们要探讨的重点了。
想象一下,如果我们抽取的样本是具有代表性的,也就是说能够很好地反映总体的特征,那么这个样本比例就能够为我们估计总体比例提供有价值的线索。
但是,这里面存在着不确定性和误差。
毕竟样本只是总体的一部分,它不可能完全等同于总体。
就好像通过一个小窗口看外面的风景,虽然能看到一些,但不可能看到全部。
为了更准确地通过样本比例估计总体比例,我们需要考虑很多因素。
首先就是样本的大小。
一般来说,样本越大,估计的准确性就越高。
这就好比小桶里的豆子数量少,估计整桶豆子中某种颜色豆子的比例可能偏差较大;但如果桶里的豆子数量很多,估计就会更准确一些。
抽样的方法也至关重要。
如果抽样是随机的、均匀的,那么样本就更有可能具有代表性。
如果抽样存在偏差,比如只在某个特定的区域或者特定的人群中抽样,那么得到的样本比例很可能不能准确地估计总体比例。
另外,我们还需要考虑置信水平和置信区间。
置信水平就像是我们对估计结果的信心程度,比如 95%的置信水平意味着我们有 95%的把握认为估计结果是准确的。
统计量及其分布习题知识点精析与应用一、填空题(将正确答案的序号填在括号内,共5小题,每小题2分,共10分)1、简单随机抽样样本均值X 的方差取决于 和_________,要使X 的标准差降低到原来的50%,则样本容量需要扩大到原来的 倍。
2、设1217,,,X X X 是总体(,4)N μ的样本,2S 是样本方差,若2()0.01P S a >=,则a =____________。
(注:20.99(17)33.4χ=, 20.995(17)35.7χ=, 20.99(16)32.0χ=, 20.995(16)34.2χ=)3、若(5)X t ,则2X 服从_______分布。
4、已知0.95(10,5) 4.74F =,则0.05(5,10)F 等于___________。
5、中心极限定理是说:如果总体存在有限的方差,那么,随着 的增加,不论这个总体变量的分布如何,抽样平均数的分布趋近于 。
,二、选择题(将正确答案的序号填在括号内,共5小题,每小题2分,共10分)1、中心极限定理可保证在大量观察下A 样本平均数趋近于总体平均数的趋势B 样本方差趋近于总体方差的趋势C 样本平均数分布趋近于正态分布的趋势D 样本比例趋近于总体比例的趋势2、设随机变量()(1)X t n n >,则21/Y X =服从21/Y X = 。
A 正态分布B 卡方分布C t 分布D F 分布3、根据抽样测定100名4岁男孩身体发育情况的资料,平均身高为95cm ,,标准差为0.4cm 。
至少以 的概率可确信4岁男孩平均身高在93.8cm 到96.2cm 之间。
A 68.27%B 90%C 95.45%D 99.73%4、某品牌袋装糖果重量的标准是(500±5)克。
为了检验该产品的重量是否符合标准,现从某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。
下列说法中错误的是( )A 、样本容量为10B 、抽样误差为2C 、样本平均每袋重量是统计量D 、498是估计值5、设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都是服从或近似服从A (100/,25)N nB NC (100,25/)N nD (100,N 三、判断题1、所有可能样本平均数的方差等于总体方差。
第二章抽样调查基本原理第一节有关基本概念一、总体总体也叫母体,它是所要认识对象的全体,是具有同一性质的许多单位的集合。
组成总体的每个个体叫做单位。
总体可以是有限的,也可以是无限的。
如果总体中所包含个体的数目为有限多个,则该总体就是有限总体,反之是无限总体。
总体也可区分成计量总体(由测量值组成的)和计数总体(由品质特征组成的)。
在抽样以前,必须根据实际情况把总体划分成若干个互不重叠并且能组合成总体的部分,每个部分称为一个抽样单元,不论总体是否有限,总体中的抽样单元数一定是有限的,而且是已知的,因此说抽样调查的总体总是有限的。
抽样单元又有大小之分,一个大的抽样单元可以分成若干个小的抽样单元,最小的抽样单元就是每一个个体。
如一项全国性的调查,如果把省作为一级单元,则可以把县作为二级单元,乡作为三级单元,村作为四级单元等等。
又如在流动人口抽样中,可以以居委会作为抽样单元,而在家计调查中,则以户为抽样单元。
总体应具备同质性、大量性和差异性的特征。
在抽样调查中,通常将反映总体数量特征的综合指标称为总体参数。
常见的总体参数主要有:1.总体总和Y:例如全国人口数。
Y=∑yi =y1+y2+…+yN2.总体均值Y:例如职工平均工资。
Y=Y/N=∑y i /N3.总体比率R:是总体中两个不同指标的总和或均值的比值。
如总收入与总支出之比。
R=Y/X=Y/X4.总体比例P:是总体中具有某种特性的单元数目所占比重。
如产品的合格率。
二、样本样本是由从总体中所抽选出来的若干个抽样单元组成的集合体。
抽样前,样本是一个n 维随机变量,属样本空间;抽样后,样本是一个n元数组,是样本空间的一个点。
样本是总体的缩影,是总体的代表。
抽样的效果好不好,依赖于样本对总体是否有充分的代表性。
样本的代表性愈强,用样本指标对总体全面特征的推断就愈精确,即推断的误差就愈小;反之,如果样本的代表性愈弱,推断的误差就愈大,推断结果就愈不可靠。
如何增强样本的代表性,使其能达到估计或推断的预期效果,就必须分析影响样本代表性的因素,以便加强控制。