常用的统计量抽样分布总结
- 格式:doc
- 大小:409.50 KB
- 文档页数:5
抽样与抽样分布在统计学中,抽样是一种常用的数据收集方法,通过从总体中选择一部分样本来进行研究和分析。
抽样的目的是通过样本来推断总体的特征和性质。
在进行抽样时,我们需要了解抽样的方法和抽样分布的概念。
一、抽样方法1. 无偏抽样无偏抽样是指所有样本有相同被选中的机会。
这样可以确保样本的代表性,从而减小样本估计值和总体真值之间的误差。
常见的无偏抽样方法包括简单随机抽样、系统抽样和分层抽样等。
2. 有偏抽样有偏抽样是指样本的选择并不具有相等的机会。
这样可能导致样本的代表性不足,从而产生较大的估计误差。
有时,有偏抽样也可以用于特定的研究目的,但需要明确地说明和分析偏差带来的影响。
二、抽样分布1. 抽样分布的概念抽样分布是指统计量在各个可能样本上的取值分布。
统计量可以是样本均值、样本方差等。
抽样分布的性质对于进行统计推断和假设检验非常重要。
2. 样本均值的抽样分布样本均值的抽样分布在中心极限定理的条件下近似服从正态分布。
中心极限定理指出,当样本容量足够大时,无论总体分布如何,样本均值的抽样分布都会接近正态分布。
3. 样本比例的抽样分布样本比例的抽样分布在满足一些条件的情况下也近似服从正态分布。
这些条件包括样本容量足够大、总体比例接近0.5以及样本与总体之间的独立性等。
4. 样本方差的抽样分布样本方差的抽样分布不服从正态分布。
通常情况下,样本方差的抽样分布呈右偏态,即偏度大于0。
为了得到样本方差的抽样分布,可以使用抽样分布的近似分布,如卡方分布。
三、应用案例抽样与抽样分布的方法和理论在实际统计学中有广泛的应用。
以下是一些常见的应用案例:1. 调查研究在进行调查研究时,我们经常需要从总体中选择一部分样本进行问卷调查或面访。
通过利用抽样与抽样分布的方法,我们可以将样本的调查结果推广到总体中,从而得到总体的特征和性质。
2. 假设检验假设检验是统计学中常用的推断方法之一。
通过比较样本统计量与假设的总体参数值,我们可以判断假设的合理性。
抽样分布与中心极限定理例题和知识点总结在统计学中,抽样分布和中心极限定理是非常重要的概念,它们为我们进行数据分析和推断提供了坚实的理论基础。
接下来,让我们通过一些具体的例题来深入理解这两个重要的知识点。
首先,我们来了解一下什么是抽样分布。
抽样分布是指从一个总体中抽取一定数量的样本,由这些样本计算出的统计量(如均值、方差等)所形成的概率分布。
比如说,我们从一个正态分布的总体中抽取样本容量为 n 的样本,计算每个样本的均值。
当我们重复抽取大量的样本,并将这些样本均值进行整理,就会得到样本均值的抽样分布。
中心极限定理则指出,无论总体的分布如何,只要样本容量足够大,样本均值的抽样分布就近似服从正态分布。
这是一个极其强大的定理,它使得我们在很多情况下可以利用正态分布的性质来进行统计推断。
下面通过几个例题来加深对这些概念的理解。
例题 1:假设一个总体的均值为μ = 50,标准差为σ = 10。
从这个总体中抽取样本容量为 n = 36 的样本。
求样本均值的抽样分布的均值和标准差。
根据抽样分布的性质,样本均值的抽样分布的均值等于总体均值,即μₓ̅=μ = 50。
样本均值的抽样分布的标准差(也称为标准误差)为σₓ̅=σ /√n = 10 /√36 = 10 / 6 = 5 / 3 。
例题 2:一个总体服从均匀分布,其范围在 0 到 10 之间。
抽取样本容量为 n = 100 的样本。
请问样本均值的抽样分布近似服从什么分布?由于样本容量 n = 100 较大,根据中心极限定理,样本均值的抽样分布近似服从正态分布。
接下来,我们总结一下抽样分布和中心极限定理的重要知识点。
抽样分布的关键知识点包括:1、样本均值的抽样分布的均值等于总体均值。
2、样本均值的抽样分布的标准差(标准误差)等于总体标准差除以样本容量的平方根。
中心极限定理的要点为:1、不管总体的分布形状如何,只要样本容量足够大(通常n ≥ 30),样本均值的抽样分布就近似服从正态分布。
高等教育自学考试辅导《概率论与数理统计(经管类)》第二部分数理统计部分专题一统计量及抽样的分布I.考点分析近几年试题的考点分布和分数分布II.内容总结一、总体与样本1.总体:所考察对象的全体称为总体;组成总体的每个基本元素称为个体。
2.样本:从总体中随机抽取n个个体x1,x2…,x n称为总体的一个样本,个数n称为样本容量。
3.简单随机样本如果总体X的样本x1,x2…,x n满足:(1)x1与X有相同分布,i=1,2,…,n;(2)x1,x2…,x n相互独立,则称该样本为简单随机样本,简称样本。
得到简单随机样本的方法称为简单随机抽样方法。
4.样本的分布(1)联合分布函数:设总体X的分布函数为F(x),x1,x2…,x n为该总体的一个样本,则联合分布函数为二、统计量及其分布1.统计量、抽样分布:设x1,x2…,x n为取自某总体的样本,若样本函数T=T(x1,x2…,x n)不含任何未知参数,则称T为统计量;统计量的分布称为抽样分布。
2.样本的数字特征及其抽样分布:设x1,x2…,x n为取自某总体X的样本,(2)样本均值的性质:①若称样本的数据与样本均值的差为偏差,则样本偏差之和为零,即②偏差平方和最小,即对任意常数C,函数时取得最小值. (5)样本矩(7)正态分布的抽样分布A.应用于小样本的三种统计量的分布的为自由度为n的X2分布的α分位点.求法:反查X 2分布表.III.典型例题[答疑编号918020101]答案:D[答疑编号918020102]答案:[答疑编号918020103]答案:B[答疑编号918020104]答案:1[答疑编号918020105]答案:B[答疑编号918020106]故填20.[答疑编号918020107]解析:[答疑编号918020108]答案:解析:本题考核正态分布的叠加原理和x2-分布的概念。
根据课本P82,例题3-28的结果,若X~N(0,1),Y~N(0,1),且X与Y相互独立,则X+Y~N(0+0,1+1)=N(0,2)。
抽样知识点总结一、抽样的基本概念1.1 总体和样本总体是指研究对象的全体,样本是从总体中抽取的一部分个体。
总体是研究的对象,样本是研究的实际观察单位。
1.2 抽样误差抽样误差是指由于抽样方法所导致的样本与总体之间的偏差。
抽样误差分为随机误差和系统误差两种,随机误差是由抽样本身的不确定性所引起,系统误差是由于抽样方法的偏差或者样本数据的不准确性所引起。
1.3 抽样分布抽样分布是一组样本统计量的概率分布,它反映了在不同样本情况下的统计量的变动情况。
1.4 抽样方法常见的抽样方法包括简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样等。
不同的抽样方法适用于不同的研究问题和数据特点。
二、抽样的基本原则2.1 代表性原则样本应当具有代表性,即能够准确地反映总体的特征和变动情况。
2.2 随机性原则抽样过程应当具有一定的随机性,以消除个体之间的偏好或者主观意愿。
2.3 独立性原则各个样本之间应当是相互独立的,互不影响,以确保样本数据的独立性和可靠性。
2.4 信息量原则样本应当具有足够的信息量,即能够为研究问题提供充足的数据支持。
三、抽样的实施步骤3.1 确定研究目标首先需要确定研究问题,明确所需的样本特征和数据信息。
3.2 制定抽样方案根据研究目标和总体特征,选择合适的抽样方法,并确定抽样的规模和抽样的程序。
3.3 抽取样本按照抽样方案进行抽样,获取符合要求的样本数据。
3.4 数据分析与推断对抽样数据进行分析和推断,从而得出关于总体特征和规律的结论。
3.5 结果解释与应用根据抽样研究的结论和推断结果,进行结果的解释和应用,为决策和实践提供支持和参考。
四、抽样的应用4.1 统计调查抽样是统计调查中常用的一种数据收集方法,可以节省人力物力,减小成本,提高工作效率。
4.2 市场调查在市场营销中,抽样可以帮助企业更加准确地了解消费者的需求和偏好,指导产品开发和促销策略。
4.3 健康调查抽样在健康调查中发挥着重要作用,可以了解社会群体的健康状况和问题,为政府和企业提供决策支持。
第六章 样本及抽样分布 总体与个体:我们将试验的全部可能的观察值称为总体,这些值不一定都不相同,数目上也不一定是有限的,每一个可能观察值称为个体 总体中所包含的个体的个数称为总体的容量 容量为有限的称为有限总体 容量为无限的称为无限总体设X 是具有分布函数F 的随机变量,若,,21X X …n X ,是具有同一分布函数F 的、相互独立的随机变量,则称,,21X X …n X ,为从分布函数F (或总体F 、或总体X )得到的容量为n 的简单随机样本,简称样本,它们的观察值,,21x x …n x ,称为样本值,又称为X 的n 个独立的观察值由定义得:若,,21X X …n X ,为F 的一个样本,则,,21X X …n X ,相互独立,且它们的分布函数都是F ,所以(,,21X X …n X ,)的分布函数为,,(21*x x F …)(),1∏==ni i n x F x又若X 具有概率密度f ,则(,,21X X …n X ,)的概率密度为,,(21*x x f …).(),1∏==ni i n x f x设,,21X X …n X ,是来自总体X 的一个样本,g(,,21X X …n X ,)是,,21X X …n X ,的函数,若g 中不含未知参数,则称g(,,21X X …n X ,)是一统计量设,,21X X …n X ,是来自总体X 的一个样本,n x x x ,^,,21是这一样本的观察值,定义:样本平均值∑==ni i X n X 11样本方差⎪⎭⎫ ⎝⎛--=--=∑∑==n i i n i i X n X n X X n S 12221211)(11样本标准差∑=--==ni i X X n S S 122)(11 样本k 阶(原点)矩,2,1,11==∑=k X n A n i ki k …样本k 阶中心矩,3,2,)(11=-=∑=k X X n B k ni i k …经验分布函数设,,21X X …n X ,是总体F 的一个样本,用∞<<-∞x x S ),(表示,,21X X …n X ,中不大于x 的随机变量的个数。
常用的统计量抽样分布一.正态分布1. ∑==ni i X n X 11EX →2. 212)(11∑=--=n i i X X n S ][11212∑=--=n i i X n X n DX →3. 定理:X ~),(2σμN ,n X X X ,,,21 为X 的样本,则 (1). X ~),(2nN σμ,(2).22)1(σS n -~)1(2-n χ,(3). X 与2S 相互独立。
二.2χ分布 1. 定义设n X X X ,,,21 独立同分布,且~)1,0(N ,则)(~2122n X ni i χχ∑==2. 性质:(1). 若X ~)(12n χ,Y ~)(22n χ,且X ,Y 独立,则X +Y ~)(212n n +χ。
(2). 若X ~)(2n χ,则n EX =,2DX n =。
三.t 分布 1. 定义设X ~)1,0(N ,Y ~)(2n χ,且X ,Y 独立,则nY X T =~)(n t 。
2. 定理:设n X X X ,,,21 独立同分布,且~),(2σμN ,则nS X μ-σσμSn X )(-=1)1()(22---=n Sn n X σσμ~)1(-n t(因为nX σμ-~)1,0(N ,22)1(σS n -~)1(2-n χ)。
3. 定理:设1,,,21n X X X 为总体X ~),(21σμN 的样本,1,,,21n Y Y Y 为总体Y ~),(22σμN 的样本,且Y X ,独立,则212111)()(n n S Y X w+---μμ~)2(21-+n n t ,其中2)1()1(212222112-+-+-=n n S n S n S w。
证:因为2211)1(σS n -~)1(12-n χ,2222)1(σS n -~)1(22-n χ,所以2222211)1()1(σS n S n -+-~)2(212-+n n χ;又X ~),(121n N σμ,Y ~),(222n N σμ,所以X Y -~),(221221n n N σσμμ++,所以212111)()(n n Y X +---σμμ~)1,0(N ,所以 212111)()(n n S Y X w+---μμ212111)()(n n Y X +---=σμμ/)2/()1()1(212222211-+-+-n n S n S n σ~)2(21-+n n t 。
四.F 分布 1. 定义设U ~)(12n χ,V ~)(22n χ,且V U ,独立,则21n Vn UF =~),(21n n F 。
2. 定理:设F ~),(21n n F ,则F1~),(12n n F 3. 定理:设1,,,21n X X X 为总体X ~),(211σμN 的样本,1,,,21n Y Y Y 为总体Y ~),(222σμN 的样本,且Y X ,独立,则)1,1(~//2122222121--=n n F S S F σσ。
常用的统计量抽样分布示例例 1 设2521X X X ,,是来自总体()1~2χX 的一个样本,则∑=251i iX服从()252χ分布;例2设随机变量21,X X ,3X 相互独立,1X ~)1,0(N ,2X ~)21,0(N ,3X ~)31,0(N ,则23222132X X X ++服从)3(2χ分布。
例3 设总体X 服从)2,0(2N ,而1521,,,X X X 为来自总体X 的简单随机样本,则随机变量)(22152112102221x X X X X Y ++++= 服从)5,10(F 分布。
例 4 设随机变量Y X ,相互独立且都服从)3,0(2N ,而921,,,X X X 和921,,,Y Y Y 为分别来自总体X 和Y 的简单随机样本,则统计量2921921YY X X X U ++++=服从)9(t 分布。
例5 设n X X X ,,,21 )2(≥n 为来自总体)1,0(N 的简单随机样本,X 是样本均值,2S 是样本方差,则 D .(A). X n ~)1,0(N (B) 2nS ~)(2n χ(C). S Xn )1(-~)1(-n t (D) ∑=-ni iX X n 2221)1(~)1,1(-n F 解:∑=-ni iXX n 2221)1(∑=-=ni in XX 22211/1/~)1,1(-n F例6 设总体X 服从),(21σμN ,总体Y 服从),(22σμN ,1,,,21n X X X 为来自总体X 的简单随机样本,2,,,21n Y Y Y 为来自总体Y 的简单随机样本,则=-+-+-∑∑==]2)()([21112212n n Y Y X XE n i n i i i2σ解:原式2121)([211∑=--+=n i i X X E n n ])(212∑=-+ni i Y Y1221212()1{[]2n ii XX E n n σσ=-=++-∑2212()[]}n ii Y Y E σ=-∑又221)(1σ∑=-n i iX X221)1(σSn -=~)1(12-n χ,故22122()[]1n ii XX E n σ=-=-∑,从而12111()11n ii XX En n =-=--∑,同理22122()11n ii Y Y En n =-=--∑,所以原式=2σ。
例7. 设n X X X ,,,21 )2(>n 为来自总体),0(2σN 的简单随机样本,X是样本均值,记X X Y i i -=,n i ,,2,1 = 。
求: (1). i Y 的方差i DY ,n i ,,2,1 = ; (2). ),(1n Y Y Cov ; (3) }0{1≤+n Y Y P 。
(4)若21)(n Y Y c +是2σ的无偏估计,求c 的值。
解:(1)i DY )(X X D i -=(i X n )11(- 与∑≠=n ik k k X n ,11独立) ]1)11[(,1∑≠=--=n i k k k i X n X n D 222221)1(1)11(σσσn n n nn -=-+-=,n i ,,2,1 = 。
(2) 0)(11=-==X X E EY EY n ,),(1n Y Y Cov ))((11n n EY Y EY Y E --=))((1X X X X E n --= )(1n X X E =)(2X E +)()(1X X E X X E n --1X ,n X 独立,)(1n X X E ∴01=⋅=n EX EX )(X D )(2X E =2)(X E -)(2X E =而)(X D ][21n X X X D n ++=21n=)(1n DX DX ++ 21σn ==++=)}()()({1)(121211n X X E X X E X E n X X E 2211)(1σnX E n =,=++=})()()({1)(221n n n n X E X X E X X E n X X E 221)(1σnX E n n =所以),(1n Y Y Cov )(X D =21σn -21σn -=21σn-(3)=+n Y Y 1)()(1X X X X n -+-∑-=--+-=121222n i i n X n X n n X n n 上式是相互独立的正态随机变量的线性组合,所以n Y Y +1服从正态分布,由于,0)(1=+n Y Y E 所以5.0}0{1=≤+n Y Y P 。
(4)])([21n Y Y c E +)(1n Y Y cD +=)],(2[11n n Y Y Cov DY DY c ++=2]211[σn n n n n c --+-=2)2(2σc nn -=2σ=,故)2(2-=n n c 。