第5章抽样分布与抽样方法.

格式：ppt
大小：1.19 MB
文档页数：80

下载文档原格式

/ 80

社会调查研究方法教案第5章抽样

第5章抽样（8学时）第一节抽样的意义与作用一、抽样的概念1．总体总体(population)通常与构成它的元素共同定义：总体是构成它的所有元素的集合，元素则是构成总体的最基本单位。

2．样本样本(sample)就是从总体中按一定方式抽取出的—部分元素的集合。

或者说一个样本就是总体的一个子集。

3．抽样明白了总体和样本的概念，再来理解抽样的概念就十分容易了。

所谓抽样(sampling)，指的是从组成某个总体的所有元素的集合中，按一定的方式选择或抽取一部分元素(即抽取总体的一个子集)的过程，或者说，抽样是从总体中按一定方式选择成抽取样本的过程。

4．抽样单位抽样单位(sampling unit)就是一次直接的抽样所使用的基本单位。

抽样单位与构成总体的元素有时是相同的，有时又是不同的。

5．抽样框抽样框(sampling frame)又称做抽样X围，它指的是一次直接抽样时总体中所有抽样单位的。

6．参数值参数值(parameter)也称为总体值，它是关于总体中某一变量的综合描述，或者说是总体中所有元素的某种特征的综合数量表现。

在统计中最常见的总体值是某一变量的平均值，7．统计值统计值(statistic)也称为样本值，它是关于样本中某一变量的综合描述，或者说是样本中所有元素的某种特征的综合数量表现。

样本值是从样本的所有元素中计算出来的，它是相应的总体值的估计量。

二、抽样的作用在社会研究中，抽样主要解决的是对象的选取问题，即如何从总体中选出一部分对象作为总体的代表的问题。

本章一开始我们就说过，一项社会研究若能对总体中的全部个体都进行了解，那当然是很好的。

但实际上广大研究人员在时间、经费、人力等方面遇到难题，甚至陷入困境，从而不得不在庞大的总体与有限的时间、人力、经费这二者之间寻求平衡。

以现代统计学和概率论为基础的现代抽样理论，以及不断发展、不断完善的各种抽样方法．正好适应了社会研究的发展和应用的需要，成为社会研究知识体系中必不可少的一部分内容。

抽样与抽样分布

抽样与抽样分布在统计学中，抽样是一种常用的数据收集方法，通过从总体中选择一部分样本来进行研究和分析。

抽样的目的是通过样本来推断总体的特征和性质。

在进行抽样时，我们需要了解抽样的方法和抽样分布的概念。

一、抽样方法1. 无偏抽样无偏抽样是指所有样本有相同被选中的机会。

这样可以确保样本的代表性，从而减小样本估计值和总体真值之间的误差。

常见的无偏抽样方法包括简单随机抽样、系统抽样和分层抽样等。

2. 有偏抽样有偏抽样是指样本的选择并不具有相等的机会。

这样可能导致样本的代表性不足，从而产生较大的估计误差。

有时，有偏抽样也可以用于特定的研究目的，但需要明确地说明和分析偏差带来的影响。

二、抽样分布1. 抽样分布的概念抽样分布是指统计量在各个可能样本上的取值分布。

统计量可以是样本均值、样本方差等。

抽样分布的性质对于进行统计推断和假设检验非常重要。

2. 样本均值的抽样分布样本均值的抽样分布在中心极限定理的条件下近似服从正态分布。

中心极限定理指出，当样本容量足够大时，无论总体分布如何，样本均值的抽样分布都会接近正态分布。

3. 样本比例的抽样分布样本比例的抽样分布在满足一些条件的情况下也近似服从正态分布。

这些条件包括样本容量足够大、总体比例接近0.5以及样本与总体之间的独立性等。

4. 样本方差的抽样分布样本方差的抽样分布不服从正态分布。

通常情况下，样本方差的抽样分布呈右偏态，即偏度大于0。

为了得到样本方差的抽样分布，可以使用抽样分布的近似分布，如卡方分布。

三、应用案例抽样与抽样分布的方法和理论在实际统计学中有广泛的应用。

以下是一些常见的应用案例：1. 调查研究在进行调查研究时，我们经常需要从总体中选择一部分样本进行问卷调查或面访。

通过利用抽样与抽样分布的方法，我们可以将样本的调查结果推广到总体中，从而得到总体的特征和性质。

2. 假设检验假设检验是统计学中常用的推断方法之一。

通过比较样本统计量与假设的总体参数值，我们可以判断假设的合理性。

第5章--抽样分布与参数估计教案资料

(5)
(5.5)
(6)
(6.5)
(7)
(7.5)
(8)
(8.5)
(9)
9
9,1
9,2
9,3
9,4
9,5
9,6
9,7
9,8
9,9
9,10
(5)
(5.5)
(6)
(6.5)
(7)
(7.5)
(8)
(8.5)
(9)
(9.5)
10
10,1
10,2
10,3
10,4
10,5
10,6
10,7
10,8
10,9
10,10
数是，标准差是，从这个总体中抽出一个容量是 n 的样本，则样本平均数 X 也服从正态分布，其平均数 E( X ) 仍为，其标准
差为。 X 5-19
从正态分布的再生定理可以看出，只要总体变量服从正态分布，则从中抽取的样本，不管n 是多少，样本平均数都服从正态分布。但是在客观实际中，总体并非都是正态分布。对于从非正态分布的总体中抽取的样本平均数的分布问题，需要由中心极限定理来解决。
第5章--抽样分布与参数估计
第一节抽样的基本概念与数学原理
一、有关抽样的基本概念二、大数定理与中心极限定理
5-2
一、有关抽样的基本概念
（一）样本容量与样本个数 1.样本容量。样本是从总体中抽出的部分
单位的集合，这个集合的大小称为样本容量，一般用n表示，它表明一个样本中所包含的单位数。
lim
n
1 n
p
n
i 1
X
i
1
(5.5)
5-17
大数定理表明：尽管个别现象受偶然因素影响，有各自不同的表现。但是，对总体的大量观察后进行平均，就能使偶然因素的影响相互抵消，消除由个别偶然因素引起的极端性影响，从而使总体平均数稳定下来，反映出事物变化的一般规律。

统计学之抽样与抽样分布

的抽样分布
统计推断的过程
• 总体均值
m=?
• 从总体中抽取 • 样本容量为 n 的样本
• 用作为m 的点估计
• 计算样本平均值
的抽样分布
的抽样分布是指所有可能的样本平均值的概率分布
的期望值
E( ) = = 总体平均值
的抽样分布
的标准差
•
有限总体
无限总体
• 当 n/N < .05时，可以将一个有限总体看作是无限
统计学之抽样与抽样分布
2020年4月29日星期三
Chapter 7
抽样和抽样分布
本章主要内容
简单随机抽样点估计抽样分布样本平均值的抽样分布样本比例的抽样分布抽样方法
•n = 100
•n = 30
统计推断
统计推断的目的是利用样本的信息推断总体的信息总体是指感兴趣的所有元素的集合样本是总体的一个子集通过样本统计量对总体参数进行估计只要抽样方法恰当，通过样本统计量可以对总体参数进行很好的估计
也就是说，样本平均值在总体平均值+/-10分范围内的概率为0.5036
•面积 = 2(.2518) = .5036
• 的抽样分布
•980 •990•1000
的抽样分布
的抽样分布是指所有可能的样本比例的概率分布的期望值
p = 总体比例
的抽样分布
的标准差有限总体
无限总体
• 也称为样本比例的标准误
总体
•
称为有限总体校正因子.
• 也称为样本均值的标准误
的抽样分布
中心极限定理：只要样本容量足够大 (n > 30)，不管总体服从什么分布，样本平均值都可以认为近似服从正态分布。

抽样与抽样分布(试题及答案)

第五章抽样与抽样分布一、单项选择题(以下每小题各有四项备选答案，其中只有一项是正确的。

)1．抽样推断的主要目的是( )。

A．用统计量来推算总体参数B．对调查单位作深入研究C．计算和控制抽样误差D．广泛运用数学方法[答案] A[解析] 抽样调查是指从总体中按随机原则抽取部分单位作为样本，进行观察研究，并根据这部分单位的调查结果来推断总体，以达到认识总体的一种统计调查方法，因此，抽样推断的主要目的是用已知的统计量来推算未知的总体参数。

2．抽样调查中，无法消除的误差是( )。

A．抽样误差B．责任心误差C．登记误差D．系统性误差[答案] A[解析] 抽样误差是指在遵循了随机原则的条件下，不包括登记误差和系统性误差在内的，用样本指标代表总体指标而产生的不可避免的误差。

3．在其他条件相同的情况下，重复抽样的抽样平均误差和不重复抽样相比，( )。

A．前者一定小于后者B．前者一定大于后者C．两者相等D．前者可能大于，也可能小于后者[答案] B[解析] 以抽样平均数的抽样平均误差为例进行说明：在重复抽样条件下，抽样平均数的平均误差的计算公式：；在不重复抽样条件下，抽样平均数的平均误差的计算公式：。

因为，故。

4．拟分别对甲、乙两个地区大学毕业生在试用期的工薪收入进行抽样调查。

据估计甲地区大学毕业生试用期月工薪的方差要比乙区高出一倍。

在样本量和抽样方法相同的情况下，甲区的抽样误差要比乙区高( )。

A．41.4% B．42.4% C．46.8% D．48.8%[答案] A[解析] 假设乙地区的大学毕业生试用期月工薪的方差为σ2，甲地区的大学毕业生试用期月工薪的方差为2σ2，则：，那么，在样本量和抽样方法相同的，情况下，甲区的抽样误差要比乙区高=41.4%。

5．对某天生产的2000件电子元件的耐用时间进行全面检测，又抽取5%进行抽样复测，资料如表5-1所示。

表5-1耐用时间(小时) 全面检测(支) 抽样复测(支)3000以下3000～4000 4000～5000 50600990230505000以上总计36020018100规定耐用时间在3000小时以下为不合格品，则该电子元件合格率的抽样平均误差为( )。

第五章抽样法

抽样的作用

抽样调查能够解决全面调查无法或难以解决的问
题。

抽样调查可以补充和订正全面调查的结果。
抽样调查方法可以用于生产过程中产品质量的检
查和控制。抽样调查方法可以用于对总体的某种假设进行检验，以判断这种假设的真伪，决定行动的取舍。

抽样中的几个基本术语
总体(Population)：调查研究的事物或现象的全体个体(Item unit)：组成总体的每个元素
一、抽样的概念、特点、作用二、抽样中的基本术语（一）总体和样本（二）参数和统计量（三）样本容量和样本个数（四）重复抽样和不重复抽样（五）概率抽样与非概率抽样（六）抽样框三、抽样误差
抽样的概念特点
（一）概念抽样调查是按照随机原则从全部研究对象中抽取一部分单位进行观察，并依据获得的数据对全部研究对象的数量特征做出具有一定可靠性的估计和判断.达到对现象总体认识的一种方法. （二）特点它是按照随机原则从总体中抽取样本。它是由部分推算整体的一种方法。它是运用概率估计的方法。抽样误差可事先计算并加以控制。
抽样中的几个基本术语
X
i 1 N
总体均值
X
i
N
或
X F
i 1 K i
K
i
F
i 1
i
标准差

X
N i 1
i
X
2
N
或
X
K i 1
i K
X Fi
i
2
F
i 1
抽样中的几个基本术语
总体方差
2
( X i X )2
i 1
N
N
或
( X i X ) 2 Fi

《统计学原理》第5章：抽样推断

σ
n )
抽样推断的基本原理
抽样推断的优良标准
设θ 为待估计的总体参数， θ为样本统计量，则 θ的优良标准为：１若 E(θ ) =θ ，则称 θ为 θ 的无偏估计量（无偏性）
更有效的估计量（有效性）２若σθ1 < σθ2，则称θ1为比θ2
３若越大σθ 越小，则称 θ 为θ 的一致估计量（一致性）
即中选成分相同但中选顺序不同的视为同一样本
抽样推断的一般问题
抽样组织方式
简单随机抽样类型抽样整群抽样等距抽样多阶段抽样多重抽样
抽样推断的一般问题
样本可能数目
按照一定的抽样方法和组织方式,从总体N中抽取n个单位构成样本,一共可以抽出的不同样本的数量,一般用M表示. 考虑顺序的不重复抽样考虑顺序的重复抽样不考虑顺序的不重复抽样不考虑顺序的重复抽样
抽样推断的一般问题
全及总体指标：参数（未知量）统计推断样本总体指标：统计量（已知量）
抽样推断的一般问题
抽样推断的特点按随机原则抽取样本运用概率论的理论和方法，用样本指标来推断总体指标。推断的误差可以事先计算和控制。
抽样推断的一般问题
抽样推断的应用无法或很难进行全面调查而又需要了解其全面情况时某些可以采用全面调查的社会经济现象，也可采用抽样推断。可用于生产过程的质量控制进行假设检验
抽样推断的基本原理
抽样推断的优良标准——有效性中位数的抽样分布
9 8 7 6 5 4 3 2 1 0 -1 45 50 55 60 65 70 75
平均数的抽样分布
E(x) =
E ( me ) =
e
σx <σm
抽样推断的基本原理

曾五一应用统计学第5章

2
(
)
(
)
2
P =
n1 n
σ 2 ( P ) = P( 1 − P )
二、样本容量与样本个数 1.样本容量。样本集合的大小称为样本容量，一般用n表示。一般地，样本容量大于30的样本称为大样本，不超过30的样本称为小样本。 2.样本个数。样本个数又称样本可能数目，它是指从一个总体中可能抽取多少种样本。样本个数的多少与抽样方法有关。
Xi = ∑ X ij
j =1 M
M 样本平均是： X=
i =1 j =1
(i = 1,2,L, r )
∑ ∑ X ij rM
r M
= i =1
∑Xi r
r
群间方差是： 2 ∑ (µ i − µ ) 2 δ = R 或者由样本数据估计： −X δ2 r 由于整群抽样都采用不重复抽样的方法，所以样本平均数的标准差是：
四、抽样组织的设计 1.简单随机抽样是基本抽样组织方式 2.类型抽样与整群抽样比较 (1)减小类型抽样中样本平均数标准差的办法。 (2)减小整群抽样的样本平均数标准差的办法。
第四节大数定理与中心极限定理
大数定理：独立同分布的随机变量 X1，X2，…,Xn，…，设它们的平均数为 µ ，方差为 σ 2 ，即， E ( X i ) = X ， σ 2 ( X i ) = σ 2 ，(i=1,2,…)。则对任意的正数 ε，有： 1 n lim p ∑ X i − µ < ε = 1 n→∞ n i =1
解：样本平均数（平均每次加油量） X = 用样本组间方差代替总体组间方差：
i =1
∑ Xi r
r
=
330 = 33 (公斤) 10
δ2
∑ (X =

医药统计学第五章抽样分布

3、总体参数（parameter）: 总体X 的数字特征即总体的特征指标。
eg：、。
（三）样本（sample）：数理统计方法实质上是由局部来推断整体，即通过一些个体的特征来推断总体的特征。 eg：观察某显像管厂所有显像管的平均寿命。
1、抽样研究（sampling）：在实际工作中，所要研究的总体无论是有限的还是无限的，通常都是采用抽样研究。
抽样：依照一定的规则从总体X 中抽取n个个体，然后对这
些个体进行测试或观察得到一组数据
。
目的：抽样研究的目的是用样本信息推断总体特征。
eg：
从上例的有限总体（浙江省2006年7岁健康男孩）中，按照随机化
原则抽取100名7岁健康男孩，他们的身高值
即为样本。因
此，从总体中抽取样本的过程为抽样，抽样方法有多种。
第四章抽样分布
数理统计基本概念抽样分布
学习目的和要求
掌握总体、样本、统计量、标准误等数理统计的基本概
念；查表求 2 分布、t 分布、Ｆ分布的临界值及其定理；
熟悉 X 的分布、 2分布、t 分布、Ｆ分布定义、性质和应
用。
数理统计的基本任务：
实验或调查
以概率论为理论基础，通过样本提供的信息，对总体的统计规律和特征进行估计与推断，其实用性较强。
1、 2分布（chi-square distribution）：是指数分布的改进，
尤其当n较大时， 2分布可全面反映随机变量的分布。
eg: 寿命、保险等资料。
定义：设随机变量
为相互独立且服从标准
正态分布N（0，1），则称随机变量
2= X12 + X22 +X32 + … + … +Xn2

第五章抽样分布

第四章抽样与抽样分布例1：从某年级1000位学生中抽取4位学生，计算身高（μ=169， =6.4），来估计全年级平均身高，假设抽取了成千上万个样本，得到如下结果：例2：几年前台湾一项调查显示，台湾民众月收入近似成正态分布，均值为13100台币，标准差为8750元，求：1）随机抽取一人，收入超过18430元的概率？2）抽取一个10人样本，平均收入超过18430元的概率？例3：假定某班级男生平均身高169cm，标准差为10.2cm，如果抽取一个n=100的随机样本，那么样本均值在μ±2之内的可能性是多少？例4：一架电梯极限负重1000公斤，一般可容纳13人。

假定电梯的所有乘客平均体重70公斤，标准差12公斤。

那么一个13个人的随机样本总重量超过极限负重的概率是多少？例5：某市育龄妇女生育意愿普查，65%的赞成“只生一个孩子”，35%不赞成或不表态。

设生育态度X：赞成为1，否则为0。

求：1）总体均值、总体方差、总体中赞成的比例；2）随机抽取10位育龄妇女，得到样本值为1、0、0、1、1、1、0、1、1、1，求样本均值、样本中赞成比例。

解：1）计算见下表2）样本均值=7/10=0.7，样本中赞成比例=7/10=0.7例6：学校选人大代表，结果有60%的选民投了我院院长而当选。

假定选举之前有人做了预测，抽取了一个n=30的随机样本进行民意测验，如果样本中只有半数一下的比例支持院长，于是得出院长失败的结果，显然这一预测是一个倒霉的预测。

那么，抽取到以上倒霉样本的概率是多少呢？即错误预测的可能性是多少？如果将样本量增到100，再计算错误概率。

例7：某中学学生男女人数相同，现随机从中抽取15名学生，问男生人数大于10的概率是多少？四、样本方差的抽样分布设随机变量x 1,x 2,x 3…..x i 相互独立且服从同一正态分布，则将这些随机变量标准化，再计算它们的平方和，得到卡方值2χ，其服从于自由度为n-1的卡方分布：2χ=2222312()()().....()i x x x x μμμμσσσσ----++++=2211()kii x μσ=-∑分子分母同乘n-1，进一步整理得2χ=22(1)n s σ-~2χ（n-1）练习题：1、某专业学生的年龄分布是右偏的，均值为22，标准差为4.45，如果采用重复抽样的方法从该专业学生中抽取容量为100的样本，则样本均值的抽样分布为？2、从均值为50，标准差为5的正态总体中抽取容量为25的样本，则样本均值超过51的概率为？3、某企业声明企业人均收入为5500元，标准差为550元。

黄良文《统计学》课后习题(抽样分布与抽样方法)【圣才出品】

N
5
（2）重复抽样的两两样本的平均数如表 5-1 所示。
表 5-1 两两样本的平均数
单位：元
样本值
140
160
180
200
220
140
140
150
160
170
180
160
150
160
170
180
190
180
160
170
180
190
200
200
170
180
190
200
210
220
180
190
200
210
（2）由（1）可得：
P(X a) P( X 40 a 40) 1 ( a 40) 0.05
2
2
2
即
( a 40) 0.95 2
则 a 40 1.645 ，解得：a=43.29。 2
1/8
圣才电子书十万种考研考证电子书、题库视频学习平台

5.3 设 X～t（n），写出它的密度函数以及均值和方差。解：t（n）的密度函数为：
220
由表 5-1 可知，样本均值的分布如表 5-2 所示。
表 5-2 样本均值的分布
样本均值 X （元）Fra bibliotek频数概率
140
1
1/25
150
2
2/25
160
3
3/25
170
4
4/25
3/8
圣才电子书

180
十万种考研考证电子书、题库视频学习平台
5
1/5
190
4
4/25
200
量 n=36 的样本。（1）求样本均值 X 的抽样分布；（2）如果 P( X a) 0.05 ，求 a 的值。

第五章抽样

Page 18
二、系统抽样（又称机械抽样）系统抽样的具体步骤是：（1）确定开始抽取人选的位置（2）计算抽样间距。抽样距离是由总体大小和样本大小决定的，假设总体所含个体数为N，样本所含个体数为n，则抽样间距应为K=N/n。（4）确定抽取元素的方法
Page 19
系统抽样实例某地区有零售店110户，采用系统抽样方法抽取11户进行调查。第一步：将总体调查对象进行编号，即从1号到110号；第二步：确定抽样距离。调查总体N=110户，所需样本数n=11户，所以，抽样距离K=10户；第三步：确定起抽号数。随机地从1-10中抽取一个数作为抽号；第四步：确定被抽取单位。从起抽号开始，按照抽样距离选取样本如果随机抽取了2为起抽号，那么： 2 2+10=12 2+10*2=22 等等即所抽的样本为编号是2，12，22，32，一直到102共11个零售店。
Page 17
答案：
（1）确定选出的随机数的位数：由于总体人数为900，在使用随机数表时，需要有3位数的随机数才能保证所有人都有被选中的机会；（2）决定从5位数种选择哪几位数字：要从随机数表中从左到右选取3位数字，（3）确定在表中选择数字的顺序：自下而上选取随机数。（4）确定开始选择的5位数组起点（5）处理大于总体规模或重复的随机数
2、“街头拦人”
Page 10
二、配额抽样配额抽样，是根据某些参数值，确定不同总体类别中的样本配额比例，然后按比例在各类别中进行方便抽样。配额抽样示例
年龄所得￥10，000以下￥10，101以上合计 34岁以下 21% 12% 33% 35岁以上 27% 40% 67% 合计 48% 52% 100%

第5章_统计量及其抽样分布

1.
2.
分布的变量值始终为正
分布的形状取决于其自由度n的大小，通常为不对称的正偏分布，但随着自由度的增大逐渐趋于对称期望为： E( 2)=n ，方差为：D (2)=2n(n 为自由度)
3.

可加性：若U和V为两个独立的2分布随机变量， U~2(n1)，V~2(n2),则U+V这一随机变量服从自由度为n1+n2的2分布

统计量是样本的一个函数统计量是统计推断的基础
5.1.2 常用统计量

样本均值样本方差样本变异系数 1 n k x i 样本k 阶矩 mk n i 1 1 n k x x i 样本k 阶中心矩 k n i 1 样本偏度样本峰度
掌握

n→∞时， 2分布的极限分布是正态分布。
2分布 (图示)
n=1 n=4 n=10
n=20
不同容量样本的抽样分布
2
2-分布 (用Excel计算2分布的概率)
1. 利用Excel提供的【CHIDIST】统计函数，计算2分布右单尾的概率值
语法：CHIDIST(x,degrees_freedom) ，其中df为自由度，x,是随机变量的取值 2. 利用【CHIINV】函数则可以计算给定右尾概率和自由度时相应的反函数值
2.
U n1 F V n2
F ~ F (n1 , n2 )
5.3.3 F分布 (F distribution)
F分布的概率密度函数为:
n1 n1 n 2 1 n1 2n2 2 ) ( n n 1 1 n 2 1 ( ) ( x ) (1 x ) f ( x ) n1 n 2 n 2 n2 n2 ( 2 ) ( 2 ) 0

抽样技术第5章等概率整群抽样

第5章等概率整群抽样到目前为止，我们假定所有抽样程序中的总体是实现给定的，我们要做的就是从这个给定的总体中抽取一个合适的样本，而这些样本中包含一定的单元。

但单元要被很好的定义并非易事，甚至再总体被很好定义的时候也是如此。

列举单元的方法多种多样，并且我们所选取的单元很可能包含了更小的单元。

假定我们想调查包含10000户家庭的某个社区中拥有自行车的住户数目，那么我们可以做一个样本容量为400个家庭的简单随机抽样，我们也可以把这个社区分为500个街区，每个街区20户家庭，然后从这个500个街区中随机的抽取20个街区作为样本。

后者实际上就是一个整群抽样。

500个街区称为初级抽样单位（PSU）或群。

街区中的家庭称为次级抽样单位（SSU）。

通常，SSU也是总体的元素。

这个有400个家庭构成的整群抽样样本的精度不及简单随机抽样样本；因为一些街区主要是由一些拥有自行车的住户构成，而一些街区的住户主要是由退休人员构成（不拥有自行车）。

处于同意街区的20户家庭并不能想随机样本的20户家庭一样反映整个社区的多样性。

因此，整群样本中的每一个观测单元所提供的信息少于随机样本。

但是，调查同一街区的20户家庭比随机调查整个社区的20户家庭要便宜很多，容易很多，因此，整群样本中，每一单元所取得的信息多于SRS中每一单元所获得的信息。

在整群抽样中，总体中的个体元素仅仅当它所属的群被抽样时它才被入样。

这个入样的群（抽样单元PSU）不同于观测单元（SSU），并且在计算整群抽样样本的标准误时，两者的容量被考虑。

为什么使用整群抽样？1、构造一个列举所有观测单元的抽样框可能就是困难、昂贵或不可能的。

我们不可能列出某一区域内所有蜜蜂或某一商场的所有顾客：就算我们能列举出北部某针叶林的所有树木或某一城市中的所有个人，但其耗时且昂贵。

2、总体在地域上分布广泛或者误群是自然产生的，如家庭或学校。

若目标总体是美国所有护理所的居民，则调查入样的某个护理所的全体居民比调查SRS中的等量居民要便宜很多：在SRS的护理所居民调查中，你可能不得不为了调查一个居民而去拜访他所在的护理所。

统计学之抽样与抽样分布

a. n/N > 30 b. N/n < 0.05 c. n/N < 0.05 d. n/N > 0.05
正确答案: d. n/N > 0.05
8. 从一个均匀分布的总体中抽取一个样本容量为45的样本，从什么分布？
a. 指数分布 b. 正态分布 c. 均匀分布 d. 无法判断
正确答案: b. 正态分布
考察所有900个申请者
• 考试成绩
• 总体平均成绩
xi 990
900
• 总体标准差
(xi )2 80 900
考察所有900个申请者
• 无相同工作经验的申请者比例
• 总体比例
p 648 .72 900
使用随机数表随机选择30个申请者作为样本进行研究,从书上随机数表第三列开始
统计学之抽样与抽样分布
2021年7月19日星期一
Chapter 7
抽样和抽样分布
本章主要内容
简单随机抽样点估计抽样分布
样本平均值x 的抽样分布样本比例 p 的抽样分布
抽样方法
n = 100
n = 30
统计推断
统计推断的目的是利用样本的信息推断总体的信息总体是指感兴趣的所有元素的集合样本是总体的一个子集通过样本统计量对总体参数进行估计只要抽样方法恰当，通过样本统计量可以对总体参数进行很好的估计
点估计
• x 作为的点估计值 x xi 29,910 997
30 30
• s 作为的点估计值
s
(xi x )2 163,996 75.2
29
29
• p 作为p 的点估计值
p 20 30 .68
值得注意的是，不同的随机数会导致不同的抽样，也就会数的不同的点估计值

黄良文《统计学》(第2版)笔记和课后习题(含考研真题)详解第5章抽样分布与抽样方法【圣才出品

②性质
(s 1) s (s)
(n 1) n!
（2） 2 (n) 分布的密度函数和主要性质
① 2 (n) 分布的密度函数
f
(x)
2n/2
1 (n
/
2)
x
n 2
1e
x
2，x
0
0，
x 0
②主要性质
a．如果 X~ 2 (n) ，则 E（X）=n，Var （X）=2n； b．如果 X1~ 2 (n) ，X2~ 2 (n) 且相互独立，则 X1+X2~ 2 (n1 n2 ) 。

其特点是：①n 个单位的样本由 n 次抽取的结果构成；②每次抽取的结果不是独立的。 ③虽然在同次试验中每个单位被抽取到的概率相同，但在不同次的试验中被抽取到的概率是不相等的。
如果考虑顺序，其总样本个数为 PNn N ! (N n)!。如果不考虑顺序，总样本个数为 CNn N !/[（N n）!n!] ，每个样本被抽取到的概率都为1/ CNn 1 (N n)!n / N ! 。
i
类子总体的均值和方差分别为
i
，
2 i
。那么，样本均值
样本均值的数学期望
E(
X
)
。样本均值的方差（抽样标准误差）
2 X
k i 1
(
ni n
)2
2 Xi
①重置抽样
②不重置抽样
或
（2）整群抽样整群抽样就是将总体的所有单位分成若干群，然后从其中随机抽取部分群，接着对中选的群进行全面调查的抽样方式。设总体的全部 N 个单位被划分为 R 群，每群都含有 M 个单位。现在从总体的所有 R
Dn
max
1k n
Xk
min 1k n

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

样本k阶原点矩样本k阶中心矩
它反映了总体k 阶中心矩的信息
1 k Ak X i n i 1
1 n Bk ( X i X )k n i 1
n
k=1,2,…
它们的观察值分别为： 1 n 样本均值 x xi n i 1
样本方差
n n 1 1 2 2 2 2 s ( x x ) [ x n x ] i i n 1 i 1 n 1 i 1
2 ( x x ) s n 1 2
第5章抽样分布与抽样方法
gongwei@
本章主要内容
• 随机抽样和统计推断 • 抽样分布 • 抽样设计方法
教学基本要求
• 通过本章的学习，掌握抽样的概念，简单随机抽样的方法；掌握重置抽样的抽样分布，不重置抽样的抽样分布；识记抽样其他组织形式，抽样设计的基本原则，掌握各种抽样组织形式的抽样平均误差的计算方法，了解抽样方案的设计内容。
抽样的基本概念
• 抽样涉及的基本概念有： – 总体与样本 – 样本容量与样本个数 – 总体参数与样本统计量 – 重复抽样与不重复抽样 • 这些概念是统计学特有的，体现了统计学的基本思想与方法。
总体和样本（回顾）
• 1.总体：又称全及总体、母体，指所要研究对象的全体，由许多客观存在的具有某种共同性质的单位构成。总体单位数用 N 表示。 • 2.样本：又称子样，来自总体，是从总体中按随机原则抽选出来的部分，由抽选的单位构成。样本单位数用 n 表示。 • 3.总体是唯一的、确定的，而样本是不确定的、可变的、随机的。
• 计算有限总体参数的公式中要使用总体的所有单位的标志值，（有限总体的单位总数N），而计算样本统计量的公式中只使用抽取到的样本（其个数是样本量n）。
总体参数和样本统计量
• 总体参数：反映总体数量特征的指标。其数值是唯一的、确定的。 • 样本统计量：根据样本分布计算的指标。是随机变量。
总体样本
常用统计量
n
它反映了总体均值的信息
样本均值
1 X Xi n i 1
它反映了总体方差的信息
n 1 2 样本方差 S 2 ( Xi X ) n 1 i 1
n 1 2 样本标准差： S S2 ( X X ) i n 1 i 1
它反映了总体k 阶矩的信息，当k=1时，就是X ~ N ( , 2 ) 的一个样本，其中未知 , 2已知，问下列随机变量中那些是统计量
X1 X n X1 X n ; ; 2 n 2 ( X 1 X n ) ( X 1 X n ) n . ; . 2 n
2、同时，有1500人参加了公司培训，则参加公司培训计划的比例为： P=1500/2500=0.60 参数是总体的数值特征（A parameter is a numerical characteristic of a population.)。如：例3中的中层干部平均年薪，年薪标准差及受培训人数所占比例均为该公司中层干部这一总体的参数。 ●抽样估计就是要通过样本而非总体来估计总体参数。
1 n 2 s ( x x ) n 1 i 1 i
样本标准差
1 n k ak xi , k 1,2 n i 1 样本k阶矩 1 n bk ( xi x )k , k 1,2 n i 1 样本k阶中心矩
注意：
• 总体参数是常数，计算总体参数的公式中所用到的总体各单位的标志值是确定的具体数值，而样本统计量是随机变量，计算样本统计量的公式中所用的样本在未具体观察前是随机变量。
样本容量与样本个数
• 样本容量：一个样本中所包含的单位数，用n表示。 • 样本个数：又称样本可能数目，指从一个总体中所可能抽取的样本的个数。对于有限总体，样本个数可以计算出来。样本个数的多少与抽样方法有关。 (这个概念只是对有限总体有意义，对无限总体没有意义！)
例3：某大公司人事部经理整理其2500个中层干部的档案。其中一项内容是考察这些中层干部的平均年薪及参加过公司培训计划的比例。总体：2500名中层干部（population )，如果：上述情况可由每个人的个人档案中得知，可容易地测出这2500名中层干部的平均年薪及标准差。假如：1：已经得到了如下的结果：总体均值（population mean） =51800 总体标准差（Population standard deviation=4000
统计量
1. 若X1, X2,…, Xn是来自总体X 的一个样本,
g(X1,X2,…, Xn)是X1,X2,…, Xn的函数，若 g中则称g(X1,X2,…, Xn)是一统计量。不含任何未知参数，
注：统计量是随机变量。
x1,x2,…, xn是相应于样本X1,X2,…, Xn的样本值, 则称g(x1,x2,…, xn)是g(X1,X2,…, Xn)的观察值。
400个样本支持人数： 160
推断
支持该候选人的选民占全部选民的比例： 160/400=40%
抽样估计方法主要用在下列两种情况： 1、对所考查的总体不可能进行全部测度； 2、从理论上说可以对所考查的总体进行全部测度，但实践上由于人力、财力、时间等方面的原因，无法或没有必要（不划算）进行全部测度。注意： ● 抽样调查必须遵循随机原则。 ● 抽样估计只能得到对总体特征的近似测度，因此，抽样估计还必须同时考察所得结果的“可能范围”与 “可靠程度”。
例1：一汽车轮胎制造商生产一种被认为寿命更长的新型轮胎。
平均里程： 36,500公里
120个样本
测试
推断
新轮胎平均寿命: 36,500公里
例2：某党派想支持某一候选人参选美国某州议员，为了决定是否支持该候选人，该党派领导需要估计支持该候选人的民众占全部登记投票人总数的比例。由于时间及财力的限制：

第5章抽样分布与抽样方法.

合集下载

社会调查研究方法教案第5章抽样

抽样与抽样分布

第5章--抽样分布与参数估计教案资料

统计学之抽样与抽样分布

抽样与抽样分布(试题及答案)

第五章抽样法

《统计学原理》第5章：抽样推断

曾五一应用统计学第5章

医药统计学第五章抽样分布

第五章抽样分布

黄良文《统计学》课后习题(抽样分布与抽样方法)【圣才出品】

第五章抽样

第5章_统计量及其抽样分布

抽样技术第5章等概率整群抽样

统计学之抽样与抽样分布

黄良文《统计学》(第2版)笔记和课后习题(含考研真题)详解第5章抽样分布与抽样方法【圣才出品

文档推荐

最新文档

第5章 抽样分布与抽样方法.

合集下载

社会调查研究方法教案第5章 抽样

抽样与抽样分布

第5章--抽样分布与参数估计教案资料

统计学之抽样与抽样分布

抽样与抽样分布(试题及答案)

第五章 抽样法

《统计学原理》第5章：抽样推断

曾五一 应用统计学 第5章

医药统计学 第五章 抽样分布

第五章抽样分布

黄良文《统计学》课后习题(抽样分布与抽样方法)【圣才出品】

第五章 抽样

第5章_统计量及其抽样分布

抽样技术第5章等概率整群抽样

统计学之抽样与抽样分布

黄良文《统计学》(第2版)笔记和课后习题(含考研真题)详解 第5章 抽样分布与抽样方法 【圣才出品

文档推荐

最新文档

第5章抽样分布与抽样方法.

社会调查研究方法教案第5章抽样

第五章抽样法

曾五一应用统计学第5章

医药统计学第五章抽样分布

第五章抽样

黄良文《统计学》(第2版)笔记和课后习题(含考研真题)详解第5章抽样分布与抽样方法【圣才出品