第三章简单随机抽样

格式：ppt
大小：332.00 KB
文档页数：54

下载文档原格式

Chap03简单随机抽样

N i j
(Yi
Y
)(Yj
Y
)

1 nN
1
n 1 N 1
N i 1
(Yi
Y
)2
n 1 N 1

N i 1
(Yi
Y
2 )

1 n

N N
n

1 N 1
N i 1
(Yi
Y
)2
1 f S2
n
证明Ⅱ：仍引进随机变量 ai ：
N 1 n 1

N n

n N
ˆ
f
E(ai )
n N

f
(3.5)
借助 ai ，样本均值 y 可以表示成:
y

1 n
N i 1
aiYi
(3.6)
E( y) 1
n
N
E(ai )Yi
i 1
1 n
n N
N
Yi
i 1
Y
推论： Y 的简单估计量Yˆ Ny 也是无偏的，即: E(Ny ) Y
所有可能的样本求平均: E( y)
N 1 y n

N n

个样本中，包含特定单元
Yi
的样
本数为

N 1 n 1
，也有同样多样
本含有任何其他单元，因此
y 1
n
( y1
y2

yn )

1 n

N 1 n 1
数，则编号为这些随机数的 n 个单元组成一个简单随机样本。
随机数的产生可使用随机数骰子或随机数表。
图 3.1 随机数骰子随机数骰子：标上 0～9 数字的正 20 面体（每个数字出现在两面）

应用抽样技术课后习题答案

=(0.0907,0.4433)
N1的95%的置信区间为: (159，776) 95%的置信区间为 (159，的置信区间为:
(3)N=1750，n=30， (3)N=1750，n=30，n1=8, t=1.96, p=0.267, q=1q=1-0.267=0.733 由此可计算得： t 2q 1.962 × 0.733 n0 = 2 = =1054.64 r p 0.01× 0.267 n = n0/[1+(n0—1)/N] = 1054.64/[1+1053.64/1750]=658.2942 = 659 计算结果说明，至少应抽取一个样本量为659的简单随机样本，才能满足95%置信度条件下相对误差不超过10%的精度要求。
t=1.96 (2)易知，N=1750，n=30， n = 8 1 n 8 N − n 1750 − 30 1− f p= 1 = = 0.267 = = = 0.03389 n −1 (n −1)N 29 ×1750 n 30
pq = p(1 − p) = 0.267 × 0.733 = 0.1957
5.5 证明：由（5.6）得：
V ( yR ) ≈ 1− f n (Yi − RX i )2 ∑
i =1 N
N −n 2 令 Sd = V , Nn
2 d
N −1
=
N −n 2 Sd Nn
则n(NV + S ) = NS ，
2 d
S 2 NSd 从而n = = V 2 2 NV + Sd Sd 1+ NV
第五章比率估计与回归估计
5.2 N＝2000, n＝36, 1－α＝0.95, t＝1.96, ˆ f = n/N＝0.018， v(R) = 0.000015359， ˆ se(R) ＝0.00392 置信区间为[40.93%,42.47%]。置信区间为[40.93%,42.47%]。

第三章抽样的原理及类型

五、抽样设计得原则
1、目得性原则 2、可行性原则 3、高效性原则
第三节样本规模与抽样误差
一、样本规模及其计算
1所、含定元义素:样得本多规少模。又确称定样样本本容规量模,就指是得每就一是项样具本体中得社会调查所必须解决得问题之一。
不能少于100个元素
2、简单随机抽样中样本规模计算公式: a,推论总体平均数
4、实际抽取样本
实际抽取样本得工作就就是在上述几个步骤得基础上,严格按照所选定得抽样方法,从抽样框中抽取一个个得抽样单位,构成样本。依据抽样方法得不同,以及依据抽样框就是否可以事先得到等因素,实际得抽样工作既可能在研究者到达实地之前就完成,也可能需要到达实地后才能完成。即既可能先抽好样本,再下去直接对预先抽好得对象进行调查或研究;也可能一边抽取样本一边就开始调查或研究。
继续保持安静
置信区间
指在一定得置信度下,样本统计值与总体参数值之间得误差范围。反映得就是抽样得精确性程度。
二、抽样得作用
向人们提供一种实现“由部分认识整体”这一目标得途径和手段。
日常生活中得抽样
第二节抽样得类型与抽样程序
一、抽样得类型从大得方面看,各种抽样都可以归为概率
抽样与非概率抽样两大类,这就是两种有着本质区别得抽样类型。
抽样
从组成某个整体得所有元素得集合中,按一定得方式选择或抽取一部分元素得过程。
比如,从1000户家庭构成得总体中,按一定得方式抽取一个由100户家庭构成得样本得过程。
抽样单位
抽样单位就就是一次直接得抽样所使用得基本单位。抽样单位与构成总体得元素有时就是相同得,有时又就是不同得。
如从32万名大学生抽取1000大学生,单个大学生既就是元素,又就是抽样单位;但就是,抽取40个班级(假定正好就是1000名)时,抽样单位与构成总体得元素就不一样了。

第三章-简单随机抽样

不放回也称不重复抽样，每次从总体中随机抽取一个样本单位，经调查观测后，不再将该单位放回总体参加下一次抽样，然后再在剩下的总体单位中随机抽取下一个样本单位进行调查观测，直到抽够n个样本单位为止。
N!
考虑顺序可能的样本为 N n !
每个样本被抽中的概率为 ( N n)! N!

s2 1358.41, v( y) (1 f )s2 / n 37.6444, se( y) 6.1355
对该校大学生某月电信消费人均支出额的估计为 53.64元，在置信度95%下，临界值1.96，可以说以 95%的把握说明该校大学生该月的人均支出在 [53.64+(-)1.96*6.1355],即41.61~65.67元。
n 1
2n
正态近似产生的误差主要与nP有关，特别当nP比较小时，产生的误差甚大，在95% 置信度下，P<0.5时正态分布需要的最小nP 值与n值如下表。
P
nP
0.5
0.4
0.3
0.2
0.1
0.05
0
n
15
30
20
50
24
80
40 200
60 600
70 1400
80 无穷
试以95%的置信度估计上例大学生月电信消费超过80元的人数及其比例。
N n S2 N n
nN
为调查某校大学生的电信消费水平，在全校Ｎ＝15230名学生用简单随机抽样抽取 n=36名学生，调查上月电信支出数据。试以95%的置信度估计该校大学生该月电信消费的平均支出额。
样本序号消费元/月样本序号消费
样本序号消费
1
45
13

统计学第三章抽样与抽样分布

=10
= 50 X
总体分布
n= 4
x 5
n =16
x 2.5
x 50
X
抽样分布
从非正态总体中抽样
结论：
从非正态中体中抽样，所形成的抽样分布最终也是趋近于正态分布的。只是样本容量需要更大些。
总结：中心极限定理
设从均值为，方差为 2的一个任意总体中抽取容量为n的样本，当n充分大时（超过30），样本均值的抽样分布近似服从均值为μ、方差为σ2/n的
总体
样本
参数
统计量
总体与样本的指标表示法
总体参数
样本统计量
(Parameter) (Sample Statistic)
容量平均数比例方差标准差
N
n
X
x
p
2
s2
s
小练习
某药品制造商感兴趣的是用该公司开发的某种新药能控制高血压人群血压的比例。进行了一项包含5000个高血压病人个体的研究。他发现用这种药后80%的个体，他们的高血压能够被控制。假定这5000个个体在高血压人群中具有代表性的话，回答下列问题： 1、总体是什么？ 2、样本是什么？ 3、识别所关心的参数 4、识别此统计量并给出它的值 5、我们知道这个参数的值么？
正态分布
一个任意分布的总体
x
n
当样本容量足够大时(n 30) ，样本均值的抽样分布逐渐趋于正态分布
x
X
总体分布
正态分布
非正态分布
大样本小样本大样本小样本
正态分布
正态分布
非正态分布
三中心极限定理的应用
中心极限定理(Central Limit theorem) 不论总体服从何种分布，从中抽取

初级1 -第三章简单随机抽样

n
n
n 1 N 1 n N
n 1 N 1
二、实施方法 • 抽签制作N个同质的签，充分混合。从中一次抽出n个签，或者先抽出一个签但不放回，再抽下一个签直到抽满n个签为止。抽出的这n个签对应的单元入选样本，这是不放回简单随机抽样；若从充分混合的N个签中抽取一个，记录后放回，再抽取下一个，如此进行，直到抽满n个为止，则是放回简单随机抽样。抽签法的实施起来比较麻烦，尤其是当总体单元数 N较大时，所以该方法的使用场合为当总体单元数 N比较小，签的制作比较方便时。
第三章简单随机抽样

第一节
基本问题
一、什么是简单随机抽样
从 N个单元的总体中抽取 n个单元组成的样本。总体单元数为 N，
样本量为 n。若抽样是放回的，每次都是从个总体单元中随机抽取1个单元，独立重复抽取n次，得到个单元组成的样本，叫做放回简单随机抽样。若抽样是不放回的，每次都是从剩下的总体单元中随机抽取1个单元，相继依次抽取n次，得到n个单元组成的样本，叫做不放回简单随机抽样。
精度margin of error
对精度的要求通常以允许最大绝对误差
差限）或允许最大相对误差（相对误差限）来表示。
r
d（绝对误
d 1 P
P r 1

样本量足够大时，可用正态分布近似
ˆ tS ˆ d t V
2
第三章基本概念
N n N 1
N n N
为修正系数
2
为 S 修正系数
n f ，称抽样比， N
2
令
N n 1 f 有限总体调整系数故， N 2
S V ( y ) (1 f ) n

第三章抽样设计PPT学习教案

（一）简单随机抽样
1、含义从总体中不加任何分组、排队，完全
按照随机原则抽取样本单位的抽样方法。又称纯随机抽样、简单任意抽样。
抓阄彩票第35页/共12 Nhomakorabea页（一）简单随机抽样
2、操作办法
（1）乱数表法在乱数表中任意选定一行或一列的数字作为开始数，
接着可从上而下，或从左至右，或一定间隔（隔行或隔列）顺序取数，凡编号范围内的数字号码即为被抽取的样本个体号码。如果不是重复抽样，碰上重复数字应舍掉直到抽足预定样本数目为止。例如：有如下数字：13、45、65、36、22、24、31 、43、61、52、55、16、23、14、25。每隔两位取一个数字，即可得到：65、24、61、16、25。
大样本与小样本
根据抽样调查中所抽选样本容量不同而划分的。当样本数目大于30时，称为大样本；当样本数
目小于30时，称为小样本。
第20页/共125页
3.抽样调查的几个基本概念
重复抽样与不重复抽样
重复抽样，又称回置抽样(有放回抽样)，是一种在总体中允许重复抽取样本单位的抽选方法。抽样过程中总体个体数始终相同。
如：从某所大学全体学生中直接抽取200名学生作为样本—该校全体学生的名单
从某一所大学所有班级中抽取3个班级作为样本—该校所有班级的名单
抽样单元，为了便于抽样，通常把总体划分为有限个互不重迭又穷尽的部分，每个部分称为一个抽样单元。
第22页/共125页
4 .抽样调查的适用范围
①无法全面调查的情况，如全国性城市居民住房面积的调查。 ②不必要进行全面调查的情况，如产品质量的检测。 ③需要快速得到调查结果，如节令市场的状况调查。 ④在经费、人力、物力和时间有限的情况下开展的调查。 ⑤对全面调查进行验证。 ⑥对某种总体进行假设性检验，也常用抽样调查来检验判断这种假

第3章抽样分布

样本方差s2
s2取值的概率
0.0 0.5
4/16 6/16
2
4.5
39
4/16
2/16
0.00 0.0 0.5 s的取值 2.0 4.5
(用Excel计算2分布的概率)
1. 利用Excel提供的CHIDIST统计函数，计算2分布右单尾的概率值
2. 语法为 CHIDIST(x,df) ，其中 df 为自由度， x 是随机变量的取值 3. 给定自由度和统计量取值的右尾概率，也可以利用“插入函数”命令来实现 4. 计算自由度为8，统计量的取值大于10的概率
σ2 =1.25
23
x 2.5
x2 0.625
样本均值的抽样分布
当总体服从正态分布N(μ,σ2)时，来自该总体的所有容量为n的样本的均值x也服从正态分布，x 的数学期望为μ，方差为σ2/n。即x～N(μ,σ2/n)
=10
n=4 x 5 n =16 x 2.5
37
2分布
(图示)
选择容量为n 的不同容量样本的抽样分布
n=1 n=4 n=10
总体
简单随机样本

计算样本方差s2
计算卡方值
n=20
2 = (n-1)s2/σ2
计算出所有的
2
2值
38
2分布
(例题的图示)
16个样本方差的分布
s取值的概率
0.40 0.35 0.30 0.25 0.20 0.15 0.10 0.05
13
三种不同性质的分布
1 2 3
14
总体分布样本分布抽样分布
总体分布
(population distribution)

03第三章简单随机抽样

首先,在理论上最符合随机原则.对此可有二种理解:一种是总体中各个单位被抽中的机会相等.设总体有N个单位,各单位被抽中的概 1 率均为 N.另一种是总体中各个样本被抽中的概率相等.我们知道,一个总体N中可以抽取许多个容量为n 的样本,通常情况下按组合形 n C N个样本,那么,在一次抽样中,某个样式有 1 本被抽中的概率为C ,这个概率对每个可能的样本都相等.简单随机抽样遵循这种等可能性原则,为进行抽样估计,计算抽样误差,提供了重要前提条件.
Y3 + Y4 2
可见,样本均值 y 是 Y 的一个无偏估计量,因为
1 Yi + Y j 1 3 4 E ( y ) = ∑∑ ( ) = ∑∑ (Yi + Y j ) 2 12 i =1 j i i =1 j i 6
3 4
而每个单元均可能在三个样本内出现,故
1 4 E ( y ) = ∑ 3Yi = Y 12 i =1
颜色蓝绿红白黄合计
人的编号 1 14 28 15 25 18 2 26 21 12 23 18 3 20 15 20 20 25 4 12 21 22 19 26
期望数字 20 20 20 20 20 100
100 100 100 100
可见四个人都对颜色存在偏好,如第一个人偏爱绿色, 第二个人偏爱蓝色等.这种由于对颜色偏好所引起的偏估类型,可称之为颜色偏误. 结论:随意抽样≠随机抽样
n N
其次,它是设计其他更复杂抽样形式的基础. 例如,设计分层抽样,将总体划分为若干层, 然后对各个层实施简单随机抽样.对一个非常大的总体,需要分若干个阶段进行抽样.例如, 进行全国性抽样调查,第一阶段可以由全国抽取若干个省份,第二阶段再由抽中的省份抽取若干个县(市);第三阶段再由抽中的县(市)抽取若干个乡(街道);第四阶段再由抽中的乡 (街道)抽取若干个村(居委会)等等.在这种多阶段抽样中,每个阶段中抽取样本单位均可采用简单随机抽样方法.

第三章抽样和抽样分布

第三章抽样和抽样分布
Probability Sample
• Probability Sample • A probability sample is a sample chosen
by chance. We must know what samples are possible and what chance, or probability, each possible sample has.
第三章抽样和抽样分布
统计应用
“抓阄”征兵计划
➢ 然而结果是，有73个较小的号码被分配给了前半
年的日子，同时有110个较小的号码被分配给了后半年的日子。换句话说，如果你生于后半年的某一天，那么，你因为被分配给一个较小号码而去服兵役的机会要大于生于前半年的人
➢ 在这种情况下，两个数字之间只应该有随机误差，
convenience sampling chooses the individuals
easiest to reach. Here is an example
of convenience sampling.
Both voluntary response samples and
convenience samples produce samples that are almost guaranteed not to represent the entire
被分配的号码较大的人也许永远轮不上到军队服役
➢ 这种抓阄看起来对决定应该被征召入伍是一个相当不错
的方法。然而，在抓阄的第二天，当所有的日子和它们对应的号码公布以后，统计学家们开始研究这些数据。经过观察和计算，统计学家们发现了一些规律。例如，我们本应期望应该有差不多一半的较小的号码(1到183) 被分配给前半年的日子，即从1月份到6月份；另外一半较小的号码被分配给后半年的日子，从7月到12月份。由于抓阄的随机性，前半年中可能不会分到正好一半较小的号码，但是应当接近一半

第三章简单随机抽样(抽样调查理论与方法-北京商学院,

100，95，92，88，83，75，71，62，60，50
平均分为77.6。先从中任选3个为一组样本，其选法共有120种
每种选法都有概率1/120。以4组样本为例(100,95,92)，(100,83,
50)，(88,83,62)，(62,60,50)它们的样本平均数分别为95.67，
77.67，77.67，57.33。从抽样调查的角度来看，我们希望抽到第二或第三组样
(3.6)
N 1 n
Nn
对随机有放回抽样，由于各次抽取是相互独立的，由概率论的知识可以求得，此时：
2
Var( y) n
1 S2 （或 (1 ) ） (3.7)
Nn
比较(3.6)式与(3.7)式，发现同样用样本平均数来估计总体平均数，它们都是无偏估计，但随机无放回时的方差小于随机
有放回时的方差。 y 的方差表示新盒子的离散程度，也就是表示了 y 取值范围的大小，方差小表明 y 取值远离中心Y 的可能性较小，这样随机的一组样本得到 y 的实现值距Y 很近
相当小，此时(3.6)式告诉我们 y 的方差将随着 n 的减少而增大，此时 1－f 在 1 附近，对Var( y)的影响不大。事实上，
抽取样本越少，抽样误差越大。
可见实际抽样调查中用 y 估计Y 所产生的随机误差，也即 y 的方差，主要受到样本容量 n 的影响，因子1－f 的影响
几乎可以忽略。
当然，影响 y 的方差的另一个重要因素是 2或 S 2。设
通常取决于总体单元个数N，满足10m1 N 10m。记m个骰子按约定颜色而确定的顺序读得随机数R0，若R0 N，则此 R0即为一次合格的随机数；否则予以放弃，重新摇取，直
到取到n个合格的随机数为止。 ③利用计算机产生随机数：不少现成的统计软件都可提供此类服务。但必须指出，这样产生的随机数一般不能保证其随机性，称为“伪随机数”。因此，提倡前述方法产生随机数。

第三章随机抽样和抽样散布

第三章随机抽样和抽样散布在前两章的讨论中，咱们明白了随机现象常常通过随机变量及其概率散布和数字特点来描述，但是，在实际问题中，要准确明白概率散布和数字特点，有时是很困难的。

例如，咱们要以药丸的崩解时刻或药片的溶解速度为指标来考察某一批药品的质量。

假设把这批药品全数进行一下实验，其散布函数及其有关的数字特点都可求出。

可是，由于测定这些指标的实验，一样是破坏性的，报废了全数药品即便求出了有关指标也无心义。

还有一些查验指标，如蜜丸的重量、体积等，对它们的查验虽不是破坏性的，但要成批逐个查验，不管从人力仍是物力上都会受到条件限制。

事实上，人们老是通过对部份产品的实验结果作分析，推断出全数产品的情形。

这确实是数理统计研究的一个要紧问题。

本章先讨论样本和统计量等大体概念，然后讨论常见的几种抽样散布，为进一步讨论统计推断方式打下必要的理论基础。

§3-1 随机抽样整体与样本整体与样本是数理统计中两个要紧概念。

整体是指研究对象的全部，组成整体的每一个单元称为个体。

整体能够包括有限个个体，也能够包括无穷多个个体。

某个整体是有限的，但在个体相当多的情形下，往往把它作为无穷整体来对待。

在数理统计中，咱们不笼统地研究所关切的对象，只考察它的某一种数值指标，例如，考察某批中成药丸的质量时，能够考察崩解时刻、溶解速度、丸重等项指标。

那个地址，若是咱们只需注意药丸的重量，固然，每一丸都有一个确信的重量如：6g，，，，…。

咱们就把所有这些丸重数值当做丸重的整体；每一个丸重值确实是一个个体。

如此，丸重X事实上是一个随机变量，它的取值的全部是一个整体，每一个可能取值确实是它的个体。

由于随机变量是用其概率散布F(x)(或密度函数f x)来刻画，因此假设X具有散布函数F(X)，那么称这一整体为具有散布函数F(X)的整()体。

为了研究整体，需在整体中抽取假设干个个体，这就得出样本的概念。

概念1在一个整体X中抽取n个个体X1，X2，…，X n，这n个个体称为整体X的一个容量为n的样本。

数理统计第3章随机抽样与抽样分布

E ( X i ) = E ( X ) = µ , D( X i ) = D( X ) = σ 2 , i = 1,2,L , n
1 n 1 n 所以 E ( X ) = E ( ∑ X i ) = ∑ E ( X i ) = µ , n i =1 n i =1
1 1 . D ( X ) = D( ∑ X i ) = 2 ∑ D( X i ) = n n i =1 n i =1
11
它反映了总体二、样本数字特征均值的信息它反映了总体 1 n 样本均值 X = ∑Xi 方差的信息 n i=1 1 n 1 n 2 2 2 2 样本方差 S = ∑( Xi − X) = n −1 ∑Xi − nX n −1 i=1 i =1
推导：推导：
( Xi − X)2 = ∑( Xi2 − 2Xi X + X 2 ) ∑
因此, 应视为一组随机变量, 因此,抽样值 ( x1 , x2 ,L, xn ) 应视为一组随机变量,我们把的一个样本子样), 样本( ),其中称为该样本的容量容量。它称为总体 X 的一个样本(或子样),其中 n 称为该样本的容量。
7
二、简单随机抽样
由于抽样的目的是为了对总体的分布进行统计推断，计推断，为了使抽取的样本能很好地反映总体的信息，必须考虑抽样方法信息，必须考虑抽样方法. 最常用的一种抽样方法叫作“ 最常用的一种抽样方法叫作“简单随机抽它要求抽取的样本满足下面两点: 样”，它要求抽取的样本满足下面两点: 1. 代表性： X1,X2,…,Xn中每一个与所考察的总体代表性：有相同的分布. 有相同的分布 2. 独立性： X1,X2,…,Xn是相互独立的随机变量独立性：是相互独立的随机变量. 由简单随机抽样得到的样本称为简单随机样本简单随机样本，由简单随机抽样得到的样本称为简单随机样本，今后如不加声明，均指简单随机样本。今后如不加声明，均指简单随机样本。

抽样技术简单随机抽样

第三章简单随机抽样
第一节概述
一、简单随机抽样的概念

1. 简单随机抽样也叫纯随机抽样，完全随机抽样。

简单随机抽样是直接从总体的N个单位中完全随机的抽取n个单位，并使总体中的每个单位都有同等被抽中概率的抽样组织形式。
简单随机样本的图示
一、简单随机抽样的概念

2 有重复抽样和不重复抽样两种形式。 3 严格意义上的简单随机抽样是指逐个不放回的、即不放回抽样。
4.33 10.33 114.33 184.33 9.33 100.33 165.33 94.33 156 160.33 6.33 93 156.33 86.33 146.33 146.33 66.33 121.33 108.33 86.33 100.8
例：
一、简单估计及其无偏性 N Yi 1 总体均值 Y i 1 N
总体总量
Y N Y
2 简单估计：用样本均值估计总体均值总体均值的简单估计
1 ˆ Y y yi n i 1
n
总体总量的简单估计
N ˆ ˆ Y N Y N y yi n
3 样本均值是总体均值的无偏估计
E( y) Y
二、估计量的方差
1 总体方差：
1 (Yi Y ) 2 N 1 2 2 S ( Y Y ) i N 1
i 1 2 3 4 5 6 7 8 9 10 11 12
xi 7 4 5 2 0 4 6 6 15 0 8 6
yi 670 450 370 130 0 250 1230 900 1240 0 1450 540
i 13 14 15 16 17 18 19 20 21 22 23 24
xi 3 10 6 2 1 4 3 2 6 1 4 8

抽样调查课件ch3

N 1 i1
(Yi
Y )2
n 1 N N 1 i1
(Yi
Y
)
2
1 nN
N n N 1
N i1
(Yi
Y )2
1 n
N n N
1N N 1 i1 (Yi
Y )2
N nS2 nN
1 f n
S2
3.估计量的方差估计：
性质3：v（y） 1 f s2是V（y） 1 f S 2的无偏估计。
n
n
证明：只需证 E(s2 ) S 2
u1 2
S（ˆ） E(ˆ)
u1 2
Cv(ˆ)
3.4.2 估计总体均值或总量时样本量的确定方法：先对总体均值的情形讨论。 1.精度要求：精度要求：置信度1-α的绝对误差限为
d，即 P( y Y d) 1
当n很大时， ˆ ~N ( ,V (ˆ))
ˆ ~N（0，1）Ｖ（ˆ）
则Ｐ（Ｖˆ （ˆ）ｕ１－／２）＝１－
因此，d u1 /2 Ｖ（ˆ） u1 /2Ｓ（ˆ）
则估计总体均值时样本量这样确定：
d
u1
/
Ｓ（
2
ｙ
）
u1 / 2
解（1）
Pˆ
a
38
0.19
n 200
v( p) 1
f
1 200 pq 3042 0.19(1 0.19) 7.2252104
n 1 2001
s( p) v( p) 0.027
（2） Aˆ NPˆ 3042 0.19 578 v( Aˆ) N 2v( p) s(Aˆ) N • s( p) 82.13 82
性质：E（s2） 2,
v(y) s2 n
（4）假定的分布是近似正态的，试分别给出总体均值μ的置信度为95%的近似置信区间。

简单随机抽样

25
对于简单随机抽样，总体均值的估计量为：
yi ˆ Y y i 1 n
n
其中，n是样本量，yi是样本中第i个单元的值，对应某特定样本的值即是估计值。也就是说，将样本中所有yi的值加起来再除以样本量就得到了总体平均数的估计值。
26
在简单随机抽样中，y 既是总体均值的一致估计，也是总体均值 Y 的无偏估计。
29
ˆ 2 的选取，我们通常使用样本方对于估计量 S 2 n 差s 。 ( yi y ) 2 可以证明： 2 i
s
N i

n 1
是总体方差 S 2
2 ( y Y ) i
N 1
的无偏估计量。
30
三、其他估计量当总体为正态分布时，用 Me（中位数）来估计Y 。可以证明：
第三章简单随机抽样（SRS）
第一节概述
第二节
第三节
估计量及其误差
样本量的确定
1
第一节
一、定义
概述
二、抽取方法
三、方法评估四、两个试验
2
一、定义
所有概率抽样的出发点和理论基础都是简单随机抽样。简单随机抽样是一种一步抽样法，它保证样本量为n的每个可能的样本都有相同的被抽中的概率p=n/N。
24
如果一个估计量对于所有可能样本计算的估计值的平均数等于参数的真值，称这个估计量是无偏的。另一个所需要的估计量的性质是它的抽样分布应与其平均数尽可能地靠拢。对这种性质的一个度量指标是抽样方差。我们通常希望估计量具有一些好的性质：其中的一个性质就是估计量应是无偏的或近似无偏的，另一个是抽样方差较小的估计量被认为是精确的：抽样方差越小，估计的精度越高。

8社会研究方法之概率抽样方法

4
二、系统抽样
步骤
方法
特点
首先将总体中各单位按一定顺序排列，根据样本容量要求确定抽选间隔，然后随机确定起点，每隔一定的间隔抽取一个单位的一种抽样方式。是纯随机抽样的变种
先将总体从1～N 相继编号，并计算抽样距离K=N/n。式中N为总体单位总数，n为样本容量。然后在1～K中抽一随机数k1，作为样本的第一个单位，接着取 k1+K,k1+2K…… ，直至抽够n个单位为止
的情况。
9
想一想：
假设某地区有高中生2400人，初中生10900人，小学生11000人。此地区教育部门为了了解本地区中小学生的近视情况及其形成原因，要从本地区的中小学生中抽取1% 的学生进行调查。你认为应当怎样抽取样本？能在14300人中任意取 143个吗？能将143个份额均分到这三部分中吗？
当总体是由差异明显的几部分组成时，往往选择分层抽样的方法
7
三、分层抽样/类型抽样
想一想：如何把图示补充完整
分类
随机抽样
总体
分层
样本
8
分层抽样的特点：
当一个总体内部分1 层明显时，能克服简单随机抽样和
等距抽样的缺点。
在不增加样本规模2的前提下降低抽样误差，提高抽样
精度。
有些研究不仅要了3解总体的情况，还要了解某些类别
（二）特点
按抽样元素的隶属关系或层次关系，把抽样分为几个阶段进行。
e.g.大学—院系—班级—学生
优点：不需要总体全部名单，抽样较容易；节约人力物力缺点：每级抽样都会有误差，故误差较大
15
例：假设某市共有2.4万名教师，分布在10个区200所学校中，现抽取一个由1200名教师组成的样本，按照三阶段抽样的方法，抽样方案有：

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

（三）不放回和放回简单随机抽样的比较

每次抽样面对的总体结构不同。放回抽样总体结构不变，每次抽取相互独立，不放回抽样总体结构改变，每次抽取不相互独立，前者的数学处理简单。样本提供的信息量不同。不放回抽样信息量更大，抽样效率高。样本单位数量限制不同。一般采用不考虑顺序的不放回简单随机抽样。
因素二：实际调查运作的机制。调查经费能支持多大样本？允许调查持续的时间多久？需要多少调查人员？多种约束条件。能够量化的因素只有抽样精度和调查费用。方案：总费用一定的条件下精度最高；或者在满足一定精度要求的条件下使费用最小。

费用公式： C C 0 cn
C 为总费用， C 0为与样本量无关的固定费用，包括管理人员的工资、调查表的设计、必要的设备以及组织、宣传等固定费用， c为平均调查一个样本的变动费用，包括调查表的印制、调查员的工资和差旅费、礼品费以及调查本身的费用。 n= C-C0 c
2
n)
n ( N 1)
N PQ (N n)
2
n ( N 1)

V(p)的无偏估计量是v(p)
v( p)

N n ( n 1) N n 1
pq
1 f n 1
pq

v( N1)
N (N n)
p q 是 V ( N 1 )的无偏估计

当N，n,N-n都比较大时，以正态分布给出P及N1的近似置信区间（置信度1-a）为
n
（一）放回简单随机抽样
设总体有５个单位（1，2，3，4，5），按放回简单随机抽样的方式抽取2个单位，若考虑样本单位的顺序，则所有的可能样本为25个，若不考虑样本单位的顺序，则所有可能样本为15个。不考虑顺序的放回简单随机抽样的估计量方差大于或等于考虑顺序时的估计量的方差。只讨论和使用考虑顺序的情形。
Y
i 1
N
i
Y

N N1 N
1 P
总体比例是总体均值的一种特殊表现形式，对总体比例的估计就是对总体均值的估计，对总体中具有某种属性单位的总个数 N 1的估计就是对总体总值估计的一个特例。
二、总体比例的简单估计量及性质
（一）简单估计量的定义利用简单随机抽样抽取n个单位组成样本，其中n1 个单位具有某种属性，则样本比例是总体比例的简 n 单估计量。
以 9 5% 的把握估计人均消费 5 3 .6 4 1 .9 6 *6 .1 4 2 8 , 既 4 1 .6 0 ~ 6 5 .6 8
二、总体总值的简单估计
•总体总值
_
Y=N Y
Y
i
•总体总值的简单估计量
Y N y

N n

n
yi
i 1
•总体总值估计量的性质由总体均值估计量的性质决定。简单随机抽样的是的无偏估计量。 Y Y •方差 V ( Y ) 无偏估计为
二、估计总体均值（总值）的样本量确定

总体总值是总体均值N倍，N是常数，对样本量的确定不起决定作用，只须估计总体均值的情形。
n
N
总体中任意两个单位出现在全部可能样本中的次数都 n 相等是 C n 2 每一单位入样概率 C N 22 n ( n 1)
N 2
CN
n

N ( N 1)
对称性论证法（三）简单估计量的方差 1 f 2 V ( y) S n （四）简单估计量方差的无偏性简单随机样本的方差 s 1 ( y 2 n 1 S 的无偏估计。
28 29 30 31 32 33 34 35 36
25 28 90 17 57 43 146 19 47

2
y i 1 9 3 1( 元）， 5 3 .6 4, (1 f ) / n 0 .0 2 7 7 1 2, y
2

s 1 3 5 8 .4 1, v ( y ) (1 f ) s / n 3 7 .6 4 4 4, se ( y ) 6 .1 3 5 5
（二）不放回简单随机抽样
不考虑样本单位顺序，可能的样本为每个样本被抽中的概率为 1 / C

n N
CN
n
个。

虽然样本个数不同，但有同样的概率分布。
（二）不放回简单随机抽样

设总体有5个单位（1，2，3，4，5），按不放回简单随机抽样的方式抽取2个单位，若考虑样本单位的顺序，则所有可能样本 20个。若不考虑样本单位的顺序，所有可能样本为10个。二者概率分布相同，不考虑顺序的工作量小，所以对于不放回抽样，只讨论不考虑顺序的不放回抽样。
第三章简单随机抽样
本章教学目的与要求
简单随机抽样是抽样中最基本、最成熟、最简单的抽样设计方式，是所有概率抽样方法发展、比较的基础。具体要求：通过学习，熟练掌握简单随机抽样的抽样方式和样本抽选方法；熟知总体均值、总体总值和总体比例的简单估计；掌握样本量的确定；了解子总体的估计。
一、确定样本量主要考虑因素样本量过大，容易产生非抽样误差，样本量过小，产生抽样误差。因素一：对抽样估计量精度的要求。精度要求高，即要求抽样误差小，则必须样本量大。总体单位调查标志的变异程度、总体的大小、样本设计和所使用的估计量、回答率等都是影响估计精度的因素。

一、确定样本量主要考虑因素

v (Y ) N v ( y )
2

N (1 f )
2
s
2
n
第三节总体比例的简单估计
一、总体比例总体中具有某种属性的单位占总体单位的比例或具有某种属性单位的总个数，也称成数。

设总体有N个单位，具有某种属性的单位N1个，不具有该属性的单位有N-N1个。
1, 总体单元具有某种属性 Yi 0，总体单元不具有某种属性 P Q N1 N 1 N
tS E ( ) t

V ( ) , 绝对允许误差

t
S E ( )

tC V ( ), 相对允许误差

C V ( )

S E ( )

,变异系数
S E ( ) 估计量的标准差
•达到要求精度，就是控制抽样误差，估计量的标准差或变异系数都是n的函数，只要给定对精度的要求，就可以求出最低样本量要求。
p

n1 n

yi

i 1
y

n
N1 Np

是总体中具有某种属性单位的总个数
N 1 的简单估计量。
（二）估计量性质

p是P的无偏估计量。 p的方差 PQ (N
V ( p)
N 1 N p 是 N 1的无偏估计 , 且 V (N1) V (NP) N V ( p)
二、简单随机样本的抽选方法
抽签法：材质相同N个签，一次抽n，或者一次抽1个直到抽够n. 随机数表法随机数色子摇奖机计算机产生

三、简单随机抽样的地位与局限
抽样技术的重要理论基础。当Ｎ很大时，编制抽样框困难；有辅助信息不加利用，统计效率低下；样本分布广泛时，抽样费时费力；可能得到差的样本。
N ( N n) pq
), N p ( t
N ( N n) pq

正态近似产生的误差主要与nP有关，特别当nP比较小时，产生的误差甚大，在95% 置信度下，P<0.5时正态分布需要的最小nP 值与n值如下表。
P 0.5
nP 15
n 30
0.4
0.3 0.2 0.1 0.05 0

（二）不放回简单随机抽样

不放回也称不重复抽样，每次从总体中随机抽取一个样本单位，经调查观测后，不再将该单位放回总体参加下一次抽样，然后再在剩下的总体单位中随机抽取下一个样本单位进行调查观测，直到抽够n个样本单位为止。
考虑顺序可能的样本为
N !
Hale Waihona Puke N n!
每个样本被抽中的概率为
(N n)! N !

第一节抽样方式
简单随机抽样（simple random sampling）：也称纯随机抽样。对于大小为N的总体，抽取样本量为n的样本，若全部可能的样本被抽中的概率都相等，则称这样的抽样为简单随机抽样。可以分为放回和不放回抽样。

（一）放回简单随机抽样

放回抽样也称重复抽样。做法是每次从总体中随机抽取一个样本单位，经调查观测后，将该单位重新放回总体，然后再在总体中随机抽取下一个单位进行调查观测，依次重复这样的步骤，直到从总体中随机抽够n个样本单位为止。 n 可能的样本为 N ( 考虑顺序) 或 C N n 1 放回抽样的特点：同一个单位有可能在同一个样本中重复出现。
(1 f ) p q n 1 n 1 ,pt (1 f ) p q n 1 ]
[p t [Np t
N ( N n) pq
, Np t
N ( N n) pq n 1
]
离散二项分布调整为连续正态分布 [ p (t [ N p (t (1 f ) p q n 1 n 1 1 2n N 2n ), p ( t (1 f ) p q n 1 1 2n n 1 N 2n )] )]

V ( y)
的无偏

第三章简单随机抽样

合集下载

Chap03简单随机抽样

应用抽样技术课后习题答案

第三章抽样的原理及类型

第三章-简单随机抽样

统计学第三章抽样与抽样分布

初级1 -第三章简单随机抽样

第三章抽样设计PPT学习教案

第3章抽样分布

03第三章简单随机抽样

第三章抽样和抽样分布

第三章简单随机抽样(抽样调查理论与方法-北京商学院,

第三章随机抽样和抽样散布

数理统计第3章随机抽样与抽样分布

抽样技术简单随机抽样

抽样调查课件ch3

简单随机抽样

8社会研究方法之概率抽样方法

文档推荐

最新文档

第三章 简单随机抽样

合集下载

Chap03简单随机抽样

应用抽样技术课后习题答案

第三章抽样的原理及类型

第三章-简单随机抽样

统计学 第三章抽样与抽样分布

初级1 -第三章简单随机抽样

第三章抽样设计PPT学习教案

第3章 抽样分布

03第三章 简单随机抽样

第三章抽样和抽样分布

第三章简单随机抽样(抽样调查理论与方法-北京商学院,

第三章随机抽样和抽样散布

数理统计第3章 随机抽样与抽样分布

抽样技术简单随机抽样

抽样调查课件ch3

简单随机抽样

8社会研究方法之概率抽样方法

文档推荐

最新文档

第三章简单随机抽样

统计学第三章抽样与抽样分布

第3章抽样分布

03第三章简单随机抽样

数理统计第3章随机抽样与抽样分布