抽样调查 一、选择题
1.抽样调查的根本功能是( C )
A. 获取样本资料
B. 计算样本资料 C . 推断总体数量特征 D. 节约费用
2.概率抽样与非概率抽样的根本区别是( B )
A.是否能保证总体中每个单位都有完全相同的概率被抽中
B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中
C.是否能减少调查误差
D.是否能计算和控制抽样误差
3. 与简单随机抽样进行比较,样本设计效果系数Deff >1表明( A ) A.所考虑的抽样设计比简单随机抽样效率低 B.所考虑的抽样设计比简单随机抽样效率高 C.所考虑的抽样设计与简单随机抽样效率相同 D.以上皆对
4.优良估计量的标准是( B )
A.无偏性、充分性和一致性
B.无偏性、一致性和有效性
C. 无误差性、一致性和有效性
D. 无误差性、无偏性和有效性 5.某乡欲估计今年的小麦总产量进行调查,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到63.118=y 吨,这些村去年的产量平均为21.104=x 吨。试采用比率估计方法估计今年该地区小麦总产量( B ) 抽样标准误差的大小与下列哪个因素无关( C )
A .样本容量
B .抽样方式、方法
C .概率保证程度
D .估计量 7.抽样标准误差与抽样极限误差之间的关系是( B ) A.θ
θ
)?(SE =
? B.)?(θtSE =? C.θθ)?(tSE =? D.t
SE )?(θ=?
8.应用比率估计量能使估计精度有较大改进的前提条件是调查变量与辅助变量
之间大致成( A )关系
A.正比例
B.反比例
C.负相关
D.以上皆是
9.能使)2(1)(2
22YX X Y lr S S S n
f y V ββ-+-=达到极小值的β值为( B )
A.YX X Y S S S ?
B.2X YX S S
C.2Y
YX
S S D.X YX S S 2
10.( B ) 是总体里最小的、不可再分的单元。
A.抽样单元
B.基本单元
C.初级单元
D.次级单元 11. 下面哪种抽样方法是最简单的概率抽样方法( A )。
A.简单随机抽样
B.分层随机抽样
C.系统抽样
D.整群抽样 12. 下面关于各种抽样方法的设计效应,表述错误的是( B )。 A.简单随机抽样的deff=1 B.分层随机抽样的deff ﹥1 C.整群随机抽样的deff ﹥1 D.机械随机抽样的deff ≈1
13. 假设考虑了有效回答率之外所有其他因素后的初始样本量为400,而预计有
效回答率为80﹪,那么样本量则应定为( B )。
14. 在要求的精度水平下,不考虑其他因素的影响,若简单随机抽样所需要的样本量为300,分层随机抽样的设计效应deff=,那么若想达到相同的精度,分层随机抽样所需要的样本量为( C )。
15. 分层抽样设计效应满足( B )。
=1﹤1≈1﹥1
16. 针对总体每一单元都进行信息搜集的调查是( D )
A.抽样调查
B.典型调查
C.重点调查
D.全面调查
17. 调查费是用一个与样本容量有关的函数,若0C为固定费用,c为每一个单元的调查费用,则最简单的线性费用函数为( D )
A. C
t = C
+n B. C
t
= C+C
n C. C
t
= (C
+C)
n
D. C
t
= C
+Cn
18. 抽样框最直接反映的是( C )
A.目标总体
B.实际总体
C.抽样单元
D.基本单元
19. 在给定费用下使估计量的方差达到最小,或者对于给定的估计量方差使得总费用达到最小的样本量分配为( C )
A. 常数分配
B.比例分配
C. 最优分配
D.梯次分配
20.分层抽样也常被称为( D )
A.整群抽样
B.系统抽样
C.组合抽样
D.类型抽样
21. 整群抽样中群的划分标准为( A )。
A.群的划分尽可能使群间差异小,群内的差异大
B.群的划分尽可能使群间差异大,群内的差异小
C.群的划分尽可能使群间差异大,群内的差异大
D.群的划分尽可能使群间差异小,群内的差异小
22.某班级共有六十名学生,要以直线等距抽样选出15个学生为样本,调查学生的到课率,则下列做法正确的是( D )。
A.将60名学生依次编为1~60
B.计算抽样间距为4
C.从1~4随机抽取一个数,作为抽样的起始单元号,按每隔4个单元抽取一个,直至抽出15个样本
D.以上都正确
23. 初级单元大小不等的多阶段抽样中,无偏估计量满足自加权的条件是( C )
A.第一阶段每个单元被抽中的概率相等
B. 第二阶段每个单元被抽中的概率相等
C.每个基本单元最终被抽中的概率相等
D. 每个基本单元最终被抽中的概率不等
24.相对于直线等距抽样,圆形等距抽样的优点为( C )
A.不用对单元进行编号
B.随机起点选择范围小
C.保证每个单元被抽中的概率严格相等
D.操作更加简单
25. 某学院共有500名学生,依次编号为1~500,要从中抽取50名学生调查学生的到课率,首先从1~10号中随机抽取一个数,作为抽样的起始单元号,然后每隔10个单元抽取一个,直到抽足50个单元。这种抽样方法是(C )
A. 简单随机抽样
B. 分层抽样
C. 系统抽样
D. 整群抽样
26. 非概率抽样与概率抽样的主要区别为( D )
A. 适用的场合不同
B. 总体特征值的估计不同
C. 样本量的确定不同
D. 抽样时是否遵循随机原则
27. 下面关于各种抽样方法的设计效应,表述错误的是( B )
A. 简单随机抽样的deff=1
B. 分层随机抽样的deff>1
C. 整群抽样的deff>1
D. 系统抽样的deff1
28. 某工厂实行流水线连续生产,为检验产品质量,在每天24小时中每隔1小时抽取一分钟的产量作全面检查,这是( C )。
A.简单随机抽样
B.分类抽样
C.等距抽样
D.整群抽样
29. 为了解1200名学生对学校教改试验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段的间隔k为( A )
30. 分层抽样中的层的划分标准为( B )。
A.尽可能使层间的差异小,层内的差异大
B.尽可能使层间的差异大,层内的差异小
C.尽可能使层间的差异大,层内的差异大
D.尽可能使层间的差异小,层内的差异小
二、判断题
×1. 总体比率R与总体比例P两者是一样的概念,只是符号不同。
√2.比估计量是有偏估计量。
×3.分层抽样在划分层时,要求层内差异尽可能大,层间差异尽可能小。
×4.对于同一总体,样本容量同抽样标准误差之间是正相关关系。
×5.整群抽样设计总是比简单随机抽样效率低。
×6.其他条件相同时,重复抽样的误差小于不重复抽样的误差。
×7.设总体容量为N,样本容量为n,采用有顺序放回简单随机抽样,样本配合C。
种数为n N
×8.一个调查单位只能对接与一个抽样单位。
√9. 营业员从笼中抓取最靠近笼门的母鸡,该种抽样方式属于非概率抽样。√10. 当调查单位的抽样框不完整时,无法直接实施简单随机抽样。
√11 分层抽样不仅能对总体指标进行推算,而且能对各层指标进行推算。
×12 分层的基本原则是尽可能地扩大层内方差,缩小层间方差。
√13 分层抽样的效率较简单随机抽样高,但并不意味着分层抽样的精度也比简单随机抽样高。
√14 分层抽样克服了简单随机抽样可能出现极端的情况。
√15 分层抽样的样本在总体中分布比简单随机抽样均匀。
×16 分层后各层要进行简单随机抽样。
√17 分层抽样的主要作用是为了提高抽样调查结果的精确度,或者在一定的精确度的减少样本的单位数以节约调查费用。
√18分层后总体各层的方差是不同的,为了提高估计的精度,通常的做法是在方差较大的层多抽一些样本。
√19在不同的层中每个单位的抽样费用可能是不等的。
×20 在分层抽样的条件下,样本容量的确定与简单随机抽样的共同点都是取决于总体的方差。
√21 多主题抽样中,不同的主题对样本量大小的要求不同。在费用允许的情况下,应尽可能地选择较大的样本量。
√22 有时在抽样时无法确定抽样单位分别属于哪一层,只有在抽取样本之后才能区分。
×23 比例分配指的是按各层的单元数占样本单元数的比例进行分配。
×24 等容量分配时各层的样本单元数与各层的层权是相同的。
√25 所谓最优分配是指给定估计量方差的条件下,使总费用最小。
√26 在奈曼分配时,如果某一层单元数较多,内部差异较大,费用比较省,则对这一层的样本量要多分配一些。
√27 在实际工作中如果第k层出现kn超过kN,最优分配是对这个层进行100%的抽样。
√28 在实际工作中,如果要给出估计量方差的无偏估计,则每层至少2个样本单元,层数不能超过n/2。
×29 无论层的划分与样本量的分配是否合理,分层抽样总是比简单随机抽样的精度要高。
×30 即使层权与实际情况相近,利用事后分层技术也难以达到提高估计精度的目的。
×31.在任何条件下,估计量的方差都与估计量的均方差相等,因此一般所讲的估计误差也就是指估计量的方差。
×32.在多阶段抽样中,各阶段只能采用同一种抽样方法。
×33.总样本量在各层间按内曼分配的结果可以形成自加权的估计量。
×34.估计抽样误差时,在各种抽样技术条件下都可以用样本方差代替总体方差。×35.比估计就是比例估计。
×36.随机原则就是要使得总体中的每一个抽样单元都有相等的可能性被抽中。√37.整群抽样可以被理解为是第二阶段抽样比为100%时的一种特殊的两阶段抽样。
×38.分层抽样可被理解为是第二阶段抽样比为100%时的一种特殊的两阶段抽样。
×39.比估计与回归估计都充分利用了有关辅助变量,因此一般情况下都较简单估计的精度要高。
√40.当第一重样本量等于总体容量时,二重分层抽样与一般分层抽样具有相同的估计精度。
三、名词解释
1.滚雪球抽样
答:滚雪球抽样是指利用样本点(构成样本的单元)寻找样本点,即由目前的受访者去寻找新的具有新的具有某一特征的受访者。
2.分别比估计
答:分别比估计是指利用将比率估计的思想和技术用于分层随机样本时,两种可行的办法之一:对每层样本分别考虑比估计量,然后对各层的比估计量进行加权平均,此时所得的估计量称为分别比估计。
抽样
答:
4.配额抽样
5.概率抽样
6. 不等概率抽样
7. PS π抽样的Brewer 方法
8. 最优分配 9. 比率估计 四、计算题 1、(简单随机抽样的均值、比例估计和样本量的确定)某住宅区调查居民的用水情况,该区共有N =1000户,调查了n =100户,得y =吨,2
s =1252,有40户用
水超过了规定的标准。
要求计算: ○1该住宅区总的用水量及95%的置信区间; ○2若要求估计的相对误差不超过10%,应抽多少户作为样本 ○3以95%的可靠性估计超过用水标准的户数; 2
设1000 n
○1采用按比例分层抽样的方法估计Y 和P 并计算其标准误; ○2采用奈曼分配的方法估计Y 和P 并计算标准误;
3、(两阶段抽样)某市为了了解职工收入情况,从该市的630个企业中随机抽取了5
其中,
i
M 为企业职工数,
i
m 为样本量;
i
y 为样本均值,
22i
s 为样本方差。
试估计该市职工平均收入及标准差。
4、(比率估计)某养兔场共有100只兔子,上月末称重一次对每只兔的重量作了纪录,并计算平均重量为磅,一个月后随机抽取10只兔子标重如下:
○2估计现有兔子的平均重量及其标准误差; ○3将比估计方法与均值估计法进行比较,哪一种方法效率高分析其原因。 5、为调查某5443户城镇居民服装消费情况,采用简单随机不重复抽样调查了36户进行调查,得到平均消费支出72.649=y 元,3048032=s 试根据此估计: (1)该地区居民服装消费支出总额,并给出置信水平为95%的置信区间。 (2)如果希望服装平均消费支出的相对误差限不超过5%,则样本量至少应为多少
6、某地区10000名群众,现欲估计在拥有本科学历及以上的群众所占的比例,随机不重复抽取了300名群众进行调查,得到25.0=p ,试估计该地区群众拥有本科以上学历的比例,并以正态分布近似给出其95%的置信区间。
7、对某地区171 980户居民家庭收入进行调查,以居民户为抽样单位,根据城镇和乡村将居民划为2层,每层按简单随机抽样抽取300户,经整理得如下
试根据此估计:
(1)居民平均收入及其95%的置信区间。
(2)若是按比例分配和奈曼分配时,各层样本量分别应为多少
8、某居民小区共有600个单元,每个单元均居住15户,现以单元为群进行整群抽样,随机抽取8个单元,调查每户每周的食品支出费用,调查结果经整理,
(1)该居民小区平均每户每周食品支出费用,并给出其置信水平为95%的置信区间。
(2)计算以单元为群的群内相关系数与设计效应 9、某县有300个村,小麦播种面积为23 434亩。全部村子按地势分为平原和山区两种类型,各按10%的抽样比抽样,调查亩产量,经整理得到下表结果,以大写字母表示总体数据,小写字母表示样本数据,Y 代表调查变量,为今年的总产量,X 代表辅助变量,为去年的总产量,相应的均值为平均亩产量。
试分别对全县今年的平均亩产量构建分别比率估计量和联合比率估计量。
10、一个由N=1000个人构成的总体被划分为两层:第一层由4001=N 名男性组成,第二层由6002=N 名女性组成。从中抽取一个样本量为n=250的样本,将样本等比例地分配给各层,使得两层的抽样比都等于n/N=1/4。求各层的样本量分别是多少
11、一公司希望估计某一个月内由于事故引起的工时损失。因工人、技术人
12、某工厂生产的新产品供应国内市场的300家用户,试销售滿一年后,现欲请用户对该厂的新产品进行评价。
现把这些用户分成本地区、本省外地区、外若要求估计评价成绩均值的方差1
.0)(=st y V ,并且费用最省(假定费用为线性形式),求样本量n 在各层的分配。
13、某林业局欲估计植树面积,该局共辖240个林场,按面积大小分为四层,
14. 一个县内所有农场按规模大小分层,各层内平均每个年农场谷物(玉米)
现要抽出一个包含100个农场的样本,目的是估计该县平均每个农场的玉米面积,请问:
(1)按比例分配时,各层的样本量为多少
(2)按最优分配时,各层的样本量为多少(假定各层的单位调查费用相等) 15. 某县欲调查某种农作物的产量,由于平原、丘陵和山区的产量有差别,故拟划分为平原、丘陵和山区三层采用分层抽样。平原区共有150个村庄,丘陵区共有100个村庄,山区共有250个村庄。按照各种地形等比例各抽取5%样本,进行实割实测产量,结果计算如下表。
(1
)在%的概率保证程度下,试估计该县农作物平均每村产量的区间范围。 (2)若村庄的农作物产量低于150吨,县政府并将其归为低产量村,从而对其加强农业补贴政策。因此,试图在%的概率保证程度下估计该县低产量村比例的 16.某城市居民小区的食品消费量调查,以每个楼层为群进行整群抽样,每个楼层都有8个住户。用简单随机抽样在N =510个楼层中抽取n =12个楼层,得到96个样本户人均食品消费额,及按楼层的平均数和标准差,如表。请估计该
小区人均食品消费额的户平均值,并给出95%置信区间。
17. 邮局欲估计每个家庭的平均订报份数,该辖区共有4000户,划分为400
群各户订报数ij y i y
11,2,1,3,3,2,1,4,1,119
21,3,2,2,3,1,4,1,1,220
32,1,1,1,1,3,2,1,3,116
41,1,3,2,1,5,1,2,3,120试估计平均每户家庭订报份数及总的订报份数,以及估计量的方差。
18. 某工业系统准备实行一项改革措施。该系统共有87个单位,现采用整
群抽样,用简单随机抽样抽取15个单位做样本,征求入选单位中每个工人
单位总人数赞成人数
15142
26253
34940
47345
510163
64831
76538
84930
97354
106145
115851
(2)在调查的基础上对方案作了修改,拟再一次征求意见,要求估计比例的允许误差不超过8%,则应抽取多少个单位做样本
19. 某集团的财务处共有48个抽屉,里面装有各种费用支出的票据。财务人员欲估计办公费用支出的数额,随机抽取了其中的10个抽屉,经过清点,整
要求以95%的置信度估计该集团办公费用总支出额度置信区间(α=)。
20. 某高校学生会欲对全校女生拍摄过个人艺术照的比例进行调查。全校共有女生宿舍200间,每间6人。学生会的同学运用两阶段抽样法设计了抽样方案,从200间宿舍中抽取了10间样本宿舍,在每间样本宿舍中抽取3位同学进行访
试估计拍摄过个人艺术照的女生比例,并给出估计的标准差。
计算题答案:
1、解:已知N = 1000,n = 100,
n100
f0.1
N1000
===,2
y=12.5s1252
=
,
○1估计该住宅区总的用水量Y为:
?Y=Ny=100012.5=12500?
估计该住宅区总的用水量Y 的方差和标准差为:
22221-f 10.1?v(Y)=N v(y)=N s 10001252=11268000
n 100?3356.7842-=??=≈
因此,在95%的置信度下,该住宅总的用水量的置信区间估计为:
??Y
ts(Y)=125001.963356.7842125006579±±?≈± 即,我们可以以95%的把握认为该住宅总的用水量在 5921吨~19079吨之间。 ○2根据题意,要求估计的相对误差不超过10%,即r ≤,假定置信度为95%
根据公式:22202222
t s 1.961252
n 3078r y 0.112.5?==
≈? 由于
n 3.0780.05N =>,所以需要对0n 进行修正: 00n 3078
n = 755n 1+3.0781N
=≈+
若要求估计的相对误差不超过10%,应抽不少于755户作为样本。 ○3以95%的可靠性估计超过用水标准的户数;
令超过用水标准的户数为A ,样本中超过用水标准的户数为a = 40,估计超过用水标准的比例P 为:
a 40p = 40%
n 100==
估计超过用水标准的比例P 的方差和标准差为:
1f 10.1
v(p)pq 40%60%0.002182n 11001
s(p) 4.67%
--=
=??≈--==≈
在95%的可靠性下,超过用水标准的比例P 的估计区间为: p ts(p)40%1.96 4.67%±=±?
因此,我们有95%的把握认为,超过用水标准的比例P 在%%之间,超过用水标准的户数的点估计为:100040%400?=户,超过用水标准的户数在
100030.85%?户~100049.15%?户之间,即309户~492户之间。
2、解:○1根据题中已知条件,采用按比例分层抽样的方法估计Y 为: L
st h h h 1y W y 0.35 3.10.55 3.90.17.8 4.01===?+?+?=∑
估计Y 的方差和标准误差为:
L
2222st h h h 1
st 1f 1
v(y )W S (0.3520.55 3.30.111.3)0.0201585n 1000s(y )0.141981
=-=
≈
?+?+?≈=∑
估计P 及其方差和标准误差为:
L
prop h h h 1
L prop h h h h 1prop p W p 0.350.540.550.390.10.240.4275
1f 1
v(p )W p q (0.350.540.460.550.390.610.10.240.76)0.000218
n 1000s(p )0.014765
====?+?+?=-≈≈??+??+??≈=∑∑
○2采用Neyman 分配的方法估计Y 和P 的方法和与○1是一样的,即
L
st h h h 1
L
prop h h h 1
y W y 0.35 3.10.55 3.90.17.8 4.01p W p 0.350.540.550.390.10.240.4275
====?+?+?===?+?+?=∑∑
但是采用Neyman 分配估计Y 和P 的方差的方法不同,分别为:
L L 222st h h h h h 1h 1st L 2prop h 1prop 111v(y )(W S )W S (0.3520.55 3.30.111.3)0.013286
n N 1000s(y )0.115265
11v(p )(W (0.350.550.10.000236
n 1000s(p )====-≈?+?+?≈==≈≈≈∑∑
∑0.015362
=≈
3、解:已知:N = 630,n = 5,2i i i 2i M ,m ,y ,s 估计该市职工的平均收入为:
n
i i
i=1n
i
i=1
M y
520328+108400140031012003709000420
y=
398520108140012009000
M
??+?+?+?=
≈++++∑∑
估计该市职工平均收入的方差及标准差为:
n n 2
212i i 2i i 1i 1i
222221-f (1-f )11v(y) = (y y)s n n 1n m 5
1-1
630 [(328398)(400398)(310398)(370398)(420398)]5511010202011111
52010814001200 [400.056301.1341303.158510102020==-+-=-+-+-+-+-+
-----=?+?+?+∑
∑100190001205.7864200]
100 667.46031745.321254
= 713.781571
s(y)=26.71669
-?+?≈+≈
因此,估计该市职工平均收入为398元,标准差为元
4、解:○1已知:N = 100 ,n = 10 ,设X ,Y 分别代表上月兔子总重量和
本月兔子总重量,则 X = 3.1,n 10
f = 0.1N 100
==。
由表中数据可得:
1010
i i i=1i=1102
2y i i 110
22x
i i 1
10
yx i i i 1
11y = y 4 x = x 2.97
10101s (y y)0.022210-11s (x x)0.024610-11s (x x)(y y)0.015
10-1======-≈=-≈=--=∑∑∑∑∑, 因此,对这批兔子较上月末增重的比率估计为: y 4?R =
1.3468x
2.97
=≈ ?R
方差的估计为: 2222y x yx
22
1f 10.1???v(R)(s R s 2Rs )(0.0222 1.34680.02462 1.34680.015)0.0002474nX 10(3.1)--≈+-=+?-??≈??R
标准误差的估计为:
?0.015729=≈ ○2对现有兔子的平均重量的比率估计为:
R ?y = RX=1.3468 3.1 4.17508?=
R y 方差的估计为:
2222R y x yx
1f 10.1??v(y )(s R s 2Rs )(0.02221.34680.024621.34680.015)0.0023775n
10
--≈+-=+?-??≈ R y 标准误差的估计为:
R s(y 0.04876=≈ ○3对现有兔子的平均重量的均值估计为:
10
i i=1
1y = y 410=∑
y 方差的估计为:
2y 1f 10.1
v(y)s 0.02220.001998n 10
--=
≈?= 因此,得到现有兔子平均重量的比率估计量设计效应的估计为: R v(y )0.0023775
?deff =
=1.1899v(y)0.001998
≈ 对于本问题,均值估计方法的效率比比率估计方法的效率要高。原因是:比
率估计是有偏的,当样本量足够大时,估计的偏倚才趋于零,而本问题中的样本量较小,使用比率估计量时不能忽视其偏倚,所以无法保证估计的有效,使得估计效率比均值估计方法的效率低。
5、解:96.1,304803,72.649,36,54432=====t s y n N
21~?
~%,66.0)1(s n
f t N y N Y N n f ?-??±==
96.3536425?
~=?=y N Y 8695.84101)(2=?-=s n
f y v )()?
~(2y v N Y v ?= 8433.499181)?~(=Y SE 所以居民区总用水量的区间为:
)37.4514822,55.2558029(
222
2000,1%,5)2(Y r s t n N
n n n r ?=+
=≤
根据题中相关数据可得11100≥n 户,由此可得922≥n 户
即,要满足相应的精度要求,至少得抽922户做样本。
6、解:96.1,25.0,03.0,300,10000====
==t p N
n
f n N 41008.6)1(1
1)(-?≈-??--=
p p n f
p v 0247.0)(≈p SE
所以本科生中暑假参加培训班的95%的置信区间为:
)
2984.0,2016.0(0484.0%25)0247.096.1(%25)(即±=?±=?±p SE t p
7、解:(1) 由题中相关数据资料:元)(39.105852
1
≈?=∑=h h h st y W y
(元)
3082.166057364.160595718.545)1()(2
2
1
2=+≈?-?=∑=h h h h h st n S
f W y v 户),元/(86.128)(≈st Y se 96.1=t
该地区居民平均收入的95%的置信区间为:
元)96.10837,82.10332()(→?±st st Y se t Y
(2)按比例分配:
户)(82137.060011=?=?=W n n 户)(518863.060022=?=?=W n n
按奈曼分配:
∑=???
=L
h h
h
h
h h S W
S W n n 1
由表中资料:362.2604,198.2197,164.407,6002
1
2211====∑=h h h S W S W S W n
由上可得根据奈曼分配,各层所需样本容量为:
94362.2604164
.4076001≈?=n
506362
.2604198
.21976002≈?=n
8、解:(1)96.1,15,013.0,8600======t M A
a
f a A ,
625.21211
=?=∑=a
i i y a y
7315.7199821.4715)(121
2=?≈-?-=
∑=y y a M
s a
i i b
9198.51)(2
≈-=
b s aM
f y v 43.2)(≈y se ,所以该城市大学生人均月生活费支出95%的置信区间为:
)39.217,86.207()(→?±y se t y (2)20.91711
2
2≈=∑=a i i w
s a s
0146.0)1(?2
222-≈-+-=w
b w
b c s M s s s ρ 7956.0?)1(1=-+≈c M deff ρ
9、解:全县今年的平均亩产量的分别比率估计量
由题可得:058.1?,039.1?,?2
1===R R x y R h
h h 89.389)?(2
1
=?=∑=h
h h h Rs X R W y 全县今年的平均亩产量的联合比率估计量
由题可得:62.3892
1
==∑=h h h st y W y ,58.3712
1
==∑=h h h st x W x
049.1?==st
st C
x y R 98.3712
1
=?=∑=h h h X W X
21.390?=?=X R y C RC
10、解:1004/1*4001==n
1504/1*6002==n
即各层的样本量分别为100和150人
11、解:3*275*926*132*
30++==∑i
i i
i i i i S N S N S N n
n 181333
*
301
11==S N n 102=n 23=n
12、解:()∑∑∑+=
2
22))(/(i i st i i i i i i N y S N C N C N n σσσ=2806.2754
.81990004
.210238.126≈=+? ()∑∑+2
22)
/(i i st i i i N y S N C N σσ
∑)/(i i i C N σ=
38.1266
8
.15358.19335.1154=?+?+? ∑)i i
i
C N σ
=4.21026*8.1*535*8.1*933*5.1*154=++
()st y S N 22=90001.030022=?
∑2
i
i
N σ
=54.81924.3*5324.3*9325.2*154=++
17059.1738
.12677
28)
//1
111≈=?
==∑i i
i
C N C N n
n σ
σ
742.738
.12648
.3328)
//2
222≈=?
==∑i i
i
C N C N n
n σ
σ
4523.338
.1269
.1528)
//3
333≈=?
==∑i i
i
C N C N n
n σ
σ
即各层的样本量分别为17、7、4
13、解:50696?==∑h
h Y N Y 506964324)?(==Y
s Y
?=(42048,59344) 分析:略。
14. 解:(1)比例分配:
根据表中所给的数据,利用公式h
h N n n
N
=直接可计算出各层样本量:
123456720,23,19,17,8,6,7n n n n n n n =======
(2)最优分配:
当各层的单位调查费用相等时,最优分配样本量计算公式为:
1
h h
h L
h
h
h N S n n N S
==?
∑
同样将表中的相关数据代入公式即可求出此时各层的样本量为:
123456710,18,17,19,12,9,15n n n n n n n =======
15. 解:(1) 24.15012
5711
.1211214755.2027=++?+?+?=x
样本方差:5.337424
1235.47584.3672.822222
2
=?+?+?==
∑∑i
i i n
n σσ
抽样平均误差56.11%)51(24
5.3374)1(2
=-=-
=
N n n
u x σ 概率保证程度为%,可查表获得t=2,12.2356.112=?==?x x tu
在%的概率保证程度下,可得该县农作物平均每村产量的置信区间为( +)。
(2) 样本成数%67.4112
577
12=++++=p
样本方差
21.024121251275545177572)1()1(=??+??+??=-=-∑∑i
i i i n n p p p p
抽样平均误差%12.9%)51(24
21
.0)1()1(=-=--=
N n n p p u p 概率保证程度为%,可查表获得t=2,%24.18%12.92=?==?x x tu
在%的概率保证程度下可得该县低产量村比例的置信区间为(%%,%+%)
16. 解:已知N =510,n =12,M =8,f =n/N= 故:
18.14186)38.21838.258()38.218-188(1128)-(1-)元(38.2181238.2585.180********
21∑
∑
=??????-++-===+++====ΛΛn
i i b n
i i y y n M s y n y 013
.123.144)()(3.14418.141868120235.0-1-1)(2====??==y v y s s nM f y v b
于是 的置信度为95%的置信区间为
17. 解:由题意得到400=N ,4=n ,10=M ,01.0400
4===
N n f 故875.14
1020
1620191
?1
=?+++=
=
=∑
=n
i i y Mn
y Y (份)
75.18875.110=?=?=y M y (份)
7500875.140010?=??=??=y N M Y
(份) ∑
=--=
n
i i b
y y n M s 1
22)(1
∑=---=
-=n
i i
b y y
n nM f s nM f y v 1
222)(1
111)(
14)75.1820()75.1819(10401.01222
--++-??-=Λ
00391875.0=
6270000391875.010400)()?(2222=??==y v M N Y
v 于是由以上的计算结果得到平均每户的订报份数为,估计量方差为。该辖区
总的订阅份数为7500,估计量方差为62700。
18、解:已知87=N ,15=n ,87
15
=
=N n f 由已知估计同意改革的比例:
709.0911
646
?1
1
≈=
=∑∑==n i i
n
i i
M
y
p
733.6011
==
∑=n i i
M
n
M
008687.0)?(1111)?(1
22=---=∑=n
i i i
M p
y
n n f M
p
v 此估计量的标准差为
9321.0008687.0)?()?(===p v p
s Y
[]218.38 1.96(12.013)194.83241.93±?元,
元
19、解:已知N=48, n=10, f=4810
=N n , 由题意得7361=∑=n i i y ,3651
=∑=n
i i M ,
则办公费用的总支出的估计为8.353273610
48
?1
=?=
=∑=n
i i y n
N Y
(元) 群总和均值6.73736101
11=?==∑=n i i y n y (元)
1
)()1()?(1
2
2--?-=∑=n y y
n
f N Y v n
i i
=9
)6.7380(...)6.7362()6.7383(10)48101(482222-++-+-?-? = ?
9
1? )?(Y
v = 则Y
?的置信度为95%的置信区间为±?,即[,]. 20、解:已知200=N ,10=n ,6M =,3=m ,05.0200101===
N n f ,5.02==M
m
f 3.03
109
?1
=?=
=∑=nm
y
p
n
i i
005747.0)(1111)?(1
2=?--?
-?=∑=n
i i
m p y
n n f m
p v
0758.0005747.0)?()?(===p v p
s 在置信度95%下,p 的置信区间为
))?(?(2/p v t p
α±=)0.448568,0.151432()0758.096.13.0(=?±
1、 分层抽样的特点是() A 、层内差异小,层间差异大 B 、层间差异小,层内差异大 C 、层间差异小 D 、层内差异大 2、下面的表达式中错误的是() A 、∑=1h f B 、∑=n n h C 、∑=1h W D 、∑=1h N 3、各省电脑体育彩票中奖号码的产生属于() A 、随意抽样 B 、判断抽样 C 、随机抽样 D 、定额抽样 4、抽样调查的根本功能是() A 、获取样本资料 B 、计算样本指标 C 、推断总体数量特征 D 、节约费用 5、最优分配(opt V )、比例分配(prop V )的分层随机抽样与相同样本量的简单随 机抽样(srs V )的精度之间的关系式为() A 、srs prop opt V V V ≤≤ B 、srs opt prop V V V ≤≤ C 、srs opt prop V V V ≥≥ D 、opt prop srs V V V ≤≤ 6、我们想了解学生的视力状况,准备抽取若干学校若干班级的学生进行测试, 则() A 、抽样单位是每一名学生 B 、调查单位一定是每一名学生 C 、调查单位可以是班级 D 、调查单位是学校 7、在分层抽样中,当样本容量n 固定时,能够使得估计量的方差)(st y V 达到最 小的分配方式是() A 、比例分配 B 、等额分配 C 、随机分配 D 、Neyman 分配 8、概率抽样与非概率抽样的根本区别是()
A 、是否能确保总体中的每个单位都有完全相同的概率被抽中 B 、是否能确保总体中的每个单位都有事先已知或可以计算的非零概率被抽中 C 、是否能减少调查性误差 D 、是否能计算和控制抽样误差 9、在抽样的总误差中,属于一致性的误差有() A 、变量误差与估计量偏差 B 、估计量偏差与抽样误差 C 、变量误差与抽样误差 D 、非抽样误差与估计量偏差 10、简单随机抽样、系统抽样、按比例分配的分层抽样三者之间的共同点是() A 、将总体分成几部分,然后按事先确定的规则在各部分抽取 B 、每个个体单元被抽到的可能性都相等 C 、一旦选定了第一个样本单元,则其余所有样本单元即可完全确定 D 、三者没有共同点 11、下面哪种样本量分配方式属于比例分配?() A 、N n N n h h = B 、h L h h h h h h h c S N c S N n n ∑==1 C 、∑==L h h h h h h S N S N n n 1 D 、∑==L h h h h h h S W S W n n 1 12、整群抽样中的群的划分标准为() A 、群的划分尽可能使群间的差异小,群内的差异大 B 、群的划分尽可能使群间的差异大,群内的差异小 C 、群的划分尽可能使群间的差异大,群内的差异大 D 、群的划分尽可能使群间的差异小,群内的差异小 13、群规模大小相等时,总体均值 的简单估计量为() A.∑∑===n i M j ij y nM Y 111?
抽样技术期末试卷
一、选择题(每题2分,共20分) 1.抽样调查的根本功能是( ) A. 获取样本资料 B. 计算样本资料 C . 推断总体数量特征 D. 节约费用 2.概率抽样与非概率抽样的根本区别是( ) A.是否能保证总体中每个单位都有完全相同的概率被抽中 B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C.是否能减少调查误差 D.是否能计算和控制抽样误差 3. 与简单随机抽样进行比较,样本设计效果系数Deff >1表明( ) A.所考虑的抽样设计比简单随机抽样效率低 B.所考虑的抽样设计比简单随机抽样效率高 C.所考虑的抽样设计与简单随机抽样效率相同 D.以上皆对 4.优良估计量的标准是() A.无偏性、充分性和一致性 B.无偏性、一致性和有效性 C. 无误差性、一致性和有效性 D. 无误差
性、无偏性和有效性 4.某乡欲估计今年的小麦总产量进行调查,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到63.118=y 吨,这些村去年的产量平均为21.104=x 吨。试采用比率估计方法估计今年该地区小麦总产量( ) A.12820.63 B.14593.96 C.12817.83 D.14591.49 6.抽样标准误差的大小与下列哪个因素无关( ) A .样本容量 B .抽样方式、方法 C .概率保证程度 D .估计量 7.当β为某一特定常数时,比率估计量可看成是比率估计量的特例,此时该常数值为( ) A.1 B.0 C.x y D.x 8.抽样标准误差与抽样极限误差之间的关系是( ) A.θ θ )?(SE = ? B. )?(θ tSE =? C. θ θ )?(tSE = ? D. t SE )?(θ = ? 9.应用比率估计量能使估计精度有较大改进的前提条件是调查变量与辅助变量之间大致成
第二章 2.1判断题: (1)错;(2)错;(3)对;(4)错;(5)错;(6)错;(7)错;(8)错;(9)对;(10)对;(11)错;(12)错;(13)错。 2.3选择题: (1)b ;(2)b ;(3)d ;(4)c ;(5)c 。 2.7 (13 3.67 4.33 5 5.67 6.33 7 1/10 1/10 2/10 2/10 2/10 1/10 1/10 (2)期望为5,方差为4/3 (3)抽样标准误 = = 1.155 (4)抽样极限误差 = 1.96*1.155 = 2.263 (5)置信区间 = (5.67-2.263, 5.67+2.263) =(3.407, 7.933)。 若区间两端只考虑抽样分布的可能性取值,则可得该抽样分布作为离散分布的置信区间为[3, 7] 第三章 3.1 判断题是否为等概率抽样: (1)是;(2)否;(3)是;(4)否。 3.2 (1)5.51 == ∑i Y N Y 25.6)(1 22=-=∑Y Y N i σ 33.8)(1 1 22=--= ∑Y Y N S i (2)样本:(2, 5) (2, 6) (2, 9) (5, 6) (5, 9) (6, 9) ()()5.55.775.55.545.36 1 =+++++= ∑y E () ∑=+++++=33.8)5.485.05.2485.4(61 2s E 3.3
(1) 1682=∑i y 1182662 =∑i y 03276.030 1750 /3011=-=-n f 760.5630/1682==y 127.8261302^067.503011826611)(11212212 =-?-=?? ? ??--=--=∑∑==y n y n y y n s n i i n i i ()07.27271.82603276.012 =?=-= s n f y v ()203.5)(==y v y se 198.10203.596.1)(=?=?=?y se t 95%置信度下置信区间为(56.067-10.198, 56.067+10.198)=(45.869, 66.265). 因此,对该校学生某月的人均购书支出额的估计为56.07(元),由于置信度95%对应的96.1=t ,所以,可以以95%的把握说该学生该月的人均购书支出额大约在45.87~66.27元之间。 (2) 易知N =1750, n =30,=8,t =1.96 267.03081=== n n p 03389.01 301750 /30111=--=--n f 1957.0)267.01(267.0)1(=-?=-=p p pq 08144.0957.003389.01)1()(=?=--= n pq f p v 0167.030 21 21=?=n P 的95%的置信区间为: ())4433.0,0907.0(0167.008114.096.1267.0211)1(=+?±=???? ??+--±n n pq f t p 则1N 的估计值为46725.467?1 ≈==Np N ,其95%的置信区间为: )776,159()4433.0,0907.0(1750=? (3)64.1054267 .01.0) 267.01(96.122220=?-?= =p q t n γ
一、选择题(每题2分,共20分) 1.抽样调查的根本功能是( ) A. 获取样本资料 B. 计算样本资料 C . 推断总体数量特征 D. 节约费用 2.概率抽样与非概率抽样的根本区别是( ) A.是否能保证总体中每个单位都有完全相同的概率被抽中 B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C.是否能减少调查误差 D.是否能计算和控制抽样误差 3. 与简单随机抽样进行比较,样本设计效果系数Deff >1表明( ) A.所考虑的抽样设计比简单随机抽样效率低 B.所考虑的抽样设计比简单随机抽样效率高 C.所考虑的抽样设计与简单随机抽样效率相同 D.以上皆对 4.优良估计量的标准是( ) A.无偏性、充分性和一致性 B.无偏性、一致性和有效性 C. 无误差性、一致性和有效性 D. 无误差性、无偏性和有效性 5.某乡欲估计今年的小麦总产量进行调查,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到63.118=y 吨,这些村去年的产量平均为21.104=x 吨。试采用比率估计方法估计今年该地区小麦总产量( ) A.12820.63 B.14593.96 C.12817.83 D.14591.49 6.抽样标准误差的大小与下列哪个因素无关( ) A .样本容量 B .抽样方式、方法 C .概率保证程度 D .估计量 7.当β为某一特定常数时,比率估计量可看成是比率估计量的特例,此时该常数值为( ) A.1 B.0 C. x y D.x 8.抽样标准误差与抽样极限误差之间的关系是( ) A.θ θ )?(SE = ? B.)?(θtSE =? C.θθ)?(tSE =? D.t SE )?(θ=?
抽样调查 一、选择题 1.抽样调查的根本功能是( C ) A. 获取样本资料 B. 计算样本资料 C . 推断总体数量特征 D. 节约费用 2.概率抽样与非概率抽样的根本区别是( B ) A.是否能保证总体中每个单位都有完全相同的概率被抽中 B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C.是否能减少调查误差 D.是否能计算和控制抽样误差 3. 与简单随机抽样进行比较,样本设计效果系数Deff >1表明( A ) A.所考虑的抽样设计比简单随机抽样效率低 B.所考虑的抽样设计比简单随机抽样效率高 C.所考虑的抽样设计与简单随机抽样效率相同 D.以上皆对 4.优良估计量的标准是( B ) A.无偏性、充分性和一致性 B.无偏性、一致性和有效性 C. 无误差性、一致性和有效性 D. 无误差性、无偏性和有效性 5.某乡欲估计今年的小麦总产量进行调查,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到63.118=y 吨,这些村去年的产量平均为21.104=x 吨。试采用比率估计方法估计今年该地区小麦总产量( B ) 抽样标准误差的大小与下列哪个因素无关( C ) A .样本容量 B .抽样方式、方法 C .概率保证程度 D .估计量 7.抽样标准误差与抽样极限误差之间的关系是( B ) A.θ θ )?(SE = ? B.)?(θtSE =? C.θθ)?(tSE =? D.t SE )?(θ=? 8.应用比率估计量能使估计精度有较大改进的前提条件是调查变量与辅助变量 之间大致成( A )关系 A.正比例 B.反比例 C.负相关 D.以上皆是 9.能使)2(1)(2 22YX X Y lr S S S n f y V ββ-+-=达到极小值的β值为( B ) A.YX X Y S S S ? B.2X YX S S C.2Y YX S S D.X YX S S 2 10.( B ) 是总体里最小的、不可再分的单元。 A.抽样单元 B.基本单元 C.初级单元 D.次级单元 11. 下面哪种抽样方法是最简单的概率抽样方法( A )。 A.简单随机抽样 B.分层随机抽样 C.系统抽样 D.整群抽样 12. 下面关于各种抽样方法的设计效应,表述错误的是( B )。 A.简单随机抽样的deff=1 B.分层随机抽样的deff ﹥1 C.整群随机抽样的deff ﹥1 D.机械随机抽样的deff ≈1 13. 假设考虑了有效回答率之外所有其他因素后的初始样本量为400,而预计有
抽样技术各类简答题参考答案 习题一 1.请列举一些你所了解的以及被接受的抽样调查。 略 2. 抽样调查基础理论及其意义; 答:大数定律,中心极限定理,误差分布理论,概率理论。 大数定律是统计抽样调查的数理基础,也给统计学中的大量观察法提供了理论和数学方面的依据;中心极限定理说明,用样本平均值产生的概率来代替从总体中直接抽出来的样本计算的抽取样本的概率,为抽样推断奠定了科学的理论基础;认识抽样误差及其分布的目的是希望所设计的抽样方案所取得的绝大部分的估计量能较好的集中在总体指标的附近,通过计算抽样误差的极限是抽样误差处于被控制的状态;概率论作为数学的一个分支而引进统计学中,是统计学发展史上的重要事件。 3.抽样调查的特点。 答:1)随机抽样;2)以部分推断总体;3)存在抽样误差,但可计算,控制;4)速度快、周期短、精度高、费用低;5)抽样技术灵活多样;6)应用广泛。 4.样本可能数目及其意义; 答:样本可能数目是在容量为N的总体中抽取容量为n的样本时,所有可能被抽中的不同样本的个数,用A表示。 意义:正确理解样本可能数目的概念,对于准确理解和把握抽样调查误差的计算,样本统计量的抽样分布、抽样估计的优良标准等一系列理论和方法问题都有十分重要的帮助。 5. 影响抽样误差的因素; 答:抽样误差是用样本统计量推断总体参数时的误差,它属于一种代表性误差,在抽样调查中抽样误差是不可避免的,但可以计算,并且可以被控制在任意小的范围内;影响 抽样误差的因素:1)有样本量大小,抽样误差通常会随着样本量的大小而增减,在某 些情形下,抽样误差与样本量大小的平方根成反比关系;2)所研究现象总体变异程度 的大小,一般而言,总体变异程度越大则抽样误差可能越大;3)抽样的方式方法, 如放回抽样的误差大于不放回抽样,各种不同的抽样组织方式也常会有不同的抽样误 差。 在实际工作中,样本量和抽样方式方法的影响是可以控制的,总体变异程度虽不可以 控制,但却可通过设计一些复杂的抽样技术而将其影响加以控制。 习题二 三简答题 1 概率抽样与非概率抽样的区别 答:概率抽样是指在抽取样本单元时,每个总体单元有一个非零的入样概率,并且样本单元的抽取应遵循一定的随机化程序。 2 普查与抽样调查的区别 答:普查是对总体的所有单元进行调查;抽样调查仅对总体中的部分单元进行调查。 3何谓抽样效率,如何评价设计效果? 答:两个抽样方案的抽样方差之比为抽样效率。当某个估计量的方差比另一估计量的方差小时,则称方差小的估计量效率比较高,因方差的大小与样本容量有直接的关系,因此比
抽样调查 一、选择题 1.抽样调查的根本功能是( C ) A. 获取样本资料 B. 计算样本资料 C . 推断总体数量特征 D. 节约费用 2.概率抽样与非概率抽样的根本区别是( B ) A.是否能保证总体中每个单位都有完全相同的概率被抽中 B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C.是否能减少调查误差 D.是否能计算和控制抽样误差 3. 与简单随机抽样进行比较,样本设计效果系数Deff >1表明( A ) A.所考虑的抽样设计比简单随机抽样效率低 B.所考虑的抽样设计比简单随机抽样效率高 C.所考虑的抽样设计与简单随机抽样效率相同 D.以上皆对 4.优良估计量的标准是( B ) A.无偏性、充分性和一致性 B.无偏性、一致性和有效性 C. 无误差性、一致性和有效性 D. 无误差性、无偏性和有效性 5.某乡欲估计今年的小麦总产量进行调查,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到63.118=y 吨,这些村去年的产量平均为21.104=x 吨。试采用比率估计方法估计今年该地区小麦总产量( B ) A.12820.63 B.14593.96 C.12817.83 D.14591.49 6.抽样标准误差的大小与下列哪个因素无关( C ) A .样本容量 B .抽样方式、方法 C .概率保证程度 D .估计量 7.抽样标准误差与抽样极限误差之间的关系是( B ) A.θθ )?(SE =? B.)?(θtSE =? C.θθ)?(tSE =? D.t SE )?(θ=? 8.应用比率估计量能使估计精度有较大改进的前提条件是调查变量与辅助变量之间大致成( A )关系 A.正比例 B.反比例 C.负相关 D.以上皆是 9.能使)2(1)(222YX X Y lr S S S n f y V ββ-+-=达到极小值的β值为( B ) A.YX X Y S S S ? B.2X YX S S C.2Y YX S S D.X YX S S 2 10.( B ) 是总体里最小的、不可再分的单元。 A.抽样单元 B.基本单元 C.初级单元 D.次级单元 11. 下面哪种抽样方法是最简单的概率抽样方法( A )。 A.简单随机抽样 B.分层随机抽样 C.系统抽样 D.整群抽样 12. 下面关于各种抽样方法的设计效应,表述错误的是( B )。 A.简单随机抽样的deff=1 B.分层随机抽样的deff ﹥1 C.整群随机抽样的deff ﹥1 D.机械随机抽样的deff ≈1
盐城师范学院 抽样调查技术与技能期末论文 题目: 《系统抽样与其他抽样的方法的联系,以及不同抽样方法的效果》 姓名: 崔亚楠 二级学院: 数学科学学院专业: 统计学 班级: 统计学131班学号: 13213205 成绩评定:
引言 1、申明 为处理方便起见,以下只讨论系统抽样,且总是假定N是n的整数倍,即N=nk的情形。在这一情况之下,直线和圆形等距抽样的结果一致,样本量一样,尤其关键的是这可以保证各个单元的入样概率都相等。 2、符号说明 为了方便讨论,将总体的N个单元(实际上是抽样框的N个抽样单元)排列成k行n列,如表1所示。 各符号的含义如下: 总体单元数:N 样本单元数:n Y-+ 第r行第j列的单元变量值:(1) j k r
第r 行对应变量的总体均值 :r Y ?,r Y ?=(1)11j k r n j Y n -+=∑ 第j 列对应的变量的总体均值 :j Y ?,j Y ?=(1)1 1j k r k r Y k -+=∑ 注意表1中主区(上下左右去掉一行或者一列剩余的部分)共有k 行n 列,显然每行都是系统抽样的一个可能样本,所以系统抽样可以看做按简单随机抽样方式(由随机起点的抽法以及牵一发动全身的特性所决定)从k 行中抽取一行,每行被抽中的等概率都等于1/k 这种说法与第2章里关于简单随机抽样为从所有(等概率的)可能样本中随机抽出一个样本的第一种定义是吻合的。 如果表1中的第r 行第j 列的单元变量值改记为rj Y ,则 (1)rj j k r Y Y -+=, r=1,2,…,n; j=1,2,…,n 则表1的内容就将变成表2。 这一变换将导致一系列令人兴奋的结果:如果将每一行的单元视为群,总体由k 个群组成,每个群的大小都是n ,则系统抽样可以看成从k 个群中随机抽取
第四章抽样技术概述 班级:姓名:成绩 一、填空题:(21分) 1、抽样调查是一种()调查,它是从所研究客观现象的总体中,按照()抽取()进行调查,以从这一部分单位调查的结果,来()所研究总体的相应数据。 2、随机原则是指在总体中抽取样本单位时,完全排除()意识,保证总体中()单位都有被抽中的同等可能性原则。 3、抽样调查是以()数据推断的()数据。 4、抽样调查产生的(),可以计算并控制, 5、从全及总体中抽取样本单位有()和()两种方法。 6、一般说,不重复抽样的抽样误差()重复抽样的抽样误差。 7、抽样平均误差就是抽样平均数(或抽样成数)与总体平均数(或总体成数)的()。它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的()。 8、影响抽样误差的主要因素有()、()、()、()。 9、利用样本统计量估计总体参数,通常运用()和()两种方法。 10、点估计是直接用()估计总体参数的推断方法。点
估计不考虑()及()。 11、置信区间反映了参数估计的精确程度,区间愈小,估计就愈();而置信度则反映了总体参数落在置信区间内的( ),置信度愈高,则估计的把握程度就()。 12、影响样本容量大小的因素主要有五种:()、()、()、()、()。 13、区间估计是用样本统计量估计总体参数时,用一个区间范围的值作为总体参数的估计值,并注明总体参数落在这们一个区间的可能性,或称()。我们称这一区间为()。 14、对于简单随机重复抽样,若其他条件不变,则当误差范围缩小一半,抽样单位数必须()倍。若误差范围扩大一倍,则抽样单位数为原来的()。 二、单项选择题:(14分) 1、随机抽样的基本要求是严格遵守() A.、准确性原则B、随机性原则C、代表性原则D、可靠性原则。 2、抽样调查的主要目的是() A.、广泛运用数学的方法B、计算和控制抽样误差C、修正普查的资料D、用样本统计量推算总体参数。 3、在抽样调查中() A.、既有登记性误差,也有代表性误差B、既没有登记性误差,也没有代表性误差C、只有登记性误差,没有代表性误差D、、
一、选择题(每题2分,共20分) 1.抽样调查的根本功能是( ) A. 获取样本资料 B. 计算样本资料 C . 推断总体数量特征 D. 节约费用 2.概率抽样与非概率抽样的根本区别是( ) A.是否能保证总体中每个单位都有完全相同的概率被抽中 B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C.是否能减少调查误差 D.是否能计算和控制抽样误差 3. 与简单随机抽样进行比较,样本设计效果系数Deff >1表明( ) A.所考虑的抽样设计比简单随机抽样效率低 B.所考虑的抽样设计比简单随机抽样效率高 C.所考虑的抽样设计与简单随机抽样效率相同 D.以上皆对 4.优良估计量的标准是( ) A.无偏性、充分性和一致性 B.无偏性、一致性和有效性 C. 无误差性、一致性和有效性 D. 无误差性、无偏性和有效性 4.某乡欲估计今年的小麦总产量进行调查,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到63.118=y 吨,这些村去年的产量平均为21.104=x 吨。试采用比率估计方法估计今年该地区小麦总产量( ) A.12820.63 B.14593.96 C.12817.83 D.14591.49 6.抽样标准误差的大小与下列哪个因素无关( ) A .样本容量 B .抽样方式、方法 C .概率保证程度 D .估计量 7.当β为某一特定常数时,比率估计量可看成是比率估计量的特例,此时该常数值为( ) A.1 B.0 C. x y D.x 8.抽样标准误差与抽样极限误差之间的关系是( ) A.θ θ )?(SE = ? B.)?(θtSE =? C.θθ)?(tSE =? D.t SE )?(θ=? 9.应用比率估计量能使估计精度有较大改进的前提条件是调查变量与辅助变量之间大致成( )关系
第2章 2.1 解:()1 这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号 为1~64的这些单元中每一个单元被抽到的概率都是 1100 。 ()2这种抽样方法不是等概率的。利用这种方法,在每次抽取样本单元时,尚未被抽中 的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是2 100 ,而尚未被抽中的编号为36~63的每个单元的入样概率都是 1100 。 ()3这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号为20 000~ 21 000中的每个单元的入样概率都是 1 1000 ,所以这种抽样是等概率的。 2.3 解:首先估计该市居民日用电量的95%的置信区间。根据中心极限定理可知,在大 _ y E y y -= 近似服从标准正态分布, _ Y 的195%α-=的置信区 间为y z y z y y α α??-+=-+? ?。
而()2 1f V y S n -= 中总体的方差2S 是未知的,用样本方差2s 来代替,置信区间 为,y y ?? -+???? 。 由题意知道,_ 2 9.5,206y s ==,而且样本量为300,50000n N ==,代入可以求得 _ 21130050000 ()2060.6825300 f v y s n --= =?=。将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192????。 下一步计算样本量。绝对误差限d 和相对误差限r 的关系为_ d rY =。 根据置信区间的求解方法可知 _ ___ 11P y Y r Y P αα? ???-≤≥-?≤≥-???? 根据正态分布的分位数可以知道1P Z αα??? ≤≥-???? ,所以()2_2rY V y z α?? ?= ??? 。也就是2 _2 _2 22 /221111r Y r Y S n N z S n N z αα?? ?????? ????? ???-=?=+ ? ????? ?? ???? 。 把_ 2 9.5,206,10%,50000y s r N ====代入上式可得,861.75862n =≈。所以样本量至少为862。 2.4 解:总体中参加培训班的比例为P ,那么这次简单随机抽样得到的P 的估计值p 的方差()()111f N V p P P n N -= --, 在大样本的条件下近 似服从标准正态分布。在本题中,样本量足够大,从而可得P 的195%α- =的置信区间为 2p z p z αα?-+?。 而这里的()V p 是未知的,我们使用它的估计值
一、选择题 1、 分层抽样的特点是() A 、层内差异小,层间差异大 B 、层间差异小,层内差异大 C 、层间差异小 D 、层内差异大 2、下面的表达式中错误的是() A 、∑=1h f B 、∑=n n h C 、∑=1h W D 、∑=1h N 3、各省电脑体育彩票中奖号码的产生属于() A 、随意抽样 B 、判断抽样 C 、随机抽样 D 、定额抽样 4、抽样调查的根本功能是() A 、获取样本资料 B 、计算样本指标 C 、推断总体数量特征 D 、节约费用 5、最优分配(opt V )、比例分配(prop V )的分层随机抽样与相同样本量的简单随 机抽样(srs V )的精度之间的关系式为() A 、srs prop opt V V V ≤≤ B 、srs opt prop V V V ≤≤ C 、srs opt prop V V V ≥≥ D 、opt prop srs V V V ≤≤ 6、我们想了解学生的视力状况,准备抽取若干学校若干班级的学生进行测试, 则() A 、抽样单位是每一名学生 B 、调查单位一定是每一名学生 C 、调查单位可以是班级 D 、调查单位是学校 7、在分层抽样中,当样本容量n 固定时,能够使得估计量的方差)(st y V 达到最 小的分配方式是() A 、比例分配 B 、等额分配 C 、随机分配 D 、Neyman 分配 8、概率抽样与非概率抽样的根本区别是() A 、是否能确保总体中的每个单位都有完全相同的概率被抽中 B 、是否能确保总体中的每个单位都有事先已知或可以计算的非零概率被抽中 C 、是否能减少调查性误差 D 、是否能计算和控制抽样误差 9、在抽样的总误差中,属于一致性的误差有() A 、变量误差与估计量偏差 B 、估计量偏差与抽样误差 C 、变量误差与抽样误差 D 、非抽样误差与估计量偏差 10、简单随机抽样、系统抽样、按比例分配的分层抽样三者之间的共同点是() A 、将总体分成几部分,然后按事先确定的规则在各部分抽取 B 、每个个体单元被抽到的可能性都相等 C 、一旦选定了第一个样本单元,则其余所有样本单元即可完全确定 D 、三者没有共同点
社会调查研究与方法测试题(一) 一、填空题(每空2分,共34分) 1、社会调查研究方法的理论基础是____________和____________。 2、社会调查研究的基本特征:第一;第二,系统性;第三;第四,实证性;第五。 3、社会调查研究的对象:首先是社会的基本要素,主要是、人口和;另外还有形形色色、种类繁多的具体对象,主要是个人、、社会组织、阶级和阶层、民族、社区、社会行为、等。 4、社会调查研究的基本理论及其理论基础有和。 5、变量间的相互关系是指两个或两个以上变量之间相联系的性质,主要有和_____。 6、概念的具体化和操作化的过程大致分为四个阶段:概念的形成、、选择测量指标、。 7、根据抽取对象的具体方式,抽样可以归纳为与两大类。 二、名词解释(每小题4分,共16分) 1、社会调查研究 2、因果关系 3、测量的信度与效度 4、概率抽样
二、简答题(每小题6分,共24分) 1、社会调查研究有哪些类型? 2、什么是概念间的相关关系? 3、抽样的特点是什么? 三、论述题(共26分) 1、怎样选择社会调查研究的课题?(10分) 2、如何制定社会调查研究的总体方案?(10分)
3、怎样检验测量的信度?(6分)
社会调查研究与方法测试题(二) 一、填空题(每空2分,共32分) 1、问卷调查方法的特点是____________和____________。 2、问卷调查的关键工作是____________。 3、一般访谈是指访谈时要有一套完整的____________,访谈人只需____________和____________即可,无须探讨式的相互商洽。 4、深度访谈是希望通过访谈发现一些____________,此类访谈主要适用于____________研究。 5、社会观察是指有目的地用____________或____________搜集人们各种行为数据资料的方法。 6、文献法的显著特点有:、、。 7、实验法一般包括三个组成部分:自变量与;与对照组(也叫控制组);前测与。 二、名词解释(每小题4分,共20分) 1、文献法 2、问卷法 3、深度访谈法 4、结构式观察法
《抽样技术》期末复习 1、设计效应(Deff ) 答:设计效应(deff )是由基什提出的,用来对不同抽样方法进行比较,其定义为:srs V(y)deff V (y) =,其中srs V (y)为不放回简单随机抽样简单估计量的方差;V(y)为某个抽样设计在同样样本量条件下估计量的方差。设计效应的定义就是将某个抽样设计的估计量的方差与同样样本量条件下的不放回简单随机抽样简单估计量的方差进行比较。如果deff < 1,则所考虑的抽样设计比简单随机抽样的效率高;反之,如果deff > 1,则所考虑的抽样设计比比简单随机抽样的效率低。 deff 对复杂抽样时确定样本量有很大作用,在一定精度条件下,简单随机抽样所需的样本量n '比较容易得到,如果可以估计复杂抽样的deff ,那么复杂抽样所需的样本量为: n = n deff '?。 2、概率抽样 答:概率抽样也称随机抽样。概率抽样就是使总体中的每一个单位都有一个已知的、不为零的概率进入样本的抽样方法。 具体说来,概率抽样具有以下几个特点:(1)按一定的概率以随机原则抽取样本。(2)每个单元被抽中的概率是已知的,或是可以计算出来的。(3)当用样本对总体目标量进行估计时,要考虑到该样本(或每个样本单元)被抽中的概率。也就是说,估计量不仅与样本单元的观测值有关,也与其入样概率有关。 概率抽样最主要的优点是,可以依据调查结果计算抽样误差,从而得到对总体目标量进行推断的可靠程度。从另一方面讲,也可以按照要求的精确度,计算必要的样本单元数目。 因此,概率抽样可以排除调查者的主观影响,抽选出较其他方法更具代表性的样本。 3、非抽样误差 答:非抽样误差是指除了抽样误差以外的,由于各种原因引起的误差。同抽样误差相
1 抽样技术各类简答题参考答案 习题一 1.请列举一些你所了解的以及被接受的抽样调查。 略 2. 抽样调查基础理论及其意义; 答:大数定律,中心极限定理,误差分布理论,概率理论。 大数定律是统计抽样调查的数理基础,也给统计学中的大量观察法提供了理论和数学方面的依据;中心极限定理说明,用样本平均值产生的概率来代替从总体中直接抽出来的样本计算的抽取样本的概率,为抽样推断奠定了科学的理论基础;认识抽样误差及其分布的目的是希望所设计的抽样方案所取得的绝大部分的估计量能较好的集中在总体指标的附近,通过计算抽样误差的极限是抽样误差处于被控制的状态;概率论作为数学的一个分支而引进统计学中,是统计学发展史上的重要事件。 3.抽样调查的特点。 答:1)随机抽样;2)以部分推断总体;3)存在抽样误差,但可计算,控制;4)速度快、周期短、精度高、费用低;5)抽样技术灵活多样;6)应用广泛。 4.样本可能数目及其意义; 答:样本可能数目是在容量为N的总体中抽取容量为n的样本时,所有可能被抽中的不同样本的个数,用A表示。 意义:正确理解样本可能数目的概念,对于准确理解和把握抽样调查误差的计算,样本统计量的抽样分布、抽样估计的优良标准等一系列理论和方法问题都有十分重要的帮助。 5. 影响抽样误差的因素; 答:抽样误差是用样本统计量推断总体参数时的误差,它属于一种代表性误差,在抽样调查中抽样误差是不可避免的,但可以计算,并且可以被控制在任意小的范围内;影响抽样误差的因素:1)有样本量大小,抽样误差通常会随着样本量的大小而增减,在某些情形下,抽样误差与样本量大小的平方根成反比关系;2)所研究现象总体变异程度的大小,一般而言,总体变异程度越大则抽样误差可能越大;3)抽样的方式方法,如放回抽样的误差大于不放回抽样,各种不同的抽样组织方式也常会有不同的抽样误差。 在实际工作中,样本量和抽样方式方法的影响是可以控制的,总体变异程度虽不可以控制,但却可通过设计一些复杂的抽样技术而将其影响加以控制。 习题二 三简答题 1 概率抽样与非概率抽样的区别 答:概率抽样是指在抽取样本单元时,每个总体单元有一个非零的入样概率,并且样本单元的抽取应遵循一定的随机化程序。 2 普查与抽样调查的区别 答:普查是对总体的所有单元进行调查;抽样调查仅对总体中的部分单元进行调查。
一、选择题(每题2分,共20分) 1?抽样调查的根本功能是( ) A. 获取样本资料 B.计算样本资料 C .推断总体数量特征 D. 节约费用 2?概率抽样与非概率抽样的根本区别是 ( ) A. 是否能保证总体中每个单位都有完全相同的概率被抽中 B. 是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C. 是否能减少调查误差 D. 是否能计算和控制抽样误差 3. 与简单随机抽样进行比 较,样本设计效果系数 Deff >1表明( ) A. 所考虑的抽样设计比简单随机抽样效率低 B. 所考虑的抽样设计比简单随机抽样效率高 C. 所考虑的抽样设计与简单随机抽样效率相同 D. 以上皆对 4?优良估计量的标准是( ) A.无偏性、充分性和一致性 B.无偏性、一致性和有效性 C.无误差性、一致性和有效性 D.无误差性、无偏性和有效性 4?某乡欲估计今年的小麦总产量进行调查, 已知去年的总产量为 12820吨,全县共123个村, 抽取13个村调查今年的产量,得到y =118.63吨,这些村去年的产量平均为 乂 =104.21吨。 试采用比率估计方法估计今年该地区小麦总产量( ) A.12820.63 B.14593.96 C.12817.83 D.14591.49 6 ?抽样标准误差的大小与下列哪个因素无关( ) A .样本容量 B .抽样方式、方法 C .概率保证程度 7?当1为某一特定常数时,比率估计量可看成是比率估计量的特例 A.1 B.0 C.) D. X X 8. 抽样标准误差与抽样极限误差之间的关系是 ( ) 代一也 B ?一tSEE C-轄 D .估计量 ,此时该常数值为(
《抽样调查》试卷D 一、判断改错 1.在抽样调查的实践中,为降低抽样误差,可以考虑缩小总体方差或扩大样本量。() 2.欲对一批成品的合格率进行抽样调查,已知在前两次的全面调查中,其 合格率分别为p 1=90%、p 2 =80%,则本次调查应根据p 1 确定样本量。() 3.在总体容量充分大时,放回抽样和不放回抽样的估计误差相差无几。() 4.整群抽样可以被理解为是第一阶段抽样比为100%时的一种特殊的两阶段抽样。() 5.分层抽样可以被理解为是第一阶段抽样比为100%时的一种特殊的两阶段抽样。() 6.比估计与回归估计优于简单估计的条件是调查变量与辅助变量间的相关系数大于1/2。() 7.二重分层抽样在效果上优于普通分层抽样。()8.当总体方差未知时,可用样本方差代替以确定必要样本量。()9.抽样分布就是指样本的分布。()10.利用随机数表既可以实施等概率抽样,也可以实施不等概率抽样。() 二、简述题 1.试述抽样调查的误差及其种类; 2.试述怎样分层才能有效提高精度; 3.找一个完整的抽样框通常是不容易的。在下述调查中可以试用什么样的
抽样框? (1)调查一个大城市中卖皮箱的商店; (2)调查失落在公共汽车上的东西的种类; (3)调查去年被蛇咬过的人数; (4)调查估计每周家庭成员用于看电视的总时数。 三、应用题 请将下述按由小到大顺序排列的20个单位标志值调整为按顺逆交替方式排列,并以k=2为起点等距抽选出4个单位组成样本,然后与在原排序方式下按上述要求所抽选的等距样本进行比较,看其在抽样误差方面有什么变化。 21 21 28 29 30 32 32 32 34 35 35 36 37 38 40 45 46 46 48 50
一、 简单随机抽样 1、在简单随机抽样中,试证明比估计R y 是总体均值Y 的渐近无偏估计,并求其方差。 证明:X R Y = X x y X R Y y R = ==∧ ∧ () ?? ??? ???? ????????? ???? ????? ? ? ?-+???? ? ?-+???? ??--=?????? ?????? ?? ???? ? ?-+=???? ??=2 2 11X X x o X X x X X x X y E X X X x X y E X X x y E y E R 由于0?→?-P X x 即0→-X X x 所以()() Y y E X y E X y E R ==??? ? ??= 得证。 由于0?→? -P X x 即0→-X X x 所以() ()() 2 22 2 1Z R S n f x R y Var x R y E X x R y E X y Var -=-=-=??? ? ??-= 其中:RX Y Z -=故() ()()( )[]() 2 222 1 2111X XY Y N i i i R S R RS S n f X R Y RX Y N n f y Var +--=-----=∑= 2、对于简单随机抽样,总体均值Y 的回归估计量定义为:()lr y y X x β=+-,如β为常数(记为 β),证明 证明: 3、在简单随机抽样中,已知变量总体均值Y 的回归估计量定义为)(x X y y lr -+=β,若β为常数(记为0β),且有Y y E lr =)(, 求证:(1))2(1)(02 202xy x y lr S S S n f y V ββ-+-= (2)使)(lr y V 最小的0β为x y x xy S S S S ρ β== 20;其中y x xy S S S = ρ. 证明:(1)[]∑=--+--=N i i i lr Y X X Y N n f y V 1 2 0)(111)(β (2)求)(lr y V 对0β的偏导数: 将0β的值代入)(lr y V ,验证其最小值存在,此时
1、已知某数字传输系统传送二进制码元的速率为1200B/s ,码元等概率出现,该系统的信息速率为 1200bit/s ;若该系统改成传送16进制信号码元,码元等概率出现,码元速率为2400B/s ,则这时的系统信息速率为 9600bit/s 。 2、已调波00()5cos cos 5sin sin m m s t t t t t ωωωω=?±?是 SSB 调幅方式。其调制信号f(t)为5cos m w t ,载波C(t)=0cos w t 。解调时,相干载波为0cos w t 时,可解调恢复原信号。 3、同步技术包括 载波同步 、 码元同步 、 群同步 、 网同步 。 4、4个独立信源的最高频率分别为1 kHz 、1 kHz 、2 kHz 、2 kHz ,采用时分复用方式进行传输,每路信号均采用8位二进制数PCM 编码。该系统中满足抽样定理的最小抽样频率为4KHz ,一帧中包含 4 路抽样信号集,每个时隙占有的时间宽度为 62.5微秒 ,每个码元宽度为 7.8125微秒 ,码元传输速率为 128Kb/s 。 5、PSK 系统的基带调制信号码型为 双极性非归零 码型,波形为 方波 ,PSK 信号相当于模拟调制的 DSB 或 相位 调制方式,传输带宽为 2Rb 。 二、选择题(每题3分,共计30分。) 1.真正客观地反映数字通信系统有效性的指标是(C ) A.数据传信速率R B.符号速率N C.频带利用率η D.以上三项均可 2.满足抽样定理时低通型信号的抽样频率应选为(D ) A.f s ≥f m B.f s =2f m C.f s <2f m D.f s ≥2f m 3.均匀量化是(D ) A.大小信号的量化间隔相同 B.量化区内均分N 等分 C.所有的量化误差相同 D.大小信号的量化间隔相同和量化区内均分N 等分 4.编码码位数l 越大,则(A ) A.量化误差越小,信道利用率越低 B.量化误差越大,信道利用率越低 C.量化误差越小,信道利用率越高 D.量化误差越大,信道利用率越高 5.A 律13折线编码器输出的码型是(A )
需要掌握的公式 1. 均方误差 = 方差 +偏倚的平方 MSE (θ?)= V (θ?)+ B 2(θ?) 2. 如果u α是标准正态分布的双侧分位数(Z α/2) ?()d u S αθ= 3.简单随机抽样的简单估计量 总体均值的简单估计 ∑===n i i y n y Y 11? 总体总量的简单估计 ∑=?=?=i y n N y N Y N Y ?? 总体成数的简单估计 n a p P ==? 总体某种特征单元总数的简单估计 Np A =? 4. 总体均值的置信度为1-α的近似置信区间为 ,y u s y u s αα??-+????? 5.成数的正态近似置信区间 p u p u α α?-+?? (没有进行连续性修正) 6. 成数的样本方差 pq n n s 12-= 7. 给定精度要求为估计量y 的绝对误差限d 是确定样本量 N n n n d S u 002 01n += ?? ? ??=α 8.对分层随机抽样: h h st st h h st st y N y N Y y W y Y ∑==∑==??
9. 比例分配 n W n h h ?= 9. 不考虑费用的最优分配,也叫奈曼分配 n S W S W n h h h h h ?∑= 10. 线性费用函数下最优分配: n C S W C S W n h h h h h h h ?∑=// 11. 整群抽样总体(样本)均值:+群间方差公式 M y n y y Y i ===? 12. 整群抽样设计效应 22() 1(1)()b C srs S V y deff M V y S ρ==≈+- 13.比估计量 x y R =? X x y X R Y R ?==?? X x y X R Y R ?==?? 14. 回归估计——差估计β0=1 d d d d y N Y x X y y Y =-+==?? 15.回归估计——样本回归系数b 2?) ()(?x yx lr lr lr lr s s b y N Y X x b y x X b y y Y ==--=-+==