抽样技术不等概抽样
- 格式:doc
- 大小:244.50 KB
- 文档页数:6
第6节不等概抽样一、实验目的学习利用EXCEL 进行不等概抽样。 二、实验要求掌握利用EXCEL 进行不等概抽样的方法。 三、实验原理设Z 1,Z 2,…Zn 是一组概率分布(分布列),按这组概率对总体中的N 个单元进行有放回抽样,每次抽中第i 个单元的概率Z i ,独立进行n 次,则这种抽样叫多项抽样。
特别地,设总体中第i 个单元的规模度量为M i ,可取这时称为PPS 抽样。
其中某单元可能被不止一次抽中,此时只调查一次,但计算时出现几次按几次计算。
PPS 抽样的实施主要有两种方法:代码法(累积总和法)和拉希里(Lahiri )法。
(一) 代码法在PPS 抽样中,赋予每个单元与规模M i 相等的代码,将代码累加得到M 0,每次抽样都产生一个[1,M 0]之间的随机数,设为m,则代码m 所对应的单元被抽中。
如果Mi 不是整数,则乘以某个倍数。
010,Nii ii M Z M M M ===∑例1 设某个总体有N=10个单元,相应单元的大小M i 及代码,我们要在其中产生一个 n=3的样本。
先在[1,738]中产生第一个随机数(如是354),再在[1,738]中产生第二个随机数(如是553),最后[1,738]中产生第三个随机数(如是493),则它们对应的第5,6,7号单元被抽中。
易验证每个单元被抽中的概率与其规模成正比。
(二) 拉希里法第一步:先在1-N 中随机等概率抽取一个数字,不妨设为i,则i 成为侯选的被抽中单元,其是否抽中还依赖于第二步;第二步:令 ,在 之间等概率随机取m ,如果m 小于刚才抽中第i 个单元的规模 M i ,即 m ≤M i ,则第i 个单元被抽中,{}*1max i i NM M ≤≤=*1~M否则重复第一步和第二步,直到两步都符合才算抽中,这样依次下去,直到抽满n 个单元为止。
例2(续上例) ,N=10,在[1,10]和[1,150]中分别产生。
(i,m)演示如下:四、 实验内容设某总体共有N=8个单元,相应Mi 及代码如下表所示:(1) 请分别用代码法和拉希里法从中抽取3个样本;(2) 利用你抽取的样本,估计相应的总体均值和总体总量,给出估计的标准差,并与简单随机抽样进行精度比较。
抽样技术:7不等概率抽样1. 引言在进行数据分析和统计研究时,抽样是一种常用的技术。
抽样技术允许我们从总体中选择一个样本,以便推断总体的性质。
在抽样技术中,不等概率抽样是一种常见的方法,它允许我们以非均匀的概率抽取样本。
本文将介绍关于7种不等概率抽样方法的详细信息。
2. 简单随机抽样简单随机抽样是最基本的抽样方法之一,它要求每个个体被选中的概率相等且任意组合都是可能的。
然而,在某些情况下,简单随机抽样可能并不适用,例如当总体分布不均匀时,或者我们希望在样本中增加一定的多样性。
这时,我们可以考虑使用不等概率抽样方法。
3. 整群抽样整群抽样是一种不等概率抽样方法,它将总体划分为若干个互不重叠的群组(或称为簇),然后从每个群组中抽取样本。
整群抽样可以有效地减少抽样过程中的复杂性,并提高样本的效率。
整群抽样常用于调查社会群体或大型组织等场景。
4. 分层抽样分层抽样是一种根据总体特点进行划分的抽样方法,它将总体划分为若干个层级或相似的子群(层),然后从每个层中抽取样本。
通过分层抽样,我们可以保证样本在各层中的分布情况与总体相似,从而更为准确地推断总体的特征。
5. 系统抽样系统抽样是一种按照固定间隔选择样本的抽样方法。
它类似于简单随机抽样,但是通过定义一个间隔,我们可以按照一定的规律抽取样本。
例如,我们可以在总体中选取每隔一定数量的个体作为样本。
系统抽样在样本大小较大时表现出较高的效率。
6. 按比例分层抽样按比例分层抽样是一种常用的不等概率抽样方法,它根据总体各层的比例确定各层的样本容量。
比例分层抽样可以使得样本在各层中的分布与总体的比例相对应。
这种抽样方法适用于总体中的各个层存在不同比例的情况。
7. 两阶段抽样两阶段抽样是一种复杂的不等概率抽样方法,它将抽样过程分为两个阶段。
在第一阶段,我们从总体中选择一部分群组(或称为簇),在第二阶段,我们从每个群组中抽取一定数量的样本。
两阶段抽样适用于总体较大或分布复杂的情况下,可以提高抽样的效率。
三阶段不等概率抽样设计
三阶段不等概率抽样设计是一种常用的抽样方法,用于从整体群体中选择代表性样本。
它将样本选择过程分为三个阶段,每个阶段的概率不等,具体步骤如下:
1. 第一阶段:按照一定的抽样概率,从总体中选择第一阶段的样本单元。
这可能涉及到某些抽样单元的非选择或重复选择,以达到样本的多样性。
2. 第二阶段:在第一阶段选择的样本单元中,按照一定的概率再次进行抽样,选择第二阶段的样本单元。
这个阶段的抽样概率可能与第一阶段有所不同,以达到更好的样本覆盖和精度。
3. 第三阶段:在第二阶段选择的样本单元中,按照一定的概率再次进行抽样,选择最终的样本个体。
同样,这个阶段的抽样概率可能与前两个阶段有所不同。
通过三阶段不等概率抽样设计,可以灵活地选择样本单元,并通过控制抽样概率来保证样本的代表性和可靠性。
这种设计方法在实际应用中可以更好地适应不同的调查需求和场景,提高样本选择的效果。
第6章 不等概率抽样1 不等概率抽样原理等概率抽样通常容易设计和解释,但并不总是如不等概率抽样一样的可行、实用、有效。
因为等概率抽样(psu’s)可能导致方差很大(尤其是对于无偏估计量)、管理困难以及成本难以控制。
而不等概率抽样的特点是以不等概率抽取psu’s 、m i 的数目相同,因此不等概率抽样使得每一个样本被抽取的概率相等、调查成本可控、每一个初级样本单元(psu )的样本数相等、方差急剧减小。
当采用不等概率抽样时,我们可以自由的调整选择不同初级样本单元(psu’s )作为样本的概率,并在估计中补充合适的权重。
核心是选择一个给定单元的概率已知: πi =P(psu i), ψi = P(psu i on first sample), ωi =1/πi1.1 抽取一个初级样本单元假定我们只要抽取N 个初级样本单元(psu )中的一个作为样本(n=1)。
初级样本单元i 的总值用t i 表示,我们需要估计总体总值t.用抽取一个初级样本单元的简单例子来说明不等概率抽样的思想。
先来考虑一个所有总体已知的情形。
一个城镇拥有四个超市,从100平方米到1000平方米按面积大小排列。
通过抽取一个超市,来估计四个超市上个月的总营业收入。
你可能预期大超市比小超市的营业收入多而且大超市的收入波动性也明显大于小超市。
因为仅抽取一个超市,所以在第一个回合中一个超市被抽取的概率 ψi 等于这个超市包含在样本中的概率πi 。
即,πi = ψi =P(超市i 被选取),此概率与超市的面积成比例。
超市A 占四个超市总面积的1/16,则它被抽取的概率为1/16。
为了说明性目的,假定我们已知总体的所有总值t i :我们可以以以上给定的概率选择一个容量为1的概率样本,通过洗散16张卡片并从中选择1张。
如果卡片数字为1,则选择超市A;如果卡片数字为2或3,则选择超市B;…… 在估计量中,我们通过使用 ψi 补充选取的不等概率权重。
如果超市面积与超市营业收入近似成比例,那么超市A 的营业收入在总收入的1/16,则可用超市A 的营业收入的16倍来估计四个超市的总收入。
抽样技术:不等概率抽样引言在统计学和数据分析中,抽样技术是一项重要的工具,用以从总体中选择一部分元素进行研究。
而抽样技术的核心就是如何从总体中选取样本,以保证样本能够准确地反映总体的特征。
其中一种常用的抽样技术是不等概率抽样。
不等概率抽样是指在抽取样本时,各个个体被选中的概率不相等。
与等概率抽样相比,不等概率抽样更能满足实际问题的需求,更能提高样本的效率和精确性。
本文将介绍不等概率抽样的原理、常用方法以及应用案例,希望能够帮助读者更好地理解和应用抽样技术。
不等概率抽样的原理不等概率抽样的原理基于概率论和统计学的基本原理。
在进行不等概率抽样时,需要根据总体的特征和研究目的,选择合适的抽样方法和样本选择概率,以使样本能够准确地反映总体。
不等概率抽样的核心在于赋予每个个体被选中的概率,也称为抽样概率。
抽样概率可以根据总体特征和研究目的进行选择,常见的选择方法包括:概率比例抽样、系统抽样、整群抽样等。
概率比例抽样是一种根据个体在总体中所占比例来确定抽样概率的方法。
具体而言,可以先计算出样本所需的个体数目,再根据各个个体在总体中的比例,分配相应的抽样概率。
这样可以保证样本能够按比例反映总体的特征。
系统抽样是一种按照一定规律选择样本的方法。
具体而言,可以在总体中确定一个起始点,然后以固定的间隔选择样本个体。
系统抽样具有简单方便、无需随机表和随机数的优点,常用于总体具有周期性分布的情况。
整群抽样是一种将总体划分为若干群体,然后随机选择部分群体进行抽样的方法。
这种方法适用于总体分布不均匀,但各群体内部相对均匀的情况。
通过整群抽样,可以减小样本误差,提高样本的代表性。
不等概率抽样的常用方法不等概率抽样有多种不同的方法和技术,根据实际问题的需求和样本特征的不同,可以选择合适的抽样方法。
以下将介绍几种常用的不等概率抽样方法。
简单随机抽样是不等概率抽样中最基本的方法之一。
简单随机抽样是指每个个体都有相等的被选中概率,且个体间的选择是相互独立的。
不等概抽样一、单选题1.( B )是最简单的不等概率抽样。
A. 整群抽样B. 多项抽样C. 多阶段抽样D. 系统抽样 2. 下面有关包含概率和性质的表达式中,错误的是( C )A. 1Ni i n π==∑ B. (1)Nij i j in ππ≠=-∑C. (1)N ij i j j in πππ≠=-∑ D. 111(1)2N Nij i j n n π=>=-∑∑二、多选题1. 多项抽样的实施方法包括( BD )A. 布鲁尔(Brewer )方法B. 拉希里(Lahili )法C. 重抽法D. 代码法E. 插补法 2. 对于不放回的不等概率抽样,其样本的抽取方法包括( ABCD ) A. 逐个抽取法 B. 重抽法 C. 系统抽取法 D. 全样本抽取法 E. 插补法 三、名词解释1. 不等概率抽样2. 多项抽样3. P P S 抽样4. P S π抽样 四、简答题请分别说明代码法和拉希里法的实施过程 五、计算题1. 对一个N=10的总体进行调整,事先规定了每个单元被抽中的概率i Z ,如下表所示。
P P S 2. 别为1187,426,1253,试估计总体总量并计算估计量的方差和标准差。
3. 某部门要了解所属8500家生产企业当月完成的利润,该部门手头有一份上年各企业完成产量的报告,将其汇总得到所属企业上年完成的产量为3676万吨。
考虑到时间紧,准备采用抽样调查来推算当月完成的利润。
根据经验,企业的产量和利润相关性比较强,且企业的特点是规模和管理水平差异较大,通常大企业的管理水平较高,因此采用与上年产量成比例的P P S 抽样,从所属企业中抽出一个样本量为30的样本,调查结果如下表所示:注:*号表示该样本被抽中两次;i m 为该企业上年完成的产量(单位:万吨);i y 为企业当月完成的利润(单位:百万)请根据表中的调查结果估计该部门所属企业当月完成的利润,并给出95%置信度下估计的相对误差。
常见的非概率抽样方法非概率抽样,又称为不等概率抽样或非随机抽样,就是调查者根据自己的方便或主观判断抽取样本的方法。
它不是严格按随机抽样原则来抽取样本,所以失去了大数定律的存在基础,也就无法确定抽样误差,无法正确地说明样本的统计值在多大程度上适合于总体。
虽然根据样本调查的结果也可在一定程度上说明总体的性质、特征,但不能从数量上推断总体。
非概率抽样依抽样特点可分为方便抽样、定额抽样、立意抽样、滚雪球抽样和空间抽样。
①方便抽样样本限于总体中易于抽到的一部分。
最常见的方便抽样是偶遇抽样,即研究者将在某一时间和环境中所遇到的每一总体单位均作为样本成员。
“街头拦人法”就是一种偶遇抽样。
某些调查对被调查者来说是不愉快的、麻烦的,这时为方便起见就采用以自愿被调查者为调查样本的方法。
方便抽样是非随机抽样中最简单的方法,省时省钱,但样本代表性因受偶然因素的影响太大而得不到保证。
②定额抽样定额抽样也称配额抽样,是将总体依某种标准分层(群);然后按照各层样本数与该层总体数成比例的原则主观抽取样本。
定额抽样与分层概率抽样很接近,最大的不同是分层概率抽样的各层样本是随机抽取的,而定额抽样的各层样本是非随机的。
总体也可按照多种标准的组合分层(群),例如,在研究自杀问题时,考虑到婚姻与性别都可能对自杀有影响,可将研究对象分为未婚男性、已婚男性、未婚女性和已婚女性四个组,然后从各群非随机地抽样。
定额抽样是通常使用的非概率抽样方法,样本除所选标识外无法保证代表性。
③立意抽样立意抽样又称判断抽样,研究人员从总体中选择那些被判断为最能代表总体的单位作样本的抽样方法。
当研究者对自己的研究领域十分熟悉,对研究总体比较了解时采用这种抽样方法,可获代表性较高的样本。
这种抽样方法多应用于总体小而内部差异大的情况,以及在总体边界无法确定或因研究者的时间与人力、物力有限时采用。
④滚雪球抽样以若干个具有所需特征的人为最初的调查对象,然后依靠他们提供认识的合格的调查对象,再由这些人提供第三批调查对象,……依次类推,样本如同滚雪球般由小变大。
非概率抽样方式(三)非概率抽样方式非概率抽样,又称为不等概率抽样或非随机抽样,是调研者根据自己的方便或主观判断抽取样本的方法。
主要有偶遇抽样、主观抽样、滚雪球抽样、、定额抽样等类型。
1.偶遇抽样,也称就近抽样、方便抽样或自然抽样。
它是指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为调查对象,或者仅仅选择那些离得最近的、最容易找到的人作为调查对象。
其优点是方便省力,其缺点是样本的代表性差,,有很大的偶然性。
2.主观抽样,也称目标式抽样、判断式抽样或立意抽样。
它是调查者根据自己的主观分析,来选择和确定调查对象的方法;。
主观抽样取得的样本.其代表性取决于研究者对总体的了解程度和判断能力。
主观抽样的优点是,可以充分发挥研究人员的主观能动性,其缺点是,样本的代表性难以判断,不能推论。
3.滚雪球抽样。
当我们无法了解总体情况时,可以从总体中的少数成员入手。
对他们进行调查向他们询问还知道哪些符合条件的人,再去找那些人并询问他们知道的人,如同滚雪球一样。
我们可以找到越来越多具有相同性质的群体成员。
4.定额抽样。
定额抽样从对总体性质的了解开始,在某一总体中考虑具有某种属性的人数所占的比例,然后从具有这种属性的人群中收集数据,并按各类人在总体中的比例赋予它的适当的比重。
这样收集数据,从理论上讲应当能够代表总体。
这种方法存在的问题是:定额的比例必须精确,但由于最新的关于总体性质变化的信息并不容易得到,往往造成抽样中的偏差。
(四)抽样中的误差问题进行抽样调查可产生两类误差,一类是抽样误差,另一类是非抽样误差。
1.抽样误差:由抽样的随机性产生,属于随机误差抽样误差是指主要指样本平均数与总体平均数之差、样本比率与总体比率之差。
抽样误差中通常运用最多的抽样平均误差,即指样本平均数或样本比率的标准差。
在重复抽样条件下,(1)样本平均数的抽样平均误差公式为其中, 为总体标准差,n为样本个案数。
(2)样本比率的抽样平均误差公式为:其中,P为总体比率,n为样本个案数实际计算时,则以样本标准差代替总体标准差,以样本比率代替总体比率。
不等概抽样
一、单选题
1.( B )是最简单的不等概率抽样。
A. 整群抽样
B. 多项抽样
C. 多阶段抽样
D. 系统抽样 2. 下面有关包含概率和性质的表达式中,错误的是( C )
A. 1
N
i i n π==∑ B. (1)N
ij i j i
n ππ≠=-∑
C. (1)N ij i j j i
n πππ≠=-∑ D. 1
1
1(1)2
N N
ij i j n n π=>=
-∑
∑
二、多选题
1. 多项抽样的实施方法包括( BD )
A. 布鲁尔(Brewer )方法
B. 拉希里(Lahili )法
C. 重抽法
D. 代码法
E. 插补法 2. 对于不放回的不等概率抽样,其样本的抽取方法包括( ABCD ) A. 逐个抽取法 B. 重抽法 C. 系统抽取法 D. 全样本抽取法 E. 插补法 三、名词解释
1. 不等概率抽样
2. 多项抽样
3. P P S 抽样
4. P S π抽样 四、简答题
请分别说明代码法和拉希里法的实施过程 五、计算题
1. 对一个N=10的总体进行调整,事先规定了每个单元被抽中的概率i Z ,如下表所示。
P P S 2. 别为1187,426,1253,试估计总体总量并计算估计量的方差和标准差。
3. 某部门要了解所属8500家生产企业当月完成的利润,该部门手头有一份上年各企业完成产量的报告,将其汇总得到所属企业上年完成的产量为3676万吨。
考虑到时间紧,准备采用抽样调查来推算当月完成的利润。
根据经验,企业的产量和利润相关性比较强,且企业的特点是规模和管理水平差异较大,通常大企业的管理水平较高,因此采用与上年产量成比例的P P S 抽样,从所属企业中抽出一个样本量为30的样本,调查结果如下表所示:
注:*号表示该样本被抽中两次;i m 为该企业上年完成的产量(单位:万吨);i y 为企业当月完成的利润(单位:百万)
请根据表中的调查结果估计该部门所属企业当月完成的利润,并给出95%置信度下估计的相对误差。
如果要求在相同条件下相对误差达到20%,所需的样本量应该是多少? 4. 假设有5个小区,每个小区的住户数X 已知,但常住居民人数未知,现从5个小区中按照不放回的不等概率抽样抽出2个小区进行调查,进而估计5个小区的常住居民总数。
数据如下表:
注:表中的包含概率i π按照0i i nX X π=,0i
X X
=
∑算得
(1)请根据表中数据计算出所有可能样本的霍维茨—汤普森(Horvitz-Thompson )估计量以及简单随机抽样的简单估计量。
(2)倘若抽样是按照布鲁尔(Brewer )方法进行的严格P S π抽样,请比较霍维茨—汤普森(Horvitz-Thompson )估计量与简单随机抽样的简单估计量的精度。
5. 假设总体的大小N=5,单元指标值分别为10,20,30,40和50,采取n=2的不放回P S π抽样。
试列出所有可能的样本,计算每个单元和每对单元被抽入样本的包含概率i π和ij π,并验证2,i ij i j i
πππ≠==∑∑。
6. 某个大型企业欲估计整个企业人员一年的人均病假天数,该企业有8个子公司,为了方便起见拟抽取3个公司进行调查然后推断整个企业,但每个子公司的人数不同,而且差别很大,所以采用按人数成比例的P P S 抽样。
各子公司的人数
(2)若抽中的是第3,6,8这三个子公司,其病假的总数分别为4320人日,4160人日和5790人日,估计全企业的人均病假天数,并计算抽样标准误。
7. 某地区欲调查水稻播种面积,以村作为抽样单元,采取按普查人数进行放回的P P S 抽样,共抽中10个村,其数据如下:
(1)估计该地区的水稻种植面积和相对标准差;
(2)若要求相对标准差控制在2%以内,求必要的样本量。
8. 有一个估计某城镇现有第三产业单位数的例子。
假设有去年年底的普查数和现有的实际单位数,分街道统计如下:
(1)等概率抽选,简单(无偏)估计;
(2)等概率抽选,以去年普查数为辅助变量的比估计;
(3)按与去年普查数成比例的概率抽样,汉森—赫维茨估计。
比较这三种估计的方差,并加以讨论
9. 对与N=4的假设总体{1,2,3,4}按给顶的概率{0.1,0.2,0.4,0.4}进行有放回抽样,n=2(1)试列出所有可能样本以及每个出现的概率;(2)对每个样本计算对总体和Y
的估计∑
==n
i i
i z y n
Y
1
1ˆ,验证HH Y ˆ是Y 的无偏估计;(3)根据可能样本计算)ˆ(HH
Y V ,验证其结果是否按公式计算的结果一致?
10. 研究人员欲估计一批电子元件板上的缺陷数,由于缺陷数与板上的电子元件数目有关,故采用与元件数目成比例的放回的PPS 抽样。
设N=10,每块板上电子元件的数目按顺序分别为10,12,22,8,16,24,9,10,8,31,设n=4。
现要求
(1)说明样本的抽选方法;
(2)若抽中的单元按前面排列的序号是第2,3,5,7这四个元件板,其缺陷数分别为1,
3,2,1,试根据这一抽样结果,估计这批元件上共有多少个缺陷数。
(3)给出上述估计量的方差估计。
11. 某个大型企业欲估计整个企业人员一年的人均病假天数,该企业有8个子公司,为了方便起见拟抽取3个公司进行调查然后推断整个企业,但每个子公司的人数不同,且差别
很大,故采用按人数成比例的PPS 抽样。
各个公司的人数如下:
(1)请列举一种抽选方法,说明抽选的步骤。
(2)若抽中的是第3,
6,8这三个子公司,其病假的总数分别为4320人日,4160人日和5790人日,估计全企业的人均病假天数,并计算抽样标准误。
12. 某地区欲调查水稻播种面积,以村作为抽样单元,采取按普查人数进行放回PPS 抽样,共抽中10个村,其数据如下:
(1)估计该地区的水稻种植面积和相对标准差;
(2)若要求相对标准差控制在2%以内,求必要的样本量。
13. 假设总体大小N=7,单元指标值分别为10,20,30,40,50,60和70,采取n=2的不放回πPS 抽样。
试列出所有可能的样本,计算每个单元和每对单元被抽入样本的包含
改良i π和ij π并验证21
=∑=N
i i π,i N
i
j ij ππ=∑≠。
14. 有一个总体N=3,=i Z 1/2,1/3和1/6,i Y =7,5和2。
采取不放回抽样方式,从总体中抽出两个单元,第一个单元按与i Z 成比例的概率抽出,第二个单元按余下单元的大小成比例的概率抽出。
要求:
(1)验证:60
511=π , 60
442=
π ,60
253=
π,
603512=
π , 60
16
13=
π,60
923=
π
(2)当采用这一抽样方法时,请比较估计量M Y ˆ与πPS 的估计量HT
Y ˆ的方差。
(3)请证明当采取放回抽样方式,按等概率抽样时)ˆ(M Y V 对)ˆ(HH
Y V 的比率接近1/2这一数值。
15. 有一个估计某城镇现有第三产业单位数的例子。
假设有去年年底的普查数和现有的实际单位数,分街道统计如下:
假设n=1,采用以下几种估计量 等概率抽选,简单(无偏)估计;
等概率抽选,以去年普查数为辅助变量的比估计;
(1)按与去年普查数成比例的概率抽样,汉森—赫维茨估计。
(2)比较这三种估计的方差或均方误差,(计算比估计的均方误差时应计算真值而不用近似公式)并加以讨论。
16. 试证:对于n=2时的布鲁尔方法,只要每个i Z <1/2,则必有 0<ij π<j i ππ, j i ≠。
17. 设总体各个单元的大小分别为i M ,i=1,…,N 。
考虑如下的抽样方法:设d 为1M ,…,
N
M
的一个公约数,以i M /d 个代码代表单元i ,然后用不放回的简单随机抽样法从总共
∑==N
i i
d M
d M
1
ˆ
个代码中抽出n 个,则相应的单元入样。
试证:在这个抽样方法下,有
(1)估计量∑
==n
i i i z y n
Y
1
1ˆ (0
ˆM
M z i
i =
)是总体总和Y 的无偏估计;
(2)Y
ˆ的方差是 2
1
00)(
1)ˆ(Y Z Y Z n
d M nd M Y
V N
i i
i i -∙--=∑
=
(3))ˆ(Y
V 的一个无偏估计是 21
)ˆ(
)
1(1
)ˆ(Y
z y Z n n M
nd
M Y
v N
i i
i i --∙
-=∑= 六、设计题
如果设想从全国各省(市、区)中随机抽取若干省(市、区)进行调查以估计全国某年生产总值,你认为因该采用等概率抽样还是不等概率抽样?如果采用不等概率抽样,那么各省(市、区)的入样概率以什么指标计算比较好,请以小组为单位进行讨论。