当前位置:文档之家› 《抽样技术》第四版习题答案

《抽样技术》第四版习题答案

《抽样技术》第四版习题答案
《抽样技术》第四版习题答案

第2章

解:这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号为1~64的这些单元中每一个单元被抽到的概率都是。

这种抽样方法不是等概率的。利用这种方法,在每次抽取样本单元时,尚未被抽中的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是,而尚未被抽中的编号为36~63的每个单元的入样概率都是。

这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号为20 000~21 000中的每个单元的入样概率都是,所以这种抽样是等概率的。

解:

解:首先估计该市居民日用电量的95%的置信区间。根据中心极限定理可知,在大样本的条件下,近似服从标准正态分布,的的置信区间为。

而中总体的方差是未知的,用样本方差来代替,置信区间为。

由题意知道,,而且样本量为,代入可以求得

。将它们代入上面的式子可得该市居民日用电量的95%置信区间为。

下一步计算样本量。绝对误差限和相对误差限的关系为。

根据置信区间的求解方法可知

根据正态分布的分位数可以知道,所以。也就是。

把代入上式可得,。所以样本量至少为862。

解:总体中参加培训班的比例为,那么这次简单随机抽样得到的的估计值的方差,利用中心极限定理可得在大样本的条件下近似服从标准正态分布。在本题中,样本量足够大,从而可得的的置信区间为。

而这里的是未知的,我们使用它的估计值。所以总体比例的的置信区间可以写为,将代入可得置信区间为。

解:利用得到的样本,计算得到样本均值为,从而估计小区的平均文化支出为144.5元。总体均值的的置信区间为,用来估计样本均值的方差。

计算得到,则,,代入数值后计算可得总体均值的95%的置信区间为。

解:根据样本信息估计可得每个乡的平均产量为1 120吨,该地区今年的粮食总产量的估计值为(吨)。

总体总值估计值的方差为,总体总值的的置信区间为,把

代入,可得粮食总产量的的置信区间为。

解:首先计算简单随机抽样条件下所需要的样本量,把带入公式,最后可得。

如果考虑到有效回答率的问题,在有效回答率为70%时,样本量应该最终确定为。

解:去年的化肥总产量和今年的总产量之间存在较强的相关性,而且这种相关关系较为稳定,所以引入去年的化肥产量作为辅助变量。于是我们采用比率估计量的形式来估计今年的化肥总产量。去年化肥总产量为。利用去年的化肥总产量,今年的化肥总产量的估计值为吨。

解:本题中,简单估计量的方差的估计值为=37.17。

利用比率估计量进行估计时,我们引入了家庭的总支出作为辅助变量,记为。文化支出属于总支出的一部分,这个主要变量与辅助变量之间存在较强的相关关系,而且它们之间的关系是比较稳定的,且全部家庭的总支出是已知的量。

文化支出的比率估计量为,通过计算得到,而,则,文化支出的比率估计量的值为(元)。

现在考虑比率估计量的方差,在样本量较大的条件下,,通过计算可以得到两个变量的样本方差为,之间的相关系数的估计值为,代入上面的公式,可以得到比率估计量的方差的估计值为。这个数值比简单估计量的方差估计值要小很多。全部家庭的平均文化支出的的置信区间为,把具体的数值代入可得置信区间为。

接下来比较比估计和简单估计的效率,,这是比估计的设计效应值,从这里可以看出比估计量比简单估计量的效率更高。

解:利用简单估计量可得,样本方差为,,样本均值的方差估计值为。

利用回归估计的方法,在这里选取肉牛的原重量为辅助变量。选择原重量为辅助变量是合理的,因为肉牛的原重量在很大程度上影响着肉牛的现在的重量,二者之间存在较强的相关性,相关系数的估计值为,而且这种相关关系是稳定的,这里肉牛的原重量的数值已经得到,所以选择肉牛的原重量为辅助变量。

回归估计量的精度最高的回归系数的估计值为。现在可以得到肉牛现重量的回归估计量为,代入数值可以得到。

回归估计量的方差为,方差的估计值为,代入相应的数值,,显然有。在本题中,因为存在肉牛原重量这个较好的辅助变量,所以回归估计量的精度要好于简单估计量。

第3章

3.1 解:在分层随机抽样中,层标志的选择很重要。划分层的指标应该与抽样调查中最关心的调查变量存在较强的相关性,而且把总体划分为几个层之后,层应该满足:层内之间的差异尽可能小,层间差异尽可能大。这样才能使得最后获得的样本有很好的代表性。对

几种分层方法的判断如下:

(1)选择性别作为分层变量,是不合适的。首先,性别这个变量与研究最关心的变量(不同职务,职称的人对分配制度改革的态度)没有很大的相关性;其次,用性别作为分层变量后,层内之间的差异仍然很大,相反,层之间的差异不是很大,因为男性和女性各自内部的职务,职称也存在很大的差别;最后,选择性别作为分层变量后,需要首先得到男性和女性的抽样框,这样会更加麻烦,也会使抽样会变得更加复杂。

(2)按照教师、行政管理人员和职工进行分层,是合适的。这种分层的指标与抽样调查研究中最关心的变量高度相关,而且按照这种方法分层后,可以看出层内对于分配制度改革的态度差异比较小,因为他们属于相同的阶层,而层之间的态度的差异是比较大的。这样选取出来的样本具有很好的代表性。

(3)按照职称(正高、副高、中级、初级和其他)分层,也是合理的。理由与(2)相同,这样进行分层的变量选择与调查最关心的变量是高度相关的,分层后的层满足分层的要求。所以,按照职称进行分层是合理的。

(4)按照部门进行分层,是合理的。因为学校有很多院、系或者所,直接进行简单随机抽样,有可能样本不能很好地代表各个院系,最关心的变量与部门也存在一定的相关性。这样分层后,每个层的总体数目和抽取的样本量都较小,最终的样本的分布比较均匀,比简单随机抽样更加方便实施。

3.2 解:设计的方案如下:

第一种方案:可以按照不同的专业进行分层,但是考虑到如果在每层都抽取,不能保证每个新生的入样概率相等,因为每个专业的人数比例未知,8个人的样本量无法在每个层之间进行分配。所以采取如下方法:对所有的新生按照专业的先后顺序进行编号,使得每个专业的人的编号在一起,然后随机选取出一个号码,然后选取出这个号码所在的专业,选取出这个专业,再在这个专业的所有新生中按照简单随机抽样的方法选取出8个人。这样就可以保证每个人入选的概率是相等的。

第二种方案:也可以按照性别进行分类,对他们进行编号,为1~800,使得男生的编号都在一起,女生的编号也都在一起,然后随机选取出一个号码,然后看这个号码所对应的性别,然后从这个性别的所有人中按照简单随机抽样的方法选取出8个新生。这样就可以保证所有的新生的入样概率是相同的。

第三种方案:随机地把所有的人分成8组,而且使得每组的人都是100个人,这样分组完成后,每个组的新生进行编号为1~100,然后随机抽取出一个号码,再从所有的小组中抽取出号码所对应的新生,从而抽取出8个人。

3.3 解:(1) 首先计算出每层的简单估计量,分别为,其中,,则每个层的层权分别为;

则利用分层随机抽样得到该小区居民购买彩票的平均支出的估计量,代入数值可以得到。

购买彩票的平均支出的的估计值的方差为,此方差的估计值为,根据数据计算可以得到每层的样本方差分别为:

其中,代入数值可以求得方差的估计值为,则估计的标准差为。

(2)由区间估计可知相对误差限满足

所以,。

样本均值的方差为,从而可以得到在置信度为,相对误差限为条件下的样本量为。

①对于比例分配而言,有成立,那么,把相应的估计值和数值代入后可以计算得到样本量为,相应的在各层的样本量分别为。

②按照内曼分配时,样本量在各层的分配满足,这时样本量的计算公式变为,把相应的数值代入后可得,在各层中的分配情况如下:。

3.4 解:(1) 首先计算得到每层中在家吃年夜饭的样本比例为,那么根据每一层的层权,计算得到该市居民在家吃年夜饭的样本比例为。

每一层中在家吃年夜饭的样本比例的方差为,则该市居民在家吃年夜饭的比例的方差,在的条件下,

,而其中每层的吃年夜饭的样本比例的方差的估计值为,则样本比例的方差的估计值为,把相应的数值代入计算可得方差的估计值为,从而可以得到该估计值的标准差为。

(2)利用上题的结果,,这里的方差是,在的条件下,近似有。

①比例分配的条件下,有成立,那么,把相应的估计值和数值代入可以求得最终的样本量应该是,样本量在各层的分配是,,

②内曼分配条件下,,则,代入相应的估计值和数值可以计算得到样本量为,在各层中样本量的分配为。

3.5 解:总体总共分为10个层,每个层中的样本均值已经知道,层权也得到,从而可以计算得到该开发区居民购买冷冻食品的平均支出的估计值为。

下一步计算平均支出的95%的置信区间,首先计算购买冷冻食品的平均支出的估计值的方差,其中,但是每层的方差是未知,则样本平均支出的方差的估计值为,每个层的样本标准差已知,题目中已经注明各层的抽样比可以忽略,计算可以得到。则这个开发区的居民购买冷冻食品的平均支出置信区间为

代入数值后,可得最终的置信区间为。

3.6 解:首先计算简单随机抽样的方差,根据各层的层权和各层的总体比例可以得到总体的比例为,则样本量为100的简单随机样本的样本比例的方差为

,不考虑有限总体校正系数,,其中,

在的条件下,通过简单随机抽样得到的样本比例的方差为

通过分层抽样得到的样本比例的方差为,但是因为不考虑有

限总体校正系数,而且抽样方式是比例抽样,所以有成立,样本比例的方差近似为。对于每一层,分别有,在的条件下,近似的有成立,有

样本量应该满足,同时这里要求分层随机抽样得到的估计的方差和简单抽

样的方差是相同的,,层权分别为,代入数值,可以计算得到最终的样本量为。

3.7解:事后分层得到的总体均值的估计量和估计量的方差分别为

,估计量的方差的估计值

对于几种说法的判断如下:

(1)事后分层比简单随机抽样产生更加精确的结果,这个说法是错误的。从事后分层得到估计量的方差的估计值来看,它的方差不一定比简单随机抽样的要小,而且从事后分层得到的样本是利用简单随机抽样的方法得到的,只是在计算估计量和估计量的方差时是按照分层随机抽样来处理,而且事后分层要求层权是已知的,但是当层权未知从而利用样本来估计层权时,就会产生偏差,事后分层不见得比简单随机抽样产生更精确的结果。

(2)事后分层比按比例分配产生更精确的结果,这个说法是错误的。从事后分层得到

的估计量的方差的估计值可以看出,它的第一项就是按照比例分层抽样得到的估计量方差的估计值,公式中的第二项表示的是按事后分层时各层样本量与按照比例分层时各层样本量发生偏差所引起的方差的增量。

(3)事后分层的最优分配产生更精确的结果,这种说法是错误的。事后分层在样本量足够大的条件下是与比例分层相当的,但是在一般条件下,事后分层的精度仍然低于比例分层的,那么事后分层的精度也会高于最优分配的精度。

(4)在抽样时不能得到分层变量,这个说法是正确的。事后分层在抽样时,是利用简单随机抽样的方法,在抽样时不涉及按照变量进行分层,至于按变量进行分层,是在抽样完成后,然后根据具体的变量来对样本进行分层。

(5)它的估计量的方差与真正按照比例分层随机抽样的方差差不多,只有在样本量足够大的条件下才成立。在样本量足够大的条件下,从事后分层的方差的计算公式可以看出,它的第二项会趋于0,这时事后分层的估计量的方差和分层随机抽样的方差差不多。

3.8 解:(1)根据简单随机抽样的公式,登记原始凭证的差错率的估计值为,在考虑到的条件下,登记的原始凭证的差错率的估计量的方差近似为

则估计量的方差的估计值为,计算得,则原始凭证的差错率的估计的标准差为。

(2)这里,每个层的层权是事先知道的,那么利用事后分层来计算登记原始凭证的差错率的估计值为,在这里。

利用事后分层得到的原始凭证的差错率的估计量的方差的估计值为

,在不考虑有限校正系数的条件下,又可以写为

,其中

,可以得到,则相应的标准差为

3.9 解:(1)所有可能的样本的数量为,所有的样本如下:

(2)我们用9个样本中的一个来计算,假定抽中的样本为。

首先按照分别比估计来估计,首先可以得到分层后的辅助变量的总体均值分别为

。在这个样本中,经计算得到,,而且,则根据分别比估计可得的估计值为

利用联合比估计时,首先计算得到辅助变量的总体均值,然后利用样本得到的主要变量和辅助变量的样本均值为,则利用联合比估计得到的的估计值为。

在计算分别比估计和联合比估计的偏差,这里的方法是利用所有可能的样本,然后计算出比估计和联合估计的估计值,按照与上面相同的计算方法,计算得到其他样本时比估计和联合估计值(按照上面的样本的排列顺序)为:

分别计算可得,而且可以计算得到,。总体的实际均值为。则分别比估计和联合比估计的偏差分别为

,所以联合比估计的偏差比分别比估计的偏差要小。

接下来计算分别比估计和联合比估计的均方误差。在这里样本量很小,不可以利用教材中的近似公式。

(3)从分别比估计和联合比估计的偏差和均方误差可以看出,联合比估计的偏差和均方误差都要小于分别比估计,也就是说在本题中,联合比估计要比分别估计好。在本题中,各层的比率和总体的比率相差基本差不多,从整个样本出发进行的联合比估计比基于每层的分别比估计更好一些,偏差更小,均方误差也更小。

第4章

4.1解:由题意知,平均每户家庭的订报份数为:

(份)

总的订报份数为:

(份)

=0.358 333

所以估计方差为:

=0.008 869

=141 900

(1)=60.733 33

所以该系统同意这一改革人数的比例为:

=70.91%

其估计的方差为:

=0.001 37

所以其估计的标准误为:

=3.7%

(2) =8%

=0.006 4

得n=6.2,所以应抽取7个单位作样本。

4.3解:该集团办公费用总支出额为:

=48/10×(83+62+…+67+80)=3 532.8(百元)

=72 765.44

=269.750 7(百元)

所以其置信度为95%的置信区间为:[3 004.089 , 4 061.511] 4.4解:=52.3

所以整个林区树的平均高度为:

=5.9(米)

其估计的方差为:

=0.06

所以其估计的标准误为:

=0.246(米)

其95%的置信区间为:[5.42 ,6.38]

4.5解:拍摄过艺术照的女生比例为:

=9/30=30%

其估计的方差为:

=0.005 891

其估计的标准差为:

=7.68%

4.6 解:

其中,

所以最优的样本学生数为2。

代入得到

所以最优的样本宿舍数为20。

4.7解:(1)简单估计:

居民总的锻炼时间为:

=1 650

居民平均每天用于锻炼的时间为:

=3.3(即33分钟)

=0.163 421

其估计的标准差为:

=0.404 254

(2)比率估计:

居民总的锻炼时间为:

居民平均每天用于锻炼的时间为:

=3.95(即39.5分钟)

=0.071 509

其估计的标准差为:

=0.267 411

(3)简单估计下的相对误差为:

r=0.404 254/3.3=12.25%

比估计下的相对误差为:

r=0.267 411/3.95=6.77%

所以比估计的估计效果好。

第5章

表中,Zi不是整数,乘以1 000 000使其变为整数,这样就可以赋予每个单元与其相等的代码数。

先在[1,1 000 054]中产生第一个随机数为825 011,其对应的单元为20号,则得到第一个入样单元20;

把单元20去掉,剩余的24个单元,累计代码数为1 000 054-36 590=963 464,在[1,963464]中产生第二个随机数为456 731,得到第二个入样单元9;

再把单元9去掉,剩余的23个单元,累计代码数为963 464-40 772=922 692,在[1, 922 692]中产生第三个随机数为857 190,得到第三个入样单元24;

依此类推,直至抽出所需的样本。

最后抽得的10个入样单元为20,9,24,3,4,25,21,16,7,5。

(2)“拉希里法”。

令,,在[1,25]和[1, 0.078 216]中分别产生随机数,,第6号单元入样;

把单元6去掉,剩余的24个单元,仍旧等于0.078 216,在[1,24]和[1,

0.078 216]中分别产生随机数,,第10号单元不入样,重新抽取随机数;

依此类推,直至抽出所需的样本。

最后抽得的10个入样单元为6,9,18,4,1,5,19,21,16,13。

5.2.解:首先计算出各PSU单元的入样概率,。

霍维茨-汤普森估计量的方差为。

5.3解:代码法列出下表:

表中,Zi不是整数,乘以1 000使其变为整数,这样就可以赋予每个单元与其相等的代码数。

在[1,1 000]之间产生三个随机数659,722,498,则它们所对应的第6,7,5号单元被抽中,即得到的n=3的PPS样本包括单元6、单元7和单元5。

5.4解:由题意知n=3, 总体总量的估计为:

总量估计的标准差为:

5.5解:由题意知,,,每个单元的入样概率。

所有可能的样本及每对单元入样概率为:

以实例验证式(5.5)、式(5.6):

设分别为7,20,12,4,6,22,当入样单元为单元1和单元2时,由式(5.5)可得。若由式(5.30)进行计算,有。

二者的计算结果是一致的。当入样单元为其他情况时,计算过程同上,二者结果仍保持一致,从而验证了式(5.5)。

由式(5.6)可得。若直接进行计算,有。

二者计算结果不一致,可见式(5.6)不适用于π抽样的情况。

5.6 解:(1) 简单随机抽样简单估计量为:10,9,5,2,4。

均方误差为:

(2) 简单随机抽样比估计为:

①联合比估计:

联合比估计估计量为:,因此

均方误差为:

②分别比估计:

分别比估计估计量为:12.453 33,8.895 238,5.337 143,1.779 048,3.558 095,因此,均方误差为:

(3)pps抽样。

PPS抽样汉森-赫维茨估计量:5.142 857,6.48,6,7.2,7.2,因此

均方误差为:

通过以上计算可以看出,PPS抽样汉森-赫维茨估计量的均方误差最小;其次是简单估计量的均方误差;两种比估计的均方误差相差不大,但都要大于汉森-赫维茨和简单估计量的均方误差。

5.7解:设5个部门的职工总人数为150。

由题意得:,,,,由于该样本为自加权的,则

由于,,估计的方差为:

估计的标准差为:

则该公司职工上班交通平均所需的时间为34分钟,估计的标准差为6分钟。

5.8解:由题意得:,。首先计算出抽中的10个单位的概率:。

根据汉森-赫维茨估计量的计算公式可得

即全集团的季度总运量为495 299.4吨。

方差估计量的估计为:

其95%的置信区间为:

第6章

6.1 解:(1)系统抽样设计原理:见教材第164页定义6.1。

(2)系统抽样与整群抽样、分层抽样的关系:

系统抽样按行来看,可看作一种特殊的整群抽样;将每一行的单元视为群,则总体由k 个群组成,每个群的大小都是n,即系统抽样可看作从k个群中随机抽取1个群的特殊整群抽样。

系统抽样按列来看,可看作一种特殊的分层抽样;将每一列单元视为一层,则总体由n 个层组成,每个层的大小都是k,则系统抽样可看作从n个层中随机抽取一个单元的特殊分层抽样。

6.2解:见教材第170页定理6.2的证明。

6.3解:将40个人依次编号为1~40号,且将这些编号看成首尾相接的一个环。

已知总体容量N=40,样本量n=7。由于N/n=5.7,取最接近5.7的整数6,则抽样间距k=6。

由于随机起点r=5,则其余样本点依次为11,17,23,29,35,1。

因此,用循环等距抽样方法抽出的样本单元序号为5,11,17,23,29,35,1。

6.4解:对于总体,容量N=360,汉族住户总数A=81,汉族比重P=A/N=0.225。

对于样本,抽样间距k=8,样本量n=N/k=45。

简单随机抽样:

系统抽样:

则。

其中

6.5解:(1)估计汉族所占比例,采用等距抽样效果最好。

理由:系统抽样可看作一种特殊的整群抽样,则希望系统抽样抽取的样本能更好地体现总体性质。由于三个民族的居民居住地紧邻,采取等距抽样能使样本中三个民族的分布与总体分布类似,即差异较小。若采用简单随机抽样,可能出现的情况是,抽取的样本中有过多的汉族居民,而等距抽样会避免该现象的发生。

(2)估计男性所占比例,采用简单随机抽样效果最好。

理由:由题意知,每户人口登记顺序为:丈夫、妻子、孩子、其他人,且平均每户有5口人。若采取等距抽样,由于抽样间距k=5,若随机起点号码为1,则第一户抽取丈夫,

第二胡抽取丈夫的可能性较大,依此类推,抽取的样本中,丈夫所占的比重较大,估计时误差会很大。而简单随机抽样会避免该情况的发生。

(3)估计孩子所占比例,理由同(2)。

6.6解:(1)估计男性所占比例。

已知总体容量N=50,男性总数A=24,男性所占比例P=A/N=0.48。

抽样间距k=5,样本量n=N/k=10。

简单随机抽样:

系统抽样:

则。

其中

(2)估计孩子所占比例。

已知总体容量N=50,孩子总数A=24,孩子所占比例P=A/N=0.48。

简单随机抽样:

系统抽样:

则。

(3)估计职业住户中人员所占比例。

已知总体容量N=50,职业住户总数A=19,职业住户所占比例P=A/N=0.38。

简单随机抽样:

系统抽样:

则。

6.7解:已知总体容量N=15,总体均值。

样本量n=3,抽样间距k=N/n=5。

简单随机抽样:

系统抽样:

其中

“系统样本”随机起点号码r “系统样本”

的单元组成

“系统样本”

样本均值y

r

1 2 3 4 5 1,6,11

2,7,12

3,8,13

4,9,14

5,10,15

6

7

8

9

10

6.8解:书稿平均错字数

抽样方差的估计如下:

(1)合并层方法估计抽样方差为:

(2)连续差方法估计抽样方差为:

(3)交叉子样本方法估计抽样方差为:

第7章

7.1解:根据表中数据,可计算各层的权重:

=0.17, =0.25, =0.28, =0.22, =0.08

全县棉花的种植面积为:

=0.17×90/17+0.25×1 806/25

+0.28×4 423/28+0.22×5 607/22+0.08×4 101/8

=164.27

根据式(7.4), 的抽样方差为:

=14.578 5+25.141 46

=39.719 96

所以全县棉花种植面积的抽样标准误的估计为:

12 604.75

7.2 解:(1) 由题意知

,,,,,

根据公式(7.10)有

根据公式(7.8),有

≈0.000 667

(2)调查总费用为3 000元,每一个抽样单元的调查费用为10元,采用简单随机抽样,样本量可以达到300,估计量的方差为:

则有

由此可知二重抽样效率更高。

7.3 解:由题知=602,由表内数据计算得

=568.583 3 ,=568.25,1.000 587,=256 154.9 ,=278 836.9 ,=256 262

根据式(7.11),该地区当年平均每村牛的年末头数为:

602(头)

所以该地区年末牛的总头数为:

745 713(头)

根据式(7.15), 的方差估计为:

所以该地区年末牛的总头数估计的标准差为:

46 398(头)

7.4 解:(1)根据公式(7.10),有

根据公式(7.8),有

即二重抽样的样本最优分配方案是第一层分配63个样本,第二层分配31个样本。

(2)令c1/c2h=a,则c1/= c2h=a,若二重抽样的精度高于简单随机抽样,则有

7.5解:由题意知: n1=300, n2=200, m=62,该保护区现有羚羊总数为:

(头)

其抽样的标准误为:

(头)

7.6 解:(1)由题意知: n1=7, n2=12, m=4,该地区渔民总数为:

(人)

其抽样的标准误为:

(人)

其95%的置信区间为:

=[12,28]

(2) 由题意知: n1=16, n2=19, m=11,该地区渔民总数为:

(人)

其抽样的标准误为:

(人)

其95%的置信区间为:

=[22,34]

(3)计算这些估计时的前提假设:

①总体是封闭的——两次抽样间没有渔民进入或离开该地区,即对每次抽样而言,N是相同的。

这要求渔民在两次抽样间不能离开该地区,其他渔民也不能进入,但这在实际中是很难做到的。

②每个样本都是来自总体的简单随机抽样,即该地区每个渔民都有同样的机会被找到。在实际中由于渔民所在地和作业时间的不同,不可能每一个渔民在调查时都能被找到,比如某些住在偏僻位置的渔民被找到的机会就会小些。

③两个样本是独立的,即渔民第一次被找到的概率跟第二次能否被找到的概率没有关系。

④不会丢失第一次被找到的渔民资料,即第一次被找到的渔民,在第二次被找到时可识别。

⑤近似服从正态分布。

7.7 解:(1)如果NCRSR和BDMP登记体系是两个独立的系统,也就是两个系统在登记病人时是独立进行的,病人出现在NCRSR中的概率与出现在BDMP中的概率无关,那么作者的认识就是正确的。

第一,满足总体是封闭的假设,NCRSR和BDMP登记系统都是针对全国人口进行登记,而且是在同一段时间范围内进行,因此总体单元数是一样的。

第二,满足标识不丢失的假设,先天性风疹综合征在出生时就会被确定出,不会因为以后是否恢复而被更改。

第三,可能不满足每个样本都是来自总体的简单随机样本。简单随机样本要求每个样本入样概率相同,从全国范围看,这一假设不一定能满足。比如由于抽样框的原因,偏远地区或者欠发达地区的人群被登记的概率会低于中心地区或者发达地区。

—1985年间先天性风疹综合征的总病例数为:

(人)

累计(2)的估计结果得到1970—1985年间先天性风疹综合征的总病例数为998人。

从结果上看,我们认为(3)的计算结果更可信,因为(3)的样本量足够大。

(4)直观上由下图发现先天性风疹综合征的患病人数是在下降。

第8章

8.13 解:(1)原假设:患有妇科疾病与是否遭受配偶性虐待相互独立。在原假设成立条件下,各单元格的期望频数为:

(2)

如果显著性水平,拒绝原假设,即认为妇科疾病与是否遭受配偶性虐待不独立。(3)应用传统的卡方检验方法的前提是样本中各观测值的权数相等。本题中样本由于存在无回答情形,各观测值的权数不一定相等,因此传统的卡方检验方法不合适。

8.14解:设总体相关系数为,其中,为总体标准差。

所以

(2) ,这里。

(3)

第9章

9.1 解:首先计算每套子样本中的居民家庭平均年总收入,结果如下表所示:

用(=1,2,3,4,5)表示每套子样本中的居民家庭平均年总收入,则

=18.76

从而

=0.066 6

的95%置信区间为:

9.2 解:要估计的比率是,其中,X和Y分别是该地区的劳动人口数和失业人数。由于每层的权重一样,故R的估计为:

=359/3 643=0.09 854 516

现采用刀切法估计失业率的方差,将每个层视为一组,从而有

==271/2 681=0.1 010 817

==259/2 691=0.09 624 675

==276/2 777=0.09 938 783

==271/2 780=0.09 748 201

因此有

0.090 936

0.105 44

0.096 017

0.101 735

根据刀切法,估计该区的人口出生率为:

0.098 532

的刀切法方差估计为:

= =

==

9.3解:要估计的比率是,其中,x和y分别是该区的人口数和新生婴儿数。由于每个初级抽样单元的大小相等,且第二阶段抽取的样本量也一样。因而,R的估计为:= =0.009 723 187

现采用刀切法估计人口出生率的方差。将每个街道中的所有居委会视为一组,从而有==0.009 675 282

==0.010 060 1

==0.009 425 196

==0.009 726 849

因此有

0.009 867

0.008 712

0.010 617

0.009 712

根据刀切法,估计该区的人口出生率为:

0.009 727

的刀切法方差估计为:

= =

==

抽样技术与应用期末复习题

1、 分层抽样的特点是() A 、层内差异小,层间差异大 B 、层间差异小,层内差异大 C 、层间差异小 D 、层内差异大 2、下面的表达式中错误的是() A 、∑=1h f B 、∑=n n h C 、∑=1h W D 、∑=1h N 3、各省电脑体育彩票中奖号码的产生属于() A 、随意抽样 B 、判断抽样 C 、随机抽样 D 、定额抽样 4、抽样调查的根本功能是() A 、获取样本资料 B 、计算样本指标 C 、推断总体数量特征 D 、节约费用 5、最优分配(opt V )、比例分配(prop V )的分层随机抽样与相同样本量的简单随 机抽样(srs V )的精度之间的关系式为() A 、srs prop opt V V V ≤≤ B 、srs opt prop V V V ≤≤ C 、srs opt prop V V V ≥≥ D 、opt prop srs V V V ≤≤ 6、我们想了解学生的视力状况,准备抽取若干学校若干班级的学生进行测试, 则() A 、抽样单位是每一名学生 B 、调查单位一定是每一名学生 C 、调查单位可以是班级 D 、调查单位是学校 7、在分层抽样中,当样本容量n 固定时,能够使得估计量的方差)(st y V 达到最 小的分配方式是() A 、比例分配 B 、等额分配 C 、随机分配 D 、Neyman 分配 8、概率抽样与非概率抽样的根本区别是()

A 、是否能确保总体中的每个单位都有完全相同的概率被抽中 B 、是否能确保总体中的每个单位都有事先已知或可以计算的非零概率被抽中 C 、是否能减少调查性误差 D 、是否能计算和控制抽样误差 9、在抽样的总误差中,属于一致性的误差有() A 、变量误差与估计量偏差 B 、估计量偏差与抽样误差 C 、变量误差与抽样误差 D 、非抽样误差与估计量偏差 10、简单随机抽样、系统抽样、按比例分配的分层抽样三者之间的共同点是() A 、将总体分成几部分,然后按事先确定的规则在各部分抽取 B 、每个个体单元被抽到的可能性都相等 C 、一旦选定了第一个样本单元,则其余所有样本单元即可完全确定 D 、三者没有共同点 11、下面哪种样本量分配方式属于比例分配?() A 、N n N n h h = B 、h L h h h h h h h c S N c S N n n ∑==1 C 、∑==L h h h h h h S N S N n n 1 D 、∑==L h h h h h h S W S W n n 1 12、整群抽样中的群的划分标准为() A 、群的划分尽可能使群间的差异小,群内的差异大 B 、群的划分尽可能使群间的差异大,群内的差异小 C 、群的划分尽可能使群间的差异大,群内的差异大 D 、群的划分尽可能使群间的差异小,群内的差异小 13、群规模大小相等时,总体均值 的简单估计量为() A.∑∑===n i M j ij y nM Y 111?

《数字通信原理(第三版)》教材课后习题答案

《数字通信原理》习题解答 第1章 概述 1-1 模拟信号和数字信号的特点分别是什么? 答:模拟信号的特点是幅度连续;数字信号的特点幅度离散。 1-2 数字通信系统的构成模型中信源编码和信源解码的作用是什么?画出话音信号的基带传输系统模型。 答:信源编码的作用把模拟信号变换成数字信号,即完成模/数变换的任务。 信源解码的作用把数字信号还原为模拟信号,即完成数/模变换的任务。 话音信号的基带传输系统模型为 1-3 数字通信的特点有哪些? 答:数字通信的特点是: (1)抗干扰性强,无噪声积累; (2)便于加密处理; (3)采用时分复用实现多路通信; (4)设备便于集成化、微型化; (5)占用信道频带较宽。 1-4 为什么说数字通信的抗干扰性强,无噪声积累? 答:对于数字通信,由于数字信号的幅值为有限的离散值(通常取二个幅值),在传输过程中受到噪声干扰,当信噪比还没有恶化到一定程度时,即在适当的距离,采用再生的方法,再生成已消除噪声干扰的原发送信号,所以说数字通信的抗干扰性强,无噪声积累。 1-5 设数字信号码元时间长度为1s μ,如采用四电平传输,求信息传输速率及符号速率。 答:符号速率为 Bd N 661010 11===-码元时间 信息传输速率为 s Mbit s bit M N R /2/1024log 10log 6 262=?=?== 1-6 接上例,若传输过程中2秒误1个比特,求误码率。

答:76105.210 221)()(-?=??==N n P e 传输总码元发生误码个数 1-7 假设数字通信系统的频带宽度为kHz 1024,可传输s kbit /2048的比特率,试问其频带利用率为多少Hz s bit //? 答:频带利用率为 Hz s bit Hz s bit //2101024102048)//3 3 =??==(频带宽度信息传输速率η 1-8数字通信技术的发展趋势是什么? 答:数字通信技术目前正向着以下几个方向发展:小型化、智能化,数字处理技术的开发应用,用户数字化和高速大容量等。 第2章 数字终端编码技术 ——语声信号数字化 2-1 语声信号的编码可分为哪几种? 答:语声信号的编码可分为波形编码(主要包括PCM 、ADPCM 等)、参量编码和混合编码(如子带编码)三大类型。 2-2 PCM 通信系统中A /D 变换、D /A 变换分别经过哪几步? 答:PCM 通信系统中A /D 变换包括抽样、量化、编码三步; D /A 变换包括解码和低通两部分。 2-3 某模拟信号频谱如题图2-1所示,(1)求满足抽样定理时的抽样频率S f 并画出抽样信号的频谱(设M S f f 2=)。(2)若,8kHz f S =画出抽样信号的频谱,并说明此频谱出现什么现象? 题图2-1

抽样技术期末试卷

抽样技术期末试卷

一、选择题(每题2分,共20分) 1.抽样调查的根本功能是( ) A. 获取样本资料 B. 计算样本资料 C . 推断总体数量特征 D. 节约费用 2.概率抽样与非概率抽样的根本区别是( ) A.是否能保证总体中每个单位都有完全相同的概率被抽中 B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C.是否能减少调查误差 D.是否能计算和控制抽样误差 3. 与简单随机抽样进行比较,样本设计效果系数Deff >1表明( ) A.所考虑的抽样设计比简单随机抽样效率低 B.所考虑的抽样设计比简单随机抽样效率高 C.所考虑的抽样设计与简单随机抽样效率相同 D.以上皆对 4.优良估计量的标准是() A.无偏性、充分性和一致性 B.无偏性、一致性和有效性 C. 无误差性、一致性和有效性 D. 无误差

性、无偏性和有效性 4.某乡欲估计今年的小麦总产量进行调查,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到63.118=y 吨,这些村去年的产量平均为21.104=x 吨。试采用比率估计方法估计今年该地区小麦总产量( ) A.12820.63 B.14593.96 C.12817.83 D.14591.49 6.抽样标准误差的大小与下列哪个因素无关( ) A .样本容量 B .抽样方式、方法 C .概率保证程度 D .估计量 7.当β为某一特定常数时,比率估计量可看成是比率估计量的特例,此时该常数值为( ) A.1 B.0 C.x y D.x 8.抽样标准误差与抽样极限误差之间的关系是( ) A.θ θ )?(SE = ? B. )?(θ tSE =? C. θ θ )?(tSE = ? D. t SE )?(θ = ? 9.应用比率估计量能使估计精度有较大改进的前提条件是调查变量与辅助变量之间大致成

《内部审计学》(第三版)

《内部审计学》(第三版) 课后习题参考答案 时现等 2017年4月 第一章内部审计概述 本章练习题 1. D 2. D 3.D 4.B 5.D 6.C 7. D 8. D 9.A 本章思考题 1.建议从审计主体、审计客体、审计内容、审计标准、审计目标等方面进行分析。 建议从准则结构、准则内容、准则实施状况等进行比较。内部审计发展的动因及影响内部审计发展的主要因素从外部环境、内部环境、管理层支持、内部审计自身等方面进行分析。 3.分别分析国际内部审计师协会和我国内部审计协会的定义。 内部审计的独立性主要是指组织上的独立,外部审计独立性包括组织上的独立性、业务上的独立性和经费上的独立性(形式上的独立与实质的独立)。 5.本题无标准答案,可以从企业价值分析入手,从价值链模型审计增值模型。 第二章内部审计程序 本章练习题 1.B 2.C 3.D 4.B 5.D 6.B 7.A 8.B 9.C 10.B 11.B 12.D 13.A 14.B 15.C 16.C 17.D 第三章内部审计机构与内部审计人员 本章练习题 1.A 2.D 3. A 4. D 5.B 6. C 7. D 8.A 9.C 10.A 11.A 12.D 本章思考题 1.为完善风险管理、内部控制服务,促进组织科学有效的战略管理,监控组织的高管层。 2.监督指导内部审计、聘请外部审计、向董事会报告内部审计情况。 3.知识、技能和经验。 4.可以从内部审计的职能、权限、业务范围、职业道德、胜任能力、机构设置等方面设

计。 第四章经营活动审计 本章练习题 一、单选题 1.D 2.C 3.A 4.C 5.D 6.B 7.B 8.A 9.D 10.B 11.A 12.B 13.A 14.D 15.A 二、多选题 1.ABCD 2. ABCD 3. ABCD 4. ABC 5. ABD 本章思考题 1.筹资管理活动、投资管理活动、经营管理活动中的财务收支情况、企业分配引起的财务活动。 2.人力资源规划、员工招聘、用人机制、人力资源开发和培训、员工的绩效管理。 3.价格、成本、质量、市场。 4.战略供应链管理使得企业内部审计的边界扩大,注重评价整个供应链上各利益相关者对企业经营效益的影响。 5.计划制定、生产组织控制、工艺流程控制、计划完成控制,与效益直接相关的内容:质量、成本。 第五章内部控制审计 本章练习题 一、单项选择题 1.B 2.D 3.B 4.C 5.B 6.D 7.D 8.B 9.D 10.A 11.A 12.D 13.C 14.B 15.A 16.B 17.A 18.D 19.A 20.B 21.B 22.D 23.C 二、判断题 1.√ 2.√3.×4.√ 5.√ 三、案例分析题 参考答案: (1)不存在内部控制缺陷。 (2)存在内部控制的缺陷,理由是:因为对于询价和确定供应商是属于不相容的两个岗位,而该公司却由一人担任是不正确的;改进措施:建议其由另外一个职员负责确定供应商。 (3)存在缺陷,理由是:未设有独立的验收部门,并保有连续编号的验收单。 (4)存在缺陷,理由是:付款凭单还应附采购订单、供应商发票等凭证。

抽样技术简答题及答案

抽样技术各类简答题参考答案 习题一 1.请列举一些你所了解的以及被接受的抽样调查。 略 2. 抽样调查基础理论及其意义; 答:大数定律,中心极限定理,误差分布理论,概率理论。 大数定律是统计抽样调查的数理基础,也给统计学中的大量观察法提供了理论和数学方面的依据;中心极限定理说明,用样本平均值产生的概率来代替从总体中直接抽出来的样本计算的抽取样本的概率,为抽样推断奠定了科学的理论基础;认识抽样误差及其分布的目的是希望所设计的抽样方案所取得的绝大部分的估计量能较好的集中在总体指标的附近,通过计算抽样误差的极限是抽样误差处于被控制的状态;概率论作为数学的一个分支而引进统计学中,是统计学发展史上的重要事件。 3.抽样调查的特点。 答:1)随机抽样;2)以部分推断总体;3)存在抽样误差,但可计算,控制;4)速度快、周期短、精度高、费用低;5)抽样技术灵活多样;6)应用广泛。 4.样本可能数目及其意义; 答:样本可能数目是在容量为N的总体中抽取容量为n的样本时,所有可能被抽中的不同样本的个数,用A表示。 意义:正确理解样本可能数目的概念,对于准确理解和把握抽样调查误差的计算,样本统计量的抽样分布、抽样估计的优良标准等一系列理论和方法问题都有十分重要的帮助。 5. 影响抽样误差的因素; 答:抽样误差是用样本统计量推断总体参数时的误差,它属于一种代表性误差,在抽样调查中抽样误差是不可避免的,但可以计算,并且可以被控制在任意小的范围内;影响 抽样误差的因素:1)有样本量大小,抽样误差通常会随着样本量的大小而增减,在某 些情形下,抽样误差与样本量大小的平方根成反比关系;2)所研究现象总体变异程度 的大小,一般而言,总体变异程度越大则抽样误差可能越大;3)抽样的方式方法, 如放回抽样的误差大于不放回抽样,各种不同的抽样组织方式也常会有不同的抽样误 差。 在实际工作中,样本量和抽样方式方法的影响是可以控制的,总体变异程度虽不可以 控制,但却可通过设计一些复杂的抽样技术而将其影响加以控制。 习题二 三简答题 1 概率抽样与非概率抽样的区别 答:概率抽样是指在抽取样本单元时,每个总体单元有一个非零的入样概率,并且样本单元的抽取应遵循一定的随机化程序。 2 普查与抽样调查的区别 答:普查是对总体的所有单元进行调查;抽样调查仅对总体中的部分单元进行调查。 3何谓抽样效率,如何评价设计效果? 答:两个抽样方案的抽样方差之比为抽样效率。当某个估计量的方差比另一估计量的方差小时,则称方差小的估计量效率比较高,因方差的大小与样本容量有直接的关系,因此比

抽样技术习题.doc

1.请列举一些你所了解的以及被接受的抽样调查。 2.抽样调查基础理论及其意义; 3.抽样调查的特点。 4.样本可能数目及其意义; 5.影响抽样误差的因素; 6.某个总体抽取一个n=50的独立同分布样本,样本数据如下: 567 601 665 732 366 937 462 619 279 287 690 520 502 312 452 562 557 574 350 875 834 203 593 980 172 287 753 259 276 876 692 371 887 641 399 442 927 442 918 11 178 416 405 210 58 797 746 153 644 476 1)计算样本均值y与样本方差s2; 2)若用y估计总体均值,按数理统计结果,y是否无偏,并写出它的方差表达式; 3)根据上述样本数据,如何估计v(y)? 4)假定y的分布是近似正态的,试分别给出总体均值μ的置信度为80%,90%,95%,99%的(近似)置信区间。

一判断题 1 普查是对总体的所有单元进行调查,而抽样调查仅对总体的部分单元进行调查。 2 概率抽样就是随机抽样,即要求按一定的概率以随机原则抽取样本,同时每个单元被抽中的概率是可以计算出来的。 3 抽样单元与总体单元是一致的。 4 偏倚是由于系统性因素产生的。 5 在没有偏倚的情况下,用样本统计量对目标量进行估计,要求估计量的方差越小越好。 6 偏倚与抽样误差一样都是由于抽样的随机性产生的。 7 偏倚与抽样误差一样都随样本量的增大而减小。 8 抽样单元是构成抽样框的基本要素,抽样单元只包含一个个体。 9 抽样单元可以分级,但在抽样调查中却没有与之相对应的不同级的抽样框。 10 总体目标量与样本统计量有不同的意义,但样本统计量它是样本的函数,是随机变量。 11 一个抽样设计方案比另一个抽样设计方案好,是因为它的估计量方差小。 12 抽样误差在概率抽样中可以对其进行计量并加以控制,随着样本量的增大抽样误差会越来越小,随着n越来越接近N,抽样误差几乎可以消除。 13 抽样误差越小,说明用样本统计量对总体参数进行估计时的精度越低。 14 样本量与调查费用呈现线性关系,但样本量与精度却呈非线性关系。 15 精度和费用也是评价抽样设计方案优劣的两条准则。 16 简单随机抽样时每个总体单元都有非零的入样概率,但每个总体单元的入样概率是不同的。 17 当总体N很大时,构造一个包含所有总体单元名单的抽样框是有局限性的,这也是简单随机抽样的局限性。 18 设N=872,n=10。利用随机数字表抽取一个简单随机样本如下:128 157 506 455 127 789 867 954 938 622 19 设N=678 n=5 利用随机数字表抽取一个简单随机样本如下:556 485 098 260 485 20 在实际工作中,如果抽样比接近于1时,人们会采用全面调查 二填空题 1 抽样比是指( ),用( )表示。 2 偏倚为零的估计量,满足( ),称为( )。 3 简单随机抽样的抽样误差等于( )。 4 简单随机抽样时重复抽样的抽样误差等于( ) 5 抽样时某一总体单元在第m次被选入样本的概率是( ) 6 简单随机抽样时总体单元被选入样本的概率是( ) 7 某一样本被选中概率是( )。 8 大数定理是指( )的规律性总是在大量( )的观察中才能显现出来,随着观察次数( )的增大,( )影响将互相抵消而使规律性有稳定的性质。 9 中心极限定理证明了当( )增大时,观察值的均值将趋向于服从( ),即不论( )服从什么分布,在观察值足够多时其均值就趋向( )分布。 10 抽样调查的核心是估计问题,选择估计量的标准是( ) ( ) ( )。 三简答题

抽样技术课后习题_参考答案_金勇进()

第二章习题 2.1判断下列抽样方法是否是等概的: (1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。 (2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64. (3)总体20000~21000,从1~1000中产生随机数r 。然后用r+19999作为被抽选的数。 解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。第二,每个单元被抽中的概率是已知的,或者是可以计算的。第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。 因此(1)中只有1~64是可能被抽中的,故不是等概的。(2)不是等概的【原因】(3)是等概的。 2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同? 300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。如果希望相对误差限不超过10%,则样本量至少应为多少? 解:由已知可得,N=50000,n=300,5.9y =,2062=s 该市居民用电量的95%置信区间为 [])(y [2 y V z N α±=[475000±1.96*41308.19] 即为(394035.95,555964.05) 由相对误差公式 y ) (v u 2y α≤10% 可得%10*5.9206*n 50000 n 1*96.1≤- 即n ≥862

欲使相对误差限不超过10%,则样本量至少应为862 2.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。 解析:由已知得:10000=N 200=n 35.0=p 02.0==N n f 又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n f p V 该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2 ∧ ∧ ±P V Z P E α 代入数据计算得:该区间为[0.2843,0.4157] 2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表: 编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 10 240 20 120 估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。 解析:由已知得:200=N 20=n 根据表中数据计算得:5.14420120 1 ==∑=i i y y ∴ 该小区平均文化支出Y 的95%置信区间为:])(y [2 y V z α ±即是:[132.544 ,156.456] 故估计该小区平均的文化支出Y =144.5,置信水平95%的置信区间为[132.544 ,156.456]。 2.6某地区350个乡为了获得粮食总产量的估计,调查了50个乡当年的粮食产量,得到 y =1120(吨),225600S =,据此估计该地区今年的粮食总产量,并给出置信水平95%的 置信区间。 解析:由题意知:y =1120 1429.0350 50 n === N f 225600S =?160=s

抽样技术 概念

目录第一章预备知识 第二章基本概念 第三章简单随机抽样 第四章分层随机抽样 第五章不等概率抽样 第六章多阶段抽样 第七章整群抽样 第八章系统抽样 第九章非概率抽样

第一章预备知识 作为抽样技术的基础知识或预备知识,本章简要地介绍调查原理、排列组合、概率统计等方面的有关知识。 一、调查概论 调查的重要性:有利于制定政策、投资决策、科学研究、机构管理以及司法实践等;与此同时,许多学科的进步和发展也同样离不开调查。 (一)(一)调查本质上是一种测量活动 测量活动具有6个要素:测量主体、测量客体、测量对象、测量法则、测量工具、测量结果(数字/符号)。 测量得到的数据大体分为三种类型:分类型数据、顺序型数据以及数值型数据。 测量的方法分为:直接测量和间接测量。 (二)(二)真值、测量值与误差 误差公理:任何调查结果都可能具有误差,而且误差始终存在于一切科学试验和调查过程中 。根据误差的来源分类:调查主体误差、调查客体误差、调查工具误差、调查法则误差、调查环境误差。 误差公理:任何调查结果都可能具有误差,而且误差始终存在于一切科学试验和调查过程中。 根据误差的来源分类:调查主体误差、调查客体误差、调查工具误差、调查法则误差、调查环境误差。 根据误差的性质分类:系统误差、随机误差和粗大误差。 根据误差的计量尺度分类:绝对误差和相对误差。 绝对误差δ、(调查)估计值x以及真实值μ之间的关系:δ=x-μ。 相对误差r、绝对误差δ以及真实值μ之间的关系:r=δ/μ。 实际常用的真值分类:理论真值、约定真值以及相对真值。 实际常用的测量值分类:单次测量值、算术平均值、加权平均值、中位数和众数。 (三)(三)信度、效度与精度 信度表示测量结果中的随机误差大小的程度。 信度的表示方法:测量值的方差(或标准差)或者样本平均数的方差(或标准差)。 衡量信度的三种方法:再测信度、复本信度和折半信度。 衡量信度的三种方法;再测信度、复本信度和折半信度。 效度表示测量结果中的系统误差大小的程度,是测量结果的“有效性” 的反映。 效度分类:内容效度、准则效度和结构效度。 效度含义:(1)测量的特征即为研究的目标特征;(2)该特征被准确地测量。 效度的表示方法:B(x)=|x-μ|或者B(E x)=|E x-μ|。 精度是信度与效度的综合,但它还与信度与效度之外的因素有关。 精度的表示方法:均方误差MSE(x)=V(x)+ () 2 B Ex u - 效度的表示方法: μ - =x x B) (或者μ - =x E x E B) (。 精度表示信度与效度的综合,但它还与信度与效度之外的因素有关。 精度的表示方法:均方误差 2 ()()() MSE x V x B Ex =+ 信度、效度与精度之间的关系:对于测量或调查来说,信度高的效度未必高,反过来效度高的信度未必高,但精度高的信度和效度肯定高。 二、排列组合 (一)(一)两条基本原理 加法原理和乘法原理。

应用抽样技术期末试卷

一、选择题(每题2分,共20分) 1.抽样调查的根本功能是( ) A. 获取样本资料 B. 计算样本资料 C . 推断总体数量特征 D. 节约费用 2.概率抽样与非概率抽样的根本区别是( ) A.是否能保证总体中每个单位都有完全相同的概率被抽中 B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C.是否能减少调查误差 D.是否能计算和控制抽样误差 3. 与简单随机抽样进行比较,样本设计效果系数Deff >1表明( ) A.所考虑的抽样设计比简单随机抽样效率低 B.所考虑的抽样设计比简单随机抽样效率高 C.所考虑的抽样设计与简单随机抽样效率相同 D.以上皆对 4.优良估计量的标准是( ) A.无偏性、充分性和一致性 B.无偏性、一致性和有效性 C. 无误差性、一致性和有效性 D. 无误差性、无偏性和有效性 5.某乡欲估计今年的小麦总产量进行调查,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到63.118=y 吨,这些村去年的产量平均为21.104=x 吨。试采用比率估计方法估计今年该地区小麦总产量( ) A.12820.63 B.14593.96 C.12817.83 D.14591.49 6.抽样标准误差的大小与下列哪个因素无关( ) A .样本容量 B .抽样方式、方法 C .概率保证程度 D .估计量 7.当β为某一特定常数时,比率估计量可看成是比率估计量的特例,此时该常数值为( ) A.1 B.0 C. x y D.x 8.抽样标准误差与抽样极限误差之间的关系是( ) A.θ θ )?(SE = ? B.)?(θtSE =? C.θθ)?(tSE =? D.t SE )?(θ=?

《抽样技术》第四版习题答案

第2章 2.1 解:()1 这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号 为1~64的这些单元中每一个单元被抽到的概率都是 1100 。 ()2这种抽样方法不是等概率的。利用这种方法,在每次抽取样本单元时,尚未被抽中 的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是2 100 ,而尚未被抽中的编号为36~63的每个单元的入样概率都是 1100 。 ()3这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号为20 000~ 21 000中的每个单元的入样概率都是 1 1000 ,所以这种抽样是等概率的。 2.3 解:首先估计该市居民日用电量的95%的置信区间。根据中心极限定理可知,在大 _ y E y y -= 近似服从标准正态分布, _ Y 的195%α-=的置信区 间为y z y z y y α α??-+=-+? ?。

而()2 1f V y S n -= 中总体的方差2S 是未知的,用样本方差2s 来代替,置信区间 为,y y ?? -+???? 。 由题意知道,_ 2 9.5,206y s ==,而且样本量为300,50000n N ==,代入可以求得 _ 21130050000 ()2060.6825300 f v y s n --= =?=。将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192????。 下一步计算样本量。绝对误差限d 和相对误差限r 的关系为_ d rY =。 根据置信区间的求解方法可知 _ ___ 11P y Y r Y P αα? ???-≤≥-?≤≥-???? 根据正态分布的分位数可以知道1P Z αα??? ≤≥-???? ,所以()2_2rY V y z α?? ?= ??? 。也就是2 _2 _2 22 /221111r Y r Y S n N z S n N z αα?? ?????? ????? ???-=?=+ ? ????? ?? ???? 。 把_ 2 9.5,206,10%,50000y s r N ====代入上式可得,861.75862n =≈。所以样本量至少为862。 2.4 解:总体中参加培训班的比例为P ,那么这次简单随机抽样得到的P 的估计值p 的方差()()111f N V p P P n N -= --, 在大样本的条件下近 似服从标准正态分布。在本题中,样本量足够大,从而可得P 的195%α- =的置信区间为 2p z p z αα?-+?。 而这里的()V p 是未知的,我们使用它的估计值

应用抽样技术期末复习题

抽样调查 一、选择题 1.抽样调查的根本功能是( C ) A. 获取样本资料 B. 计算样本资料 C . 推断总体数量特征 D. 节约费用 2.概率抽样与非概率抽样的根本区别是( B ) A.是否能保证总体中每个单位都有完全相同的概率被抽中 B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C.是否能减少调查误差 D.是否能计算和控制抽样误差 3. 与简单随机抽样进行比较,样本设计效果系数Deff >1表明( A ) A.所考虑的抽样设计比简单随机抽样效率低 B.所考虑的抽样设计比简单随机抽样效率高 C.所考虑的抽样设计与简单随机抽样效率相同 D.以上皆对 4.优良估计量的标准是( B ) A.无偏性、充分性和一致性 B.无偏性、一致性和有效性 C. 无误差性、一致性和有效性 D. 无误差性、无偏性和有效性 5.某乡欲估计今年的小麦总产量进行调查,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到63.118=y 吨,这些村去年的产量平均为21.104=x 吨。试采用比率估计方法估计今年该地区小麦总产量( B ) A.12820.63 B.14593.96 C.12817.83 D.14591.49 6.抽样标准误差的大小与下列哪个因素无关( C ) A .样本容量 B .抽样方式、方法 C .概率保证程度 D .估计量 7.抽样标准误差与抽样极限误差之间的关系是( B ) A.θθ )?(SE =? B.)?(θtSE =? C.θθ)?(tSE =? D.t SE )?(θ=? 8.应用比率估计量能使估计精度有较大改进的前提条件是调查变量与辅助变量之间大致成( A )关系 A.正比例 B.反比例 C.负相关 D.以上皆是 9.能使)2(1)(222YX X Y lr S S S n f y V ββ-+-=达到极小值的β值为( B ) A.YX X Y S S S ? B.2X YX S S C.2Y YX S S D.X YX S S 2 10.( B ) 是总体里最小的、不可再分的单元。 A.抽样单元 B.基本单元 C.初级单元 D.次级单元 11. 下面哪种抽样方法是最简单的概率抽样方法( A )。 A.简单随机抽样 B.分层随机抽样 C.系统抽样 D.整群抽样 12. 下面关于各种抽样方法的设计效应,表述错误的是( B )。 A.简单随机抽样的deff=1 B.分层随机抽样的deff ﹥1 C.整群随机抽样的deff ﹥1 D.机械随机抽样的deff ≈1

抽样技术与应用期末复习题

一、选择题 1、 分层抽样的特点是() A 、层内差异小,层间差异大 B 、层间差异小,层内差异大 C 、层间差异小 D 、层内差异大 2、下面的表达式中错误的是() A 、∑=1h f B 、∑=n n h C 、∑=1h W D 、∑=1h N 3、各省电脑体育彩票中奖号码的产生属于() A 、随意抽样 B 、判断抽样 C 、随机抽样 D 、定额抽样 4、抽样调查的根本功能是() A 、获取样本资料 B 、计算样本指标 C 、推断总体数量特征 D 、节约费用 5、最优分配(opt V )、比例分配(prop V )的分层随机抽样与相同样本量的简单随 机抽样(srs V )的精度之间的关系式为() A 、srs prop opt V V V ≤≤ B 、srs opt prop V V V ≤≤ C 、srs opt prop V V V ≥≥ D 、opt prop srs V V V ≤≤ 6、我们想了解学生的视力状况,准备抽取若干学校若干班级的学生进行测试, 则() A 、抽样单位是每一名学生 B 、调查单位一定是每一名学生 C 、调查单位可以是班级 D 、调查单位是学校 7、在分层抽样中,当样本容量n 固定时,能够使得估计量的方差)(st y V 达到最 小的分配方式是() A 、比例分配 B 、等额分配 C 、随机分配 D 、Neyman 分配 8、概率抽样与非概率抽样的根本区别是() A 、是否能确保总体中的每个单位都有完全相同的概率被抽中 B 、是否能确保总体中的每个单位都有事先已知或可以计算的非零概率被抽中 C 、是否能减少调查性误差 D 、是否能计算和控制抽样误差 9、在抽样的总误差中,属于一致性的误差有() A 、变量误差与估计量偏差 B 、估计量偏差与抽样误差 C 、变量误差与抽样误差 D 、非抽样误差与估计量偏差 10、简单随机抽样、系统抽样、按比例分配的分层抽样三者之间的共同点是() A 、将总体分成几部分,然后按事先确定的规则在各部分抽取 B 、每个个体单元被抽到的可能性都相等 C 、一旦选定了第一个样本单元,则其余所有样本单元即可完全确定 D 、三者没有共同点

抽样技术重点复习概念

调查:通过使用明确的概念、方法和程序,依据专门设计的调查方案知道的方式,从一个总体全部或部分单元中搜集感兴趣的指标信息,并将这些信息综合整理成数据系列的有关活动。 抽样调查:是调查应用最常见的模式,是一种非全面的调查,它是指从研究对象的全体(总体)中抽取一部分单元作为样本,根据对所抽取的样本进行调查,获得有关总体目标量的了解。这是广义的抽样调查的概念 抽样调查步骤:调查目标确定、抽样框选择、抽样方案设计、问卷设计、数据收集、数据编码和录入、审核与插补、参数估计、数据分析和调查结果的表述、数据分布、撰写调查报告 简单随机抽样:也称纯随机抽样,是从抽样框内的N个抽样单元中随机的、一个一个的抽取n个单元作为样本,在每次抽选中,所有未入样的待选单元入选样本的概率都想等,这n个被抽中的单元就构成了简单随机样本。简单随机样本也可以一次从总体(抽样框)中同时抽出,这时全部可能样本中的每一个样本被抽中的概率也需要相等。 分层抽样:是将抽样单元按某种特征或某种规划分为不同的层,然后从不同的层中独立、随机地抽取样本,将各层的样本结合起来,对总体的目标量进行估计。 分层随机抽样:如果每层中的抽样都是独立地按照简单随机抽样进行的,那么这样的分层抽样称为分层随即抽样,所得的样本称为分层随即样本。 整群抽样:将总体中的若干个基本单元合并为组,这样的组称为群。抽样时直接抽取群,然后对中选群中的所有基本单元全部实施调查,这样的抽样方法称为整群抽样。 多阶段抽样:采用类似整群抽样的方法,首先抽取群,但不是调查群内的所有基本单元,而是再进一步抽样,从选中的群中抽取出若干个基本单元进行调查,因为取得这些接受调查的基本单元需要两个步骤,所以将这种抽样方式成为两阶段抽样。这里,群是初级抽样单元,第二阶段抽取的是基本抽样单元。将这种方法推广,使抽样的段数增多,就称为多阶段抽样。 系统抽样:将总体中的所有单元(抽样单元)按一定顺序排列,在规定的范围内随机抽取一个单元作为初始单元,然后按事先规定好的规则确定其他样本单元,这种抽样方法称为系统抽样。 简单估计:在没有总体其他相关辅助变量信息可以利用的情况下,用样本特征直接估计总体特征,且样本特征与预估的总体特征除了写法之分外,完全同形同构,简单易记,因此有简单线性估计的名称,简称为简单估计。 比率估计:设对有两个调查变量Y 和X 的总体进行简单随机抽样,分别以y,x表示样本总值,以y,x表示样本均值,以μ// R y x y x ==为样本比率,用 μR作为总体比率R的估计称为的比率估计 回归估计:在简单随机抽样下,总体均值和总体总值Y的回归估计量定义为: ()() tr y y X x y x X ββ =+-=-- μ lr lr Y N y =其中Y,X分别为调查变量、辅助变量的样本均值,X是辅助变量的总体均值,β称为回归系数。 不等概抽样:如果总体中每个单元进入样本的可能性是不相等的,则这种随机抽样方式就称为不等概率随机抽样,简称不等概率抽样。 非抽样误差:除抽样误差以外的,由于各种原因引起的误差。 非抽样误差的分类:抽样框误差(由不完善的抽样框引起的误差);无回答误差(由于种种原因没有从被调查单元获得调查结果,造成调查数据的缺失);计量误差(所获得的调查数据与其真值之间不一致造成的误差)

抽样技术试题

第四章抽样技术概述 班级:姓名:成绩 一、填空题:(21分) 1、抽样调查是一种()调查,它是从所研究客观现象的总体中,按照()抽取()进行调查,以从这一部分单位调查的结果,来()所研究总体的相应数据。 2、随机原则是指在总体中抽取样本单位时,完全排除()意识,保证总体中()单位都有被抽中的同等可能性原则。 3、抽样调查是以()数据推断的()数据。 4、抽样调查产生的(),可以计算并控制, 5、从全及总体中抽取样本单位有()和()两种方法。 6、一般说,不重复抽样的抽样误差()重复抽样的抽样误差。 7、抽样平均误差就是抽样平均数(或抽样成数)与总体平均数(或总体成数)的()。它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的()。 8、影响抽样误差的主要因素有()、()、()、()。 9、利用样本统计量估计总体参数,通常运用()和()两种方法。 10、点估计是直接用()估计总体参数的推断方法。点

估计不考虑()及()。 11、置信区间反映了参数估计的精确程度,区间愈小,估计就愈();而置信度则反映了总体参数落在置信区间内的( ),置信度愈高,则估计的把握程度就()。 12、影响样本容量大小的因素主要有五种:()、()、()、()、()。 13、区间估计是用样本统计量估计总体参数时,用一个区间范围的值作为总体参数的估计值,并注明总体参数落在这们一个区间的可能性,或称()。我们称这一区间为()。 14、对于简单随机重复抽样,若其他条件不变,则当误差范围缩小一半,抽样单位数必须()倍。若误差范围扩大一倍,则抽样单位数为原来的()。 二、单项选择题:(14分) 1、随机抽样的基本要求是严格遵守() A.、准确性原则B、随机性原则C、代表性原则D、可靠性原则。 2、抽样调查的主要目的是() A.、广泛运用数学的方法B、计算和控制抽样误差C、修正普查的资料D、用样本统计量推算总体参数。 3、在抽样调查中() A.、既有登记性误差,也有代表性误差B、既没有登记性误差,也没有代表性误差C、只有登记性误差,没有代表性误差D、、

抽样技术期末试卷

一、选择题(每题2分,共20分) 1.抽样调查的根本功能是( ) A. 获取样本资料 B. 计算样本资料 C . 推断总体数量特征 D. 节约费用 2.概率抽样与非概率抽样的根本区别是( ) A.是否能保证总体中每个单位都有完全相同的概率被抽中 B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C.是否能减少调查误差 D.是否能计算和控制抽样误差 3. 与简单随机抽样进行比较,样本设计效果系数Deff >1表明( ) A.所考虑的抽样设计比简单随机抽样效率低 B.所考虑的抽样设计比简单随机抽样效率高 C.所考虑的抽样设计与简单随机抽样效率相同 D.以上皆对 4.优良估计量的标准是( ) A.无偏性、充分性和一致性 B.无偏性、一致性和有效性 C. 无误差性、一致性和有效性 D. 无误差性、无偏性和有效性 4.某乡欲估计今年的小麦总产量进行调查,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到63.118=y 吨,这些村去年的产量平均为21.104=x 吨。试采用比率估计方法估计今年该地区小麦总产量( ) A.12820.63 B.14593.96 C.12817.83 D.14591.49 6.抽样标准误差的大小与下列哪个因素无关( ) A .样本容量 B .抽样方式、方法 C .概率保证程度 D .估计量 7.当β为某一特定常数时,比率估计量可看成是比率估计量的特例,此时该常数值为( ) A.1 B.0 C. x y D.x 8.抽样标准误差与抽样极限误差之间的关系是( ) A.θ θ )?(SE = ? B.)?(θtSE =? C.θθ)?(tSE =? D.t SE )?(θ=? 9.应用比率估计量能使估计精度有较大改进的前提条件是调查变量与辅助变量之间大致成( )关系

应用抽样技术答案

第二章 2.1判断题: (1)错;(2)错;(3)对;(4)错;(5)错;(6)错;(7)错;(8)错;(9)对;(10)对;(11)错;(12)错;(13)错。 2.3选择题: (1)b ;(2)b ;(3)d ;(4)c ;(5)c 。 2.7 (1)抽样分布: (2)期望为5,方差为4/3 (3)抽样标准误 = √4/3 = 1.155 (4)抽样极限误差 = 1.96*1.155 = 2.263 (5)置信区间 = (5.67-2.263, 5.67+2.263) =(3.407, 7.933)。 若区间两端只考虑抽样分布的可能性取值,则可得该抽样分布作为离散分布的置信区间为[3, 7] 第三章 3.1 判断题是否为等概率抽样: (1)是;(2)否;(3)是;(4)否。 3.2 (1)5.51 == ∑i Y N Y 25.6)(1 22=-=∑Y Y N i σ 33.8)(1 1 22=--= ∑Y Y N S i (2)样本:(2, 5) (2, 6) (2, 9) (5, 6) (5, 9) (6, 9) ()()5.55.775.55.545.36 1 =+++++= ∑y E () ∑=+++++=33.8)5.485.05.2485.4(61 2s E 3.3

(1) 1682=∑i y 1182662 =∑i y 03276.030 1750 /3011=-=-n f 760.5630/1682==y 127.8261302^067.503011826611)(11212212 =-?-=?? ? ??--=--=∑∑==y n y n y y n s n i i n i i ()07.27271.82603276.012 =?=-= s n f y v ()203.5)(==y v y se 198.10203.596.1)(=?=?=?y se t 95%置信度下置信区间为(56.067-10.198, 56.067+10.198)=(45.869, 66.265). 因此,对该校学生某月的人均购书支出额的估计为56.07(元),由于置信度95%对应的96.1=t ,所以,可以以95%的把握说该学生该月的人均购书支出额大约在45.87~66.27元之间。 (2) 易知N =1750, n =30,n 1=8,t =1.96 267.03081=== n n p 03389.01 301750 /30111=--=--n f 1957.0)267.01(267.0)1(=-?=-=p p pq 08144.0957.003389.01)1()(=?=--= n pq f p v 0167.030 21 21=?=n P 的95%的置信区间为: ())4433.0,0907.0(0167.008114.096.1267.0211)1(=+?±=???? ??+--±n n pq f t p 则1N 的估计值为46725.467?1 ≈==Np N ,其95%的置信区间为: )776,159()4433.0,0907.0(1750=? (3)64.1054267 .01.0) 267.01(96.12 2220=?-?==p q t n γ

相关主题
文本预览
相关文档 最新文档