第四章抽样和抽样分布
- 格式:doc
- 大小:1.54 MB
- 文档页数:11
第四章抽样与抽样分布一、单项选择题1.抽样调查的目的在于(a )。
A、了解总体的基本情况B、用样本指标推断总体指标C、对样本进行全面调查D、了解样本的基本情况2.假定10亿人口大国和100万人口小国的居民年龄变异程度相同,现在各自用重复抽.样方法抽取本国的1%人口计算平均年龄,则抽样误差(c)。
A、两者相等B、前者大于后者C、前者小于后者D、不能确定3、抽样调查,随着样本量的增加,调查的误差(a)A、减小B、不变C、扩大D、不确定4、对某单位职工的文化程度进行抽样调查,得知其中80%的人是高中毕业,抽样平均误差为2%,当概率为95.45%(Z=2)时,该单位职工中具有高中文化程度的比重是( c )A、等于78%B、大于84%C、在76%与84%之间D、小于76%5、某银行想知道平均每户活期存款余额和估计其总量,根据存折账号的顺序,每50本存折抽出一本登记其余额。
这样的抽样组织形式是( c )A、类型抽样B、整群抽样C、机械抽样D、纯随机抽样6、农户家计调查中,按地理区域划分所进行的区域抽样,其抽样组织方式属于(d)A、简单随机抽样B、类型抽样C、等距抽样D、整群抽样7、抽样平均误差是指样本平均数或样本成数的( c )A、平均数B、平均差C、标准差D、标准差系数8、在不重复抽样中,抽样单位数从5%增加到25%,抽样平均误差( c )。
A、增加39.7%B、增加约3/5C、减少约3/5D、没有什么变化9、(甲)某高校新生1000人,从理科中随机抽取60人,文科中随机抽取40人,进行英语水平测试;(乙)从麦地总垅长中每3000市尺测竿落点处前后5尺长垅的产量进行实割实测;(丙)为研究城市青年业余时间活动情况,某城市每第10个居委会被抽取,并询问住在那里所有从16岁到30岁的青年人。
上述哪项属于类型抽样?( a )A、甲B、乙C、乙、丙D、甲、乙、丙10、抽样调查所遵循的基本原则是( b )A、准确性原则B、随机性原则C、可靠性原则】D、灵活性原则11、在其它条件不变的情况下,如果允许误差范围缩小为原来的1/2,则样本容量(a )A、扩大为原来的4倍B、扩大为原来的2倍C、缩小为原来的1/2倍D、缩小为原来的1/4倍12、对一批产品按不重复抽样方法抽取200件进行调查,其中废品8件,已知样本容量是产品总量的1/20,当F(Z)=95.45%时,不合格率的抽样极限误差是( d )A、1.35%B、1.39%C、2.70%D、2.78%13、抽样平均误差,确切地说是所有样本指标(样本平均数和样本成数)的( b)。
抽样与抽样分布在统计学中,抽样是一种常用的数据收集方法,通过从总体中选择一部分样本来进行研究和分析。
抽样的目的是通过样本来推断总体的特征和性质。
在进行抽样时,我们需要了解抽样的方法和抽样分布的概念。
一、抽样方法1. 无偏抽样无偏抽样是指所有样本有相同被选中的机会。
这样可以确保样本的代表性,从而减小样本估计值和总体真值之间的误差。
常见的无偏抽样方法包括简单随机抽样、系统抽样和分层抽样等。
2. 有偏抽样有偏抽样是指样本的选择并不具有相等的机会。
这样可能导致样本的代表性不足,从而产生较大的估计误差。
有时,有偏抽样也可以用于特定的研究目的,但需要明确地说明和分析偏差带来的影响。
二、抽样分布1. 抽样分布的概念抽样分布是指统计量在各个可能样本上的取值分布。
统计量可以是样本均值、样本方差等。
抽样分布的性质对于进行统计推断和假设检验非常重要。
2. 样本均值的抽样分布样本均值的抽样分布在中心极限定理的条件下近似服从正态分布。
中心极限定理指出,当样本容量足够大时,无论总体分布如何,样本均值的抽样分布都会接近正态分布。
3. 样本比例的抽样分布样本比例的抽样分布在满足一些条件的情况下也近似服从正态分布。
这些条件包括样本容量足够大、总体比例接近0.5以及样本与总体之间的独立性等。
4. 样本方差的抽样分布样本方差的抽样分布不服从正态分布。
通常情况下,样本方差的抽样分布呈右偏态,即偏度大于0。
为了得到样本方差的抽样分布,可以使用抽样分布的近似分布,如卡方分布。
三、应用案例抽样与抽样分布的方法和理论在实际统计学中有广泛的应用。
以下是一些常见的应用案例:1. 调查研究在进行调查研究时,我们经常需要从总体中选择一部分样本进行问卷调查或面访。
通过利用抽样与抽样分布的方法,我们可以将样本的调查结果推广到总体中,从而得到总体的特征和性质。
2. 假设检验假设检验是统计学中常用的推断方法之一。
通过比较样本统计量与假设的总体参数值,我们可以判断假设的合理性。
第四章抽样理论与参数估计第一节抽样理论的基本知识分层抽样,又叫分层随机抽样,这种抽样方法是按照总体已有的某些特征,承认总体中已有的差异,按差异将总体分为几个不同的部分,每一部分称为一个层,在每一个层中实行简单随机抽样。
它充分利用了总体的已知信息,因而是一种非常适用的抽样方法,其样本代表性及推论的精确性一般优于简单随机抽样。
分层的原则是层与层之间的变异越大越好,各层内的变异要小。
试述分层抽样的原则和方法?分层抽样是按照总体上已有的某些特征,将总体分成几个不同部分,在分别在每一部分中随机抽样。
分层的总的原则是:各层内的变异要小,而层与层之间的变异越大越好。
在具体操作中,没有一成不变的标准,研究人员可根据研究需要依照多个分层标准,视具体情况而定。
⑷两阶段随机抽样两阶段随机抽样首先将总体分成M个部分,每一部分叫做一个"集团"(或"群"),第一步从M个集团中随机抽取m个"集团”作为第一阶段样本,第二步是分别从所选取的m个"集团”中抽取个体(g构成第二阶段样本。
一般而言,两阶段抽样相对于简单随机抽样,标准误要大些,但是,两阶段抽样简便易行,节省经草贼,因而它是大规模调查研究中常被使用的抽样方法。
例如,如果我们要了解全国城市初中二年级学生的身高,第一步我们可以从全国几百个城市中随机抽取几十个城市作为第一阶段的样本。
第二步,在第一阶段随机抽取出来的城市中再随机抽取初中二年级的学生。
(二)非旃抽样非概率抽样不是完全按随机原则选取样本,有方便抽样、判断抽样。
方便抽样是由调查人员自由、方便地选择被调查者的非随机选样。
判断抽样是通过某些条件过滤,然后选择某些被调查者参与调查的抽样法。
当采取非概率抽样的方法选取样本时,研究者要说明采用此种方取样的原因以及对研究结果可能造成的影响。
第二节抽样分布[统计量分布、基本随机变量函数的分布]总体:又称母全体、全域,指具有某种特征的一类事物的全体。
第四章SPSS的应用一、简单随机抽样:例如,用SPSS不重复选取容量为10的简单随机样本,在数据编辑器窗口打开目标数据文件,在数据菜单中点击选择个案子菜单,打开如下对话框:左面是变量列表,先选择目标变量会变灰色,然后再对话框中间选择处选择抽样方法。
共有五种方法可供选择,默认选择是全部个案(A),表示所有个案所代表的的个体均被选择作为样本;如果条件满足(C)是要设置一些选择条件,可以自行设定一些条件(包括函数);随机个案样本(D)是作简单随机抽样,点击样本会跳出如下对话框;基于时间或个案全距(B),表示需要指定选样范围,个案从哪个开始到结束,此项不是随机抽样;使用筛选器变量(U), 表示要指定一个变量作为抽样变量。
图4-5按照图中操作,选择随机个案样本,在点击样本会跳出对话框,如下图4-6:图4-6在选择个案随机样本对话框中有两个抽样方法:默认是大约(A)□所有个案的%,要指定一个抽样比例;精确(E),□从第一个开始的个案(F)□个案,前一个□表示确定样本容量数目,后一个□表示抽样范围。
按照图中操作,填写对话框,点击继续返回上级菜单,再点击确定执行操作即可。
下图4-7中数据记录未被画斜线的个案即被选中作为随机抽样的样本单位,如标号46,51,56……,实际上样本单位的选取还可以通过过滤变量Filter-S的取值得到,如取值为1的数据所代表的单元即是抽中的样本单位部分。
图4-7二、对于复杂抽样方法,可以利用SPSS中复杂抽样子模块来,按成过程比较复杂。
在分析主菜单中选择复杂抽样子菜单:执行抽样向导按照指示操作即可。
利用抽样向导可以完成创建、修改或执行抽样计划文件的步骤,使用前应该构思好定义明确的目标总体、抽样单元列表和适当的样本设计。
如图4-8图4-8创建新样本计划:从菜单中选择→分析→复杂样本→选择设计样本。
→选择设计样本并建立一个计划文件,点击下一步继续向导。
→或者在设计变量步骤中,定义层次、聚类和输入样本权重等内容后,单击下一步。
→或者,在抽样方法步骤中,可以选择一个方法用于选择样本。
如果选择PPS Brewer 或PPS Murthy,可以单击完成抽取样本。
否则,单击下一步继续。
→在样本大小步骤中,制定要抽样的单元数或单元比例,单击完成抽取样本。
→或者可以进一步执行以下步骤:选择要保存的输出变量;向设计添加第二或第三阶段;设置各选择项,包括抽取样本的阶段、随机种子数,以及是否将用户缺失值视为设计变量的有效值;选择输出数据的保存位置。
STEP 1、设计变量在这个步骤中,可以选择层次变量和聚类变量,可以定义输入样本权重。
还可指定阶段的标签。
如图4-9分层依据。
分层变量的交叉分类定义了不同的层次,分别为各层获取了不同的样本,要提高估计值的精度,层内单元的特征应尽量一致。
分群。
分群变量定义了观察单元组,即分群。
要提高估计值的精度,子群单元的特征应尽量一致。
输入样本权重。
可以用以前阶段样本母体的权重作参考,也可以指定一个包含这些权重的数值型变量。
阶段标签。
为每个阶段指定一个字符标签,用于在输出中以帮助识别分阶段信息。
在抽样向导的每一步骤中,左侧都是所有步骤的概要。
单击已启用步骤的名称可以浏览该向导。
只要之前的所有步骤有效,达到步骤最低要求的指定项,那么步骤为启用状态。
图4-9 STEP 2、抽样方法。
图4-10在此步骤中,可以指定从活动数据集中选择个案的方式。
如上图4-10。
方法。
该组选项用于选择取样方法。
某些抽样类型允许选择放回(WR)或不放回(WOR)。
注意:所有PPS类型只在设计的第一阶段才可用,某些与大小成比例的概率PPS类型只在定义聚类之后才可以使用。
WR方法只在设计的最后阶段才可用。
简单随机抽样。
以等概率选择样本单元,单元可以采用(WR)或不放回(WOR)方式选择。
系统抽样,在整个抽样框或层次(如果已指定),采用不放回(WOR)方式以固定间隔抽取单元。
在第一个区间内随机选择单元作为起始点。
简单顺序。
采用采用不放回(WOR)方式以等概率顺序地选择单元。
PPS。
不等概率抽样。
这是第一阶段采用的方法,用与规模大小成正比的概率随机选择单元,采用放回的方式,只有聚类可以采用不放回的方式。
PPS系统。
这是第一阶段采用的方法,用与大小成正比的概率系统地选择单元,采用不放回的方式。
PPS顺序。
这是第一阶段采用的方法,用与聚类大小成正比的概率采用不放回方式顺序地选择单元。
PPS Brewer。
这是第一阶段采用的方法,用与聚类大小成正比的概率采用不放回方式从每一个层次选择两个聚类。
使用该方法,要指定聚类变量。
PPS Murthy。
这是第一阶段采用的方法,用与聚类大小成正比的概率采用不放回方式从每一个层次选择两个聚类。
使用该方法,要指定聚类变量。
PPS Sampford。
这是第一阶段采用的方法,用与聚类大小成正比的概率从每个层次采用不放回方式选择两个以上聚类。
它是Brewer方法的扩展。
使用该方法,要指定聚类变量。
在分析中使用WR估计。
缺省情况下,估计方法是在计划文件中指定的,与所选抽样方法一致。
这样,及时抽样方法意味着WOR估计,也可以使用放回方式估计。
此选项只在第一阶段可用。
大小测量(MOS)。
如果选择PPS方法,则必须指定定义每个单元大小的规模度量。
这些规模可以在一个变量中显示定义,也可以根据数据计算。
或者,可以设置MOS的上限和下限,覆盖所有MOS变量中的值或根据数据计算的值。
这些选项只在第一阶段可用。
STEP 3、样本大小图4-11在这一步骤中,可以指定当前阶段中药抽样的单元数或单元比例。
样本大小可以是固定的,也可以各层不同。
为了指定样本大小,前面阶段中选择的聚类可用于定义层次。
如上图4-11单位。
可以指定要抽样的单元的确切样本大小或比例。
如果选择比例,则可以设置抽样单元数的上限和下限。
值。
应用于所有层次的单个值。
如果将计数选作单元度量,则应输入一个正整数。
如果选择比例,则应输入一个非负值。
除非是放回抽样,否则比例值也应该不大于1。
各层不相等的值。
允许通过“定义不等大小”对话框逐层输入大小值。
从变量中读取值。
允许选择包含层次大小值的数值变量。
定义大小不等的对话框,如下图4-12在定义大小不等对话框中,可以逐层输入大小值。
“指定大小”网格。
该网格最多显示五个层次变量或聚类变量的交叉分类——即每行一个层次/聚类组合。
符合的变量包括当前和以前阶段的所有分层变量,以及以前阶段的所有聚类变量。
变量可在网格内重新排序,或者移到排除列表。
在最右列中输入大小。
单击标签或值,在网格单元格中分层变量和聚类变量的值标签和数据值的显示之间切换。
包含未标注值的单元格始终显示值。
单击刷新层,用网格中变量的标注数据值的每个组合重新填充网格。
排除。
要指定层次/聚类组合子集的大小,将一个或多个变量移到“排除”列表。
这些变量不用于定义样本大小。
STEP4 输出变量在这一步骤中,可以选择抽取样本时要保存的变量。
如上图4-13群体大小。
给定阶段估计的总体单元数。
保存变量的根名为PopulationSize样本比例。
给定阶段的抽样率。
保存变量的根名为SamplingRate样本大小。
给定阶段抽取的单元数。
保存变量的根名为SampleSize样本权重,包含概率的逆。
保存变量的根名为SampleWeight某些分阶段变量是自动生成的。
其中包括:包含概率。
给定阶段抽取的单元比例。
保存变量的根名为InclusionProbability累积权重。
此阶段之前(含当前阶段)的累积样本权重。
保存变量的根名为SampleWeightCumulative指标。
表示给定阶段中多次选择的单元。
保存变量的根名为index注意:保存变量根名称包含一个整数后缀,它反映阶段序号。
例如PopulationSize 1 用于阶段1保存的总体大小。
STEP5 摘要图4-14这是每个阶段的最后一步,提供整个当前阶段的样本设计指定项的摘要,在此处,可以继续下一个阶段(必要时创建阶段),也可以设置抽取样本的选项。
如图4-15图4-15在这一步骤中,可以选择是否抽取样本。
还可以控制其他抽样选项,如随机种子和缺失值处理。
.是否抽取样本。
除了选择是否样本之外,还可以选择执行部分抽样设计。
必须按照顺序抽取阶段——即抽取阶段1之后才能抽取阶段2。
编辑或执行计划时,不能重新抽取锁定的阶段。
种子。
它是用来选择生成随机数的种子值。
包括用户缺失值。
可确定用户缺失值是否有效。
如果有效,则将用户缺失值视为单独的类别。
数据已排序。
如果样本框架按照分层变量值预先排序,使用此选项可以加快选择过程。
在这一步骤中,可以选择抽样个案、权重变量、联合概率和个案选择规则的定向位置。
见上图4-16样本数据保存位置。
使用这些选项可以确定样本输出的写入位置。
样本输出可以添加到活动数据集,也可以写入新数据集,还可以保存到外部SPSS数据文件中。
数据集名称必须符合变量命名规则。
如果指定外部文件或新数据集,则写入所选个案的抽样输出变量和活动数据集中的变量。
一般不必麻烦,直接写入SPSS数据文件。
联合概率保存位置。
使用该选项可以确定联合概率的写入位置。
联合概率保存到外部SPSS的数据文件,如果选择PPS、WOR、PPS Brewer、PPS Samford或PPS Murthy方法,并且未指定WR估计,则会生成联合概率。
个案选择规则。
如果要一次在一个阶段构造样本,可以将个案选择规则保存早文本文件中。
个案选择规则对于构造后续阶段的子框架是非常有用的。
STEP5 完成抽样向导这是最后一步,保存计划文件并抽取样本,或者将选择内容粘贴到语法编辑器窗口中。
在对现有计划文件中的阶段进行更改时,可以将已编辑的计划另存为新文件或覆盖现有文件。
如果添加阶段而不更改现有阶段,则向导将自动覆盖现有计划文件。
如果要将计划保存为新文件,要选择将向导生成的语法粘贴到语法窗口,并在语法命令中更改文件名。
如图4-17如果要修改现有的样本计划可以如下操作:从菜单中选择分析→复杂样本→选择样本…。
选择编辑样本设计,并选择要编辑的计划文件。
单击下一步使用向导继续。
在计划摘要步骤中复查抽样计划,然后单击下一步。
后续步骤与新设计大体相同。
浏览到完成步骤,为编辑过的计划文件指定新名称,或选择覆盖现有的计划文件。
根据自己的需要,还可以执行以下操作:指定已进行抽样的阶段。
从计划中删除某些阶段。
见下图4-18在这一步骤中,可以复查抽样计划,确定已进行了抽样的阶段。
如果编辑抽样计划,还可以从计划中删除阶段。
以前抽样的阶段。
要扩展抽样框架不可以,必须一次在一个阶段执行多阶段抽样设计。
从下拉列表中选择那些阶段已经进行了抽样。
所有执行过的阶段都是锁定的;它们在抽取样本选择项步骤不可用,并且不能在编辑计划时更改。
删除阶段。
可以从多阶段设计中删除阶段2和3。