抽样理论和方法整群抽样共38页
- 格式:ppt
- 大小:8.60 MB
- 文档页数:38
(抽样检验)第七章整群抽样第七章整群抽样第壹节整群抽样概述壹、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取壹部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
如果总体中的单元能够分成多级,则能够对前几级单元采用多阶抽样,而在最后壹阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。
本章只讨论单级整群抽样。
设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。
当诸Mi都相等时,称为等群;否则,称为不等群。
采用整群抽样的俩个理由:-抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;-从总体中直接抽选个体在实际中且不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
整群抽样包括俩步:首先,总体被分为群;然后,在总体中抽取群的样本且访问群中的所有单元。
如果总体单元是自然分成组或群的,创建壹个这种关于群的抽样框且对它们进行抽样比创建总体中所有单元的名录框更为容易。
或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而能够创建地域框。
群的抽取能够采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。
二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。
同分层抽样壹样,整群抽样的前提是先要对总体进行分群。
关于群的划分,有俩个问题:壹是如何定义群,即当群且非是壹个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。
这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。
而整群抽样只是在各群之间抽取壹部分群进行调查,且在抽中的群内作全面调查。
第七章整群抽样第一节整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取一部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
如果总体中的单元可以分成多级,则可以对前几级单元采用多阶抽样,而在最后一阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。
本章只讨论单级整群抽样。
设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。
当诸Mi都相等时,称为等群;否则,称为不等群。
采用整群抽样的两个理由:- 抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;- 从总体中直接抽选个体在实际中并不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
整群抽样包括两步:首先,总体被分为群;然后,在总体中抽取群的样本并访问群中的所有单元。
如果总体单元是自然分成组或群的,创建一个这种关于群的抽样框并对它们进行抽样比创建总体中所有单元的名录框更为容易。
或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而可以创建地域框。
群的抽取可以采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。
二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。
同分层抽样一样,整群抽样的前提是先要对总体进行分群。
关于群的划分,有两个问题:一是如何定义群,即当群并非是一个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。
这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。
而整群抽样只是在各群之间抽取一部分群进行调查,并在抽中的群内作全面调查。
因此,群间差异的大小直接影响到抽样误差的大小,而群内差异的大小则不影响抽样误差。
抽样理论及方法一、抽样的概念:1.为什么要抽样?为了保证进厂原物料及生产的半成品质量,就要对产品的一些指标做检验,其中最理想的检验方法是全检,即对所有样品逐个进行检验。
但是在现代化的大生产中,全检有许多缺点:1)成本高;2)可能导致对检验工作完整性的错误保证;3)对生产出的产品来说是筛选;4)可能导致接收若干不合格的或有缺陷的原材料;5)可能导致拒收若干满意的材料;6)可能是不切实际的:即当需要破坏性的试验时。
而抽样可以避免以上缺点,使检验更具科学性,合理性,可操作性。
2.抽样的概念:抽样指从总体中抽出样本的过程。
抽样的目的是通过对样品分析来推断总体的情况,为了使样本具有代表性,一定要用随机抽样的方法获得样本。
所谓随机抽样是指总体中的每一只产品被抽中的机会都应一样,不能挑选,不能带有主观意识。
二、抽样方法:1.计量值型抽样方法:计量值型抽样方法是频数分布的应用。
确定一个标准的频率分布的样本含量,然后从批中按此样本含量进行抽取样本。
测量值可记录在标记卡上。
有时候样含量是有弹性的。
如果该批产品的批的一张适当的,足够的分布图形在标记卡中已经出现了,就可以停止抽取样本,不必按照规定的样本含量来抽取。
频率分布图的结果只需要和公差界限进行目视比较作为决定接收或拒收的依据。
有时则应该计算分布三倍标准偏差界限,并且和公差界限作比较,以此做为依据,接收或拒收该批。
计量抽样可分为:单侧上限抽验方案;单侧下限抽验方案;双侧抽样方案。
2.计数值型抽样方法:计数值型抽样方法是在设定一定的可接收允收水平条件下,通过批量的大小确定抽取样本量。
经检测样本中可接收或拒收的个数,来判定该批是否合格。
例:在已知批和可接收的允收的最小不合格数时可接收。
如不合格数在最小和最大允许的不合格数之间,应彩第二样本,来判断批接收或拒收。
此时,判定标准也以第二样本的最小和最大的不合格数进行判定。
三、抽样水准及判定:1.基本概念:1.1单位产品:为了实施抽样检查的需要而划分的基本单位.如:1包面、1碗面、1个粉包、1个PSP碗、1个纸箱等。
(标准抽样检验)第七章整群抽样第七章整群抽样第一节整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取一部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
如果总体中的单元可以分成多级,则可以对前几级单元采用多阶抽样,而在最后一阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。
本章只讨论单级整群抽样。
设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。
当诸Mi都相等时,称为等群;否则,称为不等群。
采用整群抽样的两个理由:-抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;-从总体中直接抽选个体在实际中并不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
整群抽样包括两步:首先,总体被分为群;然后,在总体中抽取群的样本并访问群中的所有单元。
如果总体单元是自然分成组或群的,创建一个这种关于群的抽样框并对它们进行抽样比创建总体中所有单元的名录框更为容易。
或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而可以创建地域框。
群的抽取可以采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。
二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。
同分层抽样一样,整群抽样的前提是先要对总体进行分群。
关于群的划分,有两个问题:一是如何定义群,即当群并非是一个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。
这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。
而整群抽样只是在各群之间抽取一部分群进行调查,并在抽中的群内作全面调查。
第六章 整群抽样一、作业要求:对整群抽样的复习资料整理 二、小组成员:三、作业内容:关于整群抽样的概念、估计量的构造以及群内相关系数的构造及证明,并附有例题。
整群抽样的概念、估计量的构造整群抽样的概念若总体可分为N 个初级单元(称为群),每个初级单元包含若干次级单元。
按照某种方式从总体中抽取n 个初级单元,对这些单元中所有次级单元全部进行调查。
这种抽样方法称为整群抽样。
应用整群抽样时,要求各群有较好的代表性,即群内各单位的差异要大,群间差异要小。
整群抽样的特点1) 抽样框的编制简单 2) 实施便利,节省费用 3) 抽样误差相对比较大些整群抽样的研究(从目标量的估计方面)第一种途径:将整群抽样看作二阶抽样,第二级的组内抽样为普查。
因而组内估计量有i i G g =,而相应的均方偏差02=i σ。
第二种途径:将进行普查的单元看作基本单元,单级对}{KG G G ,...,,21进行抽样调查。
整群抽样估计量的构造现在将整群抽样看作是二阶抽样的特例,在第一阶抽样后,对抽中的第一阶样本单元进行普查。
假定第一阶抽中的号码为k θθ,...,1,在i θ第一阶样本单元普查到的指标数为{}ii i N Y Yθθ,...,1。
⑴ 对简单随机抽样的整群抽样(第一阶段采用简单随机抽样),对总体总数Y 的估计有:① Y 的无偏估计:∑∑===k Nj C S E iY k Y 1i 1j ^i K θθ② CSEY ˆ的均方偏差: ∑∑==⎪⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛=⎪⎭⎫ ⎝⎛K1i 21j 2^K -1-K 1K -1K i N ij CSE Y Y k k Y V ③)ˆ(CSEY V 的一个无偏估计: 2112)ˆ(11)1()ˆ(∑∑==---=ki CSE N j jCSE K Y Y k K k kK Y v ji i θθ◆第一阶段采用简单随机抽样,第二阶段为普查Yˆ ∑=k i i Y k K 11θ ∑∑==k i Nj j iiY k K 11θθ()CSEY V ˆ = 2211w S K k k K ⎪⎭⎫ ⎝⎛- = 21121111∑∑==⎪⎪⎭⎫ ⎝⎛--⎪⎭⎫ ⎝⎛-K i N j ij i K Y Y K K k k K()CSEY v ˆ = 2211w s K k k K ⎪⎭⎫ ⎝⎛- = 2112ˆ1111∑∑==⎪⎪⎭⎫ ⎝⎛--⎪⎭⎫ ⎝⎛-ki N j CSE j i iK Y Y k K k k K θθ第一阶段简单随第二阶段普查 目标量与估计量相等 简单随抽样部分总量估计组内方差样本方差⑵ 对有放回PPS 整群抽样的整群抽样(第一阶段采用PPS ),对总体总数Y 的估计有:① Y 的无偏估计:∑∑===k Nj CPPSi i Y p k Y 1i 1j ^)(11i θθθ ② CPPS Y ˆ的均方偏差:∑∑==⎪⎪⎭⎫⎝⎛=⎪⎭⎫ ⎝⎛K 1i 21j ^Y -11iN ij ii CPPS Y p p k Y V③)ˆ(CSEY V 的一个无偏估计: ∑∑==--=ki N j C P P S jC P P SiiiY Y p k k Y v 121)ˆ1()1(1)ˆ(θθθ◆第一阶段采用有放回PPS 抽样,第二阶段为普查Y ˆ ∑=k i i i g p k 111θθ ∑∑==kNj i i Y p k 1i 1j )(11i θθθ21K1i 21j ^11Y -11i Ki iN ij ii CPPS p KY p p k Y V iσ∑∑∑===+⎪⎪⎭⎫ ⎝⎛=⎪⎭⎫ ⎝⎛=∑∑==⎪⎪⎭⎫⎝⎛K 1i 21j Y -11iN ij ii Y p p k∑=⎪⎪⎭⎫ ⎝⎛--⨯=ki CPPS i CPPSY p g k k Y v i 12ˆ)1(11)ˆ(θ=211ˆ1)1(1∑∑==⎪⎪⎭⎫⎝⎛--k i N j CPPS j ii i Y Y p k k θθθ第一阶段有放回PPS 抽样 第二阶段普查 普查02=i σ第一阶段有效放回PPS 抽样个体总量有放回PPS 抽样部分有关符号的涵义: 总体样本第i 群的个体均值NY Y ii =群均值KYY Ki i∑==1个体均值NYY =方差∑∑==--=K i Nj ij Y Y KN S 1122)(11群间方差212)(1Y Y K N S Ki i b --=∑=群内方差2112)()1(1∑∑==--=K i Nj i ij Y y N K S ωNy y ii =kyy ki i∑==1Ny y =2112)(11y y kN s k i Nj ij --=∑∑== 212)(1y y k N s ki i b--=∑= 2112)()1(1i K i Nj ij y y N k s --=∑∑==ω K 为总体群数;N 为各群所含次级单元数;ij y 为第i 群中第j 个次级单元的观则值;),,...3,2,1;,...,3,2,1(N j K i ==KN 为总体所含次级单元总数;kN 为样本所含次级单元总数;整群抽样群内相关系数1、整群抽样群内相关系数的计算公式:其中:k 为第一级抽样单元的总数; i 为代表第i 个第一级抽样单元;i N 为第i 个第一级抽样单元内的第二级抽样单元的总数;Y 为所有抽样单元的平均值;ij Y 代表第i 个第一级抽样单元内的第j 个第二级抽样单元。