当前位置:文档之家› (抽样检验)第四章抽样理论和参数估计最全版

(抽样检验)第四章抽样理论和参数估计最全版

(抽样检验)第四章抽样理论和参数估计最全版
(抽样检验)第四章抽样理论和参数估计最全版

(抽样检验)第四章抽样理论和参数估计

第四章抽样理论和参数估计

知识引入

1970年美国首次进行征兵抽签,组织者将19-25岁的适龄青年按年龄分组,使用编号

001-366的等重量塑料球,001代表1月1日出生者,031代表1月31日…,366代表12月31日。然后将所有塑料球放入滚筒中混合抽取号码,每组抽中号码对应生日的青年依次应征,直到人数足够为止。

之后,有记者指出此次抽签产生了严重的偏差,他们注意到,年末生的人似乎倾向于被抽到较前面的征兵顺序。其结果就是壹堆12月份生的人去了越南战场。后来,经过统计学家的分析,发现这种“偏差”确实存在;经过分析终于找到了原因,原来代表生日的号码塑料球是壹次按壹整个月份装入滚筒中混合的,加上又没有均匀混合;于是1月份的生日容易在滚筒底下,12月份的是最后才装进去,容易在上面。

在抽样术语中,经常能够听到“随机抽样”、“随机选择”这样的表述,“随机性”原则其实保证了总体中的每个个体被抽中的概率相等,因而被认为是保证各种抽签、选择过程公平、公正的壹个基本手段。上述抽样就没有保证这种随机性。

在本章中,我们仍会见到,作为推断的基础,我们直接研究的样本是否“得当”对研究总体十分关键,能够通过壹定的抽样设计制定科学、合理、公正的抽样方法。如上述随机性原则能够保证抽样能够使得样本和总体有相同的内部结构,也就是说有最大的可能使总体的某些特征在样本中得以再现。本章在介绍必要的抽样概念和抽样方法基础上,重点介绍抽样分布理论,且对参数估计进行简要介绍。

第一节抽样和常用抽样方法

壹、简单随机抽样

抽样(sampling)或取样,在整个研究过程中位于数据收集之前,恰当的抽样设计是保证样本代表性的关键环节,是利用样本对总体进行假设检验或参数估计的基础。抽样涉及到的壹些基本概念在绪论中均已介绍。壹个合理可行的抽样设计,壹方面要求针对调查或实验研究的具体情况选择壹种适宜抽样方法;另壹方面应该根据调查研究所要求的精确度及经费状况确定样本容量。

壹般所说的随机抽样,就是指简单随机抽样,它是最基本的抽样方法,适用范围广,最能体现随机性原则且原理简单。抽取时,总体中每个个体应独立地、等概率地被抽取。常用的实施方法有抽签法和随机数表法。

1、抽签法:是把总体中的每壹个个体都编上号且做成签,充分混合后从中随机抽取壹部分,这部分签所对应的个体就组成壹个样本。

2、随机数表法:所谓随机数表或乱码表,是由壹些任意的数毫无规律地排列而的数表。教材附表17即是壹万个数字的随机数表。

随机数表的用法

许多计算机软件都能够自动生成随机数字。这里介绍教材附录17中乱码表的用法:首先对总体中所有个体依次编号,接着从表中任壹位置(任意行列交叉处)开始,依次往下找足你所需要的随机数(均为5位),以这些随机数为编号的个体即组成壹个样本。在查找随机数时,有俩点要注意,壹是总体容量是几位数,就从表中随机数末尾截取相应位数(因而最多能够截取4位数,抽取9999个)。如总体容量为500,则能够见表中数据的末尾三位数,且依次往下找;二是找到的数字若超过总体的容量范围,则跳过,比如总体容量为500,要

求抽取30个,则设定任意起始点往下找,找到壹个数字末尾三位为678,则跳过,见到壹个098,则表示编号098号被抽中,…,直到找满30个为止。

当然这俩种方法都是针对有限总体的,在实际当中的无限总体能够采用其他方法来抽样。简单随机抽样从理论上说是最符合随机性原则,可是这种方法在实际应用时,存在着壹些不足:首先,对大总体进行编号是相当困难的;其次,由于完全采用随机性,实际抽取的那壹个样本可能不具备总体本应该有的壹些特性。

另外,对于大总体在制签或查表时都是相当困难的。对于已有顺序编号的大总体,实际当中常常采用等距抽样简洁地实现。等距抽样也称系统抽样。顾名思义,它是按照抽样比例(样本容量和总体容量之比)确定抽样间距(抽样比例的倒数),然后从任意起点间隔抽样间距逐个获得样本中的个体。如壹总体有5000个,要求抽取壹个500人组成样本,即抽样比例为10%,则从任意位置开始(假设总体中所有个体均已编号,且壹般地假设从10以内开始),连续抽取a、a+10、a+20、…、a+4990共500个编号个体作为样本。

二、分层抽样

分层抽样是事先按总体已有的某些特征,将总体分成几个不同的部分,每壹部分叫壹层,再分别在每壹层中随机抽样。这种方法充分利用了总体的已有信息,因而是壹种非常实用的抽样方法。

对于壹个总体如何分层,分多少层,要视具体情况而定。壹个总的原则是,各层内个体在该特征上的差异要少,而层和层之间的差异要越大越好。比如说,对大学生能够按其学校是壹流大学、重点大学、壹般大学来分层。对于复杂问题仍能够按几个分层标准来分层。如韦克

斯勒幼儿智力量表在制定常模时,就按年龄、性别、种族、地区、家长职业和城市农村等六个因素来分层,使得样本中各种搭配下的人数比例都和总体尽量接近。

分层抽样在具体实施时,又根据是否知道各层内标准差分成俩种办法:

按各层人数比例分配。这是在各层内标准差不知道时的分配方式,即让样本中各层人数的比例和总体中各层人数的比例相同。

最佳分配。这是在已知各层内标准差时的分配方式,它是按标准差大小和总体中各层人数比例共同来确定最终样本中各层人数的比例。任意壹层中要抽取的人数可表示为:

其中N表示总体容量,n表示样本容量,i表示第i层。

确定了各层内的抽取人数,每层内的抽取可采用简单随机抽样法进行。

三、俩阶段抽样

俩阶段抽样也称为分群抽样,首先是将总体分成若干群,从中随机选出壹些群,这是第壹阶段抽样;再从被选出的群中进行随机抽样,这是第二阶段抽样。这里分群的原则正好和分层抽样中分层的原则相反,要求各群内个体之间的差异尽量地大,而各群之间就没多大的差异。比如要进行壹个全国范围内生活消费方面的调查,能够按大城市进行分群,显然各大城市内的居民千差万别,而各个城市之间则相差无几,因此不必选取所有的大城市,能够只从中选择壹部分,然后再在这些城市进行抽样。

在壹个复杂的抽样设计中,往往可能将分层抽样抽样和分群抽样反复应用,最终才得到所要的样本。如上面的例子中,要在壹个大城市里选取壹部分居民,也不是件容易的事,这时可再分群或分层,直到便于抽样时为止。

四、样本容量的确定

样本容量的大小对统计推断非常重要。样本容量过小,会影响样本的代表性,使抽样误差增大而降低了统计推断的精确性;而样本容量过大,虽然减小了抽样误差,但可能增大过失误差,且增大经费开支。另外,样本容量和抽样误差之间且不存在直线关系,随着样本容量的增大,抽样误差减小的速度越来越慢。

对于样本容量的确定受到很多因素的影响,也有很多相应的计算公式,这里不壹壹介绍。教材中介绍了对样本均值进行推断时利用最大允许抽样误差计算样本容量的方法。所谓“最大允许抽样误差”是指某壹总体参数和其点估计(抽样所得的统计量)之间的差异在实际中所能接受的最大范围。比如,对于总体均值μ,它的点估计是,那么在实际中用来估计μ时,研究者所能接受的最大范围就称为最大允许抽样误差,壹般记为d。确定样本容量的目的就是使抽样的误差在研究者所能接受的的范围以内,因此样本容量和d是有直接关系。根据下面的抽样分布知识,能够得知:

第二节抽样分布理论

壹、为什么要了解抽样分布

推断统计的核心思想是从特殊到壹般,从部分到全体,即用样本统计量来推断总体参数。然而,统计推断和直接推断的本质区别在于,后者往往不会关心样本和总体的差异,而直接根据统计量来下结论;这会产生很多偏差。而统计推断则依据抽样分布理论进行推断,它用概率的形式描绘出样本统计量在无限次抽样(在无限总体中总能够得到无限多个容量有限的样本)中的分布规律,从而帮助我们判断壹次抽样结果的意义。

以壹个有限总体抽样的例子来说明抽样过程。

某班25名同学的某科成绩,它就是要研究的总体:

为了较快地估计该班该课程的平均成绩(总体参数),从中有放回地抽取5名学生(即抽取壹个学生的成绩登记后再放回去抽取下壹个,所以已抽取的可能在后面再次被抽取到),用他们的平均成绩(样本统计量)来反映总的平均情况(实际中,直接对25个数据求平均即可,这里以具体数据说明抽样过程,想象这里的总体为无限容量)。下表列出了壹种可能的抽样情况:

这里只抽取了3个样本,但可见出每个样本的平均数都和总体均值81.5(实际情况中总体参数往往未知)有些差异,第壹个样本显然比总体均值大多了。如何判断哪个样本统计量更具有代表性(总体参数未知时),这就需要了解样本平均数的分布规律,以便更好地对总体均值进行估计或推断。

从上面的例子能够见出抽样的实质就是对总体进行n次重复试验或n次重复观察,而每壹次试验或观察都是相互独立的(有放回抽样),即抽样问题就是研究n个“独立同分布”的随机变量的函数问题。这里“独立”是指n次重复试验互不影响,即各样本独立;“同分布”是这n个随机变量都从同壹总体取值。所以对于用随机变量X表示的总体,常常用(X1,X2,……,Xn)来表示它的壹个容量为n的样本。注意,这里的每个Xi作为X的壹次观测值本身也是随机变量。

二、基本随机变量分布和抽样分布

壹般的随机变量概率分布可称为基本随机变量分布,但上述我们要研究的是样本统计量的概率分布。注意到,根据上述n个独立同分布随机变量计算而来的样本统计量本身也是随机变量,则它们的概率分布就称为抽样分布,即样本统计量或基本随机变量函数的理论分布。根据样本统计量的不同,可区分样本均值的抽样分布、样本方差的抽样分布、样本相关系数的

抽样分布、比例的抽样分布等。另外,从分布形态上见,常见的抽样分布主要包括是正态分布、T分布、χ2分布、F分布等,将在后文陆续介绍。

三、抽样分布理论

抽样分布理论是整个推断统计的理论基础,对它们的证明不用理会,只需掌握这些结论及其应用条件。

假设某壹个用随机变量X表示的抽样母总体的均值为μ,方差为σ2,从总体中抽取容量为n 的样本,则有如下结论:

(1)壹切可能样本的平均数的均值(期望)等于母总体的均值,表示为:EX=μ

(2)壹切可能样本的平均数的方差等于母总体方差的n分之壹,表示为:DX=σ2/n

因此样本均值分布的标准差等于母总体标准差的分之壹,称其为标准误(SE),即SE=σ/。(3)壹切可能样本的方差的均值(期望)等于母总体方差的n分之n-1,表示为:

ES2=(n-1)σ2/n

注意之上结论都没有要求总体分布呈正态,所以对任意总体均有这些结论。

之前已经谈到中心极限定理(见第三章第三节),壹般而言,抽样分布有如下结论:(1)若母总体呈正态分布,壹切可能样本的均值分布也是正态分布,表示为:

X~N(μ,σ2),则~N(μ,σ2/n)

(2)若母总体不呈正态分布,只要样本容量n足够大,则壹切可能样本的均值分布趋近正态分布,表示为:

X~?,当n->∞时,~N(μ,σ2/n)

(3)若母总体服从正态分布,则壹切可能样本的方差服从χ2分布,表示为:

X~N(μ,σ2),则(n-1)/σ2~χ2(n-1)

(4)母总体服从正态分布的俩样本方差之比服从F分布,表示为:

X1~N(μ1,σ21),X2~N(μ2,σ22),

(5)样本相关系数的抽样分布:

四、χ2分布

若n个相互独立的随机变量X1,X2,…,X n,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个随机变量的平方和∑X2i构成壹新的随机变量,其分布规律称为χ2(n)分布,其中参数n称为自由度,自由度不同就是另壹个χ2分布,正如正态分布中均值或方差不同就是另壹个正态分布壹样。χ2分布的概率密度函数比较复杂,这里不再给出。

自由度

许多统计量的抽样分布都有自由度(degreeoffreedom)这个参数,所谓自由度即统计量中相互独立的随机变量的个数,这些随机变量的取值都能自由变动。故若为同壹个标准正态总

体中抽取的n个独立随机变量,其平方和之和构成的X2统计量自由度为n;但若标准化时,母总体均值未知,用样本均值替代之,则该统计量中包含了壹个约束条件,即这n个随机变量的均值要等于,从而使得统计量中真正自由变动的随机变量个数成为n-1(剩下的壹个由这

n-1个即可确定),即其自由度变为n-1。

卡方分布是由正态分布构造而成的壹个新的分布。其图形始终在第壹象限内,呈正偏态,随着参数n的增大,χ2分布趋近于正态分布。

χ2分布的均值为自由度n,方差为2倍的自由度(2n)。从χ2分布的均值和方差能够见出,随着自由度n的增大,χ2分布向正无穷方向延伸(因为均值n越来越大),分布曲线也越来越低阔(因为方差2n越来越大)。χ2分布具有可加性:若有K个服从χ2分布且相互独立的随机变量,则它们之和仍是χ2分布,新的χ2分布的自由度为原来K个χ2分布自由度之和。表示为:

χ2分布是连续分布,但有些离散分布也服从χ2分布,尤其在次数统计上非常广泛,这个应用将放在第八章介绍。

实际上,对从任意壹个正态总体中抽得的随机变量样本,其标准化后的Z分数之平方和也服从自由度为n的χ2分布。若母总体的均值未知,可使用样本均值代替,则得到的新的统计量服从自由度为n-1的χ2分布。

上面这个公式在应用中更为常见;从统计量的构造可见出,它主要是采用“比商”的方式,将样本方差和壹个已知的总体方差相比从而对该样本方差所来源的总体方差进行推断。五、T分布

T分布是由正态分布和卡方分布构造而成的壹个新的分布。设X,Y为相互独立的随机变量,X服从标准正态分布,Y服从χ2(n)分布,则统计量t=X/√Y/n服从T(n),其中参数n称为自由度。

T分布的图象呈单峰对称状(以Y轴为对称轴),非常接近标准正态分布,峰部比标准正分布低,俩端比标准正态分布高,当自由度n很大时(n>30,120),T分布和标准正分布已无法区分,所以T分布常常用于样本容量小于30的小样本,故也称T分布理论为小样本理论。

壹般情况下,T分布的均值为0,方差随自由度n的增大从大于1的方向越来越接近1,更准确的表示是:

和卡方分布壹样,T分布在实际应用中也有壹个更常用的构造。前面的正态抽样分布中,我们知道均值的抽样分布在很多时候是正态或近似正态分布,即便母总体的分布不是标准正态分布,也可通过标准化过程进行转化。即总体分布明确,参数μ和σ2给出时:

但如果母总体参数σ2不知道,则可用样本标准差来代替之,则此时新的统计量不再服从标准正态分布,而是壹个新的分布,即自由度为n-1的T分布。

注意在总体方差未知时,样本平均数本身仍然服从正态分布,服从T分布的是包含样本均值的类似于Z的新统计量。根据T分布的原始构造,这个结论能够这样来理解:

六、F分布

F分布是由俩个卡方分布构造而成的壹个新的分布。若随机变量,,则统计量

其中参数n1、n2是俩个自由度。和卡方分布壹样,F分布也在第壹象限内,呈正偏态,随着俩个自由度的的增大,趋近于正态分布。不过其趋于正态分布的方式和卡方分布不同。

壹般情况下,F分布的均值接近1,方差壹般都小于1,且随俩自由度的增大方差越来越小,即图形越来越收缩。更准确的公式是:

F分布也有壹个更常用的构造,即俩个服从自由度为样本容量减去1的卡方分布的比值:七、抽样分布的查表

对于这些抽样分布的应用,最重要的是知道如何在推断统计中查相应的概率分布表。在标准正态分布中,由于曲线形状固定,因此在半边存在统计量Z值(分布的横坐标)和中央概率(当然也能够是尾端概率)的壹壹对应关系,它们之间可通过查表进行换算。但卡方分布和T分布都有壹个自由度参数,自由度不同,曲线形状就不同;因而要对每个常用自由度编制壹个如同标准正态分布那样详细的统计量(χ2或T)和P的对应表会有很大篇幅。

因而,附表2和附表11的这俩种表都采用仅列出壹些常用自由度下若干最常用概率和统计量间的对应表,而且概率都规定是尾端概率;其中T分布表是采用分布在俩个尾端的所谓“双侧概率”和统计量对应;卡方分布是采用右侧尾端概率和统计量对应。最后,F分布由于有俩个自由度,因而在壹个表中所能列出的F统计量和概率的对应更少,附表3、4中行、列分别为俩个自由度(根据实际需要,分母自由度变化范围更大)占用,则只能提供俩个最基本的概率和统计量相对应,且这概率也是尾端概率。注意,通常附表4的单(右)侧概率分布表更为常用。

举几个简单例子说明如何查表:

上图4-2所示的单侧概率χ20.05(7)=14.1的查表方法是,在第壹列找到自由度7这壹行,在第壹行中找到概率0.05这壹列,行列的交叉处即是14.1。这个对应关系意味着在自由度7时,χ2=14.1所割出的χ2分布曲线右侧概率为0.05。反过来也是如此。上图4-3所示T分布中,查T0.05/2(8)对应的统计量值,在第壹列找到自由度8这壹行,在第壹行中找到概率0.05这壹列,行列的交叉处即是2.306。该对应关系意味着在自由度8时,T=2.306以及其所对称的-2.306所割出的双侧尾端概率为0.05。此时,若只使用单侧概率(表的下端),则显然T=2.306割出的单侧尾端概率就只有0.05的1/2。

下图分别是F分布双侧和单侧表,查表方法不再赘述,需要注意的是,F分布双侧表中,尾端概率各为α/2时,其对应统计量且不具有相反关系,而是互为倒数。

双侧概率表(附表3) 单侧

概率

(附

4)

第三节参数估计

壹般情况下,总体的情况是不清楚的,即总体的分布及总体的参数都可能未知,而参数估计就是解决总体的参数未知时如何通过样本统计量来估计总体参数的问题。

参数估计有俩种方法,壹是直接用壹个样本统计量来作为总体参数的估计值,如用样本平均数估计总体均值,用样本标准差S n-1估计总体标准差,这种参数估计称为点估计;另壹种是根据抽样分布理论,给出壹个以样本统计量为中心的壹个可能范围作为总体参数取值范围的估计,且这种估计伴随着壹定的把握程度(概率),称为区间估计。当然,如果将点估计见成是区间估计的壹种特例,可认为参数估计实际上是在估计精确度和估计把握度之间进行权衡的结果,要追求精确度,估计的区间就要尽可能小,则此时把握度必然降低;反之,若区间写得较大,则估计的把握度就越大。

壹、点估计

点估计是用样本统计量来代替总体参数,壹个好的点估计应具备的如下条件:

无偏性。用多个样本的某壹统计量作为总体参数的估计值时,若这些样本统计量和总体参数的偏差平均为零,则用该统计量来代替总体参数具有无偏性。无偏性更精确的表述为:若样本的某个统计量的均值等于该被估计的总体参数,则该样本统计量是无偏的。

壹致性。当样本容量越来越大时,估计值能越来越接近它所估计的参数。

有效性。当总体参数不止壹个无偏估计时,其中方差最小者最有效。

充分性。若估计量反映了样本中每个数据的信息,则满足充分性。

根据这些条件,总体均值的点估计是样本平均数,总体方差的点估计是样本方差S2n-1,俩总体相关系数的点估计是从这俩总体中抽样的俩配对样本的相关系数。

二、区间估计

区间估计是给出包含总体参数的可能范围。根据正态分布理论和抽样分布理论可知,任壹样本的平均数落在总体均值左右1.96个标准差(指抽样分布的标准差)的范围内的概率为95%;则将此关系中总体均值反算回去,则任壹样本平均数左右1.96个标准差范围内包含总体均值的可能性为95%。这就是总体均值区间估计的大体思路。

根据小概率事件原理,上述以样本均值为中心,半径为1.96个标准误的区间“不包含”总体均值的概率只有(100-95)%,在壹次抽样中不会发生,可忽略不计。因此就把这个范围称为总体均值的95%置信区间,概率95%称为置信度,即区间估计的把握程度;剩下5%是基于这壹次抽样(也就是基于所得样本均值)构造出的置信区间未包含总体参数的可能性大小,即区间估计犯错误的概率,称为显著性水平,用α表示;小概率事件原理要求显著性水平不能超过5%。以下是壹些常用的区间估计。

1、总体均值的区间估计:

2、总体方差、标准差的区间估计:

阅读材料

电梯载重量

注意到每部电梯中都有类似这样的提示:

载重负荷上限1000公斤,限乘13人,或者1500公斤,限乘15人等。这样规定对于保证乘坐电梯时的安全非常重要。这样规定有什么养的统计学依据呢?能够用下面的例子做壹个演示性的说明。

假设壹个标准电梯的限载重量为1000公斤,准13人乘坐,已知人群体重的平均数和标准差分别为μ=53.5公斤,σ=6.04公斤。我们能够计算电梯因为超重发生事故的概率是多大(假设体重服从正态分布)。

利用人群体重的数据构造任意壹个13人电梯乘客团体平均体重的抽样分布。我们所要求的就是P()=P(Z>)=P(Z>14)。根据正态分布知识,Z分数取值在2.58之上的概率就已经不足0.5%,所以这个概率是壹个极小概率。换句话说,只要限乘人数不超过13人(假定每次都是13人乘坐是最多的情况),则他们的平均体重超过76.9(或总体重超过1000公斤载重负荷上限)的概率非常之小,以至于能够忽略不计。因而我们能够放心乘坐。

用计数抽样检验的基本原理之概率计算

用计数抽样检验的基本原理之概率计算 用计数抽样检验的基本原理之概率计算默认分类 2019-05-11 14:37:09 阅读80 评论1 字号:大中小订阅 引用 whxujq 的计数抽样检验的基本原理之概率计算 讨论:在批量为N的一批产品中,有不合格产品D个,现从中取出n个样本,我们来计算其中恰好有d个不合格品(d小于n)出现的概 率。 首先考虑,在D个不合格品中取出d个不合格品,共有多少种取法,实际上就是从D 个元素中取出d个元素组合的问题。共有 =D!/[d!(D-d)!]种取法。同样在N-D个合格品中取出n-d 个,其取法共有 =(N-D)!/[(n-d)!(N-D-n+d)!]种取法。 这样,在N个产品中取出n个样本,使其中恰好包含d个不合格品应共有种取法。 而在N个产品中取出n个样本(不论其不合格品多少)的取法应是:=N!/n!(N-n)!种取法。 因此,在N中抽取n个样本,使其中恰包含d个不合格品出现的 概率应为: 这就是超几何分布。 现在我们来看这样一个例子,在100件产品中,内有20件不合格品,从中随机抽取20件进行检验,我们来计算样本中恰有0,1,2,3, 4,5,6,…个不合格品出现的概率。 ①、没有不合格品,d=0 =[(100-20)!*(100-20)!]/[100!(100-40)!]≈0.0066 ②、只有一个不合格品,d=1 =[(20!)2*(80!)2]/[100!*(19!)2*61!]≈0.0433 ③、有二个不合格品,d=2

=[(20!)2*(80!)2]/[2*100!*(18!)2*62]!≈0.192 这样算下去可得: P(3)≈0.216,P(4)≈0.244,P(5)≈0.192, P(6)≈0.109,…,P(20)≈ 这是超几何分布的计算方法,也是理论的计算方法,在GB2828 中还有两种近似计算方法,即二项式分布计算方法和泊松分布计算方法,在设定一定 的近似条件后,都可以推导出来,这里不再赘述。 通过这一组数据,我们可以看到,样品中不合格数等于20的可能性微乎其微,而d=4即等于样本的平均不合格数的可能性最大,如果此时我们规定一个合格判定数Ac,就可以计算出该批产品在抽样方案 (n|Ac)时的接收概率(即被判为合格批的概率)。 1、什么叫接受概率:在抽样检验中,检查批被判定合格的可能性(大小)(概率值)为接受概率。用Pa(或LCP)表示。 2、接受概率的计算: 当一个抽样方案给定后,即n与Ac值给定后,批质量一定的批产品就会有一个固定 的被接受概率(判为合格),那么这个概率是怎样得 来的呢? 首先我们先回忆一下合格判定数的概念,Ac是作出批合格判断的样本所允许的最大不合格品数或不合格数,也就是说当样本中的不合格品数(或不合格数)d≤Ac时,判该批 合格,若d>Ac时,就判批不合格。 接着我们前面的讨论,可以知道,在批量为N的一批产品中,如不合格品数为D,从 中抽取n个样本,其中恰好有d个不合格品出现的概 率为: 这时,若d≤Ac,均判批产品合格,那么该批产品被判合格的总概率应该是样本中不 合格品d小于等于Ac的各值(d=1,2,3,…,Ac) 出现的概率的总和,即: Pa=P(0)+P(1)+P(2)+…+P(Ac) 用连加符号表示,即:

(抽样检验)抽样与参数估计最全版

(抽样检验)抽样与参数估 计

抽样和参数估计 推断统计:利用样本统计量对总体某些性质或数量特征进行推断。 从数据得到对现实世界的结论的过程就叫做统计推断(statisticalinference)。这个调查例子是估计总体参数(某种意见的比例)的壹个过程。 估计(estimation)是统计推断的重要内容之壹。统计推断的另壹个主要内容是本章第二节要介绍的假设检验(hypothesistesting)。 因此本节内容就是由样本数据对总体参数进行估计,即: 学习目标:了解抽样和抽样分布的基本概念 理解抽样分布和总体分布的关系 了解点估计的概念和估计量的优良标准 掌握总体均值、总体比例和总体方差的区间估计 第一节抽样和抽样分布 回顾相关概念:总体、个体和样本 抽样推断:从所研究的总体全部元素(单位)中抽取壹部分元素(单位)进行调查,且根据样本数据所提供的信息来推断总体的数量特征。 总体(Population):调查研究的事物或现象的全体参数 个体(Itemunit):组成总体的每个元素 样本(Sample):从总体中所抽取的部分个体统计量 样本容量(Samplesize):样本中所含个体的数量 壹般将样本单位数不少于三十个的样本称为大样本,样本单位数不到三十个的样本称为小样本。 壹、抽样方法及抽样分布 1、抽样方法

(1)、概率抽样:根据已知的概率选取样本 ①、简单随机抽样:完全随机地抽选样本,使得每壹个样本都有相同的机 会(概率)被抽中。 注意:在有限总体的简单随机抽样中,由抽样是否具有可重复性,又可分为重 复抽样和不重复抽样。而且,根据抽样中是否排序,所能抽到的样本个数往往不同。 ②、分层抽样:总体分成不同的“层”(类),然后在每壹层内进行抽样 ③、整群抽样:将壹组被调查者(群)作为壹个抽样单位 ④、等距抽样:在样本框中每隔壹定距离抽选壹个被调查者 (2)非概率抽样:不是完全按随机原则选取样本 ①、非随机抽样:由调查人员自由选取被调查者 ②、判断抽样:通过某些条件过滤来选择被调查者 (3)、配额抽样:选择壹群特定数目、满足特定条件的被调查者 2、抽样分布 壹般地,样本统计量的所有可能取值及其取值概率所形成的概率分布,统计上称为抽样分布(samplingdistribution)。 某个样本统计量(如均值、比例、方差等)的抽样分布,从理论上说就是在重复选取容量为n的样本时,由每壹个样本计算出的该统计量数值的相对频数分布或概率分布。 二、样本均值的抽样分布和中心极限定理 1、样本均值的抽样分布(壹个例子)

抽样定理

实验一抽样定理实验 一、实验目的 1、了解抽样定理在通信系统中的重要性 2、掌握自然抽样及平顶抽样的实现方法 3、理解低通采样定理的原理 4、理解实际的抽样系统 5、理解低通滤波器的幅频特性对抽样信号恢复的影响 6、理解低通滤波器的相频特性对抽样信号恢复的影响 7、理解平顶抽样产生孔径失真的原理 8、理解带通采样定理的原理 二、实验内容 1、验证低通采样定理原理 2、验证低通滤波器幅频特性对抽样信号恢复的影响 3、验证低通滤波器相频特性对抽样信号恢复的影响 4、验证带通抽样定理原理 5、验证孔径失真的原理

三、实验原理 抽样定理原理:一个频带限制在(0,H f)内的时间连续信号() m t,如 果以T≤H f21 秒的间隔对它进行等间隔抽样,则() m t将被所得到的抽样值完 全确定。(具体可参考《信号与系统》) 我们这样开展抽样定理实验:信号源产生的被抽样信号和抽样脉冲经抽样/保持电路输出抽样信号,抽样信号经过滤波器之后恢复出被抽样信号。抽样定理实验的原理框图如下: 被抽样信号 抽样脉冲 抽样恢复信号 图1抽样定理实验原理框图 被抽样信号抽样恢复信号 图2实际抽样系统 为了让学生能全面观察并理解抽样定理的实质,我们应该对被抽样信号进行精心的安排和考虑。在传统的抽样定理的实验中,我们用正弦波来作为被抽样信号是有局限性的,特别是相频特性对抽样信号恢复的影响的实验现象不能很好的展现出来,因此,这种方案放弃了。 另一种方案是采用较复杂的信号,但这种信号不便于观察,如错误!未找到引用源。所示:

被抽样信号抽样恢复后的信号 图3复杂信号抽样恢复前后对比 你能分辨错误!未找到引用源。中抽样恢复后信号的失真吗因此,我们选择了一种不是很复杂,但又包含多种频谱分量的信号:“3KHz正弦波”+“1KHz正弦波”,波形及频谱如所示: 图1被抽样信号波形及频谱示意图 对抽样脉冲信号的考虑 大家都知道,理想的抽样脉冲是一个无线窄的冲激信号,这样的信号在现实系统中是不存在的,实际的抽样脉冲信号总是有一定宽度的,很显

(抽样检验)抽样与检验最全版

(抽样检验)抽样与检验

抽样和检验 壹、抽样检验基本概念 1.在质量管理中,壹般有来料检验、过程检验、成品检验、出货检验四部分,每壹部分中都会有抽样计划、允许水准、具体的抽样方式、统计分析等工作。 2.基本概念 (1)批 各种产品,凡是具有相同的来源,且在相同的条件下生产所得到壹群相同规格的产品,可称为壹个批,这样的批也可给予壹个名字叫“制造批”。壹个制造批中的质量变异具有壹个分布,在抽样时应尽可能的使检验批的质量接近实际值,这样才可使抽验的结果正确,因此壹批可能根据需要能够区分为几个检验批,但必须注意避免将几个批合且为壹个检验批。 (2)检验批 在统计学中,能够称为母体或群体。 就是在各种批中,被选定用来做抽样检验的批,该批是根椐其整个批中量的大小,照抽样计划,抽出“小”批加以检验的壹个群体。通常检验批要根据允许水准来判定这个检验批是否允收。 (3)批量 是指每个检验批内产品的单位数据,在统计学中也可称为“母体数”,通常以“N”表示。 (4)样本 是指从检验批中所抽出的以壹个之上单位组成的产品,样本中的各个

样品均须随机,而且不考虑它的品质的好坏。样本中所含的产品单位的数目称为“样本数”或“样本大小”,通常以“n”表示,它壹定小于等批量数“N”。 (5)抽样检验 从双方约定的检验批中,根据批量大小,抽出不同数量的样本。将该样本以事先确定的检验方法加以检验,且将检验的结果和预先确定的要求或“品质标准”比较,以决定该批是否合格。在计数值中,是将样本中不良品的个数所抽样计划中允收不良品的个数比较,以判定该检验批是否允收。在计量值中,是将各样品检验结果加以统计分析,以平均值、离散度、综合指数的判定基准比较,以决定该检验批是否允收。 (6)合格判定数 判定壹批产品是否合格或不合格的基准不良个数称为合格判定数,通常以“C”(或AC)表示。 (7)缺陷 产品单位的品质特性不合乎双方所规定的规格、图样、说明或要求等称为缺陷,通常用“d”表示。如若是买卖的关系,缺点壹般可分为:(a)严重缺陷(Criticaldefect),凡有危及产品的使用或携带安全,或使产品的重要功能失效的缺陷;(b)主要缺陷(Majordefect),凡使产品使用性能不能达到所期望之目的,或显著减低其实用性能的缺陷;(c)次要缺陷(Minordefect),实际上不影响产品的使用功能或引起较大抱怨的缺陷。

抽样原理+实务

第一节抽样检验的基本概念 一、基本概念 1.1 个体是可以对其进行一系列观测的一件具体的或一般的物体或可以对其进行一系列观测的一定数量的物质或一个定性或定量的观测值. 1.2批:在一致条件下生产或按规定方式汇总起来的一定数量的个体叫”批”.批中包括的个体数叫批量.一次交付的个体集叫交付批. 1.3样本:是取自总体中的一个或多个个体,用于提供关于总体的信息,并作为可能对总体(或产生总体的过程)进行某种判定的的基础.样本中所包含的个体数目叫样本量. 1.3随机抽样 从包含N个个体的总体中抽取n个个体,使包含有n个个体的所有右能的组合被抽取的概率都相等的抽样叫简单随机抽样.例如设总体包含A、B、C、D、E共五个个体.今要从其中抽取3个个体.则有10种可能. 随机抽样的方法大体有三种.一种是我国古代的抓阄,缺点是做纸团不方便;二是由计算机数学创始人冯.诺依曼最早建议,后来由其他学者发展的用计算机程序产生随机数.但由于这种随机数是程序按一定规律产生的,故叫伪随机数.第三种就是日本首倡的正20面体子. 二、抽样检验的概念 1、抽样检验的概念:是指从交验的一批产品(批量为N)中,抽取一个样本(由n个单位产品组成)进行检验,从而对批产品质量作用推断的过程。 2、抽样检验的目的:是“通过样本推断总体”,而其期望则在于“用尽量少的样本量 来尽可能准确地判定总体(批)的质量”。欲达到这一目的和期望,传统的“百分比抽样”是不科学、不合理的。通过多年来的理论研究和实践证明,只有采用“统计抽样检验”才能保证科学、合理地实现这一目的和期望。 3、抽样检验的步骤 a)抽样:需要研究的是怎样抽和抽多少的问题。 b)检验:是在统计抽样检验理论的指导下,采用具有一定测量能力的设备和正确 的方法进行检验。 c)推断:是用对样本的检验结果来推断总体(批)的质量水平。 其中抽样和推断状况构成了抽样方案,即抽多少和怎样推断。 二、统计抽样检验

(抽样检验)抽样原理+实务最全版

博迪管理顾部有眼公司抽样原理 (抽样检验)抽样原理+实 务

第壹节抽样检验的基本概念 壹、基本概念 1.1个体是能够对其进行壹系列观测的壹件具体的或壹般的物体或能够对其进行壹系列观测的壹定数量的物质或壹个定性或定量的观测值. 1.2批:在壹致条件下生产或按规定方式汇总起来的壹定数量的个体叫”批”.批中包括的个体数叫批量.壹次交付的个体集叫交付批. 1.3样本:是取自总体中的壹个或多个个体,用于提供关于总体的信息,且作为可能对总体(或产生总体的过程)进行某种判定的的基础.样本中所包含的个体数目叫样本量. 1.3随机抽样 从包含N个个体的总体中抽取n个个体,使包含有n个个体的所有右能的组合被抽取的概率都相等的抽样叫简单随机抽样.例如设总体包含A、B、C、D、E共五个个体.今要从其中抽取3个个体.则有10种可能. 随机抽样的方法大体有三种.壹种是我国古代的抓阄,缺点是做纸团不方便;二是由计算机数学创始人冯.诺依曼最早建议,后来由其他学者发展的用计算机程序产生随机数.但由于这种随机数是程序按壹定规律产生的,故叫伪随机数.第三种就是日本首倡的正20面体子. 二、抽样检验的概念 1、抽样检验的概念:是指从交验的壹批产品(批量为N)中,抽取壹个样本(由n个单位产品组成)进行检验,从而对批产品质量作用推断的过程。 2、抽样检验的目的:是“通过样本推断总体”,而其期望则在于“用尽量少的样 本量来尽可能准确地判定总体(批)的质量”。欲达到这壹目的和期望,传统

的“百分比抽样”是不科学、不合理的。通过多年来的理论研究和实践证明,只有采用“统计抽样检验”才能保证科学、合理地实现这壹目的和期望。 3、抽样检验的步骤 a)抽样:需要研究的是怎样抽和抽多少的问题。 b)检验:是在统计抽样检验理论的指导下,采用具有壹定测量能力的设备 和正确的方法进行检验。 c)推断:是用对样本的检验结果来推断总体(批)的质量水平。 其中抽样和推断状况构成了抽样方案,即抽多少和怎样推断。 二、统计抽样检验 1、统计抽样检验的概念 1)统计抽样检验:是指抽样方案完全由统计技术所确定的抽样检验。 2)统计抽样检验的优越性,体当下能够用尽可能低的检验费用(经济性),有效地保证产品质量水平(科学性),且对产品质量检验或评估结论可靠 (可靠性),而其实施又很简便(可用性)。 3)统计抽样理论是美国贝尔实验室的道吉和罗明创始的,目前在美国、日本、加拿大、瑞典等工业发达国家已行得到广泛应用,其应用领域已 深入到电子、机械、军工、建材、轻工、化工、航天、铁路、交通、邮 电、农业、商业、外贸等国民经济的各个部门。 4)我国在统计抽样检验方面的研究起步较晚,60年代只有少数先进企业采用。十壹届三中全会确定了我国改革开放方针,由于扩大对外贸易 的需要,在检验工作中必须和国际接轨,从而促进了对统计抽样理论的 研究和标准化。1981年我国制订了GB2828(逐批检验)、GB2829(周

(抽样检验)抽样与参数估计

第四章抽样与参数估计 推断统计:利用样本统计量对总体某些性质或数量特征进行推断。 从数据得到对现实世界的结论的过程就叫做统计推断(statistical inference)。这个调查例子是估计总体参数(某种意见的比例)的一个过程。 估计(estimation) 是统计推断的重要内容之一。统计推断的另一个主要内容是本章第二节要介绍的假设检验(hypothesis testing) 。 因此本节内容就是由样本数据对总体参数进行估计,即: 学习目标:了解抽样和抽样分布的基本概念 理解抽样分布与总体分布的关系 了解点估计的概念和估计量的优良标准 掌握总体均值、总体比例和总体方差的区间估计 第一节抽样与抽样分布 回顾相关概念:总体、个体和样本 抽样推断:从所研究的总体全部元素(单位)中抽取一部分元素(单位)进行调查,并根据样本数据所提供的信息来推断总体的数量特征。 总体(Population):调查研究的事物或现象的全体参数 个体(Item unit):组成总体的每个元素 样本(Sample):从总体中所抽取的部分个体统计量

样本容量(Sample size):样本中所含个体的数量 一般将样本单位数不少于三十个的样本称为大样本,样本单位数不到三十个的样本称为小样本。 一、抽样方法及抽样分布 1、抽样方法 (1)、概率抽样:根据已知的概率选取样本 ①、简单随机抽样:完全随机地抽选样本,使得每一个样本都有相同的机 会(概率)被抽中。 注意:在有限总体的简单随机抽样中,由抽样是否具有可重复性,又可分为重 复抽样与不重复抽样。而且,根据抽样中是否排序,所能抽到的样本个数往往不同。 ②、分层抽样:总体分成不同的“层”(类),然后在每一层内进行抽样 ③、整群抽样:将一组被调查者(群)作为一个抽样单位 ④、等距抽样:在样本框中每隔一定距离抽选一个被调查者 (2)非概率抽样:不是完全按随机原则选取样本 ①、非随机抽样:由调查人员自由选取被调查者 ②、判断抽样:通过某些条件过滤来选择被调查者 (3)、配额抽样:选择一群特定数目、满足特定条件的被调查者 2、抽样分布 一般地,样本统计量的所有可能取值及其取值概率所形成的概率分布,统计上称为抽样分布(sampling distribution)。 某个样本统计量(如均值、比例、方差等)的抽样分布,从理论上说就是在重复选取容量为n的样本时,由每一个样本计算出的该统计量数值的相对频数分布或概率分布。 二、样本均值的抽样分布与中心极限定理 1、样本均值的抽样分布(一个例子)

抽样检验的基本概念与分类(doc 12页)(完美版)

抽样与检验 一、抽样检验基本概念 1.在质量管理中,一般有来料检验、过程检验、成品检验、出货检验四部分,每一部分中都会有抽样计划、允许水准、具体的抽样方式、统计分析等工作。 2.基本概念 (1)批 各种产品,凡是具有相同的来源,且在相同的条件下生产所得到一群相同规格的产品,可称为一个批,这样的批也可给予一个名字叫“制造批”。一个制造批中的质量变异具有一个分布,在抽样时应尽可能的使检验批的质量接近实际值,这样才可使抽验的结果正确,因此一批可能根据需要可以区分为几个检验批,但必须注意避免将几个批合并为一个检验批。 (2)检验批 在统计学中,可以称为母体或群体。 就是在各种批中,被选定用来做抽样检验的批,该批是根椐其整个批中量的大小,照抽样计划,抽出“小”批加以检验的一个群体。通常检验批要根据允许水准来判定这个检验批是否允收。 (3)批量 是指每个检验批内产品的单位数据,在统计学中也可称为“母体数”,通常以“N”表示。 (4)样本

是指从检验批中所抽出的以一个以上单位组成的产品,样本中的各个样品均须随机,而且不考虑它的品质的好坏。样本中所含的产品单位的数目称为“样本数”或“样本大小”,通常以“n”表示,它一定小于等批量数“N”。 (5)抽样检验 从双方约定的检验批中,根据批量大小,抽出不同数量的样本。将该样本以事先确定的检验方法加以检验,并将检验的结果与预先确定的要求或“品质标准”比较,以决定该批是否合格。在计数值中,是将样本中不良品的个数所抽样计划中允收不良品的个数比较,以判定该检验批是否允收。在计量值中,是将各样品检验结果加以统计分析,以平均值、离散度、综合指数的判定基准比较,以决定该检验批是否允收。 (6)合格判定数 判定一批产品是否合格或不合格的基准不良个数称为合格判定数,通常以“C”(或AC)表示。 (7)缺陷 产品单位的品质特性不合乎双方所规定的规格、图样、说明或要求等称为缺陷,通常用“d”表示。如若是买卖的关系,缺点一般可分为:(a)严重缺陷(Critical defect),凡有危及产品的使用或携带安全,或使产品的重要功能失效的缺陷; (b)主要缺陷(Major defect),凡使产品使用性能不能达到所期望之目的,或显著减低其实用性能的缺陷; (c)次要缺陷(Minor defect),实际上不影响产品的使用功能或

(标准抽样检验)抽样检验方案

(标准抽样检验)抽样检 验方案

抽样检验方案 第四节抽样检验方案(大纲要求熟悉) 一、抽样检验的几个基本概念(基础知识) 1.抽样检验方案 是根据检验项目特性所确定的抽样数量、接受标准和方法。如在简单的计数值抽样检验方案中,主要是确定样本容量n和合格判定数,即允许不合格品件数c,记为方案(n,c)。 2.检验. 检验是对检验项目中的性能进行量测、检查、试验等,并将结果与标准规定要求进行比较,以确定每项性能是否合格所进行的活动。 3.检验批 4.批不合格品率 是指检验批中不合格品数占整个批量的比重。 5.过程平均批不合格品率 是指对k批产品首次检验得到的k个批不合格品率的平均数。 6.接受概率(又称批合格概率) 接受概率是根据规定的抽样检验方案将检验批判为合格而接受的概率。一个既定方案的接受概率是产品质量水平,即批不合格品率P的函数,用L(p)表示,检验批的不合格品率p越小,接受概率L(p)就越大。 二、抽样检验方案类型 (一)抽样检验方案的分类 (二)常用的抽样检验方案(大纲要求熟悉) 1.标准型抽样检验方案 (1)计数值标准型一次抽样检验方案 计数值标准型一次抽样检验方案是规定在一定样本容量n时的最高允许的批合格判定数c,记作(n,c),并在一次抽检后给出判断检验批是否合格的结论。c也可用Ac表示。c值一般为可接受的不合格品数,也可以是不合格品率,或者是可接受的每百单位缺陷数。若实际抽检时,检出不合格品数为d,则当: d≤c时,判定为合格批,接受该检验批;d>c定为不合格批,拒绝该检验批。 (2)计数值标准型二次抽样检验方案(以上两种标准型抽样检验程序见图7-16、7-17)

抽样检验原理和方法

抽样检验原理和方法 一、抽样检验的基础术语 ?单位产品 ? 1.单位产品划分: ?所谓单位产品,是指构成产品总体的基本单位。如一个螺丝钉、一双鞋等;但有些连续性产品不可以自然划分,如糖、味精、汽油等,其单位产品划分有相对任意性。 ? 2.单位产品缺陷: ?单位产品不符合规定技术要求的任何一点,即构成一个缺陷,按其严重程度区分为:致命缺陷、严重缺陷、轻度缺陷、微小缺陷等。 ? 3.合格品与不合格品: ?合格品:不含有任何缺陷的单位产品; ?不合格品:有一个或一个以上缺陷的单位产品。 ? 4.单位产品的质量衡量方法: ?主要两类:计量方法和计数方法。 批量与样板 ? 1.批量:检查批所包含的单位产品数。记为N。 ? 2.样本单位:从检查批中抽取并用于检验的单位产品。 ? 3.样本:样本单位的全体。 ? 4.样本大小:样本中包含的样本单位数。记为n。 ?在具体实施抽样检查时,先根据提交检查批的批量与检查水平,查表确定样本大小字码:A、B、C……,由查出的样本大小字码、检验严格度和抽样方案的类型,查表即得此抽样方案下的样本大小n。 不合格 ? 1.单位产品的质量特征不符合规定,称为不合格。 ?其按质量特性不符合的严重程度或质量特性的重要性分为A类、B类、C类不合格。 ?A类不合格为单位产品极重要特性不符合规定或单位产品的质量特性极严重不符合规定。 ?B类不合格为单位产品重要特性不符合规定或单位产品的质量严重不符合规定。 ?C类不合格为单位产品一般质量特性不符合规定或单位产品的质量特性轻微不符合规定。 ? 2.合格判定数: ?作出批合格判断样本中所允许的最大不合格品数或不合格数,记为Ac。 ? 3.不合格判定数: ?作出批不合格判断样本中所不允许的最小不合格品数或不合格品数,记为Re。 合格质量水平 ? 1.合格质量水平: ?在抽样检查中,认为可以接受的连续提交检查批的过程平均不合格率(或每百单位缺陷数)上限值,常用AQL表示。 ?原则上,按不合格的分类分别规定不同的合格质量水平。主要由生产方和使用方协商确定:?(1)AQL(A类不合格)< AQL(B类不合格)< AQL(C类不合格); ?(2)AQL(重要检验项目)< AQL(次要检验项目) ?(3)AQL(电气性能)< AQL(机械性能)< AQL(外观质量);

第 5 章 抽样调查及参数估计(练习题)

第五章 抽样调查及参数估计 5.1 抽样与抽样分布 5.2 参数估计的基本方法 5.3 总体均值的区间估计 5.4 总体比例的区间估计 5.5 样本容量的确定 一、简答题 1.什么是抽样推断?用样本指标估计总体指标应该满足哪三个标准才能被认为是优良的估计? 2.什么是抽样误差,影响抽样误差的主要因素有哪些? 3.简述概率抽样的五种方式 二、填空题 1.抽样推断是在 随机抽样 的基础上,利用样本资料计算样本指标,并据以推算 总体数量 特征的一种统计分析方法 。 2.从全部总体单位中随机抽选样本单位的方法有两种,即 重复 抽样和 不重复 抽样。 3.常用的抽样组织形式有 简单随机抽样 、 类型抽样 、等距抽样、 整群抽样 等四种。 4.影响抽样误差大小的因素有总体各单位标志值的差异程度、 抽样单位数的多少 、 抽样方法 和抽样调查的组织形式 。 5.总体参数区间估计必须具备估计值、 概率保证程度或概率度 、 抽样极限误差 等三个要素。 6.从总体单位数为N 的总体中抽取容量为n 的样本,在重复抽样和不重复抽样条件下,可能的样本个数分别是______________和_____________。 7.简单随机_抽样是最基本的抽样组织方式,也是其他复杂抽样设计的基础。 8.影响样本容量的主要因素包括总体各单位标志变异程度_、__允许的极限误差Δ的大小、_抽样方法_、抽样方式、抽样推断的可靠程度F(t)的大小等。 三、选择题 1.抽样调查需要遵守的基本原则是( B )。 A .准确性原则 B .随机性原则 C .代表性原则 D .可靠性原则 2.抽样调查的主要目的是( A )。 A .用样本指标推断总体指标 B .用总体指标推断样本指标 C .弥补普查资料的不足 D .节约经费开支 3.抽样平均误差反映了样本指标与总体指标之间的( B )。 A .实际误差 B .实际误差的平均数 C .可能的误差范围 D .实际的误差范围 4.对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式是( D ) 。 A .简单随机抽样 B .类型抽样 C .等距抽样 D .整群抽样 5.在其他情况一定的情况下,样本单位数与抽样误差之间的关系是( B )。 A .样本单位数越多,抽样误差越大 B .样本单位数越多,抽样误差越小 C .样本单位数与抽样误差无关 D .抽样误差是样本单位数的10% 6.用简单随机重复抽样方法抽取样本单位,如果要使抽样平均误差降低50%,那么样本n n N B N =!()!n N N A N n =-

(抽样检验)第四章抽样理论和参数估计

第四章抽样理论和参数估计 知识引入 1970 年美国首次进行征兵抽签,组织者将19-25岁的适龄青年按年龄分组,使用编号001-366 的等重量塑料球,001代表1月1日出生者,031代表1月31日…,366代表12月31日。然后将所有塑料球放入滚筒中混合抽取号码,每组抽中号码对应生日的青年依次应征,直到人数足够为止。 之后,有记者指出此次抽签产生了严重的偏差,他们注意到,年末生的人似乎倾向于被抽到较前面的征兵顺序。其结果就是一堆12 月份生的人去了越南战场。后来,经过统计学家的分析,发现这种“偏差”确实存在;经过分析终于找到了原因,原来代表生日的号码塑料球是一次按一整个月份装入滚筒中混合的,加上又没有均匀混合;于是1 月份的生日容易在滚筒底下,12 月份的是最后才装进去,容易在上面。 在抽样术语中,经常能够听到“随机抽样”、“随机选择”这样的表述,“随机性”原则其实保证了总体中的每个个体被抽中的概率相等,因而被认为是保证各种抽签、选择过程公平、公正的一个基本手段。上述抽样就没有保证这种随机性。 在本章中,我们还会看到,作为推断的基础,我们直接研究的样本是否“得当”对研究总体十分关键,可以通过一定的抽样设计制定科学、合理、公正的抽样方法。如上述随机性原则可以保证抽样可以使得样本和总体有相同的内部结构,也就是说有最大的可能使总体的某些特征在样本中得以再现。本章在介绍必要的抽样概念和抽样方法基础上,重点介绍抽样分布理论,并对参数估计进行简要介绍。 第一节抽样和常用抽样方法 一、简单随机抽样 抽样(sampling)或取样,在整个研究过程中位于数据收集之前,恰当的抽样设计是保证样本代表性的关键环节,是利用样本对总体进行假设检验或参数估计的基础。抽样涉及到的一些基本概念在绪论中均已介绍。一个合理可行的抽样设计,一方面要求针对调查或实验研究的具体情况选择一种适宜抽样方法;另一方面应该根据调查研究所要求的精确度及经费状况确定样本容量。 一般所说的随机抽样,就是指简单随机抽样,它是最基本的抽样方法,适用范围广,最能体现随机性原则且原理简单。抽取时,总体中每个个体应独立地、等概率地被抽取。常用的实施方法有抽签法和随机数表法。 1、抽签法:是把总体中的每一个个体都编上号并做成签,充分混合后从中随机抽取一部分,这部分签所对应的个体就组成一个样本。 2、随机数表法:所谓随机数表或乱码表,是由一些任意的数毫无规律地排列而的数表。教材附表17即是一万个数字的随机数表。 随机数表的用法

(标准抽样检验)抽样检验的基础知识

(标准抽样检验)抽样检验的基础知识

第1章抽样检验的基础知识 第1节抽样检验的目的 从居家过日子到国家重大经济决策都离不开抽样检验。比如说,你到水果摊买桔子,你可能会问:“酸不酸呀”?摊主说“你尝一尝,先尝后买”,于是你从一大堆桔子中抽取一个尝一尝,你尝的目的是什么呢?你尝的目的是要通过这一个桔子的质量情况来推断这一大堆桔子的质量情况。显然抽样检验的目的是:通过样本推断总体。样本是样品的集合,一个样本可由一个样品组成,也可由多个样品组成。欲达到通过样本推断总体这样的目的,要通过三个步骤:A.抽样,B.检验,C.推断。其中抽样这个步骤含有两个内容a.怎么抽,b.抽多少。其中检验这个步骤与抽样检验的理论没有关系,不同的产品、不同的质量特性使用不同的检测设备,有不同的检验方法。C.推断,即用对样本的检测结果来对总体进行推断。抽多少与怎样推断就构成了抽样方案。 第2节抽样方案 抽样方案分为计数型抽样方案和计量型抽样方案两大类,首先讨论计数型抽样方案。 2.1计数型抽样方案 计数型抽样方案有两种形式: (1)(n;c);(2)(n;,) 从批中抽取n件产品构成样本,逐个检验各个样品,发现其中有d 件不合格品;若d≤c(d≤)则接收该批,若d>c(d≥)则拒收该批。其框图见图1-1: 图1-1

抽样方案的使用方法是非常简单的。可抽样方案是怎么确定的呢?这里必须指出:抽样方案不是人为规定的,抽样方案是根据对总体的质量要求,用数理统计理论设计出来的。 2.2计量型抽样方案 计量型抽样方案的形式是:(n;k);它用样本均值和样本标准差对批作出推断,与计数型抽样方案相比,在相同的判断精度下,计量型抽样方案比计数型抽样方案所需的样本量更小。其使用方法在后面的章节中做详细介绍。 第3节抽样检验的统计理论(基础) 当讨论抽样方案时,我们应注意以下基本理论问题: 3.1当存在随机误差时,样本质量指标不一定等于总体质量指标。(1)样本不合格品率不一定等于总体不合格品率。比如说,从一批产品中抽取一件产品;经检验,若这件产品是合格品,那么样本不合格品率等于零,此时,并不能肯定:总体(批)不合格品率等于零,总体(批)中没有不合格品;经检验,若这件产品是不合格品,那么样本不合格品率等于百分之一百,此时,并不能肯定:总体(批)不合格品率等于百分之一百,总体(批)中都是不合格品。如果抽取两件产品,样本不合格品率有三个值:两件都是不合格品,样本不合格品率等于百分之一百;两件中一件是合格品,一件是不合格品,样本不合格品率等于百分之五十;两件都是合格品,样本不合格品率等于零;在一次抽样后,经检验,可得上述三个值中的某一个值,无论出现哪一个值,我们都不能肯定地说:总体(批)不合格品率等于这个值。 (2)样本平均每百单位产品不合格数不一定等于总体(批)平均每百单位产品不合格数。

抽样检验方法介绍

抽样检验方法介绍 对产品质量的检验通常采用两种方式:全数检验和抽样检验 一、全数检验与抽样检验 1、全数检验:是对交验的一批产品的所有单位产品进行全部检验,并对每个单位产品作出合格与不合格的判定; 全数检验适用于以下场合: (1)经检验后合格批中不允许存在不合格品时; (2)单件小批生产; (3)检验费用低,检验项目少时; 2、抽样检验:是按规定的抽样方案,随机地从批或过程中抽取少量个体或材料作为样本,对样本进行全数检验, 并根据对样本的检测结果对该批产品作出合格与不合格的判定; 抽样检验主要用于以下场合: (1)破坏性检验(检验一件破坏一件),必须采用抽样检验; (2)对连续体的检验,如对布、电线、油的检验等,只能采用抽样检验; (3)大批量生产与连续交付时; (4)检验费时、费用高时。 3、全数检验与抽样检验的比较 二、抽样检验的基本原理 1、抽样检验的数学理论基础 (1)随机变量的统计规律性

(2)概率运算 (3)计数抽样检验批接收概率的计算 (4)计量抽样检验批的接收概率 2、各种抽样检验类型的设计思想与基本做法 (1)标准型抽样检验 标准型抽样检验是最基本的抽样检验方式,为保护生产方与使用方双方的利益,将生产方风险α和使用方风险β固定为某一特定数值,(通常固定α= 0.05 ,β=0.1),由生产方和使用方协商确定P O、P1 ?生产方风险α:在生产方与使用方的验收抽样检验中, 在抽样检验中,将合格批误判为不合格所犯的错误 称为弃真错误,犯弃真错误的概率将称为弃真概率,记为犯弃真错误(将合格批误判为不合格),对生产方是不利的,在此时犯弃真错误的概率称为生产方风险 ?使用方风险β:在生产方与使用方的验收抽样检验中,犯存伪错误(将不合格批误判为合格),对使用方是不 利的,在此时犯存伪错误的概率称为使用方风险。 ?P O:可接收质量,被认为满意的批质量水平; ?P1:极限质量,使用方认为不允许更差的批质量水平。 具体做法是: ?好批高概率接收:当交验批质量达到或好于可接收质量P O时,抽样方案以1-α的高概率接收,保护生 产方利益; ?坏批高概率拒收:当交验批质量达到或差于P1时,抽样方案以大于或等于1-β的高概率拒收,保护使用 方利益; ?鉴别好批和坏批:当交验批的质量介于P O、P1之间时,抽样方案的接收概率急骤下降,较好地区分好批 和坏批。 (2)调整型抽样检验 调整型抽样检验只规定了可接受质量水平AQL,但它同时规定了正常、加严和放宽一组抽样方案与转移规则,能根据连续交验批以往的质量历史提供的质量信息及时调整宽严程度。具体做法是: ?正常抽样检验:当交验批的质量=AQL(接收质量限)时,采用正常检验的抽样方案,对这样的批抽 样方案以高概率接收。 ?加严抽样检验:当交验批质量明显劣于AQL(接收质量限)时,采用加严检验或暂停检验对使用方 提供保护。对生产方在经济上或心理上施加压力,敦促其加强质量管理,使过程平均不合 格品率好于可接受质量水平AQL。 ?放宽抽样检验:当交验批质量P明显优于AQL时,采用放宽检验,增加对合格批的接收概率,并降 低检验费用,对生产方提供保护和鼓励。

(标准抽样检验)抽样与参数估计

(标准抽样检验)抽样与 参数估计

抽样与参数估计 推断统计:利用样本统计量对总体某些性质或数量特征进行推断。 从数据得到对现实世界的结论的过程就叫做统计推断(statisticalinference)。这个调查例子是估计总体参数(某种意见的比例)的一个过程。 估计(estimation)是统计推断的重要内容之一。统计推断的另一个主要内容是本章第二节要介绍的假设检验(hypothesistesting)。 因此本节内容就是由样本数据对总体参数进行估计,即: 学习目标:了解抽样和抽样分布的基本概念 理解抽样分布与总体分布的关系 了解点估计的概念和估计量的优良标准 掌握总体均值、总体比例和总体方差的区间估计 第一节抽样与抽样分布 回顾相关概念:总体、个体和样本 抽样推断:从所研究的总体全部元素(单位)中抽取一部分元素(单位)进行调查,并根据样本数据所提供的信息来推断总体的数量特征。 总体(Population):调查研究的事物或现象的全体参数 个体(Itemunit):组成总体的每个元素 样本(Sample):从总体中所抽取的部分个体统计量 样本容量(Samplesize):样本中所含个体的数量 一般将样本单位数不少于三十个的样本称为大样本,样本单位数不到三十个的样本称为小样本。 一、抽样方法及抽样分布

1、抽样方法 (1)、概率抽样:根据已知的概率选取样本 ①、简单随机抽样:完全随机地抽选样本,使得每一个样本都有相同的机会(概率) 被抽中。 注意:在有限总体的简单随机抽样中,由抽样是否具有可重复性,又可分为重 复抽样与不重复抽样。而且,根据抽样中是否排序,所能抽到的样本个数往往不同。 ②、分层抽样:总体分成不同的“层”(类),然后在每一层内进行抽样 ③、整群抽样:将一组被调查者(群)作为一个抽样单位 ④、等距抽样:在样本框中每隔一定距离抽选一个被调查者 (2)非概率抽样:不是完全按随机原则选取样本 ①、非随机抽样:由调查人员自由选取被调查者 ②、判断抽样:通过某些条件过滤来选择被调查者 (3)、配额抽样:选择一群特定数目、满足特定条件的被调查者 2、抽样分布 一般地,样本统计量的所有可能取值及其取值概率所形成的概率分布,统计上称为抽样分布(samplingdistribution)。 某个样本统计量(如均值、比例、方差等)的抽样分布,从理论上说就是在重复选取容量为n的样本时,由每一个样本计算出的该统计量数值的相对频数分布或概率分布。 二、样本均值的抽样分布与中心极限定理 1、样本均值的抽样分布(一个例子)

抽样原理及方法

抽样原理及方法 一、抽样的基本原则 随机化是抽样研究的基本原则。所谓随机化原则,是指在进行抽样时,总体中每一个体是否被抽取,并不由研究者主观决定,而是每一个体按照概率原理被抽取的可能性是相等的。 二、抽样的几种重要方法 抽样有两种方法;非概率抽样和概率抽样。使用哪种方法主要取决于我们是否打算对总体进行推断。非概率抽样用主观的(非随机的)方法从总体中抽取单元,它是一种快速、简易且省钱的抽样方法。但要能从样本对总体进行推算,必须假定样本对总体具有代表性,而在非概率抽样情形做这样的假设将有很大风险。 概率抽样则是基于随机的原则从总体中抽取单元。与非概率抽样相比,概率抽样较为复杂,费时,费用也较高,然而,由于单元是从总体中随机抽取出来的。而且能计算每一个单元的入样概率,因此能得到可靠的估计值及其抽样误差的估计值,并对总体进行推断。下面介绍的是概率抽样的几种重要方法。 1、简单随机抽样 它是最基本的抽样方法,适用范围广,最能体现随机化原则,原理简单。抽取时,总体中每个个体应有独立的、等概率被抽取的可能。抽取的样本满足两个基本条件:代表性和独立性,常用的具体抽取方式有抽签法和随机数字法。 有简单随机抽样得到的样本为简单随机样本。尽管在总体构成信息不同的情况下需要酌情采取不同的抽样方法,如分层抽样方法、集团抽样等,但随即抽样是各种抽样方法内含的基本要求,有四种不同的简单随机抽样方式:不重复抽样(还原抽样、放回抽样);不重复抽样(非还原抽样、无放回抽样);有序抽样(既考虑到何元素有考虑到各种元素出现的顺序);无序抽样(只考虑到哪些元素不考虑各元素出现的顺序)。 2、等距抽样 它也叫做机械抽样或系统抽样。在实施时,将已遍好号码的个体排成顺序,在计算出抽样距离,然后按抽样距离抽取样本。第一个样本采用的是简单随机抽样的办法抽取。 K(抽样距离)=N(总体规模)/n(样本规模) 一般来说,这种抽样方法比简单随机抽样简便易行,而且它比较均匀地抽到总体中各个部分的个体,样本的代表性比简单随机抽样好。另外,等距抽样同简单随机抽样一样也容易忽略已有信息。 3、分层抽样(类型抽样) 现将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系统抽样的方法抽出一个子样本,最后将这些子样本合起来构成总体样本。分层有两种方法:a.先以分层变量将总体划分为若干层,再按照各层在总体中的比例从各层中抽取。例如修订智力测验中国版,先把中国的区域分成东北、华北等大行政区,每个大区再按照其人口比例随机抽取一定数量的被试(不分省市)。 b.先以分层变量将总体划分成若干层,再将各层中的元素按分层的顺序整齐排列,最后用系统抽样的方法抽取样本。例如在某大学进行大学生态度调查,可以先按专业分层,再按年级分层,然后根据抽中的专业和年级全体学生的名册进行等距抽样。分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,在抽取不同的子总体中的样本分别代表该子总体,所有的样本进而合在一起代表总体。 分层标准: a.以调查所要分析和研究的主要变量或相关的变量作为分层的标准。 b.以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作

(抽样检验)第四章抽样理论和参数估计最全版

(抽样检验)第四章抽样理论和参数估计

第四章抽样理论和参数估计 知识引入 1970年美国首次进行征兵抽签,组织者将19-25岁的适龄青年按年龄分组,使用编号 001-366的等重量塑料球,001代表1月1日出生者,031代表1月31日…,366代表12月31日。然后将所有塑料球放入滚筒中混合抽取号码,每组抽中号码对应生日的青年依次应征,直到人数足够为止。 之后,有记者指出此次抽签产生了严重的偏差,他们注意到,年末生的人似乎倾向于被抽到较前面的征兵顺序。其结果就是壹堆12月份生的人去了越南战场。后来,经过统计学家的分析,发现这种“偏差”确实存在;经过分析终于找到了原因,原来代表生日的号码塑料球是壹次按壹整个月份装入滚筒中混合的,加上又没有均匀混合;于是1月份的生日容易在滚筒底下,12月份的是最后才装进去,容易在上面。 在抽样术语中,经常能够听到“随机抽样”、“随机选择”这样的表述,“随机性”原则其实保证了总体中的每个个体被抽中的概率相等,因而被认为是保证各种抽签、选择过程公平、公正的壹个基本手段。上述抽样就没有保证这种随机性。 在本章中,我们仍会见到,作为推断的基础,我们直接研究的样本是否“得当”对研究总体十分关键,能够通过壹定的抽样设计制定科学、合理、公正的抽样方法。如上述随机性原则能够保证抽样能够使得样本和总体有相同的内部结构,也就是说有最大的可能使总体的某些特征在样本中得以再现。本章在介绍必要的抽样概念和抽样方法基础上,重点介绍抽样分布理论,且对参数估计进行简要介绍。 第一节抽样和常用抽样方法 壹、简单随机抽样

抽样(sampling)或取样,在整个研究过程中位于数据收集之前,恰当的抽样设计是保证样本代表性的关键环节,是利用样本对总体进行假设检验或参数估计的基础。抽样涉及到的壹些基本概念在绪论中均已介绍。壹个合理可行的抽样设计,壹方面要求针对调查或实验研究的具体情况选择壹种适宜抽样方法;另壹方面应该根据调查研究所要求的精确度及经费状况确定样本容量。 壹般所说的随机抽样,就是指简单随机抽样,它是最基本的抽样方法,适用范围广,最能体现随机性原则且原理简单。抽取时,总体中每个个体应独立地、等概率地被抽取。常用的实施方法有抽签法和随机数表法。 1、抽签法:是把总体中的每壹个个体都编上号且做成签,充分混合后从中随机抽取壹部分,这部分签所对应的个体就组成壹个样本。 2、随机数表法:所谓随机数表或乱码表,是由壹些任意的数毫无规律地排列而的数表。教材附表17即是壹万个数字的随机数表。 随机数表的用法 许多计算机软件都能够自动生成随机数字。这里介绍教材附录17中乱码表的用法:首先对总体中所有个体依次编号,接着从表中任壹位置(任意行列交叉处)开始,依次往下找足你所需要的随机数(均为5位),以这些随机数为编号的个体即组成壹个样本。在查找随机数时,有俩点要注意,壹是总体容量是几位数,就从表中随机数末尾截取相应位数(因而最多能够截取4位数,抽取9999个)。如总体容量为500,则能够见表中数据的末尾三位数,且依次往下找;二是找到的数字若超过总体的容量范围,则跳过,比如总体容量为500,要

相关主题
文本预览
相关文档 最新文档