统计学第九章抽样与抽样估计
- 格式:doc
- 大小:196.00 KB
- 文档页数:14
抽样与抽样分布在统计学中,抽样是一种常用的数据收集方法,通过从总体中选择一部分样本来进行研究和分析。
抽样的目的是通过样本来推断总体的特征和性质。
在进行抽样时,我们需要了解抽样的方法和抽样分布的概念。
一、抽样方法1. 无偏抽样无偏抽样是指所有样本有相同被选中的机会。
这样可以确保样本的代表性,从而减小样本估计值和总体真值之间的误差。
常见的无偏抽样方法包括简单随机抽样、系统抽样和分层抽样等。
2. 有偏抽样有偏抽样是指样本的选择并不具有相等的机会。
这样可能导致样本的代表性不足,从而产生较大的估计误差。
有时,有偏抽样也可以用于特定的研究目的,但需要明确地说明和分析偏差带来的影响。
二、抽样分布1. 抽样分布的概念抽样分布是指统计量在各个可能样本上的取值分布。
统计量可以是样本均值、样本方差等。
抽样分布的性质对于进行统计推断和假设检验非常重要。
2. 样本均值的抽样分布样本均值的抽样分布在中心极限定理的条件下近似服从正态分布。
中心极限定理指出,当样本容量足够大时,无论总体分布如何,样本均值的抽样分布都会接近正态分布。
3. 样本比例的抽样分布样本比例的抽样分布在满足一些条件的情况下也近似服从正态分布。
这些条件包括样本容量足够大、总体比例接近0.5以及样本与总体之间的独立性等。
4. 样本方差的抽样分布样本方差的抽样分布不服从正态分布。
通常情况下,样本方差的抽样分布呈右偏态,即偏度大于0。
为了得到样本方差的抽样分布,可以使用抽样分布的近似分布,如卡方分布。
三、应用案例抽样与抽样分布的方法和理论在实际统计学中有广泛的应用。
以下是一些常见的应用案例:1. 调查研究在进行调查研究时,我们经常需要从总体中选择一部分样本进行问卷调查或面访。
通过利用抽样与抽样分布的方法,我们可以将样本的调查结果推广到总体中,从而得到总体的特征和性质。
2. 假设检验假设检验是统计学中常用的推断方法之一。
通过比较样本统计量与假设的总体参数值,我们可以判断假设的合理性。
第九章抽样推断一、名词1、抽样推断:即由样本指标来推断总体指标的统计方法。
2、抽样误差:是指抽样指标和全及指标之间的绝对离差。
3、抽样极限误差:是指样本指标与全及指标之间产生的抽样误差被允许的最大可能范围,也叫允许误差。
4、点估计:就是直接用样本指标代表总体指标的估计方法。
5、区间估计:就是把抽样指标与抽样平均误差结合起来,来推断总体指标所在的可能范围的方法。
6、假设检验:就是先对研究总体的参数做出某种假设,然后抽取样本,构造适当的统计量,利用样本提供的信息对假设的正确性进行判断的过程。
二、填空题1.抽样推断是由(样本指标)来推断(相应的全及指标)的统计方法。
2.影响抽样误差大小的因素主要有:总体各单位标志值的差异程度、(样本的单位数目)、(抽样的具体方法)和抽样调查的组织形式。
3.抽样误差是由于抽样的(随机性)而产生的误差,这种误差不可避免,但可以控制在(所允许的范围)之内。
4.抽样平均误差是样本平均数的(标准差),是所有可能样本指标与总体指标之离差的(平均数)。
5.抽样极限误差,是指样本指标与全及指标之间产生的(抽样误差)被允许的(最大可能范围)。
6.用样本指标估计总体指标,要做到三个要求,即:(无偏性)、(一致性)、(有效性)。
7.抽样估计的方法有(点估计)和(区间估计)两种。
8.总体参数的区间估计必须同时具备(估计值)、(抽样误差范围)和(概率保证程度)三个要素。
9.总体中各单位标志值之间的变异程度越大,要求的样本单位数就(越多),即样本容量就(越大),总体各单位标志值变异程度与样本容量之间成(正比)。
10.允许误差越大,需要的样本单位数目就(越少);允许误差越小,需要的样本单位数目就(越多)。
11.对推断结果要求的可靠程度越高,必要样本单位数目就(越多);反之,可靠程度越低,必要样本单位数目就(越少)。
12.参数估计是用样本统计量估计(总体参数),而假设检验则是先对总体参数(提出假设),然后,运用样本资料验证假设(是否成立)。
(抽样检验)抽样与参数估计最全版(抽样检验)抽样与参数估计抽样和参数估计推断统计:利⽤样本统计量对总体某些性质或数量特征进⾏推断。
从数据得到对现实世界的结论的过程就叫做统计推断(statisticalinference)。
这个调查例⼦是估计总体参数(某种意见的⽐例)的壹个过程。
估计(estimation)是统计推断的重要内容之壹。
统计推断的另壹个主要内容是本章第⼆节要介绍的假设检验(hypothesistesting)。
因此本节内容就是由样本数据对总体参数进⾏估计,即:学习⽬标:了解抽样和抽样分布的基本概念理解抽样分布和总体分布的关系了解点估计的概念和估计量的优良标准掌握总体均值、总体⽐例和总体⽅差的区间估计第⼀节抽样和抽样分布回顾相关概念:总体、个体和样本抽样推断:从所研究的总体全部元素(单位)中抽取壹部分元素(单位)进⾏调查,且根据样本数据所提供的信息来推断总体的数量特征。
总体(Population):调查研究的事物或现象的全体参数个体(Itemunit):组成总体的每个元素样本(Sample):从总体中所抽取的部分个体统计量样本容量(Samplesize):样本中所含个体的数量壹般将样本单位数不少于三⼗个的样本称为⼤样本,样本单位数不到三⼗个的样本称为⼩样本。
壹、抽样⽅法及抽样分布1、抽样⽅法(1)、概率抽样:根据已知的概率选取样本①、简单随机抽样:完全随机地抽选样本,使得每壹个样本都有相同的机会(概率)被抽中。
注意:在有限总体的简单随机抽样中,由抽样是否具有可重复性,⼜可分为重复抽样和不重复抽样。
⽽且,根据抽样中是否排序,所能抽到的样本个数往往不同。
②、分层抽样:总体分成不同的“层”(类),然后在每壹层内进⾏抽样③、整群抽样:将壹组被调查者(群)作为壹个抽样单位④、等距抽样:在样本框中每隔壹定距离抽选壹个被调查者(2)⾮概率抽样:不是完全按随机原则选取样本①、⾮随机抽样:由调查⼈员⾃由选取被调查者②、判断抽样:通过某些条件过滤来选择被调查者(3)、配额抽样:选择壹群特定数⽬、满⾜特定条件的被调查者2、抽样分布壹般地,样本统计量的所有可能取值及其取值概率所形成的概率分布,统计上称为抽样分布(samplingdistribution)。
第九章抽样与抽样估计一、单项选择题1、抽样极限误差是指抽样指标和总体指标之间(D)。
A.抽样误差的平均数B.抽样误差的标准差C.抽样误差的可靠程度D.抽样误差的最大可能范围2、样本平均数和总体平均数(B)。
解析:样本平均数是以总体平均数为中心,在其范围内变动(P213)A.前者是一个确定值,B.前者是随机变量,后者是随机变量后者是一个确定值C.两者都是随机变量D.两者都是确定值3、某场要对某批产品进行抽样调查,一直以往的产品合格率分别为90%,93%,95%,要求误差范围小于5%,可靠性为95.45%,则必要样本容量应为(B)。
A.144B.105C.76D.1094、在总体方差不变的条件下,样本单位数增加3倍,则抽样误差(C)。
A.缩小1/2B.为原来的3/√3C.为原来的1/3D.为原来的2/35、在其他条件不变的前提下,若要求误差范围缩小1/3,则样本容量(B)。
A.增加9倍B.增加8倍C.为原来的2.25倍D.增加2.25倍6、抽样误差是指(C)。
解析:这题考的是抽样误差的定义(P213)A.在抽查过程中由于观察、测量等差错所引起的误差B.在调查中违反随机原则出现的系统误差C.随机抽样而产生的代表性误差D.人为原因所造成的误差7、在一定的抽样平均误差条件下(A)。
A.扩大极限误差范围,可以提高推断的可靠程度B.扩大极限误差范围,会降低推断的可靠程度C.缩小极限误差范围,可以提高推断的可靠程度D.缩小极限误差范围,不改变推断的可靠程度8、抽样平均误差是(B)。
解析:这题考的是抽样平均误差的定义(P214)A.总体的标准差B.样本的标准差C.抽样指标的标准差D.抽样误差的平均差9、对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式(D)。
A.简单随机抽样B.类型抽样C.等距抽样D.整群抽样10、先将总体各单位按主要标志分组,再从各组中随机抽取一定单位组成样本,这种抽样形式被称为(C)解析:这题考的是抽样调查的几种不同的方式的定义(P211)。
A.简单随机抽样B.机械抽样C.分层抽样D.整群抽样11、事先确定整体范围,并对整体的每隔单位都编号,然后根据《随机数码表》或抽签的方式来抽取样本的抽样组织形式,被称为(B)。
A.简单随机抽样B.机械抽样C.分层抽样D.整群抽样12、在同样条件下,不重复抽样的抽样标准误差于重复抽样的抽样的标准误差相比,(A)。
A.前着小于后者B.前者大于后者C.两者相等D.无法判断13、在重复的简单随机抽样中,当概率保证程度从68.27%提高到95.45%时(其他条件不变),必要的样本容量将会(C)。
A.增加一倍B.增加两倍C.增加三倍D.减少一半14、比例与比例方差的关系是(B)。
A.比例的数值越接近于1,比例方差越大B.比例数值越接近于0,比例的方差越大C.比例的数值越接近于0.5,比例的方差越大D.比例的数值越大,比咯的方差越大15、假定一个人口一亿的大国与百万人口的小国居民年龄变异程度相同,现在各自用重复抽样方法抽取本国1%人口计算平均年龄,则平均年龄抽样平均差(D)。
A.不能确定B.两者相等C.前者比后者大D.前者比后者小二、多项选择题1、下面说法错误的是(ABC)。
A.抽样调查中的代表性误差是可以避免的B.抽样调查中的系统误差是可以避免的C.抽样调查中的随机误差是可以避免的D.抽样调查中的随机误差是不可以避免的E.抽样调查中的系统误差是不可以避免的2、从一个总体中可以抽取一系列样本,所以(ACD)。
A.样本指标的数值不是唯一确定的B.总体指标是随机变量C.样本指标是随机变量D.样本指标的数值随样本的不同而不同E.样本指标是一般变量3、影响抽样平均误差的因素有(ABCD)。
A.总体标志变异程度B.样本容量C.抽样方法D.抽样组织方式E.可靠程度4、抽样组织方式有(ABD)。
A.简单随机抽样B.分层抽样C.机械抽样D.整群抽样E.重置抽样5、在其他条件不变的情况下(ABCD)。
A.总体方差越大,所需的样本容量越多B.总体方差越小,所需的样本容量越少C.允许的最大估计误差越小,所需的样本容量越多D.允许的最大估计误差越大,所需的样本容量越少E.当置信度越高,所需样本容量越少6、样本容量n受三个因素的影响(ABC)。
A.总体方差B.允许最大估计误差C.置信度D.概率分布E.抽样估计标准差7、总体参数的区间估计必须同时具备的要素有(ADE)。
此题有争议,求共同语言A.样本单位数B.抽样指标—总体参数的估计值C.抽样误差的范围D.概率保证程度E.抽样标准误差8、抽样推断中,常用的总体参数有(BD)。
A.统计量B.总体平均数C.总体成数D.总体方差E.总体标准差9、置信度、概率度和精确关系表现在(AC)。
A.概率度增大,估计的可靠新也增大B.概率度增大,估计的精确度下降C.概率度缩小,估计的精确度也缩小D.概率度缩小,估计的置信度也缩小E.概率度增大,估计的可靠性缩小10、影响抽样误差的因素有(ACE)。
A.是有限总体还是无线总体B.是变量总体还是属性总体C.是重复抽样还是不重复抽样D.总体被研究标志的变异程度E.抽样单位数的多少三、判断题1、典型调查、重点调查、配额调查、方便调查等都属于抽样调查。
(错)(解释:这些抽样是属于非随机抽样。
)2、抽样调查是一个随机变量。
这种误差的平均值是可以推算的。
(对)3、在样本容量相同的情况下,不重复抽样的平均数误差小于重复抽样的平均误差。
(对)4、在抽样调查中,当样本单位数大于30时,该样本是一个大样本。
(错)5、在其他条件不变的情况下,抽样极限误差范围缩小,区间估计的可靠程度降低。
(对)6、在重复抽样的情况下,当△x缩小一半,则样本单位数n必须增加到原来样本单数的2倍。
(对)7、测定比例方差时要首先知道成数P,如果没有进行过这方面调查,可取P=0.5。
(对)8、当计算的抽样单位数是267.33时,应该抽取的样本单位数是267个。
(对)9、抽样平均误差是所有样本平均数与总体平均数的标准差。
(对)10、总体平均数(成数)落在一定区间是一个必然事件。
(错)四、简答题1、随机抽样最基本的组织方式有哪些?分别说明它们的主要特点。
1.答:随机抽样最基本的组织方式有哪些?分别说明他们的主要特点。
答:随机抽样的最基本的组织方式有:简单随机抽样、分层抽样、整群抽样、系统抽样。
特点:随机抽样:其特点是总体中每个单位被抽中的概率是相同的,完全由许多随机因素综合作用来决定,既排除了抽样时人的主观随意性,也排除了人的主观能动性。
分层抽样:分层抽样的特点是将科学分组法与抽样法结合在一起,分组减小了各抽样层变异性的影响,抽样保证了所抽取的样本具有足够的代表性。
整群抽样:依据某种标准将总体划分为若干子群体,依据简单随机抽样或等距抽样或分层抽样的方法从总体中抽取一些子群体,然后由所抽中群体中的所有单位构成样本。
系统抽样:就是没有明显区别,但是按照排序的方法,把样本分成几个小样本,因为样本间没有区别,所以研究的时候可以从一个样本中抽取一个样本,然后其他样本中也取出同样号数的样本,一起组成要研究的样本。
系统抽样最主要的特点是没有区别,分组,编号。
2、简述重复抽样与不重复抽样的区别。
2、答:重复抽样:每次从总体中抽取的样本单位,经检验之后又重新放回总体,参加下次抽样,这种抽样的特点是总体中每个样本单位被抽中的概率是相等的。
不重复抽样:每次从总体中抽取的样本单位,经检验之后不再放回总体,在下次抽样时不会再次抽到前面已抽中过的样品单位。
总体每经一次抽样,其样品单位数就减少一个,因此每个样品单位在各次抽样中被抽中的概率是不同的。
3、简述统计误差的种类及其产生的原因。
3、答:种类:统计误差通常可以分为登记统计误差和代表性误差两大类。
所谓登记性误差就是指由于调查者或被调查者的主观原因而导致调查所得总体指标与总体实际指标之间的差异。
统计误差的成因大体可分为主观因素和客观因素两种类型。
主观因素即人的因素。
由于人的主要因素造成的统计误差具体可划分为两种,即认识误差和人为误差。
由于人们所持有的世界观不同,对客观世界的认识也不相同,这种认识上的差异就叫作认识误差;人们为了某种目的和需要,根据人的意愿对生产出来的统计产品进行故意的伪装、篡改或故意编造虚假的统计数据。
4、什么是抽样平均误差?影响其大小的因素有哪些?抽样平均误差是指所有可能的样本指标与总体指标间的平均差异程度,即样本计量的标准差。
也称抽样分布的标准差。
影响其大小的因素:(1)全及总体标志的变动程度(2)样本容量n的多少(3)抽样组织方式(4)抽样方法5、在确定抽样单位数时要注意哪几点?5、答:(1) 抽样推断的可靠程度。
它与概率度t 有关。
若要求抽样的可靠程度较高,t 也较大,抽样的数目就要多数;若可靠程度要求不高,t 也较小,抽样的数目就要少些。
(2) 总体方差的大小。
若变异程度大,则需多抽取一些样本单位;若变异程度较小,则可少抽取一些。
如果总体各单位标志值相等,只抽一个样本单位即可。
(3) 抽样极限误差的大小。
即抽样推断的精确程度。
如极限误差小,即允许误差小,则需多抽取样本单位。
如果不允许有抽样误差,就只能进行全面调查。
(4) 抽样方法与组织形式。
一般在同样条件下,重复抽样需要多抽取样本,此外,抽样单位数目的多少还取决于不同的抽样组织形式。
一般分层抽样和等距抽样可以比纯随机抽样需要的样本单位数少,整群抽样比纯随机抽样需要的样本单位数多。
五、综合题1、假定某统计总体有5000个总体单位,某被研究标志的方差为400,若要求抽样极限误差不超过3,概率保证程度为0.9545。
试问采用不重复抽样应抽取多少样本单位?1、 解:已知N=50004002=σ t=23=∆ 求n 12--==∆N n N n t t σμ 化简并解得n=1722、一个电视节目主持人想了解观众对某个电视专题节目的喜欢情况,他用简单随机重复抽样的方法选取了5000个观众做样本,结果发现喜欢该节目的有175人。
试以95%的概率来估计观众喜欢这一专题节目的区间范围。
若该节目主持人希望估计的极限误差不超过5%,问有多大的把握程度?解:p=n/N=175/500=7/20因为F(t)=95%所以t=1.96Up=pq/N-1=[0.2×(500-175)/500]/499=0.00026Sp ≈0.0204△ p=1.96×0.0204=0.04所以置信区间下限L=0.2-0.04=0.16置信区间下限U=0.2+0.04=0.24(2)1.96×0.0204/√根号下175×5%=34%P2333、用简单随机重复抽样的方法,从660个工厂中抽取33个工厂调查月产值情况,得资料如下:试求月产值的抽样平均误差。