第七章抽样推断
- 格式:ppt
- 大小:1.11 MB
- 文档页数:67
第七章 抽样设计与推断 第一节 抽样设计 一、抽样推断与抽样设计的概念 (一)抽样推断 抽样推断(Sampling inference)是在抽样调查的基础上,利用样本的实际资料计算样本指标(统计量),并据以推算总体相应特征值(总体参数)的一种统计分析方法。抽样推断具有如下特点: 第一,抽样推断是建立在随机取样的基础上。按随机原则抽取样本单位,是抽样推断的前提。所谓随机原则就是在抽选调查单位的过程中,完全排除人为的主观因素的干扰,以保证使现象总体中的每一个个体都有一定的可能性被选中。换句话讲,哪些单元能够被选作调查单位纯属偶然因素的影响所致。这里需说明几点:①随机并非“随意”。随机是有严格的科学含义的,可用概率来描述,而“随便”仍带有人为的或主观的因素,它不是一个科学的概念;②随机原则不等于等概率原则;③随机原则一般要求总体中每个单元均有一个非零的概率被抽中;④抽样概率对总体参数的估计有影响。只有坚持抽取的随机原则,才能使被抽中单位的频数分布类型与调查对象相同,从而增强被抽中单位对总体的代表性,达到推断总体的目的。 第二,抽样推断是由部分推算整体的—种认识方法。即对抽取的调查单位进行调查研究,取得调查单位的实际资料,计算出调查单位的指标数值,并据以推断和估计总体的指标数值。 第三,抽样推断以概率论中的大数法则和中心极限定理为理论依据。 第四,抽样误差可以事先计算和控制。 抽样调查除具有十分明显的特色之外,还在实际应用过程中发挥着突出的作用。 其一,抽样调查能够解决全面调查所无法解决的现象的调查问题。在实际工作中,对某些现象常常可能一方面需要了解其全面情况,另一方面又由于现象自身的特性决定了无法通过全面调查获取资料。此时,只有使用抽样调查。该类现象主要有:(1)产品质量的破坏性检验。如轮胎的里程寿命试验,青砖的抗折耐压试验,炮弹的杀伤力试验,弹簧的抗拉强度试验等等。(2)无限总体的调查。无限总体所包含的总体单位数目无限多个,无法一一调查。(3)包括未来时序的总体,如生产过程稳定性的检查等。 其二,抽样调查适用于对理论上可以作全面调查,而实际上又难以组织全面调查的现象进行调查。有些现象虽属于有限总体,但由于其总体范围过大,单位数目过多且过于分散,事实上不可能作全面调查,如森林的木材蓄积量调查,大量连续作业的某些产品质量的非破坏性检验,水稻的颗粒重检验等等。还有些现象由于受时间或其他条件的制约,不能组织全面调查,如战备物资调查,自然灾害造成损失情况的调查等等。 其三,抽样调查对于时效性要求较高、同时又可以不作全面调查的现象的调查有着特殊的作用。如前所述,抽样调查具有费用低、速度快、精度高的特点,这使得它比其它非全面调查能更有效地满足各有关方面的需要。 其四,抽样调查的结果可被用来检验和修正全面调查结果。由于全面调查涉及面广、工作量大、参加人员多、汇总传递环节多、调查结果容易出现差错。但是,其差错到底有多大,全面调查自身无法回答这一问题。因此,可在全面调查之后再进行一次抽样调查,根据抽样调查结果对全面调查结果进行检查和修正,从而提高全面调查的质量。 其五,抽样调查可对工业生产过程的稳定性进行监测,从而实现质量控制。 其六,利用抽样调查方法还可以对总体的某些假设进行检验,以判断这些假设的真伪,为管理决策提供依据。例如:一种新药在对某位患者使用后效果不错,这是否意味着这种新药的疗效就一定显著呢?单凭此还不能做出结论。因为疗效对于每个人常会受到一些随机因素的影响而呈现出一定的不确定性。因此,最好利用抽样调查结果,对这种药物的疗效是否存在显著性的统计差异进行检验,以确定其疗效状况,并据此做出是否推广使用该药的决策。 (二)抽样设计 抽样设计是为抽样调查的实施提供一个指导性文件,以实现抽样调查的目的和任务。抽样设计的目的首先要合理安排整个抽样调查各个环节上的费用,使调查费用控制在预算范围内,保证抽样调查的顺利实施。其次,抽样设计中要通过对抽样方法的选择、样本容量的科学计算等,把抽样误差控制在要求的范围内,达到抽样的精度要求。最后,抽样设计要为抽样调查提供一个具体的日程表,指导调查工作按预定的时间要求进行,保证在规定的调查期限内全面完成调查的各项工作。 一次抽样设计通常主要包括:抽样方法设计、抽样单位设计、抽样框设计、估计方法设计、辅助变量设计、样本轮换设计、样本容量设计、问卷设计等基本内容。本节主要研究抽样方法的设计问题。
第七章 抽样推断与检验习题一、填空题1.抽选样本单位时要遵守 随机 原则,使样本单位被抽中的机会 均等 。
2.常用的总体指标有 均值 、 成数(比例) 、 方差 。
3.在抽样估计中,样本指标又称为 统计 量,总体指标又称为 参数 。
4.全及总体标志变异程度越大,抽样误差就 越大 ;全及总体标志变异程度越小,抽样误差 越小 。
5.抽样估计的方法有 点估计 和 区间估计 两种。
6.整群抽样是对被抽中群内的 所有单位 进行 全面调查 的抽样组织方式。
7.常用的离散型随机变量分布包括 几何分布 、二项分布和 泊松分布 。
8.简单随机抽样的成数抽样平均误差计算公式是:重复抽样条件下:()n u p ππ-=1;不重复抽样条件下:()⎪⎭⎫⎝⎛---=11N n N nu p ππ。
9.误差范围△,概率度t 和抽样平均误差σ之间的关系表达式为 。
10.对总体指标提出的假设可以分为原假设和 备选假设(备择假设) 。
二、单项选择题1.所谓大样本是指样本单位数在()及以上A 30个B 50个C 80个 D100个2.抽样指标与总体指标之间抽样误差的可能范围是( )A 抽样平均误差B 抽样极限误差C 区间估计范围D 置信区间3.抽样平均误差说明抽样指标与总体指标之间的( )A 实际误差B 平均误差C 实际误差的平方D 允许误差4.成数方差的计算公式( )A P(1-P)B P(1-P)2C )1(P P -D P 2(1-P)5.对入库的一批产品抽检100件,其中有90件合格,最高可以( )概率保证合格率高于80%。
A 95.45%B 99.73%C 68.27%D 90%6.假设检验是检验( )的假设值是否成立A 样本指标B 总体指标C 样本方差D 样本平均数7.在假设检验中的临界区域是( )A 接受域B 拒受域C 置信区间D 检验域8.假设检验和区间估计之间的关系,下列说法正确的是( )A 虽然概念不同,但实质相同B 两者完全没有关系C 互相对应关系D 不能从数量上讨论它们之间的对应关系 222∆=σt n三、简答题1.什么是随机原则?在抽样调查中为什么要遵循随机原则?2.样本和总体有什么区别和联系?3.影响抽样误差的因素有哪些?4.抽样误差、抽样极限误差和概率度三者之间有何关系?5.什么是假设检验?其作用是什么?四、计算题1.工商部门对某超市经销的小包装休闲食品进行重量合格抽查,规定每包重量不低于试以95.45%概率推算:(1)这批食品的平均每包重量是否符合规定要求;(2)若每包食品重量低于30克为不合格,求合格率的范围。
第七章抽样推断一、单项选择1.抽样调查所必须遵循的基本原则是()。
A.随意原则B.可比性原则C.随机原则D.准确性原则2.抽样调查的主要目的是( )。
A.广泛运用数学的方法B.计算和控制抽样误差C.用样本指标来推算总体指标D.修正普查的资料3.是非(交替)标志的标准差为( )。
A.p B.pq C.p(1-P) D.4.抽样调查按抽取样本的方法不同,可分为( )。
A.大样本和小样本B.重复抽样和不重复抽样C.点估计和区间估计D.纯随机抽样和分层抽样5.抽样平均误差反映了样本指标与总体指标之间的()A.实际误差B.实际误差的绝对值C.平均误差程度D.可能的误差范围6.抽样平均误差,确切地说是所有样本指标(样本平均数和样本成数)的( )。
A.全距B.平均差C.标准差D.离散系数7.重复抽样条件下的抽样平均误差与不重复抽样条件下的抽样平均误差相比( )。
A.前者总是大于后者B.前者总是小于后者C.两者总是相等D.不能确定大小8.在抽样平均误差一定的条件下,要提高推断的可靠程度,必须()。
A.扩大误差B.缩小误差C.扩大极限误差D.缩小极限误差9.当提高抽样推断的可靠性时,则推断的准确性将( )。
A.保持不变B.随之缩小C.随之扩大D.无法确定10.计算抽样平均误差时,如有若干个样本方差的资料,应根据()计算。
A.最大一个B.最小一个C.中间一个D.平均值11.抽样平均误差和允许误差的关系是()。
A.抽样平均误差大于允许误差B.抽样平均误差等于允许误差C.抽样平均误差小于允许误差D.抽样平均误差可以大于、等于或小于允许误差)。
A.成数的数值越接近于1,成数标准差越大;B.成数的数值越接近于0,成数标准差越大;C.成数的数值越接近于0.5,成数标准差越大;D.成数的数值越接近于0.25,成数标准差越大。
13.纯随机重复抽样条件下,当允许误差△扩大一倍,则抽样单位数n()。
A.只需原来的1/2 B.只需原来的1/4 C.只需原来的1倍D.只需原来的倍14.根据抽样的资料,一年级优秀生比重为10%,二年级为20%,在抽样人数相等的条件下,优秀生比重的抽样平均误差()。
第七章 抽样调查一、本章重点1.抽样调查也叫做抽样推断或参数估计,必须坚持随机抽样的原则。
它是一种非全面调查,其意义在于对总体的推断上,存在可控制性误差。
是一种灵活快捷的调查方式。
2.抽样调查有全及总体与样本总体之区分。
样本容量小于30时一般称为小样本。
对于抽样调查来讲全及总体的指标叫做母体参数,是唯一确定的未知的量,样本指标是根据样本总体各单位标志值计算的综合性指标,是样本的一个函数,是一个随机变量,抽样调查就是要用样本指标去估计相应的总体指标。
样本可能数目与样本容量有关也与抽样的方法有关。
抽样方法可以分为考虑顺序的抽样与不考虑顺序的抽样;重复抽样与不重复抽样。
3.大数定律、正态分布理论、中心极限定理是抽样调查的数理基础。
正态分布的密度函数有两个重要的参数(σ;x )。
它有对称性、非负性等特点。
中心极限定理证明了所有样本指标的平均数等于总体指标如X x E =)(。
推出了样本分布的标准差为:1--=N n N n x σμ。
4.抽样推断在逻辑上使用的是归纳推理的方法、在方法上使用的是概率估计的方法、存在着一定误差。
无偏性、一致性和有效性是抽样估计的优良标准。
抽样调查既有登记性误差,也有代表性误差,抽样误差是一个随机变量,而抽样的平均误差是一个确定的值。
抽样误差受总体标志值的差异程度、样本容量、抽样方法、抽样组织形式的影响。
在重复抽样下抽样的平均误差与总体标志值的差异程度成正比,与样本容量的平方根成反比即n x σμ=,不重复抽样的抽样平均误差仅与重复抽样的平均误差相差一个修正因子即N nn x -=1σμ。
在通常情况下总体的方差是未知的,一般要用样本的方差来代替。
把抽样调查中允许的误差范围称作抽样的极限误差x ∆或p ∆。
μt =∆,用抽样的平均误差来度量抽样的极限误差。
把抽样估计的把握程度称为抽样估计的置信度。
抽样的极限误差越大,抽样估计的置信度也越大。
抽样估计又可区分为点估计和区间估计。
第七章 抽样推断与检验习题一、填空题1.抽选样本单位时要遵守 原则,使样本单位被抽中的机会 。
2.常用的总体指标有 、 、 。
3.在抽样估计中,样本指标又称为 量,总体指标又称为 。
4.全及总体标志变异程度越大,抽样误差就 ;全及总体标志变异程度越小,抽样误差 。
5.抽样估计的方法有 和 两种。
6.整群抽样是对被抽中群内的 进行 的抽样组织方式。
7.常用的离散型随机变量分布包括 、二项分布和 。
8.简单随机抽样的成数抽样平均误差计算公式是:重复抽样条件下: ;不重复抽样条件下: 。
9.误差范围△,概率度t 和抽样平均误差σ之间的关系表达式为 。
10.对总体指标提出的假设可以分为原假设和 。
二、单项选择题1.所谓大样本是指样本单位数在( )及以上A 30个B 50个C 80个 D100个2.抽样指标与总体指标之间抽样误差的可能范围是( )A 抽样平均误差B 抽样极限误差C 区间估计范围D 置信区间3.抽样平均误差说明抽样指标与总体指标之间的( )A 实际误差B 平均误差C 实际误差的平方D 允许误差4.成数方差的计算公式( )A P(1-P)B P(1-P)2C )1(P P -D P 2(1-P)5.总体平均数和样本平均数之间的关系是( )A 总体平均数是确定值,样本平均数是随机变量B 总体平均数是随机变量,样本平均数是确定值C 两者都是随机变量D 两者都是确定值6.对入库的一批产品抽检10件,其中有9件合格,可以( )概率保证合格率不低于80%。
A 95.45%B 99.7396C 68.27%D 90%7.在简单随机重复抽样情况下,若要求允许误差为原来的2/3,则样本容量( ) A 扩大为原来的3倍 B 扩大为原来的2/3倍C 扩大为原来的4/9倍D 扩大为原来的2.25倍8.假设检验是检验( )的假设值是否成立A 样本指标B 总体指标C 样本方差D 样本平均数9.在假设检验中的临界区域是( )A 接受域B 拒受域C 置信区间D 检验域10.假设检验和区间估计之间的关系,下列说法正确的是( )A 虽然概念不同,但实质相同B 两者完全没有关系C 互相对应关系D 不能从数量上讨论它们之间的对应关系三、多项选择题1.影响抽样误差大小的因素有( )A 抽样组织方式和抽样方法不同B 全及总体的标志变动度的大小C 样本单位数的多少D 抽样总体标志变动度的大小E 抽样的随机性2.常用的样本指标有( )A 样本平均数B 样本成数C 抽样误差D 样本方差E 标准差3.在简单随机重复抽样条件下,抽样单位数n 的计算公式为( )A 222x t n ∆=σB 22222σσt x N N t n +∆=C 22)1(Np p p t n -= D )1()1(222p p t p N p Np t n -+∆-= E 2222)1(Np p p t n -= 4.在总体2000个单位中,抽取20个单位进行调查,下列各项正确的是( ) A 样本单位数是20个 B 样本个数是20个C 一个样本有20个单位D 样本容量是20个E 是一个小样本5.若进行区间估计,应掌握的指标数值是( )A 样本指标B 概率度C 总体单位数D 抽样平均误差E 样本单位数6.参数估计方法有( )A 点估计B 区间估计C 统计估计D 抽样估计E 假设检验7.衡量点估计量好坏的标准有( )A 无偏性B 一致性C 有效性D 充分性E 随机性8.根据样本指标,分析总体的假设值是否成立的统计方法称为( )。