第七章抽样推断 (2)
- 格式:ppt
- 大小:280.01 KB
- 文档页数:29
第七章抽样设计与推断第一节抽样设计一、抽样推断与抽样设计的概念(一)抽样推断抽样推断(Sampling inference)是在抽样调查的基础上,利用样本的实际资料计算样本指标(统计量),并据以推算总体相应特征值(总体参数)的一种统计分析方法。
抽样推断具有如下特点:第一,抽样推断是建立在随机取样的基础上。
按随机原则抽取样本单位,是抽样推断的前提。
所谓随机原则就是在抽选调查单位的过程中,完全排除人为的主观因素的干扰,以保证使现象总体中的每一个个体都有一定的可能性被选中。
换句话讲,哪些单元能够被选作调查单位纯属偶然因素的影响所致。
这里需说明几点:①随机并非“随意”。
随机是有严格的科学含义的,可用概率来描述,而“随便”仍带有人为的或主观的因素,它不是一个科学的概念;②随机原则不等于等概率原则;③随机原则一般要求总体中每个单元均有一个非零的概率被抽中;④抽样概率对总体参数的估计有影响。
只有坚持抽取的随机原则,才能使被抽中单位的频数分布类型与调查对象相同,从而增强被抽中单位对总体的代表性,达到推断总体的目的。
第二,抽样推断是由部分推算整体的—种认识方法。
即对抽取的调查单位进行调查研究,取得调查单位的实际资料,计算出调查单位的指标数值,并据以推断和估计总体的指标数值。
第三,抽样推断以概率论中的大数法则和中心极限定理为理论依据。
第四,抽样误差可以事先计算和控制。
抽样调查除具有十分明显的特色之外,还在实际应用过程中发挥着突出的作用。
其一,抽样调查能够解决全面调查所无法解决的现象的调查问题。
在实际工作中,对某些现象常常可能一方面需要了解其全面情况,另一方面又由于现象自身的特性决定了无法通过全面调查获取资料。
此时,只有使用抽样调查。
该类现象主要有:(1)产品质量的破坏性检验。
如轮胎的里程寿命试验,青砖的抗折耐压试验,炮弹的杀伤力试验,弹簧的抗拉强度试验等等。
(2)无限总体的调查。
无限总体所包含的总体单位数目无限多个,无法一一调查。
第七章整群抽样第一节整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取一部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
如果总体中的单元可以分成多级,则可以对前几级单元采用多阶抽样,而在最后一阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。
本章只讨论单级整群抽样。
设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。
当诸Mi都相等时,称为等群;否则,称为不等群。
采用整群抽样的两个理由:- 抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;- 从总体中直接抽选个体在实际中并不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
整群抽样包括两步:首先,总体被分为群;然后,在总体中抽取群的样本并访问群中的所有单元。
如果总体单元是自然分成组或群的,创建一个这种关于群的抽样框并对它们进行抽样比创建总体中所有单元的名录框更为容易。
或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而可以创建地域框。
群的抽取可以采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。
二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。
同分层抽样一样,整群抽样的前提是先要对总体进行分群。
关于群的划分,有两个问题:一是如何定义群,即当群并非是一个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。
这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。
而整群抽样只是在各群之间抽取一部分群进行调查,并在抽中的群内作全面调查。
因此,群间差异的大小直接影响到抽样误差的大小,而群内差异的大小则不影响抽样误差。
《第7章抽样推断》练习题一、单项选择题1、对某市居民生活状况作了一次抽样调查, 据样本资料计算, 平均每居民实际月生活费用76元, 抽样平均误差3元, 调查队推断市居民实际月生活费用在70—82之间, 这一推断的可靠程度为:A、68.27%B、95%C、95.45%D、99.73%2、在一定的抽样平均误差条件下,A、扩大极限误差范围,可以提高推断的可靠程度B、扩大极限误差范围,会降低推断的可靠程度C、缩小极限误差范围,可以提高推断的可靠程度D、缩小极限误差范围,不改变推断的可靠程度3、按设计标准,某自动食品包装机所包装食品的平均每袋重量应为500克。
若要检验该机实际运行状况是否符合设计标准,应该采用A、左侧检验B、右侧检验C、双侧检验D、左侧检验或右侧检验4、一所较大规模的大学教务部决定调整课程时间安排,以便提供足够的时间使大家可以为上课做好准备。
到目前为止,教务部认为课间安排20分钟的时间足够了。
表述零假设H0和备择假设H1A、H0:µ=20 H1:µ≠20B、H0:µ≥20 H1:µ<20C、H0:µ≤20 H1:µ>205、当我们根据样本资料对零假设作出接受或拒绝的决定时,可能出现的情况有:①当零假设为真时接受它;②当零假设为假时接受它;③当零假设为真时拒绝它;④当零假设为假时拒绝它.A、①B、②C、①②③D、①②③④6、根据某城市抽样调查225户,计算出户均储蓄额30000元,抽样平均误差800元,试问概率为90%,户均储蓄余额极限误差是多少?A、53.3B、1.65C、720D、13207、在其他条件不变的情况下,要使抽样误差减少1/3,则样本量必须增加多少倍?A、1/3B、1.25C、3D、9二、多项选择题1、推断统计学研究的主要问题是A、如何科学地确定总体B、如何科学地从总体中抽取样本C、怎样控制样本对总体地代表性误差D、怎样控制总体对样本地代表性误差E、由所抽取地样本去推断总体特征2、在抽样推断中,样本单位数的多少取决于A、总体标准差的大小B、允许误差的大小C、抽样估计的把握程度D、总体参数的大小E、抽样方法和组织形式3、抽样推断的概率度、可靠性和精确度的关系为()A、概率度增大,估计的可靠性也增大B、概率度增大,估计的精确度下降C、概率度减小,估计的精确度下降D、概率度减小,估计的可靠性增大E、估计的可靠性增大,估计的精确度也增大3、影响抽样平均误差大小的因素有A、样本各单位标志值的差异程度B、总体各单位标志值的差异程度C、样本单位数D总体单位数E、抽样方法4、在其他条件不变时,抽样估计的置信度(1-α)越大,则:A、允许误差范围越大B、允许误差范围越小C、抽样估计的精确度越高D、抽样估计的精确度越低E、抽样估计的可靠性越高5、在假设检验中,当我们作出拒绝原假设而接受备择假设的结论时,表示A、有充足的理由否定原假设B、原假设必定是错误的C、犯错误的概率不大于αD、犯错误的概率不大于βE、在原假设为真的假设下发生了小概率事件三、判断改错题1、在抽样推断中,作为推断的总体和作为观察对象的样本都是确定的、唯一的。
第七章抽样推断习题及答案一、名词解释1、抽样推断:2、抽样平均误差:3、极限误差:4、重复抽样:5、区间估计:5、类型抽样:二、填空题1、抽样推断是利用________推断________的一种统计分析方法。
2、在简单随机抽样条件下,重复抽样的抽样平均误差是不重复抽样的________倍。
3、在缺少总体方差的资料时,可以用________来推断总体方差,计算抽样平均误差。
4、扩大极限误差的范围,可以________推断的可靠程度;缩小极限误差的范围,则会________推断的可靠程度。
三、单项选择题1、抽样必须遵循的基本原则是()A、灵活性原则B、可靠性原则C、准确性原则D、随机原则2、抽样平均误差是()A、登记性误差B、代表性误差c、系统性误差 D、随机误差3、抽样平均误差和极限误差的关系是()A、抽样平均误差大于极限误差B、抽样平均误差等于极限误差C、抽样平均误差小于极限误差D、抽样平均误差可能大于、等于或小于极限误差4、在其他条件不变的情况下,如果允许误差缩小为原来的1/2,则样本单位()A、扩大为原来的2倍B、扩大为原来的4倍C、缩小为原来的1/2倍D、缩小为原来的1/4倍5、一般来说, 在抽样组织形式中,抽样误差较大的是()A、简单抽样B、类型抽样C、等距抽样D、整群抽样6、根据抽样的资料, 一年级优秀生比重为20%, 二年级为10%,在人数相等时,优秀生比重的抽样误差()A、一年级较大B、二年级较大C、相同D、无法判断7、根据重复抽样的资料, 甲项目工人工资方差为25,乙项目为100,乙单位人数比甲单位多3倍, 则抽样误差()A、甲单位较大B、无法判断C、乙单位较大D、相同8、一个全及总体()A、只能抽取一个样本B、可以抽取多个样本C、只能计算一个指标D、只能抽取一个单位9、最符合随机原则地抽样组织形式是()A、整群抽样B、类型抽样C、阶段抽样D、简单随机抽样四、多项选择题1、抽样估计的抽样平均误差()A、是不可以避免的B、是可以改进调查方法消除的C、是可以事先计算的D、只有调查结束之后才能计算E、大小是可以控制的2、影响样本单位数目的因素有()A、推断的可靠程度B、抽样方法C、抽样组织方式D、允许误差的大小E、总体各单位标志变异程度3、提高推断的可靠程度, 可以采取的办法是()A、扩大估计值的误差范围B、缩小估计值的误差范围C、增大概率度D、降低概率度E、增加样本单位数4、影响抽样平均误差的因素有()A、总体标志变异程度B、抽样方法C、样本单位D、抽样组织形式E、样本指标值的大小5、和重复抽样相比,不重复抽样的特点是()A、总体单位数在抽选过程中逐渐减少B、总体中每个单位都有被多次抽中的可能C、总体中每个单位没有被多次抽中的可能D、样本可能数目要多些E、样本可能数目要少些6、总体标准差未知时, 常用的替代办法有()A、用过去调查的同类问题的经验数据B、用样本的标准差C、凭调查者经验确定D、用总体方差E、大致确定7、在抽样组织方式中,为提高样本对总体的代表性的组织方式有()A、简单随机抽样B、分组抽样C、机械抽样D、整群抽样E、阶段抽样8、在抽样组织方式中,为简化抽样工作的组织方式有()A、简单随机抽样B、分组抽样C、机械抽样D、整群抽样E、阶段抽样五、简答题1、影响抽样平均误差的因素有哪些?2、影响必要样本单位数目的因素有哪些?3、抽样平均误差、抽样极限误差和概率度三者之间是何关系?六、计算分析题1、某学校英语三级等级考试,学生成绩呈正态分布,根据经验标准差为10分,今随机抽样100名同学,得平均分为65分,当概率保证程度为95.45%时,推断该校同学的平均成绩的范围。
第七章抽样本章讨论抽样。
对抽样的统计学原理我们不作详细介绍,重点讨论抽样的过程和具体的操作。
抽样是一项非常重要的技术,在自然科学和社会科学的各个领域广泛运用。
自然科学方面包括化学、天文学、机械工程学和动物学等。
在社会科学研究中,抽样技术可用于实验、调查、内容分析等研究。
7.1 抽样原理7.1.1 为什么要抽样抽样是从一大批研究对象中选出一小群作为研究对象,如从20000人中选出150人。
用抽样方法获得的研究对象称为样本(sample)。
研究中用样本作为具体操作对象比用所有对象要经济得多。
然而研究者感兴趣的不仅仅是样本,他的目的是以小见大,希望把从样本得出的结论推广至全体研究对象。
“管中窥豹,可见一斑”。
数学理论和科学研究的实践业已表明,抽样是非常有效的技术。
如果使用正确,两千多个个体的样本,可有效地代表有两亿个成员的研究对象总体,出错的概率不超过百分之二到四。
这种以小见大,以少胜多并非无稽之谈,而是有缜密的统计学原理为依据,并已一再被经验证据所证实。
并非所有样本都可使结论推而广之,抽取样本必须遵守严密的程序,而且从任何样本得出的结论都必须附带说明,表明其局限性。
7.1.2 总体、个体和抽样框架研究者从一大批研究对象中抽取样本。
这些研究对象是一个个的个体(elements),有时称作个案(cases),可以是个人、群体或组织,也可以是信息、文档,甚至是社会行为(如离婚、吸毒、乱扔垃圾)。
这些都是研究者拟测量或可以测量的事物。
拟定研究对象的全体叫做总体(population)或全域(universe)。
总体是抽样的基础,必须严格界定,没有定义清晰的总体就谈不上抽样。
总体有三个要素:内容、范围和时间。
内容即组成总体的个体单位是什么:人、物还是机构等;范围即总体所处的空间界限,包括地理位置;时间即总体存在的时间界限。
表7.1举例说明了抽样的个体单位(人、企业、医院住院人次、商业广告),地理位置和时间界限。
第七章抽样推断习题一、单项选择题1、抽样推断的主要目的是()①对调查单位作深入研究②计算和控制抽样误差③用样本指标来推算总体指标④广泛运用数学方法2、抽样调查与典型调查的主要区别是()①所研究的总体不同②调查对象不同③调查对象的代表性不同④调查单位的选取方式不同3、按随机原则抽样即()①随意抽样②有意抽样③无意抽样④选取样本时要求总体中每个单位都有相等的机会或可能性被抽中4、抽样应遵循的原则是()①随机原则②同质性原则③系统原则④及时性原则5、下列指标中为随机变量的是()①抽样误差②抽样平均误差③允许误差④样本容量6、下列指标中为非随机变量的是()①样本均值②样本方差③样本成数④样本容量7、样本是指()①任何一个总体②任何一个被抽中的调查单位③抽样单元④由被抽中的调查单位所形成的总体8、从单位总量为20的总体中,以简单随机重复抽样抽取5个单位,则可能的样本数目是()①250个②25个③3200000个④15504个9、从单位总量为20的总体中,以简单随机不重复抽样抽取5个单位,则可能的样本数目是()①250个②25个③3200000个④15504个10、抽样误差是指()①在调查过程中由于观察、测量等差错所引起的误差②在调查中违反随机原则出现的系统误差③随机抽样而产生的代表性误差④人为原因所造成的误差11、抽样极限误差是()①随机误差②抽样估计所允许的误差的上下界限③最小抽样误差④最大抽样误差12、抽样平均误差就是()①样本的标准差②总体的标准差③随机误差④样本指标的标准差13、在其它条件相同的情况下,重复抽样的抽样平均误差和不重复抽样的相比()①前者一定大于后者②前者一定小于后者③两者相等④前者可能大于、也可能小于后者14、在其它条件相同的情况下,重复抽样的估计精确度和不重复抽样的相比()①前者一定大于后者②前者一定小于后者③两者相等④前者可能大于、也可能小于后者15、抽样估计的可靠性和精确度()①是一致的②是矛盾的③成正比④无关系16、抽样推断的精确度和极限误差的关系是()①前者高说明后者小②前者高说明后者大③前者变化而后者不变④两者没有关系17、点估计的优良标准是()①无偏性、数量性、一致性②无偏性、有效性、数量性③有效性、一致性、无偏性④及时性、有效性、无偏性18、在简单随机重复抽样下,欲使抽样平均误差缩小为原来的三分之一,则样本容量应()①增加8倍 ②增加9倍 ③增加45倍 ④增加2.25倍 19、在简单随机重复抽样下,欲使抽样平均误差缩小31,则样本容量应( ) ①增加8倍 ②增加9倍③增加2.25倍 ④的确应考虑抽样方法和抽样组织形式等20、当总体单位数较大时,若抽样比为51%,则对于简单随机抽样,不重复抽样的平均误差约为重复抽样的( )①51% ②49%③70% ④30%21、在500个抽样产品中,有95%的一级品,则在简单随机重复抽样下一级品率的抽样平均误差为( )①0.9747% ②0.9545%③0.9973% ④0.6827%22、若样本均值为120,抽样平均误差为2,则总体均值在114—126之间的概率为( ) ①0.6827 ②0.90③0.9545 ④0.997323、若有多个成数资料可供参考时,确定样本容量或计算抽样平均误差应该使用( ) ①数值最大的那个成数 ②数值最小的那个成数③0.5 ④数值最接近或等于0.5的那个成数24、影响分类抽样平均误差大小的主要变异因素是( )①类内方差 ②类间方差③总体方差 ④样本方差25、影响整群抽样平均误差大小的主要变异因素是( )①群内方差 ②群间方差③总体方差 ④样本方差26、当有多个参数需要估计时,可以计算出多个样品容量n ,为满足共同的要求,必要的样本容量一般应是( )①最小的n 值 ②最大的n 值③中间的n 值 ④第一个计算出来的n 值27、抽样时需要遵循随机原则的原因是()①可以防止一些工作中的失误②能使样本与总体有相同的分布③能使样本与总体有相似或相同的分布④可使单位调查费用降低二、多项选择题1、抽样推断的优点()①时效性强②更经济③能够控制抽样估计的误差④适用范围广⑤无调查误差2、抽样推断适用于()①具有破坏性的场合②用于时效性要求强的场合③对于大规模总体和无限总体的场合进行调查④用于对全面调查的结果进行核查和修正⑤不必要进行全面调查,但又需要知道总体的全面情况时3、同其它统计调查比,抽样推断的特点是()①比重点调查更节省人、财、物力②以部分推断总体③采用高率估计的方法④可以控制抽样误差⑤按随机原则抽选样本4、目标总体与被抽样总体相比()①前者是所要认识的对象②后者是抽样所依据的总体③两者所包含的单位数有时相等,有时不等④两者所包含的单位数相等⑤两者是不同的概念,所包含的单位数不等5、重复抽样和不重复抽样差别有()①可能的样本数目不同②抽样误差的大小不同③抽样误差的计算公式不同④前者属于随机抽样,后者属于非随机抽样⑤两者适用的情况不同6、抽样推断()①是科学的资料收集方法②是科学的推断方法③是非全面调查④典型调查的一种7、抽样推断中哪些误差是可以避免的()①调查性误差②因抽样破坏随机原则而造成的系统性偏差③抽样误差④因抽样破坏随机原则而造成的方向性偏差8、抽样误差中不包括()①调查性误差②因抽样破坏随机原则而造成的系统性偏差③抽样误差④由于工作失误所造成的误差9、样本平均数的()①分布在大样本下服从或近似服从正态分布②平均数是总体平均数③方差是总体方差④平均数是随机变量⑤分布与总体的分布形式相同10、抽样平均误差是()①所有可能抽样误差的一般水平②总体标准差③估计量的标准差④无偏估计量的标准差⑤样本的标准差11、影响抽样平均误差的主要因素有()①总体的变异程度②样本容量③重复抽样和不重复抽样④样本各单位的差异⑤估计的可靠性和准确度的要求12、计算抽样平均误差时,若缺少总体方差和总体成数,可用的资料有()①过去抽样调查得到的相应资料②小规模调查得到的资料③样本资料④过去全面调查得到的资料⑤重点调查得到的资料13、极限误差是()①衡量估计准确度的尺度②大于抽样平均误差的确定数值③是满足一定可靠性要求的最大抽样误差的绝对值④最大抽样误差⑤小于抽样平均误差的确定数值14、区间估计的要素是()①点估计值②样本的分布③估计的可靠度④抽样极限误差⑤总体的分布形式15、抽样估计的优良标准主要有()①无偏性②一致性③可靠性④有效性⑤及时性16、影响必要样本容量的因素主要有()①总体的标志变异程度②允许误差的大小③重复抽样和不重复抽样④样本的差异程度⑤估计的可靠度17、假设检验()①用了反证法的思想,和数学中的反证法是有区别的②用了反证法的思想,和数学中的反证法是没有区别的③可能会犯第一类型错误,即“受伪”错误④可能会犯第二类型错误,即“弃真”错误⑤在样本容量固定时,犯“弃真”和“受伪”错误的概率是相互制约的,无法使它们同时尽可能地小18、类型抽样的优点是()①只适合对各类分别进行估计②只适合对总体进行估计③既可以对各类分别进行估计,也可以对总体进行估计④估计的效果较好,在实践中广泛应用⑤可使总体的方差减少19、系统抽样()①按无关标志排队的系统抽样,可看作不放回的简单随机抽样②按有关标志排队的系统抽样,其效果要高于不放回的简单随机抽样③按有关标志排队的系统抽样,其效果要低于不放回的简单随机抽样④要避免抽样间距和现象本身的周期性节奏相重合⑤在常见的抽样方法中,它的误差一定是最小的20、整群抽样中的群与分类抽样中的类相比()①两者相同②两者不同③两者的划分原则正好相反④要求群内差异大⑤要求类内差异大三、填空题1、抽样推断就是根据( )的信息去研究总体的特征。
第七章抽样调查一、抽样原理1、定义抽样调查是按照随机原则从被研究对象的总体中(全部研究对象)抽取一部分单位进行调查观察,并运用数理统计的原理,以调查所得的指标(实际观察数值)来推断被研究总体的相应指标达到对总体的认识。
简言之,抽样调查就是从总体中抽取一定数量的样本来推断总体的情况。
2、抽样调查的特点⑴随机原则。
所谓随机原则,就是说在我们所研究的总体中,每一个个案都有被选中、抽取的机会。
也即我们在总体中抽样时,哪一个个案能被抽取,哪一个个案不能被抽取,不是人为主观决定的,而完全是偶然碰机会的。
⑵从数量上推算全体。
抽样调查是抽取部分个案进行调查,但它的主要目的不是为了了解这部分单位本身,而是为了据此从数量上推算全体。
⑶抽样调查使我们有可能用更少的人力、物力、时间、费用达到对总体的认识,而且可以起到丢普查资料进行修正补充,提高大范围调查的准确程度的作用,因而在理论上和方法上都具有重要的意义。
3、几个概念⑴总体也称为母体、一般总体等。
是指具有某种统计特征的一类事物的全部个案。
也即,研究对象的全体称为总体。
例如,某批产品、某类病人、某个生产过程等。
总体的单位数通常用符号N来表示。
⑵个体也称为个案、元素。
组成总体的每个元素称为个体。
有时也称具有某种统计特征的每一个对象为个案构成一个总体的个案,可以是人或物,也可以指个性、心理反应等。
⑶样本也称为抽样总体、样本总体等从总体中抽取一部分代表进行研究分析时,这一部分被抽取的个案称为总体中的一个样本。
也就是说,从总体中抽取的若干个案所组成的群体,称之为样本。
总体是大群体,样本是小群体。
在社会研究中,资料的收集工作往往是在样本中完成的。
样本的单位数(即样本容量)常用符号n来表示。
⑷抽样从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素(即抽取总体的一个子集)的过程,或者说,抽样是从总体中按一定方式选择或抽样样本的过程。
(5)抽样单位就是一次直接的抽样所使用的基本单位。