统计学第七章抽样推断
- 格式:ppt
- 大小:481.00 KB
- 文档页数:31
统计学中的抽样与推断在统计学中,抽样与推断是非常重要的概念。
它们涉及到我们如何从一小部分样本中推断出整个总体的特征。
在这篇文章中,我们将讨论抽样的不同方法以及如何使用样本数据进行推断。
一、抽样方法在统计学中,我们通常使用以下三种抽样方法:1. 简单随机抽样这是最基本的抽样方法。
简单随机抽样意味着从总体中随机抽出样本,每个样本被抽样的概率相等。
这种方法可以确保样本的代表性。
例如,如果我们要调查一个城市的人口,我们可以从人口登记簿中随机抽取一定数量的人口作为样本。
2. 分层抽样分层抽样是把总体划分为若干个层次,然后从每个层次中随机抽取样本。
这个方法可以减小代表性偏差。
例如,如果我们要调查一个城市的人口,我们可以按照不同的年龄段对总体进行分层,然后从每个年龄段中随机抽取一定数量的人口作为样本。
3. 系统抽样这是从总体中按照一定的规则抽样。
例如,如果我们要调查一个工厂中的员工,我们可以按照员工的工号顺序每隔一定数量抽取一个员工作为样本。
二、样本统计量的计算在进行统计推断之前,我们需要先计算样本统计量。
样本统计量是样本数据的数量指标,可以代表总体的特征。
常见的样本统计量包括:1. 样本均值样本均值是样本数据的平均值。
它可以代表总体的平均值。
例如,我们可以从一个城市的人口中随机抽取一部分人口,计算他们的平均收入,这个平均收入就是样本均值。
2. 样本标准差样本标准差是样本数据的标准差。
它可以代表总体的方差。
例如,我们可以从一个工厂中随机抽取一部分产品,计算它们的重量,这个重量的标准差就是样本标准差。
三、参数估计我们通常使用抽样中的样本统计量来估计总体参数。
例如,我们可以使用样本均值来估计总体均值,使用样本标准差来估计总体标准差。
常见的参数估计方法包括:1. 点估计点估计是用样本统计量来估计总体参数的方法。
例如,我们可以使用样本均值来估计总体均值,使用样本标准差来估计总体标准差。
2. 区间估计区间估计是用一个区间来估计总体参数的方法。
第七章 抽样调查一、本章重点1.抽样调查也叫做抽样推断或参数估计,必须坚持随机抽样的原则。
它是一种非全面调查,其意义在于对总体的推断上,存在可控制性误差。
是一种灵活快捷的调查方式。
2.抽样调查有全及总体与样本总体之区分。
样本容量小于30时一般称为小样本。
对于抽样调查来讲全及总体的指标叫做母体参数,是唯一确定的未知的量,样本指标是根据样本总体各单位标志值计算的综合性指标,是样本的一个函数,是一个随机变量,抽样调查就是要用样本指标去估计相应的总体指标。
样本可能数目与样本容量有关也与抽样的方法有关。
抽样方法可以分为考虑顺序的抽样与不考虑顺序的抽样;重复抽样与不重复抽样。
3.大数定律、正态分布理论、中心极限定理是抽样调查的数理基础。
正态分布的密度函数有两个重要的参数(σ;x )。
它有对称性、非负性等特点。
中心极限定理证明了所有样本指标的平均数等于总体指标如X x E =)(。
推出了样本分布的标准差为:1--=N n N n x σμ。
4.抽样推断在逻辑上使用的是归纳推理的方法、在方法上使用的是概率估计的方法、存在着一定误差。
无偏性、一致性和有效性是抽样估计的优良标准。
抽样调查既有登记性误差,也有代表性误差,抽样误差是一个随机变量,而抽样的平均误差是一个确定的值。
抽样误差受总体标志值的差异程度、样本容量、抽样方法、抽样组织形式的影响。
在重复抽样下抽样的平均误差与总体标志值的差异程度成正比,与样本容量的平方根成反比即n x σμ=,不重复抽样的抽样平均误差仅与重复抽样的平均误差相差一个修正因子即N nn x -=1σμ。
在通常情况下总体的方差是未知的,一般要用样本的方差来代替。
把抽样调查中允许的误差范围称作抽样的极限误差x ∆或p ∆。
μt =∆,用抽样的平均误差来度量抽样的极限误差。
把抽样估计的把握程度称为抽样估计的置信度。
抽样的极限误差越大,抽样估计的置信度也越大。
抽样估计又可区分为点估计和区间估计。
第七章抽样推断习题一、单项选择题1、抽样推断的主要目的是()①对调查单位作深入研究②计算和控制抽样误差③用样本指标来推算总体指标④广泛运用数学方法2、抽样调查与典型调查的主要区别是()①所研究的总体不同②调查对象不同③调查对象的代表性不同④调查单位的选取方式不同3、按随机原则抽样即()①随意抽样②有意抽样③无意抽样④选取样本时要求总体中每个单位都有相等的机会或可能性被抽中4、抽样应遵循的原则是()①随机原则②同质性原则③系统原则④及时性原则5、下列指标中为随机变量的是()①抽样误差②抽样平均误差③允许误差④样本容量6、下列指标中为非随机变量的是()①样本均值②样本方差③样本成数④样本容量7、样本是指()①任何一个总体②任何一个被抽中的调查单位③抽样单元④由被抽中的调查单位所形成的总体8、从单位总量为20的总体中,以简单随机重复抽样抽取5个单位,则可能的样本数目是()①250个②25个③3200000个④15504个9、从单位总量为20的总体中,以简单随机不重复抽样抽取5个单位,则可能的样本数目是()①250个②25个③3200000个④15504个10、抽样误差是指()①在调查过程中由于观察、测量等差错所引起的误差②在调查中违反随机原则出现的系统误差③随机抽样而产生的代表性误差④人为原因所造成的误差11、抽样极限误差是()①随机误差②抽样估计所允许的误差的上下界限③最小抽样误差④最大抽样误差12、抽样平均误差就是()①样本的标准差②总体的标准差③随机误差④样本指标的标准差13、在其它条件相同的情况下,重复抽样的抽样平均误差和不重复抽样的相比()①前者一定大于后者②前者一定小于后者③两者相等④前者可能大于、也可能小于后者14、在其它条件相同的情况下,重复抽样的估计精确度和不重复抽样的相比()①前者一定大于后者②前者一定小于后者③两者相等④前者可能大于、也可能小于后者15、抽样估计的可靠性和精确度()①是一致的②是矛盾的③成正比④无关系16、抽样推断的精确度和极限误差的关系是()①前者高说明后者小②前者高说明后者大③前者变化而后者不变④两者没有关系17、点估计的优良标准是()①无偏性、数量性、一致性②无偏性、有效性、数量性③有效性、一致性、无偏性④及时性、有效性、无偏性18、在简单随机重复抽样下,欲使抽样平均误差缩小为原来的三分之一,则样本容量应()①增加8倍 ②增加9倍 ③增加45倍 ④增加2.25倍 19、在简单随机重复抽样下,欲使抽样平均误差缩小31,则样本容量应( ) ①增加8倍 ②增加9倍③增加2.25倍 ④的确应考虑抽样方法和抽样组织形式等20、当总体单位数较大时,若抽样比为51%,则对于简单随机抽样,不重复抽样的平均误差约为重复抽样的( )①51% ②49%③70% ④30%21、在500个抽样产品中,有95%的一级品,则在简单随机重复抽样下一级品率的抽样平均误差为( )①0.9747% ②0.9545%③0.9973% ④0.6827%22、若样本均值为120,抽样平均误差为2,则总体均值在114—126之间的概率为( ) ①0.6827 ②0.90③0.9545 ④0.997323、若有多个成数资料可供参考时,确定样本容量或计算抽样平均误差应该使用( ) ①数值最大的那个成数 ②数值最小的那个成数③0.5 ④数值最接近或等于0.5的那个成数24、影响分类抽样平均误差大小的主要变异因素是( )①类内方差 ②类间方差③总体方差 ④样本方差25、影响整群抽样平均误差大小的主要变异因素是( )①群内方差 ②群间方差③总体方差 ④样本方差26、当有多个参数需要估计时,可以计算出多个样品容量n ,为满足共同的要求,必要的样本容量一般应是( )①最小的n 值 ②最大的n 值③中间的n 值 ④第一个计算出来的n 值27、抽样时需要遵循随机原则的原因是()①可以防止一些工作中的失误②能使样本与总体有相同的分布③能使样本与总体有相似或相同的分布④可使单位调查费用降低二、多项选择题1、抽样推断的优点()①时效性强②更经济③能够控制抽样估计的误差④适用范围广⑤无调查误差2、抽样推断适用于()①具有破坏性的场合②用于时效性要求强的场合③对于大规模总体和无限总体的场合进行调查④用于对全面调查的结果进行核查和修正⑤不必要进行全面调查,但又需要知道总体的全面情况时3、同其它统计调查比,抽样推断的特点是()①比重点调查更节省人、财、物力②以部分推断总体③采用高率估计的方法④可以控制抽样误差⑤按随机原则抽选样本4、目标总体与被抽样总体相比()①前者是所要认识的对象②后者是抽样所依据的总体③两者所包含的单位数有时相等,有时不等④两者所包含的单位数相等⑤两者是不同的概念,所包含的单位数不等5、重复抽样和不重复抽样差别有()①可能的样本数目不同②抽样误差的大小不同③抽样误差的计算公式不同④前者属于随机抽样,后者属于非随机抽样⑤两者适用的情况不同6、抽样推断()①是科学的资料收集方法②是科学的推断方法③是非全面调查④典型调查的一种7、抽样推断中哪些误差是可以避免的()①调查性误差②因抽样破坏随机原则而造成的系统性偏差③抽样误差④因抽样破坏随机原则而造成的方向性偏差8、抽样误差中不包括()①调查性误差②因抽样破坏随机原则而造成的系统性偏差③抽样误差④由于工作失误所造成的误差9、样本平均数的()①分布在大样本下服从或近似服从正态分布②平均数是总体平均数③方差是总体方差④平均数是随机变量⑤分布与总体的分布形式相同10、抽样平均误差是()①所有可能抽样误差的一般水平②总体标准差③估计量的标准差④无偏估计量的标准差⑤样本的标准差11、影响抽样平均误差的主要因素有()①总体的变异程度②样本容量③重复抽样和不重复抽样④样本各单位的差异⑤估计的可靠性和准确度的要求12、计算抽样平均误差时,若缺少总体方差和总体成数,可用的资料有()①过去抽样调查得到的相应资料②小规模调查得到的资料③样本资料④过去全面调查得到的资料⑤重点调查得到的资料13、极限误差是()①衡量估计准确度的尺度②大于抽样平均误差的确定数值③是满足一定可靠性要求的最大抽样误差的绝对值④最大抽样误差⑤小于抽样平均误差的确定数值14、区间估计的要素是()①点估计值②样本的分布③估计的可靠度④抽样极限误差⑤总体的分布形式15、抽样估计的优良标准主要有()①无偏性②一致性③可靠性④有效性⑤及时性16、影响必要样本容量的因素主要有()①总体的标志变异程度②允许误差的大小③重复抽样和不重复抽样④样本的差异程度⑤估计的可靠度17、假设检验()①用了反证法的思想,和数学中的反证法是有区别的②用了反证法的思想,和数学中的反证法是没有区别的③可能会犯第一类型错误,即“受伪”错误④可能会犯第二类型错误,即“弃真”错误⑤在样本容量固定时,犯“弃真”和“受伪”错误的概率是相互制约的,无法使它们同时尽可能地小18、类型抽样的优点是()①只适合对各类分别进行估计②只适合对总体进行估计③既可以对各类分别进行估计,也可以对总体进行估计④估计的效果较好,在实践中广泛应用⑤可使总体的方差减少19、系统抽样()①按无关标志排队的系统抽样,可看作不放回的简单随机抽样②按有关标志排队的系统抽样,其效果要高于不放回的简单随机抽样③按有关标志排队的系统抽样,其效果要低于不放回的简单随机抽样④要避免抽样间距和现象本身的周期性节奏相重合⑤在常见的抽样方法中,它的误差一定是最小的20、整群抽样中的群与分类抽样中的类相比()①两者相同②两者不同③两者的划分原则正好相反④要求群内差异大⑤要求类内差异大三、填空题1、抽样推断就是根据( )的信息去研究总体的特征。