当前位置:文档之家› 抽样误差研究

抽样误差研究

抽样误差研究
抽样误差研究

如何合理选择抽样样本数

一、研究介绍:

研究背景:众所周知,抽样样本数的大小对调查结果的准确度有很大的影响,从统计上可以计算出每个抽样样本数所对应的抽样误差有多少。但大多数客户对抽样误差缺乏直观的感觉,无法清晰了解应该选择多大的抽样误差才能满足自己的实际需求,因此也就无从有效控制成本。另外,对于定性研究来说,也需要采用另外的指标来衡量多大的样本量才能满足定性研究的需求。

研究课题:1. 定性研究应该采用多大的样本量才能有效解决问题?

2. 定量研究中,采用不同数量的抽样样本,可达到怎样的研究效果?

研究方法:我们以过往某个调查项目的总样本数(4450样本)为母体样本,从中分别随机抽取5样本,10样本,20样本,30样本,50样本,80样本,100样本,200样本,300样本来比较其结果,为了充分了解每种样本量的抽样结果,每种样本量重复抽取30次。对比的问题指标为:不提示品牌知名度。

二、研究的主要结论:

三、详细研究分析

(一)定性样本需求分析

1、答案获得率分析

概念:答案获得率是指在调查中的答案个数与实际总体答案个数的比例。定性研究是属于探测性研究,因此不太在乎量

化的数据,而会更关注能否获得足够的答案数以供进一步的定量研究,也就是说答案获得率是否足够。

在本次研究中,采用的4450个母体样本中,果汁品牌共有17个,也就是说实际总体答案个数就是17个。因此,我们只需要对比每种抽样样本量下的平均答案个数,就可以知道该抽样样本量的答案获得率。

统计结果如下表:

从上面图表可得出,5样本的调查仅能拿到一半的答案,10样本获得七成的答案,15样本可得到80%的答案,而30样本是拐点,再得到90%的答案后,再增加样本量对答案获得率的帮助不大。

2、主要答案获得率

进一步分析,我们需要了解各种抽样样本是否能得到主要的答案。下面是17个果汁品牌的不提示知名度,不提示知名度的高低代表了这个品牌的广泛性。以下是每种样本量下的各答案获得率。从图中可以看到,5样本量只能保证获得知名度最高的两个品牌,而10样本量可以保证获得不提示知名度在20%以上的5个品牌,而15样本量及30样本量可以保证获得不提示知名度在10%以上的品牌。

3、小结

综合前面两点分析,我们可得出结论:定性研究最低需要15样本或2组座谈会的量,才能获得大部分的答案并覆盖到主要的答案。如果需要对比研究细分群体,则每个细分群体也应该最少是2组座谈会放可保证效果。

(二)定量样本需求分析

(1)抽样误差分析

抽样误差是评估样本量的一个常用指标,我们的研究人员计算出了在95%的置信程度下各样本量的抽样误差,具体结果如下图:

(2)实际的调查结果分析

知道了抽样误差,大多数客户仍然很难知道应该如何根据实际情况选择抽样样本数。因此,我们在这部分会用图像来展示各种抽样样本量的调查结果,去更好地了解不同样本量可达到的研究效果。

1、20样本:调查结果与真实值相差很大,基本不能反映统计意义

2、30样本:调查结果基本可以分出高、中、低的区别,但多数值与真实值有一定的误差

3、50样本:调查结果同样可以分出高、中、低的区别,但有2-3个数值会与真实值有较大背离

4. 、100样本:调查结果开始接近现实,能反映市场大致情况,但数据排名的稳定性不够,不能作为跟踪对比的依据

5、150样本量:调查结果更接近现实,误差明显减少,但仍然不够稳定。

6、200样本量:调查结果相当接近真实情况,30次可能会有一次与真实的排名有误差。

7、300样本量:调查结果基本上与现实一致,是非常优秀的定量研究调查样本量

(3)小结

30-50样本可作为量化分辨高、中、低结果的基本样本。当样本量达到100的时候,抽样的调查情况可以反映市场的大体情况,但作为排名的结果依据仍然不充分。而样本量上升至200的时候,结果很接近真实值,但多次抽样结果仍然有不稳定的情况,用于跟踪研究并不太妥当。300的样本量在准确性及稳定性都相当好,是优秀的定量研究样本量。

总结

综合以上所述,下表整理了我们所研究的各个样本量的特点以及可以达到的研究效果:

第六章、抽样估计

第六章、抽样估计 一、单项选择题(在每小题的四个备选答案中,选出一个正确答案) 1,抽样误差是指() A. 由于观察、计算等差错所引起的登记误差 B.抽样中违反随机原则出现的系统误差 C. 随机抽样而产生的代表性误差 D.认为原因所造成的误差 2.抽样误差() A.既可以避免,也可以控制 B. 既不可以避免,也不可以控制 C. 可以避免, 但不可以控制 D. 不能避免, 但可以控制 3. 抽样平均误差反映了样本估计量与总体参数之间的( ) A. 实际误差 B. 可能误差范围 C. 平均差异程度 D. 实际误差的绝对值 4.抽样平均误差是( ) A. 总体参数的标准差 B. 样本的标准差 C.样本估计量的标准差 D. 样本估计量的平均差 5.在其他条件不变的情况下, 不重复抽样的抽样误差比重复抽样的抽样误差( ) A. 大 B. 小 C. 可大可小 D. 相等 6. 反映样本估计量与总体参数之间抽样误差的可能范围的是( ) A. 抽样平均误差 B. 抽样极限误差 C. 实际抽样误差 D. 置信水平 7.简单随机抽样条件下, 当极限误差扩大一倍, 则样本容量( ) A. 只需原来的1/2 B. 只需原来的1/4 C. 需要原来的1倍 D. 需要原来的4倍 8.在其他条件不变的情况下, 总体方差越大, 所需样本容量( ) A. 越多 B. 越少 C. 可多可少 D. 不受影响 9.下列描述不正确的是( ) A.样本统计量是一种随机变量 B.样本统计量不是一种随机变量 C.每个随机变量都有其概率分布 D.样本统计量概率分布就是抽样分布 10.中心极限定理证明了:当总体期望值和方差存在、且有限时,随机抽样下的大样本均值服从下列分布() A.N(0,1) B.N() C.N() D.t(n-1)

(完整版)第五章抽样调查习题答案

《统计学》习题五参考答案 一、单项选择题: 1、抽样误差是指()。C A在调查过程中由于观察、测量等差错所引起的误差 B人为原因所造成的误差C随机抽样而产生的代表性误差 D在调查中违反随机原则出现的系统误差 2、抽样平均误差就是()。D A样本的标准差 B总体的标准差 C随机误差 D样本指标的标准差 3、抽样估计的可靠性和精确度()。B A是一致的 B是矛盾的 C成正比 D无关系 4、在简单随机重复抽样下,欲使抽样平均误差缩小为原来的三分之一,则样本容量应()。A A增加8倍 B增加9倍 C增加1.25倍 D增加2.25倍 5、当有多个参数需要估计时,可以计算出多个样品容量n,为满足共同的要求,必要的样本容量一般应是()。B A最小的n值 B最大的n值 C中间的n值 D第一个计算出来的n值 6、抽样时需要遵循随机原则的原因是()。C A可以防止一些工作中的失误 B能使样本与总体有相同的分布 C能使样本与总体有相似或相同的分布 D可使单位调查费用降低 二、多项选择题: 1、抽样推断中哪些误差是可以避免的()。A B D A工作条件造成的误差 B系统性偏差 C抽样随机误差 D人为因素形成偏差 E抽样实际误差 2、区间估计的要素是()。A C D A点估计值 B样本的分布 C估计的可靠度 D抽样极限误差 E总体的分布形式 3、影响必要样本容量的因素主要有()。A B C E A总体的标志变异程度 B允许误差的大小 C重复抽样和不重复抽样 D样本的差异程度 E估计的可靠度 三、填空题: 1、抽样推断就是根据()的信息去研究总体的特征。样本 2、样本单位选取方法可分为()和()。重复抽样不重复抽样 3、实施概率抽样的前提条件是要具备()。抽样框 4、对总体参数进行区间估计时,既要考虑极限误差的大小,即估计的()问题,又要考虑估计的()问题。准确性可靠性 四、简答题:

抽样误差

文案调研资料的来源 评比量表例如:美国人与阿尔巴尼亚人交往的意愿 A .你愿意让阿尔巴尼亚人住在你的国家吗? B .你愿 文案调研资料的来源 企业内部资料 企业外部资料 1、业务资料 2、统计资料 3、财务资料 4、企业积累的其他资料 1、统计部门与各级各类政府主管部门公布的有关资料 2、各种经济信息中心、专业信息咨询机构、专业调查机构、各行业协会和联合会提供的市场信息 3、各地电台、电视台提供的有关市场信息 4、国内外有关的书籍、报纸、杂志所提供的文献资料 5、有关生产和经营机构3提供的信息和资料,如商品目录、广告说明书、专利资料及商品价目表等 6、各种国际组织、外国使馆、商会所提供的市场信息 7、各种国内外博览会、展览会、交易会、订货会等会议以及专业性、学术性经验交流会议上所发放的文件和资料 8、互联网提供的信息

意让阿尔巴尼亚人住进你的社区吗?C .你愿意让阿尔巴尼亚人住在你家附近吗?D .你愿意让阿尔巴尼亚人住在你的隔壁吗?E .你愿意让你的孩子与阿尔巴尼亚人结婚吗? 瑟斯顿量表研究者提出若干个可能的指标项目 例如:了解人们对一周5天工作日的看法 五天工作日对于人们精神健康是绝对必要的;五天工作日是社会进步的一种表现 五天工作日是生产力提高的结果;五天工作日是对劳动者基本权利的保证;五天工作日没有必要;五天工作日会使人变得懒散 ;五天工作日有助于经济繁荣;五天工作日会减少人们的收入;………… 请您给下面的观点打分:很同意(5分) 比较同意(4分) 讲不请(3分)不太同意(2分) 很不同意(1分)1、越是有钱,越应该参加保险2、年轻人没有必要买养老保险3、只有人们的收入达到一定的水平,才会考虑 保险4、我不大爱生病,没必要参加保险公司推出的医疗保险 ……10、目前保险定价合理 语义差异量表 7 6 5 4 3 2 1 愉悦的 不悦的 简单的 复杂的 不和谐的 和谐的 传统的 现代的 配对比较量 可乐饮料在消费者心目中中的地位认为牌子i 较牌子j 为佳的人数分布 认为牌子i 较牌子j 为佳的比率 B(2.85)>C(2.15)>A(1.60)>D(1.40) 一..抽样中的误差问题 估计量方差:描述估计精度的重要指标 偏差:反映估计量的系统性误差 均方误差:更综合地反映估计误差的情况 二.抽样误差抽样中的误差可以分为抽样误差和非抽样误差两类 抽样误差:由于抽样的随机性造成的误差;定义式 ; 影响因素:总体分布、样本量、 抽样方式和估计方式非抽样误差 差、调查人员误差、受访者误差 样本量的确定 一.影响样本量的因素1.调查精度 2.总体变异度3.总体规模 4.无回答情况5.调查经费情况 二.确定样本量的方法1.非概率抽样,样本量确定主要根据经验判断; 2.概率抽样,需要在计算的基础上确定 三.样本量的计算 i j A B C D A - 80 70 40 B 20 - 30 15 C 30 70 - 35 D 60 85 65 - A B C D A 0.50 0.80 0.70 0.40 B 0.20 0.50 0.30 0.50 C 0.30 0.70 0.50 0.35 D 0.60 0.85 0.65 0.50 合计 1.60 2.85 2.15 1.40 2 ???()()V E E θθθ?? =-?? ??()()B ias E θθθ =-2???()()()M SE V Bias θθθ=+?()S θ= ()S y = =

统计学各章练习——抽样推断

第九章抽样推断 一、名词 1、抽样推断:即由样本指标来推断总体指标的统计方法。 2、抽样误差:是指抽样指标和全及指标之间的绝对离差。 3、抽样极限误差:是指样本指标与全及指标之间产生的抽样误差被允许的最大可能范围,也叫允许误差。 4、点估计:就是直接用样本指标代表总体指标的估计方法。 5、区间估计:就是把抽样指标与抽样平均误差结合起来,来推断总体指标所在的可能范围的方法。 6、假设检验:就是先对研究总体的参数做出某种假设,然后抽取样本,构造适当的统计量,利用样本提供的信息对假设的正确性进行判断的过程。 二、填空题 1.抽样推断是由(样本指标)来推断(相应的全及指标)的统计方法。 2.影响抽样误差大小的因素主要有:总体各单位标志值的差异程度、(样本的单位数目)、(抽样的具体方法)和抽样调查的组织形式。 3.抽样误差是由于抽样的(随机性)而产生的误差,这种误差不可避免,但可以控制在(所允许的范围)之内。 4.抽样平均误差是样本平均数的(标准差),是所有可能样本指标与总体指标之离差的(平均数)。 5.抽样极限误差,是指样本指标与全及指标之间产生的(抽样误差)被允许的(最大可能范围)。 6.用样本指标估计总体指标,要做到三个要求,即:(无偏性)、(一致性)、(有效性)。 7.抽样估计的方法有(点估计)和(区间估计)两种。 8.总体参数的区间估计必须同时具备(估计值)、(抽样误差范围)和(概率保证程度)三个要素。 9.总体中各单位标志值之间的变异程度越大,要求的样本单位数就(越多),即样本容量就(越大),总体各单位标志值变异程度与样本容量之间成(正比)。 10.允许误差越大,需要的样本单位数目就(越少);允许误差越小,需要的样本单位数目就(越多)。 11.对推断结果要求的可靠程度越高,必要样本单位数目就(越多);反之,可靠程度越低,必要样本单位数目就(越少)。 12.参数估计是用样本统计量估计(总体参数),而假设检验则是先对总体参数(提出假设),然后,运用样本资料验证假设(是否成立)。 三、判断 1.在抽样推断中,作为推断对象的总体和作为观察对象的样本都是确定、唯一的。(×) 2.样本容量指从一个总体中可能抽取的样本个数。(×) 3.抽样极限误差总是大于抽样平均误差。(×) 4.重复抽样误差大于不重复抽样误差。(√) 5.抽样准确度要求高,则可靠性低。(√) 6.抽样平均数的标准差或抽样成数的标准差是衡量抽样误差一般水平的尺度。(√) 7.点估计就是以样本的实际值直接作为相应总体参数的估计值。(√) 8.抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。(√) 四、选择 (一)单项选择 1.抽样调查所遵循的基本原则是(B)。

第六章 抽样(习题解答)

第六章抽样 一、辨析题 1、一般来说,任意抽样技术适用于正式的实际调查。 错误。适用于非正式的探测性调查,或调查前的准备工作。 2、一般说来,总体中各单位之间标志值的变异程度越大,需要抽样的样本数目越多;反之,需要抽样的样本数目越少。 正确 3、分层最佳抽样法指的是等比例分层抽样。 错误。这是非比例分层抽样。 4、一般而言,抽样的样本占总体的比例同抽样误差成反向关系,即抽样比例越大,抽样误差相对越小。 正确 5、抽样误差是随机抽样调查中必然发生的代表性误差,所以平均误差是不可避免的。而且,这种误差一般包括了技术性误差,即调查工作中的误差。 错误。这种误差一般不包括技术性误差即调查工作中的误差。 6、总体单位之间标志变异程度越大,抽样误差越大;反之则越

小。 正确 7、样本单位数目越多,抽样误差越大,反之则越小。 错误。样本单位数目越多,抽样误差越小,反之则大。 8、一般来说,简单随机抽样比分层、分群抽样误差大,不重复抽样比重复抽样误差大。 错误。重复抽样比不重复抽样误差大。 9、点值估计是考虑了抽样误差,直接以样本指标作为总体指标的估计值,作近似的估计。 错误,不考虑抽样误差。 二、名词解释 1、抽样调查 抽样调查也称为抽查,是指从调查总体中抽选出一部分要素作为样本,对样本进行调查,并根据抽样所得的结果推断总体的一种专门性的调查活动。 2、抽样 抽样是指在抽样调查时采用一定的方法,抽选具有代表性的样本,以及各种抽样操作技巧和工作程序等的总称。 3、随机抽样 随机抽样又称为概率抽样或机率抽样,是对总体中每一个体都给予平等的抽取机会的抽样技术。在随机抽样的条件下,每个个体抽中或抽不中完全凭机遇,

抽样误差

抽样误差 抽样误差(Sampling error) [编辑] 什么是抽样误差 在抽样检查中,由于用样本指标代替全及指标所产生的误差可分为两种:一种是由于主观因素破坏了随机原则而产生的误差,称为系统性误差;另一种是由于抽样的随机性引起的偶然的代表性误差。抽样误差仅仅是指后一种由于抽样的随机性而带来的偶然的代表性误差,而不是指前一种因不遵循随机性原则而造成的系统性误差。 总的说来,抽样误差是指样本指标与全及总体指标之间的绝对误差。在进行抽样检查时不可避免会产生抽样误差,因为从总体中随机抽取的样本,其结构不可能和总体完全一致。例如样本 平均数与总体平均数之差,样本成数与总体成数之差| p? P | 。虽然抽样误差不可避免,但可以运用大数定律的数学公式加以精确地计算,确定它具体的数量界限,并可通过抽样设计加以控制。 抽样误差也是衡量抽样检查准确程度的指标。抽样误差越大,表明抽样总体对全及总体的代表性越小,抽样检查的结果越不可靠。反之,抽样误差越小,说明抽样总体对全及总体的代表性越大,抽样检查的结果越准确可靠。在统计学中把抽样误差分为抽样平均误差和抽样极限误差,下面就这两种误差分别进行阐释。为使推理过程简化,这里不对属性总体进行分析,而仅对变量总体进行分析计算。 [编辑] 抽样误差的计算

1、表现形式:平均数指标抽样误差;成数(比重)抽样误差。 2、平均数指标的抽样误差 1)重复抽样的条件下: 2)不重复抽样的条件下: 3、成数指标的抽样误差 1)重复抽样的条件下: 2)不重复抽样的条件下: [编辑] 影响抽样误差的因素 1.总体各单位标志值的差异程度。差异程度愈大则抽样误差愈大,差异程度愈小则则抽样误差愈小。 2.样本单位数。在其他条件相同的情况下,样本的单位数愈多,则抽样误差愈小。 3.抽样方法。抽样方法不同,抽样误差也不同。一般情况下重复抽样误差比不重复抽样误差要大一些。 4.抽样调查的组织形式。不同的抽样组织形式就有不同的抽样误差。 [编辑]

第四章 抽样估计(试题及答案)

第四章抽样估计 一、判断题部分 1.从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。(×) 2.在抽样推断中,全及指标值是确定的、唯一的,而样本指标值是一个随机变量。(√) 3.抽样平均误差总是小于抽样极限误差。(×) 4.在其它条件不变的情况下,提高抽样估计的可靠程度,则降低了抽样估计的精确程度。(√) 5.抽样平均误差反映抽样误差的一般水平,每次抽样的误差可能大于抽样平均误差,也可能小 于抽样平均误差。(√) 6.在抽样推断中,抽样误差的概率度越大,则抽样极限误差就越大于抽样平均误差。(√) 二、单项选择题 1.抽样平均误差是(A )。 A、抽样指标的标准差 B、总体参数的标准差 C、样本变量的函数 D、总体变量的函数 2.抽样调查所必须遵循的基本原则是(B )。 A、准确性原则 B、随机性原则 C、可靠性原则 D、灵活性原则 3.在简单随机重复抽样条件下,当抽样极限误差缩小为原来的1/2时,则样本单位数为原来的 (C )。 A、2倍 B、3倍 C、4倍 D、1/4倍 4.按随机原则直接从总体N个单位中抽取n个单位作为样本,这种抽样组织形式是( A)。 A、简单随机抽样 B、类型抽样 C、等距抽样 D、整群抽样 5.事先将总体各单位按某一标志排列,然后依排列顺序和按相同的间隔来抽选调查单位的抽样 称为(C ) A、简单随机抽样 B、类型抽样 C、等距抽样 D、整群抽样 6.在一定的抽样平均误差条件下(A )。 A、扩大极限误差范围,可以提高推断的可靠程度 B、扩大极限误差范围,会降低推断的可靠程度 C、缩小极限误差范围,可以提高推断的可靠程度 D、缩小极限误差范围,不改变推断的可靠程度 7.反映样本指标与总体指标之间的平均误差程度的指标是(C )。 A、平均数离差 B、概率度 C、抽样平均误差 D、抽样极限误差 8.以抽样指标估计总体指标要求抽样指标值的平均数等于被估计的总体指标值本身,这一标准 称为( A)。 A、无偏性 B、一致性 C、有效性 D、准确性 9.在其它条件不变的情况下,提高估计的概率保证程度,其估计的精确程度( B)。

第03章抽样误差

第3章抽样误差 3.1 抽样误差的概念 医学科研中通常采用抽样研究的方法,从某总体中随机抽取一个样本来进行研究,而所得样本统计量与总体参数常不一致,这种由抽样引起的样本统计量与总体参数间的差异属于抽样误差(sampling error),这在抽样研究中是不可避免的。 例如,假设某地成年男子血红蛋白的总体均数(μ)为13.76(g/100ml),随机抽查了360名男子,算得平均血红蛋白含量X=13.45(g/100ml),若用此X作为该地区成年男子血红蛋白的总体均数(μ)的一个估计值,则(13.76-13.45)=0.31(g/100ml),此差值属于抽样误差。 抽样误差有两种表现形式,其一是:样本统计量与总体参数间的差异,如样本均数与总体均数间的差异;其二是:不同样本的统计量间的差异,如从同一总体中抽取含量相等的两样本得到的两个样本均数之间的差异。 从理论上讲,若进行K次抽样,所得的K个样本统计量(例如X)则很可能各不相同,若将这些样本统计量编制成频率分布表或绘制成频率分布图,则可看出样本统计量的抽样分布是有规律的。 3.2 抽样误差产生的条件 抽样误差产生的两个必备条件: (1) 抽样研究。抽样研究是产生抽样误差的必备条件之一。只有对总体中的部分个体进行研究,才可能导致样本指标与总体指标的不一致,而且在从同一总体进行抽样的研究中,样本含量越少的研究,理论上抽样误差必然越大。 (2) 个体变异。个体变异是产生抽样误差的另一必备条件。在医学科研领域,许多被研究对象都存在着变异现象,如血压、疗效、药物反应等。在抽样方法和样本含量不变的条件下,变异大的研究样本其抽样误差也大,反之则小。 以上是产生抽样误差的必备条件,缺一不可。若进行普查,则被研究对象的个体变异将不会产生抽样误差;若个体间无变异,当然无需作抽样研究,也无抽样误差可言。

抽样误差

抽样误差、抽样平均误差与抽样极限误差 一、基本概念 抽样误差是指由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标和全及指标之间的绝对离差。因此,又称为随机误差,它不包括登记误差,也不包括系统性误差。 影响抽样误差的因素有:1、总体各单位标志值的差异程度;2、样本的单位数;3、抽样的方法;4、抽样调查的组织形式。 抽样误差又分为两种: 1、抽样平均误差。抽样平均误差是反映抽样误差一般水平的指标,它的实质含义是指抽样平均数(或成数)的标准差。即它反映了抽样指标与总体指标的平均离差程度。抽样平均误差的作用首先表现在它能够说明样本指标代表性的大小。平均误差大,说明样本指标对总体指标的代表性低;反之,则高。(记为μx 或μp ) 2、抽样极限误差。抽样极限误差指在进行抽样估计时,根据研究对象的变异程度和分析任务的要求所确定的样本指标与总体指标之间可允许的最大误差范围(记为?)。 二、计算公式 (一)抽样平均误差 1、样本平均数的平均误差 以μx 表示样本平均数的平均误差,σ表示总体的标准差。根据定义: 即n x σμ=,(若为不重复抽样,则总体方差σ要用进行修正)它说明在重复抽样的条件下,抽样平均误差与总体标准差成正比,与样本容量的平方根成反比。 例1:有5个工人的日产量分别为(单位:件):6,8,10,12,14,用重复抽样的方法,从中随机抽取2个工人的日产量,用以代表这5个工人的总体水平。则抽样平均误差为多少? 解:根据题意可得:(件) 总体标准差(件)

抽样平均误差(件) 注意:在计算抽样平均误差时,通常得不到总体标准差的数值,一般可以用样本标准差来代替总体标准差。 2、抽样成数的平均误差 总体成数P 可以表现为总体是非标志的平均数。即E(X)=P ,它的标准差 。 根据样本平均误差和总体标准差的关系,可以得到样本成数的平均误差的计算公式。 (不重复抽样时要修正) 注意:当总体成数未知时,可以用样本成数来代替。 例2:某企业生产的产品,按正常生产经验,合格率为90%,现从5000件产品中抽取50件进行检验,求合格率的抽样平均误差。 解:根据题意,在重复抽样条件下,合格率的抽样平均误差为: 在不重复抽样条件下,合格率的抽样平均误差为: (二)抽样极限误差 抽样极限误差是指用绝对值形式表示的 样本指标与总体指标偏差的可允许的最大范围。它表明被估计的总体指标有希望落在一个以样本指标为基础的可能范围。它是由抽样指标变动可允许的上限或下限与总体指标之差的绝对值求得的。 μαx Z *=?2 或μαp Z *=?2(P126,例题5-4)

统计学第九章(抽样与抽样估计)

第九章 抽样与抽样估计 一、单项选择题: 1.抽样极限误差是指抽样指标和总体指标之间( )。 A.抽样误差的平均数 B.抽样误差的标准差 C.抽样误差的可靠程度 D.抽样误差的最大可能范围 2.样本平均数和总体平均数( )。 A.前者是一个确定值,后者是随机变量 B.前者是随机变量,后者是一个确定值 C.两者都是随机变量 D.两者都是确定值 3.某厂要对某批产品进行抽样调查,已知以往的产品合格率分别为90%,93%,95%,要求误差范围小于5%,可靠性为95.45%,则必要样本容量为( )。 A.144 B.105 C.76 D.109 4.在总体方差不变的条件下,样本单位数量增加3倍,则抽样误差( )。 A.缩小1/2 B.为原来的33 C.为原来的1/3 D.为原来的2/3 5.在其他条件不变的前提下,若要求误差范围缩小1/3,则样本容量( )。 A.增加9倍 B.增加8倍 C.为原来的2.25倍 D.增加2.25倍 6.抽样误差是指( )。 A.在调查过程中由于观察、测量等差错所引起的误差 B.在调查中违反随机原则出现的系统误差 C.随机抽样而产生的代表性误差 D.人为原因所造成的误差 7.在一定的抽样平均误差条件下( )。 A.扩大极限误差范围,可以提高推断的可靠程度 B.扩大极限误差范围,会降低推断的可靠程度 C.缩小极限误差范围,可以提高推断的可靠程度 D.缩小极限误差范围,不改变推断的可靠程度 8.抽样平均误差是( )。 A.总体的标准差 B.样本的标准差

C.抽样指标的标准差 D.抽样误差的平均差 9.对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式是()。 A.简单随机抽样 B.类型抽样 C.等距抽样 D.整群抽样 10.先将总体各单位按主要标志分组,再从各组中随机抽取一定单位组成样本,这种抽样形式被称为()。 A.简单随机抽样 B.机械抽样 C.分层抽样 D.整群抽样 11.事先确定总体范围,并对总体的每个单位都编号,然后根据《随机数码表》或抽签的方式来抽取样本的抽样组织形式,被称为()。 A.简单随机抽样 B.机械抽样 C.分层抽样 D.整群抽样 12.在同样条件下,不重复抽样的抽样标准误差与重复抽样的抽样标准误差相比,()。 A.前者小于后者 B.前者大于后者 C.两者相等 D.无法判断 13.在重复的简单随机抽样中,当概率保证程度从68.27%提高到95.45%时(其他条件不变),必要的样本容量将会()。 A.增加一倍 B.增加两倍 C.增加三倍 D.减少一半 14.比例与比例方差的关系是()。 A.比例的数值越接近1,比例的方差越大 B.比例的数值越接近0,比例的方差越大 C.比例的数值越接近0.5,比例的方差越大 D.比例的数值越大,比例的方差越大 15.假定一个人口一亿的大国与百万人口的小国居民年龄变异程度相同,现在各自用重复抽样方法抽取本国的1%人口计算平均年龄,则平均年龄抽样误差 ()。 A.不能确定 B.两者相等 C.前者比后者大 D.前者比后者小 二、多项选择题: 1.下面说法错误的是()。 A.抽样调查中的代表性误差是可以避免的 B.抽样调查中的系统误差是可以避免的

抽样误差研究

如何合理选择抽样样本数 一、研究介绍: 研究背景:众所周知,抽样样本数的大小对调查结果的准确度有很大的影响,从统计上可以计算出每个抽样样本数所对应的抽样误差有多少。但大多数客户对抽样误差缺乏直观的感觉,无法清晰了解应该选择多大的抽样误差才能满足自己的实际需求,因此也就无从有效控制成本。另外,对于定性研究来说,也需要采用另外的指标来衡量多大的样本量才能满足定性研究的需求。 研究课题:1. 定性研究应该采用多大的样本量才能有效解决问题? 2. 定量研究中,采用不同数量的抽样样本,可达到怎样的研究效果? 研究方法:我们以过往某个调查项目的总样本数(4450样本)为母体样本,从中分别随机抽取5样本,10样本,20样本,30样本,50样本,80样本,100样本,200样本,300样本来比较其结果,为了充分了解每种样本量的抽样结果,每种样本量重复抽取30次。对比的问题指标为:不提示品牌知名度。 二、研究的主要结论:

三、详细研究分析 (一)定性样本需求分析 1、答案获得率分析 概念:答案获得率是指在调查中的答案个数与实际总体答案个数的比例。定性研究是属于探测性研究,因此不太在乎量

化的数据,而会更关注能否获得足够的答案数以供进一步的定量研究,也就是说答案获得率是否足够。 在本次研究中,采用的4450个母体样本中,果汁品牌共有17个,也就是说实际总体答案个数就是17个。因此,我们只需要对比每种抽样样本量下的平均答案个数,就可以知道该抽样样本量的答案获得率。 统计结果如下表: 从上面图表可得出,5样本的调查仅能拿到一半的答案,10样本获得七成的答案,15样本可得到80%的答案,而30样本是拐点,再得到90%的答案后,再增加样本量对答案获得率的帮助不大。

极限抽样误差

第二节极限抽样误差 石家庄市第一职业中专学校石艳格050000 一、教学目的与要求: 1.知识目的:理解和熟练掌握极限抽样误差的概念和计算方法,让学生学会运用极限 误差对总体数据做出区间估计。 2.能力目的:从学生熟悉的实例出发,研究总体出极限误差的概念,让学生在自学的 过程中品尝获得成功的喜悦,从而激发他 们浓厚的学习兴趣。 二、教学过程 师:前面我们学习了抽样误差的概念及计算方法,明确了抽样误差是可以计算并且可以加以控制的,那如何对抽样误差进行控制呢?就是我们这节课要解决的问题。首先,请同学们想一想,如何控制抽样误差呢?(创设问题情境,让学生自主思考) 生甲:误差当然越小越好了!误差太大了,那我们用样本统计量估计的总体参数就没有意义了。(大部分同

学意见) 生乙:抽样误差是随机误差,是避不可免要产生的,我们不可能让它无限度地缩小。 师:大家说的都对,我们对抽样误差加以控制,它不能太大,这是我们很容易理解的,但它也是不可能无 限度地小。因为误差小,就意味着对总体参数估计 的精确度会很高,当我们没有50%以上的把握程度 去达到它要求的精确度时,我们也不再去做了。所 以抽样误差不能过大,也不能过小。我们把它可扩 大或缩小的倍数称为概率度,用符号t来表示。概 率度和概率(把握程度)之间有着数量对应关系。 概率越大,则概率度的值也越大,反之,概率越小,则概率度的值也越小。由此我们得到概率F(t)与 概率度t之间的对应关系。(幻灯片)我们常用的:t=1时,F(t)=68.27% t=2 时,F(t)=95.45% t=3 时,F(t)=99.73% 师:抽样误差的概念是什么?其计算公式是什么? 生:抽样误差是指样本统计量与总体参数之间的平均离

(完整版)第五章抽样调查习题答案

《统计学》习题五 参考答案 、单项选择题: 1、抽样误差是指( )。 C A 在调查过程中由于观察、测量等差错所引起的误差 B 人为原因所造成的误差 C 随机抽样而产生的代表性误差 D 在调查中违反随机原则出现的系统误差 2、抽样平均误差就是( )。 D A 样本的标准差 B 总体的标准差 C 随机误差 D 样本指标的标准差 3、抽样估计的可靠性和精确度( )。 B A 是一致的 B 是矛盾的 C 成正比 D 无关系 4、在简单随机重复抽样下,欲使抽样平均误差缩小为原来的三分之一,则样本容量应( )。 A A 增加 8 倍 B 增加 9 倍 C 增加 1.25 倍 D 增加 2.25 倍 5、当有多个参数需要估计时,可以计算出多个样品容量 n 为满足共同的要求,必要的样本容量 一般应是( )。 B A 总体的标志变异程度 B 允许误差的大小 C 重复抽样和不重复抽样 D 样本的差异程度 E 估计的可靠度 三、填空题: 3、 实施概率抽样的前提条件是要具备( )。抽样框 4、 对总体参数进行区间估计时,既要考虑极限误差的大小,即估计的( 虑估计的( )问题。准确性 可靠性 四、简答题: 1、抽样调查与重点调查的主要不同点。 A 最小的n 值 B 最大的n 值 6、抽样时需要遵循随机原则的原因是( C 中间的n 值 D 第一个计算出来的n 值 )。C A 可以防止一些工作中的失误 B 能使样本与总体有相同的分布 C 能使样本与总体有相似或相同的分布 D 可使单位调查费用降低 二、多项选择题: 1、抽样推断中哪些误差是可以避免的( A 工作条件造成的误差 B D 人为因素形成偏差 E 2、区间估计的要素是( A 点估计值 B D 抽样极限误差 E 3、影响必要样本容量的因素主要有( )。 A B D 系统性偏差 C 抽样随机误差 抽样实际误 差 )。 A C D 样本的分布 C 估计的可靠度 总体的分布形式 )。 A B C E 1、抽样推断就是根据( )的信息去研究总体的特征。样本 2、样本单位选取方法可分为( )和( )。重复抽样 不重复抽样 )问题,又要考

第六章 抽样与推断及答案

第六章抽样与推断 一.判断题部分 1.从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。() 2.在抽样推断中,全及指标值是确定的、唯一的,而样本指标值是一个随机变量。() 3.抽样成数的特点是:样本成数越大,则抽样平均误差越大。() 4.抽样平均误差总是小于抽样极限误差。() 5.从全部总体单位中抽取部分单位构成样本,在样本变量相同的情况下,重复抽样构成的样本个数大于不重复抽样构成的样本个数() 6.抽样平均误差反映抽样误差的一般水平,每次抽样的误差可能大于抽样平均误差,也可能小于抽样平均误差。() 7.在抽样推断中,抽样误差的概率度越大,则抽样极限误差就越大于抽样平均误差() 8.抽样估计的优良标准有三个:无偏性、可靠性和一致性。() 9.抽样推断的目的是,通过对部分单位的调查,来取得样本的各项指标。() 10.总体参数区间估计必须具备三个要素即:估计值、抽样误差范围和抽样误差 的概率度。() 二.单项选择题部分 1.抽样平均误差是()。 A.抽样指标的标准差 B.总体参数的标准差 C.样本变量的函数 D.总体变量的函数 2.抽样调查所必须遵循的基本原则是()。 A.准确性原则 B.随机性原则 C.可靠性原则 D.灵活性原则 3.在简单随机重复抽样条件下,当抽样平均误差缩小为原来的1/2时,则样本单位数为原来的()。 A.2倍 B.3倍 C.4倍 D.1/4倍 4.在一定的抽样平均误差条件下()。 A.扩大极限误差范围,可以提高推断的可靠程度 B.扩大极限误差范围,会降低推断的可靠程度 C.缩小极限误差范围,可以提高推断的可靠程度 D.缩小极限误差范围,不改变推断的可靠程度 5.反映样本指标与总体指标之间的平均误差程度的指标是()。 A.平均数离差 B.概率度 C.抽样平均误差 D.抽样极限误差 6.以抽样指标估计总体指标要求抽样指标值的平均数等于被估计的总体指标值 本身,这一标准称为()。 A.无偏性 B.一致性 C.有效性 D.准确性 7.抽样误差是指()。 A.调查中所产生的登记性误 B.调查中所产生的系统性误差 C.随机的代表性误差 D.计算过程中产生的误差 8.抽样极限误差和抽样平均误差的数值之间的关系为()。

相关主题
文本预览
相关文档 最新文档