当前位置:文档之家› 抽样误差研究

抽样误差研究

抽样误差研究
抽样误差研究

如何合理选择抽样样本数

一、研究介绍:

研究背景:众所周知,抽样样本数的大小对调查结果的准确度有很大的影响,从统计上可以计算出每个抽样样本数所对应的抽样误差有多少。但大多数客户对抽样误差缺乏直观的感觉,无法清晰了解应该选择多大的抽样误差才能满足自己的实际需求,因此也就无从有效控制成本。另外,对于定性研究来说,也需要采用另外的指标来衡量多大的样本量才能满足定性研究的需求。

研究课题:1. 定性研究应该采用多大的样本量才能有效解决问题?

2. 定量研究中,采用不同数量的抽样样本,可达到怎样的研究效果?

研究方法:我们以过往某个调查项目的总样本数(4450样本)为母体样本,从中分别随机抽取5样本,10样本,20样本,30样本,50样本,80样本,100样本,200样本,300样本来比较其结果,为了充分了解每种样本量的抽样结果,每种样本量重复抽取30次。对比的问题指标为:不提示品牌知名度。

二、研究的主要结论:

三、详细研究分析

(一)定性样本需求分析

1、答案获得率分析

概念:答案获得率是指在调查中的答案个数与实际总体答案个数的比例。定性研究是属于探测性研究,因此不太在乎量化的数据,而会更关注能否获得足够的答案数以供进一步的定量研究,也就是说答案获得率是否足够。

在本次研究中,采用的4450个母体样本中,果汁品牌共有17个,也就是说实际总体答案个数就是17个。因此,我们只需要对比每种抽样样本量下的平均答案个数,就可以知道该抽样样本量的答案获得率。

统计结果如下表:

从上面图表可得出,5样本的调查仅能拿到一半的答案,10样本获得七成的答案,15样本可得到80%的答案,而30样本是拐点,再得到90%的答案后,再增加样本量对答案获得率的帮助不大。

2、主要答案获得率

进一步分析,我们需要了解各种抽样样本是否能得到主要的答案。下面是17个果汁品牌的不提示知名度,不提示知名度的高低代表了这个品牌的广泛性。以下是每种样本量下的各答案获得率。从图中可以看到,5样本量只能保证获得知名度最高的两个品牌,而10样本量可以保证获得不提示知名度在20%以上的5个品牌,而15样本量及30样本量可以保证获得不提示知名度在10%以上的品牌。

3、小结

综合前面两点分析,我们可得出结论:定性研究最低需要15样本或2组座谈会的量,才能获得大部分的答案并覆盖到主要的答案。如果需要对比研究细分群体,则每个细分群体也应该最少是2组座谈会放可保证效果。

(二)定量样本需求分析

(1)抽样误差分析

抽样误差是评估样本量的一个常用指标,我们的研究人员计算出了在95%的置信程度下各样本量的抽样误差,具体结果如下图:

(2)实际的调查结果分析

知道了抽样误差,大多数客户仍然很难知道应该如何根据实际情况选择抽样样本数。因此,我们在这部分会用图像来展示各种抽样样本量的调查结果,去更好地了解不同样本量可达到的研究效果。

1、20样本:调查结果与真实值相差很大,基本不能反映统计意义

2、30样本:调查结果基本可以分出高、中、低的区别,但多数值与真实值有一定的误差

3、50样本:调查结果同样可以分出高、中、低的区别,但有2-3个数值会与真实值有较大背离

4. 、100样本:调查结果开始接近现实,能反映市场大致情况,但数据排名的稳定性不够,不能作为跟踪对比的依据

5、150样本量:调查结果更接近现实,误差明显减少,但仍然不够稳定。

6、200样本量:调查结果相当接近真实情况,30次可能会有一次与真实的排名有误差。

7、300样本量:调查结果基本上与现实一致,是非常优秀的定量研究调查样本量

(3)小结

30-50样本可作为量化分辨高、中、低结果的基本样本。当样本量达到100的时候,抽样的调查情况可以反映市场的大体情况,但作为排名的结果依据仍然不充分。而样本量上升至200的时候,结果很接近真实值,但多次抽样结果仍然有不稳定的情况,用于跟踪研究并不太妥当。300的样本量在准确性及稳定性都相当好,是优秀的定量研究样本量。

实验法案例及误差分析

实验法案例及误差分析 第四组成员: 某企业为了了解“托儿”对商品销售的作用,决定采用两组实验设计来确定“托儿”的实际效果。其所选择的三个摊位基本效益差不多,实验结果如表: 商品销售额变动结果 事前测量是否引入“托 事后测量 儿” 实验组100 有150 控制组1 102 无110 控制组2 无有125 分析: 该公司采用前后对照组的实验方法,选择了摊位基本效益差不多的三个小组(实验组/控制组1/控制组2 ),以实现实验前三个小组的相似性,在该实验中: 因变量---商品销售额 自变量---引入托儿 抽样误差:案例中三个小组除基本效益相似外还存在例如位置、摊位摆设等其他外生变量,因此在实施中会产生随机误差。 非抽样误差:在进行实验法的过程中产生的数据收集、处理等不可避免的系统误差。 商品销售额变动结果分析:

根据以上数据,计算结果是: (1)实验组本身总效应=150-100=50 即从实验组来看,引入托儿后销售额增加了50,但不能说明销售额的增加仅仅是由引入托儿引起的,也可能是由于其他外生变量引起的。 (2)前后测量本身可能导致的销售额的差异,也即控制组1所导致的结果差异为: 控制组1导致的结果差异=110-102=8 因为控制组1没有引入托儿及自变量没有发生变化,所有该销售额的变动只能解释为是有其他外生变量引起的。 (3)无前测量所导致的差异(控制组2)=125-(100+102)/2=24 (4)所以控制组的总效应=8+24=32 (5)引入“托儿”及前测的交互效应(实验效果)=50-32=18 在排除外生变量的影响后,可以认为“引入托儿”使销售额增加了18。评价:该实验法的类型是现场实验即在自然环境的环境中操纵自变量,提高了该研究结果在现实生活中推广的可能性即外部效度较高。从所得数据可看出,误差控制得较好。

处方点评抽样与统计分析报告方法

处方点评抽样与统计分析方法 一、统计学概述 统计学是把科学和艺术结合在一起进行收集和分析数据资料的一门学科。 因为科学研究常研究的是事物的一般规律,研究的是其共性;艺术扬的是其个性,两者相差很远。而统计学是通过扬有差别的个性来寻求事物背后的一般规律,所以它是连接科学和艺术的一个桥梁。 早在16世纪,意大利人把统计学称为国情学。这种说法后来传播到法、德、荷等欧陆国家。在17,18世纪,这些国家的大学里讲授的“统计学”课程,实际上就是讲“国情学”,包括有关人口,经济,地理,乃至政治方面的容。到十九世纪初,逐步演变为现代西方统计学——Statistics。 统计学可与各领域、各专业相结合,已在社会、人口、教育、环境等各领域的应用研究中被广泛应用,因为它是一门方法学,是破解各领域难题的科学工具。如工业统计,卫生统计,生物统计,医药统计,金融统计,法学统计,心理统计,交通统计、教育统计等等。 卫生统计学属应用统计学,运用数理统计学的原理和方法,研究医学科研及卫生工作中有关数据的收集、整理、分析的科学。其容包括三部分: 1、统计设计: 抽样方法、研究设计方案 样本含量(大小)的确定 2、整理资料:数据录入、核查和汇总 3、分析资料:统计描述、统计推断。 二、目的意义

处方点评是加强合理用药的管理手段,目的是要解决临床不合理用药问题,不断提高临床医疗水平。在处方点评中应用卫生统计学的意义: 1、控制影响处方点评的因素 2、保证处方点评的质量 3、提高处方点评的水平 4、促进临床合理用药 在处方点评工作应用卫生统计,其容包括处方抽取的数量(样本含量)和抽样方法、处方数据资料的整理、分析、解释和描述。将获得可靠的结果,作出科学的推断或预测,为政府或卫生管理部门在医疗工作中进行管理决策和行动提供依据和建议。因此在处方点评中应用卫生统计,必须做到以下原则: 1、要有足够的样本含量; 2、被抽查的处方要有代表性; 3、抽样方法要科学; 4、点评结果要有可比性。 三、样本含量 样本含量是指样本中包含的观察单位数。从总体中抽取样本时,应保证样本有足够的数量满足统计学要求,样本中观察个体之间变异度小的样本含量可少些,变度大的应多些。 影响样本含量大小的相关因素 1、检验水平一般用95%的把握 2、检验效能一般取90%的信度 3、容许误差抽样率与总体率差别<10% 4、总体率的大小

第六章、抽样估计

第六章、抽样估计 一、单项选择题(在每小题的四个备选答案中,选出一个正确答案) 1,抽样误差是指() A. 由于观察、计算等差错所引起的登记误差 B.抽样中违反随机原则出现的系统误差 C. 随机抽样而产生的代表性误差 D.认为原因所造成的误差 2.抽样误差() A.既可以避免,也可以控制 B. 既不可以避免,也不可以控制 C. 可以避免, 但不可以控制 D. 不能避免, 但可以控制 3. 抽样平均误差反映了样本估计量与总体参数之间的( ) A. 实际误差 B. 可能误差范围 C. 平均差异程度 D. 实际误差的绝对值 4.抽样平均误差是( ) A. 总体参数的标准差 B. 样本的标准差 C.样本估计量的标准差 D. 样本估计量的平均差 5.在其他条件不变的情况下, 不重复抽样的抽样误差比重复抽样的抽样误差( ) A. 大 B. 小 C. 可大可小 D. 相等 6. 反映样本估计量与总体参数之间抽样误差的可能范围的是( ) A. 抽样平均误差 B. 抽样极限误差 C. 实际抽样误差 D. 置信水平 7.简单随机抽样条件下, 当极限误差扩大一倍, 则样本容量( ) A. 只需原来的1/2 B. 只需原来的1/4 C. 需要原来的1倍 D. 需要原来的4倍 8.在其他条件不变的情况下, 总体方差越大, 所需样本容量( ) A. 越多 B. 越少 C. 可多可少 D. 不受影响 9.下列描述不正确的是( ) A.样本统计量是一种随机变量 B.样本统计量不是一种随机变量 C.每个随机变量都有其概率分布 D.样本统计量概率分布就是抽样分布 10.中心极限定理证明了:当总体期望值和方差存在、且有限时,随机抽样下的大样本均值服从下列分布() A.N(0,1) B.N() C.N() D.t(n-1)

实验数据分析中的误差、概率和统计指导书

实验数据分析中的 误差、概率和统计 §1 实验测量及误差 §2 粒子物理实验的测量数据 §3 粒子物理实验的数据分析 §1 实验测量及误差 大量科学问题(自然科学、社会科学)的研究与解决依赖于实验或测量数据(包括统计数据)。 §1.1 实验测量的目的及分类 》目的: 得到一个或多个待测量的数值及误差(确定数值); 确定多个量之间的函数关系(寻找规律,确定分布)。 》分类: 1. 测量方式 直接测量 - 用测量仪器直接测得待测量 (尺量纸的长度) 间接测量 - 直接测量量为x ,待测量为 y ,y 是x 的函数 ()y f x = 例如待测量为大楼高度h , 实测量为距离和仰角,x θ, 则tan h x θ=。 绝大部分问题是间接测量问题。 2. 测量过程 静态测量 - 待测量在测量过程中不变 多次测量求得均值 动态测量 - 待测量在测量过程中变化 例雷达站测离飞行气球的距离 多次测量求得气球的运动轨迹 3. 测量对象 待测量 - 固定常量 待测量 - 随机变量 例放射源单位时间内的计数 (假定寿命极长) 每次测量值不一定相同。

错误!文档中没有指定样式的文字。 ·235· 粒子物理实验数据分析中处理的都是间接、动态、随机变量的测量和处理问题。 随机变量―― 一次测量所得的值是不确定的, 无穷多次测量,一定测量值的概率是确定的。(统计规律性) 离散随机变量――测量值是离散的分立值(掷硬币和扔骰子试验) 二项分布、泊松分布、多项分布。 连续随机变量――测量值一个区间内的所有值 均匀分布、指数分布、正态分布、2 χ分布、F 分布、t 分布。 描述随机变量的特征量――概率分布或概率密度 非负性、 可加性、 归一性 ()0.f x ≥ 2331 2 1 ()()().x x x x x x f x dx f x dx f x dx +=??? () 1.f x dx Ω =? ()0.i P x ≥ ()()().i j i j P x x P x P x ?=+ 1 () 1.n i i P x ==∑ 期望值(概率意义上的平均值) 离散型 ()()i i i E X x p x μ==∑ 连续型 ()xf x dx Ω= ? 方差(标准离差σ的平方) 离散型 2() ()(),i i i V X x p x μ=-∑ 连续型 2 ()() ().V X x f x dx Ωμ=-? §1.2 测量误差及其分类 1.报导误差的重要性 ? 物理量的测量值及其误差是衡量其可靠性及精度的依据。 ? 没有误差的结果是没有意义的,因而是无法引用的。 ? 要改正只给测量中心值、不给误差的坏习惯。

统计案例分析

哺乳动物大脑发育水平相关因素回归分析 小组成员:

目录 一、数据来源及背景 (1) 1.数据来源 (1) 2.数据背景及研究目的 (1) 3.数据说明 (1) 二、统计分析 (1) 1.数据描述性分析 (1) 1.1 数据基本描述 (1) 1.2 置信区间分析 (2) 1.3 brain weight与body weight的数据相关性 (2) 1.4 所有参数的相关性 (3) 2.数据图形化分析 (3) 3.多元回归分析 (5) 3.1 原始数据直接多元回归分析 (5) 3.2 对多元回归原始数据处理和调整 (8) 3.3 数据模型的确定 (12) 3.4 对Cook距离的分析 (17) 三、总结 (18) 附录:研究数据 (19)

统计案例分析 一、数据来源及背景 1.数据来源 数据来源于American Naturalist (1974)杂志p.593-613. 2.数据背景及研究目的 达尔文在他的《进化论》一书中指出“生物之间存在着生存斗争,适应者生存下来,不适者则被淘汰,这就是自然的选择。生物正是通过遗传、变异和自然选择,从低级到高级,从简单到复杂,种类由少到多地进化着、发展着。”从达尔文的观点中我们可以得出动物具备使它们自身更好的生存和繁衍后代的能力,这是一种内在的属性。有一种观点认为,具备更大大脑容量的动物,比如哺乳动物在生存和繁衍方面一般会表现得更好。虽然,哺乳动物的自然选择有一些限制,比如他们通常需要更长的怀孕期并且一次孕育后代的数量更少。这些负面因素在一定程度上削弱了哺乳动物的优势。但是总体来说,哺乳动物的优势要大于它们的劣势。通常情况下,较大的大脑意味着躯体也更加的硕大。我们尝试用统计的方法,研究和分析一下具备更大大脑容量的哺乳动物之间具有什么样相同和不同的特征,在这些特征中是否会存在某些特别突出的因素。众所周知,哺乳动物是动物发展史上最高级的阶段,也是与人类关系最密切的一个类群。我们希望通过此次的论证和研究,能够得到关于一些哺乳动物大脑重量的信息,并找到与之相关联的因素,为促进哺乳动物大脑重量的研究提供可以参考的依据。 3.数据说明 我们小组分析的案例,是研究哺乳动物大脑重量和其他几种因素的关系。这些因素主要包括哺乳动物的妊娠期天数、身体重量以及平均每窝产仔数量。数据总共采集了96种不同哺乳动物的信息。当模型具有显著的统计意义并且样本足够大(n=96)时,可以获得比较准确的估计值。 二、统计分析 1.数据描述性分析 1.1 数据基本描述 我们对所采用的数据首先进行了简单的描述性分析,具体信息见下图。

浅谈统计调查及统计调查误差的种类

摘要:随着社会的发展,统计调查作为各信息的来源势必会越来越受到人们更多地关注,也势必会有越来越多的人参与到统计调查活动中来。本文从统计调查的概念出发,通过对统计调查和其它调查的区别解释统计调查,并正确区分统计调查与非统计调查、理解统计调查的种类、统计调查误差的种类及其特征和产生的原因,这些问题是参与和搞好统计调查、提高统计调查质量的基本前提。 关键词:统计调查;误差;统计调查质量 一、统计调查的概念 统计调查不仅要有明确的调查对象,而且调查对象是由具有某一或某些共同特征的许多个体构成的总体,同时构成总体的个体数要足够地多,除此之外,还要求调查的个体单位数也要足够地多。统计调查对构成总体的许多独立个体的调查不是目的,综合与提炼许多独立个体信息资料才是统计调查的真正目的。因此,统计调查所获资料的真实、准确与否,直接取决于个体提供的信息资料是否真实、准确。而统计个体之所以有可能提供不真实、不准确的个体信息资料,是因为统计个体担心一旦提供了个体真实、准确的信息资料可能会为自己、他人或相关部门带来不必要的麻烦。不过,从统计调查的真实目的来看,统计个体的信息资料根本不是统计调查所关注的信息资料,个人信息资料只作为一种信息载体出现,仅起到显现总体一般属性或数量特征的作用———从对个体信息资料进行深入的加工、综合中提炼出总体的一般属性或数量特征。 二、统计调查的种类 众所周知,信息化时代信息的主体是统计信息,统计信息的获取建立在统计调查的基础之上。统计调查搜集到的个体信息资料的真实、准确与否将直接影响信息化时代信息的质量。统计调查获取个体信息资料的方式方法的不同决定了不同种类的统计调查获取个体信息资料质量的差异。 统计调查按是否对构成总体的全部个体进行调查,可以划分为全面统计调查与非全面统计调查两类。 全面统计调查指的是对构成总体的所有个体进行的调查,即要搜集总体中所有个体的个体信息资料的一种调查。再按对总体中个体信息资料收集方式的不同,全面统计调查又可以划分为普查和全面统计报表两种。普查通常通过调查员借助普查表直接向个体搜集其信息资料的一种调查方式。 非全面统计调查指仅从构成总体的全部个体中选取部分个体进行的调查。非全面调查又因从全部个体中所选部分个体的方式不同,分为抽样调查和非抽样调查。所谓抽样调查指从构成总体的所有个体中按照随机性原则选取部分个体的调查。同时,抽样调查又根据随机性原则在具体使用上的差异可以将抽样调查划分为简单随机抽样、系统随机抽样、分层随机抽样、整群随机抽样以及多阶段随机抽样等。另一方面,若从构成总体的所有个体单位中没有遵循随机性原则而选取部分个体单位进行调查,则这样的统计调查称之为非抽样调查。生活中常用的非抽样调查主要有重点调查、典型调查和滚雪球调查等。 因此,无论在抽样调查的理论研究方面,还是在抽样调查的实际应用中,抽样调查正越来越受到人们的重视。

(完整版)第五章抽样调查习题答案

《统计学》习题五参考答案 一、单项选择题: 1、抽样误差是指()。C A在调查过程中由于观察、测量等差错所引起的误差 B人为原因所造成的误差C随机抽样而产生的代表性误差 D在调查中违反随机原则出现的系统误差 2、抽样平均误差就是()。D A样本的标准差 B总体的标准差 C随机误差 D样本指标的标准差 3、抽样估计的可靠性和精确度()。B A是一致的 B是矛盾的 C成正比 D无关系 4、在简单随机重复抽样下,欲使抽样平均误差缩小为原来的三分之一,则样本容量应()。A A增加8倍 B增加9倍 C增加1.25倍 D增加2.25倍 5、当有多个参数需要估计时,可以计算出多个样品容量n,为满足共同的要求,必要的样本容量一般应是()。B A最小的n值 B最大的n值 C中间的n值 D第一个计算出来的n值 6、抽样时需要遵循随机原则的原因是()。C A可以防止一些工作中的失误 B能使样本与总体有相同的分布 C能使样本与总体有相似或相同的分布 D可使单位调查费用降低 二、多项选择题: 1、抽样推断中哪些误差是可以避免的()。A B D A工作条件造成的误差 B系统性偏差 C抽样随机误差 D人为因素形成偏差 E抽样实际误差 2、区间估计的要素是()。A C D A点估计值 B样本的分布 C估计的可靠度 D抽样极限误差 E总体的分布形式 3、影响必要样本容量的因素主要有()。A B C E A总体的标志变异程度 B允许误差的大小 C重复抽样和不重复抽样 D样本的差异程度 E估计的可靠度 三、填空题: 1、抽样推断就是根据()的信息去研究总体的特征。样本 2、样本单位选取方法可分为()和()。重复抽样不重复抽样 3、实施概率抽样的前提条件是要具备()。抽样框 4、对总体参数进行区间估计时,既要考虑极限误差的大小,即估计的()问题,又要考虑估计的()问题。准确性可靠性 四、简答题:

统计案例分析---大学生月平均生活费的估计和检验

. 统计案例分析 案例2.1 大学生月平均生活费的估计和检验 姓名:覃玉冰 学号: 班级: 16应用统计 一、数据 为了了解大学生日常生活费支出及生活费来源状况,对中国人民大学在校本科生的月生活费支出问题进行了抽样调查。该问卷随机抽取中国人民大学大一、大二、大三、大四在校本科生男女各30多人作为样本。调查采取分层抽样,对在校本科生各个年级男生、女生各发放问卷30多份,共发放问卷300份,回收问卷291份,其中有效问卷共272份。其中,男生的有效问卷为127份,女生为145份。调查得到的部分数据见表一。 表一大学生月平均生活费支出的调查数据(仅截取部分) 二、生活费支出的区间估计和假设检验 (一)平均月生活费的描述统计量 为了更好地研究全校本科学生平均月生活费支出,我们先来看一下样本数据中平均月生活费支出的一些描述统计量。 1 / 21 . 变量选择“平均月生活费”,选项描述→中,点分析→描述统计→在spss选择“均值、标准差、均值的标准误”,得到的样本数据中平均月生活费的描述统计量见

表二。平均月生活费的描述统计量表二 标准差均值N 统计量统计量统计量标准误 595.04平均月生活费272 243.444 14.761 (列表状态)N 有效的272 从表二可以看到,样本数据中平均月生活费支出的均值为595.04,标准差为243.444,均值的标准误为14.761. (二)平均月生活费的假设检验 从表二中我们已经知道了样本数据中平均月生活费支出的均值为595.04,现在我们来检验一下全校本科学生即总体的月平均生活费支出是否等于500。 1.检验统计量的确定 样本数据的样本量n为272,其大于30,可以认为该数据是一个大样本。现在我们并不知道总体的月平均生活费支出是否服从正态分布,但是在样本量大的条件下,如果总体为正态分布,样本统计量服从正态分布:如果总体为非正态分布, 样本统计量也是渐进服从正态分布的。所以在这种情况下,我们都可以把样?已 即在总体标准差z分布)。本统计量视为正态分布,这时可以使用z统计量(知时,有 ??x0?z?/n?是未知的,此时可以用样本标准差s代替,上式可而我们这里总体标准差以写为: ??x0?z s/n提出假设2. H为:全校本科学生月平均生活费支出u=500 原假设02 / 21 . u=500 备择假设为:全校本科学生月平均生活费支出H13. spss操作及结果分析“平均月生活费”→检验变量选单样本T检验在spss中点分析→比较均值→”,得到的平均月生活费的假设检验的结果见表三。→检验值填“500平均月生活费的假设检验的结果表三

抽样误差

文案调研资料的来源 评比量表例如:美国人与阿尔巴尼亚人交往的意愿 A .你愿意让阿尔巴尼亚人住在你的国家吗? B .你愿 文案调研资料的来源 企业内部资料 企业外部资料 1、业务资料 2、统计资料 3、财务资料 4、企业积累的其他资料 1、统计部门与各级各类政府主管部门公布的有关资料 2、各种经济信息中心、专业信息咨询机构、专业调查机构、各行业协会和联合会提供的市场信息 3、各地电台、电视台提供的有关市场信息 4、国内外有关的书籍、报纸、杂志所提供的文献资料 5、有关生产和经营机构3提供的信息和资料,如商品目录、广告说明书、专利资料及商品价目表等 6、各种国际组织、外国使馆、商会所提供的市场信息 7、各种国内外博览会、展览会、交易会、订货会等会议以及专业性、学术性经验交流会议上所发放的文件和资料 8、互联网提供的信息

意让阿尔巴尼亚人住进你的社区吗?C .你愿意让阿尔巴尼亚人住在你家附近吗?D .你愿意让阿尔巴尼亚人住在你的隔壁吗?E .你愿意让你的孩子与阿尔巴尼亚人结婚吗? 瑟斯顿量表研究者提出若干个可能的指标项目 例如:了解人们对一周5天工作日的看法 五天工作日对于人们精神健康是绝对必要的;五天工作日是社会进步的一种表现 五天工作日是生产力提高的结果;五天工作日是对劳动者基本权利的保证;五天工作日没有必要;五天工作日会使人变得懒散 ;五天工作日有助于经济繁荣;五天工作日会减少人们的收入;………… 请您给下面的观点打分:很同意(5分) 比较同意(4分) 讲不请(3分)不太同意(2分) 很不同意(1分)1、越是有钱,越应该参加保险2、年轻人没有必要买养老保险3、只有人们的收入达到一定的水平,才会考虑 保险4、我不大爱生病,没必要参加保险公司推出的医疗保险 ……10、目前保险定价合理 语义差异量表 7 6 5 4 3 2 1 愉悦的 不悦的 简单的 复杂的 不和谐的 和谐的 传统的 现代的 配对比较量 可乐饮料在消费者心目中中的地位认为牌子i 较牌子j 为佳的人数分布 认为牌子i 较牌子j 为佳的比率 B(2.85)>C(2.15)>A(1.60)>D(1.40) 一..抽样中的误差问题 估计量方差:描述估计精度的重要指标 偏差:反映估计量的系统性误差 均方误差:更综合地反映估计误差的情况 二.抽样误差抽样中的误差可以分为抽样误差和非抽样误差两类 抽样误差:由于抽样的随机性造成的误差;定义式 ; 影响因素:总体分布、样本量、 抽样方式和估计方式非抽样误差 差、调查人员误差、受访者误差 样本量的确定 一.影响样本量的因素1.调查精度 2.总体变异度3.总体规模 4.无回答情况5.调查经费情况 二.确定样本量的方法1.非概率抽样,样本量确定主要根据经验判断; 2.概率抽样,需要在计算的基础上确定 三.样本量的计算 i j A B C D A - 80 70 40 B 20 - 30 15 C 30 70 - 35 D 60 85 65 - A B C D A 0.50 0.80 0.70 0.40 B 0.20 0.50 0.30 0.50 C 0.30 0.70 0.50 0.35 D 0.60 0.85 0.65 0.50 合计 1.60 2.85 2.15 1.40 2 ???()()V E E θθθ?? =-?? ??()()B ias E θθθ =-2???()()()M SE V Bias θθθ=+?()S θ= ()S y = =

统计工作中的“数据误差”的原因及对策分析.

统计工作中的“数据误差”的原因及对策分析 【摘要】统计工作的精准对我国国民经济发展的影响至关重要。准确、全面、及时、系统的统计数据,是各级党委政府在进行科学决策和管理,制定宏观调控措施的必要依据。本文就统计工作中的数据误差的原因进行了分析,并提出了具体的整改措施,以保证统计工作数据的准确性。 【关键词】统计;数据;管理 一、统计工作中的数据误差的原因分析 (一)统计方法制度不够完善,统计指标体系与指标设置不够科学。统计调查方法相对滞后。全面调查和抽样调查在实际工作中存在一定的局限性。全面调查在基层工作中有时难免存在调查者与被调查者之间,在搜集资料单位的上下左右之间,往往容易引起矛盾,在层层上报过程中,容易受人的主观因素影响,所以全面统计的结果有时并不全面。对基层的统计抽样工作来说:如规模以下工业企业、限额以下批发零售贸易企业、私营、个体经济等抽样工作,基层统计人员由于对抽样调查认识不到位,往往凭自己的主观臆断来确定抽样的样本点,抽样调查缺乏科学性导致调查样本的随机性、代表性难以保证,影响了调查样本数据的准确性,扩大了抽样误差。现有统计指标体系存在第一、二产业品种繁多,而满足国民经济核算需要的第三产业报表资料相对较少,影响统计数据质量;在指标设置上存在专业之间个别指标重复上报的现象,同时个别指标的设置没有充分考虑基层的实际,存在指标理解上的偏差。统计数据评审制度还不够健全。虽然一些主要经济指标如GDP已经建立数据联审评估制度,但统计数据评审制度还存在与GDP相关主要数据评估不够配套、同时数据评估制度还存在操作性不强等问题。 (二)基层统计人员工作积极性不高,对统计数据来源把关不严。首先,由于统计体制不科学、统计工作地位和待遇不高,基层统计人员积极性不高,责任心不强加之身兼数职,任务重,对日常的统计工作基本上是疲于应付,统计数据质量难以得到保证;其次,县级统计人员存在对统计数据的来源把关不严。由于统计部门长期受一无权二无钱、求人的事情多、自己说了算的时候少的认识的影响,对基层上报数据缺乏严格要求,加上评估论证不完全到位,有的专业存在下面报多少是多少、怎么报怎么算的问题,同时基层统计工作存在统计执法不严的问题,使少数企业多存侥幸心理,这在一定程度上影响统计数据质量;第三,基层统计人员的工作能力和水平影响统计数据的质量。 (三)统计基层基础工作薄弱。主要表现在:一是部分基层统计单位统计岗位落实不到位,统计人员多数为兼职,而且变动频繁,稳定性差。调查表明,大中型的企事业单位统计工作相对比较规范,有专门的统计机构与专职的统计人员,而一些小型单位,特别是私营、个体企业对统计工作重视不够,多数统计人员身兼数职,统计工作只是附带性的工作,而且经常变动,稳定性差,统计数据质量得不到保障;二是部分基层统计单位原始记录不全,未建立规范的统计台帐和统计制度,一些私营、个体企业,对统计工作不完全配合,填报的统计数据不能真实反映企业的实际情况,统计数据的质量存在较大偏差;三是基层开展统计工作所必须的经费和保障条件不能得到保障;四是部分基层单位分管统计的领导对统计工作不重视,对统计数据审核不严把不好关。

统计学各章练习——抽样推断

第九章抽样推断 一、名词 1、抽样推断:即由样本指标来推断总体指标的统计方法。 2、抽样误差:是指抽样指标和全及指标之间的绝对离差。 3、抽样极限误差:是指样本指标与全及指标之间产生的抽样误差被允许的最大可能范围,也叫允许误差。 4、点估计:就是直接用样本指标代表总体指标的估计方法。 5、区间估计:就是把抽样指标与抽样平均误差结合起来,来推断总体指标所在的可能范围的方法。 6、假设检验:就是先对研究总体的参数做出某种假设,然后抽取样本,构造适当的统计量,利用样本提供的信息对假设的正确性进行判断的过程。 二、填空题 1.抽样推断是由(样本指标)来推断(相应的全及指标)的统计方法。 2.影响抽样误差大小的因素主要有:总体各单位标志值的差异程度、(样本的单位数目)、(抽样的具体方法)和抽样调查的组织形式。 3.抽样误差是由于抽样的(随机性)而产生的误差,这种误差不可避免,但可以控制在(所允许的范围)之内。 4.抽样平均误差是样本平均数的(标准差),是所有可能样本指标与总体指标之离差的(平均数)。 5.抽样极限误差,是指样本指标与全及指标之间产生的(抽样误差)被允许的(最大可能范围)。 6.用样本指标估计总体指标,要做到三个要求,即:(无偏性)、(一致性)、(有效性)。 7.抽样估计的方法有(点估计)和(区间估计)两种。 8.总体参数的区间估计必须同时具备(估计值)、(抽样误差范围)和(概率保证程度)三个要素。 9.总体中各单位标志值之间的变异程度越大,要求的样本单位数就(越多),即样本容量就(越大),总体各单位标志值变异程度与样本容量之间成(正比)。 10.允许误差越大,需要的样本单位数目就(越少);允许误差越小,需要的样本单位数目就(越多)。 11.对推断结果要求的可靠程度越高,必要样本单位数目就(越多);反之,可靠程度越低,必要样本单位数目就(越少)。 12.参数估计是用样本统计量估计(总体参数),而假设检验则是先对总体参数(提出假设),然后,运用样本资料验证假设(是否成立)。 三、判断 1.在抽样推断中,作为推断对象的总体和作为观察对象的样本都是确定、唯一的。(×) 2.样本容量指从一个总体中可能抽取的样本个数。(×) 3.抽样极限误差总是大于抽样平均误差。(×) 4.重复抽样误差大于不重复抽样误差。(√) 5.抽样准确度要求高,则可靠性低。(√) 6.抽样平均数的标准差或抽样成数的标准差是衡量抽样误差一般水平的尺度。(√) 7.点估计就是以样本的实际值直接作为相应总体参数的估计值。(√) 8.抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。(√) 四、选择 (一)单项选择 1.抽样调查所遵循的基本原则是(B)。

统计案例分析---大学生月平均生活费的估计和检验

统计案例分析---大学生月平均生活费的估计和检验

统计案例分析 案例2.1 大学生月平均生活费的估计和检验 姓名:覃玉冰 学号:

班级: 16应用统计 一、数据 为了了解大学生日常生活费支出及生活费来源状况,对中国人民大学在校本科生的月生活费支出问题进行了抽样调查。该问卷随机抽取中国人民大学大一、大二、大三、大四在校本科生男女各30多人作为样本。调查采取分层抽样,对在校本科生各个年级男生、女生各发放问卷30多份,共发放问卷300份,回收问卷291份,其中有效问卷共272份。其中,男生的有效问卷为127份,女生为145份。调查得到的部分数据见表一。 表一大学生月平均生活费支出的调查数据(仅 截取部分) 性别所在年级家庭所在 地区平均月 生活费 (元) 性别所在年级家庭所在 地区 平均月 生活费 (元) 男1998级大型城市1000 女1998级大型城市500 男1998级大型城市800 女1998级大型城市800

男1998级大型城市1000 女1998级大型城市500 男1998级中小城市400 女1998级大型城市1000 二、生活费支出的区间估计和假设检验 (一)平均月生活费的描述统计量 为了更好地研究全校本科学生平均月生活费支出,我们先来看一下样本数据中平均月生活费支出的一些描述统计量。 在spss中,点分析→描述统计→描述→变量选择“平均月生活费”,选项选择“均值、标准差、均值的标准误”,得到的样本数据中平均月生活费的描述统计量见表二。 表二平均月生活费的描述统计量 N 均值标准差 统计量统计量标准误统计量 平均月生活费272 595.0414.761 243.444 有效的 N (列表状态)272 从表二可以看到,样本数据中平均月生活费支出的均值为595.04,标准差为243.444,均值的标准误为14.761. (二)平均月生活费的假设检验 从表二中我们已经知道了样本数据中平均月生活费支出的均值为595.04,现在我们来检验一下全校本科学生即总体的月平均生活费支出是否等于500。 1.检验统计量的确定 样本数据的样本量n为272,其大于30,可以认为该数据是一个大样本。现在我们并不知道总体的月平均生活费支出是否服从正态分布,但是在样本量大的条件下,如果总体为正态分布,样本统计量服从正态分布:如果总体为非

第六章 抽样(习题解答)

第六章抽样 一、辨析题 1、一般来说,任意抽样技术适用于正式的实际调查。 错误。适用于非正式的探测性调查,或调查前的准备工作。 2、一般说来,总体中各单位之间标志值的变异程度越大,需要抽样的样本数目越多;反之,需要抽样的样本数目越少。 正确 3、分层最佳抽样法指的是等比例分层抽样。 错误。这是非比例分层抽样。 4、一般而言,抽样的样本占总体的比例同抽样误差成反向关系,即抽样比例越大,抽样误差相对越小。 正确 5、抽样误差是随机抽样调查中必然发生的代表性误差,所以平均误差是不可避免的。而且,这种误差一般包括了技术性误差,即调查工作中的误差。 错误。这种误差一般不包括技术性误差即调查工作中的误差。 6、总体单位之间标志变异程度越大,抽样误差越大;反之则越

小。 正确 7、样本单位数目越多,抽样误差越大,反之则越小。 错误。样本单位数目越多,抽样误差越小,反之则大。 8、一般来说,简单随机抽样比分层、分群抽样误差大,不重复抽样比重复抽样误差大。 错误。重复抽样比不重复抽样误差大。 9、点值估计是考虑了抽样误差,直接以样本指标作为总体指标的估计值,作近似的估计。 错误,不考虑抽样误差。 二、名词解释 1、抽样调查 抽样调查也称为抽查,是指从调查总体中抽选出一部分要素作为样本,对样本进行调查,并根据抽样所得的结果推断总体的一种专门性的调查活动。 2、抽样 抽样是指在抽样调查时采用一定的方法,抽选具有代表性的样本,以及各种抽样操作技巧和工作程序等的总称。 3、随机抽样 随机抽样又称为概率抽样或机率抽样,是对总体中每一个体都给予平等的抽取机会的抽样技术。在随机抽样的条件下,每个个体抽中或抽不中完全凭机遇,

统计学专业经典案例分析

案例2 美国国家健康照顾协会 美国国家健康照顾协会的主要任务是了解健康照顾人力资源的短缺情况,并为未来制定发展规划。为了掌握护理人员对所从事工作的满意程度,该协会发起了一场全国性的有关医院护理人员的调查研究。调查项目包括:工作满意度、收入、晋升机会等,填答方式采用打分制,从0~100分,分值高表示满意度高。下面是其中的一部分调查结果: 另外,按医院招募护理人员的方式,对上述资料的分组结果如下:

要求:运用描述统计方法对资料进行处理,采用的表示方法要让人能够方便地获取相应的信息,对你发现出的问题给予讨论。尤其要讨论下列内容: (1)根据给定的数据资料,指出哪些方面护理人员感到最为满意,哪些方面最不满意。有可能的话,请提出改进的措施并进行讨论。 由题目,做出如下统计分析: 列1 列2 列3

有上述分析,可知护理人员感到最为满意的是工作,收入方面最不满意。 改进措施: (2)根据变异分析的结果,为什么医护人员对工作满意度的意见差异那么大? 答:a.从列1的分析结果可知,平均数=79.8<中位数=82<众数=84,可知数据呈左偏分布,即:数据中存在极小值使得算数平均数偏向较小的一方,又因为中位数小于众数,可知数据中的较小值所占得数目较多。综上所述,列1,即工作所取得得数据中,有很多人打得分数较低,也就是说,很多人对工作都相当不满意,因此,数据的差异性较大,方差较大,医护人员对工作满意度的意见差异也很大。 b.计算各列的变异系数可得:列1变异系数=1.172125228/79.8=0.01469;列2变异系数=2.086723826/54.44=0.03833;列3变异系数=2.288884/58.36=0.03922;可知列1变异系数=0.01469>列3变异系数=0.03922>列2变异系数=0.03833;所以工作的离散系数最大,可知工作中平均数的代表性最小,说明很多分对工作并不满意,即:数据的差异性较大,方差较大,医护人员对工作满意度的意见差异也很大。 (3)从分类资料中,你能得出什么样的结论?各类医院之间,医护人员对工作满意度的差别如何,哪一类医院的情况最好? 私立医院 退伍军人

抽样误差

抽样误差 抽样误差(Sampling error) [编辑] 什么是抽样误差 在抽样检查中,由于用样本指标代替全及指标所产生的误差可分为两种:一种是由于主观因素破坏了随机原则而产生的误差,称为系统性误差;另一种是由于抽样的随机性引起的偶然的代表性误差。抽样误差仅仅是指后一种由于抽样的随机性而带来的偶然的代表性误差,而不是指前一种因不遵循随机性原则而造成的系统性误差。 总的说来,抽样误差是指样本指标与全及总体指标之间的绝对误差。在进行抽样检查时不可避免会产生抽样误差,因为从总体中随机抽取的样本,其结构不可能和总体完全一致。例如样本 平均数与总体平均数之差,样本成数与总体成数之差| p? P | 。虽然抽样误差不可避免,但可以运用大数定律的数学公式加以精确地计算,确定它具体的数量界限,并可通过抽样设计加以控制。 抽样误差也是衡量抽样检查准确程度的指标。抽样误差越大,表明抽样总体对全及总体的代表性越小,抽样检查的结果越不可靠。反之,抽样误差越小,说明抽样总体对全及总体的代表性越大,抽样检查的结果越准确可靠。在统计学中把抽样误差分为抽样平均误差和抽样极限误差,下面就这两种误差分别进行阐释。为使推理过程简化,这里不对属性总体进行分析,而仅对变量总体进行分析计算。 [编辑] 抽样误差的计算

1、表现形式:平均数指标抽样误差;成数(比重)抽样误差。 2、平均数指标的抽样误差 1)重复抽样的条件下: 2)不重复抽样的条件下: 3、成数指标的抽样误差 1)重复抽样的条件下: 2)不重复抽样的条件下: [编辑] 影响抽样误差的因素 1.总体各单位标志值的差异程度。差异程度愈大则抽样误差愈大,差异程度愈小则则抽样误差愈小。 2.样本单位数。在其他条件相同的情况下,样本的单位数愈多,则抽样误差愈小。 3.抽样方法。抽样方法不同,抽样误差也不同。一般情况下重复抽样误差比不重复抽样误差要大一些。 4.抽样调查的组织形式。不同的抽样组织形式就有不同的抽样误差。 [编辑]

定位误差分析计算综合实例

定位误差分析计算综合实例 定位误差的分析与计算,在夹具设计中占有重要的地位,定位误差的大小是定位方案能否确定的重要依据。为了掌握定位误差计算的相关知识,本小节将给出一些计算实例,抛砖引玉,以使学习者获得触类旁通、融会贯通的学习效果。 例3-3 如图3.25所示,工件以底面定位加工孔内键槽,求尺寸h 的定位误差? 解:(1)基准不重合误差求jb ? 设计基准为孔的下母线,定位基准为底平面,影响两者的因素有尺寸h 和h 1,故jb ?由两部分组成: φD 半径的变化产生2 D ? 尺寸h 1变化产生12h T ,所以 122 h jb T D +?= ? 底平面,对刀基准(2)基准位置误差jw ? 定位基准为工件为与定位基准接触的支承板的工作表面,不记形状误差, 则有 0=?jw 所以槽底尺寸h 的定位误差为 122 h dw T D +?= ? 例3-4 有一批直径为0 d T d -φ的工件如图3.27所示。外圆已加工合格,今用V 形块定位铣宽度为b 的槽。若要求保证槽底尺寸分别为1L 、2L 和3L 。试分别分析计算这三种不同尺寸要求的定位误差。 解:(1)首先计算V 形块定位外圆时的基准位置误差jw ? 在图3.26中,对刀基准是一批工件平均轴线所处的位置O 点,设定位基准为外圆的轴线,加工精度参数的方向与21O O 相同,则基准位置误差jw ?为图中O 1 点到O 2点的距离。在ΔO 1CO 2中,2 2212α =∠= O CO T CO d ,,根据勾股定理求得 2 21sin 2α d jw T O O E = =?=? (2)分别计算图3.27三种情 况的定位误差 ①图a )中1L 尺寸的定位误差 2 )(2 sin 2sin 20 1ααd L dw d jw jb T T E B = ?= ?=?=?=? ②图b )中2L 尺寸的定位误差 L 2 L 3 L 1 0d T d -φ b 图3.27 V 形块定位外圆时定位误差的计算 图3.25 内键槽槽底尺寸定位误差计算 图3.26 V 形块定位外圆时 基准位置误差jw ?的计算 1—最大直径 2—平均直径 3—最小直径 B A α/ 2 1 C 3 2 O 2 O O

第四章 抽样估计(试题及答案)

第四章抽样估计 一、判断题部分 1.从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。(×) 2.在抽样推断中,全及指标值是确定的、唯一的,而样本指标值是一个随机变量。(√) 3.抽样平均误差总是小于抽样极限误差。(×) 4.在其它条件不变的情况下,提高抽样估计的可靠程度,则降低了抽样估计的精确程度。(√) 5.抽样平均误差反映抽样误差的一般水平,每次抽样的误差可能大于抽样平均误差,也可能小 于抽样平均误差。(√) 6.在抽样推断中,抽样误差的概率度越大,则抽样极限误差就越大于抽样平均误差。(√) 二、单项选择题 1.抽样平均误差是(A )。 A、抽样指标的标准差 B、总体参数的标准差 C、样本变量的函数 D、总体变量的函数 2.抽样调查所必须遵循的基本原则是(B )。 A、准确性原则 B、随机性原则 C、可靠性原则 D、灵活性原则 3.在简单随机重复抽样条件下,当抽样极限误差缩小为原来的1/2时,则样本单位数为原来的 (C )。 A、2倍 B、3倍 C、4倍 D、1/4倍 4.按随机原则直接从总体N个单位中抽取n个单位作为样本,这种抽样组织形式是( A)。 A、简单随机抽样 B、类型抽样 C、等距抽样 D、整群抽样 5.事先将总体各单位按某一标志排列,然后依排列顺序和按相同的间隔来抽选调查单位的抽样 称为(C ) A、简单随机抽样 B、类型抽样 C、等距抽样 D、整群抽样 6.在一定的抽样平均误差条件下(A )。 A、扩大极限误差范围,可以提高推断的可靠程度 B、扩大极限误差范围,会降低推断的可靠程度 C、缩小极限误差范围,可以提高推断的可靠程度 D、缩小极限误差范围,不改变推断的可靠程度 7.反映样本指标与总体指标之间的平均误差程度的指标是(C )。 A、平均数离差 B、概率度 C、抽样平均误差 D、抽样极限误差 8.以抽样指标估计总体指标要求抽样指标值的平均数等于被估计的总体指标值本身,这一标准 称为( A)。 A、无偏性 B、一致性 C、有效性 D、准确性 9.在其它条件不变的情况下,提高估计的概率保证程度,其估计的精确程度( B)。

第03章抽样误差

第3章抽样误差 3.1 抽样误差的概念 医学科研中通常采用抽样研究的方法,从某总体中随机抽取一个样本来进行研究,而所得样本统计量与总体参数常不一致,这种由抽样引起的样本统计量与总体参数间的差异属于抽样误差(sampling error),这在抽样研究中是不可避免的。 例如,假设某地成年男子血红蛋白的总体均数(μ)为13.76(g/100ml),随机抽查了360名男子,算得平均血红蛋白含量X=13.45(g/100ml),若用此X作为该地区成年男子血红蛋白的总体均数(μ)的一个估计值,则(13.76-13.45)=0.31(g/100ml),此差值属于抽样误差。 抽样误差有两种表现形式,其一是:样本统计量与总体参数间的差异,如样本均数与总体均数间的差异;其二是:不同样本的统计量间的差异,如从同一总体中抽取含量相等的两样本得到的两个样本均数之间的差异。 从理论上讲,若进行K次抽样,所得的K个样本统计量(例如X)则很可能各不相同,若将这些样本统计量编制成频率分布表或绘制成频率分布图,则可看出样本统计量的抽样分布是有规律的。 3.2 抽样误差产生的条件 抽样误差产生的两个必备条件: (1) 抽样研究。抽样研究是产生抽样误差的必备条件之一。只有对总体中的部分个体进行研究,才可能导致样本指标与总体指标的不一致,而且在从同一总体进行抽样的研究中,样本含量越少的研究,理论上抽样误差必然越大。 (2) 个体变异。个体变异是产生抽样误差的另一必备条件。在医学科研领域,许多被研究对象都存在着变异现象,如血压、疗效、药物反应等。在抽样方法和样本含量不变的条件下,变异大的研究样本其抽样误差也大,反之则小。 以上是产生抽样误差的必备条件,缺一不可。若进行普查,则被研究对象的个体变异将不会产生抽样误差;若个体间无变异,当然无需作抽样研究,也无抽样误差可言。

抽样误差

抽样误差、抽样平均误差与抽样极限误差 一、基本概念 抽样误差是指由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标和全及指标之间的绝对离差。因此,又称为随机误差,它不包括登记误差,也不包括系统性误差。 影响抽样误差的因素有:1、总体各单位标志值的差异程度;2、样本的单位数;3、抽样的方法;4、抽样调查的组织形式。 抽样误差又分为两种: 1、抽样平均误差。抽样平均误差是反映抽样误差一般水平的指标,它的实质含义是指抽样平均数(或成数)的标准差。即它反映了抽样指标与总体指标的平均离差程度。抽样平均误差的作用首先表现在它能够说明样本指标代表性的大小。平均误差大,说明样本指标对总体指标的代表性低;反之,则高。(记为μx 或μp ) 2、抽样极限误差。抽样极限误差指在进行抽样估计时,根据研究对象的变异程度和分析任务的要求所确定的样本指标与总体指标之间可允许的最大误差范围(记为?)。 二、计算公式 (一)抽样平均误差 1、样本平均数的平均误差 以μx 表示样本平均数的平均误差,σ表示总体的标准差。根据定义: 即n x σμ=,(若为不重复抽样,则总体方差σ要用进行修正)它说明在重复抽样的条件下,抽样平均误差与总体标准差成正比,与样本容量的平方根成反比。 例1:有5个工人的日产量分别为(单位:件):6,8,10,12,14,用重复抽样的方法,从中随机抽取2个工人的日产量,用以代表这5个工人的总体水平。则抽样平均误差为多少? 解:根据题意可得:(件) 总体标准差(件)

抽样平均误差(件) 注意:在计算抽样平均误差时,通常得不到总体标准差的数值,一般可以用样本标准差来代替总体标准差。 2、抽样成数的平均误差 总体成数P 可以表现为总体是非标志的平均数。即E(X)=P ,它的标准差 。 根据样本平均误差和总体标准差的关系,可以得到样本成数的平均误差的计算公式。 (不重复抽样时要修正) 注意:当总体成数未知时,可以用样本成数来代替。 例2:某企业生产的产品,按正常生产经验,合格率为90%,现从5000件产品中抽取50件进行检验,求合格率的抽样平均误差。 解:根据题意,在重复抽样条件下,合格率的抽样平均误差为: 在不重复抽样条件下,合格率的抽样平均误差为: (二)抽样极限误差 抽样极限误差是指用绝对值形式表示的 样本指标与总体指标偏差的可允许的最大范围。它表明被估计的总体指标有希望落在一个以样本指标为基础的可能范围。它是由抽样指标变动可允许的上限或下限与总体指标之差的绝对值求得的。 μαx Z *=?2 或μαp Z *=?2(P126,例题5-4)

相关主题
文本预览
相关文档 最新文档