第四章 比估计与回归估计
- 格式:ppt
- 大小:404.50 KB
- 文档页数:33
抽样调查一、选择题1.抽样调查的根本功能是( C )A. 获取样本资料B. 计算样本资料C . 推断总体数量特征 D. 节约费用2.概率抽样与非概率抽样的根本区别是( B )A.是否能保证总体中每个单位都有完全相同的概率被抽中B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中C.是否能减少调查误差D.是否能计算和控制抽样误差3. 与简单随机抽样进行比较,样本设计效果系数Deff >1表明( A )A.所考虑的抽样设计比简单随机抽样效率低B.所考虑的抽样设计比简单随机抽样效率高C.所考虑的抽样设计与简单随机抽样效率相同D.以上皆对4.优良估计量的标准是( B )A.无偏性、充分性和一致性B.无偏性、一致性和有效性C. 无误差性、一致性和有效性D. 无误差性、无偏性和有效性5.某乡欲估计今年的小麦总产量进行调查,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到吨,这些村去年63.118=y 的产量平均为吨。
试采用比率估计方法估计今年该地区小麦总产量(21.104=x B )A.12820.63B.14593.96C.12817.83D.14591.496.抽样标准误差的大小与下列哪个因素无关( C )A .样本容量B .抽样方式、方法C .概率保证程度D .估计量7.抽样标准误差与抽样极限误差之间的关系是( B )A. B. C. D.θθ)ˆ(SE =∆)ˆ(θtSE =∆θθ)ˆ(tSE =∆tSE )ˆ(θ=∆8.应用比率估计量能使估计精度有较大改进的前提条件是调查变量与辅助变量之间大致成( A )关系A.正比例B.反比例C.负相关D.以上皆是9.能使达到极小值的值为( B ))2(1)(222YX X Y lr S S S nf y V ββ-+-=βA. B. C. D.YX X Y S S S ⋅2X YX S S 2YYX S S X YX S S 210.( B ) 是总体里最小的、不可再分的单元。
《抽样调查》复习题概述1.1 结合以下所列情况讨论哪些适合用全面调查,哪些适合用抽样调查,并说明理由;1.研究居住在某城市所有居民的食品消费结构;抽样调查2.调查一个县各村的粮食播种面积和全县生猪的存栏头数;全面调查3.为进行治疗,调查一地区小学生中患沙眼的人数;全面调查4.估计一个水库中草鱼的数量;抽样调查5.某企业想了解其产品在市场的占有率;抽样调查6.调查一个县中小学教师月平均工资。
全面调查1.2 结合习题1.1的讨论,你能否概括在什么场合作全面调查,什么场合适合做抽样调查。
答:全面调查:是一种有策划、有方法、有程序的活动,调查的结果一般表现为搜集的数据。
抽样调查:为某一特定目的而对部分考查对象进行的调查1.3某刊物对其读者进行调查,调查表随刊物送到读者手中,对寄回的调查表进行分析。
试问这是不是一项抽样调查?样本抽取是不是属于概率抽样?为什么?答:属于抽样调查,属于概率抽样,每一个样本单元被选中入样的概率是已知的。
1.5 结合习题1.3的讨论,根据你的理解什么是概率抽样?什么是非概率抽样?它们各有什么优点?答:非概率抽样:优点:操作简单,调查数据的处理较容易,省时,省费用。
概率抽样:根据随机原则,按照事先设计的程序,从总体抽取部分单元的抽样方法(要求每一个样本单元被选中入样的概率是已知的)优点:1.6抽样调查的特点。
答:1、节约费用 2、时效性强 3、完成全面调查不能胜任的项目 4、有助于提高数据质量抽样调查基本原理2.1 试说明以下术语或概念之间的关系与区别;1.总体、样本与个体;总体:是指所要研究对象的全体,它由研究对象中所有性质相同的个体组成,组成总体的各个个体称为总体单元或单位。
抽样总体:是指从中抽取样本的总体。
2.总体与抽样框;总体与抽样框应保持一致抽样框:是一份包含所有抽样单元的名单,给每一个抽样单元编上一个号码,就可以按照一定的随机化程序进行抽样。
抽样总体的具体表现是抽样框。
习题一1.请列举一些你所了解的以及被接受的抽样调查。
2.抽样调查基础理论及其意义;3.抽样调查的特点。
4.样本可能数目及其意义;5.影响抽样误差的因素;6.某个总体抽取一个n=50的独立同分布样本,样本数据如下:567 601 665 732 366 937 462 619 279 287690 520 502 312 452 562 557 574 350 875834 203 593 980 172 287 753 259 276 876692 371 887 641 399 442 927 442 918 11178 416 405 210 58 797 746 153 644 4761)计算样本均值y与样本方差s2;2)若用y估计总体均值,按数理统计结果,y是否无偏,并写出它的方差表达式;3)根据上述样本数据,如何估计v(y)?4)假定y的分布是近似正态的,试分别给出总体均值μ的置信度为80%,90%,95%,99%的(近似)置信区间。
习题二一判断题1 普查是对总体的所有单元进行调查,而抽样调查仅对总体的部分单元进行调查。
2 概率抽样就是随机抽样,即要求按一定的概率以随机原则抽取样本,同时每个单元被抽中的概率是可以计算出来的。
3 抽样单元与总体单元是一致的。
4 偏倚是由于系统性因素产生的。
5 在没有偏倚的情况下,用样本统计量对目标量进行估计,要求估计量的方差越小越好。
6 偏倚与抽样误差一样都是由于抽样的随机性产生的。
7 偏倚与抽样误差一样都随样本量的增大而减小。
8 抽样单元是构成抽样框的基本要素,抽样单元只包含一个个体。
9 抽样单元可以分级,但在抽样调查中却没有与之相对应的不同级的抽样框。
10 总体目标量与样本统计量有不同的意义,但样本统计量它是样本的函数,是随机变量。
11 一个抽样设计方案比另一个抽样设计方案好,是因为它的估计量方差小。
12 抽样误差在概率抽样中可以对其进行计量并加以控制,随着样本量的增大抽样误差会越来越小,随着n越来越接近N,抽样误差几乎可以消除。
比估计与回归估计在分层抽样中的应用摘要:本文主要探讨了在分层抽样中,估计与回归估计的应用。
首先,我们介绍了分层抽样的基本概念和方法,然后详细阐述了估计和回归估计的基本原理和应用。
我们发现,在分层抽样中,估计和回归估计可以有效地提高样本的代表性和估计的准确性。
此外,我们还讨论了估计和回归估计在实际应用中可能遇到的问题和挑战,以及如何解决这些问题。
最后,我们通过实证研究验证了估计和回归估计在分层抽样中的有效性。
关键词:分层抽样;估计;回归估计;样本代表性;估计准确性;问题与挑战;实证研究。
一、引言1 研究背景和意义在研究背景和意义上,分层抽样是一种复杂而有效的抽样方法,它的主要目标是从复杂的总体中抽取出具有代表性的研究样本。
这种方法特别适用于总体情况复杂,各单位之间差异较大,单位较多的情况。
具体来说,分层抽样将总体按照某种共同特性或属性划分为多个较小的子组或层,再从每个层内独立随机抽取样本。
估计与回归估计作为统计学中的核心概念,其主要目标是根据样本数据来估计或预测一个未知的总体参数。
在分层抽样的背景下,估计和回归估计的应用变得尤为重要。
因为通过这两个方法,我们可以有效地提高样本的代表性和估计的准确性,进而更准确地对总体进行推断和预测。
然而,在实际应用中,我们可能会遇到一些问题和挑战,如如何选择合适的分层变量,如何处理层间异质性等问题。
因此,如何解决这些问题,优化估计和回归估计在分层抽样中的应用,是本研究的重要任务。
最后,我们将通过实证研究来验证估计和回归估计在分层抽样中的有效性。
2 研究目的和方法2.1研究目的2.1.1对比估计与回归估计在分层抽样中的优劣:通过对比研究,明确哪种估计方法在分层抽样中更有效,或者在不同情况下哪种方法更适用。
2.1.2探讨分层抽样中估计与回归估计的应用:研究如何在分层抽样中应用比估计和回归估计,以及如何根据实际情况选择合适的估计方法。
2.1.3为分层抽样中的估计方法提供理论支持和实践指导:通过对比研究,为分层抽样中的估计方法提供理论依据和实践指导,帮助相关领域的研究者和实践者更好地理解和应用这些方法。
简单估计、比估计与回归估计的效率比较作者:田兵来源:《牡丹江师范学院学报(自然科学版)》2018年第03期摘要:比较简单随机不放回抽样下,简单估计、比估计和回归估计三种估计量的效率.简单估计是无偏的,比估计和回归估计是有偏的;在大样本情况下(B≠R),回归估计的精度最高,简单估计的精度最低.关键词:简单估计量;比估计量;辅助信息;回归估计量[中图分类号]O212 [文献标志码]AAbstract:Compare the efficiencies of simple estimator,ratio estimator and regression estimator under SRSWOR. Simple estimator is unbiased, ratio estimator and regression estimator are biased. The efficiency of regression estimator is highest, the efficiency of simple estimator is lowest under big sample (B≠R).Key words:simple estimator; ratio estimator;auxiliary information;regression estimator简单估计、比估计和回归估计是经常用到的对总体有关参数进行估计的三种估计量.简单估计形式简洁,具有无偏性.比估计依据调查变量与辅助变量间的比率对总体有关参数进行估计和推断.虽然比估计是有偏的,但是因为它除了使用调查变量样本信息外,还充分利用辅助变量携带的信息来估计总体参数,所以比估计往往比单纯使用调查变量资料的简单估计有更高的精度.回归估计根据样本各单元调查变量与辅助变量之间的关系构建回归方程,并根据回归系数对总体有关参数进行估计.回归估计是有偏的,只有在大样本情形下,回归估计量优于简单估计和比估计,缺点是计算方法较为复杂.4 结论数值模拟表明,在简单随机不放回抽样下,简单估计是无偏的,比估计和回归估计是有偏的;在大样本的情况下(B≠R),回归估计的精度最高,简单估计的精度最低.参考文献[1] Zaizai Yan,Bing Tian. Ratio method to the mean estimation using coefficient of skewness of auxiliary variable[J]. ICICA,Part II,CCIS,2010,106:103-110.[2] 冯士雍,施锡铨.抽样调查—理论、方法和实践[M].上海:上海科技技术出版社,1994.100-152.[3] 薛雨霞,闫在在.有辅助信息下总体均值的一类新比估计量[J].内蒙古工业大学学报,2015,34(1):1-5.[4] 卢静莉.多辅助变量线性组合的回归估计[J].统计与信息论坛,2010,25(5):14-17.[5] 张格亮,李昕.风险投资项目评估中几种数学方法评析. [J].牡丹江师范学院学报:自然科学版,2012(1):1-4.[6] 孙耀东.含双辅助变量的有限总体均值的回归估计[J].内蒙古农业大学学报:自然科学版,2013,34(6):169-173.[7] 刘常彪,李臻臻.关于泊松分布高阶矩的一些研究. [J].牡丹江师范学院学报:自然科学版,2014(2):5-6.[8] 刘媛媛.比估计方法下Eichhorn and Hayre模型的参数估计[J].内蒙古师范大学学报,2014,43(6):689-695.[9] 薛雨霞. 关于比率型估计量和AP设计下包含概率研究[D].呼和浩特:内蒙古工业大学,2015.[10] 侯瑞环.含辅助信息的最小非参似然比估计和检验[J]. 四川师范大学学报:自然科学版,2016,39(1):59-64.编辑:吴楠。
Ratio and Regression Estimator引例:1802年,拉普拉斯想要估计法国的人口数目。
他获得了一个遍布全国范围的30个社区(commune )的样本,截至1802年9月23日总共有2037615居民。
在包括1802年9月23日以前的三年中,215599个新生儿在30个commune 。
拉普拉斯认为30个commune 的每年注册的新生儿数为215599/3=71866.33。
把2037615按照71866.33 来分,拉普拉斯估计每年每28.35人里有一个注册新生儿。
具有众多人口的乡镇也就可能有同样众多的注册新生儿,通过用28.35乘以全法国年度新生儿总数来估计得出法国人口总数。
调查中都有辅助信息,抽样框也通常有每个单元额外的信息,这些信息能被用来提高我们的估计精度。
一、为什么要使用比率估计/回归估计利用总体的辅助信息提高估计的精度。
辅助指标的选择:第一,辅助指标应该与调查指标有较好的正的相关关系。
第二,x y的抽样分布较ux y 的抽样分布变动性要小得多。
第三,辅助指标的总体总量或总体均值已知。
比率估计、回归估计需要有足够的样本量才能保证估计的有效。
有偏估计:当样本量足够大时,估计的偏倚趋于0。
简单地想要估计一个比率:假定总体由面积不同农业用地构成,i y i =地谷物的产量,i x i =地的面积,B=每亩谷物的平均产量。
想要估计一个总体总数,但总体大小N 是未知的。
但是我们知道,于是可以通过y N t y =ˆ来估计N,由此我们可以使用不同于总数N 的方法而是采用辅助变量来进行测量。
要估计渔网中长度长于12cm 的鱼的总数,抽取一个鱼的随机样本,估计长度长于12cm 的鱼所占的比例,用鱼的总数N 乘以这个比例即可得到,但如果N 未知不能使用。
能称量渔网中鱼的总重量。
鱼的长度与其重量相关。
xt yt x yr =ˆ调整来自样本的估计量以便它们反映人口统计学的总量。
在一所具有4000名学生的大学提取一个400个学生的简单随机样本,此样本可能包含240个女性,160个男性,且其中被抽中的84名女性和40名男性计划以教学为毕业后的职业。
抽样技术课后习题-参考答案-金勇进第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s1706366666206*300500003001500001)()ˆ(222=-=-==s nf N y N v YV 19.413081706366666(==)y v 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。