抽样技术练习题
- 格式:docx
- 大小:10.96 MB
- 文档页数:28
应用抽样技术练习题一、选择题1. 下列哪种抽样方法属于非概率抽样?A. 简单随机抽样B. 分层抽样C. 方便抽样D. 系统抽样2. 在简单随机抽样中,每个个体被抽中的概率是:A. 不相等B. 相等C. 逐渐增大D. 逐渐减小A. 总体标准差B. 抽样误差C. 置信水平A. 确定总体B. 划分层次C. 确定各层样本量5. 系统抽样中,抽样间隔的计算公式是:A. N/nB. N/(n+1)C. n/ND. (N1)/n二、填空题1. 抽样技术分为两大类:______抽样和______抽样。
2. 在______抽样中,每个个体被抽中的概率是相等的。
3. 抽样误差的大小与样本量成______比,与总体标准差成______比。
4. 在分层抽样中,各层的样本量应与各层的______成比例。
5. 系统抽样的第一步是确定______。
三、简答题1. 简述简单随机抽样的步骤。
2. 何为抽样误差?它受哪些因素影响?3. 简述分层抽样的优点。
4. 系统抽样与简单随机抽样有何区别?5. 如何确定样本量?四、计算题1. 某企业有员工1000人,采用简单随机抽样方法抽取50人进行调查。
计算每个员工被抽中的概率。
2. 某地区居民收入总体标准差为500元,要求抽样误差不超过50元,置信水平为95%。
计算所需样本量。
3. 某学校有学生2000人,分为四个年级,每个年级人数分别为400、450、500和650人。
现采用分层抽样方法抽取200人进行调查,求每个年级应抽取的样本量。
4. 某生产线共有1000个产品,采用系统抽样方法抽取100个产品进行质量检验。
计算抽样间隔。
5. 某企业对员工满意度进行调查,总体标准差为10%,要求抽样误差不超过2%,置信水平为90%。
计算所需样本量。
五、判断题1. 在抽样调查中,总体的大小对于抽样误差没有影响。
()2. 非概率抽样不能提供总体参数的估计。
()3. 在系统抽样中,第一个样本单元可以随机选择。
应用抽样技术练习题答案一、选择题1. 抽样技术中,简单随机抽样的特点是:A. 样本容量较大B. 每个个体被抽中的概率相等C. 样本代表性差D. 抽样成本高答案:B2. 系统抽样中,若总体容量为100,样本容量为10,抽样间隔为:A. 10B. 5C. 20D. 1答案:A3. 分层抽样的目的是:A. 增加样本容量B. 提高样本的代表性C. 降低抽样成本D. 减少数据收集时间答案:B4. 在分层抽样中,如果某层的样本量占总体的比例小于该层在总体中的比例,那么该层的:A. 抽样误差会增大B. 抽样误差会减小C. 抽样成本会降低D. 抽样成本会提高答案:A5. 以下哪种抽样方法不属于概率抽样?A. 简单随机抽样B. 系统抽样C. 分层抽样D. 判断抽样答案:D二、判断题1. 在简单随机抽样中,每个个体被抽中的概率是相同的。
(对)2. 分层抽样可以提高样本的代表性,但会增加抽样成本。
(错)3. 系统抽样适用于总体分布均匀的情况。
(对)4. 判断抽样是一种非概率抽样方法。
(对)5. 抽样误差与样本容量成反比。
(对)三、简答题1. 请简述分层抽样的优点和局限性。
答案:分层抽样的优点是能够保证样本在各个层中的比例与总体相同,从而提高样本的代表性。
局限性是分层可能需要额外的信息,且如果分层不准确,可能会影响样本的代表性。
2. 什么是系统抽样?请简述其抽样过程。
答案:系统抽样是一种概率抽样方法,它首先将总体随机分成若干个等距的子群,然后在第一个子群中随机选择一个起始点,之后按照固定的间隔选择样本。
这种方法适用于总体分布均匀的情况。
四、计算题1. 某公司有500名员工,需要从中随机抽取50名员工进行满意度调查。
如果采用系统抽样,计算抽样间隔。
答案:抽样间隔 = 总体容量 / 样本容量 = 500 / 50 = 102. 假设某城市有10个区域,每个区域的人口数分别为10000, 15000, 12000, 8000, 9000, 11000, 13000, 7000, 14000, 6000。
应用抽样技术练习题答案一、选择题1. 抽样技术在统计分析中的主要作用是什么?A. 预测未来趋势B. 代表总体特征C. 描述个体差异D. 计算平均值答案:B2. 以下哪项不是抽样误差的来源?A. 抽样方法B. 抽样框的不完整性C. 抽样过程中的随机性D. 样本量的大小答案:D3. 简单随机抽样的特点是什么?A. 每个个体被抽中的概率相同B. 样本量必须很大C. 需要分层抽样D. 只能用于总体较小的情况答案:A4. 分层抽样的优点是什么?A. 可以减少抽样误差B. 可以增加样本量C. 可以提高总体的代表性D. 可以降低抽样成本答案:A5. 系统抽样的特点是什么?A. 抽样间隔是固定的B. 抽样间隔是随机的C. 需要分层D. 需要配额答案:A二、判断题1. 抽样调查总是比全面调查更经济。
(错误)2. 抽样调查的目的是估计总体参数。
(正确)3. 抽样调查中,样本量越大,抽样误差就越小。
(错误)4. 抽样框是抽样调查中用来记录所有个体的列表。
(正确)5. 抽样技术只能用于定量研究。
(错误)三、简答题1. 请简述分层抽样的步骤。
答案:分层抽样的步骤包括:(1)确定总体并将其分为互不重叠的子群体,即层;(2)在每个层中独立地进行抽样;(3)将各层的样本合并,形成总体的代表性样本。
2. 为什么在抽样调查中需要考虑样本的代表性?答案:样本的代表性意味着样本能够反映总体的特征。
如果样本具有代表性,那么从样本中得到的统计推断将更接近总体的真实情况,从而提高研究的准确性和可靠性。
四、计算题1. 假设一个总体有1000个个体,我们使用简单随机抽样方法抽取了50个个体作为样本。
计算样本比例的抽样误差。
答案:抽样误差可以通过以下公式计算:\( \text{抽样误差} = Z\times \sqrt{\frac{p(1-p)}{n}} \),其中\( Z \)是标准正态分布的置信水平对应的Z值(例如,95%置信水平对应的Z值为1.96),\( p \)是总体比例(由于我们不知道总体比例,这里假设为0.5,此时抽样误差最大),\( n \)是样本量。
抽样调查练习适合对口升学一.单选题1. 随机抽样的基本要求是严格遵守( )。
A.准确性原则B.随机原则C.代表性原则D.可靠性原则2. 抽样调查的主要目的是( )。
A.广泛运用数学的方法B.计算和控制抽样误差C.修正普查的资料D.用样本统计量推算总体参数3. 抽样总体单位亦可称为( )。
A.样本B.单位样本数C.样本单位D.总体单位4. 抽样误差产生于( )。
A.登记性误差B.系统性误差C.登记性误差与系统性误差D.随机性的代表性误差5. 在实际工作中,不重复抽样的抽样平均误差的计算,采用重复抽样的公式的情况是( )。
A.样本单位数占总体单位数的比重很小时B.样本本单位数占总体单位数的比重很大时C. 样本单位数目很少时D. 样本单位数目很多时6. 在同样条件下,不重复抽样的抽样平均误差与重复抽样的抽样平均误差大小关系是( )。
A.两者相等B.前者小于后者C.两者有时相等,有时不等D.后者小于前者7. 在抽样推断中,样本的容量( )。
A.越小越好B.越大越好C.取决于统一的抽样比例D.取决于对抽样推断可靠性的要求8. 用简单随机抽样(重复抽样)方法抽取样本单位,如果要使抽样平均误差降低50%,则样本容量需扩大到原来的( )。
倍倍倍倍9. 在重复简单随机抽样下,抽样平均误差要减少1/3,则样本单位数就要扩大到( )。
倍倍倍倍10. 某企业今年5月试制新产品,试生产60件,其中合格品与不合格品各占一半,则该新产品合格率的成数方差为( )。
%%%%11. 点估计( )。
A.不考虑抽样误差即可靠程度B.考虑抽样误差及可靠程度C.适用于推断的准确度要求高的情况D.无需考虑无偏性、有效性、一致性12. 反映样本统计量与总体参数之间抽样误差可能范围的指标是( )。
A.概率B.允许误差的大小C.概率保证程度D.抽样平均误差的大小13. 在区间估计中,有三个基本要素,它们是( )。
A.概率度、抽样平均误差、抽样数目B.概率度、统计量值、误差范围C.统计量值、抽样平均误差、概率度D.误差范围、抽样平均误差、总体单位数二.多选题1. 抽样技术是一种( )。
习题一1.请列举一些你所了解的以及被接受的抽样调查。
2.抽样调查基础理论及其意义;3.抽样调查的特点。
4.样本可能数目及其意义;5.影响抽样误差的因素;6.某个总体抽取一个n=50的独立同分布样本,样本数据如下:567 601 665 732 366 937 462 619 279 287690 520 502 312 452 562 557 574 350 875834 203 593 980 172 287 753 259 276 876692 371 887 641 399 442 927 442 918 11178 416 405 210 58 797 746 153 644 4761)计算样本均值y与样本方差s2;2)若用y估计总体均值,按数理统计结果,y是否无偏,并写出它的方差表达式;3)根据上述样本数据,如何估计v(y)?4)假定y的分布是近似正态的,试分别给出总体均值μ的置信度为80%,90%,95%,99%的(近似)置信区间。
习题二一判断题1 普查是对总体的所有单元进行调查,而抽样调查仅对总体的部分单元进行调查。
2 概率抽样就是随机抽样,即要求按一定的概率以随机原则抽取样本,同时每个单元被抽中的概率是可以计算出来的。
3 抽样单元与总体单元是一致的。
4 偏倚是由于系统性因素产生的。
5 在没有偏倚的情况下,用样本统计量对目标量进行估计,要求估计量的方差越小越好。
6 偏倚与抽样误差一样都是由于抽样的随机性产生的。
7 偏倚与抽样误差一样都随样本量的增大而减小。
8 抽样单元是构成抽样框的基本要素,抽样单元只包含一个个体。
9 抽样单元可以分级,但在抽样调查中却没有与之相对应的不同级的抽样框。
10 总体目标量与样本统计量有不同的意义,但样本统计量它是样本的函数,是随机变量。
11 一个抽样设计方案比另一个抽样设计方案好,是因为它的估计量方差小。
12 抽样误差在概率抽样中可以对其进行计量并加以控制,随着样本量的增大抽样误差会越来越小,随着n越来越接近N,抽样误差几乎可以消除。
欢迎共阅《抽样技术》期末复习1、设计效应(Deff )答:设计效应(deff )是由基什提出的,用来对不同抽样方法进行比较,其定义为:srs V(y)deff V (y)=,其中srs V (y)为不放回简单随机抽样简单估计量的方差;V(y)为某个抽样设计在同样样本量条件下估计量的方差。
设计效应的定义就是将某个抽样设计的估计量的方差与同样样本量条件下的不放回简单随机抽样简单估计量的方差进行比较。
如果deff<1,则所考虑的抽样率低。
deff n '。
2答:2)每3偏。
(3查数据质量和估计结果的负面影响非常大。
非抽样误差按其来源、性质的不同,可以分为抽样框误差、无回答误差和计量误差等三类。
4、不等概率抽样答:不等概率抽样在抽样前赋予总体每个单元一个入样概率,当然这个入样概率是不相同的,否则抽样就成为等概率的抽样。
不等概抽样的优点是大大提高估计精度,减少抽样误差,但使用它也有条件,就是必须要有说明每个单元规模大小的辅助变量来确定每个单元人样的概率,这在抽样及推算时都是必须的。
不等概率抽样可以按样本单元是否放回分为放回不等概抽样和不放回不等概抽样。
5、最优分配答:在分层随机抽样中,如何将样本量分配到各层,使得在总费用给定的条件下估计量的方差达到最小,或在给定估计量方差的条件下,使总费用最小,能满足这个条件的样本量分配就是最优分配。
6、比率估计答:比率估计(radioestimator)又称比估计,在进行抽样调查时,目标量本身就是总体比率,这样对目标量的估计就叫做比率估计,也可用来提高估计量的精度,它是有偏的。
7、试述分别比估计和联合比估计的比较因为这8如9答:但10区共有N=1000户,调查了n=100户,得y=12.5吨,2s=1252,有40户用水超过了规定的标准。
要求计算:该住宅区总的用水量及95%的置信区间;若要求估计的相对误差不超过10%,应抽多少户作为样本?以95%的可靠性估计超过用水标准的户数;解:已知N=1000,n=100,n100f0.1N1000===,2y=12.5s1252=,估计该住宅区总的用水量Y为:估计该住宅区总的用水量Y的方差和标准差为:因此,在95%的置信度下,该住宅总的用水量的置信区间估计为:即,我们可以以95%的把握认为该住宅总的用水量在5921吨~19079吨之间。
抽样技术复习题1.抽样单元是构成抽样框的基本要素,一个抽样单元就是一个个体。
对错(正确答案)2.当调查单位的抽样框不完整时,无法实施随机抽样。
对错(正确答案)3.将100只兔子从0~99编号,从钱包中随意抽取纸币,按纸币的尾号后两位抽取样本兔子的方法属于概率抽样。
对错(正确答案)4.总体编号0~64,在0~99中产生随机数r,若r>64则舍弃重抽,该方法是等概率的。
对(正确答案)错5.配额抽样是分层随机抽样的一种形式。
对错(正确答案)6.偏差为零的估计量就是无偏估计量。
对(正确答案)错7.无偏估计量的均方误差等于该估计量的方差。
对(正确答案)错8.没有无偏的比率估计量。
对9.当调查变量与辅助变量的相关系数ρ=0时,回归估计与简单估计的效果相同。
对(正确答案)错10.比率估计总是优于回归估计。
对错(正确答案)11.分层抽样的样本在总体中分布比简单随机抽样均匀。
对(正确答案)错12.分层随机抽样要将总体划分为若干个层,然后按随机原则选取一些层进行研究。
对错(正确答案)13.分层抽样不仅能对总体指标进行推算,而且能对各层指标进行推算。
对(正确答案)错14.当各层的样本量都比较大,而且各层的Rh或βh之间差异较大,则联合估计更有效。
对错(正确答案)15.当各层的样本量不大,而且各层的Rh或βh之间差异较小,则采用分别估计较为适宜。
对错(正确答案)16.整群抽样设计总是比简单随机抽样效率低。
对17.整群抽样对中选的群中的所有总体单元进行普查。
对(正确答案)错18.在整群抽样中,比率估计可以有效地提高抽样的估计精度。
对(正确答案)错19.划分群时应使同一群内各单元之间的差异尽可能大,这个原则与分层抽样中划分层的原则是相同的。
对错(正确答案)20.在整群抽样中,以群规模为辅助变量的比率估计可以有效地提高抽样的估计精度。
对(正确答案)错21.使用不等概率抽样的必要条件是每一个总体单元都要有一个已知的辅助变量,说明每个单元规模大小。
一、选择题A. 简单随机抽样B. 分层抽样C. 系统抽样D. 整群抽样A. 推断总体参数B. 获取样本信息C. 评估调查结果D. 建立模型A. 样本容量过大B. 样本容量过小C. 样本具有代表性D. 样本随机抽取A. 年龄B. 性别C. 职业A. 简单随机抽样B. 分层抽样C. 系统抽样D. 整群抽样二、判断题1. 抽样调查可以完全代替全面调查。
()2. 抽样调查的样本容量越大,结果越准确。
()3. 分层抽样可以提高样本的代表性。
()4. 系统抽样适用于总体分布不均匀的情况。
()5. 整群抽样适用于总体规模较大的情况。
()三、计算题1. 某班级共有50名学生,现采用简单随机抽样的方法抽取10名学生进行问卷调查,求抽样概率。
2. 某城市共有1000户居民,现采用分层抽样的方法抽取200户居民进行问卷调查,其中第一层抽取50户,第二层抽取100户,第三层抽取50户,求每层的抽样比例。
3. 某公司有员工1000名,现采用系统抽样的方法抽取100名员工进行问卷调查,每隔10名抽取1名,求抽样间隔。
4. 某地区共有10000名居民,现采用整群抽样的方法抽取100个居民小组进行问卷调查,每个小组有100名居民,求抽样比例。
5. 某调查员从100个调查对象中随机抽取10个进行调查,其中男性5人,女性5人,求抽样比例。
四、应用题1. 一家服装店有2000件衣服,要从中随机抽取100件进行质量检查,请设计一个抽样方案。
2. 一项关于大学生消费习惯的调查,需要从1000名大学生中抽取200名作为样本,请设计一个分层抽样方案。
3. 某城市有100个社区,现要调查居民对公共设施满意度的意见,请设计一个系统抽样方案。
4. 一项关于智能手机使用情况的调查,需要从全国100个城市中抽取50个城市作为样本,请设计一个整群抽样方案。
5. 一项关于某地区农产品质量的调查,共有1000个样本,其中50个样本为不合格品,请计算样本的不合格率。
9.1.2 分层随机抽样一、选择题1.分层随机抽样又称类型抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层随机抽样为保证每个个体等可能抽样,必须进行()A.每层等可能抽样B.每层可以不等可能抽样C.所有层按同一抽样比等可能抽样D.所有层抽取的个体数量相同【答案】C【解析】保证每个个体等可能入样是三种基本抽样方式的共同特征,为了保证这一点,分层随机抽样时必须在所有层都按同一抽样比等可能抽取.故选:C2.某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为100、200、300、400件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丁种型号的产品中抽取()件.A.24B.18C.12D.6【答案】A【解析】设应从丁种型号的产品中抽取x件,由分层抽样的基本性质可得60 400100200300400x=+++,解得24x=.故选:A.3.某单位有职工100人,不到35岁的有45人,35岁到49岁的有25人,剩下的为50岁以上(包括50岁)的人,用分层随机抽样的方法从中抽取20人,各年龄段分别抽取的人数为()A.7,5,8B.9,5,6C.6,5,9D.8,5,7【答案】B【解析】由于样本量与总体个体数之比为2011005=,故各年龄段抽取的人数依次为14595⨯=,12555⨯=,20956--=.故选:B4.已知某地区中小学生人数和近视情况分别如图1和如图2所示,为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()A .100,20B .200,20C .100,10D .200,10【答案】B【解析】由题意知,样本容量为()3500450020002%200++⨯=,其中高中生人数为20002%40⨯=,高中生的近视人数为4050%20⨯=,故选B.5.(多选题)我校有高一学生850人,高二学生900人,高三学生1200人,学校团委欲用分层抽样的方法抽取30名学生进行问卷调查,则下列判断错误的是( )A .高一学生被抽到的概率最大B .高二学生被抽到的概率最大C .高三学生被抽到的概率最大D .每名学生被抽到的概率相等 【答案】ABC【解析】由抽样的定义知,无论哪种抽样,样本被抽到的概率都相同,故每名学生被抽到的概率相等,故选ABC .6.(多选题)某单位有老年人28人、中年人54人、青年人81人,为了调查他们的身体状况,从中抽取一个容量为36的样本,则不适合抽取样本的方法是( ) A .随机数表法 B .抽签法C .简单随机抽样D .先从老年人中剔除1人,再用分层抽样【答案】ABC【解析】因为总体是由差异明显的三部分组成,所以考虑用分层抽样. 因为总人数为285481163++=,样本容量为36,由于按36163抽样,无法得到整数解,因此考虑先剔除1人,将抽样比变为3621629=. 若从老年人中随机地剔除1人,则老年人应抽取22769⨯=(人),中年人应抽取254129⨯=(人),青年人应抽取281189⨯=(人),从而组成容量为36的样本.二、填空题7.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区有10个特大型销售点,要从中抽取7个销售点调查其销售收入和售后服务等情况,记这项调查为②,则完成①②这两项调查宜采用的抽样方法分别为_____. 【答案】分层随机抽样、简单随机抽样【解析】由调查①可知个体差异明显,故宜用分层随机抽样;调查②中个体较少,且个体没有明显差异,故宜用简单随机抽样.8.防疫站对学生进行身体健康调查,采用分层抽样法抽取,泗县一中高三有学生1600人,抽取一个容量为200的样本,已知女生比男生少抽10人,则该校的女生人数应该有 . 【答案】760【解析】设学校有女生x 人,∵ 对全校男女学生共1600名进行健康调查, 用分层抽样法抽取一个容量为200的样本,∴ 每个个体被抽到的概率是200116008=, 根据抽样过程中每个个体被抽到的概率相等,∵女生比男生少抽了10人,且共抽200人, ∴女生要抽取95人,∴女生共有1957608÷= 9.某高中在校学生2000人.为了响应“阳光体育运动”号召,学校举行了跑步和登山比赛活动.每人都参加而且只参与了其中一项比赛,各年级参与比赛人数情况如表:其中a :b :2c =:3:5,全校参与登山的人数占总人数的35,为了了解学生对本次活动的满意程度,现用分层抽样方式从中抽取一个100个人的样本进行调查,则高二年级参与跑步的学生中应抽取 人 【答案】12【解析】根据题意可知样本中参与跑步的人数为2100405⨯=人,所以高二年级参与跑步的学生中应抽取的人数为3401210⨯=人. 10.小玲家的鱼塘里养了2500条鲢鱼,按经验,鲢鱼的成活率约为80%.现准备打捞出售,为了估计鱼塘中鲢鱼的总质量,从鱼塘中捕捞了3次进行统计,得到的数据如下表:那么,鱼塘中鲢鱼的总质量约是______kg. 【答案】3600【解析】平均每条鱼的质量为()20 1.610 2.210 1.81.8kg 201010⨯+⨯+⨯=++因为成活的鱼的总数约为2500×80%=2000(条) 所以总质量约是()2000 1.83600kg ⨯= 三、解答题11.举例说明简单随机抽样和分层随机抽样两种抽样方法中,无论使用哪种抽样方法,总体中的每个个体被抽到的概率都相等. 【答案】见解析.【解析】袋中有160个小球,其中红球48个,篮球64个,白球16个,黄球32个,从中抽取20个作为一个样本.(1)使用简单随机抽样:每个个体被抽到的概率为2011608=. (2)使用分层随机抽样:四种球的个数比为3:4:1:2.红球应抽320610⨯=个;篮球应抽420810⨯=个;白球应抽120210⨯=个;黄球应抽220410⨯=个. 因为68241486416328====, 所以按颜色区分,每个球被抽到的概率也都是18.所以简单随机抽样和分层随机抽样两种抽样方法中,无论使用哪种抽样方法,总体中的每个个体被抽到的概率都相等.12.某单位2 000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:(1)若要抽取40人调查身体状况,则应怎样抽样?(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人? 【答案】(1) 老年4人,中年12人,青年24人 (2) 用分层抽样(3) 系统抽样【解析】试题分析:(1)用分层抽样方法从老年人、中年人和青年人中抽取对应的人数即可;(2)用分层抽样法从管理层、技术开发部、营销部以及生产部抽取对应的人数即可;(3)用分层抽样方法从老年人、中年人和青年人中抽取对应的人数即可解析:(1)用分层抽样,并按老年4人,中年12人,青年24人抽取.(2)用分层抽样,并按管理2人,技术开发4人,营销6人,生产13人抽取.。
第四章抽样技术一、名词解释1、抽样调查2、总体和样本3、样本容量4、重复抽样5、不重复抽样6、抽样极限误差7、点估计8、区间估计二、填空1、抽样调查是从研究的中抽取部分单位作为进行观察研究,并根据这部分单位的调查结果来推断,以达到认识总体的一种统计调查方法。
2、抽样调查分为和两类。
抽样调查遵循。
3、是用主观的(非随机的)方法从总体中抽选单位进行调查,它是一种快速、简便且省钱的抽选样本的方法。
但非概率抽样具有很大的风险,因为主观选定的样本很难保证其对总体的代表性。
所以一般情况下不用来对总体进行推断。
主要包括随意抽样,,。
4、概率抽样有两条基本准则:第一,单位是随机抽取的;第二,调查总体中的每个单位都有一个非零的入样概率。
概率抽样方法主要有、、分层随机抽样、、、。
常用的为前四种。
5、是指包括调查对象所有单位的全体,它是由具有某种共同性质的许多单位组成的。
从中按随机原则抽取出来的部分单位所组成的集合体就称为样本。
6、从总体中抽取样本单位有与两种方法。
7、抽样框又称为抽样框架、抽样结构,是指对可以选择作为样本的总体单位列出名册成排序编号,以确定总体的和。
设计抽样框式进行抽样调查的前提,常见的抽样框有、等。
8、抽样误差是指指标数值与指标数值之差,即抽样估计值与被估计的未知的真实总体参数值之差。
9、在抽取多个样本时,就其中每个样本来说,都有其相应的抽样误差,而这些抽样误差的平均数,就是,用以反映抽样误差的一般水平。
10、一般来说,在实际应用时,常常采用的方法从总体各单位中抽取样本单位,进行调查;在计算上,为了计算简便,通常可以采用条件下抽样平均误差的计算公式进行计算。
11、概率分布的中心极限定理证明:(1)大量的客观事物总体现象是总体或近似于总体。
(2)在大样本的条件下,的分布是或近似地是正态分布,抽样成数的分布是或近似地是正态分布。
(3)抽样平均数的平均数总体平均数,抽样成数的平均数总体成数。
12、概率度t越大,估计的可靠性越,样本统计量与总体参数之间正负离差的变动范围也就越。
课件例题:
简单随机
1.随机数表:
例:N=1300, M=2000
2841——2841÷2000…841,抽中
3421——3421÷2000…1421,舍弃
6181——6181÷2000…181,抽中
6115——6115÷2000…115,抽中
9176——9176÷2000…1176,抽中
2. 例:下面是从N=6的总体抽取的n=3的全部可能样本情况,总体指标值为{6、7、10、12、25、30}。
S2=100.8
总体均值为15
总体总量为90
3. 例:一个房间有五个人,i = 1、2、3、4、5,N=5 , 每个人带的钱Yi=100元、80元、100元、120元、90元,Y=98元,(Yi-Y)2=880。
则全部可能样本情况表如下:
4. 例:为调查某城镇成年居民的服装消费水平,在全体N=5443个成年中,用简单随机抽样抽的一个n=36的样本,调查上一年中购买成衣件数xi与支出金额yi,样本资料如下,试估计该城镇居民成衣平均消费水平及消费总额
该城镇成人平均年成衣消费5.5件,95%置信度的近似置信区间为(5.5±1.96×0.66),即[4.21件,6.79件];
而人均用于成衣消费支出的金额为649.722元,95%置信度的近似置信区间为(649.722±1.96×91.71),即[469.97元,829.47元]。
该城镇成人年成衣总消费量估计 5.5×5443=29937件,95%置信度的近似置信区间为(29937±1.96×0.66×5443),即[22893件,36981件];
该城镇用于成衣的消费总金额估计为3536438.06元,95%的近似置信区间为:(3536438.06±1.96×91.71×5443)即[2558048.54元,4514827.58元]
若要求:成衣人均消费件数的估计绝对误差限为0.2件,人均消费成衣支出金额的估计的相
对误差限为5%,
求要求的样本量n,置信度仍取95%。
5. 成数例:对某问题进行调查,在总体中抽取一个n=200的简单随机样本,赞成、反对、不回答的人数分别为:n1=132,n2=51,n3=17,是给出赞成、反对、不回答比例P1、P2与P3的90%的近似置信区间。
设N很大,f可忽略。
6. 绝对误差限例:在人口普查中,根据以往数据,出生率估计为18‰,在95%的置信度下,实际调查估计P的绝对误差限为0.5‰和相对误差限为5%个需要多大的样本量?
分层
1.总体均值估计量置信区间
抽样均按简单随机抽样进行,求全市年平均户收入的估计及其90%的置信区间。
2.总体成数估计量的置信区间
3.各层样本量分配
某市进行家庭收入调查,分城镇居民及农村两层进行简单随机抽样固定样本量为n=550,调查资料及计算如下表。
试求城镇与农村两层比例分配与奈曼分配的样本量。
如不考虑费用因素,最优分配的结果有何变化?
4.成数估计量
不等概率抽样
1代码法:
例:设某总体有N=10个单元,欲用多项抽样从中抽取n=5个单元,入样概率及代码如下:
在[1,100]范围内产生5个随机数,04、73、25、49、82,则第1、第6、第3、第5、第8个单元即为抽中单元。
整群与多阶
1.整群抽样总体均值估计与置信区间还有群内相关系数与设计效应
2.对成数的估计
3. 二阶:例:续整群例题,为改进精度,该为二阶抽样作用。
用简单随机抽样抽取n=24个楼层,对每个抽中的楼层再用简单随机抽样抽取m=4户进行调查。
总的样本量仍为96户,具体资料如下表。
试估计该小区人均食品消费的户平均值。
所以二阶》一阶整群
也证明二阶更加精准
4. 二阶抽样对成数估计某部委对所属企事业单位就一项改革方案采取二阶抽样调查。
先在全部N=1250个单位(平均每个单位职工人数250)中按简单随机抽样抽取n=350个单位,然后,对抽中的每个单位再按简单随机抽取m=8个职工进行调查。
样本单位中赞成此项改革方案人数为k的单位频数nk(k=0,1,2,…,8)及赞成比例pk如下表所示。
系统抽样
1.不同方法的系统抽样某总体N=300,按有关标志排列,现欲抽取n=20的系统样本,采
取等距抽样的方法,则k=N/n=15,在1~15范围内抽取随机数r=3,试列出直线法、中点等距抽样法、层内对称抽样法和中心对称抽样法抽取得样本号。
(1) 直线法:3, 18, 33, 48, 63, 78, 93,108,123,138,153, 168, 183, 198, 213, 228, 243,
258,273,288 直接定起始点
(2)中点等距抽样法8, 23, 38, 53, 68, 83, 98, 113, 128, 143, 158, 173, 188, 203, 218, 233,
248, 263, 278, 293 直接取中位数
(3)层内对称抽样法上一个正数下一个倒数起始点数
3, 28, 33, 58, 63, 88, 93, 118, 123, 148,153, 178, 183, 208, 213, 238, 243, 268, 237, 298
(4)中心对称抽样法前一半正数后一半倒数起始点数
3, 18, 33, 48, 63, 78, 93, 108, 123, 138,163, 178, 193, 208, 223, 238, 253, 268, 283, 298 2.不等概率等距抽样
按职工(人)排队,职工总人数3360,欲抽20个企业作为样本,k=168,随机起点为r=99
3.无偏估计与有偏估计的修正
改变抽取起始单元方法在1~N范围内抽取随机数,用该数除以k的余数为起始单位。
构造估计量直接对估计量加以改造,构造无偏估计量
4.各种抽样方法的比较
一批产品共有N=4000件,每隔k=100件产品抽取一件,检查产品上的疵点数,共抽取n=40,样品的检查结果如下表所示。
试估计这批产品的平均疵点数及其方差。
比估计与回归估计
1.比估计量的期望方差,两种方法求方差mse 与公式,B不等于零说明有偏
一个N=6的人为总体,X为辅助变量,总量X=30已知,Y为调查指标,有关数据如总体数据表。
用简单随机抽样抽取n=4的样本,其全部可能样本数据及比估计数据如全部可能样本及比估计表。
5为x均值
2.3个比估计量,及其方差,置信区间;简单估计与比估计的比较
某企业有200名职工,月工资总额为10.2万元,现从中随机不重复抽取15名进行家庭储蓄存款调查,获得这15名职工的月工资收入xi及家庭储蓄存款yi资料如下表所示。
3.回归估计,b导致样本均值不是无偏估计,求估计量方差
如前例N=6人为总体数据,抽取n=4的简单随机样本,总体资料如下表:
(2)全部可能样本总体均值的回归估计的期望值
因为b来源于样本
小样本时,回归B较大,V并不总是最小4.用样本回归系数做回归估计,求总体总量的估计及其标准差。