统计基础第七章抽样推断
- 格式:ppt
- 大小:366.00 KB
- 文档页数:24
《统计学原理》作业(三)(第五~第七章)一、判断题:1、抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免的会产生误差,这种误差的大小是不能进行控制的。
(×)2、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。
(×)3、抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证(√)4、抽样误差即代表性误差和登记性误差,这两种误差都是不可避免的。
(×)5、总体参数区间估计必须具备的三个要素是估计值、抽样误差范围、概率保证程度。
(√)6、在一定条件,施肥量与收获率是正相关关系。
(√)7、甲产品产量与单位成本的相关系数是-0.8,乙产品单位成本与利润率的相关系数是-0.95,则乙比甲的相关程度高(√ )。
8、利用一个回归方程,两个变量可以互相推算(×)。
二、单项选择题1、在一定的抽样平均误差条件下( A )。
A、扩大极限误差范围,可以提高推断的可靠程度B、扩大极限误差范围,会降低推断的可靠程度C、缩小极限误差范围,可以提高推断的可靠程度D、缩小极限误差范围,不改变推断的可靠程度2、反映样本指标与总体指标之间的平均误差程度的指标是( C )。
A、抽样误差系数B、概率度C、抽样平均误差D、抽样极限误差3、抽样平均误差是( C )。
A、全及总体的标准差B、样本的标准差C、抽样指标的标准差D、抽样误差的平均差4、当成数等于( C )时,成数的方差最大。
A、1B、0 c、0.5 D、-15、对某行业职工收入情况进行抽样调查,得知其中80%的职工收入在800元以下,抽样平均误差为2%,当概率为95.45%时,该行业职工收入在800元以下所占比重是( C )。
A、等于78%B、大于84%c、在此76%与84%之间 D、小于76%6、对甲乙两个工厂工人平均工资进行纯随机不重复抽样调查,调查的工人数一样,两工厂工资方差相同,但甲厂工人总数比乙厂工人总数多一倍,则抽样平均误差(A )。
(抽样检验)第七章第⼀次课抽样原理与⽅法第⼀节抽样⽅案的制定在科学研究中,除了进⾏控制试验外,有时也要进⾏调查研究。
调查研究是对已有的事实通过各种⽅式进⾏了解,然后⽤统计的⽅法对所得数据进⾏分析,从⽽找出其中的规律性。
例如,了解畜禽品种及⽔产资源状况;探索和分析对某种疾病有效的防治规律、措施以及新的检验⼿段和⽅法等。
由于现场调查⽴⾜于⽣产实际,所以它是研究和解决实际问题的⼀种重要研究⽅法。
同时,控制试验的研究课题,往往是在调查研究的基础上确定的;试验研究的成果,⼜必须在其推⼴应⽤后经调查得以验证。
为了使调查研究⼯作有⽬的、有计划、有步骤地顺利开展,必须事先拟定⼀个详细的调查计划。
调查计划应包括以下⼏个内容:(⼀) 调查研究的⽬的任何⼀项调查研究都要有明确的⽬的,即通过调查了解什么问题,解决什么问题。
例如,家畜健康状况的调查的⽬的是评定家畜健康⽔平;畜禽品种资源调查的⽬的是了解畜禽品种的数量、分布与品种特征特性等情况。
同时,调查研究的⽬的还应该突出重点,⼀次调查应针对主要问题收集必要的数据,深⼊分析,为主要问题的解决提出相应的措施和办法。
(⼆) 调查的对象与范围根据调查的⽬的,确定调查的对象、地区和范围,划清调查总体的同质范围、时间范围和地区范围。
例如,四川省家禽品种资源调查,调查地区为四川省,调查总体和对象为全省各市、县的家禽,调查时间从2000年1⽉到2000年12⽉。
(三) 调查的项⽬调查项⽬的确定要紧紧围绕调查⽬的。
调查项⽬确定的正确与否直接关系到调查的质量。
因此,项⽬应尽量齐全,重要的项⽬不能漏掉;项⽬内容要具体、明确,不能模棱两可。
应按不同的指标顺序以表格形式列⽰出来,以达到顺利完成搜集资料的⽬的。
例如,家禽品种资源调查项⽬有:种类(鸡、鸭、鹅等)、品种(柴鸡、来航、⽩洛克等),数量、体重、产蛋性能等项⽬。
调查项⽬有⼀般项⽬和重点项⽬之分。
⼀般项⽬主要是指调查对象的⼀般情况,⽤于区分和查找,如畜主姓名、住址及编号等。
第七章参数估计和假设检验一、填空题1.在抽样推断中,常用的总体指标有、和。
2.在抽样推断中,按随机原则从总体中抽取的部分单位叫,这部分单位的数量叫。
3.整群抽样是对总体中群内的进行的抽样组织形式。
4.若总体单位的标志值不呈正态分布,只要,全部可能样本指标也会接近于正态分布。
5.抽样估计的方法有和两种。
6.扩大误差范围,可以推断的可靠程度,缩小误差范围则会推断的可靠程度。
7.对总体的指标提出的假设可以分为和。
8.如果提出的原假设是总体参数等于某一数值,这种假设检验称为,若提出的原假设是总体参数大于或小于某一数值,这种假设检验称为。
二、单项选择题1.所谓大样本是指样本单位数在()及以上。
A.50个B.30个C.80个D.100个2.总体平均数和样本平均数的关系是()。
A.总体平均数是确定值,样本平均数是随机变量B.总体平均数是随机变量,样本平均数是确定值C.总体平均数和样本平均数都是随机变量D.总体平均数和样本平均数都是随机变量3.先对总体按某一标志分组,然后再在各组中按随机原则抽取一部分单位构成样本,这种抽样组织方式称为()。
A.简单随机抽样B.机械抽样C.类型抽样D.整群抽样4.用样本指标对总体指标作点估计时,应满足4点要求,其中无偏性是指()。
A.样本平均数等于总体平均数B.样本成数等于总体成数C.样本指标的平均数等于总体的平均数 D.样本指标等于总体指标5.在其它条件不变的情况下,提高抽样估计的可靠程度,其精确度将()。
A.保持不变B.随之扩大C.随之缩小D.无法确定6.在抽样估计中,样本容量()。
A.越小越好B.越大越好C.有统一的抽样比例D.取决于抽样估计的可靠性要求。
7.假设检验中的临界区域是指()。
A.接受域B.拒绝域C.检验域D.置信区间三、多项选择题1.在抽样推断中,抽取样本单位的具体方法有()。
A.重复抽样B.不重复抽样C.分类抽样D.等距抽样E.多阶段抽样2.在抽样推断中,抽取样本的组织形式有()。
第六章抽样推断习题答案一、名词解释用规范性的语言解释统计学中的名词。
1. 随机原则:是指在抽样时排出主观上有意识地抽取调查单位,每个单位以相同概率被取到,从而增强样本对总体的代表性。
2. 统计量:是反映样本特征的综合指标,随样本不同而取不同的值,具有随机性。
3. 随机变量:是指变量的值无法预先确定仅以一定的可能性取值的量。
4. 样本容量:是指样本中的总体单位数量。
5. 中心极限定理:是概率论中讨论随机变量序列部分和的分布渐近于正态分布的一类定理。
这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量近似服从正态分布的条件。
6. 抽样平均误差:是反应抽样误差一般水平的指标,它的实质含义是指抽样平均数的标准差。
7. 区间估计:通过从总体中抽取的样本,根据一定的可行度与精确度的要求,构造出适当的区间,以作为总体的分布参数(或参数的函数)的真值所在范围的估计。
8. 简单随机抽样:也称为单纯随机抽样、纯随机抽样、SPS抽样,是指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。
二、判断改错对下列命题进行判断,在正确命题的括号内打“√”;在错误命题的括号内打“×”,并在错误的地方下划一横线,将改正后的内容写入题下空白处。
1. 抽样推断中,如果获取的样本数据准确,那么,由此推断的总体参数也一定准确。
(×)不一定2. 极限误差越大,则抽样估计的可靠性就越小。
(×)越大3. 抽样平均误差的大小与样本容量的大小成正比关系。
(×)反比4. 在一般的抽样推断中,抽样平均误差小于极限误差。
(×)不一定5. 重复抽样条件下的抽样平均误差,一定比不重复抽样条件下的抽样平均误差大。
(×)在其他条件相同的情况下6. 在不重复抽样的情况下,若调查的单位数为全及总体的10%,则所计算的抽样平均误差比重复抽样计算的抽样误差少10%。
第七章抽样推断习题及答案一、名词解释1、抽样推断:2、抽样平均误差:3、极限误差:4、重复抽样:5、区间估计:5、类型抽样:二、填空题1、抽样推断是利用________推断________的一种统计分析方法。
2、在简单随机抽样条件下,重复抽样的抽样平均误差是不重复抽样的________倍。
3、在缺少总体方差的资料时,可以用________来推断总体方差,计算抽样平均误差。
4、扩大极限误差的范围,可以________推断的可靠程度;缩小极限误差的范围,则会________推断的可靠程度。
三、单项选择题1、抽样必须遵循的基本原则是()A、灵活性原则B、可靠性原则C、准确性原则D、随机原则2、抽样平均误差是()A、登记性误差B、代表性误差c、系统性误差 D、随机误差3、抽样平均误差和极限误差的关系是()A、抽样平均误差大于极限误差B、抽样平均误差等于极限误差C、抽样平均误差小于极限误差D、抽样平均误差可能大于、等于或小于极限误差4、在其他条件不变的情况下,如果允许误差缩小为原来的1/2,则样本单位()A、扩大为原来的2倍B、扩大为原来的4倍C、缩小为原来的1/2倍D、缩小为原来的1/4倍5、一般来说, 在抽样组织形式中,抽样误差较大的是()A、简单抽样B、类型抽样C、等距抽样D、整群抽样6、根据抽样的资料, 一年级优秀生比重为20%, 二年级为10%,在人数相等时,优秀生比重的抽样误差()A、一年级较大B、二年级较大C、相同D、无法判断7、根据重复抽样的资料, 甲项目工人工资方差为25,乙项目为100,乙单位人数比甲单位多3倍, 则抽样误差()A、甲单位较大B、无法判断C、乙单位较大D、相同8、一个全及总体()A、只能抽取一个样本B、可以抽取多个样本C、只能计算一个指标D、只能抽取一个单位9、最符合随机原则地抽样组织形式是()A、整群抽样B、类型抽样C、阶段抽样D、简单随机抽样四、多项选择题1、抽样估计的抽样平均误差()A、是不可以避免的B、是可以改进调查方法消除的C、是可以事先计算的D、只有调查结束之后才能计算E、大小是可以控制的2、影响样本单位数目的因素有()A、推断的可靠程度B、抽样方法C、抽样组织方式D、允许误差的大小E、总体各单位标志变异程度3、提高推断的可靠程度, 可以采取的办法是()A、扩大估计值的误差范围B、缩小估计值的误差范围C、增大概率度D、降低概率度E、增加样本单位数4、影响抽样平均误差的因素有()A、总体标志变异程度B、抽样方法C、样本单位D、抽样组织形式E、样本指标值的大小5、和重复抽样相比,不重复抽样的特点是()A、总体单位数在抽选过程中逐渐减少B、总体中每个单位都有被多次抽中的可能C、总体中每个单位没有被多次抽中的可能D、样本可能数目要多些E、样本可能数目要少些6、总体标准差未知时, 常用的替代办法有()A、用过去调查的同类问题的经验数据B、用样本的标准差C、凭调查者经验确定D、用总体方差E、大致确定7、在抽样组织方式中,为提高样本对总体的代表性的组织方式有()A、简单随机抽样B、分组抽样C、机械抽样D、整群抽样E、阶段抽样8、在抽样组织方式中,为简化抽样工作的组织方式有()A、简单随机抽样B、分组抽样C、机械抽样D、整群抽样E、阶段抽样五、简答题1、影响抽样平均误差的因素有哪些?2、影响必要样本单位数目的因素有哪些?3、抽样平均误差、抽样极限误差和概率度三者之间是何关系?六、计算分析题1、某学校英语三级等级考试,学生成绩呈正态分布,根据经验标准差为10分,今随机抽样100名同学,得平均分为65分,当概率保证程度为95.45%时,推断该校同学的平均成绩的范围。
第七章 抽样调查一、本章重点1.抽样调查也叫做抽样推断或参数估计,必须坚持随机抽样的原则。
它是一种非全面调查,其意义在于对总体的推断上,存在可控制性误差。
是一种灵活快捷的调查方式。
2.抽样调查有全及总体与样本总体之区分。
样本容量小于30时一般称为小样本。
对于抽样调查来讲全及总体的指标叫做母体参数,是唯一确定的未知的量,样本指标是根据样本总体各单位标志值计算的综合性指标,是样本的一个函数,是一个随机变量,抽样调查就是要用样本指标去估计相应的总体指标。
样本可能数目与样本容量有关也与抽样的方法有关。
抽样方法可以分为考虑顺序的抽样与不考虑顺序的抽样;重复抽样与不重复抽样。
3.大数定律、正态分布理论、中心极限定理是抽样调查的数理基础。
正态分布的密度函数有两个重要的参数(σ;x )。
它有对称性、非负性等特点。
中心极限定理证明了所有样本指标的平均数等于总体指标如X x E =)(。
推出了样本分布的标准差为:1--=N n N n x σμ。
4.抽样推断在逻辑上使用的是归纳推理的方法、在方法上使用的是概率估计的方法、存在着一定误差。
无偏性、一致性和有效性是抽样估计的优良标准。
抽样调查既有登记性误差,也有代表性误差,抽样误差是一个随机变量,而抽样的平均误差是一个确定的值。
抽样误差受总体标志值的差异程度、样本容量、抽样方法、抽样组织形式的影响。
在重复抽样下抽样的平均误差与总体标志值的差异程度成正比,与样本容量的平方根成反比即n x σμ=,不重复抽样的抽样平均误差仅与重复抽样的平均误差相差一个修正因子即N nn x -=1σμ。
在通常情况下总体的方差是未知的,一般要用样本的方差来代替。
把抽样调查中允许的误差范围称作抽样的极限误差x ∆或p ∆。
μt =∆,用抽样的平均误差来度量抽样的极限误差。
把抽样估计的把握程度称为抽样估计的置信度。
抽样的极限误差越大,抽样估计的置信度也越大。
抽样估计又可区分为点估计和区间估计。
任务八 抽样推断任务描述与分析在A市自来水公司的客户满意度调查中,我们抽样调查了A市自来水公司的700个客户,从前面的调查分析中我们了解到这700户客户对A市自来水公司的产品和服务等方面的评价。
现在你需要思考的是:这700户客户的意见能在多大程度上反映所有客户的意见?误差的可能性有多大?为了保证调查的准确性,我们是否需要再追加调查?任务分析(1)如何判断我们抽样调查的700个客户够不够?(2)根据抽调客户的意见我们如何推断出所有客户的意见?(3)被调查客户的意见与所有客户的意见误差有多少?案例8-1:为了加强与顾客的沟通,深入了解客户需求,以解决客户遇到的问题,并在此基础上持续改进公司的产品质量,进一步优化供水服务,A市自来水公司决定进行客户满意度调查,要求在2个月时间内完成调查报告。
A市共有自来水用户200万户,在短短两个月时间内必须完成客户调查并出具调查报告,你如何完成这项工作?抽样调查抽样推断是按照随机原则从总体中抽取一部分总体单位作为样本单位,组成样本总体,并以样本的数量特征对总体的数量特征做出具有一定可靠程度的估计和推断的统计分析方法。
抽样推断具有以下特点:1.抽样推断是用样本指标值来估计总体指标值 2.抽样的随机原则是抽样推断的前提3.抽样推断的误差是可以事先计算并加以控制节省调查费调查速度快调查结果准确可靠应用范围广抽样调查抽样推断常用概念总体样本从总体中按照随机原则抽选出来的一部分单位称为样本,用n 表示 我们所要调查研究的事物或现象的全体,总体单位数通常用N表示总体指标样本指标总体指标又称参数,是反映总体数量特征的综合指标,总体指标主要有:总体平均数,总体方差σ 2,总体标准差σ、总体成数P 和Q。
样本指标又称统计量,是根据样本各单位的标志值或标志特征计算的、反映样本数量特征的综合指标。
样本指标主要有:样本平均数,样本方差s2,样本标准差s,样本成数p和q。
样本容量样本样本个数又称样本可能数目,是指在一个抽样方案中从总体中所有可能被抽取的样本总数。
统计学第七章、第⼋章课后题答案统计学复习笔记第七章参数估计⼀、思考题1.解释估计量和估计值在参数估计中,⽤来估计总体参数的统计量称为估计量。
估计量也是随机变量。
如样本均值,样本⽐例、样本⽅差等。
根据⼀个具体的样本计算出来的估计量的数值称为估计值。
2.简述评价估计量好坏的标准(1)⽆偏性:是指估计量抽样分布的期望值等于被估计的总体参数。
(2)有效性:是指估计量的⽅差尽可能⼩。
对同⼀总体参数的两个⽆偏估计量,有更⼩⽅差的估计量更有效。
(3)⼀致性:是指随着样本量的增⼤,点估计量的值越来越接近被估总体的参数。
3.怎样理解置信区间在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。
置信区间的论述是由区间和置信度两部分组成。
有些新闻媒体报道⼀些调查结果只给出百分⽐和误差(即置信区间),并不说明置信度,也不给出被调查的⼈数,这是不负责的表现。
因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。
在公布调查结果时给出被调查⼈数是负责任的表现。
这样则可以由此推算出置信度(由后⾯给出的公式),反之亦然。
4.解释95%的置信区间的含义是什么置信区间95%仅仅描述⽤来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。
也就是说,⽆穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。
不要认为由某⼀样本数据得到总体参数的某⼀个95%置信区间,就以为该区间以的概率覆盖总体参数。
5.简述样本量与置信⽔平、总体⽅差、估计误差的关系。
1. 估计总体均值时样本量n 为2. 样本量n 与置信⽔平1-α、总体⽅差、估计误差E 之间的关系为与置信⽔平成正⽐,在其他条件不变的情况下,置信⽔平越⼤,所其中: 2222α2222)(E z n σα=n z E σα2=需要的样本量越⼤;与总体⽅差成正⽐,总体的差异越⼤,所要求的样本量也越⼤;与与总体⽅差成正⽐,样本量与估计误差的平⽅成反⽐,即可以接受的估计误差的平⽅越⼤,所需的样本量越⼩。