推断统计习题及参考答案
- 格式:doc
- 大小:163.50 KB
- 文档页数:9
第五章参数估计(一)单项选择题(在下列备选答案中,只有一个是正确的,请将其顺序号填入括号内)1.在抽样推断中,必须遵循( )抽取样本。
①随意原则②随机原则③可比原则④对等原则2.抽样调查的主要目的在于( )。
①计算和控制抽样误差②了解全及总体单位的情况③用样本来推断总体④对调查单位作深入的研究3.抽样误差是指()。
①计算过程中产生的误差②调查中产生的登记性误差③调查中产生的系统性误差④随机性的代表性误差4.在抽样调查中( )。
①既有登记误差,也有代表性误差②既无登记误差,也无代表性误差③只有登记误差,没有代表性误差④没有登记误差,只有代表性误差5.在抽样调查中,无法避免的误差是( )。
①登记误差②系统性误差③计算误差④抽样误差6.能够事先加以计算和控制的误差是( )。
①抽样误差②登记误差③系统性误差④测量误差7.抽样平均误差反映了样本指标与总体指标之间的( )。
①可能误差范围②平均误差程度③实际误差④实际误差的绝对值8.抽样平均误差的实质是( )。
①总体标准差②全部样本指标的平均差③全部样本指标的标准差④全部样本指标的标志变异系数9.在同等条件下,重复抽样与不重复抽样相比较,其抽样平均误差( )。
①前者小于后者②前者大于后者③两者相等④无法确定哪一个大10.在其他条件保持不变的情况下,抽样平均误差( )。
①随着抽样数目的增加而加大②随着抽样数目的增加而减小③随着抽样数目的减少而减小④不会随抽样数目的改变而变动11.允许误差反映了样本指标与总体指标之间的( )。
①抽样误差的平均数②抽样误差的标准差③抽样误差的可靠程度④抽样误差的可能范围12.极限误差与抽样平均误差数值之间的关系为( )。
①前者一定小于后者②前者一定大于后者③前者一定等于后者④前者既可以大于后者,也可以小于后者13.所谓小样本一般是指样本单位数()。
①30个以下②30个以上③100个以下④100个以上14.样本指标和总体指标( )。
推断统计习题及参考答案统计学是一门重要的学科,旨在通过数据收集和分析来推断出有关总体特征的信息。
在学习统计学的过程中,解决习题是不可或缺的一部分。
本文将提供一些推断统计学习题,并附上相应的参考答案,以帮助读者巩固对推断统计学的理解。
第一节:抽样与估计问题1:某公司想要了解全员的满意度,但受时间和资源限制,只能对部分员工进行调查。
该公司选择从员工名单中随机抽取100人,并得到了他们对公司满意度的评分。
在这种情况下,我们可以将这100位员工的满意度评分作为全员满意度的估计吗?为什么?参考答案1:我们可以将这100位员工的满意度评分作为全员满意度的估计。
这是基于抽样理论的基本假设,即随机抽样的结果能够代表总体的特征。
通过适当的抽样方法和样本容量大小,我们可以确保抽样误差在可接受范围内,从而较准确地估计出总体特征。
问题2:某调查机构为了估计某城市的失业率,从该城市的人口中随机抽取500人进行调查。
发现有25人失业。
在95%的置信水平下,该城市的失业率的置信区间是多少?对于二项分布来说,当样本容量大于30且成功次数和失败次数均大于5时,可以使用正态分布近似。
由此可知,失业率的置信区间可以利用正态分布的性质来计算。
根据公式,我们可以得出该城市失业率的置信区间为:(23.09%,29.91%)。
第二节:假设检验问题3:某研究者想要验证某种新药对高血压患者的治疗效果。
他将100名患者随机分为两组,一组使用新药治疗,另一组使用常规药物治疗。
并在治疗结束后测量两组患者的血压水平。
研究者想要知道新药是否显著降低了患者的血压水平。
应该使用什么类型的假设检验?参考答案3:在这种情况下,应该使用成对样本t检验。
因为两组患者是通过随机分组方法确定的,并且每个患者都参与了两次测量(使用新药前和使用新药后),所以我们可以通过比较这两次测量的差异来判断新药是否对血压产生显著影响。
问题4:某汽车制造商声称其新产品的平均燃油效率为20升/百公里。
实用卫生统计学习题(含答案)一、单选题(共80题,每题1分,共80分)1、用于推断两数值变量间是否存在线性关系的统计方法是A、直线相关B、X2检验C、秩和检验D、直线回归正确答案:A2、132名教师血清胆固醇(mmol/L)值的资料类型属于A、计数资料B、等级资料C、计量资料D、分类资料正确答案:C3、构成比的特点是A、构成比总和必等于100%B、构成比总和必大于100%C、构成比总和不确定D、构成比总和必小于100%正确答案:A4、两个小样本均数,检验的无效假设是A、u1=u2B、u1≠u2C、x1=X2D、x1≠X2正确答案:A5、均数的标准误越大,表示样本的A、可靠程度越大B、抽样误差越大C、可比性越差D、系统误差越大正确答案:B6、推断统计包含的两个内容是A、统计描述和假设检验B、统计图表和假设检验C、统计描述和统计分析D、参数估计和假设检验正确答案:D7、关于假设检验,下面说法错误的是A、两个小样本均数比较时,要求总体方差齐性B、两个样本均数的比较可作t检验C、多个样本均数的比较可作F检验D、无论样本量大小均可作Z检验正确答案:D8、t检验的结果为A、两样本均数差别有统计学意义B、两样本均数有非常显著的差别C、两样本均数差别无统计学意义D、两样本均数无显著差别正确答案:A9、直线相关系数假设检验得P>α,可认为A、两变量无曲线关系B、两变量有关C、两变量无关D、两变量无直线关系正确答案:D10、正态分布的两个参数μ与σ,正态曲线愈趋高耸,数据愈集中,则A、σ愈小B、μ愈大C、σ愈大D、μ愈小正确答案:A11、单因素方差分析的三种变异分解正确的是A、SS总-SS组间=SS组内B、SS总+SS组内=SS组间C、SS总=SS组内D、SS组内=SS组间正确答案:A12、参数是指A、样本的总和B、随机变量C、样本的统计指标D、总体指标正确答案:D13、为了解某校锡克试验的阳性率,研究者从全校中抽取学号尾数是3和8的学生。
旗开得胜第六章抽样推断习题答案一、名词解释用规范性的语言解释统计学中的名词。
1. 随机原则:是指在抽样时排出主观上有意识地抽取调查单位,每个单位以相同概率被取到,从而增强样本对总体的代表性。
2. 统计量:是反映样本特征的综合指标,随样本不同而取不同的值,具有随机性。
3. 随机变量:是指变量的值无法预先确定仅以一定的可能性取值的量。
4. 样本容量:是指样本中的总体单位数量。
5. 中心极限定理:是概率论中讨论随机变量序列部分和的分布渐近于正态分布的一类定理。
这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量近似服从正态分布的条件。
6. 抽样平均误差:是反应抽样误差一般水平的指标,它的实质含义是指抽样平均数的标准差。
7. 区间估计:通过从总体中抽取的样本,根据一定的可行度与精确度的要求,构造出适当的区间,以作为总体的分布参数(或参数的函数)的真值所在范围的估计。
8. 简单随机抽样:也称为单纯随机抽样、纯随机抽样、SPS抽样,是指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。
1旗开得胜二、填空题根据下面提示的内容,将适宜的名词、词组或短语填入相应的空格之中。
1. 随机原则,样本,数量特征2. 样本,样本单位3. 样本个数4. 平均数,平均数5. 次数6. 平均数,成数,标准差7. 统计量,参数8. 越大,越小9. 点估计,区间估计10. 样本指标11. 重复抽样,不重复抽样12. 无偏性,有效性2313. 随机原则,样本指标,控制14. 总体单位,抽样15. 标志16. 重复抽样,不重复抽样17. 所有单位,全面调查18. 泊松分布,超几何分布19. nσ,Nn n-1σ20. σ*t =∆三、单项选择从各题给出的四个备选答案中,选择一个最佳答案,填入相应的括号中。
1 C2 A3 C4 C5 B6 D7 A8 B9 B 10 A11 A 12 B 13 A 14 B 15 C16 C 17 D 18 A 19 A 20 D四、多项选择从各题给出的四个备选答案中,选择一个或多个正确的答案,填入相应的括号中。
实习三 假设检验本章学习要点概述1. 假设检验的原理及基本步骤。
2. 假设检验中的“小概率原理”。
3. 假设检验中的第一类错误、第二类错误。
4. 不同资料类型、不同设计类型假设检验的分析思路。
表3.1 假设检验方法选择资料类型 设计类型 具备条件 统计方法 定量资料 单样本 样本来自正态分布 单样本t 检验样本来自偏态分布变量变换后t 检验 wilcoxon 秩和检验定量资料完全随机设计两样本正态;方差齐两独立样本t 检验正态但方差不齐校正t 检验 变量变换wilcoxon 秩和检验偏态或方差不齐变量变换后t 检验 wilcoxon 秩和检验定量资料 配对设计 差值满足正态分布 配对t 检验差值不满足正态分布变量变换后t 检验 wilcoxon 符号秩和检验定量资料完全随机设计多样本正态;方差齐单因素方差分析偏态或方差不齐变量变换后方差分析 Kruskal -Wallis 秩和检验定量资料 随机区组设计 正态;方差齐 双因素方差分析偏态或方差不齐 Friedman 秩和检验 定量资料 重复测量设计 正态;方差齐重复测量数据的方差分析四格表资料完全随机设计40≥n 且5≥T2χ检验40≥n 但有51<<T 时 校正2χ检验40<n 或有1<T 四格表资料精确概率法四格表资料 配对设计 40≥+c b 2χ检验(MecNemar )40<+c b校正2χ检验(MecNemar )C R ⨯表资料 完全随机设计有4/5以上格子的理论频数大于52χ检验等级资料 完全随机设计——秩和检验一、问答题1.假设检验中,P 和α的含义是什么?两者有什么关系? 2. 试述假设检验中的I 类错误和II 类错误及二者的关系。
3. 对于完全随机设计两样本定量资料的比较,如何选择统计方法? 4. 单因素方差分析的基本思想及模型假设?5. 为什么在秩和检验编秩次时,不同组间出现相同数据要给予“平均秩次”,而同一组的相同数据不必计算“平均秩次”?6. 两组或多组等级资料平均效应的比较为什么不用2χ检验而用秩和检验?7. 对于研究目的相同的同一资料,用参数检验和非参数检验结果不一致时,该怎么办? 8. 2χ检验的注意事项是什么? 二、 计算题1. 某单位研究饲料中维生素E 缺乏对肝中维生素A 含量的影响,将同种属、同年龄、同性别、同体重的大白鼠配成8对,并将每对动物随机分配到正常饲料组和缺乏维生素E 的饲料组,定期将大白鼠杀死,测定其肝中维生素A 的含量,问饲料中维生素E 缺乏对肝中维生素A 的平均含量有无影响?表3.2 正常饲料组与维生素E 缺乏组大白鼠肝中维生素A 含量(U/mg)大白鼠对别 1 2 3 4 5 6 7 8 正常饲料组 3.55 2.60 3.00 3.95 3.80 3.75 3.45 3.05 维生素E 缺乏组2.452.401.803.203.252.702.401.752. 某实验室观察局部温热治疗小鼠移植性肿瘤的疗效,以生存日数作为观察指标。
第六章抽样推断习题答案一、名词解释用规范性的语言解释统计学中的名词。
1. 随机原则:是指在抽样时排出主观上有意识地抽取调查单位,每个单位以相同概率被取到,从而增强样本对总体的代表性。
2. 统计量:是反映样本特征的综合指标,随样本不同而取不同的值,具有随机性。
3. 随机变量:是指变量的值无法预先确定仅以一定的可能性取值的量。
4. 样本容量:是指样本中的总体单位数量。
5. 中心极限定理:是概率论中讨论随机变量序列部分和的分布渐近于正态分布的一类定理。
这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量近似服从正态分布的条件。
6. 抽样平均误差:是反应抽样误差一般水平的指标,它的实质含义是指抽样平均数的标准差。
7. 区间估计:通过从总体中抽取的样本,根据一定的可行度与精确度的要求,构造出适当的区间,以作为总体的分布参数(或参数的函数)的真值所在范围的估计。
8. 简单随机抽样:也称为单纯随机抽样、纯随机抽样、SPS抽样,是指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。
二、判断改错对下列命题进行判断,在正确命题的括号内打“√”;在错误命题的括号内打“×”,并在错误的地方下划一横线,将改正后的内容写入题下空白处。
1. 抽样推断中,如果获取的样本数据准确,那么,由此推断的总体参数也一定准确。
(×)不一定2. 极限误差越大,则抽样估计的可靠性就越小。
(×)越大3. 抽样平均误差的大小与样本容量的大小成正比关系。
(×)反比4. 在一般的抽样推断中,抽样平均误差小于极限误差。
(×)不一定5. 重复抽样条件下的抽样平均误差,一定比不重复抽样条件下的抽样平均误差大。
(×)在其他条件相同的情况下6. 在不重复抽样的情况下,若调查的单位数为全及总体的10%,则所计算的抽样平均误差比重复抽样计算的抽样误差少10%。
统计学习题参考答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】第一章导论(1)数值型变量。
(2)分类变量。
(3)离散型变量。
(4)顺序变量。
(5)分类变量。
(1)总体是该市所有职工家庭的集合;样本是抽中的2000个职工家庭的集合。
(2)参数是该市所有职工家庭的年人均收入;统计量是抽中的2000个职工家庭的年人均收入。
(1)总体是所有IT从业者的集合。
(2)数值型变量。
(3)分类变量。
(4)截面数据。
(1)总体是所有在网上购物的消费者的集合。
(2)分类变量。
(3)参数是所有在网上购物者的月平均花费。
(4)参数(5)推断统计方法。
第二章数据的搜集1.什么是二手资料使用二手资料需要注意些什么与研究内容有关的原始信息已经存在,是由别人调查和实验得来的,并会被我们利用的资料称为“二手资料”。
使用二手资料时需要注意:资料的原始搜集人、搜集资料的目的、搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。
在引用二手资料时,要注明数据来源。
2.比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
概率抽样是指抽样时按一定概率以随机原则抽取样本。
每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽中的概率,概率抽样的技术含量和成本都比较高。
如果调查的目的在于掌握和研究总体的数量特征,得到总体参数的置信区间,就使用概率抽样。
非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。
非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。
它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。
非概率抽样也适合市场调查中的概念测试。
3.调查中搜集数据的方法主要有自填式、面方式、电话式,除此之外,还有那些搜集数据的方法?实验式、观察式等。
统计推断第二版课后习题答案(下)第一章估计与检验的基本概念习题1a.样本均值的估计是样本观测值的算术平均数。
b.估计量的偏差是指样本估计值与总体参数值之间的差异。
c.偏差的绝对估计误差是指估计量与总体参数的差异的绝对值。
习题2a.确定估计量的抽样分布的方法有:–数理统计方法–模拟方法b.方差是指估计量在多次抽样中估计误差的离散程度。
c.中位数是指有50%的估计值小于该值,50%的估计值大于该值。
习题3a.均方根误差衡量了估计方法的总体误差。
b.样本均值的均方误差是样本均值与总体均值之间的差异的平方。
c.均方误差是样本估计量的方差和偏差之和。
习题4a.一个无偏估计的特点是其期望值等于被估计参数的真实值。
b.偏差是指估计量从真实参数值偏离的程度。
c.便宜的估计方法在不同样本下估计值的平均值与总体参数的差异接近于零。
习题5a.置信区间是指总体参数一个区间估计的结果。
b.置信水平是指置信区间的覆盖总体参数的概率。
c.通过增加置信水平,置信区间的宽度将增加。
第二章单样本推断习题1a.在单样本问题中,当总体的分布未知且样本容量较小时,通常使用t分布。
b.当总体的分布未知且样本容量较大时,通常使用标准正态分布。
c.当总体的分布已知时,可以根据总体分布选择相应的抽样分布。
习题2a.在单样本问题中,使用z统计量时,需要知道总体的标准差。
b.当总体的标准差未知且样本容量较小时,通常使用t统计量。
c.t统计量的分布在自由度较大时趋向于标准正态分布。
习题3a.当总体的分布为正态分布时,使用样本均值的标准差作为总体标准差的估计。
b.对于非正态分布的总体,使用样本的中位数可以作为总体位置参数的估计。
c.样本观测值的众数可以作为总体分布的估计。
习题4a.在单样本问题中,使用z统计量时可以构造置信区间。
b.置信水平是指在多次抽样中,置信区间覆盖总体参数的概率。
c.置信区间的宽度与样本容量无关。
a.当总体的分布未知且样本容量较小时,假设检验通常使用t检验。
《推断统计》复习思考题一、简要回答下面的问题应当用何种统计方法进行分析(不需计算)1.某研究者欲研究学习动机和学习成绩之间的关系,用动机量表测得学生的学习动机,再用标准化学绩考试测得成绩,两组数据均可视为连续等距数据。
如果学生的成绩是教师的等级评定分,又应如何分析?2.为研究职业类型(工人、农民、教师、公务员、商人)对幸福感(幸福、不幸福)是否有影响,应选用什么样的统计方法?3.两考生的高考成绩五科如下表,已知所有考生各科成绩的平均数和标准差,如何判断两考生高考成绩哪一个更好?4.假设某次人事选拔考试分数服从正态分布,平均数和标准差分别为75,10,现欲选出40%高分者录用,问分数线应当定成多少?5.某校长根据自己的经验预测今年高考全区的平均分为530分,全区3400名毕业生高考平均成绩为520分,标准差112。
问该校长的预测是否准确?6.某研究者想考查教师教学效能感和教师教学效果之间的数量关系,分别用量表测得两组数据均可视为连续正态数据。
7.假设某考生在高考中,语文得110分,数学得125分。
如果所有考生的语文平均分为90,标准差为10;数学平均分为100,标准差为15分。
那么,相对而言这个考生哪方面能力更强?8.某研究者欲研究学习动机对学习成绩的影响,用动机量表测得学生的学习动机,再用标准化学绩考试测得成绩,按照动机的高低将学生分成高动机者、中等动机者和低动机者。
9.在缪勒—莱尔错觉实验中,为了研究夹角对错觉量的影响,随机抽取了18名被试,考虑到学生之间的个体差异,每名被试都在15度、45度和60度三种夹角下进行错觉实验现在需要求三种夹角下错觉量差异是否显著用什么方法?10.欲考查两种记忆方法的效果,让一组学生先后用两种方法记忆难度相当但内容不同的陌生材料,一半的学生先用方法A,后用方法B,另一半学生相反,学习后间隔一段时间测量他们的保持量。
11.选取8对被试,每对被试年龄、智商和视敏度相当,让其中一名被试参加视觉试验,看一个高亮度背景下的物体,另一个被试看一个低亮度背景下的同样物体。
第一章一、选择题一、统计的三种含义中,做为基础的是()A、统计分析B、统计工作C、统计学D、统计资料二、专业技术人员的职称是()A、品质标志B、数量标志C、质量指标D、数量指标3、属于数量标志的是()A、性别B、民族C、健康状况D、年龄4、在全国人口普查中,整体单位是()A、每一户B、每一个人C、每一个地域的人D、全国人口数量五、统计学是()A、实质性科学B、方式论科学C、纯自然科学D、社会学科学六、属于质量指标的是()A、国内生产总值B、利税总额C、劳动生产率D、社会商品零售总额7、属于数量指标的是()A、平均工资B、人都可支配收入C、资金利税率D、粮食总产量二、填空题一、比利时统计学家凯特勒对统计理论最大的贡献是将(概率论与数理统计)引入了统计学二、统计的三种含义别离是(统计工作)、(统计资料)、(统计学)三、名词解释一、描述统计二、推断统计四、简答:一、简述统计学的研究对象。
社会经济活动的方式和规律二、简述统计学的三种含义之间的关系。
6第二章一、选择题一、搜集低级资料的主要方式是()A、业务记录B、调查C、统计表D、整理表二、某地为了推行先进企业的生产经营管理经验,对效益最好的几个企业进行调查,这种调查属于()A、重点调查B、抽样调查C、典型调查D、普查3、在统计调查阶段,对有限整体()A、只能进行全面调查B、只能进行非全面调查C、既不能进行全面调查,也不能进行非全面调查D、全面调查和非全面调查都能进行4、了解我国城乡居民生活状况,最适合的调查方式是()A、普查B、抽样调查C、重点调查D、典型调查五、我国自1953年以来,在全国范围进行的五次人口调查是()A、抽样调查B、普查C、重点调查D、典型调查六、抽样调查和重点调查均为非全面调查,二者的大体区别在于()A、组织方式不同B、作用不同C、灵活程度不同D、先取调查单位的方式不同7、统计报表按填报单位区分为()A、国家、部门和地方的统计报表B、按期报表和年报报表C、基层报表和综合报表D、单一表和一览表八、重点调查所选的重点单位,必需是在调查对象中()A、具有较大标志值的那一部份调查单位B、具有代表性的调查单位C、按随机原则选出的调查单位D、填报调查数据的填报单位九、典型调查属于()A、全面调查B、非全面调查C、专门调查D、一次性调查E、常常性调查10、我国进行的五次人口普查是()A、全面调查B、非全面调查C、一次性调查D、按期调查E、常常性调查1一、抽样调查是()A、一种非全面调查B、永远存在抽样误差C、依照随机原则选取调查单位D、不存在抽样误差,只存在记录性误差E、用样本指标推算整体指标1二、在统计调查中,调查标志或内容的承担者是()A、调查单位B、填报单位C、调查对象D、统计报表13、调查表的种类()A、只有单一表B、只有一览表C、有单一表和一览表之分D、有计算表和分析表之分14、调查表通常由()组成A、表头B、表体C、表格D、表外附加E、表身1五、在工业企业设备调查中()A、工业企业的全数设备是调查对象B、全数工业企业是调查对象C、每一个工业企业是填报单位E、每台设备是填报单位判断题:一、对全国各大型钢铁生产基地的生产情况进行调查以掌握全国钢铁生产的大体情况,这种调查属于非全面调查()二、全面调查包括普查和统计报表()3、我国的人口普查每十年进行一次,因此它是一种持续性的调查方式()4、我国人口普查的整体单位和调查单位都是每一个人,而填报单位是户。
目录第一章P10 (1)第二章P34 (2)第三章P66 (3)第四章P94 (8)第七章P176 (11)第八章P212 (15)第10 章P258 (17)第11 章P291 (21)第13 章P348 (26)第14 章P376 (30)第一章P10一、思考题1.1什么是统计学?1.2解释描述统计和推断统计。
1.3统计数据可分为哪几种类型?不同类型的数据各有什么特点?1.4解释分类数据、顺序数据和数值型数据的含义。
1.5举例说明总体、样本、参数、统计量、变量这几个概念。
1.6变量可分为哪几类?1.7举例说明离散型变量和连续型变量。
1.8请举出统计应用的几个例子。
1.9请举出应用统计的几个领域。
1.1 指出下面变量的类型:(1)年龄(2)性别(3)汽车产量(4)员工对企业某项改革措施的态度(赞成、中立、反对)(5)购买商品时的支付方式(现金、信用卡、支票)(1)数值型变量。
(2)分类变量。
(3)离散型变量。
(4)顺序变量。
(5)分类变量。
1.2 某研究部门准备抽取 2000 个职工家庭推断该城市所有职工家庭的年人均收入。
要求:(1)描述总体和样本。
(2)指出参数和统计量。
(1)总体是该市所有职工家庭的集合;样本是抽中的 2000 个职工家庭的集合。
(2)参数是该市所有职工家庭的年人均收入;统计量是抽中的 2000 个职工家庭的年人均收入。
1.3 一家研究机构从 IT 从业者中随机抽取 1000 人作为样本进行调查,其中 60%的人回答他们的月收入在5000 元以上,50%的人回答他们的消费支付方式是用信用卡。
回答下列问题:(1)这一研究的总体是什么?(2)月收入是分类变量、顺序变量还是数值型变量?(3)消费支付方式是分类变量、顺序变量还是数值型变量?(4)这一研究涉及截面数据还是时间序列数据?(1)总体是所有 IT 从业者的集合。
(2)数值型变量。
(3)分类变量。
(4)截面数据。
1.4 一项调查表明,消费者每月在网上购物的平均花费是 200 元,他们选择在网上购物的主要原因是“价格便宜”。
【单项选择题】区间估计依据的原理是()A.概率论B.样本分布理论C.小概率事件D.假设检验【单项选择题】下列不属于评价一个估计量好坏的特征的是()A.有用性B.有效性C.一致性D.充分性【单项选择题】用从总体抽取的一个样本统计量作为总体参数的估计值称为()A.点估计B.样本估计C.区间估计D.总体估计【单项选择题】样本平均数的可靠性和样本的大小()A.没有一定关系B.成反比C.没有关系D.成正比【多项选择题】一个良好的估计量具备的特征有()A.无偏性B.一致性C.有效性D.充分性【多项选择题】区间估计中总体指标所在范围()A.是一个可能范围B.是绝对可靠的范围C.不是绝对可靠的范围D.是有一定把握程度的范围【多项选择题】参数估计分为()和()A.点估计B.标准误C.标准差D.区间估计【单项选择题】置信度或者置信水平可以表示为()A.1-βB.1-aC.βD.a【单项选择题】在某学校的一次考试中,已知全体学生的成绩服从正态分布,其总方差为100。
从中抽取25名学生,其平均成绩为80,方差为64。
以95%的置信度估计该学校全体学生成绩均值的置信区间是()A.[76.08,83.92]B.[75.90,84.10]C.[76.86,83.14]D.[74.84,85.16]【单项选择题】当显著性水平一定时,置信区间的宽度()A.随着样本容量n 的增大而增大B.随着样本容量n 的增大而减小C.与样本容量n 无关D.与样本容量n 的平方根成正比【单项选择题】从某正态总体中随机抽取一个样本,其中n=10,1-n S =6,其平均数的抽样标准误为()A.1.7B.1.9C.2.1D.2.0【单项选择题】在参数估计中,α指()A.置信水平B.置信区间C.置信度D.显著性水平【单项选择题】总体分布为正态,总体方差已知,从总体中随机抽取容量为20的样本。
用样本平均数估计总体平均数的置信区间为() A.1122-+<<--n Z X n Z X σμσααB.1122-+<<--n t X n t X σμσααC.n Z X n Z X σμσαα22+<<-D.nt X n t X σμσαα22+<<-【单项选择题】下列受样本容量影响分布曲线形态的是()A.正态分布和F 分布B.F 分布和t 分布C.正态分布和t 分布D.正态分布和χ²分布【单项选择题】随机抽取一个样本容量为100的样木,其均值X =80,标准差s=10,所属总体均值μ的99%的置信区间是()A.[77.42,82.58]B.[78.04,81.96]C.[76.08,83.92]D.[77.42,81.96]【单项选择题】总体方差未知时,可以用()作为总体方差的估计值,实现对总体平均数的估计。
《统计学原理》第五章习题河南电大贾天骐一.判断题部分题目1:从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。
()答案:×题目2:在抽样推断中,全及指标值是确定的、唯一的,而样本指标值是一个随机变量。
()答案:√题目3:抽样成数的特点是:样本成数越大,则抽样平均误差越大。
()答案:×题目4:抽样平均误差总是小于抽样极限误差。
()答案:×题目5:在其它条件不变的情况下,提高抽样估计的可靠程度,则降低了抽样估计的精确程度。
()答案:√题目6:从全部总体单位中抽取部分单位构成样本,在样本变量相同的情况下,重复抽样构成的样本个数大于不重复抽样构成的样本个数。
()答案:√题目7:抽样平均误差反映抽样误差的一般水平,每次抽样的误差可能大于抽样平均误差,也可能小于抽样平均误差。
()答案:√题目8:在抽样推断中,抽样误差的概率度越大,则抽样极限误差就越大于抽样平均误差。
()答案:√题目9:抽样估计的优良标准有三个:无偏性、可靠性和一致性。
()答案:×题目10:样本单位数的多少与总体各单位标志值的变异程度成反比,与抽样极限误差范围的大小成正比。
()答案:×题目11:抽样推断的目的是,通过对部分单位的调查,来取得样本的各项指标。
()答案:×题目12:用来测量估计可靠程度的指标是抽样误差的概率度。
()答案:√题目13:总体参数区间估计必须具备三个要素即:估计值、抽样误差范围和抽样误差的概率度。
()答案:×二.单项选择题部分题目1:抽样平均误差是()。
A、抽增指标的标准差B、总体参数的标准差C、样本变量的函数D、总体变量的函数答案:A题目2:抽样调查所必须遵循的基本原则是()。
A、准确性原则B、随机性原则C、可靠性原则 C、灵活性原则答案:B题目3:在简单随机重复抽样条件下,当抽样平均误差缩小为原来的1/2时,则样本单位数为原来的()。
一、理论与技能测试(请参考统计学第三版答案(全书)相关内容)1.抽样调查需要遵守的基本原则是()。
A.准确性原则 B.随机性原则 C.代表性原则 D.可靠性原则2.抽样调查的主要目的是()。
A.用样本指标推断总体指标B.用总体指标推断样本指标C.弥补普查资料的不足 D.节约经费开支3.抽样平均误差反映了样本指标与总体指标之间的()。
A.实际误差 B.实际误差的平均数C.可能的误差范围 D.实际的误差范围4.对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式是()。
A.简单随机抽样 B.类型抽样 C.等距抽样 D.整群抽样5.在其他情况一定的情况下,样本单位数与抽样误差之间的关系是()。
A.样本单位数越多,抽样误差越大 B.样本单位数越多,抽样误差越小C.样本单位数与抽样误差无关 D.抽样误差是样本单位数的10%6.用简单随机重复抽样方法抽取样本单位,如果要使抽样平均误差降低50%,那么样本容量需扩大到原来的()。
A.2倍 B.3倍 C.4倍 D.5倍7.在抽样调查中()。
A.只存在登记性误差,不存在代表性误差B.只存在代表性误差,不存在登记性误差C.既不存在登记性误差,也不存在代表性误差D.既存在登记性误差,也存在代表性误差8.在抽样调查中,样本单位()。
A.越少越好 B.越多越好C.取决于对抽样推断可靠性的要求 D.取决于调查者的意志和愿望9.为了解某企业职工家庭收支情况,按该企业职工名册依次每50人抽取1 人组成样本,在这个基础上,对每个家庭的生活费收入和支出情况进行调查,这种调查属于()A.简单随机抽样 B.等距抽样 C.类型抽样 D.整群抽样10.影响抽样误差的因素包括()。
A.全及总体本身的变异程度 B.抽样调查的目的和要求C.样本单位的数目 D.样本指标11.在抽样调查中()。
A.样本是唯一的,样本指标也是唯一的 B.样本是随机变量C.样本指标是随机变量 D.样本不是唯一的,样本指标也不是唯一的12.从总体中抽取样本单位的具体方法有()。
抽样与抽样估计习题5.1单选题1.不重复随机抽样的误差比重复随机抽样的误差( )①大②小③相等④有时大,有时小2.在其他条件不变的情况下,抽样平均误差的大小与总体标准差的大小( )①成正比②无关③成反比④以上都不对3.在其他条件不变的情况下,抽样平均误差的大小与样本容量方根的大小( )①无关②成正比③成反比④以上都不对4.对重复随机抽样,若其他条件不变,样本容量增加3倍,则样本的平均抽样误差( )①减少30% ②增加50% ③减少50% ④增加50%5.抽样成数P值愈接近1,则抽样成数平均误差值( )①愈大②愈小③愈接近于0.5 ④愈接近于16. 抽样结果的估计值与总体指标之间误差允许的限度称为:( )①极限误差②抽样误差③抽样平均误差④代表性误差7. 在确定样本容量时,若总体成数方差未知,则P可取( )①0.2 ②0.3 ③0.4 ④0.58. 用重复随机抽样的平均抽样误差公式计算不重复随机抽样的平均抽样误差,将会( )①高估了误差②低估了误差③既没高估也没低估④以上都不对9. 随着样本容量的增加,抽样指标与其估计的总体指标之差的绝对值小于任意小的正数的可能性趋于100%,称为估计的( )①无偏性②一致性③有效性④充分性10. 在95.45%的概率保证程度下,当抽样极限误差为0.06时,则抽样平均误差等于( )①0.02 ②0.03 ③0.12 ④0.185.2对批量为10000单位的产品随机抽取100单位为一样本,以推断其产品质量。
⑴在计算抽样平均误差时,需要使用有限总体修正系数吗?为什么?⑵如果总体标准差σ=8,试分别使用与不使用有限总体修正系数计算抽样平均误差。
5.3 对一批4000件的产品按不重复随机抽样方式进行抽样检查,抽取了该批产品的1/20作为样本,检验结果有8件废品。
试问这批产品的废品率在1.3%~6.7%的可能性有多大?5.4某市场调查公司在一次调查中,询问250人关于获得某知名企业产品的主要途径,其中有140人认为他们是通过电视广告了解的。
(1)试求总体中通过电视广告认识该厂家产品的人所占比率的95%置信区间;(2)若以95%把握程度,允许误差为0.01时,为估计总体比率应选取多大的样本容量?5.5 某职业研究所为了解本地从事IT 行业人员的薪金,随机抽取100名从事IT 行业的人员组成样本,样本均值为50124.58元,样本标准差为1685元,试分别求IT 行业人员薪金的总体均值90%、95%和99%的置信区间,当置信水平增大时,置信区间的宽度如何变化?是否合理?5.6 某省农调队要了解该省内两个地区农民年人均收入的差别。
这两个地区的独立随机样本资料如下:试求两个地区农民年人均收入之差的点估计值,及两个地区农民年人均收入之差的95%的置信区间。
在进行区间估计时需要作什么假设?5.7 生产工序中的方差是工序质量的重要度量,为此茶业制造商想估计代装茶重量的方差。
随机抽取24袋茶组成样本其重量如下:(单位:克)3.20 3.28 3.35 3.33 3.25 3.18 3.26 3.36 3.34 3.48 3.90 3.70 3.75 3.38 3.45 3.50 3.22 2.95 3.16 3.20 3.12 3.30 3.27 3.28试求出总体方差的95%的置信区间,计算这一区间时需要用什么假设?总体标准差的95%的置信区间又如何?假设检验习题一、名词解释 1. 显著性水平 2. 备择假设 3. 统计量 4. 临界值二、多项选择题:1. 根据样本指标,分析总体的假设值是否成立的统计方法称为:A. 抽样估计B. 假设检验 C .统计估计 D .显著性检验 E .概率 2. 对总体提出假设,通常有原假设和备择假设,其中,备择假设又称:A. 虚无假设B. 对立假设C. 零假设D. 替代假设E. 错误假设 3.犯一类错误的概率通常用( )来表示:A. αB.β C .显著水平 D .F (t ) E . 1-α 4. 统计量nx z /σμ-=可以用于以下( )检验。
A. 总体平均数 B .双边检验 C .总体成数 D .单边检验 E .样本平均数三、简答题1.什么是第Ⅰ类错误,什么是第Ⅱ类错误? 2.什么是双边检验,什么是单边检验? 3.试述假设检验的步骤。
4.如何选择合适的检验统计量?5.在单边检验中,如何区分左侧检验和右侧检验? 6.什么是假设检验?其作用是什么?7.用 Z 统计量检验非正态分布的总体指标,其使用依据是什么? 8.简述区间估计和假设检验的关系。
四、计算题1.某食品厂用自动装袋机包装食品,每袋标准重量为50克,每隔一定时间抽取包装袋进行检验。
现抽取10袋,测得其重量为(单位:克):49.8, 51, 50.5, 49.5, 49.2, 50.2, 51.2, 50.3, 49.7, 50.6 若每袋重量服从正态分布,每袋重量是否合符要求。
(α =0.10)2.在一批产品中抽40件进行调查,发现次品有6件,试按显著水平为0.05来判断该批产品的次品率是否高于10%。
3. 某产品的废品率是17%,经对该产品的生产设备进行技术改造后,从中抽取 200件产品检验,发现有次品28件,能否认为技术改造后提高了产品的质量?(α =0.05)相关与回归习题:一、主要概念理解:1.相关关系2.正相关与负相关3.判定系数(可决系数)4.相关系数5.估计标准误差二、判断、选择题:1. 估计标准误差S y 的值越小,判定系数r 2的值越大,回归直线的拟合程度越高。
( )2. 在直线回归方程中,若已知:n=30,∑y=13500,∑x=360,b=17.5,则a =(____)3. 已知变量x 与y 之间存在着负相关,指出下列回归方程中哪一个肯定是错误的。
( )A. x y85.010ˆ--= B. x y 5.1200ˆ-= C. x y76.0140ˆ+-= D. x y 076.025ˆ-= 4. 如果两个变量之间完全相关,则以下结论中正确的有( )A.相关系数1=rB.判定系致r 2=1C.估计标准误差S y =1D.估计标准误差S y =0E.回归系数b>0三、计算题:某公司所属8个企业的产品销售资料如下:企业编号产品销售额(万元) 销售利润(万元) 1 170 8.1 2 220 12.5 3 390 18.0 4 430 22.0 5 480 26.5 6 650 40.0 7 950 64.0 8100069.0要求:(1)计算产品销售额与利润之间的相关系数;(2)确定利润对产品销售额的直线回归方程,并说明斜率的经济意义; (3)对回归系数b 的显著性进行检验、对方程整体进行检验(取α=0.05); (4)预测产品销售额为1200万元时的利润。
抽样与抽样估计习题简要参考答案5.1 1 .② 2.① 3.③ 4.③ 5.②6.①7.④8.①9.② 10.②5.2 ⑴ 不需要 (5.0<Nn) ⑵ 0.8,0.796 结果基本一致 5.3 解:N=4000 n=200 p=0.04 由)1()1(21Nnn p p Z p --±得: 0135.004.0)40002001(200)04.01(04.004.021±=--±Z Z 1/2 =1.3%~6.7%得Z 1/2=2 查表得95.45%5.4 0.56±0.062=49.8%~62.2% n=94665.5 (49848.24, 50400.92) (49794.32, 50454.84) (49683.11, 50566.05) 置信水平越大,置信区间的宽度越宽。
合理(∵nZ 2σ=∆)5.6 372 (186.91, 557.09) 假定两样本相互独立5.7 用χ2分布 假定两样本相互独立且均来自正态总体 (0.0266,0.08865) (0.1631,0.2941)假设检验习题简要参考答案一、名词解释1、原假设真实,而样本点都落入临界区域的概率,称显著水平,常用α 表示。
2、替代假设又称对立假设或备择假设,是当原假设被否定时即可成立的假设。
3、由样本所构造的随机变量称为统计量。
4、临界值就是临界区域的端点二、多项选择题 1、B D 2、C D 3、A C 4、A B D三、简答题1、将原假设为真,却将之拒绝的错误称为第一类错误。
而将原假设为伪,却将之接受的错误称为第二类错误。
2、临界区域位于统计量分布曲线两侧的假设检验称为双边检验,而临界区域位于统计量分布曲线一侧的假设检验称为单边检验。
3、根据要求,(1)提出原假设H 。
和替代假设,在检验进行中,假设H 。
是真实的。
(2)选定合适的检验统计量。
(3)决定显著水平a 。
(4)根据显著水平确定统计量的临界区域,同时注意是双边检验还是单边检验。
(5)根据计算的统计量及所确定的显著水平作出决策。
4、检验统计量的选择取决于总体分布的特征及样本单位数的多少。
如总体为正态分布且方差已知的情况下,采用 Z 统计量;总体为正态分布且方差未知,采用 t 统计量。
对非正态分布的总体,如果样本客量足够大也可采用 Z 及 t 统计量。
5、临界区域位于统计量分布曲线左侧的假设检验称为左侧检验,临界区域位于统计量分布曲线右侧的假设检验称为右侧检验。
6、假设检验是以样本指标为依据来判断总体指标的假设值是否成立,通过构造合适的统计量来分析样本统计值与参数估计值的差异。
它的主要作用在于用样本信息与原假设差异的大小来反映假设值真实性的大小,即差异小,假设值真实性就可能大,差异大,假设值真实性就可能小。
7、当样本容量足够大时,即n >30时,非正态分布的变量近似地服从正态分布,也可选用 Z 统计量进行检验。
8、区间估计是根据样本信息去估计总体的未知信息,而假设检验是对总体参数提出一个假设值,再用样本信息去研究参数假设值是否成立。
在双边检验中的接受域即为区间估计的置信区间。
四、计算题1、解:提出假设:50:0=μH 50:1≠μH 因总体方差未知,宜采用统计量t :ns x t μ-=根据资料计算:20.50==∑nx x62.0)(2=-=∑nx x sns x t μ-==1.02 由α=0.1 查α=0.1双侧,得83.191.0=t拒绝域为a t t > 故接受原假设。
即每袋重量符合要求。
2、解:提出假设:%10:0≤p H %10:1>p H 采用统计量:np p p p z )1(000--=15.0406==p 40=n np p p p z )1(000--==1.0564.105.0=z ,拒绝域为a z z >,本题中a z z <,故接受原假设,可以认为该批产品的次品率不高于10%。