袁卫《统计学》(第3版)章节题库-方差分析与实验设计(圣才出品)
- 格式:pdf
- 大小:625.35 KB
- 文档页数:15
第二部分课后习题第1章数据与统计学1.什么是统计学?怎样理解统计学与统计数据的关系?答:统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据内在的数量规律性。
统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源于对统计数据的研究,目的也在于对统计数据的研究。
离开了统计数据,统计方法乃至统计学就失去了其存在的意义。
2.试举出日常生活或工作中统计数据及其规律性的例子。
答:(1)对人类性别比例的调查,新生婴儿男女性别比为105:100,如果没有人为的干扰,其规律是婴幼儿时男性略多于女性,中青年时男女人数大致相同,老年时女性又略多于男性。
(2)施肥量与粮食产量之间的数量关系的调查研究,其规律性为某种粮食作物的产量会随某种施肥量的增加而增加。
当开始增加施肥量时,产量增加较快。
以后增加同样的施肥量,粮食产量的增加量逐渐减少。
当施肥量增加到一定数值量,产量不再增加。
这时如果再增加肥料,产量反而会减少。
(3)商品广告费用与销售额的关系的调查,其规律性为,随着广告费用的增加,商品的知名度和销售额会相应增加。
3.联系实际简要说明统计数据的来源。
答:统计数据的来源大致分为两种,其中来源于直接组织的调查、观察和科学试验的数据,称为第一手数据或直接的数据;来源于已有的数据,称为第二手数据或间接的数据。
4.直接获取统计数据的渠道主要有哪些?答:(1)对于社会经济管理和决策而言,主要是通过统计调查的方式获取数据,如客户满意度调查、电视收视率调查、家庭收支情况调查、居民闲暇时间利用调查等。
(2)在自然科学和工程的研究领域,通常是通过科学实验的方法获得研究的统计数据。
5.简要说明抽样误差和非抽样误差。
答:(1)抽样误差是利用样本推断总体时产生的误差;抽样误差对任何一个随机样本来讲都是不可避免的。
但它又是可以计量的,并且是可以控制的。
在坚持随机原则的条件下,一般来讲,样本量越大,抽样误差就越小。
(2)非抽样误差是由于调查过程中各有关环节工作失误造成的。
为大家谋福利,低价供应第1章绪论1.什么是统计学?怎样理解统计学与统计数据的关系?2.试举出日常生活或工作中统计数据及其规律性的例子。
3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。
因此,他们开始检查供货商的集装箱,有问题的将其退回。
最近的一个集装箱装的是2 440加仑的油漆罐。
这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。
装满的油漆罐应为4.536 kg。
要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)描述推断。
答:(1)总体:最近的一个集装箱内的全部油漆;(2)研究变量:装满的油漆罐的质量;(3)样本:最近的一个集装箱内的50罐油漆;(4)推断:50罐油漆的质量应为4.536×50=226.8 kg。
4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。
这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。
假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。
要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)一描述推断。
答:(1)总体:市场上的“可口可乐”与“百事可乐”(2)研究变量:更好口味的品牌名称;(3)样本:1000名消费者品尝的两个品牌(4)推断:两个品牌中哪个口味更好。
第2章统计数据的描述——练习题●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。
服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。
调查结果如下:C B C ED B C C B C(1) 指出上面的数据属于什么类型;用Excel制作一张频数分布表;(3) 绘制一张条形图,反映评价等级的分布。
解:(1)由于表2.21中的数据为服务质量的等级,可以进行优劣等级比较,但不能计算差异大小,属于顺序数据。
统计学第一章1.什么是统计学?怎样理解统计学与统计数据的关系?答:统计学是一门收集、整理、显示和分析统计数据的科学。
统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。
2.简要说明统计数据的来源答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。
间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。
3.简要说明抽样误差和非抽样误差答:统计调查误差可分为非抽样误差和抽样误差。
非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。
抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。
4.答:(1)有两个总体:A品牌所有产品、B品牌所有产品(2)变量:口味(如可用10分制表示)(3)匹配样本:从两品牌产品中各抽取1000瓶,由1000名消费者分别打分,形成匹配样本。
(4)从匹配样本的观察值中推断两品牌口味的相对好坏。
第二章、统计数据的描述思考题1描述次数分配表的编制过程答:分二个步骤:(1)按照统计研究的目的,将数据按分组标志进行分组。
按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。
按数量标志进行分组,可分为单项式分组与组距式分组单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。
统计分组应遵循“不重不漏”原则(2)将数据分配到各个组,统计各组的次数,编制次数分配表。
2.解释洛伦兹曲线及其用途答:洛伦兹曲线是20世纪初美国经济学家、统计学家洛伦兹根据意大利经济学家帕累托提出的收入分配公式绘制成的描述收入和财富分配性质的曲线。
洛伦兹曲线可以观察、分析国家和地区收入分配的平均程度。
3. 一组数据的分布特征可以从哪几个方面进行测度?答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。
第6章方差分析与实验设计一、单项选择题1.对线性回归方程的显著性检验,通常采用3种方法,即相关系数法、F检验法和t 检验法,下面说法正确的是()[山东大学2017研]A.F检验法最有效B.t检验法做有效C.3种方法是相通的,检验效果是相同的D.F检验法和t检验法,可以代替相关系数检验法【答案】D【解析】F检验用来检验回归方程的总体线性关系是否显著,t检验和相关系数检验用来检验单个自变量与因变量的线性关系是否显著。
在一元线性回归模型中,三种检验方法等价;在多元线性回归模型中,三种检验方法有各自的用处,效果不一定相同。
F检验法和t 检验法可以检验相关系数,代替相关系数检验,D项正确。
2.在DW检验中,无序列相关的区间为()。
[山东大学2017研]A.0≤DW≤duB.du<DW<4-duC.4-du≤DW≤4-dlD.4-du<DW<4【答案】B【解析】D-W检验统计量DW=2(1-r),其中r为序列的自相关系数。
当r→0时,D→2;当r→1时,D→0;当r→-1时,D→4。
根据样本容量n和解释变量数目k,在给定显著性水平下,建立D-W检验统计量的下临界值d l和上临界值d u,确定具体的用于判断的范围。
当0≤DW<d l时,存在正自相关;当d l≤DW≤d u或4-d u≤DW≤4-d l时,相关性不能确定;当d u<DW<4-d u时,无序列相关;当4-d l<DW<4时,存在负自相关。
3.对模型y i=β0+β1x1i+β2x2i+εi的最小二乘回归结果显示,多重判定系数R2=0.92,样本容量为30,总离差平方和为500,则估计的标准误差为()。
[山东大学2017研] A.1.217B.1.482C.4.152D.5.214【答案】A【解析】由题意SST=500,R2=SSR/SST=0.92,所以SSR=460,SSE=SST-SSR =40,估计的标准误差为=1.2174.在多元线性回归模型中,若自变量x i对因变量y的影响不显著,那么它的回归系数βi的取值()。
第三部分章节题库第1章数据与统计学一、单项选择题1.被马克思誉为“政治经济学之父,在某种程度上也是统计学的创始人”的是()。
A.布莱斯·帕斯卡B.威廉·配第C.费马D.约翰·格朗特【答案】B【解析】布莱斯·帕斯卡和费马是古典概率论的奠基人;约翰·格朗特是人口统计的创始人。
2.统计学的两大分类是()。
A.统计资料的收集和分析B.理论统计和运用统计C.统计预测和决策D.描述统计和推断统计【答案】D3.下列不属于描述统计问题的是()。
A.根据样本信息对总体进行的推断B.了解数据分布的特征C.分析感兴趣的总体特征D.利用图、表或其他数据汇总工具分析数据【答案】A【解析】描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法;推断统计是研究如何利用样本数据来推断总体特征的统计方法。
4.下列叙述中,采用推断统计方法的是()。
A.用饼图描述某企业职工的学历构成B.反映大学生统计学成绩的条形图C.一个城市在1月份的平均汽油价格D.从一个果园中采摘36个橘子,利用这36个橘子的平均重量估计果园中橘子的平均重量【答案】D【解析】推断统计是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。
由题可知,根据36个橘子的平均重量估计果园中橘子的平均重量属于推断统计方法。
5.如果一个样本因人故意操纵而出现偏差,这种误差属于()。
A.抽样误差B.非抽样误差C.设计误差D.实验误差【答案】B【解析】非抽样误差是由于调查过程中各有关环节工作失误造成的。
它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,人为干扰造成的误差,调查中由于被调查者不回答产生的误差等。
6.下列说法错误的是()。
A.抽样误差只存在于概率抽样中B.非抽样误差只存在于非概率抽样中C.无论是概率抽样还是非概率抽样都存在非抽样误差D.在全面调查中也存在非抽样误差【答案】B【解析】抽样误差是由于抽样的随机性引起的样本结果与总体真值之间的误差;非抽样误差是相对抽样误差而言的,是指除抽样误差之外的,由于其他原因引起的样本观察结果与总体真值之间的差异。
第9章统计指数思考题1.统计指数与数学上的指数函数有何不同?广义指数与狭义指数有何差异?答:与数学上的“指数函数”不同,统计学中的指数是一种对比性的分析指标,可以反映不同时间(时期、时点)或不同空间(国家、地区、部门、企业等)现象水平的数量对比关系,以及现象的实际水平与计划(规划或目标)水平的数量对比关系。
在经济分析的各个领域,指数工具都获得了广泛应用,因此,统计指数常常也被称为“经济指数”。
指数有广义和狭义之分。
广义地讲,任何两个数值对比形成的相对数都可以称为指数;狭义地讲,指数是用于测定多个项目在不同场合下综合变动的一种相对数。
从指数理论和方法上看,指数所研究的主要是狭义的指数。
2.与一般相对数比较,总指数所研究的现象总体有何特点?答:一般相对数是考察总体中个别现象或个别项目的数量对比关系的指数;总指数是考察整个总体现象的数量对比关系的指数。
它与一般相对数的区别不仅在于考察范围不同,还在于考察方法不同。
总指数不能简单地沿用一般相对数的计算分析方法,也不一定能够具备一般相对数的某些直观分析性质。
3.有人认为,不同商品的销售量是不同度量的现象,因为它们的计量单位可以不同;而不同商品的价格则是同度量的现象,因为它们的计量单位相同,都是货币单位。
这种看法是否正确?为什么?答:这种看法是不完全正确的。
在统计学中,一般把相乘以后使得不能直接相加的指标过渡到可以直接相加的指标的那个因素,叫做同度量因素。
同度量因素作为对比指标的媒介转化因素必须是一个水平相对固定的因素(即在同一综合指数的分子和分母中具有相同的水平),否则,它就不是同度量因素,而成为另一个对比指标了。
不同商品的销售量是不同度量的现象,不仅因为它们的计量单位可以不同,而且直接加总的结果也没有实际经济意义。
而不同商品的价格由于直接加总的结果没有实际意义,所以它也是不同度量的现象。
4.总指数有哪两种基本编制方式?它们各自有何特点?答:总指数的编制有综合指数的编制和平均指数的编制两种方式。
袁卫《统计学》(第3版)笔记和课后习题(含考研真题)详解第1章数据与统计学1>.1 复习笔记一、统计数据与统计学1>.统计学的概念统计学是研究如何搜集数据、整理数据、分析数据,以便从中做出正确推断的认识方法论科学。
实际上,它是一门方法论的科学而不是实质性科学。
2>.统计学和统计数据的关系统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源于对统计数据的研究,目的也在于对统计数据的研究。
离开了统计数据,统计方法乃至统计学就失去了其存在的意义。
二、统计学的产生和发展最早的统计是作为国家重要事项的记录,从统计的产生和发展过程来看,可以把统计学划分为三个时期:一是统计学的萌芽时期,主要有国势学派和政治算术学派;二是统计学的近代时期,主要有数理统计学派和社会统计学派;三是统计学的现代期,主要表现为统计学吸收数学营养的程度越来越迅速;统计学向其他学科领域渗透的能力越来越强;统计学的应用日趋广泛和深入,所发挥的功效日益增强。
三、统计学的内容统计学的内容由描述统计和推断统计组成。
描述统计是用图形、表格和概括性的数字对数据进行描述的统计方法。
推断统计是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。
推断统计主要有两种类型,即参数估计和假设检验。
四、统计数据的来源统计数据来源于直接组织的调查、观察和科学试验,称之为第一手数据或直接的数据;或者来源于已有的数据,称之为第二手数据或间接的数据。
五、统计数据的质量1>.抽样误差是由于抽样的随机性引起的样本结果与总体真值之间的误差。
这种误差虽然不可避免,但是可以控制。
2>.非抽样误差是相对于抽样误差而言的,是指除了抽样误差之外的,由于其他原因引起的样本观察值与总体真值之间的差异。
非抽样误差特别是其中的系统偏差是可以避免,但如果不注意,这类误差造成的结果对调查质量来说是致命的。
六、统计学的基本概念1>.总体:是指包含所研究的全部个体的集合。
第10章国民经济统计基础知识10.1 复习笔记一、国民经济统计的基本内容和基本原则1.国民经济运行与国民经济核算(1)国民经济统计(也称“国民经济核算”)它是以国民经济整体为对象而进行的一种统计核算,可从数量角度研究国民经济运行的条件、过程、结果及其内在联系。
(2)国民经济通常包括两个互有联系的方面:①从横向来看,国民经济是由全社会各单位、各部门构成的有机整体;②从纵向来看,各经济单位和部门所从事的各种各样的经济活动——生产、分配、流通和使用,彼此依存、相互衔接、不断循环,形成国民经济的运行或社会再生产过程。
2.我国国民经济核算体系的基本框架(1)国民经济核算体系是国家或国际组织为统一规范国民经济核算而制定的一套宏观核算制度,它以一定的经济理论为基础,明确界定一系列宏观核算的概念、定义和核算规则,制定一套反映国民经济运行的指标体系、分类标准、核算方法和表现形式。
(2)我国现行的国民经济核算体系主要由“基本核算表”和“国民经济账户”两大部分组成,通过表格或账户的形式对国民经济运行过程及结果进行全面的描述。
其中,“基本核算表”所包含的五大核算是国民经济统计最基本的部分。
①国内生产总值核算主要以国内生产总值为核心指标,对国民经济活动中的生产、消费、投资和进出口等基本经济总量进行全面、系统的核算,综合反映国民经济发展的规模、速度和结构。
②投入产出核算是对国内生产总值核算的延伸,它运用投入产出分析法,将国民经济各部门生产中的各种投入品来源与产品去向,反映在纵横交错的棋盘式平衡表中。
③资金流量核算以全社会资金运动为对象,核算各部门资金的来源和运用,反映全社会各种资金在各部门间的流量、流向,包括各部门收入的形成,初次分配、再分配和各部门资金余缺的调节和融通。
④国际收支核算以对外经济贸易为对象,对一定时期一国与国外之间的贸易、非贸易往来和资本往来进行系统的核算,综合反映国家的国际收支平衡状况、收支结构和外汇储备状况。
第6章方差分析与实验设计
一、单项选择题
1.方差分析所要研究的问题是()。
A.各总体的方差是否相等
B.各样本数据之间是否有显著差异
C.分类型自变量对数值型因变量的影响是否显著
D.分类型因变量对数值型自变量的影响是否显著
【答案】C
【解析】方差分析是检验多个总体均值是否相等的统计方法。
它是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。
它所要研究的问题就是分类型自变量对数值型因变量的影响。
2.与假设检验方法相比,方差分析方法可以使犯第Ⅰ类错误的概率()。
A.提高
B.降低
C.等于0
D.等于1
【答案】B
【解析】与假设检验相比,方差分析可以提高检验的效率,同时由于它将所有的样本信息结合在一起,增加了分析的可靠性;随着个体显著性检验次数的增加,假设检验犯第Ⅰ类错误的概率会增加,例如:取α=0.05,连续进行6次假设检验,则犯第Ⅰ类错误的概率为:
1-(1-α)6=0.265>0.05。
方差分析则排除了错误累积的概率。
3.在单因素方差分析中,涉及的两个变量是()。
A.数值型变量
B.分类型变量
C.一个分类型自变量和一个数值型的因变量
D.一个数值型的自变量和一个分类型自变量
【答案】C
4.组间误差是衡量因素的不同水平(不同总体)下各样本之间的误差,它()。
A.只包括随机误差
B.只包括系统误差
C.既包括随机误差,也包括系统误差
D.有时包括随机误差,有时包括系统误差
【答案】C
【解析】衡量因素的同一水平(同一个总体)下样本数据的误差,称为组内误差;衡量因素的不同水平(不同总体)下各样本之间的误差,称为组间误差。
组内误差只包含随机误差,而组间误差既包括随机误差,也包括系统误差。
5.在单因素方差分析中,各次试验观测应()。
A.相互关联
B.相互独立
C .计量逐步精确
D .方法逐步改进
【答案】B 【解析】方差分析中有三个基本的假定:①每个总体都应服从正态分布。
也就是说,对于因素的每一个水平,其观测值是来自正态分布总体的简单随机样本;②各个总体的方差2σ必须相同。
也就是说,对于各组观察数据,是从具有相同方差的正态总体中抽取的;③观测值是独立的。
6.在单因素方差分析中,所提出的原假设和备则假设分别是( )。
A .H 0:12k μμμ===…,H 1:12k μμμ≠≠≠…
B .H 0:12k μμμ===…,H 1:12k μμμ>>…>
C .H 0:12k μμμ===…,H 1:12k μμμ<<…<
D .H 0:12k μμμ===…,H 1:(1,2,
,)i i k μ=不全相等
【答案】D
【解析】在方差分析中,原假设所描述的是:在按照自变量的值分成的类中,因变量的均值是否相等。
因此,检验因素的k 个水平(总体)的均值是否相等,需要提出如下形式的假设: H 0:12k μμμ===… 自变量对因变量没有显著影响
H 1:(12)i i k μ=,,…,不全相等 自变量对因变量有显著影响
式中:i μ为第i 个总体的均值。
7.在单因素方差分析中,若因子的水平个数为k ,全部观测值的个数为n ,则( )。
A.SST的自由度为n
B.SSA的自由度为k
C.SSE的自由度为n-k-1
D.SST的自由度等于SSA的自由度与SSE的自由度之和
【答案】D
【解析】在单因素方差分析中,三个平方和所对应的自由度分别是:SST的自由度为(n-1);SSA的自由度为(k-1);SSE的自由度为(n-k)。
8.从4个总体中各选取了5个观察值,得到组间平方和SSA=636,组内平方和SSE=742,组间平方和与组内平方和的自由度分别为()。
A.3;16
B.3;20
C.4;16
D.4;20
【答案】A
【解析】在单因素方差分析中,三个平方和所对应的自由度分别是:SST的自由度为:n-1=4×5-1=19;SSA的自由度为:k-1=4-1=3;SSE的自由度为:n-k=4×5-4=16。
9.在单因素方差分析中,如果各因素水平效应相同的原假设为真,则组间平方和SSC ()。
A.等于0
B.等于总平方和
C.完全由抽样的随机误差引起
D.完全由不同处置的差异引起
【答案】C
10.在单因素方差分析中,用于检验的统计量F的计算公式为()。
A.SSA/SSE
B.SSA/SST
C.MSA/MSE
D.MSA/MSE
【答案】C
11.在方差分析中,如果拒绝原假设,则说明()。
A.自变量对因变量有显著影响
B.所检验的各总体均值之间全不相等
C.不能认为自变量对因变量有显著影响
D.所检验的各样本均值之间全不相等
【答案】A
【解析】在方差分析中,如果不拒绝原假设H0,则不能认为自变量对因变量有显著影响,也就是说,不能认为自变量与因变量之间有显著关系;如果拒绝原假设,则意味着自变量对因变量有显著影响,也就是自变量与因变量之间有显著关系。
12.方差分析中的多重比较是通过配对比较来进一步检验()。
A.哪两个总体均值之间有差异
B.哪两个总体方差之间有差异
C.哪两个样本均值之问有差异
D.哪两个样本方差之间有差异
【答案】A
13.设用于检验的行因素有k个水平,列因素有r个水平,并假设两个因素有交互作用,交互作用平方和的自由度是()。
A.k-1
B.kr-1
C.k r(m-1)
D.(k-l)(r-1)
【答案】D
【解析】在有交互作用的双因素方差分析中,行因素平方和的自由度是k-1;列因素平方和的自由度是r-1;交互作用平方和的自由度是(k-l)(r-1);误差平方和的自由度是kr(m-1)。
14.在有交互作用的方差分析中离差平方和的分解公式为()。
A.SST=SSR+SSC+SSRC
B.SST=SSE+SSRC
C.SST=SSC+SSR+SSE
D.SST=SSR+SSC+SSRC+SSE。