袁卫《统计学》(第3版)章节题库-方差分析与实验设计(圣才出品)
- 格式:pdf
- 大小:625.35 KB
- 文档页数:15
第二部分课后习题第1章数据与统计学1.什么是统计学?怎样理解统计学与统计数据的关系?答:统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据内在的数量规律性。
统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源于对统计数据的研究,目的也在于对统计数据的研究。
离开了统计数据,统计方法乃至统计学就失去了其存在的意义。
2.试举出日常生活或工作中统计数据及其规律性的例子。
答:(1)对人类性别比例的调查,新生婴儿男女性别比为105:100,如果没有人为的干扰,其规律是婴幼儿时男性略多于女性,中青年时男女人数大致相同,老年时女性又略多于男性。
(2)施肥量与粮食产量之间的数量关系的调查研究,其规律性为某种粮食作物的产量会随某种施肥量的增加而增加。
当开始增加施肥量时,产量增加较快。
以后增加同样的施肥量,粮食产量的增加量逐渐减少。
当施肥量增加到一定数值量,产量不再增加。
这时如果再增加肥料,产量反而会减少。
(3)商品广告费用与销售额的关系的调查,其规律性为,随着广告费用的增加,商品的知名度和销售额会相应增加。
3.联系实际简要说明统计数据的来源。
答:统计数据的来源大致分为两种,其中来源于直接组织的调查、观察和科学试验的数据,称为第一手数据或直接的数据;来源于已有的数据,称为第二手数据或间接的数据。
4.直接获取统计数据的渠道主要有哪些?答:(1)对于社会经济管理和决策而言,主要是通过统计调查的方式获取数据,如客户满意度调查、电视收视率调查、家庭收支情况调查、居民闲暇时间利用调查等。
(2)在自然科学和工程的研究领域,通常是通过科学实验的方法获得研究的统计数据。
5.简要说明抽样误差和非抽样误差。
答:(1)抽样误差是利用样本推断总体时产生的误差;抽样误差对任何一个随机样本来讲都是不可避免的。
但它又是可以计量的,并且是可以控制的。
在坚持随机原则的条件下,一般来讲,样本量越大,抽样误差就越小。
(2)非抽样误差是由于调查过程中各有关环节工作失误造成的。
为大家谋福利,低价供应第1章绪论1.什么是统计学?怎样理解统计学与统计数据的关系?2.试举出日常生活或工作中统计数据及其规律性的例子。
3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。
因此,他们开始检查供货商的集装箱,有问题的将其退回。
最近的一个集装箱装的是2 440加仑的油漆罐。
这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。
装满的油漆罐应为4.536 kg。
要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)描述推断。
答:(1)总体:最近的一个集装箱内的全部油漆;(2)研究变量:装满的油漆罐的质量;(3)样本:最近的一个集装箱内的50罐油漆;(4)推断:50罐油漆的质量应为4.536×50=226.8 kg。
4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。
这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。
假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。
要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)一描述推断。
答:(1)总体:市场上的“可口可乐”与“百事可乐”(2)研究变量:更好口味的品牌名称;(3)样本:1000名消费者品尝的两个品牌(4)推断:两个品牌中哪个口味更好。
第2章统计数据的描述——练习题●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。
服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。
调查结果如下:C B C ED B C C B C(1) 指出上面的数据属于什么类型;用Excel制作一张频数分布表;(3) 绘制一张条形图,反映评价等级的分布。
解:(1)由于表2.21中的数据为服务质量的等级,可以进行优劣等级比较,但不能计算差异大小,属于顺序数据。
统计学第一章1.什么是统计学?怎样理解统计学与统计数据的关系?答:统计学是一门收集、整理、显示和分析统计数据的科学。
统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。
2.简要说明统计数据的来源答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。
间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。
3.简要说明抽样误差和非抽样误差答:统计调查误差可分为非抽样误差和抽样误差。
非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。
抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。
4.答:(1)有两个总体:A品牌所有产品、B品牌所有产品(2)变量:口味(如可用10分制表示)(3)匹配样本:从两品牌产品中各抽取1000瓶,由1000名消费者分别打分,形成匹配样本。
(4)从匹配样本的观察值中推断两品牌口味的相对好坏。
第二章、统计数据的描述思考题1描述次数分配表的编制过程答:分二个步骤:(1)按照统计研究的目的,将数据按分组标志进行分组。
按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。
按数量标志进行分组,可分为单项式分组与组距式分组单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。
统计分组应遵循“不重不漏”原则(2)将数据分配到各个组,统计各组的次数,编制次数分配表。
2.解释洛伦兹曲线及其用途答:洛伦兹曲线是20世纪初美国经济学家、统计学家洛伦兹根据意大利经济学家帕累托提出的收入分配公式绘制成的描述收入和财富分配性质的曲线。
洛伦兹曲线可以观察、分析国家和地区收入分配的平均程度。
3. 一组数据的分布特征可以从哪几个方面进行测度?答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。
第6章方差分析与实验设计一、单项选择题1.对线性回归方程的显著性检验,通常采用3种方法,即相关系数法、F检验法和t 检验法,下面说法正确的是()[山东大学2017研]A.F检验法最有效B.t检验法做有效C.3种方法是相通的,检验效果是相同的D.F检验法和t检验法,可以代替相关系数检验法【答案】D【解析】F检验用来检验回归方程的总体线性关系是否显著,t检验和相关系数检验用来检验单个自变量与因变量的线性关系是否显著。
在一元线性回归模型中,三种检验方法等价;在多元线性回归模型中,三种检验方法有各自的用处,效果不一定相同。
F检验法和t 检验法可以检验相关系数,代替相关系数检验,D项正确。
2.在DW检验中,无序列相关的区间为()。
[山东大学2017研]A.0≤DW≤duB.du<DW<4-duC.4-du≤DW≤4-dlD.4-du<DW<4【答案】B【解析】D-W检验统计量DW=2(1-r),其中r为序列的自相关系数。
当r→0时,D→2;当r→1时,D→0;当r→-1时,D→4。
根据样本容量n和解释变量数目k,在给定显著性水平下,建立D-W检验统计量的下临界值d l和上临界值d u,确定具体的用于判断的范围。
当0≤DW<d l时,存在正自相关;当d l≤DW≤d u或4-d u≤DW≤4-d l时,相关性不能确定;当d u<DW<4-d u时,无序列相关;当4-d l<DW<4时,存在负自相关。
3.对模型y i=β0+β1x1i+β2x2i+εi的最小二乘回归结果显示,多重判定系数R2=0.92,样本容量为30,总离差平方和为500,则估计的标准误差为()。
[山东大学2017研] A.1.217B.1.482C.4.152D.5.214【答案】A【解析】由题意SST=500,R2=SSR/SST=0.92,所以SSR=460,SSE=SST-SSR =40,估计的标准误差为=1.2174.在多元线性回归模型中,若自变量x i对因变量y的影响不显著,那么它的回归系数βi的取值()。
第6章方差分析与实验设计
一、单项选择题
1.方差分析所要研究的问题是()。
A.各总体的方差是否相等
B.各样本数据之间是否有显著差异
C.分类型自变量对数值型因变量的影响是否显著
D.分类型因变量对数值型自变量的影响是否显著
【答案】C
【解析】方差分析是检验多个总体均值是否相等的统计方法。
它是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。
它所要研究的问题就是分类型自变量对数值型因变量的影响。
2.与假设检验方法相比,方差分析方法可以使犯第Ⅰ类错误的概率()。
A.提高
B.降低
C.等于0
D.等于1
【答案】B
【解析】与假设检验相比,方差分析可以提高检验的效率,同时由于它将所有的样本信息结合在一起,增加了分析的可靠性;随着个体显著性检验次数的增加,假设检验犯第Ⅰ类错误的概率会增加,例如:取α=0.05,连续进行6次假设检验,则犯第Ⅰ类错误的概率为:
1-(1-α)6=0.265>0.05。
方差分析则排除了错误累积的概率。
3.在单因素方差分析中,涉及的两个变量是()。
A.数值型变量
B.分类型变量
C.一个分类型自变量和一个数值型的因变量
D.一个数值型的自变量和一个分类型自变量
【答案】C
4.组间误差是衡量因素的不同水平(不同总体)下各样本之间的误差,它()。
A.只包括随机误差
B.只包括系统误差
C.既包括随机误差,也包括系统误差
D.有时包括随机误差,有时包括系统误差
【答案】C
【解析】衡量因素的同一水平(同一个总体)下样本数据的误差,称为组内误差;衡量因素的不同水平(不同总体)下各样本之间的误差,称为组间误差。
组内误差只包含随机误差,而组间误差既包括随机误差,也包括系统误差。
5.在单因素方差分析中,各次试验观测应()。
A.相互关联
B.相互独立
C .计量逐步精确
D .方法逐步改进
【答案】B 【解析】方差分析中有三个基本的假定:①每个总体都应服从正态分布。
也就是说,对于因素的每一个水平,其观测值是来自正态分布总体的简单随机样本;②各个总体的方差2σ必须相同。
也就是说,对于各组观察数据,是从具有相同方差的正态总体中抽取的;③观测值是独立的。
6.在单因素方差分析中,所提出的原假设和备则假设分别是( )。
A .H 0:12k μμμ===…,H 1:12k μμμ≠≠≠…
B .H 0:12k μμμ===…,H 1:12k μμμ>>…>
C .H 0:12k μμμ===…,H 1:12k μμμ<<…<
D .H 0:12k μμμ===…,H 1:(1,2,
,)i i k μ=不全相等
【答案】D
【解析】在方差分析中,原假设所描述的是:在按照自变量的值分成的类中,因变量的均值是否相等。
因此,检验因素的k 个水平(总体)的均值是否相等,需要提出如下形式的假设: H 0:12k μμμ===… 自变量对因变量没有显著影响
H 1:(12)i i k μ=,,…,不全相等 自变量对因变量有显著影响
式中:i μ为第i 个总体的均值。
7.在单因素方差分析中,若因子的水平个数为k ,全部观测值的个数为n ,则( )。
A.SST的自由度为n
B.SSA的自由度为k
C.SSE的自由度为n-k-1
D.SST的自由度等于SSA的自由度与SSE的自由度之和
【答案】D
【解析】在单因素方差分析中,三个平方和所对应的自由度分别是:SST的自由度为(n-1);SSA的自由度为(k-1);SSE的自由度为(n-k)。
8.从4个总体中各选取了5个观察值,得到组间平方和SSA=636,组内平方和SSE=742,组间平方和与组内平方和的自由度分别为()。
A.3;16
B.3;20
C.4;16
D.4;20
【答案】A
【解析】在单因素方差分析中,三个平方和所对应的自由度分别是:SST的自由度为:n-1=4×5-1=19;SSA的自由度为:k-1=4-1=3;SSE的自由度为:n-k=4×5-4=16。
9.在单因素方差分析中,如果各因素水平效应相同的原假设为真,则组间平方和SSC ()。
A.等于0
B.等于总平方和
C.完全由抽样的随机误差引起
D.完全由不同处置的差异引起
【答案】C
10.在单因素方差分析中,用于检验的统计量F的计算公式为()。
A.SSA/SSE
B.SSA/SST
C.MSA/MSE
D.MSA/MSE
【答案】C
11.在方差分析中,如果拒绝原假设,则说明()。
A.自变量对因变量有显著影响
B.所检验的各总体均值之间全不相等
C.不能认为自变量对因变量有显著影响
D.所检验的各样本均值之间全不相等
【答案】A
【解析】在方差分析中,如果不拒绝原假设H0,则不能认为自变量对因变量有显著影响,也就是说,不能认为自变量与因变量之间有显著关系;如果拒绝原假设,则意味着自变量对因变量有显著影响,也就是自变量与因变量之间有显著关系。
12.方差分析中的多重比较是通过配对比较来进一步检验()。
A.哪两个总体均值之间有差异
B.哪两个总体方差之间有差异
C.哪两个样本均值之问有差异
D.哪两个样本方差之间有差异
【答案】A
13.设用于检验的行因素有k个水平,列因素有r个水平,并假设两个因素有交互作用,交互作用平方和的自由度是()。
A.k-1
B.kr-1
C.k r(m-1)
D.(k-l)(r-1)
【答案】D
【解析】在有交互作用的双因素方差分析中,行因素平方和的自由度是k-1;列因素平方和的自由度是r-1;交互作用平方和的自由度是(k-l)(r-1);误差平方和的自由度是kr(m-1)。
14.在有交互作用的方差分析中离差平方和的分解公式为()。
A.SST=SSR+SSC+SSRC
B.SST=SSE+SSRC
C.SST=SSC+SSR+SSE
D.SST=SSR+SSC+SSRC+SSE。