统计学考研章节题库-第8~10章【圣才出品】
- 格式:pdf
- 大小:2.96 MB
- 文档页数:130
第10章方差分析一、思考题1.什么是方差分析?它研究的是什么?答:方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。
方差分析是检验多个总体均值是否相等的统计方法,但本质上它所研究的是分类型自变量对数值型因变量的影响,例如,变量之间有没有关系、关系的强度如何等。
2.要检验多个总体均值是否相等时,为什么不作两两比较,而用方差分析方法?答:方差分析不仅可以提高检验的效率,同时由于它是将所有的样本信息结合在一起,也增加了分析的可靠性。
检验多个总体均值是否相等时,如果作两两比较,则需要进行多次的t检验。
随着增加个体显著性检验的次数,偶然因素导致差别的可能性也会增加(并非均值真的存在差别)。
而方差分析方法则是同时考虑所有的样本,因此排除了错误累积的概率,从而避免拒绝一个真实的原假设。
3.方差分析包括哪些类型?它们有何区别?答:(1)根据所分析的分类自变量的多少,方差分析可分为单因素方差分析和双因素方差分析。
(2)区别:①单因素方差分析研究的是一个分类型自变量对一个数值型因变量的影响;②双因素方差分析研究的是两个分类变量对数值型因变量的影响。
4.方差分析中有哪些基本假定?答:方差分析中有三个基本假定:(1)每个总体都应服从正态分布。
也就是说,对于因素的每一个水平,其观测值是来自正态分布总体的简单随机样本。
(2)各个总体的方差σ2必须相同。
也就是说,对于各组观察数据,是从具有相同方差的正态总体中抽取的。
(3)观测值是独立的。
5.简述方差分析的基本思想。
答:方差分析的基本思想:通过分析研究中不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。
6.解释因子和处理的含义。
答:在方差分析中,所要检验的对象称为因素或因子;因素的不同表现称为水平或处理。
例如:要分析行业(零售业、旅游业、航空公司、家电制造业)对投诉次数是否有显著影响,则这里的“行业”是要检验的对象,称其为“因素”或“因子”;零售业、旅游业、航空公司、家电制造业是“行业”这一因素的不同表现,称其为“水平”或“处理”。
第8章假设检验一、单项选择题1.理论预期实验处理能提高某种实验的成绩。
一位研究者对某一研究样本进行了该种实验处理,结果未发现处理显著的改变实验结果,下列哪一种说法是正确的?()A.本次实验中发生了Ⅰ型错误B.本次实验中发生了Ⅱ型错误C.需要多次重复实验,严格设定统计决策的标准,以减少Ⅰ型错误发生的机会D.需要改进实验设计,提高统计效力,以减少Ⅱ型错误发生的机会【答案】D【解析】总体的真实情况往往是未知的,根据样本推断总体,有可能犯两类错误:①虚无假设H0本来是正确的,但拒绝了H0,这类错误称为弃真错误,即Ⅰ型错误,这类错误的概率以α表示;②虚无假设H0本来不正确但却接受了H0,这类错误称为取伪错误,即Ⅱ型错误,这类错误的概率以β表示。
本次实验H0的正确性未知,所以只是可能出现Ⅱ型错误。
2.以下关于假设检验的命题,哪一个是正确的?()A.如果H0在α=0.05的单侧检验中被接受,那么H0在α=0.05的双侧检验中一定会被接受B.如果t的观测值大于t的临界值,一定可以拒绝H0C.如果H0在α=0.05的水平上被拒绝,那么H0在α=0.01的水平上一定会被拒绝D.在某一次实验中,如果实验者甲用α=0.05的标准,实验者乙用α=0.01的标准。
实验者甲犯Ⅱ型错误的概率一定会大于实验者乙【答案】A【解析】A项,单侧时H0被接受,说明t的观测值的绝对值小于0.05临界值,那一定也会小于0.025的临界值了,也就是双侧的临界值,因此双侧的时候一定会被接受。
B项,如果t值为负,则小于临界值才能拒绝H0。
C项,在α=0.05的水平上显著的在α=0.01上可能不显著。
D项,因为α+β不一定等于1,β还受其他因素的影响。
3.假设检验中的第二类错误是()。
A.原假设为真而被接受B.原假设为真而被拒绝C.原假设为假而被接受D.原假设为假而被拒绝【答案】C【解析】总体的真实情况往往是未知的,根据样本推断总体,有可能犯两类错误:①虚无假设H0本来是正确的,但拒绝了H0,这类错误称为弃真错误,即Ⅰ型错误,这类错误的概率以α表示;②虚无假设H0本来不正确但却接受了H0,这类错误称为取伪错误,即Ⅱ型错误,这类错误的概率以β表示。
第9章分类数据分析一、思考题1.简述列联表的构造与列联表的分布。
答:列联表是由两个以上的变量进行交叉分类的频数分布表。
列联表的分布可以从两个方面看,一个是观察值的分布,又称为条件分布,每个具体的观察值就是条件频数;一个是期望值的分布。
2.用一张报纸、一份杂志或你周围的例子构造一个列联表,说明这个调查中两个分类变量的关系,并提出进行检验的问题。
答:对三个生产厂甲、乙、丙提供的学习机的A、B、C 三种性能进行质量检验,欲了解生产厂家同学习机性能的质量差异是否有关系。
抽查了450部学习机次品,整理成为如表9-2所示的3×3列联表。
表9-2A B C 总计甲乙丙204015459065357070100200150总计75200175450根据抽查检验的数据表明:次品类型与厂家(即哪一个厂)生产是无关的(即是相互独立的)。
建立假设:H 0:次品类型与厂家生产是独立的,H 1:次品类型与厂家生产不是独立的。
次品类型生产厂可以计算各组的期望值,如表9-3所示(表中括号内的数值为期望值)。
表9-3各组的期望值计算表A B C 总计甲乙丙20(17)40(33)15(25)45(44)90(89)65(67)35(39)70(78)70(58)100200150总计75200175450所以2222(2017)(4033)(7058)9.821173358χ---=+++=…。
而自由度等于(R -1)(C -1)=(3-1)×(3-1)=4,若以0.01的显著性水平进行检验,查χ2分布表得20.01(4)13.277χ=。
由于220.019.821(4)13.277χχ=<=,故接受原假设H 0,即次品类型与厂家生产是独立的。
3.说明计算2χ统计量的步骤。
答:计算2χ统计量的步骤:(1)用观察值o f 减去期望值e f ;(2)将(o f -e f )之差平方;(3)将平方结果2)(e o f f -除以e f ;(4)将步骤(3)的结果加总,即得:22()o e ef f f χ-=∑。
第1章导论一、单项选择题1.在抽样推断中,总体参数是一个()。
[中央财经大学2018研]A.随机变量B.已知的量C.统计量D.确定的量【答案】D【解析】参数是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。
由于总体数据通常是不知道的,所以参数是一个未知的确定的常数。
2.统计年鉴中2016年全国各大城市的人均家庭收入数据属于()。
[中央财经大学2018研]A.定类数据B.定序数据C.截面数据D.时间序列数据【答案】C【解析】按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。
截面数据是在相同或近似相同的时间点上收集的数据,这类数据通常是在不同的空间获得的,用于描述现象在某一时刻的变化情况。
比如,2010年我国各地区的国内生产总值就是截面数据。
时间序列数据是在不同时间收集到的数据,这类数据是按时间顺序收集到的,用于描述现象随时间变化的情况。
比如2010~2012年我国的国内生产总值就是时间序列数据。
3.在教学评估中,某省三所高校的等级分别是优秀、良好、及格,则“等级”是()。
[浙江工商大学2017研]A.品质标志B.数量标志C.标志值D.数量指标【答案】A【解析】“等级”属于顺序数据,只能用文字来描述,因此是品质标志,其标志值为“优秀”“良好”“及格”。
4.下面不属于描述统计问题的是()。
[山东大学2015研]A.根据样本信息对总体进行的推断B.了解数据分布的特征顺序数据C.分析感兴趣的总体特征D.利用图、表或其他数据汇总工具分析数据【答案】A【解析】描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。
BCD三项都是描述统计问题。
A项中根据样本信息对总体进行推断则是推断统计内容。
5.一项民意调查的目的是想确定年轻人愿意与其父母讨论的话题。
调查结果表明:45%的年轻人愿意与其父母讨论家庭财务状况,38%的年轻人愿意与其父母讨论有关教育的话题,15%的年轻人愿意与其父母讨论爱情问题。
第8章假设检验
一、单项选择题
1.在假设检验中,如果我们相信原假设是真的,而犯第Ⅱ类错误又不会造成太大的影响,此时,检验的显著性水平应该取()。
[中央财经大学2015研]
A.大些
B.小些
C.无法确定
D.等于0.05
【答案】B
【解析】由于犯第Ⅰ类错误的概率和犯第Ⅱ类错误的概率是此消彼长的关系,题中我们相信原假设为真,并且第Ⅱ类错误的并不会造成较大影响,因此如果要拒绝原假设应该提高更显著的证据,所以犯第Ⅰ类错误的概率应取小些。
而在假设检验中检验的显著性水平即为犯第Ⅰ类错误的概率,故显著性水平应该取小些。
2.在假设检验中,不拒绝原假设意味着()。
[山东大学2015研]
A.原假设肯定是正确的
B.原假设肯定是错误的
C.没有证据证明原假设是正确的
D.没有证据证明原假设是错误的
【答案】D
【解析】假设检验的目的是寻找足够的证据来拒绝原假设。
不拒绝原假设意味着在统计
意义上没有证据证明原假设是错误的。
3.抽取样本容量为100的随机样本对总体的均值进行检验,检验的假设为H0:μ≤μ0,H1:μ>μ0,显著性水平α=0.05,z c为检验统计量的样本值,那么P值为()。
[对外经济贸易大学2015研]
A.P(z>z c)
B.P(z<z c)
C.P(z>1.96)
D.P(z<-1.96)
【答案】A
【解析】题中,样本量n=100≥30,σ2未知,在给定的显著性水平α下,对于右单侧检验而言,P值为检验统计量的值超过由样本所计算出的检验统计量的数值的概率,即P值=P(z>z c)。
4.对正态总体的数学期望μ进行假设检验,若在显著水平0.05下接受H0:μ=μ0,那么在显著水平0.01下,下列结论正确的是()。
[华中农业大学2015研] A.可能接受假设,也可能拒绝假设
B.拒绝假设
C.接受假设
D.不接受假设,也不拒绝假设
【答案】C
【解析】在显著性水平0.05下接受H0,说明根据样本计算的结果p值大于0.05,所
以同样的样本在显著性水平0.01下,p 值大于0.01,所以接受原假设。
5.甲、乙两人服从标准正态分布的随机数发生器分别产出30个随机数字作为样本,求得本均数12,x x ,样本方差22
12,S S ,则( )[中山大学2014研]
A .12x x =,2212S S =
B .作两样本t 检验,必然接受零假设,得出两总体均值无差别的结论
C .由甲、乙两样本求出的两总体方差比值212
2σσ的95%置信区间,必然包含0
D .分别由甲、乙两样本求出的各自总体均数的95%置信区间,可能没有交集
【答案】D
【解析】A 项,由于样本是随机的,抽出不同的样本得到的均值与方差往往是不同的。
B 项,同样由于样本的随机性,根据样本得到的估计值很可能不同于总体真值,因而两样本的t 检验不一定接受零假设。
C 项,若两总体方差均不为0,则其比值的95%置信区间不可能包含0。
6.一名研究者从甲、乙两地区分别随机抽取了100名成年人,测得他们的平均身高m 1与m 2。
欲检验H 0:μ1=μ2,经检验水平α=0.05的假设检验,得到p 值小于α。
这项结果表明( )[中山大学2014研]
A .如果μ1=μ2,则从抽样中观察到样本均数m 1与m 2这样的差异以及更极端的差异的可能性小于0.05
B .证明了两个地区的身高的总均数μ1与μ2有差异
C .有95%的可能性μ1与μ2有差异
D .有5%的可能性μ1与μ2有差异
【答案】A
【解析】p 值为当原假设为真时所得到的样本观察结果或更极端结果出现的概率。
当给定了显著性水平α,则在双侧检验中,p <α/2拒绝原假设。
A 项,如果μ1=μ2,即原假设为真,则从抽样中观察到样本均数m 1与m 2这样的差异以及更极端的差异的可能性为p ,由题,p 值小于α,因此其可能性小于0.05。
B 项,p 值小于α,但不一定小于α/2,因此不能拒绝原假设,即不能拒绝两个地区的身高的总均数μ1与μ2无差异的假设。
CD 两项,当原假设为真时,以95%的可能性判断H 0为真(即μ1与μ2无差异),以5%的可能性判断H 0不真。
7.在统计假设的显著性检验中,给定了显著性水平α,下列结论正确的是( )[浙江工商大学2014研]
A .拒绝域的确定与显著性水平α有关
B .拒绝域的确定与检验法中所构造的随机变量的分布有关
C .拒绝域的确定与备择假设有关
D .拒绝域选法是唯一的
【答案】A
【解析】在显著性检验中,当给定了显著性水平α,拒绝域也就相应确定了。
如使用正态分布(或分布)对总体均值进行检验时,拒绝域为:(或)。
即拒绝域的确定与显著性水平α有关。
8.在单样本t 检验中,备择假设是总体均值>1000,则这属于( )。
[中央财经大
t /2Z Z α>/2t t α>
学2014研]
A .左侧检验
B .右侧检验
C .双侧检验
D .双尾检验
【答案】B
【解析】A 项,若假设检验的拒绝区域在样本统计量分布的左端,则称这种单侧检验为左侧检验,它适用于担心样本统计量会显著低于假设的总体参数的情况。
B 项,右侧检验的拒绝区域在样本统计量分布的右端,适用于如原假设,而备择假设的情况。
CD 两项,双侧检验或双尾检验,其目的是观察在规定的显著水
平下所抽取的样本统计量是否显著地高于或低于假设的总体参数。
9.两个变量的样本相关系数等于0.3,对相关系数进行双侧检验的P 值等于0.0375,则以下说法正确的是:( )。
[中央财经大学2014研]
A .在5%的显著性水平下可以拒绝总体相关系数为0的零假设
B .在5%的显著性水平下可以拒绝总体相关系数不等于0的零假设
C .在1%的显著性水平下可以拒绝总体相关系数为0的零假设
D .在1%的显著性水平下可以拒绝总体相关系数不等于0的零假设
【答案】A
【解析】P 值是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。
如果P 值很小,说明这种情况发生的概率很小,而如果出现了,根据小概率原理,可以拒绝原假设。
该题中P <5%,则可以在5%的显著性水平下拒绝原假设r =0。
00:H μμ≤10:H μμ>0010:;:H H μμμμ=≠
10.检验一个总体是否服从正态分布,可通过以下哪种检验方法实现?()[华东师范大学2013研]
A.拟合优度检验
B.单位根检验
C.失拟性检验
D.随机游程检验
【答案】A
【解析】利用拟合优度检验可以检验总体是否符合某个指定分布,我们可以利用卡方的拟合优度检验来检验一个总体是否服从正态分布;单位根检验主要是用来判断时间序列是否是平稳的;失拟性检验是为了检验一次回归方程在整个研究范围内的拟合情况;随机游程检验主要是用来判定随机性的检验。
11.某厂生产的化纤纤度服从正态分布,纤维的纤度的标准均值为1.40。
某天测得25 x=,检验与原来设计的标准均值相比是否有所变化,要求的显根纤维的纤度的均值 1.39
著性水平为=0.05,则下列正确的假设形式是()。
α
A.H0:μ=1.40,H1:μ≠1.40
B.H0:μ≤1.40,H1:μ>1.40
C.H0:μ<1.40,H1:μ≥1.40
D.H0:μ≥1.40,H1:μ<1.40
【答案】A
【解析】原假设是指研究者想收集证据予以推翻的假设;备择假设是指研究者想收集证。