统计学第十一章课后习题答案
- 格式:docx
- 大小:156.94 KB
- 文档页数:14
统计学复习笔记第七章 参数估计一、 思考题1. 解释估计量和估计值在参数估计中,用来估计总体参数的统计量称为估计量。
估计量也是随机变量。
如样本均值,样本比例、样本方差等。
根据一个具体的样本计算出来的估计量的数值称为估计值。
2. 简述评价估计量好坏的标准(1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。
(2)有效性:是指估计量的方差尽可能小。
对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。
(3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。
3. 怎样理解置信区间在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。
置信区间的论述是由区间和置信度两部分组成。
有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。
因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。
在公布调查结果时给出被调查人数是负责任的表现。
这样则可以由此推算出置信度(由后面给出的公式),反之亦然。
4. 解释95%的置信区间的含义是什么置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。
也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。
不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。
5. 简述样本量与置信水平、总体方差、估计误差的关系。
1. 估计总体均值时样本量n 为2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为 其中: 2222α2222)(E z n σα=n z E σα2=▪ 与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需要的样本量越大;▪ 与总体方差成正比,总体的差异越大,所要求的样本量也越大;▪ 与与总体方差成正比,样本量与估计误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量越小。
十一章1. 解:回归分析是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。
回归分析按照涉及的变量的多少,分为一元回归和多元回归分析;在线性回归中,按照因变量的多少,可分为简单回归分析和多重回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。
如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。
如果回归分析中包括两个或两个以上的自变量,且自变量之间存在线性相关,则称为多元线性回归分析。
相关分析,相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。
相关分析和回归分析是研究客观现象之间数量联系的重要统计方法。
既可以从描述统计的角度,也可以从推断统计的角度来说明。
所谓相关分析,就是用一个指标来表明现象间相互依存关系的密切程度。
所谓回归分析,就是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系。
它们具有共同的研究对象,在具体应用时,相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。
只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。
由于相关分析不能指出变量间相互关系的具体形式,所以回归分析要对具有相关关系的变量之间的数量联系进行测定,从而为估算和预测提供了一个重要的方法。
在有关管理问题的定量分析中,推断统计加具有更加广泛的应用价值。
需要指出的是,相关分析和回归分析只是定量分析的手段。
通过相关与回归分析,虽然可以从数量上反映现象之间的联系形式及其密切程度,但是现象内在联系的判断和因果关系的确定,必须以有关学科的理论为指导,结合专业知识和实际经验进行分析研究,才能正确解决。
因此,在应用时要把定性分析和定量分析结合起来,在定性分析的基础上开展定量分析。
《统计学》课后题答案第一章导论一、选择题1.C2.A3.C4.C5.C6.B7.A8.D9.C 10.D 11.A 12.C 13.C 14.A 15.B 16.A 17.C 18.B 19.D 20.A 21.D 22. D23.B 24.C 25.A 26.A 27.A 28.B 29.A 30.D 31.C 32.A 33.B第二章数据的收集一、选择题1.A2.B3.A4.D5.B6.C7.D8.D9.D 10.C 11.C 12.A 13.D 14.D 15.C 16.A 17.D 18.C 19.B 20.B 21.A 22.B 23.C 24.A 25.B 26.B 27.A 28.B 29.C 30.C (A)二、判断题1.∨2.∨3.×4. ∨5. ×6. ×7. ∨8. ×9. ×10. ×第三章数据整理与显示一、选择题CABCD CBBAB BACBD DDBC第四章数据分布特征的测度一、选择题1.A2.C3.B4.C5.D6.D7.A8.B9.A 10.B 11.A 12.D 13.C 14.C 15.D 16.A 17.A 18.B 19.A 20.B 21.A 22.A 23.B 24.C 25.C 26.D 27.D 28.A 29.D 30.C 31.C 32.D二、判断题1. ×2. ∨3. ×4. ×5. ×6. ×7. ∨8. ×9. × 10. ∨ 11. ∨ 12. ×四、计算题1. 11399073.8954ki ii kii x fx f=====∑∑甲11.96σ===甲73.89100%100% 6.18%11.96x σν=⨯=⨯=甲73.8100%100%7.43%9.93x σν=⨯=⨯=乙甲的代表性强2. 10.2510.966ki ii kii x fx f====∑∑0.250.056σ==0.250.056100%100% 5.834%0.966xσν=⨯=⨯= 1114.534ki ii kii x fx f====∑∑10.1295σ==10.1295100%100% 2.857%4.534xσν=⨯=⨯=该教练的说法不成立。
各章思考与练习参考答案第一章导论(一)单项选择题1.D 2.C 3.B 4.D 5.D 6.D 7.B 8.A 9.B 10.A (二)多项选择题:1.ABCD 2.CD 3.AD 4.BCDE 5.ABDE(三)判断题:1.×2.×3.×4.√5.×(四)简答题:答案略(五)综合题答案略第二章统计调查(一)单项选择题:1.C 2.C 3.B 4.C 5.C 6.A 7.B 8.C 9.C 10.B (二)多项选择题:1.ACD 2.ABC 3.ABCD 4.ABC 5.ACD6.ABCD 7.ABDE 8.BCE 9.ABE 10.CD(三)判断题:1.×2.×3.×4.√5.×(四)名词解释:答案略㈤(五)简答题:答案略第三章统计整理(一)单项选择题:1.C 2.B 3.C 4.B 5.B 6.A 7.B 8.C 9.B 10.B (二)多项选择题:1.AB 2.BD 3.ACD 4.AD 5.BCD6.BD 7.ABC 8.AC 9.ABC 10.CD(三)判断题:1.×2.√3.×4.×5.×(四)名词解释:答案略(五)简答题:答案略(六)计算题:1.解:2可见,组距1000元的分布数列,更为合理。
(2)对选中的分布数列,计算频率、较小制累计次数、较大制累计次数、组中值:(3)略第四章总量指标与相对指标(一)单项选择题:1.C 2.B 3.A 4.B 5.C 6.B 7.B 8.C 9.B 10.D(二)多项选择题:1.ABCD 2.CE 3.ABCDE 4.BCE 5.ABCD(三)判断题:1.X 2.X 3.X 4.√5.X(四)名词解释:答案略(五)简答题:答案略(六)计算题:1.解:该企业集团实现利润比去年增长百分比 =110%/(1+7%)-1=2.80%2.解:(1)2011年的进出口贸易差额=12178-9559=2619(亿元)(顺差)2011年进出口总额的发展速度=21737/17607×100%=123.46%(2)2011年进出口额比例相对数=9559/12178×100%=78.49%2011年出口额结构相对数=12178/21737×100%=56.02%(3)该地区进出口贸易发展速度较快,出现贸易顺差。
十一章1. 解:回归分析是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。
回归分析按照涉及的变量的多少,分为一元回归和多元回归分析;在线性回归中,按照因变量的多少,可分为简单回归分析和多重回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。
如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。
如果回归分析中包括两个或两个以上的自变量,且自变量之间存在线性相关,则称为多元线性回归分析。
相关分析,相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。
相关分析和回归分析是研究客观现象之间数量联系的重要统计方法。
既可以从描述统计的角度,也可以从推断统计的角度来说明。
所谓相关分析,就是用一个指标来表明现象间相互依存关系的密切程度。
所谓回归分析,就是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系。
它们具有共同的研究对象,在具体应用时,相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。
只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。
由于相关分析不能指出变量间相互关系的具体形式,所以回归分析要对具有相关关系的变量之间的数量联系进行测定,从而为估算和预测提供了一个重要的方法。
在有关管理问题的定量分析中,推断统计加具有更加广泛的应用价值。
需要指出的是,相关分析和回归分析只是定量分析的手段。
通过相关与回归分析,虽然可以从数量上反映现象之间的联系形式及其密切程度,但是现象内在联系的判断和因果关系的确定,必须以有关学科的理论为指导,结合专业知识和实际经验进行分析研究,才能正确解决。
因此,在应用时要把定性分析和定量分析结合起来,在定性分析的基础上开展定量分析。
第一章统计学及基本概念 3第二章数据的收集与整理10第三章统计表与统计图19第四章数据的描述性分析25第五章参数估计37第六章假设检验49第七章方差分析62第八章非参数检验70第九章相关与回归分析78第十章多元统计分析89第十一章时间序列分析101第十二章指数108第十二章指数108第十三章统计决策120第十四章统计质量管理128第一章统计学及基本概念统计的涵义(统计工作、统计资料和统计学)统计学的内容(统计学分类:理论统计学和应用统计学;描述统计学与推断统计学)统计学的发展史(学派与主要代表人物)数据类型(定类、定序、定距和定比;时间序列、截面数据和面板数据;绝对数、相对数、平均数)变量:连续与离散;确定与随机总体、样本与个体标志、指标及指标体系统计计算工具习题一、单项选择题1. 推断统计学研究()。
(知识点:答案:D)A.统计数据收集的方法B.数据加工处理的方法C.统计数据显示的方法D.如何根据样本数据去推断总体数量特征的方法2. 在统计史上被认为有统计学之名而无统计学之实的学派是()。
(知识点:答案:D)A.数理统计学派B.政治算术学派C.社会统计学派D.国势学派3. 下列数据中哪个是定比尺度衡量的数据()。
(知识点:答案:B)A.性别B.年龄C.籍贯D.民族4. 统计对现象总体数量特征的认识是()。
(知识点:答案:C)A.从定性到定量B.从定量到定性C.从个体到总体D.从总体到个体5. 调查10个企业职工的工资水平情况,则统计总体是()。
(知识点:答案:C)个企业个企业职工的全部工资个企业的全部职工个企业每个职工的工资6. 从统计总体中抽取出来作为代表这一总体的、由部分个体组成的集合体是().(知识点:答案:A)A. 样本B. 总体单位C. 个体D. 全及总体7. 三名学生期末统计学考试成绩分别为80分、85分和92分,这三个数字是()。
(知识点:答案:D)A. 指标B. 标志C. 变量D. 标志值8. 以一、二、三等品来衡量产品质地的优劣,那么该产品等级是()。
第十一章一元线性回归练习题答案二.填空题 1. 不能;因为该相关系数为样本计算出的相关系数,它的大小受样本数据波动的影响,它是否显著尚需检验;t 检验;2.图1;不能;因为图1反映的是线性相关关系,图2反映的是非线性性相关关系,相关系数只能反映线性相关变量间的相关性的强弱,不能反映非线性相关性的强弱。
三.计算题1.(1) SSR 的自由度是1,SSE 的自由度是18。
(2)2418/6080220/1/==-=SSE SSR F(3)判定系数%14.57140802===SST SSR R 在y 的总变差中,由57.14%的变差是由于x 的变动说引起的。
(4)7559.05714.02-=-=-=R r相关系数为-0.7559。
(5)线性关系显著和:线性关系不显著和y x y x H 10H :因为414.424=>=αF F,所以拒绝原假设,x 与y 之间的线性关系显著。
2.(1)方差分析表df SS MS F Significance F回归分析 1 425 425 85 0.017 残差 15 75 5 - - 总计16500---(2)判定系数%8585.05004252====SST SSR R表明在维护费用的变差中,有85%的变差可由使用年限来解释。
(3)9220.085.02===R r二者相关系数为0.9220,属于高度相关(4)x y248.1388.6ˆ+= 分布;显著。
的自由度为t n r n r t 2);12||2---=回归系数为1.248,表示每增加一个单位的产量,该行业的生产费用将平均增长1.248个单位。
(5)线性关系显著性检验:线性关系显著:生产费用和产量之间性关系不显著生产费用和产量之间线10:H H因为Significance F=0.017<05.0=α,所以线性关系显著。
(6)348.3120248.1388.6248.1388.6ˆ==⨯++=x y当产量为10时,生产费用为31.348万元。
第十一章非参数检验第一节符号检验符号检验的方法·符号检验的特点和作用第二节配对符号秩检验配对符号秩检验的方法·配对符号秩检验的效力第三节秩和检验秩和检验的方法·秩和检验的近似第四节游程检验游程的概念·游程检验的方法·差符号游程检验第五节累计频数检验累计频数检验的方法·累计频数检验的应用一、填空1.非参数检验,泛指“对分布类型已知的总体进行参数检验”()的所有检验方法。
2.符号检验的零假设就是配对观察结果的差平均起来等于()。
3.理论研究表明,对于配对样本非正态分布的差值d,()是最佳检验。
4.秩和检验检验统计量U是U1和U2中较()的一个。
5.秩尺度之统计量的均值和标准差只取决于()。
6.()常被用作经验分布与理论分布的比较。
7.绝对值相等的值,应将它们的秩()。
8.符号检验,在分布自由检验中称为()。
9.符号检验和配对符号秩检验,都只适用于()样本。
10.数据序列ABBABAAABABBABBAAAAAB的总游程数是()二、单项选择1.下列检验中,不属于非参数统计的方法的是()。
A总体是否服从正态分布 B 总体的方差是否为某一个值C 样本的取得是否具有随机性D 两组随机变量之间是否相互独立2.下列情况中,最适合非参数统计的方法是()。
A反映两个大学新生成绩的差别B 反映两个大学新生家庭人均收入的差别C 反映两个大学三年级学生对就业前景的看法差别D反映两个大学在校生消费水平的差别3.不属于非参数检验的是()。
A符号检验B游程检验C累计频数检验 D F检验4.在累计频数检验中,卡方的自由度为()。
A n1B 2C n2D n1+n25.配对符号秩检验的效力( )。
A 小于符号检验B 大于t 检验C 介于符号检验与t 检验之间D 无法与符号检验及t 检验比较 6.如果我们说非参数检验的效力是80%,下列哪种解释正确。
( )A 如果用参数检验需要100个数据,那么在同等的检验效力下,非参数检验只要80个数据;B 如果用非参数检验需要100个数据,那么在同等的检验效力下,参数检验只要80个数据;C 如果用参数检验需要100个数据,那么在同等的检验效力下,非参数检验只要20个数据;D 如果用非参数检验需要100个数据,那么在同等的检验效力下,参数检验只要20个数据;7.对于秩和检验,U 1、U 2和n 1、 n 2的关系是( )。
11.1
(1)绘制产量与生产费用的散点图,判断二者之间的关系形态。
散点图如下:
从上图,可以看出产量与生产费用的关系为正的线性相关关系。
(2)计算产量与生产费用之间的线性相关系数。
r=0.920232
(3)对相关系数的显著性进行检验(a=0.05),并说明二者之间的关系系数。
假设:H o :ρ=0,H 1:ρ≠0 计算检验的统计量:t=|r|
²=|0.92-232|
²
=7.435
当a=0。
05时,t (12-2)=2.228。
由于检验统计量t=7.435>t =2.228,拒绝原假设。
表明产量与生产费用之间的线性关系显著。
11.2
(1)散点图如下:
(2)r=0.8621,正相关
11.3
ˆβ=10表示当X=0时Y的期望值为10
(1)
ˆβ=-0.5表示X每增加1个单位,Y平均下降0.5个单位。
(2)
1
(3)X=6时,E(Y)=10-0.5x6=7
11.4.
(1)%904
3636
2=+=+==
SSE SSR SSR SST SSR R ,%902=R 表示,在因变量y 取值的变差中,有90%可以由x 与y 之间的线性关系来解释。
(2)5.02
184
2n =--=SSE S e 。
5.0=e S 表示,当用x 来预测y 时,平均的预测
误差为0.5.
11.5
(1)散点图如下:
(2)r=0.9489,因为r>0.8,所以运送时间与运送距离有较强的正线性关系。
(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。
得到的回归方程为x 003585.0118129.0y
ˆ+=,回归系数003585.0ˆ=β表示运送距离每增加1公里,运送时间平均增加0.003585天。
11.6
(1)散点图如下:
从上图可知,人均gdp 和人均消费水平为正相关关系
(2)r=0.998128,具有非常强的正线性关系。
(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。
得到的回归方程为:x y 308683.06928.734ˆ+=。
回归系数308683.0ˆ1=β表示人均GDP 每增加1元,人均消费水平平均增加0.308683元。
(4)判定系数996259.02=R ,表明在人均消费水平的变差中,有99.6259%是由人均GDP 决定的。
(5)首先提出如下假设:00:10≠=ρρ:,H H
由于significant F<05.0=∂,拒绝原假设,表明人均GDP 与人均消费水平之间的线性关系显著。
(6)(元)108.22785000308683.06928.734ˆ5000=⨯+=y
(7)当3035.247,571.2)27(05.02/05.0==-=∂e s t 时,。
置信区间:
4
.2871078.22787
.854750849)42857.122485000(713035.247571.21078.2278)()-(1
y
ˆ2
1
2
202/0±=-+
⨯⨯±=-+±∑=n i i e a x x x x n
s t
即(1990.7,2565.5)。
预测区间为:
8.6971078.22787
.854750849)42857.122485000(7113035.247571.21078.2278)()-(11y
ˆ2
1
2
202/0±=-+
+⨯⨯±=-++±∑=n i i e a x x x x n
s t 即(1580.3,2975.9)。
11.7
(1)散点图如下:
(2)用航班正点率作自变量,顾客投诉次数作因变量,建立估计的回归方程,并解释回归系数的意义。
答
:
得到的回归方程为:x y 7.41892.430ˆ-=。
回归系数7.4-ˆ1=β表示航班正点率每增加1%,顾客投诉次数平均下降4.7次。
(3)回归系数检验的P-value=0.001108<05.0=∂,拒绝原假设,表明回归系数显著。
(4)次)(1892.54807.41892.430ˆ80=⨯-=y
(5)当8822.18,306.2)210(05.02/05.0==-=∂e s t 时,。
置信区间为:
48
.161892.54024
.39786.75-8010188722.18306.21892.54)()-(1
y
ˆ2
1
2
202/0±=+
⨯⨯±=-+±∑=)
(n i i e a x x x x n
s t 即(37.7,70.7) 预测区间:
57
.461892.54024
.39786.75-80101188722.18306.21892.54)()-(1
1y
ˆ2
1
2
202/0±=+
+⨯⨯±=-++±∑=)
(n i i e a x x x x n
s t 即(7.6,100.8)
11.8
解释和分析如图下:
由上表结果可知,出租率和月租金之间的线性回归方程为:x y
2492.03177.49ˆ+=。
回归系数2492.0ˆ1
=β表示:月租金每增加1元,出租率平均增加0.2492%。
%22.632=R ,表明在出租率的变差中被出租率与租金之间的线性关系所解释的
比例为63.22%,回归方程的拟合程度一般。
估计标准误差6858.2e =s 表示,当用月租金来预测出租率时,平均的预测误差为2.6858%,表明预测误差并不大。
由方差分析表可知,significant F=2.79889E-0.5<05.0=∂,表明回归方程的线性关系显著。
回归系数检验的P-value=0.0000<05.0=∂,表明回归系数显著,即月租金是影响出租率的显著性因素。
11.9
(1)完成上面的方差分析表。
答:
变差来源df SS MS F significant
回归 1 1602708.6 1602708.6 399.1 2.17E-09
残差10 40158.07 40158.07 ————
总计11 1642866.67 ——————(2)R2=0.9756,汽车销售量的变差中有97.56%是由于广告费用的变动引起的。
(3)r=0.9877。
(4)回归系数的意义:广告费用每增加一个单位,汽车销量就增加1.42个单位。
(5)回归系数的检验:
p=2.17E—09<α,回归系数不等于0
,显著。
回归直线的检验:
p=2.17E—09<α,回归直线显著
11.11
(1)SSR的自由度为k=1;SSE的自由度为n-k-1=18;
因此:F=1SSRk=60SSEnk14018=27 0.051,18F=4.41
(2)SSRSSRSSE=0.6=0.7746,由于是负相关,因此r=-0.7746(3)拒绝原假设,线性关系显著。
(4)r=1,18F
(5)从F检验看线性关系显著。
11.12
从n=20的样本中得到的有关回归结果是:
要求:
(1)当x=4时,构建y的平均值的95%的置信区间。
当x=4时,Y的平均值的95%的置信区间为:即(15.95,18.05)。
(2)当x=4时,构建y的个别值的95%的预测区间。
预测区间为:即(14.65,19.35)
11.13
建立线性回归模型,当x=40万元时,构建销售收入95%的置信区间。
答
得到的现行方程为:x 23977.152918.46y ˆ+-=,
销售收入95%的置信区间为:
即(441.55,685.04)
04.685)E(y 441.5540≤≤
11.14.残差图如下:
447.2)28(05.0.
299.5634023977.152918.46)(,40x 2/05.0=-=∂=⨯+--==t y E 时,当时
当
回归1的残差图表明,两个变量之间没有线性关系。
回归2的残差图表明,两个变量之间为非线性关系。
11.15(1)用广告费支出作自变量
x ,销售量作因变量y ,建立估计的回归方
程。
估计的回归方程为:x y
547478.13991.29ˆ+=。
(2)检验广告费支出与销售额之间的线性关系是否显著(05.0=∂)。
答:由于significant F=0.020582<05.0=∂,表明广告费支出与销售额之间的线性关系显著。
(3)绘制关于x 的残差图,你觉得关于误差项c 的假定被满足了吗? 答:关于x 的残差图如下:
从残差图可以看出,关于误差项c的假定并不成立。
(4)你是选用这个模型,还是另找一个更好的模型。
答:虽然线性关系通过了显著性检验,但从残差图来看,关于x与y之间存在线性关系的假设仍值得怀疑。
因此可考虑选用非线性模型。
Welcome To Download !!!
欢迎您的下载,资料仅供参考!。