统计学第十一章课后习题答案
- 格式:docx
- 大小:156.94 KB
- 文档页数:14
统计学复习笔记第七章 参数估计一、 思考题1. 解释估计量和估计值在参数估计中,用来估计总体参数的统计量称为估计量。
估计量也是随机变量。
如样本均值,样本比例、样本方差等。
根据一个具体的样本计算出来的估计量的数值称为估计值。
2. 简述评价估计量好坏的标准(1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。
(2)有效性:是指估计量的方差尽可能小。
对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。
(3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。
3. 怎样理解置信区间在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。
置信区间的论述是由区间和置信度两部分组成。
有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。
因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。
在公布调查结果时给出被调查人数是负责任的表现。
这样则可以由此推算出置信度(由后面给出的公式),反之亦然。
4. 解释95%的置信区间的含义是什么置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。
也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。
不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。
5. 简述样本量与置信水平、总体方差、估计误差的关系。
1. 估计总体均值时样本量n 为2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为 其中: 2222α2222)(E z n σα=n z E σα2=▪ 与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需要的样本量越大;▪ 与总体方差成正比,总体的差异越大,所要求的样本量也越大;▪ 与与总体方差成正比,样本量与估计误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量越小。
十一章1. 解:回归分析是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。
回归分析按照涉及的变量的多少,分为一元回归和多元回归分析;在线性回归中,按照因变量的多少,可分为简单回归分析和多重回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。
如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。
如果回归分析中包括两个或两个以上的自变量,且自变量之间存在线性相关,则称为多元线性回归分析。
相关分析,相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。
相关分析和回归分析是研究客观现象之间数量联系的重要统计方法。
既可以从描述统计的角度,也可以从推断统计的角度来说明。
所谓相关分析,就是用一个指标来表明现象间相互依存关系的密切程度。
所谓回归分析,就是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系。
它们具有共同的研究对象,在具体应用时,相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。
只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。
由于相关分析不能指出变量间相互关系的具体形式,所以回归分析要对具有相关关系的变量之间的数量联系进行测定,从而为估算和预测提供了一个重要的方法。
在有关管理问题的定量分析中,推断统计加具有更加广泛的应用价值。
需要指出的是,相关分析和回归分析只是定量分析的手段。
通过相关与回归分析,虽然可以从数量上反映现象之间的联系形式及其密切程度,但是现象内在联系的判断和因果关系的确定,必须以有关学科的理论为指导,结合专业知识和实际经验进行分析研究,才能正确解决。
因此,在应用时要把定性分析和定量分析结合起来,在定性分析的基础上开展定量分析。
《统计学》课后题答案第一章导论一、选择题1.C2.A3.C4.C5.C6.B7.A8.D9.C 10.D 11.A 12.C 13.C 14.A 15.B 16.A 17.C 18.B 19.D 20.A 21.D 22. D23.B 24.C 25.A 26.A 27.A 28.B 29.A 30.D 31.C 32.A 33.B第二章数据的收集一、选择题1.A2.B3.A4.D5.B6.C7.D8.D9.D 10.C 11.C 12.A 13.D 14.D 15.C 16.A 17.D 18.C 19.B 20.B 21.A 22.B 23.C 24.A 25.B 26.B 27.A 28.B 29.C 30.C (A)二、判断题1.∨2.∨3.×4. ∨5. ×6. ×7. ∨8. ×9. ×10. ×第三章数据整理与显示一、选择题CABCD CBBAB BACBD DDBC第四章数据分布特征的测度一、选择题1.A2.C3.B4.C5.D6.D7.A8.B9.A 10.B 11.A 12.D 13.C 14.C 15.D 16.A 17.A 18.B 19.A 20.B 21.A 22.A 23.B 24.C 25.C 26.D 27.D 28.A 29.D 30.C 31.C 32.D二、判断题1. ×2. ∨3. ×4. ×5. ×6. ×7. ∨8. ×9. × 10. ∨ 11. ∨ 12. ×四、计算题1. 11399073.8954ki ii kii x fx f=====∑∑甲11.96σ===甲73.89100%100% 6.18%11.96x σν=⨯=⨯=甲73.8100%100%7.43%9.93x σν=⨯=⨯=乙甲的代表性强2. 10.2510.966ki ii kii x fx f====∑∑0.250.056σ==0.250.056100%100% 5.834%0.966xσν=⨯=⨯= 1114.534ki ii kii x fx f====∑∑10.1295σ==10.1295100%100% 2.857%4.534xσν=⨯=⨯=该教练的说法不成立。
各章思考与练习参考答案第一章导论(一)单项选择题1.D 2.C 3.B 4.D 5.D 6.D 7.B 8.A 9.B 10.A (二)多项选择题:1.ABCD 2.CD 3.AD 4.BCDE 5.ABDE(三)判断题:1.×2.×3.×4.√5.×(四)简答题:答案略(五)综合题答案略第二章统计调查(一)单项选择题:1.C 2.C 3.B 4.C 5.C 6.A 7.B 8.C 9.C 10.B (二)多项选择题:1.ACD 2.ABC 3.ABCD 4.ABC 5.ACD6.ABCD 7.ABDE 8.BCE 9.ABE 10.CD(三)判断题:1.×2.×3.×4.√5.×(四)名词解释:答案略㈤(五)简答题:答案略第三章统计整理(一)单项选择题:1.C 2.B 3.C 4.B 5.B 6.A 7.B 8.C 9.B 10.B (二)多项选择题:1.AB 2.BD 3.ACD 4.AD 5.BCD6.BD 7.ABC 8.AC 9.ABC 10.CD(三)判断题:1.×2.√3.×4.×5.×(四)名词解释:答案略(五)简答题:答案略(六)计算题:1.解:2可见,组距1000元的分布数列,更为合理。
(2)对选中的分布数列,计算频率、较小制累计次数、较大制累计次数、组中值:(3)略第四章总量指标与相对指标(一)单项选择题:1.C 2.B 3.A 4.B 5.C 6.B 7.B 8.C 9.B 10.D(二)多项选择题:1.ABCD 2.CE 3.ABCDE 4.BCE 5.ABCD(三)判断题:1.X 2.X 3.X 4.√5.X(四)名词解释:答案略(五)简答题:答案略(六)计算题:1.解:该企业集团实现利润比去年增长百分比 =110%/(1+7%)-1=2.80%2.解:(1)2011年的进出口贸易差额=12178-9559=2619(亿元)(顺差)2011年进出口总额的发展速度=21737/17607×100%=123.46%(2)2011年进出口额比例相对数=9559/12178×100%=78.49%2011年出口额结构相对数=12178/21737×100%=56.02%(3)该地区进出口贸易发展速度较快,出现贸易顺差。
十一章1. 解:回归分析是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。
回归分析按照涉及的变量的多少,分为一元回归和多元回归分析;在线性回归中,按照因变量的多少,可分为简单回归分析和多重回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。
如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。
如果回归分析中包括两个或两个以上的自变量,且自变量之间存在线性相关,则称为多元线性回归分析。
相关分析,相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。
相关分析和回归分析是研究客观现象之间数量联系的重要统计方法。
既可以从描述统计的角度,也可以从推断统计的角度来说明。
所谓相关分析,就是用一个指标来表明现象间相互依存关系的密切程度。
所谓回归分析,就是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系。
它们具有共同的研究对象,在具体应用时,相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。
只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。
由于相关分析不能指出变量间相互关系的具体形式,所以回归分析要对具有相关关系的变量之间的数量联系进行测定,从而为估算和预测提供了一个重要的方法。
在有关管理问题的定量分析中,推断统计加具有更加广泛的应用价值。
需要指出的是,相关分析和回归分析只是定量分析的手段。
通过相关与回归分析,虽然可以从数量上反映现象之间的联系形式及其密切程度,但是现象内在联系的判断和因果关系的确定,必须以有关学科的理论为指导,结合专业知识和实际经验进行分析研究,才能正确解决。
因此,在应用时要把定性分析和定量分析结合起来,在定性分析的基础上开展定量分析。
第一章统计学及基本概念 3第二章数据的收集与整理10第三章统计表与统计图19第四章数据的描述性分析25第五章参数估计37第六章假设检验49第七章方差分析62第八章非参数检验70第九章相关与回归分析78第十章多元统计分析89第十一章时间序列分析101第十二章指数108第十二章指数108第十三章统计决策120第十四章统计质量管理128第一章统计学及基本概念统计的涵义(统计工作、统计资料和统计学)统计学的内容(统计学分类:理论统计学和应用统计学;描述统计学与推断统计学)统计学的发展史(学派与主要代表人物)数据类型(定类、定序、定距和定比;时间序列、截面数据和面板数据;绝对数、相对数、平均数)变量:连续与离散;确定与随机总体、样本与个体标志、指标及指标体系统计计算工具习题一、单项选择题1. 推断统计学研究()。
(知识点:答案:D)A.统计数据收集的方法B.数据加工处理的方法C.统计数据显示的方法D.如何根据样本数据去推断总体数量特征的方法2. 在统计史上被认为有统计学之名而无统计学之实的学派是()。
(知识点:答案:D)A.数理统计学派B.政治算术学派C.社会统计学派D.国势学派3. 下列数据中哪个是定比尺度衡量的数据()。
(知识点:答案:B)A.性别B.年龄C.籍贯D.民族4. 统计对现象总体数量特征的认识是()。
(知识点:答案:C)A.从定性到定量B.从定量到定性C.从个体到总体D.从总体到个体5. 调查10个企业职工的工资水平情况,则统计总体是()。
(知识点:答案:C)个企业个企业职工的全部工资个企业的全部职工个企业每个职工的工资6. 从统计总体中抽取出来作为代表这一总体的、由部分个体组成的集合体是().(知识点:答案:A)A. 样本B. 总体单位C. 个体D. 全及总体7. 三名学生期末统计学考试成绩分别为80分、85分和92分,这三个数字是()。
(知识点:答案:D)A. 指标B. 标志C. 变量D. 标志值8. 以一、二、三等品来衡量产品质地的优劣,那么该产品等级是()。
第十一章一元线性回归练习题答案二.填空题 1. 不能;因为该相关系数为样本计算出的相关系数,它的大小受样本数据波动的影响,它是否显著尚需检验;t 检验;2.图1;不能;因为图1反映的是线性相关关系,图2反映的是非线性性相关关系,相关系数只能反映线性相关变量间的相关性的强弱,不能反映非线性相关性的强弱。
三.计算题1.(1) SSR 的自由度是1,SSE 的自由度是18。
(2)2418/6080220/1/==-=SSE SSR F(3)判定系数%14.57140802===SST SSR R 在y 的总变差中,由57.14%的变差是由于x 的变动说引起的。
(4)7559.05714.02-=-=-=R r相关系数为-0.7559。
(5)线性关系显著和:线性关系不显著和y x y x H 10H :因为414.424=>=αF F,所以拒绝原假设,x 与y 之间的线性关系显著。
2.(1)方差分析表df SS MS F Significance F回归分析 1 425 425 85 0.017 残差 15 75 5 - - 总计16500---(2)判定系数%8585.05004252====SST SSR R表明在维护费用的变差中,有85%的变差可由使用年限来解释。
(3)9220.085.02===R r二者相关系数为0.9220,属于高度相关(4)x y248.1388.6ˆ+= 分布;显著。
的自由度为t n r n r t 2);12||2---=回归系数为1.248,表示每增加一个单位的产量,该行业的生产费用将平均增长1.248个单位。
(5)线性关系显著性检验:线性关系显著:生产费用和产量之间性关系不显著生产费用和产量之间线10:H H因为Significance F=0.017<05.0=α,所以线性关系显著。
(6)348.3120248.1388.6248.1388.6ˆ==⨯++=x y当产量为10时,生产费用为31.348万元。
第十一章非参数检验第一节符号检验符号检验的方法·符号检验的特点和作用第二节配对符号秩检验配对符号秩检验的方法·配对符号秩检验的效力第三节秩和检验秩和检验的方法·秩和检验的近似第四节游程检验游程的概念·游程检验的方法·差符号游程检验第五节累计频数检验累计频数检验的方法·累计频数检验的应用一、填空1.非参数检验,泛指“对分布类型已知的总体进行参数检验”()的所有检验方法。
2.符号检验的零假设就是配对观察结果的差平均起来等于()。
3.理论研究表明,对于配对样本非正态分布的差值d,()是最佳检验。
4.秩和检验检验统计量U是U1和U2中较()的一个。
5.秩尺度之统计量的均值和标准差只取决于()。
6.()常被用作经验分布与理论分布的比较。
7.绝对值相等的值,应将它们的秩()。
8.符号检验,在分布自由检验中称为()。
9.符号检验和配对符号秩检验,都只适用于()样本。
10.数据序列ABBABAAABABBABBAAAAAB的总游程数是()二、单项选择1.下列检验中,不属于非参数统计的方法的是()。
A总体是否服从正态分布 B 总体的方差是否为某一个值C 样本的取得是否具有随机性D 两组随机变量之间是否相互独立2.下列情况中,最适合非参数统计的方法是()。
A反映两个大学新生成绩的差别B 反映两个大学新生家庭人均收入的差别C 反映两个大学三年级学生对就业前景的看法差别D反映两个大学在校生消费水平的差别3.不属于非参数检验的是()。
A符号检验B游程检验C累计频数检验 D F检验4.在累计频数检验中,卡方的自由度为()。
A n1B 2C n2D n1+n25.配对符号秩检验的效力( )。
A 小于符号检验B 大于t 检验C 介于符号检验与t 检验之间D 无法与符号检验及t 检验比较 6.如果我们说非参数检验的效力是80%,下列哪种解释正确。
( )A 如果用参数检验需要100个数据,那么在同等的检验效力下,非参数检验只要80个数据;B 如果用非参数检验需要100个数据,那么在同等的检验效力下,参数检验只要80个数据;C 如果用参数检验需要100个数据,那么在同等的检验效力下,非参数检验只要20个数据;D 如果用非参数检验需要100个数据,那么在同等的检验效力下,参数检验只要20个数据;7.对于秩和检验,U 1、U 2和n 1、 n 2的关系是( )。
第11章习题参考答案11.11解:该地区“十五”期间居民年平均存款余额为:注:间隔相等的时点数列序时平均数的计算一般采用“首末折半法”。
11.15解:2000~2005年该企业平均管理人员数占工人数的比重为:(其中:分别代表该企业的第i年的管理人员数和工人数)注:在计算相对指标或平均指标时间序列,一般不能就时间序列中的相对指标或平均指标直接计算,而要分别计算出相对数或平均数分子和分母的平均数,在进行对比。
11.16解:(1)①∵全期的平均增长量∴全期的平均增长量②∵平均发展速度:∴③∵平均增长速度=平均发展速度-100%∴平均增长速度=。
(2)∵逐期增长量;累计增长量;∴社会消费品零售总额逐期增长量和累计增长量计算如下表所示:表1:社会消费品零售总额逐期增长量和累计增长量计算表(单位:亿元)(3)∵定基发展速度,环比发展速度;∴社会消费品零售总额定基发展速度和环比发展速度计算如下表所示:表2:社会消费品零售总额定基发展速度和环比发展速度计算表(4)∵定基增长速度=定基发展速度-100%;环比增长速度=环比发展速度-100%;∴社会消费品零售总额定基增长速度和环比增长速度计算如下表所示:表3:社会消费品零售总额定基增长速度和环比增长速度计算表(5)∵增长1%的绝对量∴社会消费品零售总额增长1%的绝对量的计算如下表所示:11.17解:2009年末的人口数;2010年末的人口数;∴2010年人口数∴2010年的GDP=2010年人口数2010年的人均GDP=2158.2925000=5395.73(亿元)∴2001~2010年GDP的年均增长速度为:∴∴2001~2010年GDP的年均增长速度为9.02%。
注:当后一时间点的数据是由前一时间点的数据逐渐变化的结果时,若我们假设这种变动时均匀变动的,可将量时点的简单平均数作为两个时点之间的代表值。
11.18解:(见Excel表)表5:产量3项移动平均计算表由最小二乘法求解出参数的计算公式为:∴(3)根据趋势方程预测2005年该企业的产品产量为:y=393.17+15.9514=616.42。
第11章一元线性回归一、思考题1.解释相关关系的含义,说明相关关系的特点。
答:变量之间存在的不确定的数量关系,称为相关关系。
相关关系的特点:一个变量的取值不能由另一个变量唯一确定,当变量x取某个值时,变量y的取值可能有几个。
对这种关系不确定的变量是不能用函数关系进行描述的。
2.相关分析主要解决哪些问题?答:相关分析就是对两个变量之间线性关系的描述与度量,它要解决的问题包括:(1)变量之间是否存在关系;(2)如果存在关系,它们之间是什么样的关系;(3)变量之间的关系强度如何;(4)样本所反映的变量之间的关系能否代表总体变量之间的关系。
3.相关分析中有哪些基本假定?答:在进行相关分析时,对总体主要有以下两个假定:(1)两个变量之间是线性关系;(2)两个变量都是随机变量。
4.简述相关系数的性质。
答:相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。
若相关系数是根据总体全部数据计算的,称为总体相关系数,记为ρ;若是根据样本数据计算的,则称为样本相关系数,记为r 。
相关系数的性质:(1)r 的取值范围在-1~+1之间,即-1≤r ≤1。
若0<r ≤1,表明x 与y 之间存在正线性相关关系;若-1≤r <0,表明x 与y 之间存在负线性相关关系;若r =+1,表明x 与y 之间为完全正线性相关关系;若r =-1,表明x 与y 之间为完全负线性相关关系。
可见当|r |=1时,y 的取值完全依赖于x ,二者之间即为函数关系;当r =0时,说明y 的取值与x 无关,即二者之间不存在线性相关关系。
(2)r 具有对称性。
x 与y 之间的相关系数xy r 和y 与x 之间的相关系数yx r 相等,即xy r =yx r 。
(3)r 数值大小与x 和y 的原点及尺度无关。
改变x 和y 的数据原点及计量尺度,并不改变r 数值大小。
(4)r 仅仅是x 与y 之间线性关系的一个度量,它不能用于描述非线性关系。
第十一章统计决策Ⅰ. 学习目的本章对统计决策的基本理论、方法及其应用,作扼要的介绍。
通过学习,要求:1.理解有关统计决策的基本概念与基本步骤,能够运用收益矩阵表与决策树形图表述所要研究的决策问题;2. 了解各种决策准则的特点与适用的场合,能够运用这些准则,进行完全不确定性决策与一般风险型决策;3. 了解贝叶斯决策的基本思想,掌握后验概率的计算方法,并在此基础上进行决策分析。
Ⅱ. 课程内容要点第一节统计决策的基本概念一、什么是统计决策所谓决策,就是在占有一定信息的基础上,利用各种方法,对影响特定目标的各种因素进行计算和分析,从而选择关于未来行动的“最佳方案”或“满意方案”的过程。
狭义的统计决策方法是一种研究非对抗型和非确定型决策问题的科学的定量分析方法。
开展统计决策研究,有助于避免决策的盲目性,提高决策的科学性。
二、统计决策的基本步骤(一)确定决策目标;反映决策目标的变量,称为目标变量。
当决策所145要求达到的目标只有一个时,称为单目标决策。
当决策所要求达到的目标不止一个时,称为多目标决策。
(二)拟定备选方案备选方案是决策者可以调控的因素,备选方案中所调控的变量称为行动变量。
所有备选方案的集合称为行动空间。
(三)列出自然状态所谓自然状态,是指实施行动方案时,可能面临的客观条件和外部环境。
所有可能出现的状态的集合称为状态空间,而相应的各种状态可能出现的概率的集合称为状态空间的概率分布。
(四)测算结果(五)选择“最佳”或“满意”的方案(六)实施方案三、收益矩阵表a1a2…a m第二节完全不确定型决策一、完全不确定型决策的准则(一)最大的最大收益值准则该准则又称乐观准则或“好中求好”准则。
在决策时,先选出各种状态下每个方案的最大收益值,然后再从中选择最大者,并以其相对应的方案作为所要选择的方案。
(二)最大的最小收益值准则146147该准则又称悲观准则或“坏中求好”准则。
在决策时,先选出各种状态下每个方案的最小收益值,然后再从中选择最大者,并以其相对应的方案作为所要选择的方案。
第二章、练习题及解答2.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:700 716 728 719 685 709 691 684 705 718 706 715 712 722 691 708 690 692 707 701 708 729 694 681 695 685 706 661 735 665 668 710 693 697 674 658 698 666 696 698 706 692 691 747 699 682 698 700 710 722 694 690 736 689 696 651 673 749 708 727 688 689 683 685 702 741 698 713 676 702 701 671 718 707 683 717 733 712 683 692 693 697 664 681 721 720 677 679 695 691 713 699 725 726 704 729 703 696 717 688 要求:(2)以组距为10进行等距分组,生成频数分布表,并绘制直方图。
灯泡的使用寿命频数分布表3.某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。
(2)制作茎叶图,并与直方图进行比较。
解:(1)频数分布表(2)茎叶图第三章、练习题及解答1. 已知下表资料:试根据频数和频率资料,分别计算工人平均日产量。
解:根据频数计算工人平均日产量:687034.35200xf x f===∑∑(件) 根据频率计算工人平均日产量:34.35fx xf==∑∑(件)结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。
附录1:各章练习题答案第1章绪论(略)第2章统计数据的描述2.1 (1)属于顺序数据。
(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频率)频率%A1414B2121C3232D1818E1515合计100100(3)条形图(略)2.2 (1)频数分布表如下:(2)某管理局下属40个企分组表按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40 100.0 2.3 频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)25~30 30~35 4610.015.035~40 40~45 45~50 159637.522.515.0合计40 100.0 直方图(略)。
2.4 (1)排序略。
(2)频数分布表如下:100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2660~670 5 5670~680 6 6680~690 14 14690~700 26 26700~710 18 18710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100 直方图(略)。
2.5 (1)属于数值型数据。
(2)分组结果如下:分组天数(天)-25~-20 6-20~-15 8-15~-10 10-10~-5 13-5~0 120~5 45~10 7合计60(3)直方图(略)。
2.6 (1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
(2)A 班考试成绩的分布比较集中,且平均分数较高;B 班考试成绩的分布比A 班分散,且平均成绩较A 班低。
2.82.9 (1)x =274.1(万元);Me=272.5 ;Q L =260.25;Q U =291.25。
(2)17.21=s (万元)。
2.10 (1)甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
11.1
(1)绘制产量与生产费用的散点图,判断二者之间的关系形态。
散点图如下:
从上图,可以看出产量与生产费用的关系为正的线性相关关系。
(2)计算产量与生产费用之间的线性相关系数。
r=0.920232
(3)对相关系数的显著性进行检验(a=0.05),并说明二者之间的关系系数。
假设:H o :ρ=0,H 1:ρ≠0 计算检验的统计量:t=|r|
²=|0.92-232|
²
=7.435
当a=0。
05时,t (12-2)=2.228。
由于检验统计量t=7.435>t =2.228,拒绝原假设。
表明产量与生产费用之间的线性关系显著。
11.2
(1)散点图如下:
(2)r=0.8621,正相关
11.3
ˆβ=10表示当X=0时Y的期望值为10
(1)
ˆβ=-0.5表示X每增加1个单位,Y平均下降0.5个单位。
(2)
1
(3)X=6时,E(Y)=10-0.5x6=7
11.4.
(1)%904
3636
2=+=+==
SSE SSR SSR SST SSR R ,%902=R 表示,在因变量y 取值的变差中,有90%可以由x 与y 之间的线性关系来解释。
(2)5.02
184
2n =--=SSE S e 。
5.0=e S 表示,当用x 来预测y 时,平均的预测
误差为0.5.
11.5
(1)散点图如下:
(2)r=0.9489,因为r>0.8,所以运送时间与运送距离有较强的正线性关系。
(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。
得到的回归方程为x 003585.0118129.0y
ˆ+=,回归系数003585.0ˆ=β表示运送距离每增加1公里,运送时间平均增加0.003585天。
11.6
(1)散点图如下:
从上图可知,人均gdp 和人均消费水平为正相关关系
(2)r=0.998128,具有非常强的正线性关系。
(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。
得到的回归方程为:x y 308683.06928.734ˆ+=。
回归系数308683.0ˆ1=β表示人均GDP 每增加1元,人均消费水平平均增加0.308683元。
(4)判定系数996259.02=R ,表明在人均消费水平的变差中,有99.6259%是由人均GDP 决定的。
(5)首先提出如下假设:00:10≠=ρρ:,H H
由于significant F<05.0=∂,拒绝原假设,表明人均GDP 与人均消费水平之间的线性关系显著。
(6)(元)108.22785000308683.06928.734ˆ5000=⨯+=y
(7)当3035.247,571.2)27(05.02/05.0==-=∂e s t 时,。
置信区间:
4
.2871078.22787
.854750849)42857.122485000(713035.247571.21078.2278)()-(1
y
ˆ2
1
2
202/0±=-+
⨯⨯±=-+±∑=n i i e a x x x x n
s t
即(1990.7,2565.5)。
预测区间为:
8.6971078.22787
.854750849)42857.122485000(7113035.247571.21078.2278)()-(11y
ˆ2
1
2
202/0±=-+
+⨯⨯±=-++±∑=n i i e a x x x x n
s t 即(1580.3,2975.9)。
11.7
(1)散点图如下:
(2)用航班正点率作自变量,顾客投诉次数作因变量,建立估计的回归方程,并解释回归系数的意义。
答
:
得到的回归方程为:x y 7.41892.430ˆ-=。
回归系数7.4-ˆ1=β表示航班正点率每增加1%,顾客投诉次数平均下降4.7次。
(3)回归系数检验的P-value=0.001108<05.0=∂,拒绝原假设,表明回归系数显著。
(4)次)(1892.54807.41892.430ˆ80=⨯-=y
(5)当8822.18,306.2)210(05.02/05.0==-=∂e s t 时,。
置信区间为:
48
.161892.54024
.39786.75-8010188722.18306.21892.54)()-(1
y
ˆ2
1
2
202/0±=+
⨯⨯±=-+±∑=)
(n i i e a x x x x n
s t 即(37.7,70.7) 预测区间:
57
.461892.54024
.39786.75-80101188722.18306.21892.54)()-(1
1y
ˆ2
1
2
202/0±=+
+⨯⨯±=-++±∑=)
(n i i e a x x x x n
s t 即(7.6,100.8)
11.8
解释和分析如图下:
由上表结果可知,出租率和月租金之间的线性回归方程为:x y
2492.03177.49ˆ+=。
回归系数2492.0ˆ1
=β表示:月租金每增加1元,出租率平均增加0.2492%。
%22.632=R ,表明在出租率的变差中被出租率与租金之间的线性关系所解释的
比例为63.22%,回归方程的拟合程度一般。
估计标准误差6858.2e =s 表示,当用月租金来预测出租率时,平均的预测误差为2.6858%,表明预测误差并不大。
由方差分析表可知,significant F=2.79889E-0.5<05.0=∂,表明回归方程的线性关系显著。
回归系数检验的P-value=0.0000<05.0=∂,表明回归系数显著,即月租金是影响出租率的显著性因素。
11.9
(1)完成上面的方差分析表。
答:
变差来源df SS MS F significant
回归 1 1602708.6 1602708.6 399.1 2.17E-09
残差10 40158.07 40158.07 ————
总计11 1642866.67 ——————(2)R2=0.9756,汽车销售量的变差中有97.56%是由于广告费用的变动引起的。
(3)r=0.9877。
(4)回归系数的意义:广告费用每增加一个单位,汽车销量就增加1.42个单位。
(5)回归系数的检验:
p=2.17E—09<α,回归系数不等于0
,显著。
回归直线的检验:
p=2.17E—09<α,回归直线显著
11.11
(1)SSR的自由度为k=1;SSE的自由度为n-k-1=18;
因此:F=1SSRk=60SSEnk14018=27 0.051,18F=4.41
(2)SSRSSRSSE=0.6=0.7746,由于是负相关,因此r=-0.7746(3)拒绝原假设,线性关系显著。
(4)r=1,18F
(5)从F检验看线性关系显著。
11.12
从n=20的样本中得到的有关回归结果是:
要求:
(1)当x=4时,构建y的平均值的95%的置信区间。
当x=4时,Y的平均值的95%的置信区间为:即(15.95,18.05)。
(2)当x=4时,构建y的个别值的95%的预测区间。
预测区间为:即(14.65,19.35)
11.13
建立线性回归模型,当x=40万元时,构建销售收入95%的置信区间。
答
得到的现行方程为:x 23977.152918.46y ˆ+-=,
销售收入95%的置信区间为:
即(441.55,685.04)
04.685)E(y 441.5540≤≤
11.14.残差图如下:
447.2)28(05.0.
299.5634023977.152918.46)(,40x 2/05.0=-=∂=⨯+--==t y E 时,当时
当
回归1的残差图表明,两个变量之间没有线性关系。
回归2的残差图表明,两个变量之间为非线性关系。
11.15(1)用广告费支出作自变量
x ,销售量作因变量y ,建立估计的回归方
程。
估计的回归方程为:x y
547478.13991.29ˆ+=。
(2)检验广告费支出与销售额之间的线性关系是否显著(05.0=∂)。
答:由于significant F=0.020582<05.0=∂,表明广告费支出与销售额之间的线性关系显著。
(3)绘制关于x 的残差图,你觉得关于误差项c 的假定被满足了吗? 答:关于x 的残差图如下:
从残差图可以看出,关于误差项c的假定并不成立。
(4)你是选用这个模型,还是另找一个更好的模型。
答:虽然线性关系通过了显著性检验,但从残差图来看,关于x与y之间存在线性关系的假设仍值得怀疑。
因此可考虑选用非线性模型。
Welcome To Download !!!
欢迎您的下载,资料仅供参考!。