上财出版社统计学第七章课后作业
- 格式:doc
- 大小:271.00 KB
- 文档页数:8
统计学复习笔记第七章 参数估计一、 思考题1. 解释估计量和估计值在参数估计中,用来估计总体参数的统计量称为估计量。
估计量也是随机变量。
如样本均值,样本比例、样本方差等。
根据一个具体的样本计算出来的估计量的数值称为估计值。
2. 简述评价估计量好坏的标准(1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。
(2)有效性:是指估计量的方差尽可能小。
对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。
(3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。
3. 怎样理解置信区间在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。
置信区间的论述是由区间和置信度两部分组成。
有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。
因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。
在公布调查结果时给出被调查人数是负责任的表现。
这样则可以由此推算出置信度(由后面给出的公式),反之亦然。
4. 解释95%的置信区间的含义是什么置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。
也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。
不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。
5. 简述样本量与置信水平、总体方差、估计误差的关系。
1. 估计总体均值时样本量n 为2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为其中: 2222α2222)(E z n σα=n z E σα2=▪ 与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需要的样本量越大;▪ 与总体方差成正比,总体的差异越大,所要求的样本量也越大;▪ 与与总体方差成正比,样本量与估计误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量越小。
统计学习题目录第一章绪论 _________________________________________________ 2第二章数据的收集与整理 _____________________________________ 4第三章统计表与统计图 _______________________________________ 6第四章数据的描述性分析 _____________________________________ 8第五章参数估计 ____________________________________________ 12第六章假设检验 ____________________________________________ 16第七章方差分析 ____________________________________________ 20第八章非参数检验 __________________________________________ 23第九章相关与回归分析 ______________________________________ 26第十章多元统计分析 ________________________________________ 30第十一章时间序列分析 ______________________________________ 34第十二章指数 ______________________________________________ 37第十三章统计决策 __________________________________________ 41第十四章统计质量管理 ______________________________________ 44第一章绪论习题一、单项选择题1. 推断统计学研究(D)。
A.统计数据收集的方法B.数据加工处理的方法C.统计数据显示的方法D.如何根据样本数据去推断总体数量特征的方法2. 在统计史上被认为有统计学之名而无统计学之实的学派是( D )。
第七章 相关和回归一、单项选择题1.相关关系中,用于判断两个变量之间相关关系类型的图形是( )。
(1)直方图 (2)散点图 (3)次数分布多边形图 (4)累计频率曲线图 2.两个相关变量呈反方向变化,则其相关系数r( )。
(1)小于0 (2)大于0 (3)等于0 (4)等于13.在正态分布条件下,以2yx S (提示:yx S 为估计标准误差)为距离作平行于回归直线的两条直线,在这两条平行直线中,包括的观察值的数目大约为全部观察值的( )。
(1)68.27% (2)90.11% (3)95.45% (4)99.73% 4.合理施肥量与农作物亩产量之间的关系是( )。
(1)函数关系 (2)单向因果关系 (3)互为因果关系 (4)严格的依存关系 5.相关关系是指变量之间( )。
(1)严格的关系 (2)不严格的关系(3)任意两个变量之间关系 (4)有内在关系的但不严格的数量依存关系 6.已知变量X 与y 之间的关系,如下图所示:其相关系数计算出来放在四个备选答案之中,它是( )。
(1)0.29 (2)-0.88 (3)1.03 (4)0.997.如果变量z 和变量Y 之间的相关系数为-1,这说明两个变量之间是( )。
(1)低度相关关系 (2)完全相关关系 (3)高度相关关系 (4)完全不相关 8.若已知2()x x -∑是2()y y -∑的2倍,()()x x y y --∑是2()y y -∑的1.2倍,则相关系数r=( )。
(1)21.2 2(3)0.92 (4)0.65 9.当两个相关变量之问只有配合一条回归直线的可能,那么这两个变量之间的关系是( )。
(1)明显因果关系 (2)自身相关关系(3)完全相关关系 (4)不存在明显因果关系而存在相互联系 10.在计算相关系数之前,首先应对两个变量进行( )。
(1)定性分析 (2)定量分析 (3)回归分析 (4)因素分析 11.用来说明因变量估计值代表性高低的分析指标是( )。
第7章 相关与回归分析1、设销售收入x 为自变量,销售成本y 为因变量。
现已根据某百货公司某年12个月的有关资料计算出以下数据(单位:万元):2()425053.73ix x -=∑ 647.88x =2()262855.25iy y -=∑549.8y =()()334229.09iix x y y --=∑(1)拟合简单线性回归方程,并对方程中回归系数的经济意义作出解释。
(2)计算可决系数和回归估计的标准误差。
(3)对回归系数进行显著性水平为5%的显著性检验。
(4)假定下年一月销售收入为800万元,利用拟合的回归方程预测销售成本,并给出置信度为95%的预测区间。
解:(1)定性分析可知,销售收入影响销售成本,以销售收入为自变量,销售成本为因变量拟合线性回归方程i i i y x u αβ=++,采用最小二乘法估计回归参数得:22()()(,)334229.09ˆ0.7863()425053.73ii xix x y y Cov x y x x βσ--===≈-∑∑ˆˆ549.80.7863647.8840.372y x αβ=-=-⨯= 因此,拟合的回归方程为:ˆˆˆ40.3720.7863i i iy x x αβ=+=+ 其中,回归系数β表示自变量每变动一个单位,因变量的平均变量幅度。
在此,表示销售收入每增加1万元,销售成本平均增加0.7863万元。
(2)可决系数22222[()()]334229.090.9998()()425053.73262855.25i i i i x x y y SSR R SST x x y y --===≈-⋅-⨯∑∑∑ (本问接下来的计算不做要求:为计算回归系数的标准误差,根据离差平方和分解,可知:2222222[()()]ˆˆˆˆˆˆ()[()()]()()334229.09262811.68425053.73i i i iiix x y y SSR y y x x x x x x αβαββ--=-=+-+=-=-==∑∑∑∑∑22ˆ()()262855.25262811.6843.57i i SSE SST SSR y y yy =-=---=-=∑∑因此有ˆ()0.0032S β===≈) (3)陈述假设:01:0 :0H H ββ=≠在原假设成立的前提下,构造t 检验统计量245.598t ===在5%的双侧检验显著性水平下,查自由度为10的t 分布表,得临界值0.025(10) 2.228t t =<,因此拒绝原假设。
统计学课后习题答案第七章相关分析与回归分析报告第七章相关分析与回归分析一、单项选择题1.相关分析是研究变量之间的A.数量关系B.变动关系C.因果关系D.相互关系的密切程度2.在相关分析中要求相关的两个变量A.都是随机变量B.自变量是随机变量C.都不是随机变量D.因变量是随机变量3.下列现象之间的关系哪一个属于相关关系?A.播种量与粮食收获量之间关系B.圆半径与圆周长之间关系C.圆半径与圆面积之间关系D.单位产品成本与总成本之间关系4.正相关的特点是A.两个变量之间的变化方向相反B.两个变量一增一减C.两个变量之间的变化方向一致D.两个变量一减一增5.相关关系的主要特点是两个变量之间A.存在着确定的依存关系B.存在着不完全确定的关系C.存在着严重的依存关系D.存在着严格的对应关系6.当自变量变化时, 因变量也相应地随之等量变化,则两个变量之间存在着A.直线相关关系B.负相关关系C.曲线相关关系D.正相关关系7.当变量X值增加时,变量Y值都随之下降,则变量X和Y之间存在着A.正相关关系B.直线相关关系C.负相关关系D.曲线相关关系8.当变量X值增加时,变量Y值都随之增加,则变量X和Y之间存在着A.直线相关关系B.负相关关系C.曲线相关关系D.正相关关系9.判定现象之间相关关系密切程度的最主要方法是A.对现象进行定性分析B.计算相关系数C.编制相关表D.绘制相关图10.相关分析对资料的要求是A.自变量不是随机的,因变量是随机的B.两个变量均不是随机的C.自变量是随机的,因变量不是随机的D.两个变量均为随机的11.相关系数A.既适用于直线相关,又适用于曲线相关B.只适用于直线相关C.既不适用于直线相关,又不适用于曲线相关D.只适用于曲线相关12.两个变量之间的相关关系称为A.单相关B.复相关C.不相关D.负相关13.相关系数的取值围是A.-1≤r≤1B.-1≤r≤0C.0≤r≤1D. r=014.两变量之间相关程度越强,则相关系数A.愈趋近于1B.愈趋近于0C.愈大于1D.愈小于115.两变量之间相关程度越弱,则相关系数A.愈趋近于1B.愈趋近于0C.愈大于1D.愈小于116.相关系数越接近于-1,表明两变量间A.没有相关关系B.有曲线相关关系C.负相关关系越强D.负相关关系越弱17.当相关系数r=0时,A.现象之间完全无关B.相关程度较小B.现象之间完全相关 D.无直线相关关系18.假设产品产量与产品单位成本之间的相关系数为-0.89,则说明这两个变量之间存在A.高度相关B.中度相关C.低度相关D.显著相关19.从变量之间相关的方向看可分为A.正相关与负相关B.直线相关和曲线相关C.单相关与复相关D.完全相关和无相关20.从变量之间相关的表现形式看可分为A.正相关与负相关B.直线相关和曲线相关C.单相关与复相关D.完全相关和无相关21.物价上涨,销售量下降,则物价与销售量之间属于A.无相关B.负相关C.正相关D.无法判断22.配合回归直线最合理的方法是A.随手画线法B.半数平均法C.最小平方法D.指数平滑法23.在回归直线方程y=a+bx中b表示A.当x增加一个单位时,y增加a的数量B.当y增加一个单位时,x增加b的数量C.当x增加一个单位时,y的平均增加量D.当y增加一个单位时, x的平均增加量24.计算估计标准误差的依据是A.因变量的数列B.因变量的总变差C.因变量的回归变差D.因变量的剩余变差25.估计标准误差是反映A.平均数代表性的指标B.相关关系程度的指标C.回归直线的代表性指标D.序时平均数代表性指标26.在回归分析中,要求对应的两个变量A.都是随机变量B.不是对等关系C.是对等关系D.都不是随机变量27.年劳动生产率(千元)和工人工资(元)之间存在回归方程y=10+70x,这意味着年劳动生产率每提高一千元时,工人工资平均A.增加70元B.减少70元C.增加80元D.减少80元28.设某种产品产量为1000件时,其生产成本为30000元,其中固定成本6000元,则总生产成本对产量的一元线性回归方程为:A.y=6+0.24xB.y=6000+24xC.y=24000+6xD.y=24+6000x29.用来反映因变量估计值代表性高低的指标称作A.相关系数B.回归参数C.剩余变差D.估计标准误差二、多项选择题1.下列现象之间属于相关关系的有A.家庭收入与消费支出之间的关系B.农作物收获量与施肥量之间的关系C.圆的面积与圆的半径之间的关系D.身高与体重之间的关系E.年龄与血压之间的关系2.直线相关分析的特点是A.相关系数有正负号B.两个变量是对等关系C.只有一个相关系数D.因变量是随机变量E.两个变量均是随机变量3.从变量之间相互关系的表现形式看,相关关系可分为A.正相关B.负相关C.直线相关D.曲线相关E.单相关和复相关4.如果变量x与y之间没有线性相关关系,则A.相关系数r=0B.相关系数r=1C.估计标准误差等于0D.估计标准误差等于1E.回归系数b=05.设单位产品成本(元)对产量(件)的一元线性回归方程为y=85-5.6x,则A.单位成本与产量之间存在着负相关B.单位成本与产量之间存在着正相关C.产量每增加1千件,单位成本平均增加5.6元D.产量为1千件时,单位成本为79.4元E.产量每增加1千件,单位成本平均减少5.6元6.根据变量之间相关关系的密切程度划分,可分为A.不相关B.完全相关C.不完全相关D.线性相关E.非线性相关7.判断现象之间有无相关关系的方法有A.对现象作定性分析B.编制相关表C.绘制相关图D.计算相关系数E.计算估计标准误差8.当现象之间完全相关的,相关系数为A.0B.-1C.1D.0.5E.-0.59.相关系数r =0说明两个变量之间是A.可能完全不相关B.可能是曲线相关C.肯定不线性相关D.肯定不曲线相关E.高度曲线相关10.下列现象属于正相关的有A.家庭收入愈多,其消费支出也愈多B.流通费用率随商品销售额的增加而减少C.产量随生产用固定资产价值减少而减少D.生产单位产品耗用工时,随劳动生产率的提高而减少E.工人劳动生产率越高,则创造的产值就越多11.直线回归分析的特点有A.存在两个回归方程B.回归系数有正负值C.两个变量不对等关系D.自变量是给定的,因变量是随机的E.利用一个回归方程,两个变量可以相互计算12.直线回归方程中的两个变量A.都是随机变量B.都是给定的变量C.必须确定哪个是自变量,哪个是因变量D.一个是随机变量,另一个是给定变量E.一个是自变量,另一个是因变量13.从现象间相互关系的方向划分,相关关系可以分为A.直线相关B.曲线相关C.正相关D.负相关E.单相关14.估计标准误差是A.说明平均数代表性的指标B.说明回归直线代表性指标C.因变量估计值可靠程度指标D.指标值愈小,表明估计值愈可靠E.指标值愈大,表明估计值愈可靠15.下列公式哪些是计算相关系数的公式16.用最小平方法配合的回归直线,必须满足以下条件A.∑(y-y c )=最小值B.∑(y-y c )=0C.∑(y-y c )2=最小值D.∑(y-y c )2=0E.∑(y-y c )2=最大值17.方程y c =a+bx222222)()(.)()())((...))((.y y n x x n y x xy n r E y y x x y y x x r D L L L r C L L L r B n y y x x r A xx xy xy yy xx xy yx ∑-∑?∑-∑∑?∑-∑=-∑?-∑--∑===--∑=σσA.这是一个直线回归方程B.这是一个以X为自变量的回归方程C.其中a是估计的初始值D.其中b是回归系数E.y c是估计值18.直线回归方程y c=a+bx中的回归系数bA.能表明两变量间的变动程度B.不能表明两变量间的变动程度C.能说明两变量间的变动方向D.其数值大小不受计量单位的影响E. 其数值大小受计量单位的影响19.相关系数与回归系数存在以下关系A.回归系数大于零则相关系数大于零B.回归系数小于零则相关系数小于零C.回归系数等于零则相关系数等于零D.回归系数大于零则相关系数小于零E.回归系数小于零则相关系数大于零20.配合直线回归方程的目的是为了A.确定两个变量之间的变动关系B.用因变量推算自变量C.用自变量推算因变量D.两个变量相互推算E.确定两个变量之间的相关程度21.若两个变量x和y之间的相关系数r=1,则A.观察值和理论值的离差不存在B.y的所有理论值同它的平均值一致C.x和y是函数关系D.x与y不相关E.x与y是完全正相关22.直线相关分析与直线回归分析的区别在于A.相关分析中两个变量都是随机的;而回归分析中自变量是给定的数值,因变量是随机的B.回归分析中两个变量都是随机的;而相关分析中自变量是给定的数值,因变量是随机的C.相关系数有正负号;而回归系数只能取正值D.相关分析中的两个变量是对等关系;而回归分析中的两个变量不是对等关系E.相关分析中根据两个变量只能计算出一个相关系数;而回归分析中根据两个变量只能计算出一个回归系数三、填空题1.研究现象之间相关关系称作相关分析。
上财浙院统计学第七章课后习题P163 课后题五、计算题(注:全部修改如下)1.某地区粮食播种面积共5000亩,按不重复抽样方法随机抽取了100亩进行实测。
调查结果,平均亩产为450公斤,亩产量的标准差为52公斤。
试以95%的置信度估计该地区粮食平均亩产量的区间。
2.电话咨询服务部门在每次通话结束时都要记下通话的时间。
从一个由16个记录组成的简单随机样本得出一次通话的平均时间为1.6分钟。
试求总体平均值的置信度为90%的置信区间。
已知总体服从标准差为0.7分钟的正态分布。
3.为了解某村1 200户农民的年收入状况,抽取一个由80户组成的简单随机样本,得出每户农民年平均收入为3 210元,标准差为205元。
试求该村每户农民年平均收入置信度为95%的置信区间。
4.为了在正常条件下研究一种杂交作物的两种新处理方案,在同一地区随机地抽选八块地,在每块试验地上按两种方案种植作物。
这八块地的单位面积产量分别是:一号方案产量86 87 86 93 84 93 85 79 二号方案产量80 79 68 84 77 82 74 66 假设这两种方案的产量都服从正态分布,且方差相等。
试求这两种方案平均产量之差的置信度为95%的置信区间。
5.某地对上年栽种一批树苗共3000株进行了抽样调查,随机抽查的200株树苗中有170株成活。
试以95.45%的概率估计该批树苗的成活率的置信区间和成活总数的置信区间。
6.为调查某市郊区72 000户农民家庭中拥有彩电的成数,随机抽取了其中的400户,结果有92户有彩电,试求总体成数的置信度为95%的置信区间。
7.一个随机样本由居民区甲400户家庭组成,其中有18%的家庭至少有一个学龄前儿童。
另一个由居民区乙600户家庭组成的随机样本中,有23%的家庭至少有一个学龄前儿童。
试求两个总体成数之差置信度为95%的置信区间。
8.某公司有职工3000人,现从中随机抽取60人调查其工资收入情况,得到有关资料如下:(1)试以0.95的置信度估计该公司工人的月平均工资所在范围;(2)试以0.9545的置信度估计月收入在1000元及以上工人所占比重。
思考题与练习题参考答案【友情提示】请各位同学完成思考题和练习题后再对照参考答案。
回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。
学而不思则罔,如果直接抄答案,对学习无益,危害甚大。
想抄答案者,请三思而后行!第一章绪论思考题参考答案1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。
即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔是危险的。
2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在他的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域是军机的危险区域。
3.能,拯救和发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。
练习题参考答案一、填空题1.调查。
2.探索、调查、发现。
3. 目的。
二、简答题1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。
2.统计学解决实际问题的基本思路,即基本步骤是:①提出与统计有关的实际问题;②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。
不解决问题时,重复第②-⑥步。
3.在结合实质性学科的过程中,统计学是能发现客观世界规律,更好决策,改变世界和培养相应领域领袖的一门学科。
三、案例分析题1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:姓名;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩;指标体系:上学期全班同学学习的科目;统计量:我班部分同学课程的平均成绩;定性数据:姓名;定量数据:课程成绩;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。
第七章 练习题参考答案7.1 (1)已知σ=5,n=40,x =25,α=0.05,z05.0=1.96样本均值的抽样标准差σx=n σ=79.0405= (2)估计误差(也称为边际误差)E=z 2αnσ=1.96*0.79=1.55 7.2(1)已知σ=15,n=49,x =120,α=0.05,z05.0=1.96(2)样本均值的抽样标准差σx=nσ==49152.14 估计误差E=z 2αnσ=1.96*=49154.2 (3)由于总体标准差已知,所以总体均值μ的95%的置信区间为: nx z σα±=120±1.96*2.14=120±4.2,即(115.8,124.2)7.3(1)已知σ=85414,n=100,x =104560,α=0.05,z05.0=1.96由于总体标准差已知,所以总体均值μ的95%的置信区间为: nx z σα±=104560±1.96*=10085414104560±16741.144即(87818.856,121301.144)7.4(1)已知n=100,x =81,s=12, α=0.1,z21.0=1.645由于n=100为大样本,所以总体均值μ的90%的置信区间为:ns x z 2α±=81±1.645*=1001281±1.974,即(79.026,82.974)(2)已知α=0.05,z205.0=1.96由于n=100为大样本,所以总体均值μ的95%的置信区间为:ns x z 2α±=81±1.96*=1001281±2.352,即(78.648,83.352)(3)已知α=0.01,z201.0=2.58由于n=100为大样本,所以总体均值μ的99%的置信区间为:ns x z 2α±=81±2.58*=1001281±3.096,即(77.94,84.096)7.5(1)已知σ=3.5,n=60,x =25,α=0.05,z05.0=1.96由于总体标准差已知,所以总体均值μ的95%的置信区间为: nx z σα±=25±1.96*=60.5325±0.89,即(24.11,25.89)(2)已知n=75,x =119.6,s=23.89, α=0.02,z202.0=2.33由于n=75为大样本,所以总体均值μ的98%的置信区间为:ns x z 2α±=119.6±2.33*=759.823119.6±6.43,即(113.17,126.03)(3)已知x =3.419,s=0.974,n=32,α=0.1,z21.0=1.645由于n=32为大样本,所以总体均值μ的90%的置信区间为:ns x z 2α±=3.419±1.645*=3274.90 3.419±0.283,即(3.136,3.702)7.6(1)已知:总体服从正态分布,σ=500,n=15,x =8900,α=0.05,z205.0=1.96由于总体服从正态分布,所以总体均值μ的95%的置信区间为:nx z σα2±=8900±1.96*=155008900±253.03,即(8646.97,9153.03)(2)已知:总体不服从正态分布,σ=500,n=35,x =8900,α=0.05,z205.0=1.96虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的95%的置信区间为:nx z σα2±=8900±1.96*=355008900±165.65,即(8734.35,9065.65)(3)已知:总体不服从正态分布,σ未知, n=35,x =8900,s=500, α=0.1,z21.0=1.645虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的90%的置信区间为:ns x z 2α±=8900±1.645*=355008900±139.03,即(8760.97,9039.03)(4)已知:总体不服从正态分布,σ未知, n=35,x =8900,s=500, α=0.01,z201.0=2.58虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的99%的置信区间为:ns x z 2α±=8900±2.58*=355008900±218.05,即(8681.95,9118.05)7.7 已知:n=36,当α=0.1,0.05,0.01时,相应的z21.0=1.645,z205.0=1.96,z201.0=2.58根据样本数据计算得:x =3.32,s=1.61由于n=36为大样本,所以平均上网时间的90%置信区间为:ns x z 2α±=3.32±1.645*=361.61 3.32±0.44,即(2.88,3.76)平均上网时间的95%置信区间为:ns x z 2α±=3.32±1.96*=361.61 3.32±0.53,即(2.79,3.85)平均上网时间的99%置信区间为:ns x z 2α±=3.32±2.58*=361.61 3.32±0.69,即(2.63,4.01)7.8 已知:总体服从正态分布,但σ未知,n=8为小样本,α=0.05,)(18t205.0-=2.365 根据样本数据计算得:x =10,s=3.46 总体均值μ的95%的置信区间为:ns x t 2α±=10±2.365*=83.4610±2.89,即(7.11,12.89)7.9 已知:总体服从正态分布,但σ未知,n=16为小样本,α=0.05,)(116t205.0-=2.131 根据样本数据计算得:x =9.375,s=4.113从家里到单位平均距离的95%的置信区间为:ns x t 2α±=9.375±2.131*=144.1139.375±2.191,即(7.18,11.57)7.10 (1)已知:n=36,x =149.5,α=0.05,z205.0=1.96由于n=36为大样本,所以零件平均长度的95%的置信区间为:ns x z 2α±=149.5±1.96*=361.93149.5±0.63,即(148.87,150.13)(2)在上面的估计中,使用了统计中的中心极限定理。
第7章 相关与回归分析二 单项选择题1-5 BCBAC 6-10 CCABA 11-15 BCCAA 16-20 CCBDB 21-25 CBBAA 26_30 BCBBA 31_35 CBABA 36_40 BAAAA三计算分析题7.1(1)散点图如下:从散点图可以看出,销售收入与广告费用之间为正的线性相关关系。
(2)利用Excel 的“CORREL”函数计算的相关系数为947663.0=r 。
(3)首先提出如下假设:0:0=ρH ,0:1≠ρH 。
计算检验的统计量 272.7947663.0128947663.01222=--=--=r n rt 当05.0=α时,9687.2)28(205.0=-t 。
由于检验统计量9687.2272.72=>=αt t ,拒绝原假设。
表明产量与生产费用之间的线性关系显著。
7.2 (1)散点图如下:从散点图可以看出,复习时间与考试分数之间为正的线性相关关系。
(2)利用Excel 的“CORREL”函数计算的相关系数为8621.0=r 。
相关系数8.0>r ,表明复习时间与考试分数之间有较强的正线性相关关系。
7.3 (1)散点图如下:7.3利用Excel 的“CORREL”函数计算的相关系数为9489.0=r 。
由Excel 输出的回归结果如下表:得到的回归方程为:x y 003585.0118129.0ˆ+=回归系数003585.0ˆ1=β表示运送距离每增加1公里,运送时间平均增加0.003585天。
7.4 (1) 散点图如下:Multiple R 0.868643 R Square 0.75454 Adjusted RSquare 0.723858标准误差 18.88722 观测值 10方差分析df SS MS FSignificanceF回归分析 1 8772.584 8772.584 24.59187 0.001108 残差 8 2853.816 356.727 总计 9 11626.4Coefficients 标准误差t Stat P-valueIntercept 430.1892 72.15483 5.962029 0.000337 X Variable 1-4.70062 0.947894 -4.95902 0.001108得到的回归方程为:x y 7.41892.430ˆ-=。
解: (1)已知 6 = 5/= 40,元=25(1)标准误差:A a 15 八… 亍=亍=2.14 4n V49练习题7.1从一个标准差为5的总体中抽出一个样本量为40的样本,样本均值为25。
(1)样本均值的抽样标准差<7了等于多少?(2)在95%的置信水平下,边际误差是多少?样本均值的抽样标准差。
亍=与=京==逅^ 0.79V40 4(2)已知er = 5,〃 = 40,无=25 , (7- = , l-a = 95%4••Z Q/2 = Z° 025 = 1-96边际误差 E = Z a/2-^ = 1.96*—« 1.55 -yjn 47.2某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样木。
(1)假定总体标准差为15元,求样本均值的抽样标准误差;(2)在95%的置信水平下,求边际误差;(3)如果样本均值为120元,求总体均值〃的95%的置信区间。
解.已知.根据查表得%2=1・96(2).已知Za/2=1・96v I )所以边际误差=z ” *刀==1.96*-7= =4.2插 V49q 15(3)置信区问:元土Z.刁==120±^*1.96 = (115.8,124.2)2 V/i 749第7章参数估计假定总体标准差121301.1447.3从一个总体中随机抽取〃 =10。
的随机样本,得到x = 104560 ,b = 85414,构建总体均值#的95%的置信区间。
85414 1.96*^= = 16741.144 V100=104560 -16741.144 = 87818.856f +Z %.云=104560 +16741.144置信区间:(87818.856, 121301.144) 7.4从总体中抽取一个〃 =100的简单随机样本,得到x=81, 5 = 12O(1) 构建〃的90%的置信区间。
(2) 构建"的95%的置信区间。
第七章课后习题(一)思考题略(二)填空题1. 参数估计有两种形式:一是 _ ,二是 _ 。
2. 判别点估计优良性的三个准则是:、和。
3.抽样的允许误差是指与的最大绝对误差范围。
4.对于简单随机重复抽样,若其他条件不变,则当允许误差Δ缩小一半,抽样单位数必须为原来的倍。
若Δ扩大一倍,则抽样单位数为原来的。
5.如果总体平均数落在区间960~1040内的概率是95%,则抽样平均数是,允许误差是,抽样平均误差是。
6.在同样的精度要求下,不放回抽样比放回抽样需要的样本容量。
7.置信区间表达了区间估计的精确性,置信概率表达了区间估计的可靠性它是区间估计的可靠概率;而表达了区间估计的不可靠的概率。
8.影响必要样本容量的因素有总体方差、和可靠程度等。
参考答案:1.点估计;区间估计 2.一致性;无偏性;有效性 3.样本估计值;总体参数4.4;1/4 5. 1000;40; 6. 少 7. 显着性水平 8. 允许误差(三)判断题1.抽样误差是抽样调查中无法避免的误差。
()2. 抽样误差的产生是由于破坏了随机原则所造成的。
()3. 在其他条件不变的情况下,抽样平均误差要减少为原来的1/3,则样本容量必须增大到9倍。
()4. 抽样允许误差就是抽样平均数的标准差。
()参考答案:1.(√) 2. (×) 3. (√ ) 4.(√)(四)单项选择题1. 在其他条件不变的前提下,若要求误差范围缩小1/3,则样本容量A.增加9倍 B.增加8倍 C.为原来的倍 D.增加倍2. 比例和比例方差的关系是()A.比例越接近于0,比例方差越大B.比例越接近于1,比例方差越大C.比例越接近于,比例方差越大D.比例越接近于,比例方差越大3. 对400名大学生抽取19%进行不放回抽样调查,其中优等生比重为20%,概率保证程度为%,则优等生比重的允许误差为()A. 4%B. %C. %D. %4. 区间估计表明的是一个A.绝对可靠的范围B.可能的范围C.绝对不可靠的范围D.不可能的范围5 无偏性是指A.抽样指标的平均数等于被估计的总体指标B.当样本容量n充分大时,样本指标充分靠近总体指标C.随着n的无限增大,样本指标与未知的总体指标之间的离差任意小的可能性趋于实际必然性D.作为估计量的方差比其他估计量的方差小6 样本统计量和总体参数A.前者是一个确定值,后者是随机变量B.前者是随机变量,后者是一个确定值C.两者都是随机变量D.两者都是确定值 7. 若甲估计量的方差小于乙估计量的方差,则称A.甲是无偏估计量B.乙是一致估计量C.乙比甲有效D.甲比乙有效8. 某厂要对某批产品进行抽样调查,已知以往的产品合格率分别为90%,93%,95%,要求误差范围小于5%,可靠性为%,则必要样本容量应为.105 C参考答案: (五)计算题1.某地区粮食播种面积共5000亩,按不重复抽样方法随机抽取了100亩进行实测。
调查结果,平均亩产为450公斤,亩产量的标准差为52公斤。
试以95%的置信度估计该地区粮食平均亩产量的区间。
解“由题意知5000,10030N n ==>,450X =千克,52S =千克,195%α-=, 则100%2%5%nN⨯=<,0.05α=,X 近似服从正态分布,。
因此2450 1.96450101.92439.808X Z α-=-=-=2450 1.96450101.92460.192X Z α+=+=+= 所以该地区粮食平均亩产量的95%的置信区间为[,].2.某地对上年栽种一批树苗共3000株进行了抽样调查,随机抽查的200株树苗中有170株成活。
试以%的概率估计该批树苗的成活率的置信区间和成活总数的置信区间。
解:由题意知1703000,200,0.85,195.45%200S N n P α====-=, 则2000.851705,(1)2000.15305,0.0455S S nP n P α=⨯=>-=⨯=>=,S P 近似服从正态分布,200100% 6.7%5%3000n N ⨯==>。
因此,20.8520.850.050.80S P Z α-=-=-=20.8520.850.050.90S P Z α+=+=+=所以,该树苗的成活率P 的置信水平为%的置信区间为[,],而树苗的成活数NP 总数的置信区间为[30000.80,30000.90]⨯⨯ =[2400,2700].3.某公司有职工3000人,现从中随机抽取60人调查其工资收入情况,得到有关资料如下:(1)试以的置信度估计该公司工人的月平均工资所在范围; (2)试以的置信度估计月收入在1000元及以上工人所占比重。
解;(1)由题意知,3000,6030,10.95N n α==>-=,则60100%2%5%3000n N =⨯=<,0.5α=,X 近似服从正态分布。
又因为,881181623001038.336060i i i ii i ii w x w xXw=======∑∑∑ 166.05S ===21038.33 1.961038.3342.16996.17X Z α-=-=-= 21038.33 1.961038.3342.161080.49X Z α+=+=+= 即该公司职工平均工资的置信水平95%的置信区间为[,]. (2)因为10.9545α-=,0.0455α=,1098740.6360S P ++++==,600.63385S nP =⨯=>,(1)60(10.64)225S n P -=⨯-=>则有0.0455222Z Z α==。
因此,20.6420.509S P Z α-=-=20.6420.758S P Z α+=+= 所以月收入在1000元及以上的工人所占比重置信水平的置信区间为[,].4.对一批产品按不重复抽样方法抽选200件,其中废品8件。
又知道抽样总体是成品总量的1/20,当概率为%时,可否认为这一批成品的废品率低于5%。
解:由题意知,200n =,80.04200S P ==,1100%5%20n N =⨯=,则需要样本比例的标准差进行修正。
因为,85,(1)1925S S nP n P =>-=>,则S P 近似服从正态分布。
又因为,195.45%α-=,则22Z α=,119110.9512020N n n N N -≈-=-==-20.0420.040.0270.013S P Z α-=-=-=20.0420.040.0270.067S P Z α+=+=+= P 的置信水平为%的置信区间为[%,%],这个置信区间内包含5%,这就不能说明,这批成品的废品率低于5%。
须进一步做单侧检验。
5.某企业从长期实践得知,其产品直径X 是一随机变量,服从方差为的正态分布。
从某日产品中随机抽取6个,测得其直径分别为,,,15,,(单位:厘米)。
在的置信度下,试求该产品直径的均值的置信区间。
解,有题意知,X ~2(,)N μσ,20.05σ=,6n = ,10.95α-=则X ~N (u ,),21.96Z α=,61901566ii xX ====∑1(1)215 2.571150.05214.94n X t --=-=-=1(1)215 2.571150.05215.05n X t -+=+=+= 所以该产品平均直径的95%的置信区间为[,].(14.,15.)6.某厂对一批产品的质量进行抽样检验,采用重复抽样抽取样品200只,样本优质品率为85%,试计算当把握程度为95%时优质品率的区间范围。
解,85%,2000.851705,(1)2000.15305S S S P nP n P ==⨯=>-=⨯=>,195%α-= 则S P 近似服从正态分布,21.96Z α=20.85 1.960.850.050.8S P Z α-=-=-=20.85 1.960.850.050.9S P Z α+=+=+= 所以,置信水平为95%的优质品率的置信区间[,]。
% - %7.检验某食品厂本月生产的10 000袋产品的重量,根据上月资料,这种产品每袋重量的标准差为25克。
要求在%的概率保证程度下,平均每袋重量的误差范围不超过5克,应抽查多少袋产品。
解:10000,25,195.45%,5X N σα==-=∆=,则根据公式7-13得:22222222222251000099.5510000225X Z Nn N Z αασσ⨯⨯≥==∆+⨯+⨯ 所以,应该查100袋产品。
8.某企业对一批产品进行质量检验,这批产品的总数为5 000件,过去几次同类调查所得的产品合格率为93%、95%和96%,为了使合格率的允许误差不超过3%,在%的概率下应抽查多少件产品。
解:由题意得,5000N =,199.73%,3%X α-=∆=,当93%P =时保证(1)P P -最大,23Z α=依据公式7-14,22222(1)30.93(10.93)6510.03P Z p p n α-⨯⨯-≥==∆ 所以在的概率下应该抽取651件产品。
9. 设年末某银行抽取100户的资料如下:试以%(t =2)的概率,估计以下指标的范围: (1) 该储蓄所存款户平均每户的存款余额;(2)该所储蓄存款余额在30 000元以上的户数占全部存款户数的比重。
解515135200352100i ii ii w xX w=====∑∑ (1)(,) (2)(%,%)10. 某市人口普查显示,该市老年人口老龄化(65岁以上)比率为%。
随机调查了400名当地市民,发现有57人年龄在65岁以上。
那么调查结果是否支持该市老龄化率为%的看法(α=) 解1:P 0=%,n=400,P s =57/400=,nP s =57>5,n (1-P s )=400×)343>5,则S P 近似服从正态分布。
又因为,α=,=,20.6420.509S P Z α-=-==(×())^%在(,)的范围内,所以,支持该市老龄化率为%的看法。
解2:Ho :P=;H 1:P=/ 检验统计量Z=<=所以接受原假设,即支持该市老龄化率为%的看法。
解3:调查结果是否支持该市老龄化率大于%的看法(α=) Ho :P<=;H 1:P> 检验统计量Z=<=所以接受原假设,即不支持该市老龄化率大于%的看法。