统计学第七章、第八章课后题答案
- 格式:doc
- 大小:308.00 KB
- 文档页数:22
167第八章 对比分析与统计指数思考与练习4. 指出下列哪一个数量加权算术平均数指数,恒等于综合指数形式的拉 氏数量指标指数(C )。
C. d.6. 编制数量指标综合指数所采用的同度量因素是( a ) a .质量指标b .数量指标C •综合指标d •相对指标7. 空间价格指数一般可以采用( C )指数形式来编制。
a .拉氏指数 b.帕氏指数 C.马埃公式d.平均指数二、问答题:1.报告期与基期相比,某城一、选择题:1.某企业计划要求本月每万元产值能源消耗率指标比去年同期下降 实际降低了2.5%,则该项计划的计划完成百分比为( d )。
d. 102.6%5%a. 50.0%b. 97.4%c. 97.6% 2. 下列指标中属于强度相对指标的是(a..产值利润率 C.恩格尔系数3. 编制综合指数时, a .指数化指标 b. b. d.应固定的因素是( b基尼系数 人均消费支出C )。
个体指数c.同度量因素 d.被测定的因素S k q q 。
P 1 」2k q q 1 p 1S k q q o P 0 」 S k q q t p o;b. --------- ; c. -------- ; d. -------- a .S q 。
P 1送 q i P i S q o P o Z q i P o 5.之所以称为同度量因素,是因为:它可使得不同度量单位的现象总体转化为数量上可以加总; 客观上体现它在实际经济现象或过程中的份额 ;是我们所要测定的那个因素; 它必须固定在相同的时期。
(a )。
a .市居民消费价格指数为110%,居民可支配收入增加了20 %,试问居民的实际收入水平提高了多少?解:(1+20% /110%-100%=109.10%-100%=9.10%2.某公司报告期能源消耗总额为28.8万元,与去年同期相比,所耗能源的价格平均上升了20%那么按去年同期的能源价格计算,该公司报告期能源消耗总额应为多少?解:28.8 -(1+20%)=24 万元3.编制综合指数时,同度量因素的选择与指数化指标有什么关系?同度量因素为什么又称为权数?它与平均指数中的权数是否一致?解:(略)4.结构影响指数的数值越小,是否说明总体结构的变动程度越小?一般说来,当总体结构发生什么样的变动时,结构影响指数就会大于1。
统计学课后习题答案第七章相关分析与回归分析第七章相关分析与回归分析⼀、单项选择题1、相关分析就是研究变量之间得A、数量关系B、变动关系C、因果关系D、相互关系得密切程度2、在相关分析中要求相关得两个变量A、都就是随机变量B、⾃变量就是随机变量C、都不就是随机变量D、因变量就是随机变量3、下列现象之间得关系哪⼀个属于相关关系?A、播种量与粮⾷收获量之间关系B、圆半径与圆周长之间关系C、圆半径与圆⾯积之间关系D、单位产品成本与总成本之间关系4、正相关得特点就是A、两个变量之间得变化⽅向相反B、两个变量⼀增⼀减C、两个变量之间得变化⽅向⼀致D、两个变量⼀减⼀增5、相关关系得主要特点就是两个变量之间A、存在着确定得依存关系B、存在着不完全确定得关系C、存在着严重得依存关系D、存在着严格得对应关系6、当⾃变量变化时, 因变量也相应地随之等量变化,则两个变量之间存在着A、直线相关关系B、负相关关系C、曲线相关关系在着A、正相关关系B、直线相关关系C、负相关关系D、曲线相关关系8、当变量X值增加时,变量Y值都随之增加,则变量X与Y之间存在着A、直线相关关系B、负相关关系C、曲线相关关系D、正相关关系9、判定现象之间相关关系密切程度得最主要⽅法就是A.对现象进⾏定性分析 B、计算相关系数C、编制相关表D、绘制相关图10、相关分析对资料得要求就是A.⾃变量不就是随机得,因变量就是随机得B、两个变量均不就是随机得C、⾃变量就是随机得,因变量不就是随机得D、两个变量均为随机得11、相关系数A、既适⽤于直线相关,⼜适⽤于曲线相关B、只适⽤于直线相关C、既不适⽤于直线相关,⼜不适⽤于曲线相关D、只适⽤于曲线相关12、两个变量之间得相关关系称为A、单相关B、复相关C、不相关D、负相关13、相关系数得取值范围就是A、-1≤r≤1B、-1≤r≤0C、0≤r≤114、两变量之间相关程度越强,则相关系数A、愈趋近于1B、愈趋近于0C、愈⼤于1D、愈⼩于115、两变量之间相关程度越弱,则相关系数A、愈趋近于1B、愈趋近于0C、愈⼤于1D、愈⼩于116、相关系数越接近于-1,表明两变量间A、没有相关关系B、有曲线相关关系C、负相关关系越强D、负相关关系越弱17、当相关系数r=0时,A.现象之间完全⽆关 B、相关程度较⼩B.现象之间完全相关 D、⽆直线相关关系18、假设产品产量与产品单位成本之间得相关系数为-0、89,则说明这两个变量之间存在A、⾼度相关B、中度相关C、低度相关D、显著相关19、从变量之间相关得⽅向瞧可分为A、正相关与负相关B、直线相关与曲线相关C、单相关与复相关D、完全相关与⽆相关20、从变量之间相关得表现形式瞧可分为A、正相关与负相关B、直线相关与曲线相关C、单相关与复相关D、完全相关与⽆相关21、物价上涨,销售量下降,则物价与销售量之间属于B、负相关C、正相关D、⽆法判断22、配合回归直线最合理得⽅法就是A、随⼿画线法B、半数平均法C、最⼩平⽅法D、指数平滑法23、在回归直线⽅程y=a+bx中b表⽰A、当x增加⼀个单位时,y增加a得数量B、当y增加⼀个单位时,x增加b得数量C、当x增加⼀个单位时,y得平均增加量D、当y增加⼀个单位时, x得平均增加量24、计算估计标准误差得依据就是A、因变量得数列B、因变量得总变差C、因变量得回归变差D、因变量得剩余变差25、估计标准误差就是反映A、平均数代表性得指标B、相关关系程度得指标C、回归直线得代表性指标D、序时平均数代表性指标26、在回归分析中,要求对应得两个变量A、都就是随机变量B、不就是对等关系C、就是对等关系D、都不就是随机变量27、年劳动⽣产率(千元)与⼯⼈⼯资(元)之间存在回归⽅程y=10+70x,这意味着年劳动⽣产率每提⾼⼀千元时,⼯⼈⼯资平均A、增加70元B、减少70元C、增加80元D、减少80元固定成本6000元,则总⽣产成本对产量得⼀元线性回归⽅程为:A、y=6+0、24xB、y=6000+24xC、y=24000+6xD、y=24+6000x29、⽤来反映因变量估计值代表性⾼低得指标称作A、相关系数B、回归参数C、剩余变差D、估计标准误差⼆、多项选择题1、下列现象之间属于相关关系得有A、家庭收⼊与消费⽀出之间得关系B、农作物收获量与施肥量之间得关系C、圆得⾯积与圆得半径之间得关系D、⾝⾼与体重之间得关系E、年龄与⾎压之间得关系2、直线相关分析得特点就是A、相关系数有正负号B、两个变量就是对等关系C、只有⼀个相关系数D、因变量就是随机变量E、两个变量均就是随机变量3、从变量之间相互关系得表现形式瞧,相关关系可分为A、正相关B、负相关C、直线相关D、曲线相关E、单相关与复相关4、如果变量x与y之间没有线性相关关系,则A、相关系数r=0B、相关系数r=1C、估计标准误差等于0D、估计标准误差等于15、设单位产品成本(元)对产量(件)得⼀元线性回归⽅程为y=85-5、6x,则A.单位成本与产量之间存在着负相关B、单位成本与产量之间存在着正相关C、产量每增加1千件,单位成本平均增加5、6元D、产量为1千件时,单位成本为79、4元E、产量每增加1千件,单位成本平均减少5、6元6、根据变量之间相关关系得密切程度划分,可分为A、不相关B、完全相关C、不完全相关D、线性相关E、⾮线性相关7、判断现象之间有⽆相关关系得⽅法有A、对现象作定性分析B、编制相关表C、绘制相关图D 、计算相关系数E 、计算估计标准误差8、当现象之间完全相关得,相关系数为A 、0B 、-1C 、1D 、0、5E 、-0、59、相关系数r =0说明两个变量之间就是A 、可能完全不相关B 、可能就是曲线相关C 、肯定不线性相关D 、肯定不曲线相关E 、⾼度曲线相关10、下列现象属于正相关得有A.家庭收⼊愈多,其消费⽀出也愈多B 、流通费⽤率随商品销售额得增加⽽减少D 、⽣产单位产品耗⽤⼯时,随劳动⽣产率得提⾼⽽减少E 、⼯⼈劳动⽣产率越⾼,则创造得产值就越多11、直线回归分析得特点有A 、存在两个回归⽅程B 、回归系数有正负值C 、两个变量不对等关系D 、⾃变量就是给定得,因变量就是随机得E 、利⽤⼀个回归⽅程,两个变量可以相互计算12、直线回归⽅程中得两个变量A 、都就是随机变量B 、都就是给定得变量C 、必须确定哪个就是⾃变量,哪个就是因变量D 、⼀个就是随机变量,另⼀个就是给定变量E 、⼀个就是⾃变量,另⼀个就是因变量13、从现象间相互关系得⽅向划分,相关关系可以分为A 、直线相关B 、曲线相关C 、正相关D 、负相关E 、单相关14、估计标准误差就是A.说明平均数代表性得指标B 、说明回归直线代表性指标C 、因变量估计值可靠程度指标D 、指标值愈⼩,表明估计值愈可靠E 、指标值愈⼤,表明估计值愈可靠15、下列公式哪些就是计算相关系数得公式16、⽤最⼩平⽅法配合得回归直线,必须满⾜以下条件A 、∑(y-y c )=最⼩值B 、∑(y-y c )=0C 、∑(y-y c )2=最⼩值D 、∑(y-y c )2=0E 、∑(y-y c )2=最⼤值17、⽅程y c =a+bx)((...))((.y y n x x n y x xy n r E y y x x y y x x r D L L L r C L L L r B n y y x x r A xx xy xy yy xx xy y x ∑-∑?∑-∑∑?∑-∑=-∑?-∑--∑===--∑=σσA.这就是⼀个直线回归⽅程B、这就是⼀个以X为⾃变量得回归⽅程C、其中a就是估计得初始值D、其中b就是回归系数E、y c就是估计值18、直线回归⽅程y c=a+bx中得回归系数bA.能表明两变量间得变动程度B、不能表明两变量间得变动程度C、能说明两变量间得变动⽅向D、其数值⼤⼩不受计量单位得影响E、其数值⼤⼩受计量单位得影响19、相关系数与回归系数存在以下关系A.回归系数⼤于零则相关系数⼤于零B、回归系数⼩于零则相关系数⼩于零C、回归系数等于零则相关系数等于零D、回归系数⼤于零则相关系数⼩于零E、回归系数⼩于零则相关系数⼤于零20、配合直线回归⽅程得⽬得就是为了A.确定两个变量之间得变动关系 B、⽤因变量推算⾃变量C、⽤⾃变量推算因变量D、两个变量相互推算E、确定两个变量之间得相关程度21、若两个变量x与y之间得相关系数r=1,则A.观察值与理论值得离差不存在B、y得所有理论值同它得平均值⼀致C、x与y就是函数关系D、x与y不相关E、x与y就是完全正相关22、直线相关分析与直线回归分析得区别在于A.相关分析中两个变量都就是随机得;⽽回归分析中⾃变量就是给定得数值,因变量就是随机得B.回归分析中两个变量都就是随机得;⽽相关分析中⾃变量就是给定得数值,因变量就是随机得C、相关系数有正负号;⽽回归系数只能取正值E、相关分析中根据两个变量只能计算出⼀个相关系数;⽽回归分析中根据两个变量只能计算出⼀个回归系数三、填空题1、研究现象之间相关关系称作相关分析。
《统计学概论》第八章课后练习答案一、思考题1.什么是相关系数?它与函数关系有什么不同?P237- P2382.什么是正相关、负相关、无线性相关?试举例说明。
P238- P2393.相关系数r的意义是什么?如何根据相关系数来判定变量之间的相关系数?P245 4.简述等级相关系数的含义及其作用?P2505.配合回归直线方程有什么要求?回归方程中参数a、b的经济含义是什么?P2566.回归系数b与相关系数r之间有何关系?P2587.回归分析与相关分析有什么联系与区别?P2548.什么是估计标准误差?这个指标有什么作用?P2619.估计标准误差与相关系数的关系如何?P258-P26410.解释判定系数的意义和作用。
P261二、单项选择题1.从变量之间相互关系的方向来看,相关关系可以分为()。
A.正相关和负相关B.直线关系与曲线关系C.单相关和复相关D.完全相关和不完全相关2.相关分析和回归分析相比较,对变量的要求是不同的。
回归分析中要求()。
A.因变量是随机的,自变量是给定的B.两个变量都是随机的C.两个变量都不是随机的D.以上三个答案都不对3.如果变量x与变量y之间的相关系数为-1,这说明两个变量之间是()。
A.低度相关关系B.完全相关关系C.高度相关关系D.完全不相关4.初学打字时练习的次数越多,出现错误的量就越少,这里“练习次数”与“错误量”之间的相关关系为()。
A.正相关B.高相关C.负相关D.低相关5.假设两变量呈线性关系,且两变量均为顺序变量,那么表现两变量相关关系时应选用()。
A.简单相关系数r B.等级相关系数r sC.回归系数b D.估计标准误差S yx6.变量之间的相关程度越低,则相关系数的数值()。
A.越大B.越接近0C.越接近-1 D.越接近17.下列各组中,两个变量之间的相关程度最高的是()。
A.商品销售额和商品销售量的相关系数是0.9B.商品销售额和商品利润率的相关系数是0.84C.产量与单位成本之间的相关系数为-0.94D.商品销售价格与销售量的相关系数为-0.918.相关系数r的取值范围是()。
第八章一、单项选择题1.时间数列的构成要素是()A.变量和次数 B.时间和指标数值C.时间和次数 D.主词和时间2.编制时间数列的基本原则是保证数列中各个指标值具有()A.可加性 B.连续性C.一致性 D.可比性3.相邻两个累积增长量之差,等于相应时期的()A.累积增长量 B.平均增长量C.逐期增长量 D.年距增长量4.统计工作中,为了消除季节变动的影响可以计算()A.逐期增长量 B.累积增长量C.平均增长量 D.年距增长量5.基期均为前一期水平的发展速度是()A.定基发展速度 B.环比发展速度C.年距发展速度 D.平均发展速度6.某企业2003年产值比1996年增长了1倍,比2001年增长了50%,则2001年比1996年增长了()A.33% B.50%C.75% D.100%7.关于增长速度以下表述正确的有()A.增长速度是增长量与基期水平之比 B.增长速度是发展速度减1C.增长速度有环比和定基之分 D.增长速度只能取正值8.如果时间数列环比发展速度大体相同,可配合()A.直线趋势方程 B.抛物线趋势方程C.指数曲线方程 D.二次曲线方程二、多项选择题1.编制时间数列的原则有()A.时期长短应一致 B.总体范围应该统一C.计算方法应该统一 D.计算价格应该统一E.经济内容应该统一2.发展水平有()A.最初水平 B.最末水平C.中间水平 D.报告期水平E.基期水平3.时间数列水平分析指标有()A.发展速度 B.发展水平C.增长量 D.平均发展水平E.平均增长量4.测定长期趋势的方法有()A.时距扩大法 B.移动平均法C.序时平均法 D.分割平均法E.最小平方法三、填空题1.保证数列中各个指标值的_______是编制时间数列的最主要规则。
2.根据采用的基期不同,增长量可以分为逐期增长量和_______增长量两种。
3.累积增长量等于相应的_______之和。
两个相邻的_______之差,等于相应时期的逐期增长量。
第七章 相关和回归一、单项选择题1.相关关系中,用于判断两个变量之间相关关系类型的图形是( )。
(1)直方图 (2)散点图 (3)次数分布多边形图 (4)累计频率曲线图 2.两个相关变量呈反方向变化,则其相关系数r( )。
(1)小于0 (2)大于0 (3)等于0 (4)等于13.在正态分布条件下,以2yx S (提示:yx S 为估计标准误差)为距离作平行于回归直线的两条直线,在这两条平行直线中,包括的观察值的数目大约为全部观察值的( )。
(1)68.27% (2)90.11% (3)95.45% (4)99.73% 4.合理施肥量与农作物亩产量之间的关系是( )。
(1)函数关系 (2)单向因果关系 (3)互为因果关系 (4)严格的依存关系 5.相关关系是指变量之间( )。
(1)严格的关系 (2)不严格的关系(3)任意两个变量之间关系 (4)有内在关系的但不严格的数量依存关系 6.已知变量X 与y 之间的关系,如下图所示:其相关系数计算出来放在四个备选答案之中,它是( )。
(1)0.29 (2)-0.88 (3)1.03 (4)0.997.如果变量z 和变量Y 之间的相关系数为-1,这说明两个变量之间是( )。
(1)低度相关关系 (2)完全相关关系 (3)高度相关关系 (4)完全不相关 8.若已知2()x x -∑是2()y y -∑的2倍,()()x x y y --∑是2()y y -∑的1.2倍,则相关系数r=( )。
(1)1.2 (3)0.92 (4)0.65 9.当两个相关变量之问只有配合一条回归直线的可能,那么这两个变量之间的关系是( )。
(1)明显因果关系 (2)自身相关关系(3)完全相关关系 (4)不存在明显因果关系而存在相互联系 10.在计算相关系数之前,首先应对两个变量进行( )。
(1)定性分析 (2)定量分析 (3)回归分析 (4)因素分析 11.用来说明因变量估计值代表性高低的分析指标是( )。
《统计学概论》第八章课后练习答案一、思考题1.什么是相关系数它与函数关系有什么不同P237- P2382.什么是正相关、负相关、无线性相关试举例说明。
P238- P2393.相关系数r的意义是什么如何根据相关系数来判定变量之间的相关系数P2454.简述等级相关系数的含义及其作用P2505.配合回归直线方程有什么要求回归方程中参数a、b的经济含义是什么P2566.回归系数b与相关系数r之间有何关系P2587.回归分析与相关分析有什么联系与区别P2548.什么是估计标准误差这个指标有什么作用P261【9.估计标准误差与相关系数的关系如何P258-P26410.解释判定系数的意义和作用。
P261二、单项选择题1.从变量之间相互关系的方向来看,相关关系可以分为()。
A.正相关和负相关B.直线关系与曲线关系C.单相关和复相关D.完全相关和不完全相关2.相关分析和回归分析相比较,对变量的要求是不同的。
回归分析中要求()。
A.因变量是随机的,自变量是给定的B.两个变量都是随机的C.两个变量都不是随机的D.以上三个答案都不对3.如果变量x与变量y之间的相关系数为-1,这说明两个变量之间是()。
'A.低度相关关系B.完全相关关系C.高度相关关系D.完全不相关4.初学打字时练习的次数越多,出现错误的量就越少,这里“练习次数”与“错误量”之间的相关关系为()。
A.正相关B.高相关C.负相关D.低相关5.假设两变量呈线性关系,且两变量均为顺序变量,那么表现两变量相关关系时应选用()。
A.简单相关系数r B.等级相关系数r sC.回归系数b D.估计标准误差S yx6.变量之间的相关程度越低,则相关系数的数值()。
A.越大B.越接近0…C.越接近-1 D.越接近17.下列各组中,两个变量之间的相关程度最高的是()。
A.商品销售额和商品销售量的相关系数是0.9B.商品销售额和商品利润率的相关系数是0.84C.产量与单位成本之间的相关系数为-0.94D.商品销售价格与销售量的相关系数为-0.918.相关系数r的取值范围是()。
第七章 参数估计(1)x σ==(2)2x z α∆==1.96=某快餐店想要估计每位顾客午餐的平均花费金额。
在为期3周的时间里选取49名顾客组成了一个简单随机样本。
(1)假定总体标准差为15元,求样本均值的抽样标准误差。
x σ=== (2)在95%的置信水平下,求估计误差。
x x t σ∆=⋅,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=z α 因此,x x t σ∆=⋅x z ασ=⋅0.025x z σ=⋅=×=(3)如果样本均值为120元,求总体均值 的95%的置信区间。
置信区间为:2x z x z αα⎛-+ ⎝=()120 4.2,120 4.2-+=(,)2x z x z αα⎛-+ ⎝=104560±(,) 从总体中抽取一个n=100的简单随机样本,得到x =81,s=12。
要求:大样本,样本均值服从正态分布:2,x N n σμ⎛⎫ ⎪⎝⎭:或2,s x N n μ⎛⎫⎪⎝⎭:置信区间为:22x z x z αα⎛-+ ⎝, (1)构建μ的90%的置信区间。
2z α=0.05z =,置信区间为:()81 1.645 1.2,81 1.645 1.2-⨯+⨯=(,) (2)构建μ的95%的置信区间。
2z α=0.025z =,置信区间为:()81 1.96 1.2,81 1.96 1.2-⨯+⨯=(,) (3)构建μ的99%的置信区间。
2z α=0.005z =,置信区间为:()81 2.576 1.2,81 2.576 1.2-⨯+⨯=(,)(1)2x z α±=25 1.96±(,) (2)2x z α±=119.6 2.326±=(,) (3)2x z α±=3.419 1.645±(,) (1)2x z α±=8900 1.96±=(,)(2)2x z α±=8900 1.96±=(,) (3)2x z α±=8900 1.645±=(,)(4)2x z α±=8900 2.58±=(,) 某大学为了解学生每天上网的时间,在全校7 500名学生中采取重复抽样方法随机抽取36人,调查解:(1)样本均值x =,样本标准差s=1α-=,t=z α=0.05z =,xz α±=3.32 1.645±(,) 1α-=,t=z α=0.025z =,x z α±=3.32 1.96±(,)1α-=,t=z α=0.005z =,x zα±=3.32 2.76±(,)2x t α±=10 2.365±=,某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离(单位:km)分别是:10 3 14 8 6 9 12 11 7 5 10 15 9 16 13 2假定总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。
第七章参数估计7.1 (1) =0。
7906(2)==1。
54957。
2 某快餐店想要估计每位顾客午餐的平均花费金额。
在为期3周的时间里选取49名顾客组成了一个简单随机样本。
(1)假定总体标准差为15元,求样本均值的抽样标准误差。
=2。
143(2)在95%的置信水平下,求估计误差。
,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=因此,=1.96×2。
143=4。
2(3)如果样本均值为120元,求总体均值的95%的置信区间.置信区间为:==(115.8,124.2)7.3 ==(87818.856,121301。
144)7.4 从总体中抽取一个n=100的简单随机样本,得到=81,s=12。
要求:大样本,样本均值服从正态分布:或置信区间为:,==1。
2(1)构建的90%的置信区间.==1.645,置信区间为:=(79。
03,82.97)(2)构建的95%的置信区间。
==1。
96,置信区间为:=(78。
65,83.35)(3)构建的99%的置信区间.==2.576,置信区间为:=(77。
91,84.09)7.5 (1)==(24.114,25.886)(2)==(113。
184,126.016)(3)==(3.136,3。
702)7。
6 (1)==(8646.965,9153.035)(2)==(8734。
35,9065。
65)(3)==(8761。
395,9038。
605)(4)==(8681。
95,9118.05)7.7 某大学为了解学生每天上网的时间,在全校7 500名学生中采取重复抽样方法随机抽取36人,调解:(1)样本均值=3。
32,样本标准差s=1.61=0。
9,t===1.645,==(2。
88,3。
76)=0。
95,t===1。
96,==(2。
79,3.85)=0.99,t===2.576,==(2。
63,4.01)7。
8 ==(7.104,12.896)7。
9 某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离(单位:km)分别是:10 3 14 8 6 9 12 11 7 5 10 15 9 16 13 2假定总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。
第二章、练习题及解答2.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:700 716 728 719 685 709 691 684 705 718 706 715 712 722 691 708 690 692 707 701 708 729 694 681 695 685 706 661 735 665 668 710 693 697 674 658 698 666 696 698 706 692 691 747 699 682 698 700 710 722 694 690 736 689 696 651 673 749 708 727 688 689 683 685 702 741 698 713 676 702 701 671 718 707 683 717 733 712 683 692 693 697 664 681 721 720 677 679 695 691 713 699 725 726 704 729 703 696 717 688 要求:(2)以组距为10进行等距分组,生成频数分布表,并绘制直方图。
灯泡的使用寿命频数分布表3.某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。
(2)制作茎叶图,并与直方图进行比较。
解:(1)频数分布表(2)茎叶图第三章、练习题及解答1. 已知下表资料:试根据频数和频率资料,分别计算工人平均日产量。
解:根据频数计算工人平均日产量:687034.35200xf x f===∑∑(件) 根据频率计算工人平均日产量:34.35fx xf==∑∑(件)结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。
统计学复习笔记第七章 参数估计一、 思考题1. 解释估计量和估计值在参数估计中,用来估计总体参数的统计量称为估计量。
估计量也是随机变量。
如样本均值,样本比例、样本方差等。
根据一个具体的样本计算出来的估计量的数值称为估计值。
2. 简述评价估计量好坏的标准(1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。
(2)有效性:是指估计量的方差尽可能小。
对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。
(3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。
3. 怎样理解置信区间在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。
置信区间的论述是由区间和置信度两部分组成。
有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。
因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。
在公布调查结果时给出被调查人数是负责任的表现。
这样则可以由此推算出置信度(由后面给出的公式),反之亦然。
4. 解释95%的置信区间的含义是什么置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。
也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。
不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。
5. 简述样本量与置信水平、总体方差、估计误差的关系。
1. 估计总体均值时样本量n 为2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为 其中: 2222α2222)(E z n σα=n z E σα2=▪ 与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需要的样本量越大;▪ 与总体方差成正比,总体的差异越大,所要求的样本量也越大;▪ 与与总体方差成正比,样本量与估计误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量越小。
二、 练习题1. 从一个标准差为5的总体中采用重复抽样方法抽出一个样本量为40的样本,样本均值为25。
1) 样本均值的抽样标准差x xσ等于多少? 2) 在95%的置信水平下,估计误差是多少?解: 1) 已知σ = 5,n = 40, = 25∵ ∴x σx σ= 5 /√40≈ 0.79 2) 已知∵ ∴ 估计误差 E = 1.96×5÷√40≈1.552. 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。
1) 假定总体标准差为15元,求样本均值的抽样标准误差。
2) 在95%的置信水平下,求估计误差。
3) 如果样本均值为120元,求总体均值µ的95%的置信区间。
解:1)已知σ = 15,n = 49∵ x nx n x σσ=α2n z E σα2=n x n x σσ=nx n x σσ=∴x σx σ= 15÷√49 = 2.14 2)已知∵ ∴ 估计误差 E = 1.96×15÷√49 ≈ 4.23)已知 = 120∵ 置信区间为±E ∴ 其置信区间 = 120±4.23. 从一个总体中随机抽取n =100的随机样本,得到=104560,假定总体标准差σ = 85414,试构建总体均值µ的95%的置信区间。
解: 已知n =100, =104560,σ = 85414,1-α=95% ,由于是正态总体,且总体标准差已知。
总体均值μ在1-α置信水平下的置信区间为104560 ±1.96×85414÷√100= 104560 ±16741.1444. 从总体中抽取一个n =100的简单随机样本,得到 =81,s=12。
要求:1) 构建µ的90%的置信区间。
2) 构建µ的95%的置信区间。
3) 构建µ的99%的置信区间。
解:由于是正态总体,但总体标准差未知。
总体均值μ在1-α置信水α2n z E σα2=x x x x 2α()28.109,44.10192.336.105251096.136.1052=±=⨯±=±n z x σαx平下的置信区间公式为81±×12÷√100 = 81±×1.21)1-α=90%, 1.65 其置信区间为 81 ± 1.982)1-α=95% ,其置信区间为 81 ± 2.3523) 1-α=99%, 2.58其置信区间为 81 ± 3.0965. 利用下面的信息,构建总体均值的置信区间。
1) = 25,σ = 3.5,n =60,置信水平为95%2) =119,s =23.89,n =75,置信水平为98%3) =3.149,s =0.974,n =32,置信水平为90%解:∵ ∴ 1) 1-α=95% ,其置信区间为:25±1.96×3.5÷√60= 25±0.8852) 1-α=98% ,则α=0.02, α/2=0.01, 1-α/2=0.99,查标准正态分布表,可知: 2.33其置信区间为: 119±2.33×23.89÷√75= 119±6.345x x x 22未知αα)(22未知或σσααns z x n z x ±±3) 1-α=90%, 1.65其置信区间为:3.149±1.65×0.974÷√32= 3.149±0.2846. 利用下面的信息,构建总体均值µ的置信区间:1) 总体服从正态分布,且已知σ = 500,n = 15,=8900,置信水平为95%。
解: N=15,为小样本正态分布,但σ已知。
则1-α=95%,。
其置信区间公式为 ∴置信区间为:8900±1.96×500÷√15=(8646.7 , 9153.2)2) 总体不服从正态分布,且已知σ = 500,n = 35, =8900,置信水平为95%。
解:为大样本总体非正态分布,但σ已知。
则1-α=95%,。
其置信区间公式为 ∴置信区间为:8900±1.96×500÷√35=(8733.9 9066.1) 3) 总体不服从正态分布,σ未知,n = 35,=8900,s =500,置信水平为90%。
解:为大样本总体非正态分布,且σ未知,1-α=90%,1.65。
其置信区间为:8900±1.65×500÷√35=(8761 9039)4) 总体不服从正态分布,σ未知,n = 35, =8900,s =500,置信水平为99%。
2α()28.109,44.10192.336.105251096.136.1052=±=⨯±=±n z x σαx x 2α()28.109,44.10192.336.105251096.136.1052=±=⨯±=±n z x σαx x解:为大样本总体非正态分布,且σ未知,1- =99%, 2.58。
其置信区间为:8900±2.58×500÷√35=(8681.9 9118.1)7.某大学为了解学生每天上网的时间,在全校7500名学生中采取重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时)(略)。
求该校大学生平均上网时间的置信区间,置信水平分别为90%解:先求样本均值:= 3.32再求样本标准差:置信区间公式:8.从一个正态总体中随机抽取样本量为8的样本,各样本值分别为:10,8,12,15,6,13,5,11。
求总体均值µ的95%置信区间。
解:本题为一个小样本正态分布,σ未知。
先求样本均值:= 80÷8=10再求样本标准差:= √84/7 = 3.4641于是 , 的置信水平为的置信区间是,已知,n = 8,则,α/2=0.025,查自由度为n-1 = 7的分布表得临界值 2.45所以,置信区间为:10±2.45×3.4641÷√79.某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离分别是:10,3,14,8,6,9,12,11,7,5,10,15,9,16,13,2。
假设总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。
解:小样本正态分布,σ未知。
已知,n = 16,,则, α/2=0.025,查自由度为n-1 = 15的分布表得临界值 2.14 样本均值=150/16=9.375再求样本标准差:= √253.75/15 ≈4.11于是 , 的置信水平为的置信区间是,9.375±2.14×4.11÷√1610.从一批零件是随机抽取36个,测得其平均长度是149.5,标准差是1.93。
1)求确定该种零件平均长度的95%的置信区间。
2)在上面估计中,你使用了统计中的哪一个重要定理?请解释。
解:1)这是一个大样本分布。
已知N=36,= 149.5,S =1.93,x1-α=0.95,。
其置信区间为:149.5±1.96×1.93÷√36 2)中心极限定理论证:如果总体变量存在有限的平均数和方差,那么,不论这个总体的分布如何,随着样本容量的增加,样本均值的分布便趋近正态分布。
在现实生活中,一个随机变量服从正态分布未必很多,但是多个随机变量和的分布趋于正态分布则是普遍存在的。
样本均值也是一种随机变量和的分布,因此在样本容量充分大的条件下,样本均值也趋近于正态分布,这为抽样误差的概率估计理论提供了理论基础。
11.某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克,现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量如下:(略)已知食品包重服从正态分布,要求:1)确定该种食品平均重量的95%的置信区间。
2)如果规定食品重量低于100克属于不合格,确定该批食品合格率的95%的置信区间。
解:1)本题为一个大样本正态分布,σ未知。
已知N=50,µ=100,1-α=0.95,。
①每组组中值分别为97、99、101、103、105,即此50包样本平均值= (97+99+101+103+105)/5 = 101②样本标准差为:=√{(97-101)²×2+(99-101)²×3+(101-101)²×34+(103-101)²×7+(105-101)²×4}÷(50-1)≈ 1.666③其置信区间为:101±1.96×1.666÷√502)∵不合格包数(<100克)为2+3=5包,5/50 = 10%(不合格率),即P = 90%。