统计学(第六版)贾俊平 中国人民大学出版社——课后习题答案
- 格式:pdf
- 大小:1.30 MB
- 文档页数:59
统计学课后答案第六章【篇一:统计学第五版课后练答案(4-6章)】txt>4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下: 2 4 7 10 10 10 12 12 14 15 要求:(1)计算汽车销售量的众数、中位数和平均数。
(2)根据定义公式计算四分位数。
(3)计算销售量的标准差。
(4)说明汽车销售量分布的特征。
解:statisticsmean median mode std. deviation percentiles25 50 75 missing10 0 9.60 10.00 10 4.169 6.25 10.00单位:周岁19 15 29 25 24 23 21 38 22 18 30 20 19 19 16 23 27 22 34 24 4120 31 17 23要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄1(2)根据定义公式计算四分位数。
mean=24.00;std. deviation=6.652 (4)计算偏态系数和峰态系数:skewness=1.080;kurtosis=0.773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。
如需看清楚分布形态,需要进行分组。
21、确定组数:lg?2?5?1?1k?1?lg(2)lg2lgn()1.398?5.64k=6 ,取0.30103网络用户的年龄 (binned)分组后的直方图:3客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待。
为比较哪种排队方式使顾客等待的时间更短.两种排队方式各随机抽取9名顾客。
得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟。
第二种排队方式的等待时间(单位:分钟)如下:5.5 6.6 6.7 6.8 7.1 7.3 7.47.8 7.8 要求:(1)画出第二种排队方式等待时间的茎叶图。
8.2 一种元件,要求其使用寿命不得低于700小时。
现从一批这种元件中随机抽取36件,测得其平均寿命为680小时。
已知该元件寿命服从正态分布,σ=60小时,试在显著性水平0.05下确定这批元件是否合格。
解:H 0:μ≥700;H 1:μ<700已知:x =680 σ=60由于n=36>30,大样本,因此检验统计量:x z s n μ-==6807006036-=—2 当α=0.05,查表得z α=1.645。
因为z <-z α,故拒绝原假设,接受备择假设,说明这批产品不合格。
8。
38.4 糖厂用自动打包机打包,每包标准重量是100千克。
每天开工后需要检验一次打包机工作是否正常。
某日开工后测得9包重量(单位:千克)如下:99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5已知包重服从正态分布,试检验该日打包机工作是否正常(a =0.05)?解:H 0:μ=100;H 1:μ≠100经计算得:x =99.9778 S =1.21221检验统计量:x t s n = 1.2122190.055 当α=0.05,自由度n -1=9时,查表得()29t α=2。
262。
因为t <t α,样本统计量落在接受区域,故接受原假设,拒绝备择假设,说明打包机工作正常。
8.5 某种大量生产的袋装食品,按规定不得少于250克.今从一批该食品中任意抽取50袋,发现有6袋低于250克。
若规定不符合标准的比例超过5%就不得出厂,问该批食品能否出厂(a =0.05)?解:解:H 0:π≤0.05;H 1:π>0。
05已知: p =6/50=0.12检验统计量:()0001Z n ππ=-()0.0510.0550⨯-=2。
271当α=0.05,查表得z α=1。
645。
因为z >z α,样本统计量落在拒绝区域,故拒绝原假设,接受备择假设,说明该批食品不能出厂. 8。
68.7 某种电子元件的寿命x (单位:小时)服从正态分布。
第13章时间序列分析和预测13.1 复习笔记一、时间序列及其分解1.时间序列(1)概念:时间序列是同一现象在不同时间上的相继观察值排列而成的序列,也称动态数列或时间数列。
(2)时间序列的两要素任何一个时间序列都具有两个基本要素:一是统计指标所属的时间,也称为时间变量;二是统计指标在特定时间的具体指标值。
(3)研究时间序列的目的①在编制时间序列的基础上,可以计算平均发展水平,进行动态水平分析;②可以计算各种速度指标,进行速度分析;③利用相关的数学模型,对现象的变动进行趋势分析。
2.时间序列的类型(1)平稳序列它是基本上不存在趋势的序列。
这类序列中的各观察值基本上都在某个固定的水平上波动,虽然在不同的时间段波动的程度不同,但并不存在某种规律,其波动可以看成是随机的。
(2)非平稳序列它是包含趋势、季节性或周期性的序列,它可能只含有其中的一种成分,也可能含有几种成分,因此非平稳序列可以分为有趋势的序列、有趋势和季节性的序列、几种成分混合而成的复合型序列。
3.时间序列的4种成分(1)趋势(T)也称长期趋势,它是时间序列在长时期内呈现出来的某种持续上升或持续下降的变动。
时间序列中的趋势可以是线性的,也可以是非线性的。
(2)季节性(S)也称季节变动,它是时间序列在一年内重复出现的周期性波动。
季节性中的“季节”一词是广义的,它不仅仅是指一年中的四季,其实是指任何一种周期性的变化。
(3)周期性(C)也称循环波动,它是时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动。
(4)随机性(I)也称不规则波动,它是时间序列中除去趋势、周期性和季节性之后的偶然性波动。
4.时间序列的分解模型将时间序列分解成长期趋势、季节变动、周期变动和随机变动四个因素后,可以认为时间序列Y t是这四个因素的函数,即Y t=f(T t,S t,C t,I t),其中较常用的是加法模型和乘法模型,其表现形式为:加法模型:Y t=T t+S t+C t+I t乘法模型:Y t=T t×S t×C t×I t注意:时间序列组合模型中包含了四种因素,这是时间序列的完备模式,但是并不是在每个时间序列中这四种因素都同时存在。
统计学贾俊平课后习题答案HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】附录:教材各章习题答案第1章统计与统计数据1.1(1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5)分类数据。
1.2(1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家庭”;(2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。
1.3(1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。
1.4(1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者的月平均花费;(4)统计量;(5)推断统计方法。
1.5(略)。
1.6(略)。
第2章数据的图表展示2.1(1)属于顺序数据。
(2)频数分布表如下(4)帕累托图(略)。
2.2(1)频数分布表如下2.3频数分布表如下2.5(1)排序略。
(2)频数分布表如下2.6(3)食品重量的分布基本上是对称的。
2.72.8(1)属于数值型数据。
2.9(1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
2.10A 班分散,且平均成绩较A 班低。
2.11 (略)。
2.12 (略)。
2.13 (略)。
2.14 (略)。
2.15 箱线图如下:(特征请读者自己分析) 第3章 数据的概括性度量3.1(1)100=M ;10=e M ;6.9=x 。
(2)5.5=L Q ;12=U Q 。
(3)2.4=s 。
(4)左偏分布。
3.2(1)190=M ;23=e M 。
(2)5.5=L Q ;12=U Q 。
(3)24=x ;65.6=s 。
(4)08.1=SK ;77.0=K 。
(5)略。
3.3 (1)略。
(2)7=x ;71.0=s 。
(3)102.01=v ;274.02=v 。
(4)选方法一,因为离散程度小。
3.4 (1)x =(万元);M e= 。
第四章统计数据的概括性度量4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数.(2)根据定义公式计算四分位数。
(3)计算销售量的标准差。
(4)说明汽车销售量分布的特征。
解:Statistics10Missing0Mean9.60Median10.00Mode10Std. Deviation4。
169Percentiles256。
255010.0075单位:周岁19152925242321382218302019191623272234244120311723要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄(2)根据定义公式计算四分位数。
Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18。
75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0。
75×2=26.5。
(3)计算平均数和标准差;Mean=24。
00;Std。
Deviation=6。
652(4)计算偏态系数和峰态系数:Skewness=1。
080;Kurtosis=0。
773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。
如需看清楚分布形态,需要进行分组。
1、确定组数: ()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=6 2、确定组距:组距=( 最大值 — 最小值)÷ 组数=(41-15)÷6=4。
3,取53、分组频数表网络用户的年龄 (Binned)分组后的直方图::一种是所有颐客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待。
为比较哪种排队方式使顾客等待的时间更短.两种排队方式各随机抽取9名顾客.得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟。
一、思考题3.1数据的预处理包括数据审核,数据筛选,数据排序,数据透视表。
3.2分类数据整理:频数分布表(频数,比例,百分比,比率)图示方法:条形图,对比条形图,帕累托图,饼图。
顺序数据的整理:频数分布表(累计频数,累计频率)图示方法:环形图。
3.3数值型数据的分组方法是组距分组,步骤:1.确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。
在实际分组时,组数一般为5≤K ≤152.确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距=( 最大值 - 最小值)÷ 组数3.统计出各组的频数并整理成频数分布表3.4直方图和条形图区别:1.条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的2.直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义3.直方图的各矩形通常是连续排列,条形图则是分开排列4.条形图主要用于展示分类数据,直方图则主要用于展示数值型数据3.5绘制线图应该注意的问题:一般情况下,纵轴数据下端应从“0”开始,以便于比较。
数据与“0”之间的间距过大时,可以采取折断的符号将纵轴折断3.6饼图和环形图的不同:饼图只能显示一个总体各部分所占的比例,环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环。
3.7茎叶图与直方图相比的优点与各自的应用场合:直方图可观察一组数据的分布状况,但没有给出具体的数值;茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息。
直方图适用于大批量数据,茎叶图适用于小批量数据3.8鉴别图表优劣的准则有:3.9制作统计表时应注意的问题:二、练习题3.1为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。
服务质量的等级分别为:A.好;B.较好;C.一般;D.较差;E.差。
第六章统计量及其抽样分布6。
1 调节一个装瓶机使其对每个瓶子的灌装量均值为盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差盎司的正态分布。
随机抽取由这台机器灌装的9个瓶子形成一个样本,并测定每个瓶子的灌装量。
试确定样本均值偏离总体均值不超过0.3盎司的概率。
解:总体方差知道的情况下,均值的抽样分布服从的正态分布,由正态分布,标准化得到标准正态分布:z=~,因此,样本均值不超过总体均值的概率P为:====2—1,查标准正态分布表得=0。
8159因此,=0。
63186。
2 =====0。
95查表得:因此n=436。
3 ,,……,表示从标准正态总体中随机抽取的容量,n=6的一个样本,试确定常数b,使得解:由于卡方分布是由标准正态分布的平方和构成的:设Z1,Z2,……,Z n是来自总体N(0,1)的样本,则统计量2分布,记为χ2~ χ2(n)服从自由度为n的χ因此,令,则,那么由概率,可知:b=,查概率表得:b=12.596。
4 在习题6。
1中,假定装瓶机对瓶子的灌装量服从方差的标准正态分布。
假定我们计划随机抽取10个瓶子组成样本,观测每个瓶子的灌装量,得到10个观测值,用这10个观测值我们可以求出样本方差,确定一个合适的范围使得有较大的概率保证S2落入其中是有用的,试求b1,b2,使得解:更加样本方差的抽样分布知识可知,样本统计量:此处,n=10,,所以统计量根据卡方分布的可知:又因为:因此:则:查概率表:=3。
325,=19。
919,则=0。
369,=1.88。
第十章习题10.1H0:三个总体均值之间没有显著差异。
H1:三个总体均值之间有显著差异。
答:方差分析可以看到,由于P=0。
1078>0.01,所以接受原假设H0。
说明了三个总体均值之间没有显著差异.10.2H0:五个个总体均值之间相等。
H1: 五个总体均值之间不相等。
答:方差分析可以看到,由于P=1。
02E-05〈0.01,所以拒接原假设H0。
说明了五个总体均值之间不相等。
H0:四台机器的装填量相等。
H1:四台机器的装填量不相等答:方差分析可以看到,由于P=0.00068〈0。
01,所以拒接原假设H0。
说明了四台机器装填量不相同。
10.4H0:不同层次管理者的满意度没有差异.H1:不同层次管理者的满意度有差异。
答:方差分析可以看到,由于P=0。
000849〈0.05,所以拒接原假设H0。
说明了不同层次管理者的满意度有差异。
H0:3个企业生产的电池平均寿命之间没有显著差异。
H1: 3个企业生产的电池平均寿命之间有显著差异多重比较因变量: VAR00002LSD(I)VAR00001 (J)VAR00001均值差(I-J)标准误显著性95%置信区间下限上限1。
00 2。
00 14.40000*2。
68576 。
000 8.5482 20。
2518 3。
00 1.80000 2。
68576 .515 -4。
0518 7.65182.00 1.00—14。
40000*2.68576 .000 -20.2518 -8。
54823.00—12。
60000*2.68576 .001—18。
4518—6.74823.00 1。
00 —1.80000 2.68576 。
515 —7.65184.0518 2。
00 12.60000*2。
68576 .001 6。
7482 18。
4518*. 均值差的显著性水平为 0.05。
答:方差分析可以看到,由于P=0。
00031<0.01,所以拒接原假设H0。
说明了不同3个企业生产的电池平均寿命之间有显著差异。
第一章导论.1(1)数值型变量。
(2)分类变量。
(3)离散型变量。
(4)顺序变量。
(5)分类变量。
(1)总体是该市所有职工家庭的集合;样本是抽中的2000个职工家庭的集合。
(2)参数是该市所有职工家庭的年人均收入;统计量是抽中的2000个职工家庭的年人均收入。
(1)总体是所有IT从业者的集合。
(2)数值型变量。
(3)分类变量。
(4)截面数据。
(1)总体是所有在网上购物的消费者的集合。
(2)分类变量。
(3)参数是所有在网上购物者的月平均花费。
(4)参数(5)推断统计方法。
第二章数据的搜集1.什么是二手资料使用二手资料需要注意些什么与研究内容有关的原始信息已经存在,是由别人调查和实验得来的,并会被我们利用的资料称为“二手资料”。
使用二手资料时需要注意:资料的原始搜集人、搜集资料的目的、搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。
在引用二手资料时,要注明数据来源。
2.比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
概率抽样是指抽样时按一定概率以随机原则抽取样本。
每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽中的概率,概率抽样的技术含量和成本都比较高。
如果调查的目的在于掌握和研究总体的数量特征,得到总体参数的置信区间,就使用概率抽样。
非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。
非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。
它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。
非概率抽样也适合市场调查中的概念测试。
3.调查中搜集数据的方法主要有自填式、面方式、电话式,除此之外,还有那些搜集数据的方法实验式、观察式等。
4. 自填式、面方式、电话式调查个有什么利弊自填式优点:调查组织者管理容易,成本低,可以进行较大规模调查,对被调查者可以刻选择方便时间答卷,减少回答敏感问题的压力。
第1章统计与统计数据1.1(1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5)分类数据。
1.2(1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家庭”;(2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。
1.3(1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。
1.4(1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者的月平均花费;(4)统计量;(5)推断统计方法。
1.5(略)。
1.6(略)。
第2章数据的图表展示2.1(1)属于顺序数据。
(2)频数分布表如下服务质量等级评价的频数分布(3)条形图(略)(4)帕累托图(略)。
2.2(1)频数分布表如下40个企业按产品销售收入分组表(2)某管理局下属40个企分组表2.3频数分布表如下某百货公司日商品销售额分组表直方图(略)。
2.4茎叶图如下箱线图(略)。
2.5(1)排序略。
(2)频数分布表如下100只灯泡使用寿命非频数分布(3)直方图(略)。
(4)茎叶图如下2.6(1)频数分布表如下(2)直方图(略)。
(3)食品重量的分布基本上是对称的。
2.7(1)频数分布表如下(2)直方图(略)。
2.8(1)属于数值型数据。
(2)分组结果如下(3)直方图(略)。
2.9(1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
2.10(1)茎叶图如下(2)A 班考试成绩的分布比较集中,且平均分数较高;B 班考试成绩的分布比A 班分散,且平均成绩较A 班低。
2.11 (略)。
2.12 (略)。
2.13 (略)。
2.14 (略)。
2.15箱线图如下:(特征请读者自己分析)第3章 数据的概括性度量3.1(1)100=M ;10=e M ;6.9=x 。
(2)5.5=L Q ;12=U Q 。
(3)2.4=s 。
(4)左偏分布。
3.2(1)190=M ;23=e M 。
附录:教材各章习题答案第1章统计与统计数据1.1(1)数值型数据;(2分类数据;(3)数值型数据;(4)顺序数据;(5)分类数据。
1.2(1)总体是该城市所有的职工家庭”样本是抽取的2000个职工家庭”(2)城市所有职工家庭的年人均收入,抽取的“ 200个家庭计算出的年人均收入。
1.3(1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。
1.4(1)总体是所有的网上购物者”(2)分类变量;(3)所有的网上购物者的月平均花费;(4)统计量;(5)推断统计方法。
1.5(略)。
1.6(略)。
第2章数据的图表展示2.1(1)属于顺序数据。
(2)频数分布表如下服务质量等级评价的频数分布(3)条形图(略)(4)帕累托图(略)。
2.2(1)频数分布表如下40个企业按产品销售收入分组表(2)某管理局下属40个企分组表2.3 频数分布表如下某百货公司日商品销售额分组表直方图(略)。
2.4 茎叶图如下箱线图(略)。
2.5(1)排序略。
(2)频数分布表如下100只灯泡使用寿命非频数分布690~700 700~710 710~720 720~730 730~740 261813103261813103合计100 100(3)直方图(略)(4)茎叶图如下茎叶65 1 866 1 4 5 6 867 1 3 4 6 7 968 1 1 2 3 3 3 4 5 5 5 8 8 9 969 0 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 970 0 0 1 1 2 2 3 4 5 6 6 6 7 7 8 8 8 971 0 0 2 2 3 3 5 6 7 7 8 8 972 0 1 2 2 5 6 7 8 9 973 3 5 674 1 4 7(1)频数分布表如下按重量分组频率/包40 〜42 242 〜44 344 〜46 746 〜48 1648 〜50 1752 〜52 1052 〜54 202.62.7 2.854 〜56 856 〜58 1058 〜60 460 〜62 3合计100(2)直方图(略)。