当前位置:文档之家› 统计学人教版第五版7,8,10,11,13,14章课后题答案

统计学人教版第五版7,8,10,11,13,14章课后题答案

统计学人教版第五版7,8,10,11,13,14章课后题答案
统计学人教版第五版7,8,10,11,13,14章课后题答案

统计学复习笔记

第七章

一、 思考题

1. 解释估计量和估计值

在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。

根据一个具体的样本计算出来的估计量的数值称为估计值。

2. 简述评价估计量好坏的标准

(1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。

(3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。

3. 怎样理解置信区间

在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。

4. 解释95%的置信区间的含义是什么

置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。

不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。

5. 简述样本量与置信水平、总体方差、估计误差的关系。

1. 估计总体均值时样本量n 为

2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为

其中:

22

2

2)(E z n σα

=

2

22

2)(E z n σα=n

z E σ

α2

=n z E σα2=

? 与置信水平成正比,在其他条件不变的情况下,置信水平越大,所

需要的样本量越大;

? 与总体方差成正比,总体的差异越大,所要求的样本量也越大; ? 与与总体方差成正比,样本量与估计误差的平方成反比,即可以接

受的估计误差的平方越大,所需的样本量越小。

二、 练习题

1. 从一个标准差为5的总体中采用重复抽样方法抽出一个样本量为40的样本,样本均值为25。

1) 样本均值的抽样标准差等于多少? 2) 在95%的置信水平下,估计误差是多少?

解: 1) 已知σ = 5,n = 40,

= 25

∵ ∴ = 5 /√40 ≈ 0.79

2) 已知

∵ ∴ 估计误差 E = 1.96×5÷√40 ≈ 1.55

2. 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。

1) 假定总体标准差为15元,求样本均值的抽样标准误差。 2) 在95%的置信水平下,求估计误差。

3) 如果样本均值为120元,求总体均值μ的95%的置信区间。 解:1)已知σ = 15,n = 49 ∵

x

σ

x σx σx σ

x x n

x

σ

σ=n x σσ=n

z E σ

α2=n z E

σα2=n

x

σ

σ=n x σσ=n

x

σ

σ=n x σσ=

∴ = 15÷√49 = 2.14

2)已知

∴ 估计误差 E = 1.96×15÷√49 ≈ 4.2

3)已知

= 120 ∵ 置信区间为

±E ∴ 其置信区间 = 120±4.2

3. 从一个总体中随机抽取n =100的随机样本,得到

=104560,假定总体标准差σ = 85414,试构建总体均值μ的95%的置信区间。

解: 已知n =100, =104560,σ = 85414,1-α=95% ,

由于是正态总体,且总体标准差已知。总体均值μ在1-α置信水平下的置信区间为

104560 ± 1.96×85414÷√100 = 104560 ±16741.144

4. 从总体中抽取一个n =100的简单随机样本,得到

=81,s=12。要求:

1) 构建μ的90%的置信区间。 2) 构建μ的95%的置信区间。 3) 构建μ的99%的置信区间。

解:由于是正态总体,但总体标准差未知。总体均值μ在1-α置信水

x

σ

x σn

z E σ

α2=n z E σα2=x x x x x x x x ()28.109,44.10192

.336.1052510

96.136.1052

=±=?

±=±n z x σ

α()28.109,44.10192.336.105251096.136.1052=±=?±=±n z x σαx x

平下的置信区间公式为

81

±

×12÷√100 = 81

±×1.2

1)1-α=90%

1.65

其置信区间为 81 ± 1.98

2)1-α=95% ,

其置信区间为 81 ± 2.352 3) 1-α=99%

2.58

其置信区间为 81 ± 3.096

5. 利用下面的信息,构建总体均值的置信区间。

1)

= 25,σ = 3.5,n =60,置信水平为95% 2) =119,s =23.89,n =75,置信水平为98% 3) =3.149,s =0.974,n =32,置信水平为90% 解:∵ ∴ 1) 1-α=95% ,

其置信区间为:25±1.96×3.5÷√60 = 25±0.885

2) 1-α=98% ,则α=0.02, α/2=0.01, 1-α/2=0.99,查标准正态分布表,可知:

2.33

其置信区间为: 119±2.33×23.89÷√75 = 119±6.345

x x

x x

x x

)(2

2未知或σσααn

s

z x n

z x ±±)(22未知或σσααn s z x n z x ±±

3) 1-α=90%

, 1.65

其置信区间为: 3.149±1.65×0.974÷√32 = 3.149±0.284

6. 利用下面的信息,构建总体均值μ的置信区间:

1) 总体服从正态分布,且已知σ = 500,n = 15

=8900,置信水平为95%。

解: N=15,为小样本正态分布,但σ已知。则1-α=95%,

。其置信区间公式为

∴置信区间为:8900±1.96×500÷√15=(8646.7 , 9153.2)

2) 总体不服从正态分布,且已知σ = 500,n = 35, =8900,置

信水平为95%。

解:为大样本总体非正态分布,但σ已知。则1-α=95%,

。其置信区间公式为

∴置信区间为:8900±1.96×500÷√35=(8733.9 9066.1)

3) 总体不服从正态分布,σ未知,n = 35,

=8900,s =500,置信水平为90%。

解:为大样本总体非正态分布,且σ未知,1-α=90%, 1.65。

其置信区间为: 8900±1.65×500÷√35=(8761 9039)

4) 总体不服从正态分布,σ未知,n = 35,

=8900,s =500,置信水平为99%。

()28.109,44.10192.336.10525

1096.136.1052

=±=?

±=±n

z x σ

α()

28.109,44.10192.336.105251096.136.1052=±=?±=±n z x σαx x x x ()28.109,44.10192.336.10525

1096.136.1052

=±=?

±=±n

z x σ

α()

28.109,44.10192.336.105251096.136.1052=±=?±=±n z x σαx x x x

解:为大样本总体非正态分布,且σ未知,1- =99%, 2.58。

其置信区间为:8900±2.58×500÷√35=(8681.9 9118.1)

7.某大学为了解学生每天上网的时间,在全校7500名学生中采取重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时)(略)。求该校大学生平均上网时间的置信区间,置信水平分别为90%

解:先求样本均值:= 3.32

再求样本标准差:

置信区间公式:

8.从一个正态总体中随机抽取样本量为8的样本,各样本值分别为:10,8,12,15,6,13,5,11。求总体均值μ的95%置信区间。解:本题为一个小样本正态分布,σ未知。

先求样本均值:= 80÷8=10

再求样本标准差:= √84/7 = 3.4641

于是 , 的置信水平为的置信区间是

,

已知,n = 8,则,α/2=0.025,查自由度为

n-1 = 7的分布表得临界值 2.45

所以,置信区间为:10±2.45×3.4641÷√7

9.某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离分别是:10,3,14,8,6,9,12,11,7,5,10,15,9,16,13,2。假设总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。

解:小样本正态分布,σ未知。已知,n = 16,,则,

α/2=0.025,查自由度为n-1 = 15的分布表得临界值 2.14

样本均值=150/16=9.375

再求样本标准差:= √253.75/15 ≈4.11

于是 , 的置信水平为的置信区间是

,

9.375±2.14×4.11÷√16

10.从一批零件是随机抽取36个,测得其平均长度是149.5,标准差是1.93。

1)求确定该种零件平均长度的95%的置信区间。

2)在上面估计中,你使用了统计中的哪一个重要定理?请解释。

解:1)这是一个大样本分布。已知N=36,

= 149.5,S =1.93,

1-α=0.95,。

其置信区间为:149.5±1.96×1.93÷√36 2)中心极限定理论证:如果总体变量存在有限的平均数和方差,那么,不论这个总体的分布如何,随着样本容量的增加,样本均值的分布便趋近正态分布。在现实生活中,一个随机变量服从正态分布未必很多,但是多个随机变量和的分布趋于正态分布则是普遍存在的。样本均值也是一种随机变量和的分布,因此在样本容量充分大的条件下,样本均值也趋近于正态分布,这为抽样误差的概率估计理论提供了理论基础。

11.某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克,现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量如下:(略)

已知食品包重服从正态分布,要求:

1)确定该种食品平均重量的95%的置信区间。

2)如果规定食品重量低于100克属于不合格,确定该批食品合格率的95%的置信区间。

x x

解:1)本题为一个大样本正态分布,σ未知。已知N=50,μ =100,1-α=0.95,。

①每组组中值分别为97、99、101、103、105,即此50包样本平均值= (97+99+101+103+105)/5 = 101

②样本标准差为:

=√{(97-101)2×2+(99-101)2×3+(101-101)2×34+(103-101)2×7+(105-101)2×4}÷(50-1)≈ 1.666

③其置信区间为:101±1.96×1.666÷√50

2)∵不合格包数(<100克)为2+3=5包,5/50 = 10%(不合格率),即P = 90%。

∴该批食品合格率的95%置信区间为:

= 0.9 ±1.96×√(0.9×0.1)÷50= 0.9 ±1.96×0.042

12.假设总体服从正态分布,利用下面的数据构建总体均值μ的99%的置信区间。(略)

解:样本均值

样本标准差:

尽管总体服从正态分布,但是样本n=25是小样本,且总体标

准差未知,应该用T统计量估计。1-α=0.99,则α=0.01,

α/2=0.005,查自由度为n-1 = 24的分布表得临界值 2.8

的置信水平为的置信区间是,

13.一家研究机构想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取了18个员工,得到他们每周加班的时间数据如下(单位:小时):(略)

假定员工每周加班的时间服从正态分布,估计网络公司员工平均每周加班时间的90%的置信区间。

解:① N = 18 < 30,为小样本正态分布,σ未知。

②样本均值= 244/18 = 13.56

样本标准差:=

③ 1-α= 90%,α= 0.1,α/2= 0.05,则查自由度为n-1 = 17

的分布表得临界值 1.74

④的置信水平为的置信区间是,

14.利用下面的样本数据构建总体比例丌的置信区间:

1)n =44,p = 0.51 ,置信水平为99%

2)n =300,p = 0.82 ,置信水平为95%

3)n =1150,p = 0.48,置信水平为90%

解:1)1-α= 99%,α= 0.01,α/2= 0.005,1-α/2= 0.995,

查标准正态分布表,则 2.58

2)1-α=95%,

3)1-α=90%, 1.65

分别代入

15.在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机,其中拥有该品牌电视机的家庭占23%。求总体比例的置信区间,置信水平分别为90%和95%。

解:1)置信水平90%,1-α=90%, 1.65,N = 200,P = 23%。

代入

2)置信水平95%,1-α=95%,,N = 200,P = 23%。代入

16.一位银行的管理人员想估计每位顾客在该银行的月平均存款额。他假设所有顾客月存款额的标准差为1000元,要求的估计误差在200元以内,置信水平为99%。应选取多大的样本?

解:已知 1-α = 99%,则 2.58。E = 200,σ= 1000元。

则 N = (2×σ2)÷E2= (2.582×10002)÷2002≈167 (得数应该是166.41,不管小数后是多少,都向上进位取整,因此至少是167人)

17.要估计总体比例丌,计算下列条件下所需的样本量。

1)E=0.02,丌=0.40,置信水平96%

2)E=0.04,丌未知,置信水平95%

3)E=0.05,丌=0.55,置信水平90%

解:1)已知 1-α = 96%,α/2 =0.02 ,则 2.06

N = {2×丌(1-丌)}÷E2=2.062×0.4×0.6÷0.022≈2547

2) 已知 1-α = 95%,α/2 =0.025 ,则 1.96

丌未知,则取使丌(1-丌)最大时的0.5。

N = {2×丌(1-丌)}÷E2=1.962×0.5×0.5÷0.042≈601

3)置信水平90%,1- =90%, 1.65,

N = {2×丌(1-丌)}÷E2=1.652×0.55×0.45÷0.052≈270

18.某居民小区共有居民500户,小区管理者准备采用一项新的供水设施,想了解居民是否赞成。采取重复抽样方法随机抽取了50户,其中有32户赞同,18户反对。

1)求总体中赞成该项改革的户数比例的置信区间(α=0.05)2)如果小区管理者预计赞成的比例能达到80%,估计误差

不超过10%,应抽取多少户进行调查(α=0.05)

解:1)

已知N=50,P=32/50=0.64,α=0.05,α/2 =0.025 ,则 1.96

置信区间:P±√{P(1-P)/N}= 0.64±1.96√0.64×0.36/50 = 0.64±1.96×0.48/7.07=0.64±0.133

2)已知丌=0.8 , E = 0.1, α=0.05,α/2 =0.025 ,则 1.96

N= 2丌(1-丌)/E2= 1.962×0.8×0.2÷0.12≈62

19.根据下面的样本结果,计算总体标准差σ的90%的置信区间:1)=21,S=2,N=50

2)=1.3,S=0.02,N=15

3)=167,S=31,N=22

解:1)大样本,σ未知,置信水平90%,1-α=90%, 1.65

21±1.65×2÷√50

2)小样本,σ未知,置信水平90%,1-α=90%,则查自由度

为n-1 = 14的分布表得临界值 1.761

, = 1.3±1.761×0.02÷√15

3) 大样本, σ未知,置信水平90%,1-α=90%, 1.65

167±1.65×31÷√22

20.题目(略)

1)构建第一种排队方式等待时间标准差的95%的置信区间

2)构建第二种排队方式等待时间标准差的95%的置信区间

3)根据1)和2)的结果,你认为哪种排队方式更好?

解:本题为小样本正态分布,σ未知,应用公式

,

置信水平95%,1- =95%,则查自由度为n-1 = 9的分布表

得临界值 2.31

1)= 7.15,

= √2.045/9≈0.48

其置信区间为7.15±2.31×0.48÷√10

2) = 7.15

= √0/9 = 0

其置信区间为7.15±0

4)第二种排队方式更好.

(19题是对总体方差的估计,应该用卡方统计量进行估计,20题是对两个总体参数的估计,这二种类型老师未讲,不是本次考试的内容,不能用Z统计量像估计总体均值和比例那样去估计,具体内容见书上P188――P194)

第八章

一、思考题

1.假设检验和参数估计有什么相同点和不同点?

解:参数估计与假设检验是统计推断的两个组成部分。

相同点:它们都是利用样本对总体进行某种推断。

不同点:推断的角度不同。参数估计讨论的是用样本统计量估计总体参数的方法,总体参数μ在估计前是未知的。而在假设检验中,则是先对μ的值提出一个假设,然后利用样本信息去检验这个假设是否成立。

2.什么是假设检验中的显著性水平?统计显著是什么意思?

解:显著性水平用α表示,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险,即假设检验中犯弃真错误的概率。它是由人们根据检验的要求确定的。

(我理解的统计学意义,统计显著是统计上专用的判定标准,指在一定的概率原则下,可以承认一种趋势或者合理性达到的程度,达到为统计上水平显著,达不到为统计上水平不显著)

3.什么是假设检验中的两类错误?

解:弃真错误(α错误):当原假设为真时拒绝原假设,所犯的错误成为第I类错误,又称为弃真错误。犯第I类错误的概率常记作α。

取伪错误(β错误):当原假设为假时没有拒绝原假设,所犯的错误称为第II类错误,又称取伪错误。犯第II类错误概率常记作β。

发生第I类错误的概率也常被用于检验结论的可靠性度量。假设检验中犯第I类错误的概率被称为显著性水平,记作α。

4.两类错误之间存在什么样的数量关系?

在样本容量n一定的情况下,假设检验不能同时做到犯α和β两类错误的概率都很小。若减小α错误,就会增大犯β错误的机会;若减小β错误,也会增大犯α错误的机会。要使α和β同时变小只有增大样本容量。但样本容量增加要受人力、经费、时间等很多因素的限制,无限制增加样本容量就会使抽样调查失去意义。因此假设检验需要慎重考虑对两类错误进行控制的问题。

5.解释假设检验中的P值。

解:如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为P值。也称为观察到的显著性水平。

P值是反映实际观测到的数据与原假设H0之间不一致程度的一个概率值。P值越小,说明实际观测到的数据与H0之间不一致程度就越大。

6.显著性水平与P值有何区别?

解:α(显著性水平)是一个判断的标准(当原假设为真,却被拒绝的概率),而P是实际统计量对应分位点的概率值(当原假设为真时,所得到的样本观察结果或更极端结果出现的概率)。

可以通过α计算置信区间,然后与统计量进行比较判断,也可以通过统计量计算对应的p值,然后与α值比较判断。

7.假设检验依据的基本原理是什么?

解:假设检验利用的是小概率原理,小概率原理是指发生概率很小的随机事件在一次试验中是几乎不可能发生的。根据这一原理,可以先假设总体参数的某项取值为真,也就是假设其发生的可能性很大,然后抽取一个样本进行观察,如果样本信息显示出现了与事先假设相反的结果且与原假设差别很大,则说明原来假定的小概率事件在一次实验中发生了,这是一个违背小概率原理的不合理现象,因此有理由怀疑和拒绝原假设;否则不能拒绝原假设。

8.你认为在单侧检验中原假设和备择假设的方向应该如何确定?

解:假设问题有两种情况,一种是所考察的数值越大越好(左单侧检验或下限检验),临界值和拒绝域均在左侧;另一种是数值越小越好(右单侧检验或上限检验),临界值和拒绝域均在右侧。

二、练习题

1.已知某炼铁厂的含碳量服从正态分布N(4.55,0.1082),现在测定了9炉铁水,其平均含碳量为4.484。如果估计方差没有变化,可否认为现在生产的铁水平均含碳量为4.55(α=0.05)?

解: 已知μ0=4.55,σ2=0.1082,N=9,=4.484,

这里采用双侧检验,小样本,σ已知,使用Z 统计。 假定现在生产的铁水平均含碳量与以前无显著差异。则, H 0 :μ =4.55 ; H 1 :μ ≠4.55 α=0.05,α/2 =0.025

,查表得临界值为 1.96

计算检验统计量:

= (4.484-4.55)/(0.108/√9) = -1.833

决策:∵Z 值落入接受域,∴在α=0.05的显著性水平上接受H 0。

结论:有证据表明现在生产的铁水平均含碳量与以前没有显著差异,可以认为现在生产的铁水平均含碳量为4.55。

2. 一种元件,要求其使用寿命不得低于700小时。现从一批这种元件中随机抽取36件,测得其平均寿命为680小时。已知该元件寿命服从正态分布,σ=60小时,试在显著性水平0.05下确定这批元件是否合格。

解: 已知N=36,σ=60,=680,μ0 =700

这里是大样本,σ已知,左侧检验,采用Z 统计量计算。 提出假设:假定使用寿命平均不低于700小时 H 0:μ≥700 H 1: μ < 700

α = 0.05,左检验临界值为负,查得临界值: -Z 0.05=-1.645

n

x Z / σ - =

μ0

计算检验统计量:

= (680-700)/(60/√36) = -2

决策:∵Z 值落入拒绝域,∴在α=0.05的显著性水平上拒绝H 0,接受H 1

结论:有证据表明这批灯泡的使用寿命低于700小时,为不合格产品。

3. 某地区小麦的一般生产水平为亩产250公斤,其标准差是30公斤。现用一种化肥进行试验,从25个小区抽样,平均产量为270公斤。这种化肥是否使小麦明显增产(α=0.05)? 解:已知μ0 =250,σ = 30,N=25,=270

这里是小样本分布,σ已知,用Z 统计量。右侧检验,α =0.05,则Z α=1.645

提出假设:假定这种化肥没使小麦明显增产。

即 H 0:μ≤250 H 1: μ > 250 计算统计量:

Z = (-μ0)/(σ/√N )= (270-250)/(30/√25)= 3.33 结论:Z 统计量落入拒绝域,在α =0.05的显著性水平上,拒绝H 0,接受H 1。

决策:有证据表明,这种化肥可以使小麦明显增产。

n x Z / σ - =

μ0

4. 糖厂用自动打包机打包,每包标准重量是100千克。每天开工后需要检验一次打包机工作是否正常。某日开工后测得9包重量(单位:千克)如下:(略)

已知包重服从正态分布,试检验该日打包机工作是否正常。(α =0.05)

解:已知N=9,这里是小样本正态分布,σ未知,双侧检验,采用t 统计量,自由度为N-1=8。α =0.05,则T α/2=2.37

= 99.98

≈1.22

提出假设,假设打包机工作正常: 即 H 0:μ= 100 H 1: μ ≠ 100 计算统计量:

= (99.98-100)/( 1.22/√9)≈-0.049

结论:∵t 值落入接受域,∴在α=0.05的显著性水平上接受H 0 决策:有证据表明这天的打包机工作正常。

5. 某种大量生产的袋装食品,按规定不得少于250克。今从一批该食品中任意抽取50袋,发现有6袋低于250克。若规定不符合标准的比例超过5%就不得出厂,问该批食品能否出厂(α=0.05)?

-

=

n

s x t μ

统计学课后习题答案(袁卫)

统计学课后习题答案(袁卫、庞皓、曾五一、贾俊平)第三版 第1章绪论 1.什么是统计学?怎样理解统计学与统计数据的关系? 2.试举出日常生活或工作中统计数据及其规律性的例子。 3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)描述推断。 答:(1)总体:最近的一个集装箱内的全部油漆; (2)研究变量:装满的油漆罐的质量; (3)样本:最近的一个集装箱内的50罐油漆; (4)推断:50罐油漆的质量应为4.536×50=226.8 kg。 4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)一描述推断。 答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型;

统计学课后习题答案完整版

统计学课后习题答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

第四章 统计描述 【】某企业生产铝合金钢,计划年产量40万吨,实际年产量45万吨;计划降低成本5%,实际降低成本8%;计划劳动生产率提高8%,实际提高10%。试分别计算产量、成本、劳动生产率的计划完成程度。 【解】产量的计划完成程度=%5.112100%40 45 100%=?=?计划产量实际产量 即产量超额完成%。 成本的计划完成程=84%.96100%5%-18% -1100%-1-1≈?=?计划降低百分比实际降低百分比 即成本超额完成%。 劳动生产率计划完= 85%.101100%8%110% 1100%11≈?++=?++计划提高百分比实际提高百分比 即劳动生产率超额完成%。 【】某煤矿可采储量为200亿吨,计划在1991~1995年五年中开采全部储量的%, 试计算该煤矿原煤开采量五年计划完成程度及提前完成任务的时间。 【解】本题采用累计法: (1)该煤矿原煤开采量五年计划完成=100% ?数 计划期间计划规定累计数 计划期间实际完成累计 = 75%.1261021025357 4 =?? 即:该煤矿原煤开采量的五年计划超额完成%。 (2)将1991年的实际开采量一直加到1995年上半年的实际开采量,结果为2000万吨,此时恰好等于五年的计划开采量,所以可知,提前半年完成计划。 【】我国1991年和1994年工业总产值资料如下表:

要求: (1)计算我国1991年和1994年轻工业总产值占工业总产值的比重,填入表中; (2)1991年、1994年轻工业与重工业之间是什么比例(用系数表示) (3)假如工业总产值1994年计划比1991年增长45%,实际比计划多增长百分之几? 1991年轻工业与重工业之间的比例=96.01.144479 .13800≈; 1994年轻工业与重工业之间的比例=73.04.296826 .21670≈ (3) %37.25 1%) 451(2824851353 ≈-+ 即,94年实际比计划增长%。 【】某乡三个村2000年小麦播种面积与亩产量资料如下表: 要求:(1)填上表中所缺数字; (2)用播种面积作权数,计算三个村小麦平均亩产量; (3)用比重作权数,计算三个村小麦平均亩产量。

统计学课后习题和答案

第一章 1*.下面的列联表是根据一个小城市的居民教育水平(以获得了高中文凭和没有获得高中文凭分类)和就业状况(以全职和非全职分类)所做出 如果原假设即在教育水平和工作状态之间没有联系为真,那么下列哪一个选项表明了获得了高中文凭并且是全职工作的期望值? A. 9252157g B. 9282157g C.528292g D. 655292g E. 9252 82 g 1*. Answer :B Analysis :本题考查二维表中两个变量的独立性,如果原假设独立成立,那么cell “earned at least a high school diploma ”和“ employed full time ”的期望值为: 92829282 (,)()()157157157157 P Earned Employed Total P Earned P Employed Total == = g g g g g g 2*.一次实验中,每一个随机样本中的成人都有他的最喜爱的颜色,下表展示了按年龄分组 的试验结果。 如果对于颜色的偏好是同年龄组相互独立,下列哪一个选项表明了年龄组30到50岁,喜爱 绿色的人数的期望值? A. (99)(108)314 B. (69)(108)314 C. (99)(35)108 D. (35)(108)314 E. (99)(35) 314 2*. Answer :A Analysis :本题考查二维表中两个变量的独立性,如果两个变量独立,那么cell “aged 30 to 50”和“prefer green ”的期望值为: 1089999108 (3050,)(3050)()314314314314 P green Total P P green Total -=-= = g g g g g g 第二章 1*.下面的直方图代表了五种不同的数据集的分布,每个都包含28个整数,从1到7,水平和垂直比例对所有图形都是相同的。下面哪个图代表了有最大标准差的数据集?

统计学(贾俊平,第四版)第五章习题答案

《统计原理》第五章练习题答案 5.1 (1)平均分数是范围在0-100之间的连续变量,Ω=[0,100] (2)已经遇到的绿灯次数是从0开始的任意自然数,Ω=N (3)之前生产的产品中可能无次品也可能有任意多个次品,Ω=[10,11,12,13…….] 5.2 设订日报的集合为A ,订晚报的集合为B ,至少订一种报的集合为A ∪B ,同时订两种报的集合为A ∩B 。 P(A ∩B)=P(A)+ P(B)-P(A ∪B)=0.5+0.65-0.85=0.3 5.3 P(A ∪B)=1/3,P(A ∩B )=1/9, P(B)= P(A ∪B)- P(A ∩B )=2/9 5.4 P(AB)= P(B)P(A ∣B)=1/3*1/6=1/18 P(A ∪B )=P(B A )=1- P(AB)=17/18 P(B )=1- P(B)=2/3 P(A B )=P(A )+ P(B )- P(A ∪B )=7/18 P(A ∣B )= P(B A )/P(B )=7/12 5.5 设甲发芽为事件A ,乙发芽为事件B 。 (1)由于是两批种子,所以两个事件相互独立,所以有:P(AB)= P(B)P(B)=0.56 (2)P(A ∪B)=P(A)+P(B)-P(A ∩B)=0.94 (3)P(A B )+ P(B A )= P(A)P(B )+P(B)P(A )=0.38 5.6 设合格为事件A ,合格品中一级品为事件B P(AB)= P(A)P(B ∣A)=0.96*0.75=0.72 5.7 设前5000小时未坏为事件A ,后5000小时未坏为事件B 。 P(A)=1/3,P(AB)=1/2, P(B ∣A)= P(AB)/ P(A)=2/3 5.8 设职工文化程度小学为事件A ,职工文化程度初中为事件B ,职工文化程度高中为事件C ,职工年龄25岁以下为事件D 。 P(A)=0.1 P(B)=0.5, P(C)=0.4 P(D ∣A)=0.2, P(D ∣B)=0.5, P(D ∣C)=0.7 P(A ∣D)=2/55)C P(C)P(D )B P(B)P(D )A P(A)P(D ) A P(A)P(D =++ 同理P(B ∣D)=5/11, P(C ∣D)=28/55 5.9 设次品为D ,由贝叶斯公式有: P(A ∣D)=)C P(C)P(D )B P(B)P(D )A P(A)P(D ) A P(A)P(D ++=0.249 同理P(B ∣D)=0.112 5.10 由二项式分布可得:P (x=0)=0.25, P (x=1)=0.5, P (x=2)=0.25 5.11 (1) P (x=100)=0.001, P (x=10)=0.01, P (x=1)=0.2, P (x=0)=0.789

统计学第六版部分课后题答案

第四章 数据分布特征的测度 4.6 解:先计算出各组组中值如下: 4.8 解: ⑴ ⑵体重的平均数 体重的标准差 ⑶ 55—65kg 相当于μ-1σ到μ+1σ 根据经验法则:大约有68%的人体重在此范围内。 ⑷ 40—60kg 相当于μ-2σ到μ+2σ 2501935030450425501865011426.7120116.5 i M f x f s ?+?+?+?+?=====∑∑ 大。所以,女生的体重差异===离散系数===离散系数女 男10 .010 1 505v 08.012 1 605v =μσ=μσσσ) (1102.250)(1322.260磅=磅=女男=?μ=?μ) (112.25磅==?σ

根据经验法则:大约有95%的人体重在此范围内。 4.9 解: 在A 项测试中得115分,其标准分数为: 在B 项测试中得425分,其标准分数为: 所以,在A 项中的成绩理想。 4.11 解: 成年组的标准差为: 幼儿组的标准差为: 所以,幼儿组身高差异大。 115 100 115X Z =-=σμ-=5.050 400425X Z =-=σμ-= 172.1 4.24.2 2.4%172.1s x x n s s V x = == ====∑ 71.3 2.52.5 3.5% 71.3s x x n s s V x = =====∑

第七章 参数估计 7.7 根据题意:N=7500,n=36(大样本) 总体标准差σ未知,可以用样本标准差s 代替 32 .336 4.119n x x ===∑样本均值 2 1.61 s z α= =样本标准差: 边际误差为:22222 90 1.645 1.6451.61 1.6450.446 3.320.44 (2.883.76)95 1.9699 2.58(2.803.84)(2.634.01) z z x z z z ααααα==?=±=±置信水平%时,=平均上网时间的置信区间为: ,同理,置信水平%时,=;置信水平%时,=平均上网时间的置信区间分别为:,;,

统计学课后题答案第四版中国人民大学出版社

●3.2.某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元): 1521241291161001039295127104 10511911411587103118142135125 117108105110107137120136117108 9788123115119138112146113126 (1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率; (2)如果按规定:销售收入在125万元以上为先进企业,115万~125万元为良好企业,105万~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。 解:(1)要求对销售收入的数据进行分组, 全部数据中,最大的为152,最小的为87,知数据全距为152-87=65; 为便于计算和分析,确定将数据分为6组,各组组距为10,组限以整10划分; 为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值87可能落在最小组之下,最大值152可能落在最大组之上,将最小组和最大组设计成开口形式; 按照“上限不在组内”的原则,用划记法统计各组内数据的个数——企业数,也可以用Excel 进行排序统计(见Excel练习题2.2),将结果填入表内,得到频数分布表如下表中的左两列;将各组企业数除以企业总数40,得到各组频率,填入表中第三列; 在向上的数轴中标出频数的分布,由下至上逐组计算企业数的向上累积及频率的向上累积,由上至下逐组计算企业数的向下累积及频率的向下累积。 整理得到频数分布表如下: 40个企业按产品销售收入分组表 (2)按题目要求分组并进行统计,得到分组表如下: 某管理局下属40个企分组表 按销售收入分组(万元)企业数(个)频率(%) 先进企业良好企业一般企业落后企业11 11 9 9 27.5 27.5 22.5 22.5 合计40100.0

统计学课后第一章习题答案

第1章导论 1、某森林公园的一项研究试图确定哪些因素有利于成年松树长到60英尺以上的高度。经估计,森林公园生长着25000颗成年松树,该研究需要从中随机抽取250颗成年松树并丈量它们的高度后进行分析。该研究的总体是() A、250颗成年松树 B、公园中25000颗成年松树 C、所有高于60英尺的成年松树 D、森林公园中所有年龄的松树 2、某森林公园的一项研究试图确定成年松树的高度。该研究需要从中随机抽取250颗成年松树并丈量它们的高度后进行分析。该研究所感兴趣的变量是() A、森林公园中松树的年龄 B、森林公园中松树的数量 C、森林公园中松树的高度 D、森林公园中数目的种类 3、推断统计的主要功能是() A、应用总体的信息描述样本 B、描述样本中包含的信息 C、描述总体中包含的信息 D、应用样本信息描述总体 4、对高中生的一项抽样调查表明,85%的高中生愿意接受大学教育。这一叙述是()的结果

A、定性变量 B、试验 C、描述统计 D、推断统计 5、一名统计学专业的学生为了完成其统计学作业,在图书馆找到一本参考书中包含美国50个州的家庭收入中位数。在该生的作业中,他应该将此数据报告来源于() A、试验 B、实际观察 C、随机抽样 D、已发表的资料 6、某大公司的人力资源部主任需要研究公司雇员的饮食习惯。他注意到,雇员的午饭要么从家里带来,要么在公司餐厅就餐,要么在外面的餐馆就餐。该研究的目的是为了改善公司餐厅的现状。这种数据的收集方式可以认为是() A、观察研究 B、设计的试验 C、随机抽样 D、全面调查 7、下列不属于描述统计问题的是() A、根据样本信息对总体进行的推断 B、感兴趣的总体或样本 C、图、表或其他数据汇总工具 D、了解数据分布特征 8、某大学的一位研究人员希望估计该大学一年级新生在教科书上的花费,为此,他观察了200名新生在教科书上的花费,发现他们每个学期平均在教科书上的花费是250元。该研究人员感兴趣的总体是() A、该大学的所有学生 B、所有的大学生 C、该大学所有的一年级新生 D、样本中的200名新生

统计学第五章课后题及答案解析

第五章 一、单项选择题 1.抽样推断的目的在于() A.对样本进行全面调查 B.了解样本的基本情况 C.了解总体的基本情况 D.推断总体指标 2.在重复抽样条件下纯随机抽样的平均误差取决于() A.样本单位数 B.总体方差 C.抽样比例 D.样本单位数和总体方差 3.根据重复抽样的资料,一年级优秀生比重为10%,二年级为20%,若抽样人数相等时,优秀生比重的抽样误差() A.一年级较大 B.二年级较大 C.误差相同 D.无法判断 4.用重复抽样的抽样平均误差公式计算不重复抽样的抽样平均误差结果将()A.高估误差 B.低估误差 C.恰好相等 D.高估或低估 5.在其他条件不变的情况下,如果允许误差缩小为原来的1/2,则样本容量()A.扩大到原来的2倍 B.扩大到原来的4倍 C.缩小到原来的1/4 D.缩小到原来的1/2 6.当总体单位不很多且差异较小时宜采用() A.整群抽样 B.纯随机抽样 C.分层抽样 D.等距抽样 7.在分层抽样中影响抽样平均误差的方差是() A.层间方差 B.层内方差 C.总方差 D.允许误差 二、多项选择题 1.抽样推断的特点有() A.建立在随机抽样原则基础上 B.深入研究复杂的专门问题 C.用样本指标来推断总体指标 D.抽样误差可以事先计算 E.抽样误差可以事先控制 2.影响抽样误差的因素有() A.样本容量的大小 B.是有限总体还是无限总体 C.总体单位的标志变动度 D.抽样方法 E.抽样组织方式 3.抽样方法根据取样的方式不同分为() A.重复抽样 B.等距抽样 C.整群抽样 D.分层抽样 E.不重复抽样 4.抽样推断的优良标准是() A.无偏性 B.同质性 C.一致性 D.随机性 E.有效性 5.影响必要样本容量的主要因素有() A.总体方差的大小 B.抽样方法

统计学课后习题答案第五章 指数

第五章指数 一﹑单项选择题 1.广义的指数是指反映 A.价格变动的相对数 B.物量变动的相对数 C.总体数量变动的相对数 D.各种动态相对数 2.狭义的指数是反映哪一总体数量综合变动的相对数? A.有限总体 B.无限总体 C.简单总体 D.复杂总体 3.指数按其反映对象范围不同,可以分为 A.个体指数和总指数 B.数量指标指数和质量指标指数 C.定基指数和环比指数 D.平均指数和平均指标指数 4.指数按其所表明的经济指标性质不同可以分为 A.个体指数和总指数 B.数量指标指数和质量指标指数 C.定基指数和环比指数 D.平均指数和平均指标指数 5.按指数对比基期不同,指数可分为 A.个体指数和总指数 B.定基指数和环比指数 C.简单指数和加权指数 D.动态指数和静态指数 6.下列指数中属于数量指标指数的是 A.商品价格指数 B.单位成本指数 C.劳动生产率指数 D.职工人数指数 7.下列指数中属于质量指标指数的是 A.产量指数 B.销售额指数 C.职工人数指数 D.劳动生产率指数 8.由两个总量指标对比所形成的指数是 A.个体指数 B.综合指数 C.总指数 D.平均指数 9.综合指数包括 A.个体指数和总指数 B.数量指标指数和质量指标指数 C.定基指数和环比指数 D.平均指数和平均指标指数 10.总指数编制的两种基本形式是 A.个体指数和综合指数 B.综合指数和平均指数 C.数量指标指数和质量指标指数 D.固定构成指数和结构影响指数 11.数量指标指数和质量指标指数的划分依据是 A.指数化指标性质不同 B.所反映的对象范围不同 C.所比较的现象特征不同 D.指数编制的方法不同 12.编制综合指数最关键的问题是确定 A.指数化指标的性质 B.同度量因素及其时期 C.指数体系 D.个体指数和权数 13.编制数量指标指数的一般原则是采用下列哪一指标作为 同度量因素 A.基期的质量指标 B.报告期的质量指标 C.报告期的数量指标 D.基期的数量指标 14.编制质量指标指数的一般原则是采用下列哪一指标作为

统计学课后习题答案(Chap1.2)

第1章绪论 1.什么是统计学怎样理解统计学与统计数据的关系 2.试举出日常生活或工作中统计数据及其规律性的例子。 3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)描述推断。 答:(1)总体:最近的一个集装箱内的全部油漆; (2)研究变量:装满的油漆罐的质量; (3)样本:最近的一个集装箱内的50罐油漆; (4)推断:50罐油漆的质量应为×50=226.8 kg。 4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)一描述推断。 答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型; (2)用Excel制作一张频数分布表;

2014统计学课后复习题答案

《应用统计学》习题解答 第一章绪论 【1.1】指出下列变量的类型: (1)汽车销售量; (2)产品等级; (3)到某地出差乘坐的交通工具(汽车、轮船、飞机); (4)年龄; (5)性别; (6)对某种社会现象的看法(赞成、中立、反对)。 【解】(1)数值型变量 (2)顺序变量 (3)分类变量 (4)数值型变量 (5)分类变量 (6)顺序变量 【1.2】某机构从某大学抽取200个大学生推断该校大学生的月平均消费水平。 要求: (1)描述总体和样本。 (2)指出参数和统计量。 (3)这里涉及到的统计指标是什么? 【解】(1)总体:某大学所有的大学生 样本:从某大学抽取的200名大学生 (2)参数:某大学大学生的月平均消费水平 统计量:从某大学抽取的200名大学生的月平均消费水平 (3)200名大学生的总消费,平均消费水平 【1.3】下面是社会经济生活中常用的统计指标: ①轿车生产总量,②旅游收入,③经济发展速度,④人口出生率,⑤安置再就业人数,⑥全国第三产业发展速度,⑦城镇居民人均可支配收入,⑧恩格尔系数。 在这些指标中,哪些是数量指标,哪些是质量指标?如何区分质量指标与数量指标?【解】数量指标有:①、②、⑤ 质量指标有:③、④、⑥、⑦、⑧ 数量指标是说明事物的总规模、总水平或工作总量的指标,表现为绝对数的形式,并附有计量单位。而质量指标是说明总体相对规模、相对水平、工作质量和一般水平的统计指标,通常是两个有联系的统计指标对比的结果。 【1.4】某调查机构从某小区随机地抽取了50为居民作为样本进行调查,其中60%的居民对自己的居住环境表示满意,70%的居民回答他们的月收入在6000元以下,生活压力大。 回答以下问题: (1)这一研究的总体是什么? (2)月收入是分类变量、顺序变量还是数值型变量? (3)对居住环境的满意程度是什么变量? 【解】(1)这一研究的总体是某小区的所有居民。

统计学课后习题参考答案

思考题与练习题 参考答案 【友情提示】请各位同学完成思考题与练习题后再对照参考答案。回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。学而不思则罔,如果直接抄答案,对学习无益,危害甚大。想抄答案者,请三思而后行! 第一章绪论 思考题参考答案 1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔就是危险的。 2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在她的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域就是军机的危险区域。 3.能,拯救与发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。 练习题参考答案 一、填空题 1.调查。

2.探索、调查、发现。 3、目的。 二、简答题 1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。 2.统计学解决实际问题的基本思路,即基本步骤就是:①提出与统计有关的实际问题;②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。不解决问题时,重复第②-⑥步。 3.在结合实质性学科的过程中,统计学就是能发现客观世界规律,更好决策,改变世界与培养相应领域领袖的一门学科。 三、案例分析题 1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:姓名;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩 ;指标体系:上学期全班同学学习的科目 ;统计量:我班部分同学课程的平均成绩 ;定性数据:姓名 ;定量数据: 课程成绩 ;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。 2.(1)总体:广州市大学生;单位:广州市的每个大学生。(2)如果调查中了解的就是价格高低,为定序尺度;如果调查中了解的就是商品丰富、价格合适、节约时间,为定类尺度。(3)广州市大学生在网上购物的平均花费。(4)就是用统计量作为参数的估计。(5)推断统计。 3.(1)10。(2)6。(3)定类尺度:汽车名称,燃油类型;定序尺度:车型大小;定距尺度:引擎的汽缸数;定比尺度:市区驾车的油耗,公路驾车的油耗。(4)定性变量:汽车名称,车型大小,燃油类型;定量变量:引擎的汽缸数,市区驾车的油耗,公路驾车的油耗。(5)40%;(6)30%。 第二章收集数据 思考题参考答案

统计学习题答案 第5章 参数估计

第5章 参数估计 ●1. 从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。 (1) 样本均值的抽样标准差x σ等于多少? (2) 在95%的置信水平下,允许误差是多少? 解:已知总体标准差σ=5,样本容量n =40,为大样本,样本均值x =25, (1)样本均值的抽样标准差 x σ=0.7906 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E = α/2 Z 6×0.7906=1.5496。 ●2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。 (3) 假定总体标准差为15元,求样本均值的抽样标准误差; (4) 在95%的置信水平下,求允许误差; (5) 如果样本均值为120元,求总体均值95%的置信区间。 解:(1)已假定总体标准差为σ=15元, 则样本均值的抽样标准误差为 x σ15=2.1429 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E = α/2 Z 6×2.1429=4.2000。 (3)已知样本均值为x =120元,置信水平1-α=95%,得 α/2Z =1.96, 这时总体均值的置信区间为 α/2 x Z 0±4.2=124.2115.8 可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。 ●3.某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时): 3.3 3.1 6.2 5.8 2.3 4.1 5.4 4.5 3.2 4.4 2.0 5.4 2.6 6.4 1.8 3.5 5.7 2.3 2.1 1.9 1.2 5.1 4.3 4.2 3.6 0.8 1.5 4.7 1.4 1.2 2.9 3.5 2.4 0.5 3.6 2.5

免费《统计学》课后答案

统计学 费宇石磊(主编) 第2章练习题参考答案 2.1解:(1)首先将顾客态度分别用代码1、2、3表示,然后在数据文件的Varible View窗口Values栏定义变量值标签:1代表“喜欢并愿意购买”;2代表“不喜欢”,3代表“喜欢并愿意购买”。操作步骤: 依次点击File→点击open→点击Data→打开数据文件ex2.1→点击Analyze→点击Descriptive Statistics→点击Frequencies→将“态度”选入Variable框→点击OK。输出结果如表2.1所示: (2)根据表2.1频数分布表资料建立的数据文件为 绘制条形图操作步骤:依次点击File→点击open→点击Data→打开数据文件,选中Summaries for groups of cases→单击Define→选中Other Summary function→将“人数”选入Variable(纵轴),将“态度分类”选入Category Axis (横轴)→点击OK。输出结果如图2.1所示:

图2.1 30名顾客满意程度分布条形图 绘制饼图操作步骤:依次点击File→点击open→点击Data→打开数据文件 of individual cases→点击Define→将“人数”选入Slices Represent栏,将“态度分类”选入Variable栏→点击OK。输出结果如图2.2所示: 2.2解:首先列计算表如表2.2所示: 表2.2 120名学生英语成绩的均值、中位数、众数、偏态系数、峰度系数计算表

(1)均值151 872072.67120 i i i i i x f x f === = =∑∑(分) 表2.2中,分布次数最多的组是“40~50”组,这就是众数所在组;2 N =60,中位数大约在第60位,可确定中位数也在“40~50”组。 众数10124230 701073.333018M L i ?-=+ ?=+?=?+?-+-(分) (42)(42) 中位数11204922701072.6242 m e m N S M L i f ---=+?=+?=(分) (2)首先计算标准差:11.65s = =(分) 3 1 1 3 3 () /38389.64/120 0.202311.65k k i i i i x x f f SK s ==-= = =∑∑ 由计算结果可看出,偏态系数为正值,但与零的差距不大,说明120名大学生英语成绩为轻微右偏分布,成绩较低的同学占有一定的比例,但偏斜程度不大。 4 1 1 4 4 () /5108282.61/120 330.689111.65k k i i i i x x f f K s ==-= -= -=-∑∑ 由计算结果可看出,峰度系数为负值,说明120名大学生英语成绩为平峰分布,成绩较低的同学占一定比例,但低成绩区域的集中程度并不很高。 2.3解(1)整理的组距数列如表 表2.3.1 连续60天计算机销售量频数分布表

统计学课后题答案

第二章 3.某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。 (2)制作茎叶图,并与直方图进行比较。 解:(1)频数分布表

或: (2)茎叶图

第三章 1. 已知下表资料: 试根据频数和频率资料,分别计算工人平均日产量。解:计算表

根据频数计算工人平均日产量:6870 34.35200 xf x f = = =∑∑(件) 根据频率计算工人平均日产量:34.35f x x f = = ∑∑ g (件) 结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。 2.某企业集团将其所属的生产同种产品的9个下属单位按其生产该产品平均单位成本的分组资料如下表: 试计算这9个企业的平均单位成本。 解:

这9个企业的平均单位成本=f x x f = ∑∑ =13.74(元) 3.某专业统计学考试成绩资料如下: 试计算众数、中位数。 解:众数的计算: 根据资料知众数在80~90这一组,故L=80,d=90-80=10,fm=20,fm-1=14,fm+1=9, ()() 1 11m m o m m m m f f M L d f f f f --+-=+ ?-+-

最新《统计分析与SPSS的应用(第五版)》课后练习答案(第5章)

《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第5章SPSS的参数检验 1、某公司经理宣称他的雇员英语水平很高,如果按照英语六级考试的话,一般平均得分为 75分。现从雇员中随机选出11人参加考试,得分如下: 80, 81, 72, 60, 78, 65, 56, 79, 77,87, 76 请问该经理的宣称是否可信。 原假设:样本均值等于总体均值即u=u0=75 步骤:生成spss数据→分析→比较均值→单样本t检验→相关设置→输出结果(Analyze->compare means->one-samples T test;) 采用单样本T检验(原假设H0:u=u0=75,总体均值与检验值之间不存在显著差异); 单个样本统计量 N 均值标准差均值的标准误 成绩11 73.73 9.551 2.880 单个样本检验 检验值 = 75 t df Sig.(双侧) 均值差值差分的 95% 置信区间下限上限 成绩-.442 10 .668 -1.273 -7.69 5.14 分析:指定检验值:在test后的框中输入检验值(填75),最后ok! 分析:N=11人的平均值(mean)为73.7,标准差(std.deviation)为9.55,均值标准误差(std error mean)为2.87.t统计量观测值为-4.22,t统计量观测值的双尾概率p-值(sig.(2-tailed))为0.668,六七列是总体均值与原假设值差的95%的置信区间,为(-7.68,5.14),由此采用双尾检验比较a和p。T统计量观测值的双尾概率p-值(sig.(2-tailed))为0.668>a=0.05所以不能拒绝原假设;且总体均值的95%的置信区间为(67.31,80.14),所以均值在67.31~80.14内,75包括在置信区间内,所以经理的话是可信的。 2、在某年级随机抽取35名大学生,调查他们每周的上网时间情况,得到的数据如下(单位:小时): (1)请利用SPSS对上表数据进行描述统计,并绘制相关的图形。 (2)基于上表数据,请利用SPSS给出大学生每周上网时间平均值的95%的置信区间。 (1)分析→描述统计→描述、频率

统计学(第五版)贾俊平-课后思考题和练习题答案(完整版)

统计学(第五版)贾俊平课后思考题和练习题答案(最终完整版) 第一部分思考题 第一章思考题 1.1什么是统计学 统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。 1.2解释描述统计和推断统计 描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。 推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。 1.3统计学的类型和不同类型的特点 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 1.4解释分类数据,顺序数据和数值型数据 答案同1.3 1.5举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 1.6变量的分类 变量可以分为分类变量,顺序变量,数值型变量。 变量也可以分为随机变量和非随机变量。经验变量和理论变量。 1.7举例说明离散型变量和连续性变量 离散型变量,只能取有限个值,取值以整数位断开,比如“企业数” 连续型变量,取之连续不断,不能一一列举,比如“温度”。 1.8统计应用实例 人口普查,商场的名意调查等。 1.9统计应用的领域 经济分析和政府分析还有物理,生物等等各个领域。

统计学第五章课后题及答案解析

第五章 练习题 一、单项选择题 1.抽样推断的目的在于() A.对样本进行全面调查 B.了解样本的基本情况 C.了解总体的基本情况 D.推断总体指标 2.在重复抽样条件下纯随机抽样的平均误差取决于() A.样本单位数 B.总体方差 C.抽样比例 D.样本单位数和总体方差 3.根据重复抽样的资料,一年级优秀生比重为10%,二年级为20%,若抽样人数相等时,优秀生比重的抽样误差() A.一年级较大 B.二年级较大 C.误差相同 D.无法判断 4.用重复抽样的抽样平均误差公式计算不重复抽样的抽样平均误差结果将()A.高估误差 B.低估误差 C.恰好相等 D.高估或低估 5.在其他条件不变的情况下,如果允许误差缩小为原来的1/2,则样本容量()A.扩大到原来的2倍 B.扩大到原来的4倍 C.缩小到原来的1/4 D.缩小到原来的1/2 6.当总体单位不很多且差异较小时宜采用() A.整群抽样 B.纯随机抽样 C.分层抽样 D.等距抽样 7.在分层抽样中影响抽样平均误差的方差是() A.层间方差 B.层内方差 C.总方差 D.允许误差 二、多项选择题 1.抽样推断的特点有() A.建立在随机抽样原则基础上 B.深入研究复杂的专门问题 C.用样本指标来推断总体指标 D.抽样误差可以事先计算 E.抽样误差可以事先控制 2.影响抽样误差的因素有() A.样本容量的大小 B.是有限总体还是无限总体 C.总体单位的标志变动度 D.抽样方法 E.抽样组织方式 3.抽样方法根据取样的方式不同分为() A.重复抽样 B.等距抽样 C.整群抽样 D.分层抽样 E.不重复抽样 4.抽样推断的优良标准是() A.无偏性 B.同质性 C.一致性 D.随机性 E.有效性 5.影响必要样本容量的主要因素有() A.总体方差的大小 B.抽样方法

统计学课后习题答案(全)

<<统计学 >> 课后习题参考答案 第四章 1. 计划完成相对指标二一8% 100% =10 2.9% 1+5% 2. 计划完成相对指标二 1 一6 % 100% =97.9% 1—4% 3. 4. 5.解:⑴计划完成相对指标= 14 防 13 100 %" 5. 56 % (2)从第四年二季度开始连续四季的产量之和为: 10+11 + 12+14=47 该产品到第五年第一季 已提前完成任务,提前 完成的天数 90 ?该产品总共提前10个月零15天完成任务。 6.解:计划完成相对指标 10 11 12 14-45 V 天 14 一10

156 230 540 279 325 470 535 200 1040.1% 100% =126.75% (2) 156+230+540+279+325+470=2000 (万吨) 所以正好提前半年完成计划 7. 第五章平均指标与标志变异指标 1 . X 甲= :.26 27 28 29 30 31 3 2 3334=30 9 —20 25 28 30 32 34 36 38 40 '1.44 X乙二9 AD甲二 26-30卩27 -30 28-30 29 -30 30-30 |31 -30 32 - 30 亠|33 - 30 叫34 - 30 9 -2.22 AD乙二 20—31.44” 25—31.44 十2〔8—31.44 屮30—31.44 +|32|— 31.44 + 34卜31.44 + 網 + 31.44 + 38— |31.44 + 4Q — 9 = 5.06 R 甲=34-26=8 R 乙=40-20=20

统计学第五版课后题答案

第一章导论 1.1 (1)数值型变量。 (2)分类变量。 (3)离散型变量。 (4)顺序变量。 (5)分类变量。 1.2 (1)总体是该市所有职工家庭的集合;样本是抽中的2000个职工家庭的集合。 (2)参数是该市所有职工家庭的年人均收入;统计量是抽中的2000个职工家庭的年人均收入。 1.3 (1)总体是所有IT从业者的集合。 (2)数值型变量。 (3)分类变量。 (4)截面数据。 1.4 (1)总体是所有在网上购物的消费者的集合。 (2)分类变量。 (3)参数是所有在网上购物者的月平均花费。 (4)参数 (5)推断统计方法。 第二章数据的搜集 1.什么是二手资料?使用二手资料需要注意些什么? 与研究内容有关的原始信息已经存在,是由别人调查和实验得来的,并会被我们利用的资料称为“二手资料”。使用二手资料时需要注意:资料的原始搜集人、搜集资料的目的、搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。在引用二手资料时,要注明数据来源。 2.比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。 概率抽样是指抽样时按一定概率以随机原则抽取样本。每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽中的概率,概率抽样的技术含量和成本都比较高。如果调查的目的在于掌握和研究总体的数量特征,得到总体参数的置信区间,就使用概率抽样。

非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。非概率抽样也适合市场调查中的概念测试。 3.调查中搜集数据的方法主要有自填式、面方式、电话式,除此之外,还有那些搜集数据的方法? 实验式、观察式等。 4. 自填式、面方式、电话式调查个有什么利弊? 自填式优点:调查组织者管理容易,成本低,可以进行较大规模调查,对被调查者可以刻选择方便时间答卷,减少回答敏感问题的压力。缺点:返回率低,调查时间长,在数据搜集过程中遇到问题不能及时调整。 面谈式优点:回答率高,数据质量高,在数据搜集过程中遇到问题可以及时调整可以充分发挥调查员的作用。缺点:成本比较高,对调查过程的质量控制有一定难度。对于敏感问题,被访者会有压力。 电话式优点:速度快,对调查员比较安全,对访问过程的控制比较容易,缺点:实施地区有限,调查时间不宜过长,问卷要简单,被访者不愿回答时,不宜劝服。 5.请举出(或设计)几个实验数据的例子。 不同饲料对牲畜增重有无影响,新旧技术的机器对组装同一产品所需时间的影响。 6.你认为应当如何控制调查中的回答误差? 对于理解误差,要注意表述中的措辞,学习一定的心里学知识。对于记忆误差,尽量缩短所涉及问题的时间范围。对于有意识误差,调查人员要想法打消被调查者得思想顾虑,调查人员要遵守职业道德,为被调查者保密,尽量避免敏感问题。 7.怎样减少无回答?请通过一个例子,说明你所考虑到的减少无回答的具体措施。 对于随机误差,可以通过增加样本容量来控制。对于系统误差,做好预防,在调查前做好各方面的准备工作,尽量把无回答率降到最低程度。无回答出现后,分析武回答产生的原因,采取补救措施。比如要收回一百份,就要做好一百二十份或一百三十份问卷的准备,当被调查者不愿意回答时,可以通过一定的方法劝服被访者,还可以通过馈赠小礼品等的方式提高回收率。 第三章数据的图表搜集 一、思考题 3.1数据的预处理包括哪些内容? 答:审核、筛选、排序等。 3.2分类数据和顺序数据的整理和显示方法各有哪些? 答:分类数据在整理时候先列出所分的类别,计算各组的频数、频率,得到频数分布表,

相关主题
文本预览
相关文档 最新文档