当前位置:文档之家› #统计学第七章、第八章课后题答案

#统计学第七章、第八章课后题答案

#统计学第七章、第八章课后题答案
#统计学第七章、第八章课后题答案

统计学复习笔记

第七章

一、 思考题

1. 解释估计量和估计值

在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。

2. 简述评价估计量好坏的标准

(1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。

(2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。

(3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。

3. 怎样理解置信区间

在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。

4. 解释95%的置信区间的含义是什么

置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。

不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。

5. 简述样本量与置信水平、总体方差、估计误差的关系。

1. 估计总体均值时样本量n 为

2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为

与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需要的样本量越大;

其中: 2222α2222)(E z n σα=n z E σα2=

? 与总体方差成正比,总体的差异越大,所要求的样本量也越大;

? 与与总体方差成正比,样本量与估计误差的平方成反比,即可以接

受的估计误差的平方越大,所需的样本量越小。

二、 练习题

1. 从一个标准差为5的总体中采用重复抽样方法抽出一个样本量为40的样本,样本均值为25。

1) 样本均值的抽样标准差x x

σ等于多少? 2) 在95%的置信水平下,估计误差是多少?

解: 1) 已知σ = 5,n = 40,

= 25

∵ ∴ x σx σ = 5 /√40 ≈ 0.79 2) 已知

∵ ∴ 估计误差 E = 1.96×5÷√40 ≈ 1.55

2. 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。

1) 假定总体标准差为15元,求样本均值的抽样标准误差。

2) 在95%的置信水平下,求估计误差。

3) 如果样本均值为120元,求总体均值μ的95%的置信区间。 解:1)已知σ = 15,n = 49 ∵ ∴ x σx σ = 15÷√49 = 2.14 2)已知

∵ x n

x n x σσ=α2n z E σα2=n x n x σσ=n

x n x σσ=α2n z E σα2=

∴ 估计误差 E = 1.96×15÷√49 ≈ 4.2

3)已知

= 120

∵ 置信区间为

±E ∴ 其置信区间 = 120±4.2

3. 从一个总体中随机抽取n =100的随机样本,得到

=104560,假定总体标准差σ = 85414,试构建总体均值μ的95%的置信区间。

解: 已知n =100, =104560,σ = 85414,1-α=95% ,

由于是正态总体,且总体标准差已知。总体均值μ在1-α置信水平下的置信区间为

104560 ± 1.96×85414÷√100

= 104560 ±16741.144 4. 从总体中抽取一个n =100的简单随机样本,得到 =81,s=12。要求:

1) 构建μ的90%的置信区间。

2) 构建μ的95%的置信区间。

3) 构建μ的99%的置信区间。

解:由于是正态总体,但总体标准差未知。总体均值μ在1-α置信水平下的置信区间公式为

81±

×12÷√100 = 81±×1.2

1)1-α=90%, 1.65 其置信区间为 81 ± 1.98

x x x x 2α()28.109,44.10192.336.1052510

96.136.1052=±=?±=±n z x σ

αx

2)1-α=95% ,

其置信区间为 81 ± 2.352

3) 1-α=99%

, 2.58

其置信区间为 81 ± 3.096

5. 利用下面的信息,构建总体均值的置信区间。

1)

= 25,σ = 3.5,n =60,置信水平为95%

2) =119,s =23.89,n =75,置信水平为98%

3) =3.149,s =0.974,n =32,置信水平为90%

解:∵ ∴ 1) 1-α=95% ,

其置信区间为:25±1.96×3.5÷√60

= 25±0.885

2) 1-α=98% ,则α=0.02, α/2=0.01, 1-α/2=0.99,查标准正态分布表,可知: 2.33

其置信区间为: 119±2.33×23.89÷√75

= 119±6.345

3) 1-α=90%, 1.65

其置信区间为: 3.149±1.65×0.974÷√32

= 3.149±0.284

6. 利用下面的信息,构建总体均值μ的置信区间:

1) 总体服从正态分布,且已知σ = 500,n = 15,

=8900,置信水平为95%。

x x x 22未知αα)(22未知或σσααn

s z x n z x ±±x

解: N=15,为小样本正态分布,但σ已知。则1-α=95%

。其置信区间公式为 ∴置信区间为:8900±1.96×500÷√15=(8646.7 , 9153.2)

2) 总体不服从正态分布,且已知σ = 500,n = 35

, =8900,置信水平为95%。

解:为大样本总体非正态分布,但σ已知。则1-α=95%,

。其置信区间公式为 ∴置信区间为:8900±1.96×500÷√35=(8733.9 9066.1)

3) 总体不服从正态分布,σ未知,n = 35, =8900,s =500,置信水平为90%。

解:为大样本总体非正态分布,且σ未知,1-α=90%,

1.65。 其置信区间为: 8900±1.65×500÷√35=(8761 9039)

4) 总体不服从正态分布,σ未知,n = 35, =8900,s =500,置信水平为99%。

解:为大样本总体非正态分布,且σ未知,1-α=99%,

2.58。 其置信区间为:

8900±2.58×500÷√35=(8681.9

9118.1)

7. 某大学为了解学生每天上网的时间,在全校7500名学生中采取重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时)(略)。求该校大学生平均上网时间的置信区间,置信水平分别为90% 2α()28.109,44.10192.336.105251096.136.1052=±=?

±=±n z x σαx 2α()28.109,44.10192.336.105251096.136.1052=±=?

±=±n z x σαx x

解:先求样本均值:= 3.32

再求样本标准差:

置信区间公式:

8.从一个正态总体中随机抽取样本量为8的样本,各样本值分别为:10,8,12,15,6,13,5,11。求总体均值μ的95%置信区间。解:本题为一个小样本正态分布,σ未知。

先求样本均值:= 80÷8=10

再求样本标准差:= √84/7 = 3.4641

于是 , 的置信水平为的置信区间是

,

已知,n = 8,则,α/2=0.025,查自由度为

n-1 = 7的分布表得临界值 2.45

所以,置信区间为:10±2.45×3.4641÷√7

9.某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离分别是:10,3,14,8,6,9,12,11,7,5,10,15,9,16,13,2。假设总体服从正态分

布,求职工上班从家里到单位平均距离的95%的置信区间。

解:小样本正态分布,σ未知。已知,n = 16,,则

,

α/2=0.025,查自由度为n-1 = 15的分布表得临界值

2.14

样本均值=150/16=9.375

再求样本标准差:= √253.75/15 ≈4.11

于是 , 的置信水平为

的置信区间是

,

9.375±2.14×4.11÷√16

10.从一批零件是随机抽取36个,测得其平均长度是149.5,标准差是1.93。

1)求确定该种零件平均长度的95%的置信区间。

2)在上面估计中,你使用了统计中的哪一个重要定理?请解释。

解:1)这是一个大样本分布。已知N=36,

= 149.5,S =1.93,

1-α=0.95,。

其置信区间为:149.5±1.96×1.93÷√36 2)中心极限定理论证:如果总体变量存在有限的平均数和方差,那么,不论这个总体的分布如何,随着样本容量的增加,样本均值的分布便趋近正态分布。在现实生活中,一个随机变量服从正态分

x

布未必很多,但是多个随机变量和的分布趋于正态分布则是普遍存在的。样本均值也是一种随机变量和的分布,因此在样本容量充分大的条件下,样本均值也趋近于正态分布,这为抽样误差的概率估计理论提供了理论基础。

11.某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克,现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量如下:(略)

已知食品包重服从正态分布,要求:

1)确定该种食品平均重量的95%的置信区间。

2)如果规定食品重量低于100克属于不合格,确定该批食品合格率的95%的置信区间。

解:1)本题为一个大样本正态分布,σ未知。已知N=50,μ =100,1-α=0.95,。

①每组组中值分别为97、99、101、103、105,即此50包样本平均值= (97+99+101+103+105)/5 = 101

②样本标准差为:

=√{(97-101)2×2+(99-101)2×3+(101-101)2×34+(103-101)2×7+(105-101)2×4}÷(50-1)≈ 1.666

③其置信区间为:101±1.96×1.666÷√50

2)∵不合格包数(<100克)为2+3=5包,5/50 = 10%(不合格率),即P = 90%。

∴该批食品合格率的95%置信区间为:

= 0.9 ±1.96×√(0.9×0.1)÷50= 0.9 ±1.96×0.042 12.假设总体服从正态分布,利用下面的数据构建总体均值μ的99%的置信区间。(略)

解:样本均值

样本标准差:

尽管总体服从正态分布,但是样本n=25是小样本,且总体标准差未知,应该用T统计量估计。1-α=0.99,则α=0.01,

α/2=0.005,查自由度为n-1 = 24的分布表得临界值 2.8

的置信水平为的置信区间是,

13.一家研究机构想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取了18个员工,得到他们每周加班的时间数据如下(单位:小时):(略)

假定员工每周加班的时间服从正态分布,估计网络公司员工平均每周加班时间的90%的置信区间。

解:① N = 18 < 30,为小样本正态分布,σ未知。

②样本均值= 244/18 = 13.56

样本标准差:=

③ 1-α= 90%,α= 0.1,α/2= 0.05,则查自由度为n-1 = 17

的分布表得临界值 1.74

④的置信水平为的置信区间是,

14.利用下面的样本数据构建总体比例丌的置信区间:

1)n =44,p = 0.51 ,置信水平为99%

2)n =300,p = 0.82 ,置信水平为95%

3)n =1150,p = 0.48,置信水平为90%

解:1)1-α= 99%,α= 0.01,α/2= 0.005,1-α/2= 0.995,

查标准正态分布表,则 2.58

2)1-α=95%,

3)1-α=90%, 1.65

分别代入

15.在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机,其中拥有该品牌电视机的家庭占23%。求总体比例的置信区间,置信水平分别为90%和95%。

解:1)置信水平90%,1-α=90%, 1.65,N = 200,P = 23%。

代入

2)置信水平95%,1-α=95%,,N = 200,P =

23%。代入

16.一位银行的管理人员想估计每位顾客在该银行的月平均存款额。他假设所有顾客月存款额的标准差为1000元,要求的估计误差在200元以内,置信水平为99%。应选取多大的样本?

解:已知 1-α = 99%,则 2.58。E = 200,σ= 1000元。

则 N = (2×σ2)÷E2= (2.582×10002)÷2002≈167 (得数应该是166.41,不管小数后是多少,都向上进位取整,因此至少是167人)

17.要估计总体比例丌,计算下列条件下所需的样本量。

1)E=0.02,丌=0.40,置信水平96%

2)E=0.04,丌未知,置信水平95%

3)E=0.05,丌=0.55,置信水平90%

解:1)已知 1-α = 96%,α/2 =0.02 ,则 2.06

N = {2×丌(1-丌)}÷E2=2.062×0.4×0.6÷0.022≈2547

2) 已知 1-α = 95%,α/2 =0.025 ,则 1.96

丌未知,则取使丌(1-丌)最大时的0.5。

N = {2×丌(1-丌)}÷E2=1.962×0.5×0.5÷0.042≈601

3)置信水平90%,1-α=90%, 1.65,

N = {2×丌(1-丌)}÷E2=1.652×0.55×0.45÷0.052≈270 18.某居民小区共有居民500户,小区管理者准备采用一项新的供水设施,想了解居民是否赞成。采取重复抽样方法随机抽取了50户,其中有32户赞同,18户反对。

1)求总体中赞成该项改革的户数比例的置信区间(α=0.05)2)如果小区管理者预计赞成的比例能达到80%,估计误差不超过10%,应抽取多少户进行调查(α=0.05)

解:1)

已知N=50,P=32/50=0.64,α=0.05,α/2 =0.025 ,则 1.96

置信区间:P±√{P(1-P)/N}= 0.64±1.96√0.64×0.36/50 = 0.64±1.96×0.48/7.07=0.64±0.133

2)已知丌=0.8 , E = 0.1, α=0.05,α/2 =0.025 ,则 1.96

N= 2丌(1-丌)/E2= 1.962×0.8×0.2÷0.12≈62

19.根据下面的样本结果,计算总体标准差σ的90%的置信区间:1)=21,S=2,N=50

2)=1.3,S=0.02,N=15

3)=167,S=31,N=22

解:1)大样本,σ未知,置信水平90%,1-α=90%, 1.65

21±1.65×2÷√50

2)小样本,σ未知,置信水平90%,1-α=90%,则查自由度

为n-1 = 14的分布表得临界值 1.761

, = 1.3±1.761×0.02÷√15

3) 大样本, σ未知,置信水平90%,1-α=90%, 1.65

167±1.65×31÷√22

20.题目(略)

1)构建第一种排队方式等待时间标准差的95%的置信区间

2)构建第二种排队方式等待时间标准差的95%的置信区间

3)根据1)和2)的结果,你认为哪种排队方式更好?

解:本题为小样本正态分布,σ未知,应用公式

,

置信水平95%,1-α=95%,则查自由度为n-1 = 9的分布表

得临界值 2.31

1)= 7.15,

= √2.045/9≈0.48

其置信区间为7.15±2.31×0.48÷√10

2) = 7.15

= √0/9 = 0

其置信区间为7.15±0

4)第二种排队方式更好.

(19题是对总体方差的估计,应该用卡方统计量进行估计,20题

是对两个总体参数的估计,这二种类型老师未讲,不是本次考试的内容,不能用Z统计量像估计总体均值和比例那样去估计,具体内容见书上P188――P194)

第八章

一、思考题

1.假设检验和参数估计有什么相同点和不同点?

解:参数估计与假设检验是统计推断的两个组成部分。

相同点:它们都是利用样本对总体进行某种推断。

不同点:推断的角度不同。参数估计讨论的是用样本统计量估计总体参数的方法,总体参数μ在估计前是未知的。而在假设检验中,则是先对μ的值提出一个假设,然后利用样本信息去检验这个假设是否成立。

2.什么是假设检验中的显著性水平?统计显著是什么意思?

解:显著性水平用α表示,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险,即假设检验中犯弃真错误的概率。它是由人们根据检验的要求确定的。

(我理解的统计学意义,统计显著是统计上专用的判定标准,指在一定的概率原则下,可以承认一种趋势或者合理性达到的程度,达到为统计上水平显著,达不到为统计上水平不显著)

3.什么是假设检验中的两类错误?

解:弃真错误(α错误):当原假设为真时拒绝原假设,所犯的错误成为第I类错误,又称为弃真错误。犯第I类错误的概率常记作α。

取伪错误(β错误):当原假设为假时没有拒绝原假设,所犯的错误称为第II类错误,又称取伪错误。犯第II类错误概率常记作β。

发生第I类错误的概率也常被用于检验结论的可靠性度量。假设检验中犯第I类错误的概率被称为显著性水平,记作α。

4.两类错误之间存在什么样的数量关系?

在样本容量n一定的情况下,假设检验不能同时做到犯α和β两类错误的概率都很小。若减小α错误,就会增大犯β错误的机会;若减小β错误,也会增大犯α错误的机会。要使α和β同时变小只有增大样本容量。但样本容量增加要受人力、经费、时间等很多因素的限制,无限制增加样本容量就会使抽样调查失去意义。因此假设检验需要慎重考虑对两类错误进行控制的问题。

5.解释假设检验中的P值。

解:如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为P值。也称为观察到的显著性水平。

P值是反映实际观测到的数据与原假设H0之间不一致程度的一个概率值。P值越小,说明实际观测到的数据与H0之间不一致程度就越大。

6.显著性水平与P值有何区别?

解:α(显著性水平)是一个判断的标准(当原假设为真,却被拒绝的概率),而P是实际统计量对应分位点的概率值(当原假设为真时,所得到的样本观察结果或更极端结果出现的概率)。

可以通过α计算置信区间,然后与统计量进行比较判断,也可以

通过统计量计算对应的p值,然后与α值比较判断。

7.假设检验依据的基本原理是什么?

解:假设检验利用的是小概率原理,小概率原理是指发生概率很小的随机事件在一次试验中是几乎不可能发生的。根据这一原理,可以先假设总体参数的某项取值为真,也就是假设其发生的可能性很大,然后抽取一个样本进行观察,如果样本信息显示出现了与事先假设相反的结果且与原假设差别很大,则说明原来假定的小概率事件在一次实验中发生了,这是一个违背小概率原理的不合理现象,因此有理由怀疑和拒绝原假设;否则不能拒绝原假设。

8.你认为在单侧检验中原假设和备择假设的方向应该如何确定?

解:假设问题有两种情况,一种是所考察的数值越大越好(左单侧检验或下限检验),临界值和拒绝域均在左侧;另一种是数值越小越好(右单侧检验或上限检验),临界值和拒绝域均在右侧。

二、练习题

1.已知某炼铁厂的含碳量服从正态分布N(4.55,0.1082),现在测定了9炉铁水,其平均含碳量为4.484。如果估计方差没有变化,可否认为现在生产的铁水平均含碳量为4.55(α=0.05)?

解:已知μ0=4.55,σ2=0.1082,N=9,=4.484,

这里采用双侧检验,小样本,σ已知,使用Z统计。

假定现在生产的铁水平均含碳量与以前无显著差异。则,

H0 :μ=4.55 ;H1 :μ≠4.55

α=0.05,α/2 =0.025

,查表得临界值为

1.96

计算检验统计量: = (4.484-4.55)/(0.108/√9) = -1.833

决策:∵Z 值落入接受域,∴在α=0.05的显著性水平上接受H 0。

结论:有证据表明现在生产的铁水平均含碳量与以前没有显著差异,可以认为现在生产的铁水平均含碳量为4.55。

2. 一种元件,要求其使用寿命不得低于700小时。现从一批这种元件中随机抽取36件,测得其平均寿命为680小时。已知该元件寿命服从正态分布,σ=60小时,试在显著性水平0.05下确定这批元件是否合格。

解: 已知N=36,σ=60,=680,μ0 =700

这里是大样本,σ已知,左侧检验,采用Z 统计量计算。 提出假设:假定使用寿命平均不低于700小时

H 0:μ≥700

H 1: μ < 700

α = 0.05,左检验临界值为负,查得临界值: -Z 0.05=-1.645 计算检验统计量:

= (680-700)/(60/√36) = -2

决策:∵Z 值落入拒绝域,∴在α=0.05的显著性水平上拒绝H 0,接受H 1 n

x Z / σ - =

n x Z / σ - =

μ0 μ0

结论:有证据表明这批灯泡的使用寿命低于700小时,为不合格产品。

3.某地区小麦的一般生产水平为亩产250公斤,其标准差是30公斤。现用一种化肥进行试验,从25个小区抽样,平均产量为270公斤。这种化肥是否使小麦明显增产(α=0.05)?

解:已知μ0 =250,σ = 30,N=25,=270

这里是小样本分布,σ已知,用Z统计量。右侧检验,α =0.05,则Zα=1.645

提出假设:假定这种化肥没使小麦明显增产。

即H0:μ≤250

H1: μ> 250

计算统计量:

Z = (-μ0)/(σ/√N)= (270-250)/(30/√25)= 3.33 结论:Z统计量落入拒绝域,在α=0.05的显著性水平上,拒绝H0,接受H1。

决策:有证据表明,这种化肥可以使小麦明显增产。

4.糖厂用自动打包机打包,每包标准重量是100千克。每天开工后需要检验一次打包机工作是否正常。某日开工后测得9包重量(单位:千克)如下:(略)

已知包重服从正态分布,试检验该日打包机工作是否正常。(α=0.05)

解:已知N=9,这里是小样本正态分布,σ未知,双侧检验,采用t

统计量,自由度为N-1=8。α =0.05,则T α/2=2.37

= 99.98

≈1.22

提出假设,假设打包机工作正常:

即 H 0:μ= 100

H 1: μ ≠ 100

计算统计量:

= (99.98-100)/( 1.22/√9)≈-0.049 结论:∵t 值落入接受域,∴在α=0.05的显著性水平上接受H 0 决策:有证据表明这天的打包机工作正常。

5. 某种大量生产的袋装食品,按规定不得少于250克。今从一批该食品中任意抽取50袋,发现有6袋低于250克。若规定不符合标准的比例超过5%就不得出厂,问该批食品能否出厂(α=0.05)? 解:已知N=50,P=6/50=0.12,为大样本,右侧检验,用Z 统计量计算。α=0.05,即Z α=1.645

H 0:丌≤5%

H 1:丌>5% = (0.12-0.05)/√(0.05×0.95÷50)≈2.26 (因为没有找到丌表示的公式,这里用P 0表示丌0)

- = n

s x t μ0

0)1,0(~)1(000N n P P P p z --=

结论:因为Z值落入拒绝域,所以在α=0.05的显著性水平上,拒绝H0,而接受H1。

决策:有证据表明该批食品合格率不符合标准,不能出厂。6.某厂家在广告中声称,该厂生产的汽车轮胎在正常行驶条件下超过目前的平均水平25000公里。对一个由15个轮胎组成的随机样本做了试验,得到样本均值和标准差分别为27000公里和5000公里。假定轮胎寿命服从正态分布,问该厂家的广告是否真实(α=0.05)?解:N=15, =27000,s=5000,小样本正态分布,σ未知,用t统计量计算。这里是右侧检验,α=0.05,自由度N-1=14,即tα=1.77 H0:μ0 ≤25000

H1:μ>25000

= (27000-25000)/(5000÷√15)≈1.55 结论:因为t值落入接受域,所以接受H0,拒绝H1。

决策:有证据表明,该厂家生产的轮胎在正常行驶条件下使用寿命与目前平均水平25000公里无显著性差异,该厂家广告不真实。7.某种电子元件的寿命x(单位:小时)服从正态分布。现测得16只元件的寿命如下:(略)。问是否有理由认为元件的平均寿命显著地大于225小时(α=0.05)?

解:= 241.5,

= 98.726

-

=

n

s

x

t

μ0

统计学基础课后思考题答案(仅供参考)前六章

第一章概论 1、“统计”一词有统计工作、统计资料、统计学三种涵义。统计资料是统计工作的成果,统计工作和统计资料是过程与成果的关系。 2、统计学的研究对象是客观现象(包括社会现象和自然现象)总体的数量方面。它具有数量性、总体性、变异性、具体性、社会性的特点。 3、统计学的性质是属于方法论学科,统计学是一门研究客观现象总体数量方面的独立的方法论科学。 4、统计学的基本研究方法:大量观察法、统计分组法、综合指标法、统计模型法、归纳推断法。 5、统计学的基本职能有:信息职能、咨询职能、监督职能。 6、统计的基本任务:一方面是以国民经济和社会发展为统计调查的对象,在对其数量方面进行科学的统计分析的基础上,为党和国家制定政策、各部门编制计划,指导经济和社会发展及进行科学管理提供信息和咨询服务;另一方面则是对国民经济和社会的运行状态、国家政策,计划的执行情况等进行统计监督。 7、统计工作的过程包括:统计设计、统计调查、统计整理和统计分析。 8、统计总体是指客观存在的,在同一性质的基础上结合起来的许多个别事物构成的整体,简称总体。总体单位是指构成总体的个别事物,简称个体。总体和总体单位是整体与部分、集合与元素的关系,它们互为存在条件。总体是界定总体单位的前提条件,总体单位是构成总体的基本元素。 9、标志按性质不同可分为品质标志和数量标志,按变异情况可分为不变标志和可变标志。 10、统计指标的特点:数量性、综合性、具体性。统计指标按其说明总体特征的性质不同,可分为数量指标和质量指标;按表现形式不同,可分为总量指标、相对指标,平均指标;按计量单位的不同,可分为实物量指标、价值指标和劳动量指标;按指标功能的不同,可分为描述指标、评价指标和预警指标。 11、(简)指标与标志的联系,具有对应关系、汇总关系、转换关系;指标与标志的区别,说明对象范围的不同,具体表现形式不同。(详)指标与标志有哪些区别及联系? 区别: ①指标和标志的概念明显不同,标志是说明个体特征的,一般不具有综合的特征:指标是说明总体特征的,具有综合的性质。 ②统计指标分为数量指标和质量指标,它们都是可以用数量来表示的;标志分为数量标志和品质标志,它们不是都可以用数量来表示,品质标志只能用文字表示。 联系: ③统计指标是建立在标志值的基础之上的,它是各个总体单位的数量标志值的汇总,没有总体单位的标志值 也就不可能有总体的指标值。 ④随研究目的不同,指标与标志之间可以互相转化。两者体现这样的关系,指标在标志的基础上形成,指标又是确定标志的依据。 12、变量的分类:按变量值是否连续,可分为连续型变量和离散型变量;按照其性质不同,可分为确定性变量和随机变量。13、统计指标体系分为基本统计指标体系和 专题统计指标体系两大类。 第二章统计调查 1、统计调查是根据统计研究的目的、要求和 任务,采用科学的调查方法,有计划、有组 织地搜集统计资料的工作过程。统计调查在 统计工作的整个过程中,担负着提供基础资 料的任务,所有的统计计算和统计研究都是 在原始资料搜集的基础上建立起来的。 2、统计调查的基本要求: (1)准确性。即统计调查得到的资料应 该是真实可靠的、符合客观实际,不受人的 主观偏见和错误意识的影响。 (2)及时性。即统计调查要按时完成资 料的搜集和上报任务,以及充分发挥统计资 料的时间价值。 (3)完整性。统计调查搜集的资料,一 是要调查单位的完整、做到调查单位不重复、 不遗漏,以保证反映被研究对象整体的面貌; 二是要做到搜集的项目齐全,调查项目不仅 具有层次性,而且是紧密链接、赋予逻辑联 系,齐全的调查项目才能实现调查研究的目 的和任务。 3、一份完整的统计调查方案,应包括: (1)确定调查目的; (2)确定调查对象、调查单位和报告单位; (3)拟定调查项目、制定调查表; (4)规定调查时间和调查期限、调查地点 和方法; (5)制定调查工作的组织实施计划。 4、调查表的内容有:表头、表体和表脚。 调查表分无记名调查反馈表和记名调查 反馈表。 5、统计调查的组织形式有统计报表、普查、 重点调查、典型调查和抽样调查。 6、重点调查与典型调查有何异同? 相同点: 都是非全面调查;调查单位少,可节省 人力、物力、时间;灵活性强;属于有部分 到全面的调查方式。 区别: (1)定义不同 重点调查是一门专门组织的非全面调 查,它是在调查对象的全部单位中只选择一 小部分重点单位进行调查,以了解总体的基 本情况。 典型调查是一种十分重要的,行之有效 的非全面调查方法。它是根据调查目的和要 求,在对被研究对象做全面分析的基础上, 有意识地从中选择少数具有代表性的典型单 位进行深入细致地调查研究,以便认识事物 的本质及其规律性的一种非全面调查。 (2)特点不同 重点调查的主要特点是:投入少、调查 速度快、所反映的主要情况或基本趋势比较 准确。 典型调查的主要特点是:调查单位少、 机动灵活、典型单位的选择带有一定的主观 性、典型单位可以注重于现象数量方面的分 析。 (3)组织形式不同 重点调查既可以是一次性调查性调查, 也可以用于经常性调查。其组织形式可以是 组织专门调查,也可以颁发统计报表,由选 中重点单位填报。 典型调查一般有两种方式:“解剖麻雀” 式和“化类选典”式。 (4)调查方式的优缺点不同 重点调查:优点:调查单位少,可调查 较多的项目和指标,了解较详细的效果,能 使党政领导尽快的掌握基本情况,发现问题, 采取措施,以指导工作。 缺点:因为重点调查单位与一般单位的 差别较大,通常不能用重点调查结果来推算 调查总体的指标 典型调查:优点:是补充全面调查资料 的缺口,利用典型调查资料,可以分析全面 调查不能认识清楚地一些具体问题,还可以 深入研究新生事物,找出事物变化发展的规 律,用来推断总体的指标数值。 缺点:主要是针对问题的普遍性研究, 不够深入 根本区别在于选取调查单位的方法不同。 典型调查单位的选择取决于调查者的主 观判断,因此具有主观性。重点调查单位的 选择取决于某一标志总量在总体所占比重, 因此具有客观性。 典型调查虽然在一定条件下,能根据典 型单位估计推断总体。但由于无法合理估计 其误差,因此不能根据典型单位的数量特征, 推断总体单位的数量特征。不过,可以利用 典型调查得到的具体、详细事例,补充分析 抽样调查无法获得具体、详细事例的不足。 7、统计调查的方法有:观察法、询问法、报 告法、网络调查法和问卷调查法。 观察法:优点是取得的资料比较准确; 缺点是花费的人力、物力、财力和时间都较 多,而且具有局限性。 询问法:优点是调查者能按统计口径逐 项询问,对统计项目有统一的理解,可保证 调查资料的准确性;缺点是花费大量的人力 和时间。 报告法:优点是准确性不亚于观察法; 缺点是花费较多的人力和物力。 网络调查法:优点是速度快、费用低、 易获得联系性数据、调研内容设置灵活、调 研群体大和可视性强;缺点是代表性问题、 安全性问题和无限制样本问题。 问卷调查法:优点是节省时间、经费和 人力;调查结果容易量化、便于统计处理与 分析;现在的电子问卷克服了纸质问卷的一 些缺点,方便实施与调整;可以进行大规模 的调查。 缺点是面向设计的问题问卷调查比较 难;调查结果广而不深;问卷调查经常采用 由用户自己填答问卷的方式,所以其调查结 果的质量常常得不到保证。;问卷调查的回 收率难以保证。 8、调查问卷的结构由卷首语(开场白)、正 文和结尾组成。 问卷的设计形式有开放式和封闭式。 第三章统计数据的整理与显示 1、统计数据整理的主要内容(步骤)是:(1) 统计资料整理方案的设计;(2)对调查资料 的审核;(3)对调查资料进行科学的分组、 汇总;(4)数据资料的显示——编制和绘制 统计表(图);(5)统计资料的保管与积累。 2、统计分组就是根据统计研究的目的和被研 究现象总体的内在特征,将统计整体按照一 定的标志划分为若干性质不同的部分或组的 一种统计方法。统计分组的关键在于确定分 组标志和组距。

2014统计学课后复习题答案

《应用统计学》习题解答 第一章绪论 【1.1】指出下列变量的类型: (1)汽车销售量; (2)产品等级; (3)到某地出差乘坐的交通工具(汽车、轮船、飞机); (4)年龄; (5)性别; (6)对某种社会现象的看法(赞成、中立、反对)。 【解】(1)数值型变量 (2)顺序变量 (3)分类变量 (4)数值型变量 (5)分类变量 (6)顺序变量 【1.2】某机构从某大学抽取200个大学生推断该校大学生的月平均消费水平。 要求: (1)描述总体和样本。 (2)指出参数和统计量。 (3)这里涉及到的统计指标是什么? 【解】(1)总体:某大学所有的大学生 样本:从某大学抽取的200名大学生 (2)参数:某大学大学生的月平均消费水平 统计量:从某大学抽取的200名大学生的月平均消费水平 (3)200名大学生的总消费,平均消费水平 【1.3】下面是社会经济生活中常用的统计指标: ①轿车生产总量,②旅游收入,③经济发展速度,④人口出生率,⑤安置再就业人数,⑥全国第三产业发展速度,⑦城镇居民人均可支配收入,⑧恩格尔系数。 在这些指标中,哪些是数量指标,哪些是质量指标?如何区分质量指标与数量指标?【解】数量指标有:①、②、⑤ 质量指标有:③、④、⑥、⑦、⑧ 数量指标是说明事物的总规模、总水平或工作总量的指标,表现为绝对数的形式,并附有计量单位。而质量指标是说明总体相对规模、相对水平、工作质量和一般水平的统计指标,通常是两个有联系的统计指标对比的结果。 【1.4】某调查机构从某小区随机地抽取了50为居民作为样本进行调查,其中60%的居民对自己的居住环境表示满意,70%的居民回答他们的月收入在6000元以下,生活压力大。 回答以下问题: (1)这一研究的总体是什么? (2)月收入是分类变量、顺序变量还是数值型变量? (3)对居住环境的满意程度是什么变量? 【解】(1)这一研究的总体是某小区的所有居民。

统计学课后练习题答案人大第四版

第三章节:数据的图表展示 (1) 第四章节:数据的概括性度量 (15) 第六章节:统计量及其抽样分布 (26) 第七章节:参数估计....................................................... (28) 第八章节:假设检验........................................................ (38) 第九章节:列联分析........................................................ (41) 第十章节:方差分析........................................................ (43) 3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C E E A B D D C A D B C C A E D C B C B C E D B C C B C 要求: (1)指出上面的数据属于什么类型。 顺序数据 (2)用Excel制作一张频数分布表。 用数据分析——直方图制作: 接收频率 E16 D17 C32 B21 A14 (3)绘制一张条形图,反映评价等级的分布。 用数据分析——直方图制作: (4)绘制评价等级的帕累托图。 逆序排序后,制作累计频数分布表:

统计学4章练习题+答案

| 第4章练习题 1、一组数据中出现频数最多的变量值称为(A) A.众数 B.中位数 C.四分位数 D.平均数 2、下列关于众数的叙述,不正确的是(C) A.一组数据可能存在多个众数 B.众数主要适用于分类数据 C.一组数据的众数是唯一的 , D.众数不受极端值的影响 3、一组数据排序后处于中间位置上的变量值称为(B) A.众数 B.中位数 C.四分位数 D.平均数 4、一组数据排序后处于25%和75%位置上的值称为(C) A.众数 B.中位数 C.四分位数 D.平均数 5、非众数组的频数占总频数的比例称为(A) A.异众比率 B.离散系数 C.平均差 D.标准差 6、四分位差是(A) ) A.上四分位数减下四分位数的结果 B.下四分位数减上四分位数的结果 C.下四分位数加上四分位数 D.下四分位数与上四分位数的中间值 7、一组数据的最大值与最小值之差称为(C) A.平均差 B.标准差 C.极差 D.四分位差 8、各变量值与其平均数离差平方的平均数称为(C) A.极差 B.平均差 C.方差 D.标准差 | 9、变量值与其平均数的离差除以标准差后的值称为(A) A.标准分数 B.离散系数 C.方差 D.标准差 10、如果一个数据的标准分数-2,表明该数据(B) A.比平均数高出2个标准差 B.比平均数低2个标准差 C.等于2倍的平均数 D.等于2倍的标准差 11、经验法则表明,当一组数据对称分布时,在平均数加减2个标准差的范围之内大约有(B)> %的数据 %的数据 %的数据%的数据 12、如果一组数据不是对称分布的,根据切比雪夫不等式,对于k=4,其意义是(C) A.至少有75%的数据落在平均数加减4个标准差的范围之内 B. 至少有89%的数据落在平均数加减4个标准差的范围之内 C. 至少有94%的数据落在平均数加减4个标准差的范围之内 D. 至少有99%的数据落在平均数加减4个标准差的范围之内

统计学思考题答案

4.1一组数据的分布特征可以从哪几个方面进行测度? 数据分布特征可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或集中的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。 2. 4.5简述众数、中位数和平均数的特点和应用场合。 众数是一组数据分布的峰值,不受极端值的影响,缺点是具有不唯一性。众数只有在数据量较多时才有意义,数据量较少时不宜使用。主要适合作为分类数据的集中趋势测度值。 中位数是一组数据中间位置上的代表值,不受极端值的影响。当数据的分布偏斜较大时,使用中位数也许不错。主要适合作为顺序数据的集中趋势测度值。 平均数对数值型数据计算的,而且利用了全部数据信息,在实际应用中最广泛。当数据呈对称分布或近似对称分布时,三个代表值相等或相近,此时应选择平均数。但平均数易受极端值的影响,对于偏态分布的数据,平均数的代表性较差,此时应考虑中位数或众数。 4.7标准分数有哪些用途? 标准分数给出了一组数据中各数值的相对位置。在对多个具有不同量纲的变量进行处理时,常需要对各变量进行标准化处理。它还可以用来判断一组数据是否有离群数据。 7.3怎样理解置信区间? 置信区间:由样本统计量所构造的总体参数的估计区间 7.4解释95%的置信区间。 95%的置信区间指用某种方法构造的所有区间中有95%的区间包含总体参数的真值。 7.5 Za/2的含义是什么 含义:Za/2是标准正态分布上侧面积为a/2的z值,公式是统计总体均值时的边际误差。 7.6 解释独立样本和匹配样本的含义。 独立样本:如果两个样本是从两个总体中独立抽取的,即一个样本中的元素与另一个样本中的元素相互独立。 匹配样本:一个样本中的数据与另一个样本中的数据相对应。 7.8简述样本量与置信水平、总体方差、边际误差的关系。 样本量越大置信水平越高,总体方差和边际误差越小 10.1什么是方差分析?它研究的是什么? 答:方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。它所研究的是非类型自变量对数值型因变量的影响。 10.4方差分析中有哪些基本假定? 答:方差分析中有三个基本假定: (1)每个总体都应服从正态分布 (2)各个总体的方差σ2必须相同 (3)观测值是独立的

统计学课后习题答案(Chap1.2)

第1章绪论 1.什么是统计学怎样理解统计学与统计数据的关系 2.试举出日常生活或工作中统计数据及其规律性的例子。 3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)描述推断。 答:(1)总体:最近的一个集装箱内的全部油漆; (2)研究变量:装满的油漆罐的质量; (3)样本:最近的一个集装箱内的50罐油漆; (4)推断:50罐油漆的质量应为×50=226.8 kg。 4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)一描述推断。 答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型; (2)用Excel制作一张频数分布表;

统计学各章节课后习题答案

统计学各章练习题答案第1章绪论(略) 第2章统计数据的描述 2.1 (1)属于顺序数据。 (2)频数分布表如下: 服务质量等级评价的频数分布 服务质量等级家庭数(频率)频率% A1414 B2121 C3232 D1818 E1515 合计100100 (3)条形图(略) 2.2 (1)频数分布表如下: (2)某管理局下属40个企分组表 按销售收入分组(万元)企业数(个)频率(%) 先进企业良好企业一般企业落后企业11 11 9 9 27.5 27.5 22.5 22.5 合计40 100.0 2.3 频数分布表如下: 某百货公司日商品销售额分组表 按销售额分组(万元)频数(天)频率(%) 25~30 30~35 35~40 40~45 45~50 4 6 15 9 6 10.0 15.0 37.5 22.5 15.0 合计40 100.0 直方图(略)。

2.4 (1)排序略。 (2)频数分布表如下: 100只灯泡使用寿命非频数分布 按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2 660~670 5 5 670~680 6 6 680~690 14 14 690~700 26 26 700~710 18 18 710~720 13 13 720~730 10 10 730~740 3 3 740~750 3 3 合计100 100 直方图(略)。 2.5 (1)属于数值型数据。 (2)分组结果如下: 分组天数(天) -25~-20 6 -20~-15 8 -15~-10 10 -10~-5 13 -5~0 12 0~5 4 5~10 7 合计60 (3)直方图(略)。 2.6 (1)直方图(略)。 (2)自学考试人员年龄的分布为右偏。 2.7 (1

统计学课后题答案第四版中国人民大学出版社

●3.2.某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元): 1521241291161001039295127104 10511911411587103118142135125 117108105110107137120136117108 9788123115119138112146113126 (1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率; (2)如果按规定:销售收入在125万元以上为先进企业,115万~125万元为良好企业,105万~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。 解:(1)要求对销售收入的数据进行分组, 全部数据中,最大的为152,最小的为87,知数据全距为152-87=65; 为便于计算和分析,确定将数据分为6组,各组组距为10,组限以整10划分; 为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值87可能落在最小组之下,最大值152可能落在最大组之上,将最小组和最大组设计成开口形式; 按照“上限不在组内”的原则,用划记法统计各组内数据的个数——企业数,也可以用Excel 进行排序统计(见Excel练习题2.2),将结果填入表内,得到频数分布表如下表中的左两列;将各组企业数除以企业总数40,得到各组频率,填入表中第三列; 在向上的数轴中标出频数的分布,由下至上逐组计算企业数的向上累积及频率的向上累积,由上至下逐组计算企业数的向下累积及频率的向下累积。 整理得到频数分布表如下: 40个企业按产品销售收入分组表 (2)按题目要求分组并进行统计,得到分组表如下: 某管理局下属40个企分组表 按销售收入分组(万元)企业数(个)频率(%) 先进企业良好企业一般企业落后企业11 11 9 9 27.5 27.5 22.5 22.5 合计40100.0

统计学第四版(贾俊平)课后思考题答案

统计课后思考题答案 第一章思考题 1.1什么是统计学 统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。 1.2解释描述统计和推断统计 描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。 推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。 1.3统计学的类型和不同类型的特点 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 1.4解释分类数据,顺序数据和数值型数据 答案同1.3 1.5举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 1.6变量的分类

统计学课后习题答案(袁卫)

统计学课后习题答案(袁卫、庞皓、曾五一、贾俊平)第三版 第1章绪论 1.什么是统计学?怎样理解统计学与统计数据的关系? 2.试举出日常生活或工作中统计数据及其规律性的例子。 3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)描述推断。 答:(1)总体:最近的一个集装箱内的全部油漆; (2)研究变量:装满的油漆罐的质量; (3)样本:最近的一个集装箱内的50罐油漆; (4)推断:50罐油漆的质量应为4.536×50=226.8 kg。 4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)一描述推断。 答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型;

统计学1-3章练习题参考答案

第一章统计总论 一、单项选择题 1.属于统计总体的是() A.某县的粮食总产量 B.某地区的全部企业 C.某商店的全部商品销售额 D.某单位的全部职工人数 B 2.构成统计总体的个别事物称为()。 A.调查单位 B.标志值 C.品质标志 D.总体单位 D 3.对某城市工业企业未安装设备进行普查,总体单位是()。 A.工业企业全部未安装设备 B.工业企业每一台未安装设备 C.每个工业企业的未安装设备 D.每一个工业企业 B 4.工业企业的设备台数、产品产值是()。 A.连续变量 B.离散变量 C.前者是连续变量,后者是离散变量 D.前者是离散变量,后者是连续变量 D 5.在全国人口普查中()。 A.男性是品质标志 B.人的年龄是变量 C.人口的平均寿命是数量标志 D.全国人口是统计指标 B 6.总体的变异性是指()。 A.总体之间有差异 B.总体单位之间在某一标志表现上有差异 C.总体随时间变化而变化 D.总体单位之间有差异 B 7.几位学生的某门课成绩分别是67分、78分、88分、89分、96分,“学生成绩”是()。 A.品质标志 B.数量标志 C.标志值 D.数量指标 B 8.某年级学生四门功课的最高考分分别是98分、86分、88分和95,这四个数字是() A.指标 B.标志 C.变量 D.标志值 D 9.下列指标中属于质量指标的是()。 A.社会总产值 B.产品合格率 C.产品总成本 D.人口总数 B 10.下列属于质量指标的是() A.产品的产量 B.产品的出口额 C.产品的合格品数量 D.产品的评价 D

11.下列属于离散型变量的是() A.职工的工资 B.商品的价格 C.粮食的亩产量 D.汽车的产量 D 12.标志的具体表现是指() A.标志名称之后所列示的属性或数值 B.如性别 C.标志名称之后所列示的属性 D.标志名称之后所列示的数值 A 13.社会经济统计的研究对象是()。 A.抽象的数量特征和数量关系 B.社会经济现象的规律性 C.社会经济现象的数量特征和数量关系 D.、社会经济统计认识过程的规律和方法 C 14.统计指标按所反映的数量特点不同可以分为数量指标和质量指标两种。其中数量指标的表现形式是()。 A.绝对数 B.相对数 C.平均数 D.百分数 A 15.以产品的等级来衡量某种产品的质量好坏,则该产品“等级”是() A.数量标注 B. 品质标志 C. 数量指标 D. 质量指标 B 16.设某地区有670家工业企业,要研究这些企业的产品生产情况,总体单位是() A.每个工业企业; B.670家工业企业; C.每一件产品; D.全部工业产品 C 17.某机床厂要统计该企业的自动机床的产量和产值,上述两个变量是()。 A.二者均为离散变量 B.二者均为连续变量 C.前者为连续变量,后者为离散变量 D.前者为离散变量,后者为连续变量 D 18.下列哪个是连续型变量() A. 工厂数 B. 人数 C. 净产值 D.设备台数 C 19.设某地区有670家工业企业,要研究这些企业的产品生产情况,总体单位是() A.每个工业企业; B.670家工业企业; C.每一件产品; D.全部工业产品 C 20.统计工作过程不包括()。 A.统计调查 B.统计分布 C.统计整理 D.统计分析 B 二、多项选择题 1.统计一词的含义是()

统计学课后题答案

第二章 3.某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。 (2)制作茎叶图,并与直方图进行比较。 解:(1)频数分布表

或: (2)茎叶图

第三章 1. 已知下表资料: 试根据频数和频率资料,分别计算工人平均日产量。解:计算表

根据频数计算工人平均日产量:6870 34.35200 xf x f = = =∑∑(件) 根据频率计算工人平均日产量:34.35f x x f = = ∑∑ g (件) 结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。 2.某企业集团将其所属的生产同种产品的9个下属单位按其生产该产品平均单位成本的分组资料如下表: 试计算这9个企业的平均单位成本。 解:

这9个企业的平均单位成本=f x x f = ∑∑ =13.74(元) 3.某专业统计学考试成绩资料如下: 试计算众数、中位数。 解:众数的计算: 根据资料知众数在80~90这一组,故L=80,d=90-80=10,fm=20,fm-1=14,fm+1=9, ()() 1 11m m o m m m m f f M L d f f f f --+-=+ ?-+-

统计学课后习题参考答案

思考题与练习题 参考答案 【友情提示】请各位同学完成思考题与练习题后再对照参考答案。回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。学而不思则罔,如果直接抄答案,对学习无益,危害甚大。想抄答案者,请三思而后行! 第一章绪论 思考题参考答案 1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔就是危险的。 2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在她的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域就是军机的危险区域。 3.能,拯救与发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。 练习题参考答案 一、填空题 1.调查。

2.探索、调查、发现。 3、目的。 二、简答题 1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。 2.统计学解决实际问题的基本思路,即基本步骤就是:①提出与统计有关的实际问题;②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。不解决问题时,重复第②-⑥步。 3.在结合实质性学科的过程中,统计学就是能发现客观世界规律,更好决策,改变世界与培养相应领域领袖的一门学科。 三、案例分析题 1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:姓名;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩 ;指标体系:上学期全班同学学习的科目 ;统计量:我班部分同学课程的平均成绩 ;定性数据:姓名 ;定量数据: 课程成绩 ;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。 2.(1)总体:广州市大学生;单位:广州市的每个大学生。(2)如果调查中了解的就是价格高低,为定序尺度;如果调查中了解的就是商品丰富、价格合适、节约时间,为定类尺度。(3)广州市大学生在网上购物的平均花费。(4)就是用统计量作为参数的估计。(5)推断统计。 3.(1)10。(2)6。(3)定类尺度:汽车名称,燃油类型;定序尺度:车型大小;定距尺度:引擎的汽缸数;定比尺度:市区驾车的油耗,公路驾车的油耗。(4)定性变量:汽车名称,车型大小,燃油类型;定量变量:引擎的汽缸数,市区驾车的油耗,公路驾车的油耗。(5)40%;(6)30%。 第二章收集数据 思考题参考答案

统计学各章练习

第一章绪论 一、判断改错题 1、统计学是一门研究现象总体数量方面的方法论科学,所以它不关心,也不研究个别现象 的数量特征。 2、社会经济统计学是一门实质性科学。 3、品质指标,是由名称和数值两部分组成的。 4、三个员工的工资不同,因此存在三个变量。 5、质量指标是反映总体质的特征,因此,可以用文字来表述。 6、连续变量的数值包括整数和小数。 7、指标体系是许多指标集合的总称。 8、总体和总体单位是固定不变的。 9、只要有了某个指标,就能对总体进行完整、全面的认识。 10、变量是指可变的数量标志。 11、时点指标均无可加性。 12、总量指标数值随总体范围大小而改变。 13、某厂年计划产量比去年提高8%,实际只提高5%,因此只完成计划的50%。 14、将若干个指标数值相加,即可得到指标体系的数值。 15、强度相对指标越大,说明分布密度越大。 二、多项选择题(在备选答案中,选出二个及以上正确答案) 1、下列各项中,属于品质标志的有( )。 A.性别 B.年龄 C.职务 D.民族 E.工资 2、下列各项中,属于连续变量的有( )。 A. 厂房面积 B.职工人数 C.产值 D.原材料消耗量(单位:千克) E.设备数量 3、统计指标按其反映的时间状况不同,有( )。 A.实体指标 B.客观指标 C.时期指标 D.主观指标 E.时点指标 4、在全国的工业普查中,有( )。 A.工业企业数是数量指标 B.设备台数是离散变量 C.工业总产值是连续变量 D. 每一个工业企业是总体单位 E.每个工业企业的职工人数是连续变量 5、某市工业企业状况进行调查,得到以下资料,其中统计指标是( )。 A.该市职工人数400000人 B.企业职工人数4000人 C.该市设备台数75000台 D.市产值40亿元 E.某企业产值20万元 6、商业网点密度=全市商业机构数/全市人口数,它是()。 A.比较相对指标 B.强度相对指标 C.数量指标 D.质量指标 E.平均指标 7、下列指标中的比例相对指标是()。 A.某厂工人中,技术工人与辅助工人人数之比为4∶5 B.某年全国高考录取与报考之比是1∶2 C.存款利息率 D.家庭收支比 E.甲地人均收入是乙地的3倍 8、间班组竞赛,结果甲组产量是乙组的2倍,废品总量中甲组占70%,说明()。 A.甲组产品质量优于乙组 B.甲组产品质量不如乙组 C.甲组废品率比乙组低 D.乙组废品率比甲组低 9、列指标类型中,分子、分母可以互换的有()。 A.强度相对指标 B.比例相对指标 C.比较相对指标 D.计划完成百分比 E.产品合格率 10、统计研究的方法有()。 A.大量观察法 B.时间数列分析法 C.统计分组法 D.指数分析法 E.综合指标法

统计学 课后习题答案

附录:教材各章习题答案 第1章统计与统计数据 1.1(1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5) 分类数据。 1.2(1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家 庭”;(2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。 1.3(1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。 1.4(1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物 者的月平均花费;(4)统计量;(5)推断统计方法。 1.5(略)。 1.6(略)。 第2章数据的图表展示 2.1(1)属于顺序数据。 (2)频数分布表如下 (4)帕累托图(略)。 2.2(1)频数分布表如下

2.5(1)排序略。 (2)频数分布表如下 (4)茎叶图如下

2.6 (3)食品重量的分布基本上是对称的。 2.7 2.8(1)属于数值型数据。

2.9 (1)直方图(略)。 (2)自学考试人员年龄的分布为右偏。 比A 班分散, 且平均成绩较A 班低。 2.11 (略)。 2.12 (略)。 2.13 (略)。 2.14 (略)。 2.15 箱线图如下:(特征请读者自己分析) 第3章 数据的概括性度量 3.1 (1)100=M ;10=e M ;6.9=x 。

(2)5.5=L Q ;12=U Q 。 (3)2.4=s 。 (4)左偏分布。 3.2 (1) 19 0=M ; 23 =e M 。 (2)5.5=L Q ;12=U Q 。 (3)24=x ;65.6=s 。 (4)08.1=SK ;77.0=K 。 (5)略。 3.3 (1)略。 (2)7=x ;71.0=s 。 (3)102.01=v ;274.02=v 。 (4)选方法一,因为离散程度小。 3.4 (1)x =274.1(万元);M e=272.5 。 (2)Q L =260.25;Q U =291.25。 (3)17.21=s (万元)。 3.5 甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原 因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。 3.6 (1)x =426.67(万元);48.116=s (万元)。 (2)203.0=SK ;688.0-=K 。 3.7 (1)(2)两位调查人员所得到的平均身高和标准差应该差不多相 同,因为均值和标准差的大小基本上不受样本大小的影响。 (3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的围就可能越大。 3.8 (1)女生的体重差异大,因为女生其中的离散系数为0.1大于男 生体重的离散系数0.08。 (2) 男生:x =27.27(磅),27.2=s (磅); 女生:x =22.73(磅),27.2=s (磅); (3)68%; (4)95%。 3.9 通过计算标准化值来判断,1=A z ,5.0=B z ,说明在A项测试中 该应试者比平均分数高 出1个标准差,而在B 项测试中只高出平均分数0.5个标准差,由于A 项测试的标准化值高于B 项测试,所以A 项测试比较理想。 3.10 通过标准化值来判断,各天的标准化值如下表 日期 周一 周二 周三 周四 周五 周六 周日 标准化值Z 3 -0.6 -0.2 0.4 -1.8 -2.2 0 周一和周六两天失去了控制。

统计学第一章课后习题及答案

第一章 练习题 一、单项选择题 1.统计的含义有三种,其中的基础是() A.统计学B.统计方法 C.统计工作D.统计资料 2.对30名职工的工资收入进行调查,则总体单位是() A.30名职工B.30名职工的工资总额 C.每一名职工D.每一名职工的工资 3.下列属于品质标志的是() A.某人的年龄B.某人的性别 C.某人的体重D.某人的收入 4.商业企业的职工人数,商品销售额是() A.连续变量B.离散变量 C.前者是连续变量,后者是离散变量D.前者是离散变量,后者是连续变量5.了解某地区工业企业职工的情况,下列哪个是统计指标() A.该地区每名职工的工资额B.该地区职工的文化程度 C.该地区职工的工资总额D.该地区职工从事的工种 二、多项选择题 1.社会经济统计的特点,可概括为() A.数量性B.同质性 C.总体性D.具体性 E.社会性 2.统计学的研究方法是() A.大量观察法B.归纳推断法 C.统计模型法D.综合分析法 E.直接观察法 3.下列标志哪些属于品质标志() A.学生年龄B教师职称C企业规模D企业产值 4.下列哪些属于离散型变量 A年龄B机器台数C人口数D学生成绩 5.总体,总体单位,标志,指标这几个概念间的相互关系表现为() A.没有总体单位就没有总体,总体单位也离不开总体而独立存在 B.总体单位是标志的承担者 C.统计指标的数值来源于标志 D.指标是说明统计总体特征的,标志是说明总体单位特征的 E.指标和标志都能用数值表现 6.指标和标志之间存在着变换关系,是指() A.在同一研究目的下,指标和标志可以对调 B.在研究目的发生变化时,指标有可能成为标志

贾俊平 统计学(第六版)思考题答案

第一章: 1、什么是统计学 统计学是一门收集、分析、表述、解释数据的科学和艺术。 2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 3、统计学据可以分成哪几种类型,个有什么特点 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同。分为:观测数据、和实验数据 观测数据:通过调查或观测而收集到的数据;不控制条件; 社会经济领域 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 4、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定) 样本:从总体中抽取的一部分元素的集合。 参数:用来描述总体特征的概括性数字度量。(平均数、标准差、比例等) 统计量:用来描述样本特征的概括性数字度量。(平均数、标准差、比例等) 变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。(商品销售额、受教育程度、产品质量等级等) (对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。) 5、变量可以分为哪几类 分类变量:说明事物类别;取值是分类数据。 顺序变量:说明事物有序类别;取值是顺序数据 数值型变量:说明事物数字特征;取值是数值型数据。 变量也可以分为:随机变量和非随机变量;经验变量和理论变量 6、举例说明离散型变量和连续型变量。 离散型变量:只能取有限个、可数值的变量。(企业个数、产品数量) 连续型变量:可以在一个或多个区间中取任何值的变量。(年龄、温度、零件尺寸误差)7、请举出统计应用的几个例子。 市场调查、人口普查等。 8、请举出应用统计学的几个领域。 社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。

相关主题
文本预览
相关文档 最新文档