当前位置:文档之家› 统计学第七章、第八章课后题答案

统计学第七章、第八章课后题答案

统计学第七章、第八章课后题答案
统计学第七章、第八章课后题答案

统计学复习笔记

第七章

一、 思考题

1. 解释估计量和估计值

在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。

2. 简述评价估计量好坏的标准

(1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。

(2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。

(3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。

3. 怎样理解置信区间

在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。

4. 解释95%的置信区间的含义是什么

置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。

不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。

5. 简述样本量与置信水平、总体方差、估计误差的关系。

1. 估计总体均值时样本量n 为

2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为 其中: 2222α2222)(E z n σα=n z E σα2=

? 与置信水平成正比,在其他条件不变的情况下,置信水平越大,所

需要的样本量越大;

? 与总体方差成正比,总体的差异越大,所要求的样本量也越大;

? 与与总体方差成正比,样本量与估计误差的平方成反比,即可以接

受的估计误差的平方越大,所需的样本量越小。

二、 练习题

1. 从一个标准差为5的总体中采用重复抽样方法抽出一个样本量为40的样本,样本均值为25。

1) 样本均值的抽样标准差等于多少?

2) 在95%的置信水平下,估计误差是多少?

解: 1) 已知σ = 5,n = 40,

= 25

∵ ∴ = 5 /√40 ≈ 0.79 2) 已知

∵ ∴ 估计误差 E = 1.96×5÷√40 ≈ 1.55

2. 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。

1) 假定总体标准差为15元,求样本均值的抽样标准误差。

2) 在95%的置信水平下,求估计误差。

3) 如果样本均值为120元,求总体均值μ的95%的置信区间。 解:1)已知σ = 15,n = 49 ∵

x σx σ

x x σx n

x n x σσ=α2n z E σα2=n x n x σσ=n x n x σσ=

∴ = 15÷√49 = 2.14 2)已知

∵ ∴ 估计误差 E = 1.96×15÷√49 ≈ 4.2

3)已知 = 120

∵ 置信区间为

±E ∴ 其置信区间 = 120±4.2

3. 从一个总体中随机抽取n =100的随机样本,得到

=104560,假定总体标准差σ = 85414,试构建总体均值μ的95%的置信区间。

解: 已知n =100, =104560,σ = 85414,1-α=95% ,

由于是正态总体,且总体标准差已知。总体均值μ在1-α置信水平下的置信区间为

104560 ± 1.96×85414÷√100

= 104560 ±16741.144

4. 从总体中抽取一个n =100的简单随机样本,得到 =81,s=12。要求:

1) 构建μ的90%的置信区间。

2) 构建μ的95%的置信区间。

3) 构建μ的99%的置信区间。

解:由于是正态总体,但总体标准差未知。总体均值μ在1-α置信水x σx σ

α2n z E σα2=x x x x 2α()28.109,44.10192.336.1052510

96.136.1052=±=?±=±n z x σ

αx

平下的置信区间公式为

81

±

×12÷√100 = 81

±×1.2

1)1-α=90%

, 1.65 其置信区间为 81 ± 1.98

2)1-α=95% ,

其置信区间为 81 ± 2.352

3) 1-α=99%

, 2.58

其置信区间为 81 ± 3.096

5. 利用下面的信息,构建总体均值的置信区间。

1)

= 25,σ = 3.5,n =60,置信水平为95%

2) =119,s =23.89,n =75,置信水平为98%

3) =3.149,s =0.974,n =32,置信水平为90%

解:∵ ∴ 1) 1-α=95% ,

其置信区间为:25±1.96×3.5÷√60

= 25±0.885

2) 1-α=98% ,则α=0.02, α/2=0.01, 1-α/2=0.99,查标准正态分布表,可知: 2.33

其置信区间为: 119±2.33×23.89÷√75

= 119±6.345

x x x 22未知αα)(22未知或σσααn

s z x n z x ±±

3) 1-α=90%

, 1.65

其置信区间为: 3.149±1.65×0.974÷√32

= 3.149±0.284

6. 利用下面的信息,构建总体均值μ的置信区间:

1) 总体服从正态分布,且已知σ = 500,n = 15

=8900,置信水平为95%。

解: N=15,为小样本正态分布,但σ已知。则1-α=95%,

。其置信区间公式为 ∴置信区间为:8900±1.96×500÷√15=(8646.7 , 9153.2)

2) 总体不服从正态分布,且已知σ = 500,n = 35, =8900,置信水平为95%。

解:为大样本总体非正态分布,但σ已知。则1-α=95%,

。其置信区间公式为 ∴置信区间为:8900±1.96×500÷√35=(8733.9 9066.1)

3) 总体不服从正态分布,σ未知,n = 35,

=8900,s =500,置信水平为90%。

解:为大样本总体非正态分布,且σ未知,1-α=90%,

1.65。 其置信区间为:

8900±1.65×500÷√35=(8761 9039)

4) 总体不服从正态分布,σ未知,n = 35, =8900,s =500,置信水平为99%。

2α()28.109,44.10192.336.105251096.136.1052=±=?

±=±n z x σαx x 2α()28.109,44.10192.336.105251096.136.1052=±=?

±=±n z x σαx x

解:为大样本总体非正态分布,且σ未知,1- =99%, 2.58。

其置信区间为:8900±2.58×500÷√35=(8681.9 9118.1)

7.某大学为了解学生每天上网的时间,在全校7500名学生中采取重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时)(略)。求该校大学生平均上网时间的置信区间,置信水平分别为90%

解:先求样本均值:= 3.32

再求样本标准差:

置信区间公式:

8.从一个正态总体中随机抽取样本量为8的样本,各样本值分别为:10,8,12,15,6,13,5,11。求总体均值μ的95%置信区间。解:本题为一个小样本正态分布,σ未知。

先求样本均值:= 80÷8=10

再求样本标准差:= √84/7 = 3.4641

于是 , 的置信水平为的置信区间是

,

已知,n = 8,则,α/2=0.025,查自由度为

n-1 = 7的分布表得临界值 2.45

所以,置信区间为:10±2.45×3.4641÷√7

9.某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离分别是:10,3,14,8,6,9,12,11,7,5,10,15,9,16,13,2。假设总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。

解:小样本正态分布,σ未知。已知,n = 16,,则,

α/2=0.025,查自由度为n-1 = 15的分布表得临界值 2.14

样本均值=150/16=9.375

再求样本标准差:= √253.75/15 ≈4.11

于是 , 的置信水平为的置信区间是

,

9.375±2.14×4.11÷√16

10.从一批零件是随机抽取36个,测得其平均长度是149.5,标准差是1.93。

1)求确定该种零件平均长度的95%的置信区间。

2)在上面估计中,你使用了统计中的哪一个重要定理?请解释。

解:1)这是一个大样本分布。已知N=36,

= 149.5,S =1.93,

1-α=0.95,。

其置信区间为:149.5±1.96×1.93÷√36 2)中心极限定理论证:如果总体变量存在有限的平均数和方差,那么,不论这个总体的分布如何,随着样本容量的增加,样本均值的分布便趋近正态分布。在现实生活中,一个随机变量服从正态分布未必很多,但是多个随机变量和的分布趋于正态分布则是普遍存在的。样本均值也是一种随机变量和的分布,因此在样本容量充分大的条件下,样本均值也趋近于正态分布,这为抽样误差的概率估计理论提供了理论基础。

11.某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克,现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量如下:(略)

已知食品包重服从正态分布,要求:

1)确定该种食品平均重量的95%的置信区间。

2)如果规定食品重量低于100克属于不合格,确定该批食品合格率的95%的置信区间。

x

解:1)本题为一个大样本正态分布,σ未知。已知N=50,μ =100,1-α=0.95,。

①每组组中值分别为97、99、101、103、105,即此50包样本平均值= (97+99+101+103+105)/5 = 101

②样本标准差为:

=√{(97-101)2×2+(99-101)2×3+(101-101)2×34+(103-101)2×7+(105-101)2×4}÷(50-1)≈ 1.666

③其置信区间为:101±1.96×1.666÷√50

2)∵不合格包数(<100克)为2+3=5包,5/50 = 10%(不合格率),即P = 90%。

∴该批食品合格率的95%置信区间为:

= 0.9 ±1.96×√(0.9×0.1)÷50= 0.9 ±1.96×0.042

12.假设总体服从正态分布,利用下面的数据构建总体均值μ的99%的置信区间。(略)

解:样本均值

样本标准差:

尽管总体服从正态分布,但是样本n=25是小样本,且总体标

准差未知,应该用T统计量估计。1-α=0.99,则α=0.01,

α/2=0.005,查自由度为n-1 = 24的分布表得临界值 2.8

的置信水平为的置信区间是,

13.一家研究机构想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取了18个员工,得到他们每周加班的时间数据如下(单位:小时):(略)

假定员工每周加班的时间服从正态分布,估计网络公司员工平均每周加班时间的90%的置信区间。

解:① N = 18 < 30,为小样本正态分布,σ未知。

②样本均值= 244/18 = 13.56

样本标准差:=

③ 1-α= 90%,α= 0.1,α/2= 0.05,则查自由度为n-1 = 17

的分布表得临界值 1.74

④的置信水平为的置信区间是,

14.利用下面的样本数据构建总体比例丌的置信区间:

1)n =44,p = 0.51 ,置信水平为99%

2)n =300,p = 0.82 ,置信水平为95%

3)n =1150,p = 0.48,置信水平为90%

解:1)1-α= 99%,α= 0.01,α/2= 0.005,1-α/2= 0.995,

查标准正态分布表,则 2.58

2)1-α=95%,

3)1-α=90%, 1.65

分别代入

15.在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机,其中拥有该品牌电视机的家庭占23%。求总体比例的置信区间,置信水平分别为90%和95%。

解:1)置信水平90%,1-α=90%, 1.65,N = 200,P = 23%。

代入

2)置信水平95%,1-α=95%,,N = 200,P = 23%。代入

16.一位银行的管理人员想估计每位顾客在该银行的月平均存款额。他假设所有顾客月存款额的标准差为1000元,要求的估计误差

在200元以内,置信水平为99%。应选取多大的样本?

解:已知 1-α = 99%,则 2.58。E = 200,σ= 1000元。

则 N = (2×σ2)÷E2= (2.582×10002)÷2002≈167 (得数应该是166.41,不管小数后是多少,都向上进位取整,因此至少是167人)

17.要估计总体比例丌,计算下列条件下所需的样本量。

1)E=0.02,丌=0.40,置信水平96%

2)E=0.04,丌未知,置信水平95%

3)E=0.05,丌=0.55,置信水平90%

解:1)已知 1-α = 96%,α/2 =0.02 ,则 2.06

N = {2×丌(1-丌)}÷E2=2.062×0.4×0.6÷0.022≈2547

2) 已知 1-α = 95%,α/2 =0.025 ,则 1.96

丌未知,则取使丌(1-丌)最大时的0.5。

N = {2×丌(1-丌)}÷E2=1.962×0.5×0.5÷0.042≈601

3)置信水平90%,1- =90%, 1.65,

N = {2×丌(1-丌)}÷E2=1.652×0.55×0.45÷0.052≈270

18.某居民小区共有居民500户,小区管理者准备采用一项新的供水设施,想了解居民是否赞成。采取重复抽样方法随机抽取了50户,其中有32户赞同,18户反对。

1)求总体中赞成该项改革的户数比例的置信区间(α=0.05)

2)如果小区管理者预计赞成的比例能达到80%,估计误差不超过10%,应抽取多少户进行调查(α=0.05)

解:1)

已知N=50,P=32/50=0.64,α=0.05,α/2 =0.025 ,则 1.96

置信区间:P±√{P(1-P)/N}= 0.64±1.96√0.64×0.36/50 = 0.64±1.96×0.48/7.07=0.64±0.133

2)已知丌=0.8 , E = 0.1, α=0.05,α/2 =0.025 ,则 1.96

N= 2丌(1-丌)/E2= 1.962×0.8×0.2÷0.12≈62

19.根据下面的样本结果,计算总体标准差σ的90%的置信区间:1)=21,S=2,N=50

2)=1.3,S=0.02,N=15

3)=167,S=31,N=22

解:1)大样本,σ未知,置信水平90%,1-α=90%, 1.65

21±1.65×2÷√50

2)小样本,σ未知,置信水平90%,1-α=90%,则查自由度

为n-1 = 14的分布表得临界值 1.761

, = 1.3±1.761×0.02÷√15

3) 大样本, σ未知,置信水平90%,1-α=90%, 1.65

167±1.65×31÷√22

20.题目(略)

1)构建第一种排队方式等待时间标准差的95%的置信区间

2)构建第二种排队方式等待时间标准差的95%的置信区间

3)根据1)和2)的结果,你认为哪种排队方式更好?

解:本题为小样本正态分布,σ未知,应用公式

,

置信水平95%,1- =95%,则查自由度为n-1 = 9的分布表

得临界值 2.31

1)= 7.15,

= √2.045/9≈0.48

其置信区间为7.15±2.31×0.48÷√10

2) = 7.15

= √0/9 = 0

其置信区间为7.15±0

4)第二种排队方式更好.

(19题是对总体方差的估计,应该用卡方统计量进行估计,20题是对两个总体参数的估计,这二种类型老师未讲,不是本次考试的内容,不能用Z统计量像估计总体均值和比例那样去估计,具体内容见书上P188――P194)

第八章

一、思考题

1.假设检验和参数估计有什么相同点和不同点?

解:参数估计与假设检验是统计推断的两个组成部分。

相同点:它们都是利用样本对总体进行某种推断。

不同点:推断的角度不同。参数估计讨论的是用样本统计量估计总体参数的方法,总体参数μ在估计前是未知的。而在假设检验中,则是先对μ的值提出一个假设,然后利用样本信息去检验这个假设是否成立。

2.什么是假设检验中的显著性水平?统计显著是什么意思?

解:显著性水平用α表示,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险,即假设检验中犯弃真错误的概率。它是由人们根据检验的要求确定的。

(我理解的统计学意义,统计显著是统计上专用的判定标准,指在一定的概率原则下,可以承认一种趋势或者合理性达到的程度,达到为统计上水平显著,达不到为统计上水平不显著)

3.什么是假设检验中的两类错误?

解:弃真错误(α错误):当原假设为真时拒绝原假设,所犯的错误成为第I类错误,又称为弃真错误。犯第I类错误的概率常记作α。

取伪错误(β错误):当原假设为假时没有拒绝原假设,所犯的错误称为第II类错误,又称取伪错误。犯第II类错误概率常记作β。

发生第I类错误的概率也常被用于检验结论的可靠性度量。假设检验中犯第I类错误的概率被称为显著性水平,记作α。

4.两类错误之间存在什么样的数量关系?

在样本容量n一定的情况下,假设检验不能同时做到犯α和β两类错误的概率都很小。若减小α错误,就会增大犯β错误的机会;若减小β错误,也会增大犯α错误的机会。要使α和β同时变小只有增大样本容量。但样本容量增加要受人力、经费、时间等很多因素的限制,无限制增加样本容量就会使抽样调查失去意义。因此假设检验需要慎重考虑对两类错误进行控制的问题。

5.解释假设检验中的P值。

解:如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为P值。也称为观察到的显著性水平。

P值是反映实际观测到的数据与原假设H0之间不一致程度的一个概率值。P值越小,说明实际观测到的数据与H0之间不一致程度就越大。

6.显著性水平与P值有何区别?

解:α(显著性水平)是一个判断的标准(当原假设为真,却被拒绝

的概率),而P是实际统计量对应分位点的概率值(当原假设为真时,所得到的样本观察结果或更极端结果出现的概率)。

可以通过α计算置信区间,然后与统计量进行比较判断,也可以通过统计量计算对应的p值,然后与α值比较判断。

7.假设检验依据的基本原理是什么?

解:假设检验利用的是小概率原理,小概率原理是指发生概率很小的随机事件在一次试验中是几乎不可能发生的。根据这一原理,可以先假设总体参数的某项取值为真,也就是假设其发生的可能性很大,然后抽取一个样本进行观察,如果样本信息显示出现了与事先假设相反的结果且与原假设差别很大,则说明原来假定的小概率事件在一次实验中发生了,这是一个违背小概率原理的不合理现象,因此有理由怀疑和拒绝原假设;否则不能拒绝原假设。

8.你认为在单侧检验中原假设和备择假设的方向应该如何确定?

解:假设问题有两种情况,一种是所考察的数值越大越好(左单侧检验或下限检验),临界值和拒绝域均在左侧;另一种是数值越小越好(右单侧检验或上限检验),临界值和拒绝域均在右侧。

二、练习题

1.已知某炼铁厂的含碳量服从正态分布N(4.55,0.1082),现在测

定了9炉铁水,其平均含碳量为4.484。如果估计方差没有变化,可否认为现在生产的铁水平均含碳量为4.55(α=0.05)?

解: 已知μ0=4.55,σ2=0.1082,N=9,=4.484,

这里采用双侧检验,小样本,σ已知,使用Z 统计。

假定现在生产的铁水平均含碳量与以前无显著差异。则, H 0 :μ =4.55 ; H 1 :μ ≠4.55

α=0.05,α/2 =0.025

,查表得临界值为

1.96

计算检验统计量: = (4.484-4.55)/(0.108/√9) = -1.833

决策:∵Z 值落入接受域,∴在α=0.05的显著性水平上接受H 0。

结论:有证据表明现在生产的铁水平均含碳量与以前没有显著差异,可以认为现在生产的铁水平均含碳量为4.55。

2. 一种元件,要求其使用寿命不得低于700小时。现从一批这种元件中随机抽取36件,测得其平均寿命为680小时。已知该元件寿命服从正态分布,σ=60小时,试在显著性水平0.05下确定这批元件是否合格。

解: 已知N=36,σ=60,=680,μ0 =700

这里是大样本,σ已知,左侧检验,采用Z 统计量计算。 提出假设:假定使用寿命平均不低于700小时

H 0:μ≥700

n

x Z / σ - =

μ0

H 1: μ < 700

α = 0.05,左检验临界值为负,查得临界值: -Z 0.05=-1.645 计算检验统计量: = (680-700)/(60/√36) = -2

决策:∵Z 值落入拒绝域,∴在α=0.05的显著性水平上拒绝H 0,接受H 1

结论:有证据表明这批灯泡的使用寿命低于700小时,为不合格产品。

3. 某地区小麦的一般生产水平为亩产250公斤,其标准差是30公斤。现用一种化肥进行试验,从25个小区抽样,平均产量为270公斤。这种化肥是否使小麦明显增产(α=0.05)?

解:已知μ0 =250,σ = 30,N=25,=270

这里是小样本分布,σ已知,用Z 统计量。右侧检验,α =0.05,则Z α=1.645

提出假设:假定这种化肥没使小麦明显增产。

即 H 0:μ≤250

H 1: μ > 250

计算统计量:

Z = (-μ0)/(σ/√N )= (270-250)/(30/√25)= 3.33 结论:Z 统计量落入拒绝域,在α =0.05的显著性水平上,拒绝H 0,接受H 1。

n x Z / σ - =

μ0

决策:有证据表明,这种化肥可以使小麦明显增产。

4. 糖厂用自动打包机打包,每包标准重量是100千克。每天开工后需要检验一次打包机工作是否正常。某日开工后测得9包重量(单位:千克)如下:(略)

已知包重服从正态分布,试检验该日打包机工作是否正常。(α =0.05)

解:已知N=9,这里是小样本正态分布,σ未知,双侧检验,采用t 统计量,自由度为N-1=8。α =0.05,则T α/2=2.37

= 99.98

≈1.22

提出假设,假设打包机工作正常:

即 H 0:μ= 100

H 1: μ ≠ 100

计算统计量:

= (99.98-100)/( 1.22/√9)≈-0.049 结论:∵t 值落入接受域,∴在α=0.05的显著性水平上接受H 0 决策:有证据表明这天的打包机工作正常。

5. 某种大量生产的袋装食品,按规定不得少于250克。今从一批该 - = n

s x t μ0

统计学答案第八章

三、选择题 1 某厂生产的化纤纤度服从正态分布,纤维的纤度的标准均值为1.40。某天测得25根纤维的纤度的均值x=1.39,检验与原来设计的标准均值相比是否有所变化,要求的显著性水平为α=0.05,则下列正确的假设形式是()。 A.H0:μ=1.40,H1:μ≠1.40 B. H0:μ≤1.40,H1:μ>1.40 C. H0:μ<1.40,H1:μ≥1.40 D. H0:μ≥1.40,H1:μ<1.40 2 某一贫困地区估计营养不良人数高达20%,然而有人认为这个比例实际上还要高,要检验该说法是否正确,则假设形式为()。 A. H0:π≤0.2,H1:π>0.2 B. H0:π=0.2,H1:π≠0.2 C. H0:π≥0.3,H1:π<0.3 D. H0:π≥0.3,H1:π<0.3 3 一项新的减肥计划声称:在计划实施的第一周内,参加者的体重平均至少可以减轻8磅。随机抽取40位参加该项计划的样本,结果显示:样本的体重平均减少7磅,标准差为3 2磅,则其原假设和备择假设是()。 A. H0:μ≤8,H1:μ>8 B. H0:μ≥8,H1:μ<8 C. H0:μ≤7,H1:μ>7 D. H0:μ≥7,H1:μ<7 4 在假设检验中,不拒绝原假设意味着()。 A.原假设肯定是正确的 B.原假设肯定是错误的 C.没有证据证明原假设是正确的 D.没有证据证明原假设是错误的 5 在假设检验中,原假设和备择假设()。 A.都有可能成立 B.都有可能不成立 C.只有一个成立而且必有一个成立 D.原假设一定成立,备择假设不一定成立 6 在假设检验中,第一类错误是指()。 A.当原假设正确时拒绝原假设 B.当原假设错误时拒绝原假设 C.当备择假设正确时拒绝备择假设 D.当备择假设不正确时未拒绝备择假设 7 在假设检验中,第二类错误是指()。 A.当原假设正确时拒绝原假设 B.当原假设错误时未拒绝原假设 C.当备择假设正确时未拒绝备择假设 D.当备择假设不正确时拒绝备择假设 8 指出下列假设检验哪一个属于右侧检验()。 A. H0:μ=μ0, H1:μ≠μ0 B. H0:μ≥μ0, H1:μ<μ0 C. H0:μ≤μ0, H1:μ>μ0 D. H0 :μ>μ0, H1:μ≤μ0 9 指出下列假设检验哪一个属于左侧检验()。 A. H0:μ=μ0, H1:μ≠μ0 B. H0:μ≥μ0 , H1:μ<μ0 C. H0:μ≤μ0, H1:μ>μ0 D. H0:μ>μ0, H1:μ≤μ0 10 指出下列假设检验哪一个属于双侧检验()。 A. H0:μ=μ0, H1:μ≠μ0 B. H0:μ≥μ0, H1:μ<μ0

梁前德《统计学》(第二版)学习指导与习题训练答案:07第七章 假设检验与方差分析 习题答案

旗开得胜 1 第七章 假设检验与方差分析 习题答案 一、名词解释 用规范性的语言解释统计学中的名词。 1. 假设检验:对总体分布或参数做出某种假设,然后再依据抽取的样本信息,对假设是否正确做出统计判断,即是否拒绝这种假设。 2. 原假设:又叫零假设或无效假设,是待检验的假设,表示为 H 0,总是含有等号。 3. 备择假设:是零假设的对立,表示为 H 1,总是含有不等号。 4. 单侧检验:备择假设符号为大于或小于时的假设检验。 5. 显著性水平:原假设为真时,拒绝原假设的概率。 6. 方差分析:是检验多个总体均值是否相等的一种统计分析方法。 二、填空题 根据下面提示的内容,将适宜的名词、词组或短语填入相应的空格之中。 1. u , n x σμ0 -,标准正态; ),( ),(2/2/+∞- -∞n z n z σσααY 2. 参数检验,非参数检验 3. 弃真,存伪 4. 方差

旗开得胜 2 5. 卡方, F 6. 方差分析 7. t ,u 8. n s x 0μ-,不拒绝 9. 单侧,双侧 10.新产品的废品率为5% ,0.01 11.相关,总变异,组间变异,组内变异 12.总变差平方和=组间变差平方和+组内变差平方和 13.连续,离散 14.总体均值 15.因子,水平 16.组间,组内 17.r-1,n-r 18. 正态,独立,方差齐

三、单项选择 从各题给出的四个备选答案中,选择一个最佳答案,填入相应的括号中。 1.B 2.B 3. B 4.A 5.C 6.B 7.C 8.A 9.D 10.A 11.D 12.C 四、多项选择 从各题给出的四个备选答案中,选择一个或多个正确的答案,填入相应的括号中。1.AC 2.A 3.B 4.BD 5. AD 五、判断改错 对下列命题进行判断,在正确命题的括号内打“√”;在错误命题的括号内打“×”,并在错误的地方下划一横线,将改正后的内容写入题下空白处。 1. 在任何情况下,假设检验中的两类错误都不可能同时降低。( ×) 样本量一定时 2. 对于两样本的均值检验问题,若方差均未知,则方差分析和t检验均可使用,且两者检验结果一致。( √) 3

统计学试题库及答案

统计学试题库及答案 Document serial number【KKGB-LBS98YT-BS8CB-BSUT-BST108】

《统计学》试题库 知识点一:统计基本理论和基本概念 一、填空题 1、统计是、和的统一体,是统计工作的成果,是统计工作的经验总结和 理论概括。 2、统计研究的具体方法主要有、、和。 3、统计工作可划分为、、和四个阶段。 4、随着的改变,总体和是可以相互转化的。 5、标志是说明,指标是说明。 6、可变的数量标志和所有的统计指标称为,变量的具体数值称为。 7、变量按分,可分为连续变量和离散变量,职工人数、企业数属于变量;变量按分,可 分为确定性变量和随机变量。 8、社会经济统计具有、、、等特点。 9、一个完整的统计指标应包括和两个基本部分。 10、统计标志按是否可用数值表示分为和;按在各个单位上的具体表现是否相同分为 和。 11、说明特征的名称叫标志,说明特征的名称叫指标。 12、数量指标用表示,质量指标用或平均数表示。 13、在统计中,把可变的和统称为变量。 14、由于统计研究目的和任务的变更,原来的变成,那么原来的指标就相应地变成标志,两者 变动方向相同。 二、是非题 1、统计学和统计工作的研究对象是完全一致的。 2、运用大量观察法,必须对研究对象的所有单位进行观察调查。 3、统计学是对统计实践活动的经验总结和理论概括。 4、一般而言,指标总是依附在总体上,而总体单位则是标志的直接承担者。 5、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。 6、某同学计算机考试成绩80分,这是统计指标值。 7、统计资料就是统计调查中获得的各种数据。 8、指标都是用数值表示的,而标志则不能用数值表示。 9、质量指标是反映工作质量等内容的,所以一般不能用数值来表示。 10、总体和总体单位可能随着研究目的的变化而相互转化。 11、女性是品质标志。

统计学4章练习题+答案

| 第4章练习题 1、一组数据中出现频数最多的变量值称为(A) A.众数 B.中位数 C.四分位数 D.平均数 2、下列关于众数的叙述,不正确的是(C) A.一组数据可能存在多个众数 B.众数主要适用于分类数据 C.一组数据的众数是唯一的 , D.众数不受极端值的影响 3、一组数据排序后处于中间位置上的变量值称为(B) A.众数 B.中位数 C.四分位数 D.平均数 4、一组数据排序后处于25%和75%位置上的值称为(C) A.众数 B.中位数 C.四分位数 D.平均数 5、非众数组的频数占总频数的比例称为(A) A.异众比率 B.离散系数 C.平均差 D.标准差 6、四分位差是(A) ) A.上四分位数减下四分位数的结果 B.下四分位数减上四分位数的结果 C.下四分位数加上四分位数 D.下四分位数与上四分位数的中间值 7、一组数据的最大值与最小值之差称为(C) A.平均差 B.标准差 C.极差 D.四分位差 8、各变量值与其平均数离差平方的平均数称为(C) A.极差 B.平均差 C.方差 D.标准差 | 9、变量值与其平均数的离差除以标准差后的值称为(A) A.标准分数 B.离散系数 C.方差 D.标准差 10、如果一个数据的标准分数-2,表明该数据(B) A.比平均数高出2个标准差 B.比平均数低2个标准差 C.等于2倍的平均数 D.等于2倍的标准差 11、经验法则表明,当一组数据对称分布时,在平均数加减2个标准差的范围之内大约有(B)> %的数据 %的数据 %的数据%的数据 12、如果一组数据不是对称分布的,根据切比雪夫不等式,对于k=4,其意义是(C) A.至少有75%的数据落在平均数加减4个标准差的范围之内 B. 至少有89%的数据落在平均数加减4个标准差的范围之内 C. 至少有94%的数据落在平均数加减4个标准差的范围之内 D. 至少有99%的数据落在平均数加减4个标准差的范围之内

统计学第八章练习题

第八章 相关与回归分析 一、填空题 8.1.1 客观现象之间的数量联系可以归纳为两种不同的类型,一种是 ,另一种是 。 8.1.2 回归分析中对相互联系的两个或多个变量区分为 和 。 8.1.3 是指变量之间存在的严格确定的依存关系。 8.1.4 变量之间客观存在的非严格确定的依存关系,称为 。 8.1.5 按 的多少不同,相关关系可分为单相关、复相关和偏相关。 8.1.6 两个现象的相关,即一个变量对另一个变量的相关关系,称为 。 8.1.7 在某一现象与多个现象相关的场合,当假定其他变量不变时,其中两个变量的相关关系称为 。 8.1.8 按变量之间相关关系的 不同,可分为完全相关、不完全相关和不相关。 8.1.9 按相关关系的 不同可分为线性相关和非线性相关。 8.1.10 线性相关中按 可分为正相关和负相关。 8.1.11 研究一个变量与另一个变量或另一组变量之间相关方向和相关密切程度的统计分析方法,称为 。 8.1.12 当一个现象的数量由小变大,另一个现象的数量也相应由小变大,这种相关称为 。 8.1.13 当一个现象的数量由小变大,而另一个现象的数量相反地由大变小,这种相关称为 。 8.1.14 当两种现象之间的相关只是表面存在,实质上并没有内在的联系时,称之为 。 8.1.15根据相关关系的具体形态,选择一个合适的数学模型来近似地表达变量间平均变化关系的统计分析方法,称为 。 8.1.16 反映变量之间相关关系及关系密切程度的统计分析指标是 。 8.1.17 就是寻找参数01ββ和的估计值 01 ββ和,使因变量实际值与估计值的残差平方和达到最小。 8.1.18 正如标准差可以说明平均数代表性大小一样, 则可以说明回归线代表性的大小。 8.1.19 回归分析中的显著性检验包括两方面的内容,一是对 的显著性检验;二是对 的显著性检验。 8.1.20 对各回归系数的显著性检验,通常采用 ;对整个回归方程的显著性检验,通常采用 。 8.1.21 当相关系数0≈r 时,只能认为变量之间不存在 关系。 8.1.22 的显著性检验就是要检验自变量x 对因变量y 的影响程度是否显著。

《统计学》-第7章-习题答案

第七章思考与练习参考答案 1.答:函数关系是两变量之间的确定性关系,即当一个变量取一定数值时,另一个变量有确定值与之相对应;而相关关系表示的是两变量之间的一种不确定性关系,具体表示为当一个变量取一定数值时,与之相对应的另一变量的数值虽然不确定,但它仍按某种规律在一定的范围内变化。 2.答:相关和回归都是研究现象及变量之间相互关系的方法。相关分析研究变量之间相关的方向和相关的程度,但不能确定变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况;回归分析则可以找到研究变量之间相互关系的具体形式,并可变量之间的数量联系进行测定,确定一个回归方程,并根据这个回归方程从已知量推测未知量。 3.答:单相关系数是度量两个变量之间线性相关程度的指标,其计算公式为:总体相关系数 ,样本相关系数 。复相关系数是多元线性回归分 析中度量因变量与其它多个自变量之间的线性相关程度的指标,它是方程的判定系数2R 的正的平方根。偏相关系数是多元线性回归分析中度量在其它变量不变的情况下两个变量之间真实相关程度的指标,它反映了在消除其他变量影响的条件下两个变量之间的线性相关程度。 4.答:回归模型假定总体上因变量Y 与自变量X 之间存在着近似的线性函数关系,可表示为t t t u X Y ++=10ββ,这就是总体回归函数,其中u t 是随机误差项,可以反映未考虑的其他各种因素对Y 的影响。根据样本数据拟合的方程,就是样本回归函数,以一元线 性回归模型的样本回归函数为例可表示为:t t X Y 10???ββ+=。总体回归函数事实上是未知的,需要利用样本的信息对其进行估计,样本回归函数是对总体回归函数的近似反映。两者的区别主要包括:第一,总体回归直线是未知的,它只有一条;而样本回归直线则是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归直线。第二,总体回归函数中 的0β和1β是未知的参数,表现为常数;而样本回归直线中的0 ?β和1?β是随机变量,其具体数值随所抽取的样本观测值不同而变动。 5.最小二乘法是在根据样本数据估计样本回归方程时,采用残差平方和作为衡量总偏 差的尺度,找到使得残差平方和最小的回归系数0 ?β和1?β的取值的估计方法。根据微积分中

统计学试题及答案

统计学试题及答案文件排版存档编号:[UYTR-OUPT28-KBNTL98-UYNN208]

统计学试题及答案 一.单选题(每题2分,共20分) 1.在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2.一组数据的均值为20, 离散系数为, 则该组数据的标准差为 A 50 B 8 C D 4 3.某连续变量数列,其末组为“500以上”。又知其邻组的组中值为480,则末组的组中值为 A 520 B 510 C 530 D 540 4.已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为 A.5%×7%×9% B. 105%×107%×109% C.(105%×107%×109%)-1 D. 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分比为 A. –5% B. –% C. –% D. % 6.对不同年份的产品成本配合的直线方程为 , 回归系数b= -表示 A. 时间每增加一个单位,产品成本平均增加个单位 B. 时间每增加一个单位,产品成本平均下降个单位 C. 产品成本每变动一个单位,平均需要年时间

7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间: =70件, =件乙车间: =90件, =件 哪个车间日加工零件的离散程度较大: A甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间 A. 相关程度很低 B.不存在任何相关关系 C. 不存在线性相关关系 D.存在非线性相关关系 二. 多选题 (每题2分,共14分) 1. 下列数据中属于时点数的有 A. 流动资金平均余额20万元 B. 储蓄存款余额500万元 C. 商品销售额80万元 D. 固定资产300万元 E. 企业职工人数2000人 2. 在数据的集中趋势的测量值中,不受极端数值影响的测度值是

统计学各章节课后习题答案

统计学各章练习题答案第1章绪论(略) 第2章统计数据的描述 2.1 (1)属于顺序数据。 (2)频数分布表如下: 服务质量等级评价的频数分布 服务质量等级家庭数(频率)频率% A1414 B2121 C3232 D1818 E1515 合计100100 (3)条形图(略) 2.2 (1)频数分布表如下: (2)某管理局下属40个企分组表 按销售收入分组(万元)企业数(个)频率(%) 先进企业良好企业一般企业落后企业11 11 9 9 27.5 27.5 22.5 22.5 合计40 100.0 2.3 频数分布表如下: 某百货公司日商品销售额分组表 按销售额分组(万元)频数(天)频率(%) 25~30 30~35 35~40 40~45 45~50 4 6 15 9 6 10.0 15.0 37.5 22.5 15.0 合计40 100.0 直方图(略)。

2.4 (1)排序略。 (2)频数分布表如下: 100只灯泡使用寿命非频数分布 按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2 660~670 5 5 670~680 6 6 680~690 14 14 690~700 26 26 700~710 18 18 710~720 13 13 720~730 10 10 730~740 3 3 740~750 3 3 合计100 100 直方图(略)。 2.5 (1)属于数值型数据。 (2)分组结果如下: 分组天数(天) -25~-20 6 -20~-15 8 -15~-10 10 -10~-5 13 -5~0 12 0~5 4 5~10 7 合计60 (3)直方图(略)。 2.6 (1)直方图(略)。 (2)自学考试人员年龄的分布为右偏。 2.7 (1

统计学第七章、第八章课后题答案

统计学复习笔记 第七章参数估计 一、思考题 1.解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2.简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。 3.怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4.解释95%的置信区间的含义是什么 置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以的概率覆盖总体参数。 5.简述样本量与置信水平、总体方差、估计误差的关系。 1. 估计总体均值时样本量n 为 (z 2 )2 2其中: E z n n E22 其中: E z 2 n 2. 样本量n 与置信水平1- α、总体方差、估计误差E之间的关系为与置信水平 成正比,在其他条件不变的情况下,置信水平越大,所

统计学题库答案

单选 问题:下列不属于相关关系的现象是( 3 )。 选项一:企业的投资与产出 选项二:居民的收入与存款 选项三:电视机产量与西红柿产量 选项四:商品销售额与商品销售价格 问题:抽样调查中的抽样误差是指(3 ) 选项一:在调查过程中由于观察、测量等差错所引起的误差 选项二:在调查中违反随机原则出现的系统误差 选项三:随机抽样而产生的代表性误差 选项四:人为原因所造成的误差 问题:企业职工工资水平比上年提高5%,职工人数增加2%,则企业工资总额增长( 2 )。 选项一:10.0% 选项二:7.1% 选项三:7.0% 选项四:7.2% 问题:在假设检验中,原假设与备择假设( 3 ) 选项一:都有可能被接受 选项二:都有可能不被接受 选项三:只有一个被接受而且必有一个被接受 选项四:原假设一定被接受,备择假设不一定被接受 问题:小王收集了1978年以来历年我国人均GDP与人均消费额的资料,如果要反映这一时期我国生产与消费的关系,用什么图形最为合适?(2 ) 选项一:直方图

选项二:散点图 选项三:饼图 选项四:折线图 问题:若回归直线方程中的回归系数为0,则直线相关系数( 3 )。 选项一:r=1 选项二:r=-1 选项三:r=0 选项四:r 无法确定 问题:若消费者价格指数为95%,则表示( 4 )。 选项一:所有商品的价格都上涨了 选项二:所有商品的价格都下跌了 选项三:商品价格有涨有落,总体来说是上涨了 选项四:商品价格有涨有落,总体来说是下跌了 问题:某连续变量数列末位组为开口组,下限为200,相邻组组中值为170,则末位组中值为( 1 )。选项一:230 选项二:200 选项三:210 选项四:180 问题:若两变量的r=0.4,且知检验相关系数的临界值为,则下面说法正确的是( 3 )。 选项一:40%的点都密集分布在一条直线的周围 选项二:40%的点低度相关 选项三:两变量之间是正相关 选项四:两变量之间没有线性关系 问题:下列指标中包含有系统性误差的是(1 ) 选项一:SSA 选项二:SSE

统计学1-3章练习题参考答案

第一章统计总论 一、单项选择题 1.属于统计总体的是() A.某县的粮食总产量 B.某地区的全部企业 C.某商店的全部商品销售额 D.某单位的全部职工人数 B 2.构成统计总体的个别事物称为()。 A.调查单位 B.标志值 C.品质标志 D.总体单位 D 3.对某城市工业企业未安装设备进行普查,总体单位是()。 A.工业企业全部未安装设备 B.工业企业每一台未安装设备 C.每个工业企业的未安装设备 D.每一个工业企业 B 4.工业企业的设备台数、产品产值是()。 A.连续变量 B.离散变量 C.前者是连续变量,后者是离散变量 D.前者是离散变量,后者是连续变量 D 5.在全国人口普查中()。 A.男性是品质标志 B.人的年龄是变量 C.人口的平均寿命是数量标志 D.全国人口是统计指标 B 6.总体的变异性是指()。 A.总体之间有差异 B.总体单位之间在某一标志表现上有差异 C.总体随时间变化而变化 D.总体单位之间有差异 B 7.几位学生的某门课成绩分别是67分、78分、88分、89分、96分,“学生成绩”是()。 A.品质标志 B.数量标志 C.标志值 D.数量指标 B 8.某年级学生四门功课的最高考分分别是98分、86分、88分和95,这四个数字是() A.指标 B.标志 C.变量 D.标志值 D 9.下列指标中属于质量指标的是()。 A.社会总产值 B.产品合格率 C.产品总成本 D.人口总数 B 10.下列属于质量指标的是() A.产品的产量 B.产品的出口额 C.产品的合格品数量 D.产品的评价 D

11.下列属于离散型变量的是() A.职工的工资 B.商品的价格 C.粮食的亩产量 D.汽车的产量 D 12.标志的具体表现是指() A.标志名称之后所列示的属性或数值 B.如性别 C.标志名称之后所列示的属性 D.标志名称之后所列示的数值 A 13.社会经济统计的研究对象是()。 A.抽象的数量特征和数量关系 B.社会经济现象的规律性 C.社会经济现象的数量特征和数量关系 D.、社会经济统计认识过程的规律和方法 C 14.统计指标按所反映的数量特点不同可以分为数量指标和质量指标两种。其中数量指标的表现形式是()。 A.绝对数 B.相对数 C.平均数 D.百分数 A 15.以产品的等级来衡量某种产品的质量好坏,则该产品“等级”是() A.数量标注 B. 品质标志 C. 数量指标 D. 质量指标 B 16.设某地区有670家工业企业,要研究这些企业的产品生产情况,总体单位是() A.每个工业企业; B.670家工业企业; C.每一件产品; D.全部工业产品 C 17.某机床厂要统计该企业的自动机床的产量和产值,上述两个变量是()。 A.二者均为离散变量 B.二者均为连续变量 C.前者为连续变量,后者为离散变量 D.前者为离散变量,后者为连续变量 D 18.下列哪个是连续型变量() A. 工厂数 B. 人数 C. 净产值 D.设备台数 C 19.设某地区有670家工业企业,要研究这些企业的产品生产情况,总体单位是() A.每个工业企业; B.670家工业企业; C.每一件产品; D.全部工业产品 C 20.统计工作过程不包括()。 A.统计调查 B.统计分布 C.统计整理 D.统计分析 B 二、多项选择题 1.统计一词的含义是()

统计学第五版(贾俊平)第八章课后习题答案

《统计学》第八章课后练习题 8.4 解:由题意知,μ=100,α=0.05,n=9<30,故选用t统计量。经计算得:x =99.9778,s=1.2122, 进行检验的过程为: H0:μ=100 H1:μ≠100 t= s n = 1.21229 =?0.0549 当α= 0.05,自由度n-1= 8,查表得tα2(8)=2.3060,因为t< tα2,样本统计量落在接收域,所以接受原假设H0,即打包机正常工作。 用P值检测,这是双侧检验,故: P=2×1?0.5215=0.957,P值远远大于α,所以不能原假设H0。 8.7 解:由题意知,μ=225,α=0.05,n=16<30,故选用t统计量。 经计算得:x =241.5,s=98.7259, 进行检验的过程为: H0:μ≤225 H1:μ>225 t= s n = 98.725916 =0.6685 当α= 0.05,自由度n-1= 15,查表得tα(15)=2.1314,这是一个右单侧检验,因为t

即元件平均寿命没有显著大于225小时。 用P值检测,这是右单侧检验,故: P=1?0.743=0.257,P值远远大于α,所以不能拒绝原假设H0。 8.9, 解:由题意得 σA2=632,σB2=572,x A=1070,x B=1020,n A=81,n B=64,故选用z统计量。 进行检验的过程为: H0:μA?μB=0 H1: μA?μB≠0 Z=A B A B σA A +σB B = 632+572 =5 当α=0.05时,zα2=1.96,因为Z>zα2,所以拒绝原假设H0,,即A、B两厂生产的材料平均抗压强度不相同。 用P值检测,这是双侧检验,故: P=2×1?0.9999997=0.0000006,P值远远小于α,所以拒绝原假设H0, 8.13 解:建立假设为: H0: π1=π2 H1: π1≠π2 由题意得:

统计学试题库及答案

1、统计学与统计工作的研究对象就是完全一致的。F 2、运用大量观察法,必须对研究对象的所有单位进行观察调查。T 3、统计学就是对统计实践活动的经验总结与理论概括。T 4、一般而言,指标总就是依附在总体上,而总体单位则就是标志的直接承担者。T 5、数量指标就是由数量标志汇总来的,质量指标就是由品质标志汇总来的。F 6、某同学计算机考试成绩80分,这就是统计指标值。F 7、统计资料就就是统计调查中获得的各种数据。F 8、指标都就是用数值表示的,而标志则不能用数值表示。F 9、质量指标就是反映工作质量等内容的,所以一般不能用数值来表示F。 10、总体与总体单位可能随着研究目的的变化而相互转化。T11、女性就是品质标志。T 12、以绝对数形式表示的指标都就是数量指标以相对数或平均数表示的指标都就是质量指标 T 13、构成统计总体的条件就是各单位的差异性。F 14、变异就是指各种标志或各种指标之间的名称的差异。F 9、调查某校学生,学生“一天中用于学习的时间”就是(A)A、标志 13、研究某企业职工文化程度时,职工总人数就是(B) B数量指标 14、某银行的某年末的储蓄存款余额(C)C、可能就是统计指标,也可能就是数量标志 15、年龄就是(B)B、离散型变量 四、多项选择题 1、全国第四次人口普查中(BCE)A、全国人口数就是统计总体B、总体单位就是每一个人 C、全部男性人口数就是统计指标 D、男女性别比就是总体的品质标志 E、人的年龄就是变量 2、统计总体的特征表现为(ACD)A、大量性B、数量性C、同质D、差异性E、客观性 3、下列指标中属于质量指标的有(ABCDE)A、劳动生产率B、产品合格率C、人口密度 D、产品单位成本 E、经济增长速度 4、下列指标中属于数量指标的有(ABC) A、国民生产总值B、国内生产总值C、固定资产净值D、劳动生产率E、平均工资 5、下列标志中属于数量标志的有(BD)A、性别B、出勤人数C、产品等级D、产品产量E 文化程度 6、下列标志中属于品质标志的有(ABE)A、人口性别B、工资级别C、考试分数D、商品使用寿命E、企业所有制性质 7、下列变量中属于离散型变量的有(BE)A、粮食产量B、人口年龄C、职工工资 D、人体身高 E、设备台数 8、研究某企业职工的工资水平,“工资”对于各个职工而言就是(ABE)A、标志B、数量标

统计学各章练习

第一章绪论 一、判断改错题 1、统计学是一门研究现象总体数量方面的方法论科学,所以它不关心,也不研究个别现象 的数量特征。 2、社会经济统计学是一门实质性科学。 3、品质指标,是由名称和数值两部分组成的。 4、三个员工的工资不同,因此存在三个变量。 5、质量指标是反映总体质的特征,因此,可以用文字来表述。 6、连续变量的数值包括整数和小数。 7、指标体系是许多指标集合的总称。 8、总体和总体单位是固定不变的。 9、只要有了某个指标,就能对总体进行完整、全面的认识。 10、变量是指可变的数量标志。 11、时点指标均无可加性。 12、总量指标数值随总体范围大小而改变。 13、某厂年计划产量比去年提高8%,实际只提高5%,因此只完成计划的50%。 14、将若干个指标数值相加,即可得到指标体系的数值。 15、强度相对指标越大,说明分布密度越大。 二、多项选择题(在备选答案中,选出二个及以上正确答案) 1、下列各项中,属于品质标志的有( )。 A.性别 B.年龄 C.职务 D.民族 E.工资 2、下列各项中,属于连续变量的有( )。 A. 厂房面积 B.职工人数 C.产值 D.原材料消耗量(单位:千克) E.设备数量 3、统计指标按其反映的时间状况不同,有( )。 A.实体指标 B.客观指标 C.时期指标 D.主观指标 E.时点指标 4、在全国的工业普查中,有( )。 A.工业企业数是数量指标 B.设备台数是离散变量 C.工业总产值是连续变量 D. 每一个工业企业是总体单位 E.每个工业企业的职工人数是连续变量 5、某市工业企业状况进行调查,得到以下资料,其中统计指标是( )。 A.该市职工人数400000人 B.企业职工人数4000人 C.该市设备台数75000台 D.市产值40亿元 E.某企业产值20万元 6、商业网点密度=全市商业机构数/全市人口数,它是()。 A.比较相对指标 B.强度相对指标 C.数量指标 D.质量指标 E.平均指标 7、下列指标中的比例相对指标是()。 A.某厂工人中,技术工人与辅助工人人数之比为4∶5 B.某年全国高考录取与报考之比是1∶2 C.存款利息率 D.家庭收支比 E.甲地人均收入是乙地的3倍 8、间班组竞赛,结果甲组产量是乙组的2倍,废品总量中甲组占70%,说明()。 A.甲组产品质量优于乙组 B.甲组产品质量不如乙组 C.甲组废品率比乙组低 D.乙组废品率比甲组低 9、列指标类型中,分子、分母可以互换的有()。 A.强度相对指标 B.比例相对指标 C.比较相对指标 D.计划完成百分比 E.产品合格率 10、统计研究的方法有()。 A.大量观察法 B.时间数列分析法 C.统计分组法 D.指数分析法 E.综合指标法

统计学第四版第七章课后题最全答案

第七章 练习题参考答案 (1)已知σ=5,n=40,x =25,α=, z 2 05.0= 样本均值的抽样标准差 σ x =n σ= 79.0405 = (2)估计误差(也称为边际误差)E=z 2 α n σ =*= (1)已知σ=15,n=49,x =120,α=, z 2 05.0= (2)样本均值的抽样标准差 σ x =n σ= =4915 估计误差E= z 2 α n σ=* =4915 (3)由于总体标准差已知,所以总体均值μ的95%的置信区间为: n x z σ α 2 ± =±*=±,即(,) (1)已知σ=85414,n=100,x =104560,α=, z 05.0= 由于总体标准差已知,所以总体均值μ的95%的置信区间为: n x z σ α 2 ± =±* =100 85414±.144即(,) (1)已知n=100,x =81,s=12, α=, z 1.0= 由于n=100为大样本,所以总体均值μ的90%的置信区间为: n s x z 2 α±=±* =100 12±,即(,) (2)已知α=, z 2 05.0= 由于n=100为大样本,所以总体均值μ的95%的置信区间为: n s x z 2 α±=±* =100 12±,即(,) (3)已知α=, z 2 01.0= 由于n=100为大样本,所以总体均值μ的99%的置信区间为:

n s x z 2 α±=±* =100 12±,即(,) (1)已知σ=,n=60,x =25,α=, z 05.0= 由于总体标准差已知,所以总体均值μ的95%的置信区间为: n x z σ α 2 ± =±* =60 .53±,即(,) (2)已知n=75,x =,s=, α=, z 02.0= 由于n=75为大样本,所以总体均值μ的98%的置信区间为: n s x z 2 α±=± =75 9.823±,即(,) (3)已知x =,s=,n=32,α=, z 2 1.0= 由于n=32为大样本,所以总体均值μ的90%的置信区间为: n s x z 2 α±=± =32 74.90±,即(,) (1)已知:总体服从正态分布,σ=500,n=15,x =8900,α=,z 2 05.0= 由于总体服从正态分布,所以总体均值μ的95%的置信区间为: n x z σ α2 ±=±* =15 500±,即(,) (2)已知:总体不服从正态分布,σ=500,n=35,x =8900,α=, z 2 05.0= 虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的95%的置信区间为: n x z σ α2 ±=±* =35 500±,即(,) (3)已知:总体不服从正态分布,σ未知, n=35,x =8900,s=500, α=, z 1.0= 虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的90%的置信区间为: n s x z 2 α±=±* =35 500±,即(,) (4)已知:总体不服从正态分布,σ未知, n=35,x =8900,s=500, α=, z 2 01.0= 虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的99%的置信区间

统计学题库及题库答案

统计学题库及题库答案 ) B 、进行调查的时间 D 、调查资料报送的时间 2、对某城市工业企业未安装设备进行普查,总体单位是( ) A 、工业企业全部未安装设备 B 、企业每一台未安装设备 C 、每个工业企业的未安装设备 D 、每一个工业企业 3、 对比分析不同性质的变量数列之间的变异程度时 ,应使用( )。 A 、全距 B 、平均差 C 、标准差 D 、变异系数 4、 在简单随机重复抽样条件下,若要求允许误差为原来的 2/3,则样本容量( ) A 、扩大为原来的 3倍 B 、扩大为原来的 2/3倍 C 、扩大为原来的 4/9倍 D 、扩大为原来的 2.25倍 5、 某地区组织职工家庭生活抽样调查 ,已知职工家庭平均每月每人生活费收入的标准差为 可靠程度为0.9545,极限误差为1元,在简单重复抽样条件下,应抽选( )。 A 、576 户 B 、144 户 C 、100 户 D 、288 户 6、当一组数据属于左偏分布时,则( ) A 、 平均数、中位数与众数是合而为一的 B 、 众数在左边、平均数在右边 C 、 众数的数值较小,平均数的数值较大 D 、众数在右边、平均数在左边 7、 某连续变量数列,其末组组限为 500以上,又知其邻组组中值为 480,则末组的组中值为( ) A 、 520 B 、 510 C 、 500 D 、 490 8、 用组中值代表组内变量值的一般水平有一定的假定性,即( ) A 、 各组的次数必须相等 B 、 变量值在本组内的分布是均匀的 C 、 组中值能取整数 D 、 各组必须是封闭组 9、 XjX 2’…,X n 是来自总体的样本,样本均值 X 服从( )分布 A 、N(F 2) B.、N(0,1) C 、 N(n 巴nb 2 ) N(=) D 、 n 10、测定变量之间相关密切程度的指标是( ) A 、估计标准误 B 、两个变量的协方差 C 、相关系数 D 、两个变量的标准差 二、多项选择题(每题 2分,共10分) 1、抽样推断中,样本容量的多少取决于( )。 A 、总体标准差的大小 B 、 允许误差的大小 c 、抽样估计的把握程度 D 、总体参 题库1 、单项选择题(每题 2分,共20分) 1、调查时间是指( A 、调查资料所属的时间 C 、调查工作的期限 12元,要求抽样调查的

统计学第一章课后习题及答案

第一章 练习题 一、单项选择题 1.统计的含义有三种,其中的基础是() A.统计学B.统计方法 C.统计工作D.统计资料 2.对30名职工的工资收入进行调查,则总体单位是() A.30名职工B.30名职工的工资总额 C.每一名职工D.每一名职工的工资 3.下列属于品质标志的是() A.某人的年龄B.某人的性别 C.某人的体重D.某人的收入 4.商业企业的职工人数,商品销售额是() A.连续变量B.离散变量 C.前者是连续变量,后者是离散变量D.前者是离散变量,后者是连续变量5.了解某地区工业企业职工的情况,下列哪个是统计指标() A.该地区每名职工的工资额B.该地区职工的文化程度 C.该地区职工的工资总额D.该地区职工从事的工种 二、多项选择题 1.社会经济统计的特点,可概括为() A.数量性B.同质性 C.总体性D.具体性 E.社会性 2.统计学的研究方法是() A.大量观察法B.归纳推断法 C.统计模型法D.综合分析法 E.直接观察法 3.下列标志哪些属于品质标志() A.学生年龄B教师职称C企业规模D企业产值 4.下列哪些属于离散型变量 A年龄B机器台数C人口数D学生成绩 5.总体,总体单位,标志,指标这几个概念间的相互关系表现为() A.没有总体单位就没有总体,总体单位也离不开总体而独立存在 B.总体单位是标志的承担者 C.统计指标的数值来源于标志 D.指标是说明统计总体特征的,标志是说明总体单位特征的 E.指标和标志都能用数值表现 6.指标和标志之间存在着变换关系,是指() A.在同一研究目的下,指标和标志可以对调 B.在研究目的发生变化时,指标有可能成为标志

统计学第八章习题答案

第8章 时间序列分析和预测 从时间序列图可以看出,国家财政用于国防的支出额大体上呈指数上升趋势。 (2)年平均增长率为: %1.161%1.116131 .2901.49511190=-=-=-=n n Y Y G 。 (3)2271.5748%)1.161(1.4951?2010 =+?=Y 。 (2)2010年的预测值为:

8.6945 3474 57.6372.7494.7623.7534.5712010==++++= F (3)由Excel 输出的指数平滑预测值如下表: 2010年3.0=α时的预测值为: 24.6679.679)3.01(7.6373.0)1(2010=?-+?=-+=t t F Y F αα 5.0=α时的预测值为: 85.683730)5.01(7.6375.0)1(2010=?-+?=-+=t t F Y F αα 比较误差平方可知,5.0=α更合适。 8.3(1)第19个月的3期移动平均预测值为: 33.6303 1891 366064458719==++= F

3.0=时的预测值: 5.5959.567)3.01(6603.019=?-+?=F ,误差均方=87514.7 4.0=α时的预测值: 7.6181.591)4.01(6604.019=?-+?=F ,误差均方=62992.5 5.0=α时的预测值: 3.6335.606)5.01(6605.019=?-+?=F ,误差均方=50236。 比较各误差平方可知,5.0=α更合适。 输出的回归结果如下: 回归统计 Multiple R 0.9673 R Square 0.9356 Adjusted R Square 0.9316 标准误差 31.6628 观测值 18 方差分析 df SS MS F Significance F 回归分析 1 232982.5 232982.5 232.3944 5.99E-11 残差 16 16040.49 1002.53 总计 17 249022.9 Coefficients 标准误差 t Stat P-value Lower 95% Upper 95% Intercept 239.73203 15.57055 15.3965 5.16E-11 206.7239 272.7401 X Variable 1 21.928793 1.438474 15.24449 5.99E-11 18.87936 24.97822 t Y t 9288.2173.239?+=。

统计学答案第七章

1 估计量的含义是指()。 A.用来估计总体参数的统计量的名称 B.用来估计总体参数的统计量的具体数值 C.总体参数的名称 D.总体参数的具体数值 2 在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是使它与总体参数的离差越小越好。这种评价标准称为()。 A.无偏性 B.有效性 C.一致性 D.充分性 3 根据一个具体的样本求出的总体均值的95%的置信区间()。 A.以95%的概率包含总体均值 B.有5%的可能性包含总体均值 C.一定包含总体均值 D.要么包含总体均值,要么不包含总体均值 4 无偏估计是指()。 A.样本统计量的值恰好等于待估的总体参数 B.所有可能样本估计值的数学期望等于待估总体参数 C.样本估计值围绕待估总体参数使其误差最小 D.样本量扩大到和总体单元相等时与总体参数一致 5 总体均值的置信区间等于样本均值加减边际误差,其中的边际误差等于所要求置信水平的临界值乘以()。 A.样本均值的抽样标准差 B.样本标准差 C.样本方差 D.总体标准差 6 当样本量一定时,置信区间的宽度()。 A.随着置信系数的增大而减小 B.随着置信系数的增大而增大 C.与置信系数的大小无关 D.与置信系数的平方成反比 7 当置信水平一定时,置信区间的宽度()。 A.随着样本量的增大而减小 B.随着样本量的增大而增大 C.与样本量的大小无关 D.与样本量的平方根成正比 8 一个95%的置信区间是指()。 A.总体参数有95%的概率落在这一区间内 B.总体参数有5%的概率未落在这一区间内 C.在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数 D.在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数

相关主题
文本预览
相关文档 最新文档