当前位置:文档之家› 统计学第二版第八章

统计学第二版第八章

统计学第二版第八章
统计学第二版第八章

第八章 假设检验

第一节 假设检验的基本问题

一、假设检验及示例

假设检验是推断统计中的一个重要研究内容,该方法在现代经济管理学以及其它领域都有着广泛的应用。所谓假设检验,就是首先对总体的分布函数形式或分布的某些参数做出假设,再利用随机抽样得到样本数据,利用这些数据构造小概率事件,通过“小概率事件原理”对假设的正确性做出判断的统计推断过程与方法。它可以分为两类:一类是参数假设检验;另一类是非参数假设检验。下面结合两个实例来说明:

【例8.1】某品牌香烟的尼古丁含量服从2(4.55,0.108)N ,现测定了9支该品牌香烟,得到平均尼古丁含量为4.484mg ,假设方差没有发生变化,试检验现在的尼古丁含量是否发生变化?

在本例中,香烟的尼古丁含量为随机变量,记为ξ,则2(4.55,0.108)N ξ ,从而

4.55E ξμ==,

现在要通过随机抽样得到的9支该品牌香烟来检验尼古丁含量是否发生显著变化,也就是现在的含量μ与4.55 mg 有没有显著差异,这显然是已知总体的分布形式而对分布的参数提出假设并进行检验,属于参数假设检验问题。

【例8.2】某企业欲了解其产品定单的分布情况,在随机选择的一周中发现其定单频数分布如表8.1所示:

表8.1 产品定单的分布表 星期 星期一 星期二 星期三 星期四 星期五 合计

定单数 7 12 15 11 15 60

现在的问题是该企业的定单在每星期的5天中是均匀分布吗?

在本例中,由于定单的分布形式未知,现就其是否服从均匀分布给出检验,这是一个典型的非参数假设检验问题。

上述两个例子说明,无论是参数假设检验还是非参数假设检验,有两点是必不可少的:首先都要提出一个待检验的假设命题,如例8.1中的参数μ为4.55和例2中的定单服从均匀分布;其次,都要通过抽样获得样本资料来进行检验。

二、假设的表达形式

为了实现对假设进行检验,首先必须构造出合适的假设,例如上述的两个例子,构造假设分别为:

0H : 4.55μ=

0H :定单服从均匀分布

这就是原假设,或者称为零假设(Null Hypothesis ),通常以0H 表示。原假设的构造一般要遵循两个原则:一是根据实际问题和研究的目的来构造,不同的要求有不同的构造方法;二是构造的假设要有利于检验统计量的选择。与原假设对立是备择假设(Alternative Hypothesis ),通常以1H 表示,它是原假设被否定时另一种可能成立的结论。备择假设往往

比原假设还要重要,一般把期望出现的结论做为备择假设。例如例8.1中的备择假设可以设为:

111: 4.55

: 4.55: 4.55

H H H μμμ≠<>

第一种情况对应想知道香烟尼古丁含量是否为4.55mg ,可能大于也可能小于4.55mg ,

这是双边检验。

第二种对应想知道香烟尼古丁含量是否小于4.55 mg ,为左检验。

第三种情况对应是想知道香烟尼古丁含量是否大于4.55 mg ,为右检验。左检验和右检

验统称为单边检验。

需要说明的是,原假设和备择假设不一定完全对逆,这就是为什么说1H 表示的是原假

设被否定时另一种可能成立的结论。

三、小概率事件原理与假设检验的显著性水平

在构造出适当的假设以后,如何利用样本资料来验证原假设是否成立呢?通常的做法

是在原假设成立的情况下构造一个小概率事件,然后检验小概率事件在一次实验中是否发生。小概率事件原理表明:一个概率很小的事件,比如概率为0.05的事件,在一次实验中几乎不可能发生。如果在原假设成立下,构造的小概率事件在一次实验中竟然发生了,那么就怀疑原假设的正确性。为了加深对小概率事件原理的理解,现举例说明如下:

【例8.3】某大学的班长声称,该班同学的出操率为0.97,为检验其说法的可靠性,某

次随机在该班中抽取了5名学生,发现有2名学生未出操,问该班长的说法是否可信。

解:记该班同学的出操率为p ,首先构造出原假设和备择假设为:

01:0.97:0.97H p H p =≠

这里构造的是双边检验,从实际抽取的样本资料来看,该班同学的出操率为0.6(3/5),

显然与所声称的出操率相差0.37(0.97-0.6),产生差异的原因可能有两种途径:一是该班长说法是正确的,即出操率的确是p =0.97,0.37的差异完全由于抽样的随机性而造成的;二是抽样的随机性不可能造成如此大的差异,0.37的差异来源于班长的说法有误,即该班同学的出操率不等于0.97。现在假设差异完全是由抽样的随机性产生的,即0:0.97H p =成立,那么5人中有2人未出操的概率可以利用二项式分布来计算,即概率为22350.030.970.008C =,这显然是一个小概率事件,然而小概率事件在一次抽查(实验)中竟然发生了,从而就怀疑该班长说法的真实性,即该班同学的出操率不为0.97。当然究竟概率小到什么程度才算小,这没有统一的标准,同一个假设,可能在不同的小概率选取下会得出完全相反的结论,所以假设检验总是和一定的小概率事件联系在一起,这个小概率就是假设检验中的显著性水平,通常记为α,从这个角度来说,假设检验也称为显著性检验,实际中取0.05α=较为常见。

上述概率的计算使用EXCEL 的过程如下:

(1)打开一个EXCEL 空表。

(2)在空表的任意一个单元格中输入‘=BINOMDIST(2,5,0.03,false )’,回车后可以得到概率为0.008214。

四、假设检验中的两类错误

在假设检验中可能要发生两类错误,第一类错误为弃真错误,即原假设0H 本来是正确

的,然而由于构造的小概率事件在一次实验中竟然发生了,从而拒绝原假设0H ,显然发生这种情况的概率正是小概率事件本身的概率α,如果小概率事件没有发生,就接受原假设0H ,从而做出正确的选择,发生此种情况的概率为1α-。第二类错误为取伪错误,即原假设0H 本身就是错误的,构造的小概率事件在一次实验中没有发生,从而相信原假设0H 是正确的而加以接受,发生这样的概率记为β,另一方面,做出正确抉择而拒绝原假设0H 的概率为1β-。现将两类错误的情况总结在表8.2中:

表8.2 假设检验中的两类错误及其概率 接受0H ,拒绝1H 拒绝0H ,接受1H

0H 为真 判断正确,概率为1-α 判断错误,犯第一类错误,概率为α

0H 为假 判断错误,犯第二类错误,概率为β 判断正确,概率为1-β

一个自然的想法是尽可能地降低犯这两类错误的可能性,然而对于给定的样本容量,研

究表明:如果减少弃真错误概率α,就会增大犯取伪错误概率β,反之亦然。所以在假设检验中存在着对两类错误进行取舍的问题,一般来说,哪类错误带来的后果越严重,就把哪类错误作为首要考虑的目标。目前在假设检验中都遵循着这样的一个原则,皮迩逊指出:在控制弃真错误概率α的条件下,尽可能地降低犯第二类错误的概率β水平。如果允许的话,通过加大样本容量,可以同时降低犯这两类错误的概率。关于犯这两类错误概率的计算方法请参考本书配套的习题集。

第二节 单个正态总体均值与方差的检验

假设讨论的总体为2

(,)N ξμσ ,12(,,,)n ξξξ 是从该总体中随机抽取的一个容量为n 的样本,样本的观察值为12(,,,)n x x x 。记样本均值统计量为1

1n

i i n ξξ==∑,对应统计量的值为1

1n

i i x x n ==∑。现就正态总体下两个参数的假设检验进行分析。 一、关于均值μ的检验

1、总体方差2

σ已知

为了说明这类问题的假设检验,首先以例8.1为代表来说明,建立如下的假设形式:

01: 4.55: 4.55H H μμ=≠ 这是双边检验。数理统计理论表明:E ξμ=,如果原假设成立,那么应该有样本均值统计量的观察值x 与4.55相差不能太大,相差的幅度视检验的显著性水平而定。为此可以构造一个小概率事件,一方面要能够把这种差异引进来,另一方面能够使用一种确定的分布来计算这个小概率。考虑到2(,/)N n ξμσ ,从而构造如下的小概率事件:

1/2P z αα-??>=???

其中1/2z α-为临界值,且满足1/2()1/2z αα-Φ=-,()Φ?为标准正态分布的分布函数。在检验时,可以用均值的观察值x 代替ξ,以原假设成立时的实际值0μ代替μ,从而获得统计

量的值0(x z μσ-=,通过查表得到临界值1/2z α-,然后进行比较来验证小概率事件是否

发生,如果统计量的绝对值大于临界值,则小概率事件发生而拒绝原假设,接受备择假设,反之亦然。从另一个方面来看,小概率事件也可以等价地表示为:

1/21P z αα-??≤=-???

由此得到样本均值统计量值x 在原假设成立下应该落入如下的区域(接受域):

01/201/2[x z z ααμμ--∈-+ 反之如果样本均值统计量值x 落入如下的区域(拒绝域):

01/201/2(,()z z ααμμ---∞-?+∞

则就拒绝原假设,从而接受备择假设。显然这是一个问题的两个方面,实际在检验时通常直接使用验证小概率事件是否发生来进行。就例8.1而言有:

1.833z === 而1/20.975 1.96z z α-==,显然有0.9751.833 1.96z z =<=,故小概率事件没有发生,所以接受原假设,即香烟的尼古丁含量在0.05的显著性水平下没有发生显著的变化。如果计算样本均值x 的接受域,那么有:

01/201/24.47944, 4.62056

z z ααμμ---=+= 显然样本均值统计量的值 4.484x =,显然有:

4.484[4.47944,4.62056]x =∈

从这个角度来说,也接受原假设而拒绝备择假设,由此可见,这两种方法是等价的。

上述过程如果用EXCEL 来计算步骤如下:

(1)打开一个EXCEL 空表,任选两列,比如A 、B 两列,输入如图8.1中的数据:

图8.1 假设检验数据

(2)在B5中输入‘=(B1-B2)*SQRT (B4)/B3’,回车后得到-1.8333。

(3)将选中B6,输入‘=NORMSINV(0.975)’,回车可以得到临界值为1.96。

(5)在B7中输入‘=B2-B6*B3/SQRT (B4)’,在B8中输入‘=B2+B6*B3/SQRT(B4)’,回车以后分别得到样本均值的下限和上限范围。在A 列中分别输入注释语句,最后的结果如图8.2所示:

图8.2假设检验的最终结果

2、总体方差2σ未知

这时的分析方法同方差已知的情况分析思路一样,但由于方差2σ未知,所以不能直接

使用正态分布统计量,但根据数理统计知识有:

(1)t n - 其中2

211()1n i i s n ξξ==--∑为样本方差统计量,其观察值为2211()1n i i s x x n ==--∑,从而可以构造如下的小概率事件:

/2(1)P t n αα??>-=???

其中/2(1)t n α-表示自由度为1n -的t 分布上/2α分位点。在原假设成立下,代入相关的值来检验小概率事件是否发生,从而给出假设检验的结论。同样也可以得到此种情况下在原假设成立时样本均值观察值x 的接受域为:

0/20/2[((x t n t n ααμμ∈--+- 读者也可以给出相应的拒绝域。下面结合一个实例来说明:

【例8.4】根据以往的经验知灯泡的寿命服从2(2000,)N σ,现从一批灯泡中随机抽取50个,得到平均寿命为1900小时,490s =,取0.01α=,检验现在的均值是否发生变化? 解:首先构造假设如下:

01:2000

:2000H H μμ=≠

构造统计量为t =

1.443t === 对于0.01α=,有/20.005(1)(49)

2.68t n t α-==,显然有:

0.0051.443(49) 2.68t t =<=

所以小概率事件没有发生,故接受原假设,即灯泡的寿命没有发生显著的变化。读者也可以通过计算在原假设成立情况下的样本均值的接受域来进行假设检验,这里不再赘述。

上述过程使用EXCEL 求解步骤如下:

(1)打开EXCEL 空表,选取任两列比如A 、B 两列,输入下如图8.3中的数据:

图8.3 假设检验的数据

(2)在B6中输入‘=(B1-B2)*SQRT (B4)/B3’,回车后得到-1.443。

(3)选中B7,输入‘=TINV(0.01,49)’,回车后得到2.68。然后在A 列中加入注释,最后的结果见图8.4。

图8.4 假设检验的最终结果

以上就双边检验的问题给出分析,事实上,可以仿照这种检验思路,对单边检验构造

出相应的小概率事件,结果分别为:

对于左检验有:0010:,:H H μμμμ=<,当方差2σ已知时,构造的小概率事件为

1P z αα-??<-=?????

,当方差2σ未知时构造的小概率事件为

P t αα??<-=?????

。对于右检验有:0010:,:H H μμμμ=>,当方差2σ已知时,

构造的小概率事件为1(P z αξμασ-??-?

?>=??????

,当方差2σ未知时,构造的小概率事件为

P t αα??>=?????

。从而可以根据实际情况,代入相应的数据来验证小概率事件是否发生来进行假设检验。需要说明的是,当将上面单边检验中原假设的等号分别该为,≥≤时,拒绝域不会发生变化。

二、关于方差2σ的假设检验(只考虑均值未知的情况)

1、关于2σ的双边检验

首先建立的假设为: 22220010

::H H σσσσ=≠ 这里选择的统计量为2

222(1)(1)n s n χχσ-=- ,构造的小概率事件为:

221222(1)(1)n s n s P k P k ασσ????-->+<=????????

为了降低犯第二类错误的可能性,选择这样一组的临界值

/21/22212(1),(1)k n k n ααχχ-=-=-,其中/22(1)n αχ-是自由度为1n -的2χ分布上/2α分位

点。在进行假设检验时,在原假设成立的情况下和相关的样本数据,验证小概率事件是否发

生,从而给出假设检验的结果。另一方面得到关于2σ的拒绝域为

22

2

222/21/2(1)(1),(1)(1)n s n s n n αασσχχ---<>--,从而也可以使用拒绝域或接受域来进行检验。 【例8.5】某种轴承的直径服从2(,0.005)N μ,现从新生产的一批轴承中任取9只,测得轴

承的样本方差为220.008s =,假设0.05α=,能否认为这批轴承直径的方差仍为20.005? 解:这是一个关于方差的双边检验问题,建立假设如下:

22

2201:0.005:0.005H H σσ=≠ 22

2/22/22221/221/2(1)80.0080.05(1)17.5350.0000292(1)17.535

(1)80.0080.05(1) 2.180.0002349(1) 2.18n s n n n s n n αααααχχαχχ---?=?-=?==--?=?-=?

==- 显然2

222/2(1)0.0050.0000250.0000292(1)

n s n ασχ-==<=-,从而落在拒绝域中,故拒绝原假设,即不能认为这批轴承的直径方差仍为2

0.005。

上述过程也可以使用EXCEL 来进行,步骤如下:

(1)打开EXCEL 空表,选取任两列比如A 、B 两列,输入下如图8.5中的数据:

图8.5 假设检验的数据

(2)选中B5,输入‘=CHIINV(0.025,8)’,回车后得到临界值17.535,同样将光标放

在B6,输入‘=CHIINV(0.975,8)’,回车得到另一个临界值2.18。

(4)在B7中输入‘=(B3-1)*B1/B5’,在B8中输入‘=(B3-1)*B1/B6’,可以得到两

个统计量值分别为0.0000292和0.0002349。最后在A 列中加以注释,结果如图8.6所示:

图8.6 假设检验的最终结果

2、关于2σ的单边检验

这点和双边检验没有什么本质区别,只是对应的拒绝域只有一个。此时有:

左检验:

22220010

::H H σσσσ=< 对应的拒绝域为2

2

2(1)(1)n s n ασχ-<-。 右检验:

22220010

::H H σσσσ=> 对应的拒绝域为2

2

21(1)(1)n s n ασχ-->-。 第三节 双正态总体下的假设检验

假设现在讨论的总体为两个,分别记为211(,)N ξμσ ,222(,)N ημσ ,且两个总体

相互独立。112(,,,)n ξξξ ,212(,,,)n ηηη 是从两个总体中随机抽取的一个样本,样

本的观察值分别记为121212(,,,),(,,,)n n x x x y y y 。记样本均值统计量分别为

1111n i i n ξξ==∑、212

1n i i n ηη==∑,对应统计量的值分别为1111n i i x x n ==∑、2121n i i y y n ==∑。样本方差分别12

21111()n i i s n ξξ==-∑、22221

21()n i i s n ηη==-∑,对应统计量的观察值仍记为1221

111()n i i s x x n ==-∑、2222121()n i i s y y n ==-∑。现就两个正态总体下两个参数的假设检验进行分析。

一、关于两个均值相等的检验

1、两个正态总体的方差2212,σσ都已知

此时构造的双边假设检验为:

012

112::H H μμμμ=≠

由数理统计知识得到:

(0,1)N ξη 从而构造的小概率事件为:

1/2P z αα-???>=????

以样本均值x 、y 代入可以验证小概率事件是否发生来检验。或者在原假设成立下,得到两个样本均值差的拒绝域为:

1/1/x y z x y z αα--->-<-在进行假设检验时,既可以通过在原假设成立下验证小概率事件是否发生来进行,也可以通过比较在原假设成立时样本均值统计量值的差是否落入拒绝域来进行,这两者也是等价的。

【例8.5】某银行正考虑在两个相邻地区之一开设一个新的支行。银行所关心的因素是这两个地区的家庭平均收入是否相同。根据以往的调查资料,银行知道这两个地区家庭平均收入都服从正态分布,且标准差都等于500元。但银行为了慎重起见,在这两个地区各抽取了200户,经计算得到第一个地区的平均收入为25600元,第二个地区的平均收入为25490元,问在0.05的显著性水平下,检验这两个地区家庭收入是否有显著差异。

解:首先构造假设为:

012

112::H H μμμμ=≠

根据样本资料计算检验统计量的值为:

2.2x y z === 当0.05α=时有1/20.975 1.96z z α-==,从而有0.975z z >,小概率事件发生,从而拒绝原假设,即两个地区家庭收入在0.05的显著性水平下有显著差异。

上述检验过程也可以使用EXCEL 进行,步骤如下:

(1)打开EXCEL 空表,选取任两列比如A 、B 两列,输入下如图8.7中的数据:

图8.7假设检验的数据

(2)在B8中输入‘=(B1-B2)/SQRT ((B3*B3/B5)+ (B4*B4/B6))’,回车后得到2.2。

(3)选中B9,输入‘=NORMSINV(0.975)’,回车后可以得到1.96。最后将A 列中加以注释得到的结果如图8.8所示:

图8.8 最终假设检验结果

2、两个总体方差2212,σσ未知但相等

这种情况下构造的双边检验同第一种情况是一样的,但由于方差2212,σσ未知,所以不

能直接采用正态分布的统计量,根据数理统计知识有:

12(2)t n n ξη+- 其中222

112212(1)(1)2

w n s n s s n n -+-=+-。从而构造小概率事件为:

/212(2)P t n n αα???>+-=????

或者得到在原假设成立时一次实验样本均值差满足的拒绝域为:

/212/212(2)(2)x y t n n s x y t n n s αα->+--<-+-同样对于两个总体均值差也有单边检验,即有左检验和右检验,检验的假设形式分别: 左检验为012112::H H μμμμ=<,右检验为:012

112::H H μμμμ=> 其检验思路与双边检验是一样的,就两个总体的方差未知但相等的情况而言,左检验和右检验对应的样本均值差的拒绝域分别为:

左检验:12(2)x y t n n s α-<-+-

右检验:12(2)x y t n n s α->+-【例8.6】在针织品漂白工艺中,要考察温度对针织品断裂强力的影响,为比较50度与60度的影响有无差别,分别重复做了8次实验,测得的数据为(取0.05α=):

50度:20.5,18.8,19.8,20.9,21.5,19.5,21.0,21.2

60度:17.7,20.3,20.0,18.8,19.0,20.1,20.0,19.1

试检验两者的均值是否有显著差异(假设方差相等,且针织品断裂强力服从正态分布)。

解:如果视50度和60度下针织品断裂强力为两个不同的总体,显然这是一个双边检验问题,而且两个总体的方差未知但相等,采用t 分布的统计量,具体的过程如下:

012112::H H μμμμ=≠

2212/21220.4,19.37520.419.375 1.025,0.8857,0.7878

1(2) 2.14480.914760.9812x y x y s s t n n s α==?-=-===+-=??=

从而有/2121.0250.981(2)x y t n n s α-=>=+-,显然一次实验中,样本均值差统计量落入拒绝域,从而拒绝原假设,即在0.05α=的显著性水平认为两者是有差别的。

上述检验过程也可以使用EXCEL 进行,步骤如下:

(1)打开EXCEL 空表,选取任两列比如A 、B 两列,输入下如图8.9中的数据:

图8.9假设检验的数据

(2)在A10中输入‘=AVERAGE(A2:A9)’ ,在B10中输入‘=AVERAGE(B2:B9)’,在A11中输入‘=VAR(A2:A9)’ ,在B11中输入‘=VAR(B2:B9)’,分别得到两个总体

下的样本均值和样本方差。

(3)在B12中输入‘=SQRT((7*A11+7*B11)/14)’,得到w s 的估计值为0.915。

(4)在B13中输入‘=A10-B10’,得到两个总体均值的差为1.025。

(5)在B14中输入‘=TINV(0.05,14)’,得到临界值为2.1448。

(6)在B15中输入‘=B12*B14*SQRT(1/8+1/8)’,得到样本均值差的临界值为0.98。 最后将A 列中加以注释得到的结果入图8.10所示:

图8.10 假设检验的最终结果

二、关于两个方差相等检验

这里只讨论两个总体的均值12,μμ未知的情况,首先建立双边检验为:

2222012112

::H H σσσσ=≠ 由数理统计知识得到:

2211122222

/(1,1)/s F n n s σσ-- 从而构造在原假设成立时的小概率事件为:

2211/2121/2122222(1,1)(1,1)s s P F n n P F n n s s ααα-????>--+<--=????????

从而得到原假设成立时两个样本方差比的拒绝域为:

2211/2121/2122222

(1,1),(1,1)s s F n n F n n s s αα->--<-- 对于实际的假设检验,既可以使用检验小概率事件是否发生进行检验,也可以使用检验两个样本方差统计量值之比是否落入拒绝域来进行检验。关于单边检验的问题,对应的假设分别为:

左检验:2222012112::H H σσσσ=<,右检验:2222012012::H H σσσσ=>

在原假设成立下对应的拒绝域分别为2111222

(1,1)s F n n s α-<--,211222(1,1)s F n n s α>--。 【例8.7】两台车床生产同一种滚珠,假设滚珠的直径都服从正态分布,现从中分别抽取8个和9个产品,得到的数据如下:

车床1:15.0,14.5,15.2,15.5,14.8,15.1,15.2,14.8

车床2:15.2,15.0,14.8,15.2,15.0,15.0,14.8,15.1,14.8

试检验两者的方差是否相等,取0.05α=。

解:根据此种情况下的假设检验,得到有关的过程如下:

2222012

11222

211222

/2120.0251/212/221::0.096,0.026 3.659(1,1)(7,8) 4.53,(1,1)1/(1,1)1/4.900.204H H s s s s F n n F F n n F n n ααασσσσ-=≠==?=--==--=--==从而有:

210.9750.02522

(7,8)(7,8)s F F s << 可以看出,两个总体样本方差值之比的值落在接受域内,从而接受原假设,即两个车床生产的滚珠的直径在0.05显著性水平下没有明显差异。

上述检验过程使用EXCEL 解决的步骤如下:

(1)打开EXCEL 空表,选取任两列比如A 、B 两列,输入如图8.11中的数据:

图8.11假设检验的数据

(2)在A11中输入‘=VAR(A2:A9)’, 在B11中输入‘=VAR(B2:B10)’,分别得到两个总体下的样本方差估计值。 (3)在B12中输入‘=A11/B11’,回车得到两个样本方差比的估计值。

(4)在B13中输入‘=FINV(0.025,7,8)’,回车得到两个样本方差比临界值的上限。

(5)在B14中输入‘=FINV(0.975,7,8)’,回车得到两个样本方差比临界值的下限。对A 列中加以注释,可以得到的最终结果见图8.12。

图8.12 假设检验的最终结果

第四节 非参数检验

在假设检验时,有时事先并不知道总体具有什么样的分布形式,或者有时就是要对总体

的分布形式进行检验,例如第一节中关于定单在一周内是否服从均匀分布的检验。这种检验总体的分布形式或在未知总体的分布形式而对其含有的参数进行的检验称为非参数检验,本节就简要介绍几种常用的非参数检验方法。

一、拟合优度检验

【例8.8】题目见第一节的【例8.2】,取显著性水平α=0.05。

解:如果定单分布是均匀的,则每天收到定单的概率应该相等,即都等于0.2。因此,一个星期60份定单中,从理论上说每天应收到12份,但实际情况并不是这样,见表8.1 所示。为了概括它们之间的差别,记观测频数为oi f ,理论频数为ei f ,其中i =1,2,…,k (k 表示所分的组数,如本例中k =5),K.Person 提出并证明了以下统计量: 约束个数)--=

∑=k f f f k i ei

ei oi (~)(2122χχ 在本例中有一个约束,即:6011

==∑∑==k i k i ei oi f f

,所以本例的自由度为4。为便于比较,上式计算结果列在表8.3中:

表8.3 均匀分布检验表 星期 观测频数oi f 理论频数ei f 2)(ei oi f f - ei ei oi f f f /)(2-

星期一 7 12 25 2.08

星期二 12 12 0 0

星期三 15 12 9 0.75

星期四 11 12 1 0.08

星期五 15 12 9 0.75

合 计 60 60 44 3.66

在显著性水平α=0.05的条件下,查得)4(205.0χ=9.488。由于2χ=3.66<)4(2

05.0χ=9.488,所以接受定单在每星期的5天中是均匀分布这一假设。

上述过程使用EXCEL 来完成的步骤如下:

(1)打开EXCEL 空表,在A 、B 列输入如图8.13的数据:

图8.13假设检验的数据

(2)在C1中输入‘两者的差’,在C2中输入‘=A2-B2’,回车后得到第一个差值,然后将光标放在单元格C2的右下脚,当光标变为‘十’字形时,按住鼠标左键往下拖,直到C6。计算出所有的差值。

(3)在D1中输入‘差的平方’,在D2中输入‘=C2*C2’,回车后得到第一个差的平方,仿照(2)可以得到所有其它差的平方。

(4)在E1中输入‘差的平方/理论值’,在E2中输入‘=D2/B2’,得到第一个差的平方/理论值,然后同样可以得到其它的值。

(5)在E7中输入‘=SUM(E2:E6)’,得到统计量的值,在E8中输入‘=CHIINV(0.05,

4)’,回车后得到临界值9.488。所有的结果如图8.14所示:

图8.14 假设检验的最终结果

对于其它形式的分布检验,也可以利用卡方检验。另外卡方检验在检验总体的独立性和

几个总体的齐一性中也有广泛的应用。拟合优度检验的核心思想就是考察理论频数与实际频数的差别而进行的,有兴趣的读者可以参考非参数检验方面的文献。

二、符号检验

符号检验可以检验某个样本是否来自某个总体,也可以使用成对样本来检验两个总体是

否有显著的差异,下面结合成对样本检验两个总体是否有差异来介绍符号检验的思路。

【例8.9】使用两种不同的猪饲料,x y 来养猪,其增重情况如表8.4所示,试检验:

01:()1/2,:()1/2H P x y H P x y >=>≠

表8.4 两种饲料的增重情况

随机样本 饲料x 饲料y x-y 随机样本 饲料x 饲料y x-y

1 25 19 + 8 28 26 +

2 30 32 - 9 32 30 +

3 28 21 + 10 29 25 +

4 23 19 + 11 30 29 +

5 24 25 - 12 30 31 -

6 35 31 + 13 31 25 +

7 30 31 - 14 16 25 -

解:首先这是个双侧检验问题,如果原假设是正确的,即如果两种饲料的增重效果没有显著差异,则它们的随机样本之间的差值在“+”和“—”个数上应该大体相等,从而通过比较正、负号是否超过或者小于某个临界值来进行假设检验。对于本例而言,显然有差值的正、负号个数应该服从(14,1/2)B ,以正号个数为例说明,设正号的个数为(14,1/2)B ξ ,通过计算有:

(3)(11)0.057P P ξξ≤+≥=

这说明如果取0.057α=,则正号的个数在4和10之间时,就接受原假设,否则就拒绝原假设,经过检验有正号的个数为9,落在接受域之内,从而接受原假设,说明饲料x 的增重效果与饲料y 的增重效果在0.057显著水平上没有显著差异。

上述过程可以使用EXCEL 来计算,这里只给出计算小概率的EXCEL 处理。打开一个EXCEL 空表,在任意一个单元格中键入‘=BINOMDIST(3,14,0.5,1)’,回车后可以得到左侧概率值为0.02868652 ,再选择一个单元格,输入‘=1-BINOMDIST(10,14,0.5,1)’,从而可以得到右侧概率值为0.02868652,从而得到小概率事件和相应的概率。

三、Willcoxon 秩次和检验

秩次和检验是针对符号检验的不足而提出的,它不但考虑差值的符号,而且还在此基础

上对差值取绝对值并加以排序,进而求秩次和,通过对秩次和求分布来进行检验。该检验要求总体的分布为连续型。下面结合一个关于中位数检验的实例,介绍该检验的步骤。

【例8.10】某电池厂认为其电池的寿命为140安培小时,现从中抽取20n =个进行测试,结果见表8.5,试根据数据资料检验中位数是等于140安培小时还是小于140安培小时,取α=0.05。

表8.5 某电池的寿命数据

i x 140i x - 140i x - 秩次 符号 i x 140i x - 140i x - 秩次 符号

137 –3 3 12 - 141.1 1.1 1.1 6 +

140 0 0 去掉 139.2 -0.8 0.8 2 -

138.3 -1.7 1.7 7.5 - 136.5 -3.5 3.5 13.5 -

139.0 -1 1 5.0 - 136.5 -3.5 3.5 13.5 -

144.3 4.3 4.3 16 + 135.6 -4.4 4.4 17 -

139.1 -0.9 0.9 3.5 - 138.0 -2.0 2.0 10 -

141.7 1.7 1.7 7.5 + 140.9 0.9 0.9 3.5 +

137.3 -2.7 2.7 11 - 140.6 0.6 0.6 1.0 +

133.5 -6.5 6.5 19 - 136.3 -3.7 3.7 15 -

138.2 -1.8 1.8 9 - 134.1 -5.9 5.9 18 -

解:首先建立假设如下:

00:140:140e e H M H M =<

其中e M 为中位数。将原始数据减去中位数以后,再编秩次和,具体过程如下:

(1)对每个观察值减去中位数。

(2)对得到的数取绝对值,然后按照从小到大的顺序给予标上秩次号,如果有几个数相等,则使用平均的秩次,如果某个数正好等于中位数,则该数被删除。

(3)计算带正号的秩次和,记为i W R +

=∑。

对于考察观察值个数为n 的数据而言,总的秩次和为(1)2

n n +,如果原假设成立,那么(1)0,2n n W +??∈ ???

,更进一步地说,应该在其平均数(1)4n n +左右变动(另一半为负号的秩次和)。如果原假设不成立,那么W 应该向两个端点靠拢,如果偏向0,则中位数小于给定的检验值,如果偏向

(1)2

n n +,则中位数大于给定的检验值。 (4)查Willcoxon 秩次和检验表(当20n <时)。 若20n ≥时,则可以使用正态分布做近似检验,令1/2()

W W E W z σ-=,其中(1)()4

n n E W +=

,1/2W σ= 对于本例有19n =,采用近似检验的结果为:

19(191)()954E W +==

,1/224.85W σ== 而34i W R +==∑,从而有1/2()

3495 2.4524.85

W W E W z σ--===-,按照题意要进行的左检验,当α=0.0 5时,查得临界值为 1.645-,正好落在拒绝域内,所以拒绝原假设而接受备择假设,即应该认为中位数是小于140;另一个方面,如果查Willcoxon 秩次和检验表有0.051953W =,而实际上有0.0519

3453W W =<=,从而也得出同样的结论。 四、游程检验

游程检验是基于游程个数和游程长度两个方面来检验,把每个连续出现某一个观察值的

段称为一个游程,每个游程包含的某一个样本观察值的个数称为游程的长度,如序列XXXYXYYYXYY 中有6个游程,游程长度分别为3、1、1、3、1、2。游程检验主要用于检验单个序列分布是否具有随机性以及两个样本是否具有同一分布。下面结合一个实例来分析如何利用游程的个数检验单个序列的是否具有随机性。

【例8.11】现有以下的16个数据:61、74、70、63、64、58、82、78、60、76、85、72、68、54、62、56,试判断这批数据是否具有随机性。

解:首先以这批数据的中位数为参考对象,容易得到中位数为(64+68)/2=66,设小于66的数记为X ,大于66的数据记为Y ,则容易得到这批数据对应的形式为:

XYYXXXYYXYYYYXXX

如果该批数据具有随机性,那么必然会有X 、Y 频繁交替出现,或者说游程的个数应该较多,相应游程的长度较小,所以可以通过求出游程个数对应的概率来确定小概率事件是否发生。假设现有m 个X 和n 个Y 构成的序列,则游程个数为r 的概率为:

(1)当2r k =为偶数:11112(2)k k n m n n m

C C P r k C ----+==; (2)当21r k =+为奇数:111111(21)k k k k n m n m n n m

C C C C P r k C ------++=+=。 对于本例有8m n ==,从而有:

11118181888

11111181818181888

21218181

8

8822121281818181888

22(2)(16)1287014(3)(15)12870298(4)(14)12870294(5)(13)12870C C P r P r C C C C C P r P r C C C

P r P r C C C C C P r P r C ----+------+----+------+=====+==========+=====

从而有:

(2)(3)(4)(5)(16)(15)(14)(13)0.0634P r P r P r P r P r P r P r P r =+=+=+=+=+=+=+==如果取显著性水平0.0634α=,使用双侧检验,那么如果原序列是随机分布的,那么在理论上游程的个数应该在6和12之间的概率为0.9366,如果游程的个数超过这个范围,则就认为小概率事件发生,在本例中不难发现游程的个数为7,所以落入接受域中,从而在0.0634α=接受该批数据具有随机性。

习 题

8.1 简述假设检验的概念与分类。

8.2 简述假设检验中的两类错误。

8.3 简述参数假设检验的基本步骤。

8.4 一制造厂商声称,其制造的钓鱼线的平均强度为15公斤,标准差为0.5公斤,为了检验其说法是否正确,随机抽取了50根,测得平均强度为14.9公斤。试以0.05的显著性水平检验钓鱼线强度是否为15公斤;如果真实的平均强度为14.8公斤,试计算犯第二类错误的概率。

8.5 现有10个容器,假设其容量服从正态分布,测得容量分别为10.2、9.7、10.1、10.3、10.1、9.8、9.9、10.4、10.3、9.8公升,试在0.01的显著性水平下检验其容量是否为10公升。

8.6 设润滑油的容器容量为正态分布,且有20.03σ=,现抽取10个,测得0.246s =,

在0.01的显著性水平来检验20.03

σ=是否成立。

8.7 从标准差

15.2

σ=的正态总体中取

125

n=的样本,得到平均数为81,另从标准差

23.4

σ=的正态总体中取

236

n=的样本,得到平均数为76,试在0.05的显著性水平下检

验两个正态总体的均值是否相等。

8.8 欲估计某省两个地区的收入差异,自一个地区抽取100人,得到年总收入为26000元,样本标准差为1300;从另一个地区抽取200人,得到年总收入为26900元,样本标准差为1400,试在0.05的显著性水平下检验两者的收入是否有显著差异。

8.9 现使用两种仪器来测量一氧化碳的含量,其结果如下:

仪器A:0.96 0.82 0.75 0.61 0.89 0.64 0.81 0.68 0.65

仪器B:0.87 0.74 0.63 0.55 0.76 0.70 0.69 0.57 0.53

假设测得的数据服从正态分布,试在0.05的显著性水平检验两类数据的方差是否相等。8.10 掷一个六面体共180次,得到的结果如下:

点数 1 2 3 4 5 6

次数 28 36 36 30 27 23

试以0.05的显著性水平检验这个六面体是否均匀。

统计学第七章、第八章课后题答案学习资料

统计学复习笔记 第七章 参数估计 一、 思考题 1. 解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2. 简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。 3. 怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4. 解释95%的置信区间的含义是什么 置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。 5. 简述样本量与置信水平、总体方差、估计误差的关系。 1. 估计总体均值时样本量n 为 2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为 其中: 2222α2222)(E z n σα=n z E σα2=

最新统计学和统计法基础知识试卷及答案汇总

2011年统计学和统计法基础知识试卷及答 案

二○一一年度全国统计专业技术初级资格考试 统计学和统计法基础知识试卷 1.在你拿到试卷的同时将得到一份专用答题卡,所有试题均须在专用答题卡上作答,在试卷或草稿纸上作答不得分。 2.答题时请认真阅读试题,对准题号作答。 一、单项选择题(以下每小题各有四项备选答案,其中只有一项是正确 的。本题共40分,每小题1分。) 1.下列方法中,属于推断统计的是()。 A.搜集数据的方法 B.参数估计的方法 C.用图形展示数据的方法 D.分析样本数据特征的方法2.下列变量中,属于分类变量的是()。 A.产量B.收入C.性别 D.体重 3.为了调查某校学生的购书费用支出,从男生中抽取50名学生调查,从女生中抽取40名学生调查,这种调查方法是()。 A.简单随机抽样 B.分层抽样 C.整群抽样 D.系统抽样 仅供学习与交流,如有侵权请联系网站删除谢谢2

4.下列调查方式中,属于全面调查的是()。 A.普查 B.重点调查 C.电话调查 D.典型调查 5.落在某一分类数据每一类别或组中的数据个数称为()。 A.频数B.频率C.频数分布表D.累积频数6.下列图形中,适合比较不同变量之间的结构差异的是()。 A.条形图B.饼图C.环形图D.散点图7.适合反映两个变量的关系的统计图是()。 A.直方图 B.条形图 C.散点图 D.圆形图 8.某运动中心有20个篮球场,30个羽毛球场,40个排球场,15个手球场。在上面的描述中,则运动场的众数是()。 A.40 B.30 C.排球场 D.手球场 9.下列选项中,最容易受到极端数值影响的是()。 A.众数B.中位数C.平均数 D.四分位数10.在一个统计样本中,标准差越大,说明()。 A.它的各个观测值分布的越分散 B.它的集中趋势越好 C.它的离散程度低 D.它的各个观测值分布的越集中 仅供学习与交流,如有侵权请联系网站删除谢谢3

统计学第五版(贾俊平)第八章课后习题答案

《统计学》第八章课后练习题 8.4 解:由题意知,μ=100,α=0.05,n=9<30,故选用t统计量。经计算得:x =99.9778,s=1.2122, 进行检验的过程为: H0:μ=100 H1:μ≠100 t= s n = 1.21229 =?0.0549 当α= 0.05,自由度n-1= 8,查表得tα2(8)=2.3060,因为t< tα2,样本统计量落在接收域,所以接受原假设H0,即打包机正常工作。 用P值检测,这是双侧检验,故: P=2×1?0.5215=0.957,P值远远大于α,所以不能原假设H0。 8.7 解:由题意知,μ=225,α=0.05,n=16<30,故选用t统计量。 经计算得:x =241.5,s=98.7259, 进行检验的过程为: H0:μ≤225 H1:μ>225 t= s n = 98.725916 =0.6685 当α= 0.05,自由度n-1= 15,查表得tα(15)=2.1314,这是一个右单侧检验,因为t

即元件平均寿命没有显著大于225小时。 用P值检测,这是右单侧检验,故: P=1?0.743=0.257,P值远远大于α,所以不能拒绝原假设H0。 8.9, 解:由题意得 σA2=632,σB2=572,x A=1070,x B=1020,n A=81,n B=64,故选用z统计量。 进行检验的过程为: H0:μA?μB=0 H1: μA?μB≠0 Z=A B A B σA A +σB B = 632+572 =5 当α=0.05时,zα2=1.96,因为Z>zα2,所以拒绝原假设H0,,即A、B两厂生产的材料平均抗压强度不相同。 用P值检测,这是双侧检验,故: P=2×1?0.9999997=0.0000006,P值远远小于α,所以拒绝原假设H0, 8.13 解:建立假设为: H0: π1=π2 H1: π1≠π2 由题意得:

【免费下载】统计学答案第十章

三、选择题 1 方差分析的主要目的是判断()。 A.各总体是否存在方差 B.各样本数据之间是否有显著差异 C.分类型自变量对数值型因变量的影响是否显著 D.分类型因变量对数值型自变量的影响是否显著 2 在方差分析中,检验统计量F是()。 A.组间平方和除以组内平方和 B.组间均方除以组内均方 C.组间平方除以总平方和 D.组间均方除以总均方 3 在方差分析中,某一水平下样本数据之间的误差称为()。 A.随机误差 B.非随机误差 C.系统误差 D.非系统误差 4 在方差分析中,不同水平下样本数据之间的误差称为()。 A.组内误差 B.组间误差 C.组内平方 D.组间平方 5 组间误差是衡量不同水平下各样本数据之间的误差,它()。 A.只包括随机误差 B.只包括系统误差 C.既包括随机误差,也包括系统误差 D.有时包括随机误差,有时包括系统误差 6 组内误差是衡量某一水平下样本数据之间的误差,它()。 A.只包括随机误差 B.只包括系统误差 C.既包括随机误差,也包括系统误差 D.有时包括随机误差,有时包括系统误差 7 在下面的假定中,哪一个不属于方差分析中的假定()。 A.每个总体都服从正态分布 B.各总体的方差相等 C.观测值是独立的 D.各总体的方差等于0 8 在方差分析中,所提出的原假设是H0:μ1=μ2=…=μk,备择假设是()。 A.H1:μ1≠μ2≠…≠μk B.H1:μ1>μ2>…>μk C.H1:μ1<μ2<…<μk D.H1:μ1,μ2,…,μk不全相等 9 单因素方差分析是指只涉及()。 A.一个分类型自变量 B.一个数值型自变量 C.两个分类型自变量 D.两个数值型因变量 10 双因素方差分析涉及()。 A.两个分类型自变量 B.两个数值型自变量

统计学第七章、第八章课后题答案

统计学复习笔记 第七章参数估计 一、思考题 1.解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2.简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。 3.怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4.解释95%的置信区间的含义是什么 置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以的概率覆盖总体参数。 5.简述样本量与置信水平、总体方差、估计误差的关系。 1. 估计总体均值时样本量n 为 (z 2 )2 2其中: E z n n E22 其中: E z 2 n 2. 样本量n 与置信水平1- α、总体方差、估计误差E之间的关系为与置信水平 成正比,在其他条件不变的情况下,置信水平越大,所

(完整版)医学统计学第六版课后答案

第一章绪论 一、单项选择题 答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D 二、简答题 1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。 2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。 4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。 5答系统误差、随机测量误差、抽样误差。系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。 6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。 第二章定量数据的统计描述 一、单项选择题 答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 二、计算与分析 2

统计学基础 第八章 相关与回归分析

统计学基础第八章相关与回归分析 【教学目的】 1.掌握相关系数的测定和性质 2.明确相关分析与回归分析的特点 3.建立回归直线方程,掌握估计标准误差的计算 【教学重点】 1.相关关系、相关分析和回归分析的概念 2.相关系数计算 3.回归方程的建立和依此进行估计和预测 【教学难点】 1.相关分析和回归分析的区别 2.相关系数的计算 3.回归系数的计算 4.估计标准误的计算 【教学时数】 教学学时为8课时 【教学内容参考】 第一节相关关系 一、相关关系的含义 宇宙中任何现象都不是孤立地存在的,而是普遍联系和相互制约的。这种现象间的相互联系、相互制约的关系即为相关关系。 相关关系因其依存程度的不同而表现出相关程度的差别。有些现象间存在着严格的数据依存关系,比如,在价格不变的条件下销售额量之间的关系,圆的面积与半径之间的关系等等,均具有显著的一一对应关系。这些关系可由数学中的函数关系来确切的描述,因而也可以认为是一种完全相关关系。有些现象间的依存关系则没有那么严格。当一种现象的数量发生变化时,另一种现象的数量却在一定的范围内发生变化,比如身高与体重的关系就是如此。一般来说,身高越高,

体重越重,但二者之间的关系并非严格意义上的对应关系,身高1.75米的人,对应的体重会有多个数值,因为影响体重的因素不只身高而已,它还会受遗传、饮食习惯等因素的制约和影响。社会经济现象中大多存在这种非确定的相关关系。 在统计学中,这些在社会经济现象之间普遍存在的数量依存关系,都成为相关关系。在本章,我们主要介绍那些能用函数关系来描述的具有经济统计意义的相关关系。 二、相关关系的特点 1.现象之间确实存在数量上的依存关系 如果一个现象发生数量上的变化,则另一个现象也会发生数量上的变化。在相互依存的两个变量中,可以根据研究目的,把其中的一个变量确定为自变量,把另一个对应变量确定为因变量。例如,把身高作为自变量,则体重就是因变量。 2.现象之间数量上的关系是不确定的 相关关系的全称是统计相关关系,它属于变量之间的一种不完全确定的关系。这意味着一个变量虽然受另一个(或一组)变量的影响,却并不由这一个(或一组)变量完全确定。例如,前面提到的身高和体重之间的关系就是这样一种关系。 三、相关关系的种类 现象之间的相互关系很复杂,它们涉及的变动因素多少不同,作用方向不同,表现出来的形态也不同。相关关系大体有以下几种分类: (一)正相关与负相关 按相关关系的方向分,可分为正相关和负相关。当两个因素(或变量)的变动方向相同时,即自变量x值增加(或减少),因变量y值也相应地增加(或减少),这样的关系就是正相关。如家庭消费支出随收入增加而增加就属于正相关。如果两个因素(或变量)变动的方向相反,即自变量x值增大(或减小),因变量y值随之减小(或增大),则称为负相关。如商品流通费用率随商品经营的规模增大而逐渐降低就属于负相关。 (二)单相关与复相关 按自变量的多少分,可分为单相关和复相关。单相关是指两个变量之间的相关关系,即所研究的问题只涉及到一个自变量和一个因变量,如职工的生活水平与工资之间的关系就是单相关。复相关是指三个或三个以上变量之间的相关关系,即所研究的问题涉及到若干个自变量与一个因

2015年《统计学》第十章 时间序列分析习题及满分答案

2015年《统计学》第十章时间序列分析习题及满分答案 一、单项选择: 1.时间数列中,每项指标数值可以相加的是(B ) A.绝对数时间数列 B. 时期数列 C. 时点数列 D.相对数或平均数时间数列 2. 下列属于时点数列的是(D) A. 某厂各年工业产值 B.某厂各年劳动生产率 C.某厂各年生产工人占全部职工的比重 D.某厂各年年初职工人数 3.发展速度与增长速度的关系是( B ) A. 环比增长速度等于定基发展速度-1 B. 环比增长速度等于环比发展速度-1 C. 定基增长速度的连乘积等于定基发展速度 D. 环比增长速度的连乘积等于环比发展速度 4.年距增长速度是(C) A. 报告期水平/基期水平 B. (报告期水平— 基期水平)/基期水平 C. 年距增长量/去年同期发展水平 D. 环比增长量/前一时期水平 5.几何平均法平均发展速度数值的大小(C)

A. 不受最初水平和最末水平的影响 B. 只受中间各期发展水平的影响 C. 只受最初水平和最末水平的影响,不受中间各期发展水平的影响 D. 既受最初水平和最末水平的影响,也受中间各期发展水平的影响 6.某厂第一季度三个月某种产品的实际产量分别为500件、612件、832件、分别超计划0%、2%和4%,则该厂第一季度平均超额完成计划的百分数为( C )A. 102% B. 2% C. 2.3% D. 102.3% 7.时期数列中的每个指标数值是(B)。 A、每隔一定时间统计一次 B、连续不断统计而取得 C、间隔一月统计一次 D、定期统计一次 8.一般平均数与序时平均数的共同之处是(A)。 A、两者都是反映现象的一般水平 B、都是反映同一总体的一般水平 C、共同反映同质总体在不同时间上的一般水平 D、都可以消除现象波动的影响 9.某企业1997年产值比1990年增长了1倍,比1995年增长了0.5倍,则1995年比1990年增长了( A )。 A、0.33 B、0.5 C、0.75 D、1 10.假设有如下资料:则该企业一季度平均完成计划为(B)。 一月二月三月某产品实际完成数 500 612

统计学第八章题目

一.单项选择题 1、用于测定两个变量之间密切程度的方法是(D )。 A、定性判断 B、相关表 C、相关图 D、相关系数 2、产品产量与单位成本的相关系数是—,单位成本与利润率的相关系数是,产量与利润的相关系数是,因此(C)。 A、产量与利润的相关程度最高 B、单位成本与利润率的相关程度最高 C、产量与单位成本的相关程度最高 D、无法判断哪对变量的相关程度最高 3、相关系数的取值范围是(D )。 A、0≤r≤1 B、-1≤r≤0 C、r>0 D、-1≤r≤1 4、变量x与y之间的负相关是指(C )。 A、x值增大时y值也随之增大 B、x值减少时y值也随之减少 C、x值增大时y值随之减少,或x值减少时y值随之增大 D、y的取值几乎不受x取值的影响 5、两个变量之间的相关关系称为( B )。 A、复相关 B、单相关 C、曲线相关 D、直线相关 6、、正方形的边长与周长的相关系数为(A )。 A、1 B、-1 C、0 D、无法计算 7、在一元线性回归方程中,回归系数b的含义是( B )。 A、当x=0时,y的平均值

B 、当x 变动一个单位时,y 的平均变动数额 C 、当x 变动一个单位时,y 增加的总数额 D 、当y 变动一个单位时,x 的平均变动数额 8、常用的求解一元线性回归方程的方法是( B )。 A 、相关系数法 B 、最小平方法 C 、误差绝对值最小法 D 、误差和最小法 9、下列回归方程与相关系数的对应式中,错误的是( C ) A 、89.0,5.2170?-=-=r x y B 、94.0,8.35?-=--=r x y C 、78.0,5.036?-=+=r x y D 、98.0,9.25?=+-=r x y 10、已知变量x 与y 线性相关,x 与y 的协方差为-60,x 的方差为64,y 的方差为去100,则二者的相关系数的值为( B )。 A 、 B 、 C 、 D 、 11、已知变量x 与y 高度线性相关,x 与y 的协方差为-60,x 的方差为64,y 的方差为去100,则建立的y 依x 回归方程中的回归系数b 的值为( B )。 A 、 B 、 C 、 D 、 12、若相关系数为正值,则回归系数的值( B )。 A 、为负 B 、为正 C 、视a 的符号而定 D 、不能确定 13、回归估计标准误差是说明( C )的指标。 A 、平均数代表性 B 、现象之间相关程度 C 、回归直线代表性 D 、抽样误差平均程度

统计学(贾俊平版)第十章答案

第十章习题 10.1 H0:三个总体均值之间没有显著差异。 H1: 三个总体均值之间有显著差异。 方差分析:单因素方差分析 SUMMARY 组观测数求和平均方差 1579015861.5 2460015036.66667 33497165.6667154.3333 方差分析 差异源SS df MS F P-value F crit 组间425.58332212.7917 2.8813310.1078578.021517 组内664.6667973.85185 总计1090.2511 答:方差分析可以看到,由于P=0.1078>0.01,所以接受原假设H0。说明了三个总体均值之间没有显著差异。 10.2 H0:五个个总体均值之间相等。 H1: 五个总体均值之间不相等。 方差分析:单因素方差分析 SUMMARY 组观测数求和平均方差 133712.33333 4.333333 255010 1.5 3448120.666667 458016 1.5 5678130.8 方差分析 差异源SS df MS F P-value F crit 组间93.76812423.4420315.82337 1.02E-05 4.579036 组内26.6666718 1.481481 总计120.434822 答:方差分析可以看到,由于P=1.02E-05<0.01,所以拒接原假设H0。说明了五个总体均值之间不相等。 10.3 H0:四台机器的装填量相等。 H1: 四台机器的装填量不相等

答:方差分析可以看到,由于P=0.00068<0.01,所以拒接原假设H0。说明了四台机器装填量不相同。 10.4 H0:不同层次管理者的满意度没有差异。 H1: 不同层次管理者的满意度有差异. 答:方差分析可以看到,由于P=0.000849<0.05,所以拒接原假设H0。说明了不同层次管理者的满意度有差异。 10.5 H0:3个企业生产的电池平均寿命之间没有显著差异。 H1: 3个企业生产的电池平均寿命之间有显著差异 单因素方差分析 VAR00002 平方和df 均方 F 显著 性 方差分析:单因素方差分析 SUMMARY 组观测数求和平均方差 1416.12 4.030.000333 2624.01 4.0016670.000137 3519.87 3.9740.00033 4416.02 4.0050.000167 方差分析 差异源SS df MS F P-value F crit 组间0.00707630.00235910.09840.000685 5.416965组内0.003503150.000234 总计0.01057918 方差分析:单因素方差分析 SUMMARY 组观测数求和平均方差 列 15387.60.8 列 27628.8571430.809524 列 36355.833333 2.166667 方差分析 差异源SS df MS F P-value F crit 组间29.60952214.8047611.755730.000849 3.68232组内18.89048151.259365 总计48.517

统计学第7章和第8章思考题和练习题

统计学第7章和第8章思考题和练习题 2012290113 李其彦思考题 7.1说明X2拟合优度检验和独立性检验的用途 (1)、推断两个或两个以上的总体率或总体构 成比之间有无差别; (2)、推断两种属性或两个变量之间有无关联性(计数资料的相关分析); (3)、频数分布的拟合优度检验。 7.2举出几个可以用列联表表示的分类变量的例子 7.3测度两个分类变量相关性的统计量有哪些?他们有什么不同? 测度两个分类变量相关性的统计量有以下几个: Φ相关系数、列联相关系数(c系数)、v相关系数 (1)Φ相关系数:描述2×2列联表数据相关程度最常用的一种相关系数且Φ系数没有上限。 (2)列联相关系数(c系数):主要用于大于2×2列联表的情况且c系数小于1. (3) v相关系数:取值在0-1之间,当两个变量相互独立时,v=0;当两个变量完全相关时,v=1.若列联表中有一维为2,v相关系数=Φ相关系数。 8.1什么是方差分析?它研究的是什么? (1)方差分析:就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。 (2)本质上来说它所研究的是分类型自变量对数值型因变量的影响。 8.2方差分析中有哪些基本假定? 方差分析有三个基本假定: (1)每个总体都应服从正态分布。也就是说,对于因素的每一个水平,其观测值是来自正态分布总体的简单随机样本。 (2)各个总体的方差σ2必须相同。也就是说,各组观察数据是从具有相同方差的正态总体中抽取的。(3)观测值是独立的。也就是说,每个样本数据是来自因子各水平的独立样本

8.4 解释主效应和交互效应 主效应:一个因素的水平之间的平均数差异,称为该因素的主效应。当研究设计被呈现为一个矩阵,并且第一个因素定义行,第二个因素定义列的时候,行与行之间的平均数差异描述就是第一个因素的主效应,列之间的平均数差异描述的是第二个因素的主效应。 交互效应:当被试处理情境之间或单元之间的平均数差异显著不同于因素的全部主效应时,双因素之间的交互作用就发生了。或者可以这样理解,当双因素实验研究的结果以图形呈现的时候,如果存在不平行的折线,则说明存在交互作用。[ 练习题 8.3 答: ,

统计学和统计法基础知识试卷及答案

二○一一年度全国统计专业技术初级资格考试 统计学和统计法基础知识试卷 1.在你拿到试卷的同时将得到一份专用答题卡,所有试题均须在专用答题卡上作答,在试卷或草稿纸上作答不得分。 2.答题时请认真阅读试题,对准题号作答。 一、单项选择题(以下每小题各有四项备选答案,其中只有一项是正确的。本题共 40分,每小题1分。) 1.下列方法中,属于推断统计的是()。 A.搜集数据的方法B.参数估计的方法 C.用图形展示数据的方法D.分析样本数据特征的方法 2.下列变量中,属于分类变量的是()。 A.产量B.收入 C.性别D.体重 3.为了调查某校学生的购书费用支出,从男生中抽取50名学生调查,从女生中抽取40名学生调查,这种调查方法是()。 A.简单随机抽样B.分层抽样 C.整群抽样D.系统抽样 4.下列调查方式中,属于全面调查的是()。 A.普查B.重点调查 C.电话调查D.典型调查 5.落在某一分类数据每一类别或组中的数据个数称为()。 A.频数B.频率 C.频数分布表D.累积频数 6.下列图形中,适合比较不同变量之间的结构差异的是()。

A.条形图B.饼图 C.环形图D.散点图 7.适合反映两个变量的关系的统计图是()。 A.直方图B.条形图 C.散点图D.圆形图 8.某运动中心有20个篮球场,30个羽毛球场,40个排球场,15个手球场。在上面的描述中,则运动场的众数是()。 A.40 B.30 C.排球场D.手球场 9.下列选项中,最容易受到极端数值影响的是()。 A.众数B.中位数 C.平均数D.四分位数 10.在一个统计样本中,标准差越大,说明()。 A.它的各个观测值分布的越分散 B.它的集中趋势越好 C.它的离散程度低 D.它的各个观测值分布的越集中 11.一组数据的离散系数为0.5,平均数为20,则标准差为()。 A.4 B.10 C.0.025 D.40 12.某学校男生身高的均值是175cm,标准差为2.8cm。一名男同学身高180cm,则他的身高的标准分数为()。 A.1.43 B.3.15 C.2.32 D.1.79 13.样本均值的标准误差()。 A.随着样本量的增大而变小B.随着样本量的增大而变大 C.与样本量的大小无关D.大于总体标准差 14.正态分布变量标准化的公式为()。

统计学答案第八章

统计学答案第八章. 三、选择题纤维的纤某厂生产的化纤纤度服从正态分布,1 根纤维的纤25.40。某天测得度的标准均值为1

度的均值=1.39,检验与原来设计的标准均值x比是否有所变化,要求的显著性水平为 α=0.05,则下列正确的假设形式是()。A.H:μ=1.40,H:μ≠1.40 B. H:μ001≤1.40,H:μ>1.40 1C. H:μ<1.40,H:μ≥1.40 D. H:010μ≥1.40,H:μ<1.40 1 2 某一贫困地区估计营养不良人数高达20%,然而有人认为这个比例实际上还要高,要检验该说法是否正确,则假设形式为()。

A. H:π≤0.2,H:π>0.2 B. H:π001=0.2,H:π≠0.2 1C. H:π≥0.3,H:π<0.3 D. H:π001≥0.3,H:π<0.3 1 3 一项新的减肥计划声称:在计划实施的第一周内,参加者的体重平均至少可以减轻8磅。随机位参加该项计划的样本,结果显示:样40抽 取.

32标准差为磅,则本的体重平均减少7磅,。其原假设和备择假设是()A. H:μ≤8,

H:μ>8 B. H:μ≥001 8,H:μ<8 1C. H:μ≤7,H:μ>7 D. H:μ≥0107,H:μ<7 1 4 在假设检验中,不拒绝原假设意味着()。 A.原假设肯定是正确的 B.原假设肯定是错误的 C.没有证据证明原假设是正确的 D.没有证据证明原假设是错误的

5 在假设检验中,原假设和备择假设()。 A.都有可能成立 B.都有可能不成立 C.只有一个成立而且必有一个成立 D.原假设一定成立,备择假设不一定成立 6 在假设检验中,第一类错误是指()。 A.当原假设正确时拒绝原假设 B.当原假设错误时拒绝原假设 C.当备择假设正确时拒绝备择假设 D.当备择假设不正确时未拒绝备择假设

统计学第十章课后习题

二、单项选择 1.统计指数按其反映的对象范围不同分为( C)。 A 简单指数和加权指数 B 综合指数和平均指数 C 个体指数和总指数 D 数量指标指数和质量指标指数 2.总指数编制的两种形式是( C )。 A 算术平均指数和调和平均指数 B 个体指数和综合指数 C 综合指数和平均指数 D 定基指数和环比指数 4.某市居民以相同的人民币在物价上涨后少购商品15%,则物价指数为( )D 。 A 17.6% B 85% C 115% D 117.6% 5.在掌握基期产值和各种产品产量个体指数资料的条件下,计算产量总指数要采用(C )。 A 综合指数 B 可变构成指数 C 加权算术平均数指数 D 加权调和平均数指数 6.在由三个指数组成的指数体系中,两个因素指数的同度量因素通常( C)。 A 都固定在基期 B 都固定在报告期 C 一个固定在基期,另一个固定在报告期 D 采用基期和报告期的平均数 7.某商店报告期与基期相比,商品销售额增长6.5%,商品销售量增长6.5%,则商品价格( D )。 A 增长13% B 增长6.5% C 增长1% D 不增不减 8.单位产品成本报告期比基期下降6%,产量增长6%,则生产总费用(B )。 A 增加 B 减少 C 没有变化 D 无法判断 10.某商店2001年1月份微波炉的销售价格是350元,6月份的价格是342元,指数为97。71%,该指数是( D )。 A 综合指数 B 平均指数 C 总指数 D 个体指数 11。编制数量指标指数一般是采用( A )作同度量因素。 A 基期质量指标 B 报告期质量指标 C 基期数量指标 D 报告期数量指标 12.编制质量指标指数一般是采用( D )作同度量因素。 A 基期质量指标 B 报告期质量指标 C 基期数量指标 D 报告期数量指标 三、多项选择题 1.指数的作用包括(ABCD ) A 综合反映事物的变动方向 B 综合反映事物的变动程度 C 利用指数可以进行因素分析 D 研究事物在长时间内的变动趋势 、 E 反映社会经济现象的一般水平 2.拉斯贝尔综合指数的基本公式有( BC ) A ∑∑1 011q p q p B ∑∑0 01p q p q C ∑∑0 1q p q p D ∑∑1 11p q p q E ∑∑0 11q p q p 3.派许综合指数的基本公式(AE ) A ∑∑1 011q p q p B ∑∑0 1q p q p C ∑∑0 11q p q p D ∑∑0 10q p q p E ∑∑0 11 1q p q p 4.某企业为了分析本厂生产的两种产品产量的变动情况,已计算出产量指数为112.5%,这一指数是(AB D )

2018年《统计学和统计法基础知识》复习资料(十五)

2018年《统计学和统计法基础知识》复习资料(十五) 不定向选择题-1/知识点:章节测试 根据以下材料,回答{TSE}题某房地产开发有限公司因拒绝提供统计资料,被某市统计局依法予以统计行政处罚。该公司不服,提起了行政复议和行政诉讼。经审理,受理行政复议和行政诉讼的机关均维持了市统计局做出的行政处罚决定。请回答:{TS}市统计局依法可对该公司做出的处理有()。 A.停业整顿 B.警告 C.通报 D.20万元以下罚款 单选题-2/知识点:章节测试 商品销售额实际增加400元,由于销售量增长使销售额增加420元,由于价格()。 A.增长使销售额增加20元 B.增长使销售额增长210元 C.降低使销售额减少20元 D.降低使销售额减少210元 单选题-3/知识点:章节测试 按重置抽样方式从总体随机抽取样本量为n的样本。假设总体标准差σ=2,如果样本量n=16增加到n=64,则样本均值的标准差()。

A.减少4倍 B.增加4倍 C.减少一半 D.增加一半 单选题-4/知识点:章节测试 统计从业资格认定工作的承办机关是()。 A.国家统计局 B.省级人民政府 C.省级人民政府统计机构 D.县级人民政府统计机构 单选题-5/知识点:章节测试 首先将总体分成不同的“层(或组)”,然后在每一层内进行抽样。此种抽样方法是() A.概率抽样 B.分层抽样 C.非概率抽样 D.整群抽样 单选题-6/知识点:章节测试 在时间序列加法模型中()。 A.假定T、S、I四种变动因素相互独立

B.假定T、S、I四种变动因素相互影响 C.假定T、S、C三种变动因素相互独立 D.假定T、S、C三种变动因素相互影响 单选题-7/知识点:章节测试 承办机关应当将初步审查意见和全部申请材料自受理之日起___________内报送省级人民政府统计机构,由统计从业资格认定工作的实施机关进行终审。统计从业资格认定工作的实施机关进行终审的时间为___________,自收到初步审查意见和全部申请材料之日起算。() A.二十日;二十日 B.二十日;十日 C.十日;十日 D.三十日;三十日 单选题-8/知识点:章节测试 产品产量与单件成本的相关系数是-0.80,单位成本与利润率的相关系数是-0.94,产量与利润率之间的相关系数是0.89,因此() A.产量与利润率的相关程度最高 B.单位成本与利润率的相关程度最高 C.产量与单位成本的相关程度最高 D.反映不出哪对变量的相关程度最高 单选题-9/知识点:章节测试

(完整word版)职高数学第十章概率与统计初步习题及答案.doc

第 10 章概率与统计初步习题 练习 10.1.1 1、一个三层书架里,依次放置语文书 12 本,数学书 14 本,英语书 11 本,从中取出 1 本,共有多少种不同的取法? 2、高一电子班有男生28 人,女生19 人,从中派 1 人参加学校卫生检查,有多少种选法? 3、某超市有4 个出口,小明约好和朋友在出口处见面,请问他们见面的地方有多少种选择? 答案: 1、 37 2、 47 3、4 练习 10.1.2 1、一个三层书架里,依次放置语文书12 本,数学书14 本,英语书 11 本,从中取出语文,数学和英语各 1 本,共有多少种不同的取法? 2、将 5 封信投入 3 个邮筒,不同的投法有多少种? 3、某小组有8 名男生, 6 名女生,从中任选男生和女生各一人去参加座谈会,有多少种不 同的选法? 答案: 1、 12× 14× 11=1848(种) 2、 3×3× 3× 3× 3=3 5 (种) 3、 8× 6=48(种) 练习 10.2.1 1、掷一颗骰子,观察点数,这一试验的基本事件数为--------------- () A、 1 B 、 3 C 、 6D 、 12 2、下列语句中,表示随机事件的是-------------------------- () A、掷三颗骰子出现点数之和为19 B 、从 54 张扑克牌中任意抽取 5 张 C、型号完全相同的红、白球各 3 个,从中任取一个是红球 D 、异性电荷互相吸引 3、下列语句中,不表示复合事件的是-------------------------- () A、掷三颗骰子出现点数之和为8 B 、掷三颗骰子出现点数之和为奇数 C、掷三颗骰子出现点数之和为 3 D 、掷三颗骰子出现点数之和大于13 答案: 1、 C 2、B 3、 C 练习 10.2.2 1、某学校要了解学生对自己专业的满意程度,进行了 5 次“问卷”,结果如表2-1 所示: 表 2-1 被调查500 502 504 496 505 人数 n 满意人404 476 478 472 464 数 m 满意频 m 率 n (1)计算表中的各个频率;

2007年初级统计师考试统计学和统计法基础知识真题及答案

二○○七年度全国统计专业技术初级资格考试统计学和统计法基础知识试卷 1.在你拿到试卷的同时将得到一份专用答题卡,所有试题均须在专用答题卡上作答,在试卷或草稿纸上作答不得分。 2.答题时请认真阅读试题,对准题号作答。 一、单项选择题(以下每小题各有四项备选答案,其中只有一项是正确的。本题共 40分,每小题1分。) 1.在客观事物的研究中,从总体出发对其全部单位或足够多数的单位进行观察和分析研究的方法是()。 A.大量观察法B.统计模型法 C.综合指标法D.统计推断法 2.统计指标的两个主要特点是()。 A.连续变量和离散变量B.同质性和差异性 C.同质事物的可量性和量的综合性D.数量性和总体性 3.下列选项中属于总量指标的有()。 A.人口密度B.国内生产总值 C.资金利润率D.单位产品成本 4.对下述情况需要进行经常性调查的是()。 A.农产品产量B.人口数量 C.农机具拥有量D.耕地面积 5.某地为推广先进企业的生产经营管理经验,对效益最好的几个企业进行调查,此种调查属于()。 A.重点调查B.典型调查 C.普查D.抽样调查 统计学和统计法基础知识试卷第 1 页(共13页)

6.对农作物产量进行调查时,应该运用()。 A.典型调查B.重点调查 C.统计报表D.抽样调查 7.次数分布数列中的频率是指()。 A.各组分布次数相互之比B.各组的频数相互之比 C.各组分布次数与总次数之比D.各组分布次数与比重之比 8.次数分布数列各组频率之和应()。 A.等于100% B.大于100% C.小于100% D.视情况而定 9.某组距式分组,起始组是开口组,上限为100,又知相邻组的组距为50,则起始组的组距可以视为()。 A.50 B.80 C.90 D.100 10.下列指标中属于结构相对指标的是()。 A.产值资金占用率B.产值计划完成程度 C.男性人口占总人口的比重D.男性人口数对女性人口数之比11.加权算术平均数的大小()。 A.主要受各组标志值大小的影响,而与各组次数的多少无关 B.主要受各组次数多少的影响,而与各组标志值的大小无关 C.既受各组标志值大小的影响,又受各组次数多少的影响 D.既与各组标志值大小无关,又与各组次数多少无关 12.变量数列中的某项变量值为0时,则无法计算()。 A.简单算术平均数B.加权算术平均数 C.标志变异指标D.调和平均数 13.时间数列中,每项指标数值可以相加的是()。 A.相对数时间数列B.时期数列 C.平均数时间数列D.时点数列 14.下列指标和时间构成的数列中,属于平均数时间数列的是()。 A.年末总人口B.出勤率 C.工人劳动生产率D.人口自然增长率 统计学和统计法基础知识试卷第 2 页(共13页)

统计学和统计法基础知识201220108

二○一二年度全国统计专业技术初级资格考试 统计学和统计法基础知识试卷 1.在你拿到试卷的同时将得到一份专用答题卡,所有试题均须在专用答题卡上作答,在试卷或草稿纸上作答不得分。 2.答题时请认真阅读试题,对准题号作答。 一、单项选择题(以下每小题各有四项备选答案,其中只有一项是正确的。本题共 40分,每小题1分。) 1.2012年7月1日,北京的最高气温达到35摄氏度,该数据属于()。 A.分类数据 B. 顺序数据 C.定性数据 D. 定量数据 2.在分析数据时,我们可以运用加、减、乘、除等多种不同数学方法对()进行计算。 A. 分类数据 B. 顺序数据 C. 定性数据 D. 数值型数据 3.汽车保有量和某种新药的疗效,()。 A. 两者都是观测数据 B. 两者都是实验数据 C. 前者是观测数据,后者是实验数据 D. 前者是实验数据,后者是观测数据

4.全国人口数()。 A. 是一个观测数据 B. 是一个实验数据 C. 只能通过普查得到 D. 只能通过抽样调查得到 5.进行抽样调查时,先对性别分组,然后分别在男性和女性人口中随机抽取样本单位,这种抽样方法是()。 A. 简单随机抽样 B. 分层抽样 C. 系统抽样 D. 整群抽样 6.按规定,规模以上工业企业应定期上报企业的生产经营活动情况,这种调查属于()。 A. 普查 B. 抽样调查 C. 统计报表 D. 典型调查 7.适合反映2011年我国城镇和农村消费支出结构情况的图形是()。 A. 环形图 B. 直方图 C. 折线图 D. 散点图 8.描述人均消费支出与人均可支配收入之间关系的合适图形是()。 A. 直方图 B. 折线图 C. 散点图 D. 条形图 9.度量数据集中趋势的统计量有()。 A. 极差 B. 方差和标准差 C. 离散系数 D. 均值、中位数和众数 10.在相同的条件下,有限总体不重置抽样的抽样误差()。 A. 一定比重置抽样的抽样误差大 B. 一定比重置抽样的抽样误差小 C. 与重置抽样的抽样误差相等 D. 有时比重置抽样的抽样误差大,有时比重置抽样的抽样误差小

统计学 指数习题及答案

第十章统计指数 一、填空题 1.狭义指数是反映复杂现象总体变动的 2.指数按其所反映的对象范围的不同,分为指数和 指数。 3.指数按其所标明的指标性质的不同,分为指数和 指数。 4.指数按其采用基期的不同,分为指数和指数。 5. 指数是在简单现象总体条件下存在的,指数是在复杂现象总体的条件下进行编制的。 6.总指数的计算形式有两种,一种是指数,一种是指数。 7.按照一般原则,编制数量指标指数时,同度量因素固定在 ,编制质量指标指数时,同度量因素固定在。 8.在编制质量指标指数时,指数化指标是指标,同度量因素是与之相联系的指标。 9.综合指数编制的特点,一是选择与指标相联系的同度量因素,二是把同度量因素的时期。 10.拉氏指数对于任何指数化指标的同度量因素都固定在,派氏指数对于任何指数化指标的同度量因素都固定在。 11.编制指数的一般方法是:指数是按拉氏指数公式编制的;指数是按派氏指数公式编制的。 12.综合指数的编制方法是先后。 13.编制综合指数时,与指数化指标相联系的因素称,还可以称为。 14.平均指数的计算形式为指数和指数。 15.平均指数是先计算出数量指标或质量指标的指数,然后再进行计算,来测定现象的总变动程度。 16.在编制平均指数时,算术平均数指数多用为权数,调和平均数指数多用为权数。 17.数量指标的算术平均数指数,在采用为权数的特定条件下,和一般综合指数的计算结论相同;而质量指标的调和平均数指数,在采用为权数的特定条件下,计算结果和综合指数一致。 18.编制数量指标平均指数,一是掌握,二是掌握。 19.编制质量指标平均指数,一是掌握,二是掌握。 20.在零售物价指数中,K表示,W表示。 21.平均指数既可依据资料编制,也可依据资料编制,同时还可用估算的权数比重进行编制计算。 22.因素分析包括数和数分析。 23.总量指标二因素分析是借助于来进行,即当总量指标是两个原因指标的时,才可据此进行因素分析。 24指数体系中,指数之间的数量对等关系表现在两个方面:一是结果指数等于因素指数的,二是结果指数的分子分母之差等于各因素指数的。 25平均指标指数(可变构成指数)可以分解为和的乘积。 26.在平均指标变动的因素分析中,反映各组水平变化对总平均水平影响的指数称,公式为。 27.在平均指标变动的因素分析中,反映内部构成对总体平均水平影响的指数称,公

相关主题
文本预览
相关文档 最新文档