当前位置:文档之家› 统计学教(学)案习题05方差分析报告

统计学教(学)案习题05方差分析报告

统计学教(学)案习题05方差分析报告
统计学教(学)案习题05方差分析报告

第五章 方差分析

一、教学大纲要求

(一)掌握内容 1.方差分析基本思想

(1) 多组计量资料总变异的分解,组间变异和组内变异的概念。 (2) 多组均数比较的检验假设与F 值的意义。 (3) 方差分析的应用条件。 2.常见实验设计资料的方差分析

(1)完全随机设计的单因素方差分析:适用的资料类型、总变异分解(包括自由度的分解)、方差分析的计算、方差分析表。

(2)随机区组设计资料的两因素方差分析:适用的资料类型、总变异分解(包括自由度的分解)、方差分析的计算、方差分析表。

(3)多个样本均数间的多重比较方法: LSD-t 检验法;Dunnett-t 检验法;SNK-q 检验法。 (二)熟悉内容

多组资料的方差齐性检验、变量变换方法。 (三)了解内容

两因素析因设计方差分析、重复测量设计资料的方差分析。

二、教学内容精要

(一) 方差分析的基本思想

1. 基本思想

方差分析(analysis of variance ,ANOVA )的基本思想就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和(sum of squares of deviations from mean ,SS )和自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如各组均数的变异SS 组间可由处理因素的作用加以解释。通过各变异来源的均方与误差均方比值的大小,借助F 分布作出统计推断,判断各因素对各组均数有无影响。

2.分析三种变异

(1)组间变异:各处理组均数之间不尽相同,这种变异叫做组间变异(variation among groups ),组间变异反映了处理因素的作用(处理确有作用时 ),也包括了随机误差( 包括个体差异及测定误差 ), 其大小可用组间均方(MS

组间

)表示,即 MS 组间= 组间组间ν/SS , 其中,SS 组间=

21

)(x x

n k

i i

i -∑= ,组间ν=k -1为组间自由度。k 表示处理组数。

(2)组内变异:各处理组内部观察值之间不尽相同,这种变异叫做组内变异(variation within groups),组内变异反映了随机误差的作用,其大小可用组内均方 (组内MS ) 表示, 组内组内组内ν/SS MS = ,其中

∑∑==??

?

???-=k

i n j i ij i x x SS 112)(组内

, k N -=组内ν,为组内均方自由度。 (3)总变异:所有观察值之间的变异(不分组),这种变异叫做总变异(total variation)。其大小可用全体数据的方差表示, 也称总均方(MS 总 )。按方差的计算方法,MS 总= 总总ν/SS ,其中SS 总=211

)(∑∑==-k i n j ij

i

x x

, k 为处理组

数,i n 为第i 组例数,总ν=N -1为总的自由度, N 表示总例数。

(二)方差分析的应用条件

(1) 各样本是相互独立的随机样本,且来自正态分布总体。

(2) 各样本的总体方差相等,即方差齐性(homoscedasticity)。 (三)不同设计资料的方差分析 1.完全随机设计的单因素方差分析

(1)资料类型:完全随机设计(completely random design)是将受试对象完全随机地分配到各个处理组。设计因素中只考虑一个处理因素,目的是比较各组平均值之间的差别是否由处理因素造成。

(2) 方差分析表:见表5-1。F ≥F α时,拒绝H 0: 12k μμμ===L L 。

表5-1 完全随机设计方差分析计算表

来源

SS

ν

MS

F 值

组间

SS 组间

1-=k 组间ν

MS

=

组间

组间

νSS

F=

组内

组间MS MS

组内 (误差)

SS 组内=SS 总 - SS 组

组内ν=总ν-组内ν=N - k

MS

=

组内

组内

νSS

总计

SS 总

总ν= N - 1

2.随机区组设计的两因素方差分析

(1)资料类型:随机区组设计(randomized block design )是将受试对象按自然属性(如实验动物的窝别、体重,病人的性别、年龄及病情等)相同或相近者组成单位组(区组),然后把每个组中的受试对象随机地分配给不同处理。设计中有两个因素,一个是处理因素,另一个是按自然属性形成的单位组。单位组的选择原则是“单位组间差别越大越好,单位组内差别越小越好”。

(2)方差分析表:见表5-2。F 处理≥F α时,拒绝H 0: 12k μμμ===L L 。

表5-2 随机区组设计方差分析计算表

变异来源

SS

ν

MS F 值

处理组间

SS 处理 处理ν= k-1 MS 处理=

处理

处理

νSS F 处理 =

误差处理MS MS

单位组间

SS 单位

单位ν= b -1

MS 单位=

单位

单位

νSS F 单位 =

误差

单位MS MS

误差

SS 误差= SS 总- SS 处理- SS 单

误差ν=总ν-处理ν-单位ν

=N-k-n+1

MS 误差=

误差

误差

νSS

总计

SS 总

总ν = N -1

3.多个样本均数的多重比较

如果方差分析结果表明各组间有显著差别,则需要进一步进行两两比较,也称均数间的多重比较(multiple comparison )。进行两两比较的方法主要有:

(1) LSD-t 检验:称为最小显著差异t 检验。适用于k 组中某一对或某几对在专业上有特殊意义的均数间差异的比较。检验统计量为t 值,自由度为方差分析表中的误差自由度,查t 界值表。

AB

d B

A S X X t -=

其中

)(11B

A

AB

n n d MS S +=误差 (5-1)

(2)

Dunnett-t 检验:它适用于k-1个试验组与一个对照组均数差别的多重比较,检验统计量为t 值,自由

度为方差分析表中的误差自由度,查Dunnet-t 界值表。

x

x i i

S x x t --=

,其中0x x i S -=)1

1(

n n MS i +误差 (5-2) (3)SNK-q 检验:在方差分析结果拒绝H 0时采用。适用于所有组均数的两两比较。检验统计量为q ,自由度为比较组数a 和方差分析表中的误差自由度,查q 界值表。

()

A B d

X X S q -=

其中,d

S =

(5-3)

4.多组资料方差起行检验

当各组标准差相差较大(如1.5倍)时,需检验资料是否满足方差齐性的条件。 5. 变量变换

当资料不能满足方差分析的条件时,如果进行方差分析,可能造成错误的判断。因此对于明显偏离上述应用条件的资料,可以通过变量变换的方法来加以改善。常用的变量变换方法有:

(1)对数变换 对数变换不仅可以将对数正态分布的数据正态化,还能使数据方差达到齐性,特别是各样本的标准差与均数成比例或变异系数接近于一个常数时。变换公式为:

X X lg =' (5-4)

当原始数据中有小值或零时,可用)1lg(+='X X

(2)平方根变换 常用于使服从Possion 分布的计数资料或轻度偏态的资料正态化;当各样本的方差与均数呈正相关时,可使资料达到方差齐性。变换公式为:

X X =

' (5-5)

当原始数据中有小值或零时,可用5.0+=

'X X

(3)倒数变换 常用于数据两端波动较大的资料,可使极端值的影响减小。变换公式为:

X X /1=' (5-6)

(4)平方根反正弦变换 常用于服从二项分布的率或百分比资料。一般地,当总体率较小(<30%)或较大(>70%)时,通过平方根反正弦变换,可使资料接近正态,且达到方差齐性的要求。变换公式为:

X X 1

sin

-=' (5-7)

(5)秩转换后,采用秩和检验比较组间差别(祥见第九章)。 6.两因素析因设计方差分析

处理含有两因素两水平的全面组合。例如治疗肿瘤术后病人,可采用4种方法:既不放疗也不化疗(a 0b 0);放疗不化疗(a 1b 0);不放疗化疗(a 0b 1);既放疗又化疗(a 1b 1)。设放疗为A 因素(两水平),化疗为B 因素(两水平),则构成2?2析因设计,目的是分析A 的主效应,B 的主效应及AB 的交互作用。

7.重复测量资料的方差分析

受试对象随机分组后,多次测量某一观察指标,以比较处理效应在不同时间点有无变化。如试验组和对照组的轻度高血压病人入院前、治疗后1天、2天、3天、4天的血压变化。设处理分组为A 因素,重复测量的时间点为B 因素,目的是分析A 的主效应和AB 的交互作用。

三、典型试题分析

1.完全随机设计资料的方差分析中,必然有( )

A .SS 组内

B .MS 组间

C.MS总=MS组间+MS组内D.SS总=SS组间+SS组内

答案:D

[评析]本题考点:方差分析过程中离均差平方和的分解、离均差平方和与均方的关系。

方差分析时总变异的来源有:组间变异和组内变异,总离均差平方和等于组间离均差平方和与组内离均差平方差之和,因此,等式SS总=SS组间+SS组内是成立的。离均差平方和除以自由度之后的均方就不再有等式关系,因此C选项不成立。A、B选项不一定成立。D选项为正确答案。

2.单因素方差分析中,当P<0.05时,可认为()。

A.各样本均数都不相等B.各总体均数不等或不全相等

C.各总体均数都不相等D.各总体均数相等

答案:B

[评析]本题考点:方差分析的检验假设及统计推断。

方差分析用于多个样本均数的比较,它的备择假设(H1)是各总体均数不等或不全相等,当P<0.05时,接受H1,即认为总体均数不等或不全相等。因此答案选B。

3. 以下说法中不正确的是()

A.方差除以其自由度就是均方

B.方差分析时要求各样本来自相互独立的正态总体

C.方差分析时要求各样本所在总体的方差相等

D.完全随机设计的方差分析时,组内均方就是误差均方

答案:A

[评析]本题考点:方差分析的应用条件及均方的概念。

方差就是标准差的平方,也就是均方,因此选项A是错误的。选项B、C是方差分析对资料的要求,因此选项B和C都是正确的。在完全随机设计的方差分析中,组内均方就是误差均方,D选项也是正确的。

4.当组数等于2时,对于同一资料,方差分析结果与t检验结果()。

A.完全等价且F = t

B.方差分析结果更准确

t=

C.t检验结果更准确

D.完全等价且F

答案:D

[评析]本题考点:方差分析与t检验的区别与联系。

t=,因此,正确答案为D。

对于同一资料,当处理组数为2时,t检验和方差分析的结果一致且F

5. 完全随机设计与随机单位组设计相比较()。

A.两种设计试验效率一样

B.随机单位组设计的误差一定小于完全随机设计

C.随机单位组设计的变异来源比完全随机设计分得更细

D.以上说法都不对

答案:C。

[评析]:本题考点:两种设计及其方差分析的区别。

两种设计不同,随机区组设计除处理因素外,还考虑了单位组因素。进行方差分析时,变异来源多分解出一项:单位组间变异。因此C选项为正确答案。

四、习题

(一)名词解释

1.均方2.方差分析基本思想3.总变异4.组间变异5.组内变异

6.完全随机设计 7.随机区组设计 (二) 单项选择题

1. 两样本均数的比较,可用( )。

A .方差分析

B .t 检验

C .两者均可

D .方差齐性检验 2.配伍组设计的方差分析中,ν配伍等于( )。

A .ν总-ν误差

B .ν总-ν处理

C .ν总-ν处理+ν误差

D .ν总-ν处理-ν误差

3.在均数为μ,标准差为σ的正态总体中随机抽样,≥-||

μX ( )的概率为5%。

A .1.96σ

B .x

σ96.1 C .0.05,t s ν D.

0.05,x t s ν

4.当自由度(ν1,ν2)及显著性水准α都相同时,方差分析的界值比方差齐性检验的界值( )。

A .大

B .小

C .相等

D .不一定 5.方差分析中变量变换的目的是( )。

A .方差齐性化

B .曲线直线化

C .变量正态化

D .以上都对

6.下面说法中不正确的是( )。

A .方差分析可以用于两个样本均数的比较

B .完全随机设计更适合实验对象变异不太大的资料

C .在随机区组设计中,每一个区组内的例数都等于处理数

D .在随机区组设计中,区组内及区组间的差异都是越小越好 7.随机单位设计要求( )。

A .单位组内个体差异小,单位组间差异大

B .单位组内没有个体差异,单位组间差异大

C .单位组内个体差异大,单位组间差异小

D .单位组内没有个体差异,单位组间差异小 8.完全随机设计方差分析的检验假设是( )。

A .各对比组样本均数相等

B .各对比组总体均数相等

C .各对比组样本均数不相等

D .各对比组总体均数不相等 9.完全随机设计、随机区组设计的SS 和及自由度各分解为几部分( )。 A .2,2 B .2,3 C .2,4 D .3,3 10.配对t 检验可用哪种设计类型的方差分析来替代( )。 A .完全随机设计 B .随机区组设计 C .两种设计都可以 D .AB 都不行 (三)简答题

1.t 检验和方差分析的应用条件? 2.如何合理选择检验水准α?

3.以t 检验为例,说明检验假设中α和P 的区别。 (四)计算题

1.某湖水在不同季节氯化物含量测定值如表5-3所示。问不同季节氯化物含量有无差别?若有差别,进行32个水平的两两比较。

表5-3 某湖水不同季节氯化物含量(mg/L ) 春 夏 秋 冬

22.6 19.1 18.9 19.0 22.8 22.8 13.6 16.9

21.0

24.5

17.2

17.6

16.9 18.0 15.1 14.8 20.0 15.2 16.6 13.1 21.9 18.4 14.2 16.9 21.5 20.1 16.7 16.2 21.2

21.2 19.6 14.8 ∑ij

X

167.9 159.3 131.9 129.3 588.40 i n 8

8

8 8 32 i X

20.99 19.91 16.49 16.16 18.39 ∑ij

X

2

3548.

51

3231.95 2206.27 2114.11 11100.84

i s 2

3.53

8.56

4.51

3.47

2.根据表5-4资料说明大白鼠感染脊髓灰质炎病毒后,再做伤寒或百日咳接种是否影响生存日数?若结论为“有影响”,请做多重比较(与对照组比)。

表5-4 各组大鼠接种后生存日数

伤寒 百日咳 对照

5 6 8 7 6 9 8 7 10 9 8 10 9 8 10 10 9 11 10 9 12 11 10 12 11 10 14

12

11 16 ∑ij

X 92 84 112 288 i n 10 10 10 30 i X

9.2

8.4 11.2 9.6 ∑ij

X

2 886 732 1306 2924 i s 2

4.4

2.93

5.73

3.有三种抗凝剂(A 1,A 2,A 3)对一标本作红细胞沉降速度(一小时值)测定,每种抗凝剂各作5次,问三种抗凝剂对红细胞沉降速度的测定有无差别?

A 1:15 11 13 12 14 A 2:13 16 14 17 15 A 3:13 15 16 14 12

4.用Dunnett-t 法检验下表中四个处理组均数与对照组的均数的差别。

%)

试验分组 n

i X 对照(未损伤) 8 78.86 0.43 损伤后0.5小时 5 79.65 0.68 损伤后3小时

5

79.77

0.66

损伤后6小时 8 80.94 0.75 治疗组 9 79.61 0.66

5.将36只大白鼠按体重相近的原则配为12个单位组,各单位组的3只大白鼠随机地分配到三个饲料组。一个月后观察尿中氨基氮的排出量(mg )。经初步计算,162=总SS ,8=饲料SS ,110=误差SS 。试列出该实验数据的方差

分析表。

6.将18名原发性血小板减少症患者按年龄相近的原则配为6个单位组,每个单位组中的3名患者随机分配到A 、B 、C 三个治疗组中,治疗后的血小板升高见表5-6,问3种治疗方法的疗效有无差别?

表5-6 不同人用鹿茸草后血小板的升高值 (104/mm 3)

年龄组 A B C 1

3.8 6.3 8.0 2

4.6 6.3 11.9 3 7.6 10.2 14.1 4 8.6 9.2 14.7 5 6.4 8.1 13.0 6

6.2

6.9

13.4

7.某研究人员以0.3ml/kg 剂量纯苯给大鼠皮下注射染毒,每周3次,经45天后,使实验动物白细胞总数下降至染毒前的50%左右,同时设置未染毒组。两组大鼠均按照是否给予升高白细胞药物分为给药组和不给药组,试验结果见下表,试作统计分析。

表5-7 试验效应指标(吞噬指数)数据

未染毒组 染毒组

不给药 给药

不给药 给药

3.80

3.8

8

1.8

5

1.9

4

3.90

3.8

4

2.0

1

2.2

5

4.06

3.9

6

2.1

2.0

3

3.85

3.9

2

1.9

2

2.1

3.84

3.8

0 2.0

4

2.0

8

五、 习题答题要点

(一) 名词解释

1.均方:均方差(MS )或方差,是由离均差平方和被自由度相除而得。

2.方差分析:方差分析(analysis of variance ,ANOVA )就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和与自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释。通过各变异来源的均方与误差均方比值的大小,借助F 分布作出统计推断,判断各因素对观测指标有无影响。

3.总变异:样本中全部实验单位差异称为总变异。其大小可以用全部观察值的均方(方差)表示。

4.组间变异:各处理组样本均数之间的差异,受处理因素的影响,这种变异称为组间变异,其大小可用组间均方表示。

5.组内变异: 各处理组内部观察值大小不等,这种变异称为组内变异,可用组内均方表示。

6.完全随机设计:只考虑一个处理因素,将全部受试对象随机分配到各处理组,然后观察实验效应,这种设计叫做完全随机设计。

7.随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则是各区组内的受试对象的特征相同或相近,且受试对象数与处理因素的水平数相等。然后再将每个区组内的观察对象随机地分配到各处理组,这种设计叫做随机区组设计。

(二) 单项选择题

1.C

2.D

3.B

4.B

5.D

6.D

7.A

8.B

9.B 10.B (三) 简答题

1. t 检验和方差分析均要求各样本来自相互独立的正态总体且各总体方差齐。

2.设置检验水准应根据研究目的,结合专业知识和研究设计要求,在末获得样本信息之前决定,而不应受到样本结果的影响。

3.以t 检验为例,α和P 都是用t 分布尾部面积大小表示,所不同的是:α表示I 型错误的概率,即H 0为真而被错误地拒绝的概率值。α是在统计分析时,根据I 型错误危害的大小,预先规定的,即规定统计结果为“接受 H 1” 时的误判率的界限值为α(即检验水准)。P 值是由实际样本得出的统计结果为“接受 H 1” 时误判率。根据P 与α的大小关系作出“不拒绝H 0”或“拒绝H 0”的统计推断。 (四)计算题

1.完全随机设计单因素芳差分析

解:H 0:4个季节湖水中氯化物含量相等,即μ1=μ2=μ3=μ

4

H 1:4个季节湖水中氯化物含量不等或不全相等。

α=0.05

205.1081932/4.588/)(22===∑∑n X C ij

635.281205.1081984.111002=-=-=∑∑C X SS ij 总

170

.141205.108198/)3.1299.1313.1599.167(]/)[(22222=-+++=-=∑∑C

n X SS i ij 组间

465.140141170635.281=-=-=组间总组内SS SS SS

表5-8 方差分析表

总变异 组间变异 组内变异

281.635 141.170 140.465

31 3 28

47.057 5.017

9.380

查F 界值表,95.228

,3,05.0=F 。因F >28,3,05.0F 所以P <0.05。按α=0.05水准,拒绝H 0,接受H 1,认为不同季节

湖水中氯化物含量不同或不全相同。

用SNK-q 检验进行各组均数间两两比较。 H 0:任意两对比组的总体均数相等,μA =μB

H 1:μA ≠μB

α=0.05

表5-9 四个样本均数顺序排序

i X 位次

20.99 1 19. 91 2 16.49 3

16.16 4

表5-10 四组均数两两比较q 检验 对比组 两均数之差 组数 q 值

P 值

1 , 4 1 , 3 1 ,

2 2 , 4 2 ,

3 3 , 4

4. 83 4. 50 1. 08 3. 30 3. 42 0. 33

4 3 2 3 2 2

6. 099 5. 682 1.364 4. 735 4. 319 0. 417

<0.01 <0.01 >0.05 <0.01 <0.01 >0.05

春与夏、秋与冬湖水中氯化物含量P >0.05,按α=0.05水准,不拒绝H 0,即不能认为春与夏、秋与冬季湖水中氯化物含量有差别。而其它4组均有P <0.01,按α=0.05水准,拒绝H 0,接受H 1,即认为春夏两季湖水中氯化物含量高于秋冬两季。

2.完全随机设计单因素芳差分析

H 0:大白鼠感染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗生存日数相等.

H 1:大白鼠感染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗生存日数不等或不全相等.

α=0.05

8.276430/288/)(22===∑∑n X C ij 2.1598.276429242=-=-=∑∑C X SS ij 总

22

2

2

[()/](9284112)/102764.841.6

ij i SS X n C

=-=++-=∑∑组间

6.1176.412.159=-=-=组间总组内SS SS SS

表5-11 方差分析表

变异来源 SS ν

MS

F

总变异 组间变异 组内变异

159.2 41.6 117.6

29 2 27

20.80 4.36

4.77

查F 界值表,35.327

,2,05.0=F 。因F 〉27,2,05.0F 得P <0.05,按α=0.05水准,拒绝H 0,接受H 1,认为大白鼠

感染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗对生存日数有影响.

用Dunnet-t 检验方法进行均数间多重比较:

H 0:任一组与对照组总体均数相同

H 1:任一组与对照组总体均数不同

α=0.05

由Dunnett-t 检验公式,伤寒与对照组比较:

(9.2-11.2)2/0.93 2.14

X X t -=

==-=-

ν=27,查Dunnett-t 检验界值表,得P <0.05。按α=0.05水准,拒绝H 0,接受H 1,故可认为接种伤寒菌苗组较

对照组生存日数减少。

百日咳与对照组比较:

99.2)10/110/1(36.4/)2.114.8(-=+-=百对t

ν=27,查Dunnett-t 检验界值表,得P <0.05,按α=0.05水准,拒绝H 0,接受H 1,认为接种百日咳菌苗组较对

照组生存日数减少。

3.完全随机设计资料方差分析

H 0:三种抗凝剂所作血沉值之间没有差别 H 1:三种抗凝剂所作血沉值之间存在差别 α=0.05

表5-12 方差分析表

变异来源 SS

ν

MS

F

总变异 40 14 组间变异 组内变异

10 30

2 12

5 2.5

2

查F 界值表,,88.312,2,05.0=F 所以P >0.05,按α=0.05水准,不能拒绝H 0。即尚不能认为三种抗凝剂所作血沉值之间有差别。

4.首先计算误差均方

3086

.1266.0)19(75.0)18(66.0)15(68.0)15(43.0)18()1(222222

=?-+?-+?-+?-+?-=-=∑i

i s n SS 误差

305-35k -N ===误差ν

/12.3086/300.4103MS SS ν===误差误差误差

(1) 损伤后0.5小时与对照组比

H 0:损伤后0.5小时与对照组组织含水量相等 H 1:损伤后0.5小时与对照组组织含水量不等

α=0.05

16

.2)

5

181(4103.086

.7865.79=+-=

t

以30=误差ν,处理数=4查Dunnett-t 界值表,得界值2.25,因t =2.16<2.25, 所以P >0.05。在α=0.05水准上,不拒绝H 0,尚不能认为损伤后0.5小时与对照组组织含水量有差别。

(2)损伤后3小时与对照组比

H 0:损伤后3小时与对照组组织含水量相等 H 1:损伤后3小时与对照组组织含水量不等

α

=0.05

2.49t =

=

因t >2.25(界值),故P <0.05。在α=0.05水准上,拒绝H 0,认为损伤后3小时与对照组的组织含水量有差别。 (3)损伤后6小时与对照组比

H 0:损伤后6小时与对照组组织含水量相等 H 1:损伤后6小时与对照组组织含水量不等

α

=0.05

6.49t =

=

因t >2.25(界值),故P <0.05。在α=0.05水准上,拒绝0,认为损伤后6小时与对照组的组织含水量有差别。 (4)治疗组与对照组比

H 0:治疗组与对照组组的织含水量相等 H 1:治疗组与对照组的组织含水量不等

α

=0.05

2.41t =

=

因t >2.25(界值),故P <0.05。在α=0.05水准上,拒绝H 0,认为治疗组与对照组的组织含水量有差别。 5.随机去组设计方差分析,总例数N =36,处量组数k =3,区组数n =12。 计算:441108162=--=--=误差饲料总区组SS SS SS SS

351361=-=-=N v 总 2131=-=-=k v 饲料 111121=-=-=n v 区组

221123361=+--=+--=n k N v 误差 根据计算结果填写方差分析表,见表5-11。

表5-13 方差分析表

变异来源 SS ν

MS F

P

处理间 8 2 4 0.8 >0.05 区组间 44 11 4 0.8 >0.05 误差 110 22 5 总变异

162

35

6.解:这两组资料用随机区组的方差分析为宜。 (1)处理组间比较

H 0:不同治疗组血小板升高值相同 H 1:不同治疗组血小板升高值不全相同 α=0.05

(2)年龄组间比较

H 0:不同年龄组血小板升高值相同

H 1:不同年龄组血小板升高值不全相同

α=0.05

(3)计算,列方差分析表

表5-14 方差分析表

变异来源 ν

总变异 组间 区组间 误差

187.265 129.003 50.132 8.13

17 2 5 10

64.502 10.026

0.813

79.338 12.333

查F界值表,

0.05,2,104.10,

F=

0.05,4,103.48,

F=因此,组间及区组间均为P<0.05。按α=0.05水准,拒绝H0,可认为不同治疗组间血小板升高值不相同,不同年龄组患者血小板升高值也不相同。

7.设A因素为染毒(2水平), B因素为药物(2水平),做2?2表析因设计方差分析。结果见表5-15。

表5-15 方差分析表

变异来源SS MS F

总变异

染毒

药物

染毒* 药物误差17.339

0.009

17.168

0.014

0.148

19

1

1

1

16

0.009

17.16

8

0.014

0.009

1.000

1907.555

1.555

查F界值表,

0.01,1,168.68,

F=因此,药物组间P<0.01。按α=0.01水准,认为给药组和不给药组吞噬指数不相

同。

(赵清波张玉海)

统计学计算题例题

第四章 1. 某企业1982年12月工人工资的资料如下: 要求:(1)计算平均工资;(79元) (2)用简捷法计算平均工资。 2. 某企业劳动生产率1995年比1990年增长7%,超额完成计划2%,试确定劳动生产率计划增长数。7%-2%=5% 3. 某厂按计划规定,第一季度的单位产品成本比去年同期降低8%。实际 执行结果,单位产品成本较去年同期降低4%。问该厂第一季度产品单位成本计划的完成程度如何?104.35%( (1-4%)/(1-8%)*100%=96%/92%*100%=104.35%结果表明:超额完成4.35%( 104.35%-100%)) 4. 某公社农户年收入额的分组资料如下:

要求:试确定其中位数及众数。中位数为774.3(元)众数为755.9(元) 求中位数: 先求比例:(1500-720)/(1770-720)=0.74286 分割中位数组的组距:(800-700)*0.74286=74.286 加下限700+74.286=774.286 求众数: D1=1050-480=570 D2=1050-600=450 求比例:d1/(d1+d2)=570/(570+450)=0.55882 分割众数组的组距:0.55882*(800-700)=55.882 加下限:700+55.882=755.882 5.1996年某月份某企业按工人劳动生产率高底分组的生产班组数和产量资料如下: 64.43(件/人) (55*300+65*200+75*140+85*60)/(300+200+140+60) 6.某地区家庭按人均月收入水平分组资料如下:

根据表中资料计算中位数和众数。中位数为733.33(元) 众数为711.11(元) 求中位数: 先求比例:(50-20)/(65-20)=0.6667 分割中位数组的组距:(800-600)*0.6667=66.67 加下限:600+66.67=666.67 7.某企业产值计划完成103%,比去年增长5%。试问计划规定比去年增长 多少?1.94% (上年实际完成1.03/1.05=0.981 本年实际计划比上年增长 (1-0.981)/0.981=0.019/0.981=1.937%) 8.甲、乙两单位工人的生产资料如下: 试分析:(1)哪个单位工人的生产水平高? (2)哪个单位工人的生产水平整齐? % 3.33V %7.44V /8 .1x /5.1x ====乙甲乙甲人)(件人)(件9.在 计算平均数里,从每个标志变量中减去75个单位,然后将每个差数 缩小10倍,利用这个变形后的标志变量计算加权算术平均数,其中各个变量的权数扩大7倍,结果这个平均数等于0.4个单位。试计算这个平均标志变量的实际平均数,并说明理由。79 10.某地区1998~1999年国内生产总值资料如下表:(单位:亿元)

统计学原理计算题试题及答案(最新整理)

电大专科统计学原理计算题试题及答案 计算题 1某单位40名职工业务考核成绩分别为 68 89 8884 86 87 75 73 72 68 75 82 9758 81 54 79 76 95 76 71 60 9065 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81 单位规定:60分以下为不及格,60 — 70分为及格,70 — 80分为中,80 — 90 分为良,90 — 100分为优。 要求: (1)将参加考试的职工按考核成绩分为不及格、及格、中、良、优五组并编制一张考核成绩次数分配表; (2)指出分组标志及类型及采用的分组方法; (3)分析本单位职工业务考核情况。 解:(1) (2)分组标志为”成绩",其类型为" 的开放组距式分组,组限表示方法是重叠组限; (3)本单位的职工考核成绩的分布呈两头小,中间大的”正态分布”的形态, 说明大多数职工对业务知识的掌握达到了该单位的要求。 2.2004年某月份甲、乙两农贸市场农产品价格和成交量、成交额资料如下 价格(元/斤) 甲市场成交额(万元) 乙市场成交量(万斤) 品种

试问哪一个市场农产品的平均价格较高?并说明原因 解:先分别计算两个市场的平均价格如下: 甲市场平均价格 X m 5.5 1.375 (元 /斤) m/x 4 乙市场平均价格 X xf 5.3 1.325 (元 / 斤) f 4 说明:两个市场销售单价是相同的,销售总量也是相同的,影响到两个市场 平均价格高低不同的原因就在于各种价格的农产品在两个市场的成交量不同 3. 某车间有甲、乙两个生产组,甲组平均每个工人的日产量为 36件, 标准差为9.6件;乙组工人日产量资料如下:

统计分析综合实验报告

统 计 分 析 综 合 实 验 报 告 专业:班级: 姓名:学号: 规定题目

一.问题提出及分析目的 (一)问题提出 夏春同学打算毕业后去上海创办一家属于自己的投资咨询服务公司,以便利用在学校里学到的经济学知识,去为广大的货币市场从业人员提供必要的投资指导。为了能顺利地实现自己的创业计划,他着手编辑了一份投资信息简报、分发给一些投资商,希望这些人能提供各方面的建议,进而了解投资商们感兴趣的东西。(二)分析目的 (1)、对货币市场的交易规模和收益情况进行描述分析。 (2)在95%的置信水平下,对整个货币市场的投资规模、每周收益率和每月收益率进行区间估计,并作出解释。 (3)对周收益率和月收益率进行比较。 (4)资产规模大小对收益率影响是否显著? 二.数据收集及录入

1.打开SPSS 应用程序,在“变量视图”编辑框中录入以下数据: 2.在“数据视图”编辑框中依据收集的数据录入以下数据:(因版面需要在此呈现前5行数据,后面27行按前5行方式录入) 三.数据分析 (一)描述性分析 1.在SPSS 中依次选取“分析”—“描述统计”—“描述”,将资产规模和过去一周、一月的平均收益率全部选取转至右侧方框: 2.在描述性对话框中点击右侧“选项”,进入选项属性设置对话框,选中“均值”、“标准差”、“最大值”、“最小值”、“峰度”、“偏度”、“变量列表”选项:

(二)区间估计 1.在SPSS中依次选取“分析”—“描述统计”—“探索过程”,将资产规模和过去一周、一月的平均收益率全部选取转至右侧方框: 2. .在“探索”对话框中点击右侧“统计量”,进入统计量设置对话框,设置均值置信区间为95%: (三)周月收益率分析 1.在SPSS中依次选取“分析”——“比较均值”——“配对样本T检验”,将过去一周、一月的平均收益率选取转至右侧方框: 2. .在“配对样本T检验”对话框中点击右侧“选项”,进入选项属性设置对话框,设置置信区间为95%:

统计学计算题例题及计算分析

计算分析题解答参考 1.1.某厂三个车间一季度生产情况如下: 计算一季度三个车间产量平均计划完成百分比和平均单位产品成本。 解:平均计划完成百分比=实际产量/计划产量=733/(198/0.9+315/1.05+220/1.1) =101.81% 平均单位产量成本 X=∑xf/∑f=(15*198+10*315+8*220)/733 =10.75(元/件) 1.2.某企业产品的有关资料如下: 试分别计算该企业产品98年、99年的平均单位产品成本。 解:该企业98年平均单位产品成本 x=∑xf/∑f=(25*1500+28*1020+32*980)/3500 =27.83(元/件) 该企业99年平均单位产品成本x=∑xf /∑(m/x)=101060/(24500/25+28560/28+48000/32) =28.87(元/件) 年某月甲、乙两市场三种商品价格、销售量和销售额资料如下: 1.3.1999 解:三种商品在甲市场上的平均价格x=∑xf/∑f=(105*700+120*900+137*1100)/2700 =123.04(元/件) 三种商品在乙市场上的平均价格x=∑m/∑(m/x)=317900/(126000/105+96000/120+95900/137) =117.74(元/件) 2.1.某车间有甲、乙两个生产小组,甲组平均每个工人的日产量为22件,标准差为 3.5件;乙组工人日产量资料:

试比较甲、乙两生产小组中的哪个组的日产量更有代表性? 解:∵X 甲=22件 σ甲=3.5件 ∴V 甲=σ甲/ X 甲=3.5/22=15.91% 列表计算乙组的数据资料如下: ∵x 乙=∑xf/∑f=(11*10+14*20+17*30+20*40)/100 =17(件) σ乙= √[∑(x-x)2 f]/∑f =√900/100 =3(件) ∴V 乙=σ乙/ x 乙=3/17=17.65% 由于V 甲<V 乙,故甲生产小组的日产量更有代表性。 2.2.有甲、乙两个品种的粮食作物,经播种实验后得知甲品种的平均产量为998斤,标准差为162.7斤;乙品种实验的资料如下: 试研究两个品种的平均亩产量,确定哪一个品种具有较大稳定性,更有推广价值? 解:∵x 甲=998斤 σ甲=162.7斤 ∴V 甲=σ甲/ x 甲=162.7/998=16.30% 列表计算乙品种的数据资料如下:

统计学计算例题及答案

计算题例题及答案: 1、某校社会学专业同学统计课成绩如下表所示。 社会学专业同学统计课成绩表 学号成绩学号成绩学号成绩101023 76 101037 75 101052 70 101024 91 101038 70 101053 88 101025 87 101039 76 101054 93 101026 78 101040 90 101055 62 101027 85 101041 76 101056 95 101028 96 101042 86 101057 95 101029 87 101043 97 101058 66 101030 86 101044 93 101059 82 101031 90 101045 92 101060 79 101032 91 101046 82 101061 76 101033 80 101047 80 101062 76 101034 81 101048 90 101063 68 101035 80 101049 88 101064 94 101036 83 101050 77 101065 83 要求: (1)对考试成绩按由低到高进行排序,求出众数、中位数和平均数。

(2)对考试成绩进行适当分组,编制频数分布表,并计算累计频数和累计频率。答案: (1)考试成绩由低到高排序: 62,66,68,70,70,75,76,76,76,76,76,77,78,79, 80,80,80,81,82,82,83,83,85,86,86,87,87,88, 88,90,90,90,91,91,92,93,93,94,95,95,96,97, 众数:76 中位数:83 平均数: =(62+66+……+96+97)÷42 =3490÷42 =83.095 (2) 按成绩 分组频数频率(%) 向上累积向下累积 频数频率(%) 频数频率(%) 60-69 3 7.143 3 7.143 42 100.000 70-79 11 26.190 14 33.333 39 92.857 80-89 15 35.714 29 69.048 28 66.667

统计学原理(第五版)》习题计算题答案详解

《统计学原理(第五版)》习题计算题答案详解 第二章 统计调查与整理 1. 见教材P402 2. 见教材P402-403 3. 见教材P403-404 第三章 综合指标 1. 见教材P432 2. %86.12270 25 232018=+++= 产量计划完成相对数 3. 所以劳动生产率计划超额%完成。 4. %22.102% 90% 92(%)(%)(%)=== 计划完成数实际完成数计划完成程度指标 一季度产品单位成本,未完成计划,还差%完成计划。 5. %85.011100%8% 110% 1=?++==计划完成数实际完成数计划完成程度指标计划完成数;所以计划完成数实际完成数标因为,计划完成程度指%105%103= = 1.94%%94.101% 103% 105,比去年增长解得:计划完成数==()得出答案)将数值带入公式即可以计算公式, 上的方程,给大家一个很多同学都不理解也可以得出答案,鉴于(根据第三章天)。 个月零天(也即是个月零(月)也就是大约)(上年同季(月)产量达标季(月)产量超出计划完成产量 达标期完成月数计划期月数超计划提前完成时间达标期提前完成时间完成计划的时间万吨。根据公式:提前多出万吨,比计划数万吨产量之和为:季度至第五年第二季度方法二:从第四年第三PPT PPT 6868825.8316-32070 -7354-60--3707320181718=+=+=+==+++()天完成任务。个月零 年第四季度为止提前(天),所以截止第五)(根据题意可设方程:万吨完成任务。天达到五年第二季度提前万吨。根据题意,设第万吨达到原计划,还差万吨产量之和为:季度至第五年第一季度方法一:从第四年第二6866891 -91*20)181718(1916707016918171816=++++=+++x x x

统计学练习题——计算题

统计学练习题——计算题 1、某企业工人按日产量分组如下: 单位:(件) 试计算7、8月份平均每人日产量,并简要说明8月份比7月份平均每人日产量变化的原因。 7月份平均每人日产量为:37360 13320 == = ∑∑f Xf X (件) 8月份平均每人日产量为:44360 15840 == = ∑∑ f Xf X (件) 根据计算结果得知8月份比7月份平均每人日产量多7件。其原因是不同组日产量水平的工人所占比重发生变化所致。7月份工人日产量在40件以上的工人只占全部工人数的40%,而8月份这部分工人所占比重则为66.67%。

2、某纺织厂生产某种棉布,经测定两年中各级产品的产量资料如下: 解: 2009年棉布的平均等级= 250 10 3 40 2 200 1? + ? + ? =1.24(级) 2010年棉布的平均等级= 300 6 3 24 2 270 1? + ? + ? =1.12(级) 可见该厂棉布产品质量2010年比2009年有所提高,其平均等级由1.24级上升为1.12级。质量提高的原因是棉布一级品由80%上升为90%,同时二级品和三级品分别由16%及4%下降为8%及2%。

试比较和分析哪个企业的单位成本高,为什么? 解: 甲企业的平均单位产品成本=1.0×10%+1.1×20%+1.2×70%=1.16(元) 乙企业的平均单位产品成本=1.2×30%+1.1×30%+1.0×40%=1.09(元) 可见甲企业的单位产品成本较高,其原因是甲企业生产的3批产品中,单位成本较高(1.2元)的产品数量占70%,而乙企业只占30%。

统计学计算题答案..

第 1 页/共 12 页 1、下表是某保险公司160名推销员月销售额的分组数据。书p26 按销售额分组(千元) 人数(人) 向上累计频数 向下累计频数 12以下 6 6 160 12—14 13 19 154 14—16 29 48 141 16—18 36 84 112 18—20 25 109 76 20—22 17 126 51 22—24 14 140 34 24—26 9 149 20 26—28 7 156 11 28以上 4 160 4 合计 160 —— —— (1) 计算并填写表格中各行对应的向上累计频数; (2) 计算并填写表格中各行对应的向下累计频数; (3)确定该公司月销售额的中位数。 按上限公式计算:Me=U- =18-0.22=17,78 2、某厂工人按年龄分组资料如下:p41 工人按年龄分组(岁) 工人数(人) 20以下 160 20—25 150 25—30 105 30—35 45 35—40 40 40—45 30 45以上 20 合 计 550 要求:采用简捷法计算标准差。《简捷法》 3、试根据表中的资料计算某旅游胜地2004年平均旅游人数。P50 表:某旅游胜地旅游人数 时间 2004年1月1日 4月1日 7月1日 10月1日 2005年1月1 日 旅游人数(人) 5200 5000 5200 5400 5600 4、某大学2004年在册学生人数资料如表3-6所示,试计算该大学2004年平均在册学生人数. 时间 1月1日 3月1日 7月1日 9月1日 12月31日 在册学生人数(人) 3408 3528 3250 3590 3575

应用统计学练习题(含答案)

应用统计学练习题 第一章绪论 一、填空题 1.统计工作与统计学的关系是__统计实践____和___统计理论__的关系。 2.总体是由许多具有_共同性质_的个别事物组成的整体;总体单位是__总体_的组成单位。 3.统计单体具有3个基本特征,即__同质性_、__变异性_、和__大量性__。 4.要了解一个企业的产品质量情况,总体是_企业全部产品__,个体是__每一件产品__。 5.样本是从__总体__中抽出来的,作为代表_这一总体_的部分单位组成的集合体。 6.标志是说明单体单位特征的名称,按表现形式不同分为__数量标志_和_品质标志_两种。 7. 8.统计指标按其数值表现形式不同可分为__总量指标__、__相对指标_和__平均指标__。 9.指标与标志的主要区别在于: (1)指标是说明__总体__特征的,而标志则是说明__总体单位__特征的。 (2)标志有不能用__数量__表示的_品质标志_与能用_数量_表示的_数量标志_,而指标都是能用_数量_表示的。 10.一个完整的统计工作过程可以划分为_统计设计_、_统计调查_、_统计整理_和__统计分析__4个阶段。 二、单项选择题 1.统计总体的同质性是指(A)。 A.总体各单位具有某一共同的品质标志或数量标志 B.总体各单位具有某一共同的品质标志属性或数量标志值 C.总体各单位具有若干互不相同的品质标志或数量标志 D.总体各单位具有若干互不相同的品质标志属性或数量标志值 2.设某地区有800家独立核算的工业企业,要研究这些企业的产品生产情况,总体是( D)。

A.全部工业企业 B.800家工业企业 C.每一件产品 D.800家工业企业的全部工业产品 3.有200家公司每位职工的工资资料,如果要调查这200家公司的工资水平情况,则统计总体为(A)。 A.200家公司的全部职工 B.200家公司 C.200家公司职工的全部工资 D.200家公司每个职工的工资 4.一个统计总体( D)。 A.只能有一个标志 B.可以有多个标志 C.只能有一个指标 D.可以有多个指标 5.以产品等级来反映某种产品的质量,则该产品等级是(C)。 A.数量标志 B.数量指标 C.品质标志 D.质量指标 6.某工人月工资为1550元,工资是( B )。 A.品质标志 B.数量标志 C.变量值 D.指标 7.某班4名学生金融考试成绩分别为70分、80分、86分和95分,这4个数字是( D)。 A.标志 B.指标值 C.指标 D.变量值 8.工业企业的职工人数、职工工资是(D)。 A.连续变量 B.离散变量 C.前者是连续变量,后者是离散变量 D.前者是离散变量,后者是连续变量 9.统计工作的成果是(C)。 A.统计学 B.统计工作 C.统计资料 D.统计分析和预测 10.统计学自身的发展,沿着两个不同的方向,形成(C)。 A.描述统计学与理论统计学 B.理论统计学与推断统计学 C.理论统计学与应用统计学 D.描述统计学与推断统计学

统计学期末考试试题(含答案)

西安交大统计学考试试卷 一、单项选择题(每小题2分,共20分) 1.在企业统计中,下列统计标志中属于数量标志的是( C) A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有(B ) A、国民收入 B、人均国民收入 C、国内生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有( B)个变量 A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是(A ) A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中,属于时点指标的有(A ) A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是(B )确定调查单位的 A、随机 B、主观 C、随意 D盲目 7.总体标准差未知时总体均值的假设检验要用到( A ): A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为(A ) A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值范围是p(D ) A、大于1 B、大于-1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于(A ) A、零 B、 1 C、-1 D、2 二、多项选择题(每小题2分,共10分。每题全部答对才给分,否则不计分) 1.数据的计量尺度包括( ABCD ): A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有( BE ): A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有( ABE ) A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中( BDE ) A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是 填报单位 D、每台设备是调查单位 E、每个工业企业是填报单位 5.下列平均数中,容易受数列中极端值影响的平均数有( ABC ) A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数 三、判断题(在正确答案后写“对”,在错误答案后写“错”。每小题1分,共10分) 1、“性别”是品质标志。(对) 2、方差是离差平方和与相应的自由度之比。(错) 3、标准差系数是标准差与均值之比。(对) 4、算术平均数的离差平方和是一个最大值。(错) 5、区间估计就是直接用样本统计量代表总体参数。(错) 6、在假设检验中,方差已知的正态总体均值的检验要计算Z统计量。(错)

《统计学》计算题型与参考答案

《统计学》计算题型 (第二章)1.某车间40名工人完成生产计划百分数(%)资料如下:9065 100 102 100 104 112 120 124 98 110110 120 120 114 100 109 119 123 107 110 99 132 135 107 107 109 102 102 101 110 109 107 103 103 102 102 102 104 104 要求: (1)编制分配数列;(4分) (2)指出分组标志及其类型;(4分) (3)对该车间工人的生产情况进行分析。(2分) 解答: (1)

(2)分组标志:生产计划完成程度 类型:数量标志 (3)从分配数列可以看出,该计划未能完成计划的有4人,占10%,超额完成计划在10%以内的有22人,占55%,超额20%完成的有7人,占17.5%。反映该车间,该计划完成较好。 (第三章)2.2005年9份甲、乙两农贸市场某农产品价格和成交量、成交额资料如下: 试问哪一个农贸市场农产品的平均价格较高?(8分)并分析说明原因。(2分) 解答: (1)x 甲=∑∑m x m 1=24 8.41 6.36.314.24.21246.34.2?+?+?++=30/7=4.29(元) x 乙= ∑∑f xf = 1 241 8.426.344.2++?+?+?=21.6/7=3.09(元) (2)原因分析:甲市场在价格最高的C 品种成交量最高,而乙市场是在最低的价格A 品种成交量最高,根据权数越大其对应的变量值对平均数的作用越大的原理,可知甲市场平均价格趋近于C ,而乙市场平均价格却趋近于A ,所以甲市场平均价格高于乙市场平均价格。

统计学计算题例题学习资料

统计学计算题例题

第四章 1. 某企业1982年12月工人工资的资料如下: 要求:(1)计算平均工资;(79元) (2)用简捷法计算平均工资。 2. 某企业劳动生产率1995年比1990年增长7%,超额完成计划2%,试确定劳动生产率计划增长数。 7%-2%=5% 3. 某厂按计划规定,第一季度的单位产品成本比去年同期降低8%。实际 执行结果,单位产品成本较去年同期降低4%。问该厂第一季度产品单位成本计划的完成程度如何?104.35%( (1-4%)/(1-8%)*100%=96%/92%*100%=104.35%结果表明:超额完成4.35%(104.35%-100%)) 4. 某公社农户年收入额的分组资料如下:

要求:试确定其中位数及众数。中位数为774.3(元)众数为755.9(元) 求中位数: 先求比例:(1500-720)/(1770-720)=0.74286 分割中位数组的组距:(800-700)*0.74286=74.286 加下限700+74.286=774.286 求众数: D1=1050-480=570 D2=1050-600=450 求比例:d1/(d1+d2)=570/(570+450)=0.55882 分割众数组的组距:0.55882*(800-700)=55.882 加下限:700+55.882=755.882 5.1996年某月份某企业按工人劳动生产率高底分组的生产班组数和产量资料如 下: 率。64.43(件/人)

(55*300+65*200+75*140+85*60)/(300+200+140+60) 6.某地区家庭按人均月收入水平分组资料如下: 根据表中资料计算中位数和众数。中位数为733.33(元) 众数为711.11(元) 求中位数: 先求比例:(50-20)/(65-20)=0.6667 分割中位数组的组距:(800-600)*0.6667=66.67 加下限:600+66.67=666.67 7.某企业产值计划完成 103%,比去年增长5%。试问计划规定比去年增长 多少?1.94% (上年实际完成1.03/1.05=0.981 本年实际计划比上年增长 (1-0.981)/0.981=0.019/0.981=1.937%) 8.甲、乙两单位工人的生产资料如下:

统计学练习题及答案

2014统计学练习题及答案 一判断题 1、某企业全部职工的劳动生产率计划在去年的基础上提高8%,计划执行结果仅提高4%,则劳动生产率的任务仅实现一半。(错) 2、在统计调查中,调查标志的承担者是调查单位。( 错) 3、制定调查方案的首要问题是确定调查对象。( 错) 4、正相关指的就是因素标志和结果标志的数量变动方向都是上升的。( 错) 5、现象之间的函数关系可以用一个数学表达式反映出来。(对) 6.上升或下降趋势的时间序列,季节比率大于1,表明在不考虑其他因素影响时,由于季.的影响使实际值高于趋势值,(对) 7.特点是“先对比,后综合。”(错 8.隔相等的时点数列计算平均发展水平时,应用首尾折半的方法。( 错) 9.均数指数的计算特点是:先计算所研究对象各个项目的个体指数;然后将个体指数进行加权平均求得总指数。( 错) 10.和样本指标均为随机变量。( 错) 11.距数列中,组数等于数量标志所包含的变量值的个数。(对) 12.中值是各组上限和下限之中点数值,故在任何情况下它都能代表各组的一般水平。( 错) 13.标志和数量标志都可以用数值表示,所以两者反映的内容是相同的。(错) 14.变异度指标越大,均衡性也越好。( 对) 15.于资料的限制,使综合指数的计算产生困难,就需要采用综合指数的变形公式平均数指数。( 错) 16.计量是随机变量。(对) 17.数虽然未知,但却具有唯一性。(错) 18.标和数量标志都可以用数值表示,所以两者反映的内容是相同的(错) 19.以经常进行,所以它属于经常性调查(错) 20.样本均值来估计总体均值,最主要的原因是样本均值是可知的。()答案未 21.工业普查中,全国工业企业数是统计总体,每个工业企业是个体。(错) 22.标志的承担者,标志是依附于个体的。(对) 23.志表明个体属性方面的特征,其标志表现只能用文字来表现,所以品质标志不能转化为统计指标。(错) 24.标和数量标志都可以用数值表示,所以两者反映的内容是相同的。(错) 25.计指标都是用数值表示的,所以数量标志就是统计指标。(错) 26.标及其数值可以作为总体。(错) 27.润这一标志可以用定比尺度来测定。(错) 28.统计学考试成绩分别为55分,78分,82分,96分,这4个数字是数量指标。(错) 29.术学派注重对事物性质的解释,而国势学派注重数量分析。(错) 30.是统计研究现象总体数量的前提。(对) 31.析中,平均发展速度的计算方法分水平法和方程两种。(错) 32.数值越大,说明相关程度越高:同理,相关系数的数值越小,说明相关程度越低(对 33.志是总体同质性特征的条件,而不变标志是总体差异性特征的条件。(错) 34.度具有另外三种尺度的功能。(对) 35.民旅游意向的问卷中,“你最主要的休闲方式是什么?”,这一问题应归属于事实性问题

使用统计学实验报告

*****大学 应用统计学课程实验(上机)报告 专业班级: 学号: 学生姓名: 指导老师: 实验地点: 学期:

实验(上机)日期:第一次 实验(上机)主题:统计软件的运用 实验(上机)类别:验证性 完成方式:独立 实验(上机)目的与要求: 1、掌握启动和退出统计软件 2、掌握数据库的建立 3、搜集一些数据并建立数据库 4、进行统计计算(函数、描述性统计) 5、制作统计图 6、计算各种统计指标 实验(上机)内容及方法(学生填写) 第1步:打开Excel输入需要分析的数据,然后点击公式选项,选择其中需要的函数进行计算分析。 第2步:在A1:A20区域选取从-3到3,间距为0.058的数据序列作为X序列。在B1单元格中输入公式 “=NORMDIST(A1,0,1,FALSE)”,然后将公式复制到B1:B20区域,在B1:B20区域形成相对A1:A20区间点的正态分布概率密度函数序列。 第3步:选取自由度为2,在A1:A20区域填充从0—12的等差数列,步长为0.1.在B1单元格输入公式“=(A1×EXP(-A1/2)

/2)”即可得A1在自由度为2时的卡方分布概率值,然后将B1单元格的公式复制到B1:B20区域,同样选择图标向导和折线图,经过编辑和修饰得到卡方分布概率密度函数图。 实验(上机)过程与结果(学生如实记载上机操作内容、步骤及结果) 本专业男生身高数值(单位:cm): 165、167、168、172、175、173、168、170、180、178、175、181、172、170、169、177、173、168、170、171 1.计算统计指标:在菜单栏中选择工具,然后单击数据分析,再选择描述统计输入数据。 2.点击图表向导,选择折线图第一个样式。

统计学计算习题

第四章 六、计算题 月工资(元) 甲单位人数(人) 乙单位人数比重(%) 400以下 400~600 600~800 800~1000 1000以上 4 25 84 126 28 2 8 30 42 18 合 计 267 100 工资更具有代表性。 1、(1) 430025500267 x f x f ?+?+ == = ∑∑甲工资总额 总人数 3002%5008%7003%f x x f =? =?+?+?+ ∑∑乙 (2) 计算变异系数比较 ()2 x x f f σ-=∑∑甲甲 甲甲 () 2 x x f f σ-∑∑乙乙 乙乙 V x σσ= 甲 甲 甲 V x σσ= 乙乙乙 根据V σ甲 、V σ乙 大小判断,数值越大,代表性越小。 甲品种 乙品种 田块面积(亩) 产量(公斤) 田块面积(亩) 产量(公斤) 1.2 0.8 1.5 1.3 600 405 725 700 1.0 1.3 0.7 1.5 500 675 375 700 4.8 2430 4.5 2250 假定生产条件相同,试研究这两个品种的收获率,确定那一个品种具有稳定性和推广价值。 2、(1) 收获率(平均亩产) 2430 528.254.8 x = ==甲总产量总面积 2250 5004.5 x = =乙 (2) 稳定性推广价值(求变异指标) 2 2 2 2 600405725700506 1.25060.8506 1.5506 1.31.20.8 1.5 1.34.8 σ???????? -?+-?+-?+-? ? ? ? ?? ???????=甲

2 2 2 2 500675375700500 1.0500 1.35000.7500 1.51.0 1.30.7 1.54.5 σ???????? -?+-?+-?+-? ? ? ? ?? ???????=乙 求V σ甲 、V σ乙 ,据此判断。 8.某地20个商店,1994年第四季度的统计资料如下表4-6。 表4-6 按商品销售计划完成情 况分组(%) 商店 数目 实际商品销售额 (万元) 流通费用率 (%) 80-90 90-100 100-110 110-120 3 4 8 5 45.9 68.4 34.4 94.3 14.8 13.2 12.0 11.0 试计算 (1)该地20个商店平均完成销售计划指标 (2)该地20个商店总的流通费用率 (提示:流通费用率=流通费用/实际销售额) 8、(1) () 101%1 % f f x = = =?∑∑ 20实际销售额计划销售额 实际销售额 计划完成 (2) 据提示计算:2012.7%x = 品 种 价格 (元/公斤) 销售额(万元) 甲市场 乙市场 甲 乙 丙 0.30 0.32 0.36 75.0 40.0 45.0 37.5 80.0 45.0 13、提示:= 销售额 平均价格销售量 企业序号 计划产量(件) 计划完成程度(%) 实际一级品率 (%) 1 2 3 4 5 350 500 450 400 470 102 105 110 97 100 98 96 90 85 91

应用统计学试题及答案

北京工业大学经济与管理学院2007-2008年度 第一学期期末应用统计学 主考教师 专业:学号:姓名:成绩: 1 C 2 B 3 A 4 C 5 B 6 B 7 A 8 A 9 C 10 C 一.单选题(每题2分,共20分) 1.在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设 备 2.一组数据的均值为20, 离散系数为, 则该组数据的标准差为 A 50 B 8 C D 4 3.某连续变量数列,其末组为“500以上”。又知其邻组的组中值为480,则末组的组中值为

A 520 B 510 C 530 D 540 4. 已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为 A .5%×7%×9% B. 105%×107%×109% C .(105%×107%×109%)-1 D. 1%109%107%1053- 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分比为 A. –5% B. –% C. –% D. % 6.对不同年份的产品成本配合的直线方程为x y 75.1280? -=, 回归系数b= -表示 A. 时间每增加一个单位,产品成本平均增加个单位 B. 时间每增加一个单位,产品成本平均下降个单位 C. 产品成本每变动一个单位,平均需要年时间 D. 时间每减少一个单位,产品成本平均下降个单位 7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600 公

斤,其余亩产为500 公斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间:x=70件,σ=件乙车间: x=90件, σ=件哪个车间日加工零件的离散程度较大: A甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间 A. 相关程度很低 B.不存在任何

(完整版)统计学复习题答案

一、主要术语 描述统计 ....:研究数据收集、处理和描述的统计学分支。 推断统计 ....:研究如何利用样本数据来推断总体特征的统计学分支。 观测数据 ....:在没有对事物进行人为控制的条件下,通过调查或观测而收集到的数据。 实验数据 ....:在实验中控制实验对象而收集到的数据。 异众比率 ....:非众数组的频数占总频数的比率。 四分位差 ....:也称为内距或四分间距,上四分位数与下四分位数之差. 。 显著性水平 .....:假设检验中发生第Ⅰ类错误的概率,记为 P-.值.:也称观察到的显著性水平或实测显著性水平,是根据样本观测值计算出来的概率。 拟合优度检验 ......:根据样本观测结果与原假设为真条件下期望结果的吻合程度,来检验总体是否服从某种分布。一般地,可以用于任何假设的概率分布。 独立性检验 .....:检验两个分类变量之间是否存在相关关系。 多个总体比例差异检验 ..........:检验多个总体比例是否都相等。 消费者物价指数 .......:又称居民消费价格指数,反映一定时期内城乡居民所购买的生活消费品价格和服务项目价格的变动程度的一种相对数。 生产者价格指数 .......:反映企业产品出厂价格变动趋势和变动程度的一种相对数。 股票价格指数 ......:是反映某一股票市场上多种股票价格变动趋势的一种相对 二.简答和计算P41—P42: 2.2比较概率抽样和非概率抽样的特点。举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。 概率抽样的特点:简单随机抽样、系统抽样(等距抽样)、分层抽样(类型抽样)和整群抽样。非概率抽样的特点:方便抽样、定额抽样、立意抽样、滚雪球抽样和空间抽样。 2.6你认为应当如何控制调查中的回答误差? 回答误差是指被调查者接受调查时给出的答案与实际不符。导致回答误差的原因有多种,主要有理解误差、记忆误差及意识误差。 调查一方在调查时可协助被调查者一方共同完成调查,被调查方不了解的调查方可帮助解释、阐明,这样可减少误差。 2.7怎样减少无回答?请通过一个例子,说明你所考虑到的减少无回答的具体措施。 可通过优选与培训采访人员、加强调查队伍管理、准确定位调查对象、保证问卷的送达率等加以预防,采取物质奖励、消除疑虑、提前告知和事中提醒等加以控制,采用多次访问、替换被调查单位、随机化回答技术等方法来降低无回答率。 2.8如何设计调查方案? 第一步:确定调查目的 第二步:确定调查对象和调查单位 第三步:确定调查项目和调查表 第四步:调查表格和问卷的设计 第五步:确定调查时间和调查方法等

统计学计算题(有答案)

1、甲乙两班同时参加《统计学原理》课程的测试,甲班平均成绩为81分,标准差为9.5分,乙 班的成绩分组资料如下: 按成绩分组学生人数(人) 60以下 4 60~70 10 70~80 25 80~90 14 90~100 2 计算乙班学生的平均成绩,并比较甲乙两班,哪个班的平均成绩更有代表性? 2、某车间有甲乙两个生产组,甲组平均每个人的日产量为36件,标准差为9.6件,乙组工人产 量资料如下: 日产量(件)工人数(人) 15 15 25 38 35 34 45 13 要求:(1)计算乙组平均每个工人的日产量和标准差 (2)比较甲乙两生产小组的日产量更有代表性 3 月份 1 2 3 4 5 6 8 11 12

库存额60 55 48 43 40 50 45 60 68 又知1月1日商品库存额为63万元,试计算上半年,下半年和全年的平均商品库存额。 4 品名单位销售额2002比2001销售量增长(%) 2001 2002 电视台5000 8880 23 自行车辆4500 4200 -7 合计9500 13080 (2)计算由于销售量变动消费者增加或减少的支出金额 5、某商店两种商品的销售额和销售价格的变化情况如下:(万元) 商品单位销售额1996比1995年销售价格提高(%) 1995 1996 甲米120 130 10 乙件40 36 12 要求:(1)计算两件商品销售价格总指标和由于价格变动对销售额的影响绝对值(2)计算销售量总指数,计算由于销售变动消费者增加或减少的支出金额

6、某企业上半年产品量和单位成本资料如下: 要求:(1)计算相关系数, 说明两个变量相关的密切程度 (2)配合回归方程,指出产量每增加1000件时,单位成本平均变动多少? 月份 产量(千克) 单位成本(元) 1 2 73 2 3 72 3 4 71 4 3 73 5 4 69 6 5 68

统计学计算题及答案

1002 1050 1 ■ 1050 1020 汇2 = 1032 (人) 上半年平均人数: 1002 1050 1 1050 1020 2 1020 1008 3 二 1023 计算题 1 .某公司某年9月末有职工250人,10月上旬的人数变动情况是:10月4日新招 聘12名大学生上岗,6日有4名老职工退休离岗,8日有3名青年工人应征入伍, 同日又有3名职 工辞职离 岗,9日招聘7名营销人员上岗。试计算该公司 10月上旬的平均在岗人数。 af 250 3 262 2 258 2 252 1 259 2 答案1 . a 256 送 f 3+2+2+1+2 要求:⑴具体说明这个时间序列属于哪一种时间序列。 (2)分别计算该银行2001年第一季度、第二季度和上半年的平均现金库存额。 1)这是个等间隔的时点序列 (答案: 3° - a , - a 2,a 3 亠,亠 a n 」-3n 2 - 2 n 第一季度的平均现金库存额: 500 520 + 480 +450 + 2 2 3 第二季度的平均现金库存额: 二480 (万元) 500 580 550 600 2 2 3 上半年的平均现金库存额: = 566 .67(万元) 500 580 + 480 + …+550 +600 + 2 -------------------------------------------- J 二 52 3 .33,或 = 480 566.67 = 523.33 6 答:该银行2001年第一季度平均现金库存额为 480万元,第二季度平均现金库存额为 566.67 万元,上半年的平均现金库存额为 523.33万元. 3某单位上半年职工人数统计资料如下: 要求计算:①第一季度平均人数;②上半年平均人数 答案:第一季度平均人数 2 12 3

统计学计算题答案(课后)

9. (1)工人日产量平均数: 45 60 55 140 65 260 75 150 85 50 660 =64.85(件 / 人) (2)通过观察得知,日产量的工人数最多为 260人,对应的分组为 60~70,则众数在60~70这一组中,则众数的取值范围在 60~70 之间。 利用下限公式计算众数: n x f i i i 1 n f i i 1 众数M ° (f m f m 1 )

=65.22 (件) (3)首先进行向上累计,计算出各组的累计频数: 10.(1)全距 只=最大的标志值一最小的标志值 =95—55=40 x f ⑵平均日装配部件数x ―」 55 4 65 12 75 24 85 6 95 4 50 =73.8 (个) n _ X i x f i i 1 n 260 140 (260 140 (260 15C) (70 60) 660 1 2 330.5 比较各组的累计频数和 330.5,确定中位数在60~70这一组 利用下限公式计算中位数: ~~2- S m 1 M e L 壬 60 660 200 2 (70 60) 65(件) 260 ⑷分析:由于x M e M o , 所以该数列的分布状态为左偏。 平均差 A.D

f i i 1 |55 73.8 4 |65 73.8| 12 |75 73.8| 24 |85 73.8 6 |95 73.8 4 4 12 24 6 4 =7.232 (件)

⑷标准差系数V -100% x 9.93 73.8 13.46% X i f i 30 4 50 25 70 84 90 126 110 28 267 =81.16 (件) 乙企业的平均日产量X 乙 xf j 30 2 50 8 70 30 90 42 110 18 2 (X i X) f i i 1 n f i i 1 2 2 2 2 2 (55 73.8) 4 (65 73.8) 12 (75 73.8) 24 (85 73.8) 6 (95 73.8) 4 ⑶方差 4 12 24 6 4 =98.56 (个) 标准差 n (x x)2 f i i 1 n 、、98.56 9.93(件) 13. 甲企业的平均日产量x 甲

相关主题
文本预览
相关文档 最新文档