当前位置:文档之家› 心理学统计方差分析

心理学统计方差分析

心理学统计方差分析
心理学统计方差分析

近来关于随机区组和被试内实验设计以及对应的方差分析的问题,多人追问不止。既自觉已思路清晰、天下无敌。特本着一半自己再梳理一下,一半友好互助的形式小写个群邮件,充个英勇,让大家也分享下。定是不足与不当多多,盼批评指正。

相信把这个东西认真看完,思路不清晰的童鞋马上也会思路清晰起来。

看似很复杂,实际上我尽全力做到深入浅出,因此,相信只要是地球人都可以看得懂。

一、随机区组的被试分配:

a1 a2

区组 b1 b2 b1 b2

1 1 4 7 10

2 2 5 8 11

3 3 6 9 12

数据刻意简单化,不合理没有关系。

是个2*2随机区组设计,3个区组。

如何分配被试?首先,随机区组的每个区组的被试应该是有差异的,否则就不需要分区组了,直接完全随机就可以了。

因此随机区组的前提是:区组间异质,而区组内的被试尽可能同质。

被试有以下几个情况:

第一分配方式:假设该实验的被试总个数为24个,每个区组的被试为8个。他可以有两种分配方式

1、将每组中的任意每2个被试随机接受一种处理,2*4=8

2、8人同时接受所有的处理,1*8=8

需要注意的三个问题:

1、一般都用第一种情况,第二种不用,因为区组内的这8个人本来就是理论上的同质的,所以只要把他们分开,随机接受不同的处理就能说明问题,这样可以省时,省钱,还能避免每个人由于重复测量导致的额外变量的增加。

2、它强调了区组内的被试随机接受不同的实验处理,也因此叫随机区组。

3、它要求每个区组的被试单位应该是实验处理水平的整数倍。如8/4=2

第二种分配方式:假设该实验的被试一共是3个,就是说,一个被试为一个区组。那么每个区组的这个被试全部接受实验的4个不同水平的处理。这个时候就需要平衡实验的顺序,防止一个人不短的被实验而出现的顺序效应,如何平衡,一般用“ABBA”或所谓的“拉丁方”。

第三种分配方式:当一个大团体(如学校)为一个区组的时候,而大团体中又有小团体的时候(如学校中的班级),通常让一个小团体接受一种处理。例如:ABC分别是不同的三个学校,他们各自为一个区组,那么A学校是区组一,A学校就要抽四个班级出来,每个班级随机接受一种实验处理。

注意:传统的观点认为上述“第二种方式”----一个被试为一个区组的情况不叫区组,叫被试内设计,就是因为每个被试都接受了不同的实验处理,因此没有随机可言。其具体的方差分析和随机区组的方差分析也有所差别。表现在SS残差的是否细分。具体往下看。

二、随机区组的方差分析

还是那个例子:

a1 a2

b1 b2 b1 b2

区组处理1 处理2 处理3 处理4

1 1 4 7 10

2 2 5 8 11

3 3 6 9 12

假定研究某种药物对某种操作的影响

自变量A(药物)有两个水平,药物分别是0单元和2单元

自变量B(实验环境)有两个水平,环境1和环境2。

分别取三个不同层次的个体,分别是:少年、青年、老年。

数据刻意简单化,不合理没有关系。

是个2*2随机区组设计

区组的个数n=3

a因素的处理水P=2

b因素的处理水平q=2

所有的处理水平p*q=4

所有的被试单位=N =npq =3*2*2=12

为了本质化,特意把所有的无聊的SS后面的字母统统去掉,用汉字表达

平方和的分解:

SS总=SS处理间+SS区组+SS残差

1、SS总=整个实验的每个具体测量值和整个实验的总平均数差的平方再求和。

即:SS总=∑(X-μ)^2(μ=总平均数,X=各原始测量值)

2、“SS处理间”是什么意思?

例子一共有4种处理,因此,SS处理间=4种处理中,n倍的“每一种处理的平均值与整个实验总平均值差的平方再求和”。

即:SS处理间=n*[∑(各种处理平均值-μ)^2](μ=总平均数)

3、“SS区组”是什么意思?

例子一共有3个区组,因此,SS区组=3个区组中,pq倍的“每一个区组的平均值与整个实验总平均值差的平方再求和”。

即:SS区组=pq*[∑(各区组平均值-μ)^2](μ=总平均数)

如何具体求SS总、SS处理间、SS区组?

1、求SS总:

因为SS总=∑(X-μ)^2(μ=总平均数,X=各原始测量值)

又因为整个实验的总平均数=6.5

因此SS总=∑(X-μ)^2=(1-6.5)^2+(2-6.5)^2+(3-6.5)^2+……+(12-6.5)^2 (μ=总平均数,X=各原始测量值)

2、求SS处理间:

因为SS处理间= n*[∑(各种处理平均值-μ)^2](μ=总平均数,X=各原始测量值)

又因为处理1的平均值是2;处理2的平均值是5;处理3是8,处理4的是11。

因此SS处理间= n*[∑(各种处理平均值-μ)^2]=3*[(2-6.5)^2+(5-6.5)^2+(8-6.5)^2+(11-6.5)^2]

3、求SS区组:

因为SS区组= pq*[∑(各区组平均值-μ)^2](μ=总平均数,X=各原始测量值)

又因为区组一的平均值是5.5,区组二的平均值是6.5,区组三的平均值是7.5。

因此SS区组= pq*[∑(各区组平均值-μ)^2]=4*[(5.5-6.5)^2+(6.5-6.5)^2+(7.5-6.5)^2]

4、求SS残差:

直接用SS残差= SS总-SS处理间-SS区组

但是实际中,计算一般不用先求对应的平均数,而是直接用原始数据。

根据数学转化,可以得出以下等式:(数学转换过程不需要管)

1、SS总=∑(X-μ)^2=∑X^2-[(∑X) ^2]/npq(μ=总平均数,X=各原始测量值)

2、SS处理间= n*[∑(各种处理平均值-μ)^2]=∑[(各种处理的总值^2)/n]-[(∑X) ^2]/npq(X=各原始测量值)

3、SS区组= pq*[∑(各区组平均值-μ)^2]=∑[(各区组的总值^2)/pq]-[(∑X) ^2]/npq(X=各原始测量值)

所以可以用原始数据这么计算:

1、SS总=∑(X-μ)^2=∑X^2-[(∑X) ^2]/npq=1^2+2^2+3^2+......+12^2-[(1+2+3+ (12)

^2]/12

2、因为处理1的总水平=1+2+3=6;处理2的总水平=4+5+6=15;处理3的总水平=7+8+9=24;处理4的总水平=10+11+12=33

所以SS处理间=∑[(各种处理的总水平^2)/n]-[(∑X) ^2]/npq=(6^2)/3+(15^2)/3+(24^2)/3+(33^2)/3-[(1+2+3+……+12)^2]/12

3、因为区组1的总水平=1+4+7+10=22,区组2的总水平=2+5+8+11=26,区组3的总水平=3+6+9+12=30

所以SS区组=∑[(各区组的总水平^2)/pq]-[(∑X) ^2]/npq=(22^2)/4+(26^2)/4+(30^2)/4-[(1+2+3+……+12)^2]/12

通过上述的分析,我们可以得到SS总、SS处理间、SS区组,自然“SS残差”也就得出来了。

因此,这个时候就可以通过“SS区组/ df区组”来计算出“MS区组”,同时通过“SS残差/df残差”可以计算出“MS残差”。

在这里插个问题:

“df总”指总自由度,它等于所有被试单位-1,即npq-1=3*2*2-1=11

df区组等于多少?它等于区组数-1,即n-1=3-1

df处理间等于多少?它等于处理水平-1,即pq-1=2*2-1=3

df残差自然就等于(n-1)(pq-1)

df总=df区组+df处理间+df残差

再回到问题:

将“MS区组”除以“MS残差”,就可以得到F值,再与对应的F(0.05)以及F(0.01)比较。若F大于F(0.05),则说明在0.05的水平上,可以得到差异显著结论。

请注意,到底是什么差异是否显著?

在这里,计算的是MS区组/ MS残差,因此,它所描述的统计结论是:该实验的三个区组的水平是否差异。具体的说,某种药物对某种操作的影响在少年、成年、老年这三个区组上的结果是差异显著的。或者说不同年龄段的人不管药物水平和环境如何,结果都是差异显著的。

同样,我们也可以通过“SS处理间/ df处理间”来计算出“MS处理间”,将“MS处理间”除以“MS 残差”,就可以得到F值,再与对应的F(0.05)以及F(0.01)比较。得出是否显著显著。

请您集中全身注意,惊险时刻!!!在这里,通过计算“MS处理间/MS残差”检验的是什么差异是否显著?

实验要检验的是在A因素上实验的结果是否差异显著、B因素上实验的结果是否差异显著、在AB因素交互作用下结果差异是否显著。而按照“MS处理间/MS残差”检验的时候只能检验出实验中4个处理水平是否差异显著。每个水平既有A因素,又有B因素。因此,在多因素实验设计的时候,必须对SS处理间进行平方和的再分解,分解出A、B以及AB交互的平方和:SSA、SSB以及SSAB之后,再利用SSA/dfA、SSB/dfB以及SSAB/dfAB求出对应的MSA、MSB以及MSAB才能具体检验。

如何分解?如何计算SSA、SSB以及SSAB以及对应的dfA、dfB以及dfAB?

先等等,到这里插个问题题:

如果我们把题目改成:

区组处理1 处理2 处理3 处理4

1 1 4 7 10

2 2 5 8 11

3 3 6 9 12

比较一下,把两个AB因素去掉了,直接说成是一个自变量的4种处理,实质上的方差分析是一模一样的。

自变量(药物)有4个处理水平,药物分别是0单元、2单元、4单元、8单元(几个单元不管,只是区分水平)

分别取三个不同层次的个体,分别是:少年、青年、老年。

这就是个单因素随机区组设计

区组的个数n=3

处理水平k=4

所有的被试单位=N =nK=3*4=12

方差分析要分析出:区组差异是否显著,以及处理间差异是否显著。

同样:

SS总=SS区组+SS处理间+SS残差

如何计算?方法跟上面一模一样,只是这里的K等于原来的pq

因此字母换一下而已:

1、SS总=∑(X-μ)^2=∑X^2-[(∑X) ^2]/nk=1^2+2^2+3^2+……+12^2-[(1+2+3+……+12)^2]/12

2、SS处理间=∑[(各种处理的总值^2)/n]-[(∑X) ^2]/nk=(6^2)/3+(15^2)/3+(24^2)/3+(33^2)/3-[(1+2+3+……+12)^2]/12

3、SS区组=∑[(各区组的总值^2)/k]-[(∑X) ^2]/nk=(22^2)/4+(26^2)/4+(30^2)/4-[(1+2+3+……+12)^2]/12

同时:

df总=nk-1=3*2*2-1=11

df区组=n-1=3-1

df处理间=k-1=2*2-1=3

df残差=(n-1)(k-1)

df总=df区组+df处理间+df残差

这个时候,用“MS区组/ MS残差”检验描述的统计结论还是:某种药物对某种操作的影响在少年、成年、老年这三个区组上的结果是差异显著的。

而用“MS处理间/MS残差”检验描述得统计结论自然变得“理所当然”:某种药物不同水平对某钟操作的影响是差异显著的。

因此,以上借两因素的随机区组实验的方差分析实际上讲的是单因素的随机区组方差分析。

灰常正经的:这就是单因素随机区组实验的方差分析!

这也说明方差分析的本质是一样的。

而实际的两因素的方差分析才进行到一半。

继续两因素的方差分析,以上已经计算出SS总、SS处理间、SS区组以及SS残差,和对应的自由度,同时完成了区组的检验,即MS区组/MS残差。而SS处理间还要进一步分解。

分解:SS处理间=SSA+SSB+SSAB

因此:SS总=SS区组+SS残差+SSA+SSB+SSAB

1、SSA=在A因素中,nq倍的“每一种水平对应的具体测量值和这个水平的平均值的差的平方再求和”。

即:SSA=np*[∑(A因素各水平的平均值-A因素平均值)^2](A因素的平均值实际上就是总平均值)

因为A因素水平1的平均数是=(1+2+3+4+5+6)/6=3.5,

水平2的平均值=(7+8+9+10+11+12)/6=57=9.5,

总平均值=6.5

nq=6

因此SSA=6*(3.5-6.5)^2+(9.5-6.5)^2

也可以用数学方法转换成原始数据计算的公式:

SSA=∑[(A因素各种水平的总值^2)/nq]-[(∑X) ^2]/npq

因为A因素水平1的总值=1+2+3+4+5+6=21,A因素水平2的总值=7+8+9+10+11+12=57 因此SSA= [(21^2)/6+(57^2)/6]-[(1+2+3+……+12)^2]/12

2、SSB=在B因素中,np倍的“每一种处理水平对应的具体测量值和这个水平的平均值的差的平方再求和”。

即:SSB=np*[∑(B因素各水平的平均值-B因素平均值)^2](B因素的平均值实际上也就是总平均值)

因为B因素水平1的平均数是=(1+2+3+7+8+9)/6=5,

水平2的平均值=(4+5+6+10+11+12)/6=8,

总平均值=6.5

nq=6

因此SSB=6*(5-6.5)^2+(8-6.5)^2

也可以用数学方法转换成原始数据计算的公式:

SSB=∑[(B因素各种水平的总值^2)/np]-[(∑X) ^2]/npq

因为B因素水平1的总值=1+2+3+7+8+9=30,B因素水平2的总值=4+5+6+10+11+12=48

因此SSB= [(30^2)/6+(48^2)/6]-[(1+2+3+……+12)^2]/12

3、求SSAB=SS处理间-SSA-SSB

同时:dfA=p-1

dfB=q-1

dfAB=(p-1)(q-1)

df处理间=dfA+dfB+dfAB

df总=df区组+df处理间+df残差=df区组+df残差+dfA+dfB+dfAB

因此SS总=SS区组+SS残差+SSA+SSB+SSAB中的任何值都求出来了,同时也知道了各自的自由度df,就可以求任意的均方(MS),通过和残差均方的对比,来构建F检验,从而判断各种因素或区组是否差异显著。

需要说明的是:AB的交互作用是非常重要的,如果检验AB的交互作用是不显著的,那么检验AB因素各自的主效应就很重要;如果AB的交互作用很显著,那么对AB因素各自主效应的检验的意义就不大。

此外,很多时候,在检验A因素和B因素的时候会发现一个问题,那就是,是否可以把AB 因素各自的主效应再细分,例如,是否可以检验A因素在B1和B2哪个水平上更显著?或者B因素在A1和A2哪个水平上更显著?

1、如何检验A因素在B1和B2哪个水平上更显著?(仅限2*2设计时)

将SSA+SSAB=SSAB1+SSAB2

求SSAB1=(A1B1水平上的和的平方+ A2B1水平上的和的平方)/n-(A1B1水平上的和+A2B1水平上的和)^2/qn

=[(1+2+3)^2+(7+8+9)^2]/3-(1+2+3+7+8+9)^2/6

求SSAB2=(A1B2水平上的和的平方+ A2B2水平上的和的平方)/n-(A1B2水平上的和+A2B2水平上的和)^2/qn

=[(4+5+6)^2+(10+11+12)^2]/3-(4+5+6+10+11+12)^2/6

将求得的SSAB1、SSAB2分别求MSAB1和MSAB2,并分别除以MS残差。并检验结论。

2、如何检验B因素在A1和A2哪个水平上更显著?(仅限2*2设计时)

同理将SSB+SSA=SSA1B+SSA2B

求SSA1B=(A1B1水平上的和的平方+ A1B2水平上的和的平方)/n-(A1B1水平上的和+A1B2水平上的和)^2/pn

求SSA2B=(A2B1水平上的和的平方+ A2B2水平上的和的平方)/n-(A2B1水平上的和+A2B2水平上的和)^2/pn

同时:dfAB1=dfAB2=dfA1B=dfA2B=1

三、被试内设计方差分析

还是那个例子:

a1 a2

b1 b2 b1 b2

区组处理1 处理2 处理3 处理4

1 1 4 7 10

2 2 5 8 11

3 3 6 9 12

如果这个时候把“区组”俩字改成“被试”,意味着该实验有3名被试,每一名被试均接受4种不同的处理。

那么就成了一个被试内实验。

(一)单因素时

被试处理1 处理2 处理3 处理4

1 1 4 7 10

2 2 5 8 11

3 3 6 9 12

被试的个数n=3

自变量的水平K=4

所有的被试单位=N =nk =3*4=12

原来的平方和分析是:SS总=SS区组+SS处理间+SS残差

因此相应的也就改成:SS总=SS被试间+SS处理间+SS残差

(SS处理间+SS残差=SS被试内,这个没有任何意义,知道下就可以了)

进行对应的方差分析:(和原来一模一样,就把原来的区组统统改成被试间)

方差分析要分析出:被试间差异是否显著,以及处理间差异是否显著。

1、SS总=∑(X-μ)^2=∑X^2-[(∑X) ^2]/nk=1^2+2^2+3^2+……+12^2-[(1+2+3+……+12)^2]/12

2、SS处理间=∑[(各种处理的总值^2)/n]-[(∑X) ^2]/nk=(6^2)/3+(15^2)/3+(24^2)/3+(33^2)/3-[(1+2+3+……+12)^2]/12

3、SS区组=∑[(各个被试的侧量总值^2)/k]-[(∑X) ^2]/nk=(22^2)/4+(26^2)/4+(30^2)/4-[(1+2+3+……+12)^2]/12

同时:

df总=nk-1=3*2*2-1=11

df被试间=n-1=3-1

df处理间=k-1=2*2-1=3

df残差=(n-1)(k-1)

df总=df被试间+df处理间+df残差

再算

MS被试间/ MS残差

MS处理间/MS残差

(二)两因素时

a1 a2

b1 b2 b1 b2

被试处理1 处理2 处理3 处理4

1 1 4 7 10

2 2 5 8 11

3 3 6 9 12

被试的个数n=3

a因素的处理水P=2

b因素的处理水平q=2

所有的处理水平p*q=4

所有的被试单位=N =npq =3*2*2=12

原来的平方和分析是:SS总=SS区组+SS残差+SSA+SSB+SSAB 因此相应的也就改成:SS总=SS被试间+SS残差+SSA+SSB+SSAB

其中,SS总、SS被试间、SSA、SSB、SSAB的计算方法和随机区组一模一样,就是把字改一下:

1、SS总=∑(X-μ)^2=∑X^2-[(∑X) ^2]/npq=1^2+2^2+3^2+......+12^2-[(1+2+3+ (12)

^2]/12

2、SS处理间=∑[(各种处理的总水平^2)/n]-[(∑X) ^2]/npq=(6^2)/3+(15^2)/3+(24^2)/3+(33^2)/3-[(1+2+3+……+12)^2]/12

3、SS被试间=∑[(各被试间的总水平^2)/pq]-[(∑X) ^2]/npq=(22^2)/4+(26^2)/4+(30^2)/4-[(1+2+3+……+12)^2]/12

4、SS残差= SS总-SS处理间-SS被试间

5、SSA=∑[(A因素各种水平的总值^2)/nq]-[(∑X) ^2]/npq

= [(21^2)/6+(57^2)/6]-[(1+2+3+……+12)^2]/12

6、SSB=∑[(B因素各种水平的总值^2)/np]-[(∑X) ^2]/npq

= [(30^2)/6+(48^2)/6]-[(1+2+3+……+12)^2]/12

7、求SSAB=SS处理间-SSA-SSB

同时:

1、df总=npq-1=3*2*2-1=11

2、df被试间n-1=3-1

3、df处理间=pq-1=2*2-1=3

4、df残差=(n-1)(pq-1)

5、dfA=p-1

6、dfB=q-1

7、dfAB=(p-1)(q-1)

8、df总=df被试间+df处理间+df残差=df被试间+df残差+dfA+dfB+dfAB

注意:从这里开始,就不一样了~

传统的心理统计认为:在进行被试内设计的方差分析的时候,需要把SS残差细分,尽管张版统计认为一个被试可以当成一个区组,因此直接利用总的残差计算。但是貌似主流的观点还是将SS残差进行一个划分,因此,那就分吧~

SS残差=SSA*被试间+SSB*被试间+SSAB*被试间

因此在最后计算完MSA、MSB、以及MSAB之后,不能将他们分别直接除以SS残差。

而是要对应的除以:SSA*被试间、SSB*被试间、SSAB*被试间

即:F=MSA/ MSA*被试间

F=MSB/ MSB*被试间

F=MSAB/MAB*被试间

最后比较他们和F(0.05)以及F(0.01)的关系,进而作出结论。

据说这样细分的结果更科学、更合理、更敏感、更·#¥%……

那么如何算SSA*被试间、SSB*被试间、SSAB*被试间以及对应的自由度?

(灰常痛苦~)

1、SSA*被试间=∑[(A因素任意水平上每个被试两次处理结果的和^2)/q]-[(∑X) ^2]/npq-SSA-SS被试间

=[(1+4)^2+(2+5)^2+(3+6)^2+…+(9+12)^2]/2-[(∑X) ^2]/npq-SSA-SS 被试间

2、SSB*被试间=∑[(B因素任意水平上每个被试两次处理结果的和^2)/p]-[(∑X) ^2]/npq-SSB-SS被试间

=[(1+7)^2+(2+8)^2+(3+9)^2+…+(6+12)^2]/2-[(∑X) ^2]/npq-SSB-SS 被试间

3、SSAB*被试间=SS残差-SSA*被试间-SSB*被试间

同时:

dfA*被试间=(p-1)(n-1)

dfB*被试间=(q-1)(n-1)

dfAB*被试间=(p-1)(q-1)(n-1)

df残差= dfA*被试间+ dfB*被试间+ dfAB*被试间

df总=df被试间+ dfA*被试间+ dfB*被试间+ dfAB*被试间+dfA+dfB+dfAB

终于结束了。

多因素只考两因素的,去年考过混合的,实际上混合的计算比这个简单。单因素的又太简单。所以个人认为今年考个区组或被试内的可能还是有的。

把这个弄懂,我相信再看完全随机或混合的时候,那太简单了。

同志们加油~

应用统计学习题:方差分析

第五章方差分析 序号:5-004 题型:名词解释题 章节:方差分析 题目:方差分析的任务 答案:①求参数μ、μj 、α 1、α 2 ……αm的估计值(参数估计) ②分析观测值的偏差 ③检验各水平效应α 1、α 2 ……αm(等价μ 1 、μ 2 ……μm)有无显著差异 难度:高 评分标准:每题2分,少一条扣去1分。 序号:5-002 题型: 判断题 章节:方差分析 题目:方差分析是一种比较总体方差差异的统计方法。() 答案:错误 难度:中 评分标准:1分 序号:5-003 题型:综合题 章节:方差分析 题目:设有三个车间以不同的工艺生产同一种产品,为考察不同工艺对产品产量的影响,现对每个车间各纪录5天的日产量,如表所示,问三个车间的日产量是否有显著差异? (取α=0.05)。 将最终的计算结果填入下表:

F >)12,2(05.0F 存在显著差异。 解:(1)计算各水平均值和总平均值,465 46 484745441=++++= X , 同理46,5232==X X ,483 46 5246=++=X (2’分) (2)计算总离差平方和S T ,组内平方和S E ,组间平方和S A 。 S T =(44-48)2+(46-48)2+……(45-48)2=172 (1’分) S A =Σ120)4846(5)4852(5)4846(5)(2222j =-+-?+-=-X X (1’分) S E =S T -S A =172-120=52(1’分) (3)计算方差 MS A = 601 3120 =- MS E = 33.43 1552 =-(1’分) (4)作F 检验 85.1333 .460 === E A MS MS F (1’分) 89.3)21,2(),1(05.02==--F m n m F (1’分) 难度:中 评分标准: 每题8分 序号:5-004 题型:综合题 章节:方差分析 题目: 有重复双因素方差分析,A 因素有3个水平,B 因素有3个水平,在A i 、B j 所有可能组合条件下,重复观测2次。试用观测值X ijk 、均值??i X 、??j X ……, i =1、2……n , j =1、2……m , k =1、2…… l 制表。并指定Excel 单元格对应。 有重复双因素方差分析数据表

卫生统计学生存分析

一、选择题 1.生存分析中的生存时间是指_____________。 A 手术至死亡的时间 B 观察开始到观察结束的时间 C 起始事件到终点事件间隔的时间 D 发病到痊愈的时间 E 出生到死亡的时间 2.食管癌患者术后随访资料进行生存分析,其中的删失值可以是_____________。 A 患者失访 B 患者死于车祸 C 患者死于其它肿瘤 D 观察期结束仍存活 E 以上都是 3.生存分析中的结果变量是_____________。 A 生存时间 B 是否删失 C 生存率D生存时间与随访结局 E 生存时间与生存率 4.关于生存概率与生存率,叙述正确的是_____________。 A 生存率不会随时间增加B生存概率随时间增加而加大 C生存概率一定大于生存率D生存概率一定小于生存率 E 生存概率一定等于生存率 5.关于生存曲线正确的描述是_____________。 A 纵坐标为生存概率 B 此曲线是严格下降的 C 曲线平缓,表示预后较好 D 横坐标中点为中位生存期 E 寿命表法生存曲线呈阶梯型 6.Cox模型要求数据满足的假设条件为_____________。 A 自变量服从正态分布 B 应变量为二项分类数据 C 各自变量满足方差齐性D变量满足比例风险假定 E 协变量为数值变量 二、简答题 1.Cox回归与logistic回归都可作临床研究中的预后分析,二者的主要区别何在?2.请简述Cox回归中回归系数与RR值的关系。

三、计算分析题 1.将符合手术治疗适应征的21例乳腺癌患者随机分为两组,一组10例接受手术治疗,另一组11例在术后同时接受化疗,其生存时间如表23-13。(1)试估计两种疗法的生存率及生存曲线。(2)比较两种疗法的生存率有无差别。 表21例乳腺癌患者两种疗法的生存时间(月) 手术组 6 9 13 15 18 19 19 20 22 24 手术+化疗组10 14 15 16+19 19 20 20+24 26 28 2.以下是女性心绞痛患者诊断后的生存数据,试用寿命表法估计其生存率并估计中位生存期。

13第十三章完全随机单因素方差分析-刘红云版心理统计教材课后习题

练习题 1.因组内被试之间的差异造成的变异是() (A)处理内变异 (B)偶然因素变异 (C)处理间变异 (D)实验误差变异 2.完全随机单因素方差分析中,F检验对应的分子的自由度为3,分母的自由度为16,则参加实验的被试数量和因素的水平分别是() (A)16 ,3 (B)17 ,4 (C)19 ,4 (D)20 ,4 3.对于单因素方差分析的处理内误差,下面说法正确的有()(多选) (A)反映了随机因素和系统因素的影响 (B)处理内误差一定小于组间误差 (C)其自由度为N—k(N为观测个数,k为组数) (D)反映了随机因素的影响 4.方差分析中,我们常常用到事后检验。请回答: (1)什么情况下需要进行事后检验? (2)如果只存在两个处理组,还需要进行事后检验么?为什么? (3)如果方差分析结果不显著,还需要进行事后检验么?为什么? 5.在一个实验中,有三个处理组,每个处理组有7名被试。如果采用Tukey的可靠显著差异法来进行事后检验,处理内均方MS处理内=15.75,在显著性水平为0.05的条件下,临界HSD的值为多少? (A)7.66 (B)5.42 (C)6.25 (D)8.12 6.下面是一个方差分析表,其中有一些空格。将表中的空格填完整,并回答下面的问题: 变异来源SS df MS F 处理间42.596 —10.649 — 处理内162.450 — 3.610 总体—— (1)这个实验的自变量有多少个水平? (2)假设每个处理组的人数相等,在每个处理组中多少被试? (3)如果显著性水平设定为0.05,那么F的临界值是多少?你能得出怎样的结论? (4)这个方差分析的测量效应是多少? (5)这个方差分析的效应值是多少?按照Cohen的标准,效应大小如何? 7.下面的数据来自于一个完全随机单因素实验,该实验有三种处理水平。如果采用方差分析的方法,在显著性水平为0.05的条件下,能否得出结论认为处理间存在显著差异? 处理1 处理2 处理3 1 5 10 N=12 3 5 6 G=60

心理学统计方差分析

近来关于随机区组和被试内实验设计以及对应的方差分析的问题,多人追问不止。既自觉已思路清晰、天下无敌。特本着一半自己再梳理一下,一半友好互助的形式小写个群邮件,充个英勇,让大家也分享下。定是不足与不当多多,盼批评指正。 相信把这个东西认真看完,思路不清晰的童鞋马上也会思路清晰起来。 看似很复杂,实际上我尽全力做到深入浅出,因此,相信只要是地球人都可以看得懂。 一、随机区组的被试分配: a1 a2 区组 b1 b2 b1 b2 1 1 4 7 10 2 2 5 8 11 3 3 6 9 12 数据刻意简单化,不合理没有关系。 是个2*2随机区组设计,3个区组。 如何分配被试?首先,随机区组的每个区组的被试应该是有差异的,否则就不需要分区组了,直接完全随机就可以了。 因此随机区组的前提是:区组间异质,而区组内的被试尽可能同质。 被试有以下几个情况: 第一分配方式:假设该实验的被试总个数为24个,每个区组的被试为8个。他可以有两种分配方式 1、将每组中的任意每2个被试随机接受一种处理,2*4=8 2、8人同时接受所有的处理,1*8=8 需要注意的三个问题: 1、一般都用第一种情况,第二种不用,因为区组内的这8个人本来就是理论上的同质的,所以只要把他们分开,随机接受不同的处理就能说明问题,这样可以省时,省钱,还能避免每个人由于重复测量导致的额外变量的增加。

2、它强调了区组内的被试随机接受不同的实验处理,也因此叫随机区组。 3、它要求每个区组的被试单位应该是实验处理水平的整数倍。如8/4=2 第二种分配方式:假设该实验的被试一共是3个,就是说,一个被试为一个区组。那么每个区组的这个被试全部接受实验的4个不同水平的处理。这个时候就需要平衡实验的顺序,防止一个人不短的被实验而出现的顺序效应,如何平衡,一般用“ABBA”或所谓的“拉丁方”。 第三种分配方式:当一个大团体(如学校)为一个区组的时候,而大团体中又有小团体的时候(如学校中的班级),通常让一个小团体接受一种处理。例如:ABC分别是不同的三个学校,他们各自为一个区组,那么A学校是区组一,A学校就要抽四个班级出来,每个班级随机接受一种实验处理。 注意:传统的观点认为上述“第二种方式”----一个被试为一个区组的情况不叫区组,叫被试内设计,就是因为每个被试都接受了不同的实验处理,因此没有随机可言。其具体的方差分析和随机区组的方差分析也有所差别。表现在SS残差的是否细分。具体往下看。 二、随机区组的方差分析 还是那个例子: a1 a2 b1 b2 b1 b2 区组处理1 处理2 处理3 处理4 1 1 4 7 10 2 2 5 8 11 3 3 6 9 12 假定研究某种药物对某种操作的影响 自变量A(药物)有两个水平,药物分别是0单元和2单元 自变量B(实验环境)有两个水平,环境1和环境2。 分别取三个不同层次的个体,分别是:少年、青年、老年。

东师《心理统计学》在线作业1

东北师范大学东师心理统计学在线作业1 一、单选题(共10 道试题,共30 分。) 1. 欲比较统一团体种不同观测值的离散程度,最合适的指标是 A. 全距 B. 方差 C. 四分互差 D. 变异系数 正确答案: 2. 比较不同性别员工的工作满意度有显著差异的结论是 A. 拒绝虚无假设 B. 接受虚无假设 C. 拒绝备择假设 D. 以上都不对 正确答案: 3. 在IQ测验中,获得130或以上的分数的概率为多少? A. 2.28% B. 2% C. 2.22% D. 3% 正确答案: 4. 某一事件在无限测量中所能得相对出现的次数是 A. 次数 B. 比率 C. 概率 D. 频率 正确答案: 5. 实验设计中要求严格遵照实验设计的基本原则,其目的是为了 A. 尽量减少或抵消非实验因素的干扰 B. 消除随机误差的影响 C. 便于进行实验 D. 便于统计处理 正确答案: 6. 有联系的两列变量可采用什么分布表 A. 相对次数分布表 B. 累加次数分布表

C. 双列次数分布表 D. 简单次数分布表 正确答案: 7. 若要考察18名中学生两种测验得分的相关,应采用下列哪种相关系数? A. 肯德尔和谐系数 B. 积差相关 C. 斯皮尔曼相关 D. 点二列相关 正确答案: 8. 若考察两变量的相关程度,其中一列变量为连续变量,另一列为二分变量,应使用 A. 积差相关 B. 点二列相关 C. 等级相关 D. 肯德尔和谐系数 正确答案: 9. 完全随机设计的组内的自由度dfw为 A. k(n-1) B. nk-1 C. k-1 D. n-k 正确答案: 10. 下列关于I型错误说法正确的是 A. 接受Ho时所犯的错误 B. 拒绝Ho时所犯的错误 C. 拒绝H1是所犯的错误 D. 以上说法均不对 正确答案: 心理统计学16秋在线作业1 二、多选题(共10 道试题,共30 分。) 1. 考察学生唱歌水平和心理健康的相关时,可用以下哪些相关方法研究 A. 皮尔逊极差相关 B. 斯皮尔曼等级相关 C. 肯德尔和谐系数 D. 点二列相关 E. 二列相关 正确答案:

方差分析结果报告格式

1被试的基本情况: 本研究共有260名被试,其中男性146人,女性114人,文科学生120人占整体的46%, 理科学生140人,占整体的54%。所有的被试均为大学二年级学生,年龄范围19-25岁,平均年龄为20.71岁,标准差为0.924。 (频率分布的结果报告格式) 2:根据RQ测得的被试的依恋类型结果:(见表1) 表1:被试的依恋类型(根据RQ测量的结果) (列联表的报告格式) 3:依恋类型的性别差异: 表2依恋类型的性别差异分析 依恋类型__________________ 合计 安全型轻视型倾注型害怕型 性别男生61 37 37 10 145 女生44 31 33 6 114 合计105 68 70 16 259 X检验结果表明,男女生的依恋类型没有显著性差异 (X (3)=0.812, p=0.847)。

3:心理健康水平的各因子得分情况 下表是根据SCL-90得到的总分,即各因子分的情况 表3 SCL-90各因子的得分情况 (t 检验结果的报告格式) t 检验结果表明,男女生在躯体化方面得分差异接近显著性 水平,t (258)=1.846, p=0.066. (相关分析结果的报告格式) 表5 SCL-90部分指标的相关系数(r, n=260) 躯体化 强迫症 人际敏感 抑郁 焦虑 敌对 躯体化 1 强迫症 ** .634 1 人际敏感 .581** ** .784 1 抑郁 .682** ** .711 ** .741 1 焦虑 .741** ** .694 ** .715 ** .811 1 敌对 ** .494 ** .492 ** .565 ** .531 ** .612 1

统计学教案习题05方差分析

第五章方差分析 一、教学大纲要求 (一)掌握内容 1.方差分析基本思想 (1)多组计量资料总变异的分解,组间变异和组内变异的概念。 (2)多组均数比较的检验假设与F值的意义。 (3)方差分析的应用条件。 2.常见实验设计资料的方差分析 (1)完全随机设计的单因素方差分析:适用的资料类型、总变异分解(包括自由度的分解)、方差分析的计算、方差分析表。 (2)随机区组设计资料的两因素方差分析:适用的资料类型、总变异分解(包括自由度的分解)、方差分析的计算、方差分析表。 (3)多个样本均数间的多重比较方法: LSD-t检验法;Dunnett-t检验法;SNK-q检验法。 (二)熟悉内容 多组资料的方差齐性检验、变量变换方法。 (三)了解内容 两因素析因设计方差分析、重复测量设计资料的方差分析。 二、教学内容精要 (一) 方差分析的基本思想 1.基本思想 方差分析(analysis of variance,ANOVA)的基本思想就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和(sum of squares of deviations from mean,SS)和自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如各组均数的变异SS组间可由处理因素的作用加以解释。通过各变异来源的均方与误差均方比值的大小,借助F分布作出统计推断,判断各因素对各组均数有无影响。 2.分析三种变异 (1)组间变异:各处理组均数之间不尽相同,这种变异叫做组间变异(variation among groups),组间变异反映

医学统计学SPSS生存分析实例

将生存时间按从小到大顺序排列如下: 表1 BCG治疗组生存情况 *死亡=1;删失=0

*死亡=1;删失=0 按上述二表将数据输入SPSS软件,其中数据编号为i,列(1)即时间为t,列(3)即生存结局为status,表1为group1,表2为group2。 选择Analyze中的Survival里的Kaplan-Meier分析,将Time,Status,Factor依次选定,option 和Compare Factor依次设定完成后,得到输出结果,结果分析如下: Survival Table中: 1为BCG治疗组患者生存率(Estimate)及其标准误(Std. Error)的计算结果。2为药物与BCG结合治疗组患者生存率(Estimate)及其标准误(Std. Error)的计算结果。 Overall Comparisons

Log Rank (Mantel-Cox) .057 1 .811 Breslow (Generalized Wilcoxon) .658 1 .417 Tarone-Ware .336 1 .562 Test of equality of survival distributions for the different levels of group. 两组生存率的log-rank 检验 H 0:两种疗法患者生存率相同 H 1:两种疗法患者的生存率不同 α =0.05 采用SPSS 软件对两组生存率进行检验,得到上面Overall Comparisons 表,其中第一行为LogRank 检验结果。即X 2=0.057,P=0.811。按α=0.05水准,不拒绝H 0,还不能认为用BCG 疗法和用药物与BCG 结合疗法治疗黑色素瘤患者的生存率有差别。 生存曲线如上图所示,其中生存时间为横轴,生存率为纵轴。

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe 法,SNK法等。 1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe 法,SNK法等。 1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。 ****需要注意的问题:

统计学教案习题05方差分析

统计学教案习题05方 差分析 -CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

第五章 方差分析 一、教学大纲要求 (一)掌握内容 1.方差分析基本思想 (1) 多组计量资料总变异的分解,组间变异和组内变异的概念。 (2) 多组均数比较的检验假设与F 值的意义。 (3) 方差分析的应用条件。 2.常见实验设计资料的方差分析 (1)完全随机设计的单因素方差分析:适用的资料类型、总变异分解(包括自由度的分解)、方差分析的计算、方差分析表。 (2)随机区组设计资料的两因素方差分析:适用的资料类型、总变异分解(包括自由度的分解)、方差分析的计算、方差分析表。 (3)多个样本均数间的多重比较方法: LSD-t 检验法;Dunnett-t 检验法;SNK-q 检验法。 (二)熟悉内容 多组资料的方差齐性检验、变量变换方法。 (三)了解内容 两因素析因设计方差分析、重复测量设计资料的方差分析。 二、教学内容精要 (一) 方差分析的基本思想 1. 基本思想 方差分析(analysis of variance ,ANOVA )的基本思想就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和(sum of squares of deviations from mean ,SS )和自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如各组均数的变异SS 组间可由处理因素的作用加以解释。通过各变异来源的均方与误差均方比值的大小,借助F 分布作出统计推断,判断各因素对各组均数有无影响。 2.分析三种变异 (1)组间变异:各处理组均数之间不尽相同,这种变异叫做组间变异(variation among groups ),组间变异反映了处理因素的作用(处理确有作用时 ),也包括了随机误差( 包括个体差异及测定误差 ), 其大小可用组间均方(MS 组间)表示,即 MS 组间= 组间组间ν/SS , 其中,SS 组间=21)(x x n k i i i -∑= , 组间ν=k -1为组间自由度。k 表示处理组数。 (2)组内变异:各处理组内部观察值之间不尽相同,这种变异叫做组内变异(variation within groups),组内变异反映了随机误差的作用,其大小可用组内均方 (组内MS ) 表示, 组内组内组内ν/SS MS = ,其中∑∑==?? ????-=k i n j i ij i x x SS 112)(组内 , k N -=组内ν,为组内均方自由度。

心理统计考试题和答案解析

2009—2010学年第二学期《教育与心理统计学》 期末考试试题A 注:t0.05/2(60)=2.00 Z0.05/2=1.96 一、单项选择题(本大题共15小题,每小题2分,共30分) 1.当我们按性别差异,将男性指定用数字“1”来代表,女性指定用数字“2”来代表,这里所得到的数据是( ) A.称名数据 B.顺序数据 C.等距数据 D.比率数据 2.比较不同单位资料的差异程度,可以采用的统计量是( ) A.差异系数 B.方差 C.全距 D.标准差 3..中数的优点是( ) A.不受极端值影响 B.灵敏 C.适于代数运算 D.全部数据都参与运算 4.一班32名学生的平均分为72.6,二班40人的平均分为80.2,三班36人的平均分为75,则三个班级总平均分为() A.75.93 B.76.21 C.80.2 D.73 5.用平面直角坐标系上点的散布图来表示两种事物之间的相关性及联系模式,这种统计图是()

A.散点图B.线形图C.条形图D.圆形图6.一组数据中任何两个相邻数据之比接近于常数,表示其集中量数应使用() A.算术平均数B.几何平均数C.中位数D.加权平均数7.随机现象中出现的各种可能的结果称为() A.随机事件B.必然事件C.独立事件D.不可能事件8.进行多个总体平均数差异显著性检验时,一般采用 () A.Z检验B.t检验C.χ2检验D.方差分析9.已知P(Z>1)=0.158,P(Z>1.96)=0.025,则P(1

《应用数理统计》吴翊李永乐第五章方差分析课后作业参考答案

第五章 方差分析 课后习题参考答案 5.1 下面给出了小白鼠在接种三种不同菌型伤寒杆菌后的存活日数: 设小白鼠存活日数服从方差相等的正态分布,试问三种菌型的平均存活日数有无显著差异?(01.0=α) 解:(1)手工计算解答过程 提出原假设:() 3,2,10:0==i H i μ 记 167.20812 11112 =???? ??-=∑∑∑∑====r i n j ij r i n j ij T i i X n X S 467.7011 2 11211=???? ??-???? ??=∑∑∑ ∑====r i n j ij r i n j ij i A i i X n X n S 7 .137=-=A T e S S S 当 H 成立时, ()() ()r n r F r n S r S F e A ----= ,1~/1/ 本题中r=3 经过计算,得方差分析表如下:

查表得 ()()35 .327,2,195.01==---F r n r F α且F=6.909>3.35,在95%的置信度下,拒绝原 假设,认为不同菌型伤寒杆菌对小白鼠的存活日数有显著影响。 (2)软件计算解答过程 组建效应检验 Depend ent Variable: 存活日数a 70.429235.215 6.903 .004 137.73727 5.101 208.167 29 方差来源菌型误差总和 平方和自由度 均值F 值P 值R Squared = .338 (Adjusted R Squared = .289) a. 从上表可以看出,菌种不同这个因素的检验统计量F 的观测值为6.903,对应的检验概率p 值为0.004,小于0.05,拒绝原假设,认为菌种之间的差异对小白鼠存活日数有显著影响。 5.2 现有某种型号的电池三批,他们分别是甲、乙、丙三个工厂生产的,为评论其质量,各随机抽取6只电池进行寿命试验,数据如下表所示: 工厂 寿命(小时) 甲 40 48 38 42 45 乙 26 34 30 28 32 丙 39 40 43 50 50 试在显著水平 0.05α=下,检验电池的平均寿命有无显著性差异?并求 121323,μμμμμμ---及的95%置信区间。这里假定第i 种电池的寿命 2i X (,)(1,2,3) i N i μσ=。 解:手工计算过程: 1.计算平方和 其检验假设为:H0:,H1:。 2.假设检验: 6 .615])394.44()3930()396.42[(*4)()(4 .216)3.28108.15(*4*))(1()(832 429.59*14*))(1()(2221 22 1 21 22 222=-+-+-=-=-==++=-==-===-==-=∑∑∑∑∑∑∑∑∑===r i i i i A r i i i r i i i i ij e ij T X X n X X S S n S n X X S s n ns X X S 0684 .170333 .188 .30712/4.2162/6.615)/()1/(===--= r n S r S F e A

方差分析习题与答案

统计学方差分析练习题与答案一、单项选择题 1.在方差分析中,()反映的是样本数据与其组平均值的差异 A 总离差 B 组间误差 C 抽样误差 D 组内误差 2.是() A 组内平方和 B 组间平方和 C 总离差平方和 D 因素B的离差平方和 3.是() A 组内平方和 B 组间平方和 C 总离差平方和 D 总方差 4.单因素方差分析中,计算F统计量,其分子与分母的自由度各为() A r,n B r-n,n-r C r-1.n-r D n-r,r-1 二、多项选择题 1.应用方差分析的前提条件是() A 各个总体报从正态分布 B 各个总体均值相等 C 各个总体具有相同的方差 D 各个总体均值不等 E 各个总体相互独立 2.若检验统计量F= 近似等于1,说明() A 组间方差中不包含系统因素的影响 B 组内方差中不包含系统因素的影响 C 组间方差中包含系统因素的影响 D 方差分析中应拒绝原假设 E方差分析中应接受原假设 3.对于单因素方差分析的组内误差,下面哪种说法是对的?() A 其自由度为r-1 B 反映的是随机因素的影响 C 反映的是随机因素和系统因素的影响 D 组内误差一定小于组间误差 E 其自由度为n-r 4.为研究溶液温度对液体植物的影响,将水温控制在三个水平上,则称这种方差分析是() A 单因素方差分析 B 双因素方差分析 C 三因素方差分析 D 单因素三水平方差分析 E 双因素三水平方差分析 三、填空题 1.方差分析的目的是检验因变量y与自变量x是否,而实现这个目的的手段是通过

的比较。 2.总变差平方和、组间变差平方和、组内变差平方和三者之间的关系是。3.方差分析中的因变量是,自变量可以是,也可以是。4.方差分析是通过对组间均值变异的分析研究判断多个是否相等的一种统计方法。 5.在试验设计中,把要考虑的那些可以控制的条件称为,把因素变化的多个等级状态称为。 6.在单因子方差分析中,计算F统计量的分子是方差,分母是方差。 7.在单因子方差分析中,分子的自由度是,分母的自由度是。 四、计算题 1.有三台机器生产规格相同的铝合金薄板,为检验三台机器生产薄板的厚度是否相同,随机从每台机器生产的薄板中各抽取了5个样品,测得结果如下: 机器1:0.236,0.238,0.248,0.245,0.243 机器2:0.257,0.253,0.255,0.254,0.261 机器3:0.258,0.264,0.259,0.267,0.262 问:三台机器生产薄板的厚度是否有显著差异? 2.养鸡场要检验四种饲料配方对小鸡增重是否相同,用每一种饲料分别喂养了6只同一品种同时孵出的小鸡,共饲养了8周,每只鸡增重数据如下:(克) 配方:370,420,450,490,500,450 配方:490,380,400,390,500,410 配方:330,340,400,380,470,360 配方:410,480,400,420,380,410 问:四种不同配方的饲料对小鸡增重是否相同? 3.今有某种型号的电池三批,它们分别为一厂、二厂、三厂三个工厂所生产的。为评比其质量,各随机抽取5只电池为样品,经试验测得其寿命(小时)如下: 一厂:40,48,38,42,45 二厂:26,34,30,28,32 三厂:39,40,43,50,50 试在显著性水平下检验电池的平均寿命有无显著的差异。 4.一个年级有三个小班,他们进行了一次数学考试。现从各个班级随机抽取了一些学生,记录其成绩如下: 1班:73,89,82,43,80,73,66,60,45,93,36,77 2班:88,78,48,91,51,85,74,56,77,31,78,62,76,96,80 3班:68,79,56,91,71,71,87,41,59,68,53,79,15

生存分析概念

“ 一、生存分析的概念: 将事件的结果和出现此结果所经历的时间结合起来分析的统计分析方法。 研究生存现象和响应时间数据及其统计规律的一门学科。 对一个或多个非负随机变量(生存时间)进行统计分析研究。 对生存时间进行分析和推断,研究生存时间和结局与众多影响因素间关系及其程度的统计 分析方法。 在综合考虑相关因素(内因和外因)的基础上,对涉及生物学、医学(临床、流行病)、工 程(可靠性)、保险精算学、公共卫生学、社会学和人口学(老龄问题、犯罪、婚姻)、经 济学(市场学)等领域中,与事件(死亡,疾病发生、发展和缓解,失效,状态持续)发 生的时间(也叫寿命、存活时间或失效时间,统称生存时间)有关的问题提供相关的统计 规律的分析与推断方法的学科。 二、生存时间”(Survival Time)的概念 生存时间也叫寿命、存活时间、失效时间等等。 医学:疾病发生时间、治疗后疾病复发时间 可靠性工程系:元件或系统失效时间 犯罪学:重罪犯人的假释时间 社会学:首次婚姻持续时间 人口学:母乳喂养新生儿断奶时间 经济学:经济危机爆发时间、发行债券的违约时间 保险精算学:保险人的索赔时间、保险公司某一索赔中所付保费 汽车工业:汽车车轮转数 市场学中:报纸和杂志的篇幅和订阅费 三、生存分析的应用领域:社会学,保险学,医学,生物学,人口学,医学,经济学,可 靠性工程学等 六、生存分析研究的目的 1、描述生存过程:估计不同时间的总体生存率,计算中位生存期,绘制生存函数曲线。统 计方法包括 Kaplan-Meier (K-M )法、寿命表法。 2、比较:比较不同处理组的生存率,如比较不同疗法治疗脑瘤的生存率,以了解哪种治疗

医学统计学选择(全部答案-仅供参考)

《医学统计学》第二版(七年制临床医学用) (一)最佳选择题 1.描述一组偏态分布资料的变异度,以()指标较好。 A.全距 B.标准差 C.变异系数 D. |四分位数间距 E.方差 2.用均数和标准差可以全面描述()资料的特征。 A.正偏态分布 B.负偏态分布 C.正态分布 D.对称分布 E.对数正态分布 3.各观察值均加(或 同一数后()。 减) A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 E.以上都不对 4. 比较身高和体重两组数据变异度大小宜采用() A. 变异系数 B. 方差 C. 极差 D. 标准差 E.四分位数间距 5. 偏态分布宜用()描述其分布的集中趋势。 A. 算术均数 B. 标准差 C. 中位数 D. 四分位数间距

E.方差

6.各观察值同乘以一个不等于0的常数后,()不变 A.算术均数C.几何均数 B. D. 标准差 中位数 E.变异系数 7.()分布的资料,均数等于中位数。 A.对数正态 B.正偏态 C.负偏态 D.偏态 E.正态 8.对数正态分布是种()分布。(说明:设X变量经Y=g X变换后服从正态分布,问X变量属何种分布?) A.正态 B.近似正态 C.左偏态 D.右偏态 E.对称 9. 最小组段无下限或最大组段无上限的频数分布资料,可用()描述其集中趋势。 A. 均数 B. 标准差 C. 中位数 D. 四分位数间距 E.几何均数 10. 血清学滴度资料最常用来表示其平均水平的指标是()。 A. 算术平均数 B. 中位数 C. 几何均数 D. 变异系数 E.标准差

11. ()小,表示用该样本均数估计总体均数的可靠性大。 A. CV B. S C. x D. R E. 四分位数间距 12. 两样本均数比较的t检验,差别有统计学意义时,P越小,说明()。 A. 两样本均数差别越大 B. 两总体均数差别越大 D. 越有理由认为两样本均数不同 E. 越有理由认为两总体均数相同 13. 甲乙两人分别从同一随机数字表抽得30个(各取两位数字)随机数字作为两个样本,求得X1和S2;X2和S2,则理论上()。 A. X1X2 B. S2S; C. 作两样本均数比较的t检验,必然得出无统计学意义的结论 D. 作两样本方差比较的F检验,必然方差齐 E. 由甲、乙两样本均数之差求出的总体均数95%信区间,很可能包括0 14. 在参数未知的正态总体中随机抽样,X | ()的概率为5% A. 1.96 B. 1.96 C. 2.58 D. t o.o5/2, S E. t o.o5/2, S X 15. 某地1992年随机抽取100名健康女性,算得其血清总蛋白含量 的均数为74g/L,标准差为4g/L,则其95%勺参考值范围为()。

统计学考题(按章节) 第6题【05分】__随访资料的生存分析

五、其它30分(3~5道题目,每题6~10分) 随访资料的生存分析: 【06真题】 九、某医生从 2002年 1月 1日起对某医院收治的 6名急性心肌梗塞病人进行跟踪观察,2002年 3月 25日结束观察,共 12周。记录的资料如下:(5分) 1、上述资料随访时间单位以(日)、(月)、(年)哪个较合适?为什么? 2、判断上述随访时间哪些属截尾值?写出观察对象编号。 【05真题、04真题、03真题】 四、16例某癌症病人在不同时期经随机化分配到A、B两治疗组,并继续进行随访至1974年5月 31日结束。资料如下表:(8分) 16例某种癌症病人随访资料 病人号治疗组分组日期终止日期是否该病死亡截尾值 1 A 68.05.1 2 68.05.30 Y 2 B 70.10.18 71.04.16 Y 3 B 69.02.12 70.11.06 Y 4 A 72.01.30 74.05.31 仍存活 5 A 73.11.11 74.01.02 Y 6 B 68.03.12 73.03.30 车祸死亡 7 A 69.01.06 69.01.04 Y 8 A 69.02.08 70.02.08 迁出 9 B 71.05.02 71.11.13 Y 10 B 68.03.08 68.05.23 Y 11 B 73.12.12 74.02.20 Y 12 A 74.05.01 74.05.09 Y 13 B 72.07.02 72.07.15 Y 14 B 68.12.18 74.04.31 失访 15 A 69.01.01 74.05.31 仍存活 16 B 73.09.02 73.09.20 Y 1.上述资料随访时间单位以(日)、(月)、(年)哪个较合适?为什么? 2.判断上述随访时间哪些属截尾值,写出观察对象编号。 3.要比较A、B疗法对该种癌症病人的疗效,宜选用何种统计检验方法? 4.A、B治疗组随访资料生存时间的特征量(代表值)一般用何指标表示? 【答案】jszb 0、本资料中,第7号观察对象数据,终止日期竟然早于分组日期,是典型的错误数据,应该排除。 1、本资料并未按时间分组,实际上是A、B两个治疗组的未分组资料。 一般情况下较细的时间单位准确性较高,当随访时间可以作较细的量化时,则应考虑用较细的时间单位。 但研究目的不同,时间单位不同,使用恰当的时间单位。 本资料的目的是比较A、B疗法对该种癌症病人的疗效,癌症病人的生存时间测度单位如果以(日)太小, 因此,本资料随访时间单位以月较合适? 2、产生截尾数据的原因:包括中途失访、研究结束时仍然存活、死于与研究疾病无关的原因。 因此,编号4、6、8、14、15观察对象属截尾值。

心理学考研-心理统计资料-方差分析

2017考研已经拉开序幕,很多考生不知道如何选择适合自己的考研复习资料。中公考研辅导老师为考生准备了【心理学考研知识点讲解和习题】,希望可以助考生一臂之力。同时中公考研特为广大学子推出考研集训营、专业课辅导、精品网课、vip1对1等课程,针对每一个科目要点进行深入的指导分析,欢迎各位考生了解咨询。 第十章方差分析 【本章综述】两个平均数之间的差异检验用Z/t检验,那么两个以上的平均数之间差异检验该用何种检验?方差分析主要处理两个两个或以上的平均数之间的差异检验问题。本章主要介绍方差分析的基本原理,以及完全随机设计和随机区组设计这两种最基本的实验设计数据的方差分析以及事后检验。 【考点分布】 方差分析 【本章框架】

【复习建议】方差分析这一章处处是重点,而且有一定的难度。同学们在复习时旨 在把握方差分析的原理以及在不同的实验设计中的变异来源,抓住这一精髓灵活地应对不同类型的题。 第一节 方差分析的原理与基本过程 (一)方差分析的基本原理 1. 方差分析依据的基本原理就是方差的可加性或者说可分解性原则,具体说就是将实验中的总变异分解为几个不同来源的变异。一般来说,总变异包括组间变异(组间平方和)和组变异(组平方和)两部(平方和指观测数据与平均数离差的平方总和)。 2. 其公式如下: ① SS T = SS B + SS W ;∑∑=== k j n 1 i )X (X SS 2 ij T 1-t ;∑=? =k j )X X (n SS 2j B 1 -t ; ∑∑=== k j n 1 i )X (X SS 2ij W 1-j ;这些公式中,X 的下标j 表示第几组,i 表示某一组中 第几个被试,求和符号的起止标记意思与这个相同。k 表示实验处理数;n 表示每种实验处理下的被试数。SS T 表示总平方和,所有观测值与总平均数的离差的平方总和,也即实验中产生的总变异;SS B 为组间平方和,几个组的平均数与总平均数的离差的平方总和,表示由于接受不同的实验处理而造成的各组之间的差异以及无法控制的随机实验误差(通常忽略不

心理统计考试试题及答案精选

注:t0.05/2(60)=2.00Z0.05/2=1.9 6 一、单项选择题(本大题共15小题,每小题2分,共30分) 1.当我们按性别差异,将男性指定用数字“1”来代表,女性指定用数字“2”来代表,这里所得到的数据是( ) A.称名数据 B.顺序数据 C.等距数据 D.比率数据 2.比较不同单位资料的差异程度,可以采用的统计量是( ) A.差异系数 B.方差 C.全距 D.标准差 3..中数的优点是( ) A.不受极端值影响 B.灵敏 C.适于代数运算 D.全部数据都参与运算 4.一班32名学生的平均分为72.6,二班40人的平均分为80.2,三班36人的平均分为75,则三个班级总平均分为() A.75.93 B.76.21 C.80.2 D.73 5.用平面直角坐标系上点的散布图来表示两种事物之间的相关性及联系模式,这种统计图是()A.散点图 B.线形图 C.条形图 D.圆形图 6.一组数据中任何两个相邻数据之比接近于常数,表示其集中量数应使用() A.算术平均数 B.几何平均数 C.中位数 D.加权平均数 7.随机现象中出现的各种可能的结果称为() A.随机事件 B.必然事件 C.独立事件 D.不可能事件

8.进行多个总体平均数差异显著性检验时,一般采用() A.Z检验 B.t检验 C.χ2检验 D.方差分析 9.已知P(Z>1)=0.158,P(Z>1.96)=0.025,则P(1

相关主题
文本预览
相关文档 最新文档