当前位置:文档之家› 第十二章 秩和检验

第十二章 秩和检验

第十二章  秩和检验
第十二章  秩和检验

第十二章秩和检验

假设检验通常可划分为参数检验(parametric test)和非参数检验(nonparametri c test)两大类。

以特定的总体分布为前提,对未知的总体参数作推断的假设检验方法统称为参数检验。前面章节介绍的t检验和方差分析均要求样本来自正态总体,属于参数检验。非参数检验不以特定的总体分布为前提,也不对总体参数作推断,故也称为任意分布检验(distribution-free test)。

非参数检验具有广泛的适用性。由于总体不必服从特定分布,无论资料总体分布形式如何,一端或两端无界,甚至分布未知,都能适用。在非参数检验中,一般不直接用样本观察值做分析,统计量的计算是基于原始数据在整个样本中按大小所占的位次。由于非参数检验没有利用观察值的具体数值,而只利用了其大小次序的信息,信息利用不够充分,故凡适合参数检验的资料,应首选参数检验。但当总体分布不明确时,则应采用非参数检验。尤其对于那些难以确定分布又出现少量离群值的小样本数据,非参数检验在剔除这些数据前后所得结论显示出了较好的稳健性。

非参数检验方法很多,有秩和检验(rank sum test)、符号检验、游程检验、等级相关分析等。本章介绍在非参数检验中占有重要地位且检验功效相对较高的秩和检验。

第一节Wilcoxon符号秩和检验

1945年Wilcoxon提出的Wilcoxon符号秩和检验(Wilcoxon singned-rank tes t),亦称符号秩和检验,可用于配对设计计量差值的比较,还可用于单一样本与总体中位数的比较。

一、配对设计的两样本比较

(一) 本法的基本思想与步骤

配对设计资料主要是对差值进行分析。通过检验配对样本的差值是否来自中位数为0的总体,来推断两个总体中位数有无差别,即推断两种处理的效应是否不同。现以例12.1说明其基本思想与步骤。

例12.1 某研究用甲、乙两种方法对某地方性砷中毒地区水源中砷含量(mg

/L)进行测定,检测10处,测量值如表12.1的(2)、(3)栏。问两种方法的测定结果有无差别?

表12.1 甲、乙两种方法测定某地区10处水源中砷含量的结果(mg/L)

测定点

序号

水中砷含量差值i d正差值秩次负差值秩次

(1) 甲法

(2)

乙法

(3) (4)=(2)-(3) (5) (6)

1 0.010 0.015 -0.005 - 2

2 0.060 0.070 -0.010 - 3

3 0.320 0.300 0.020 5.5 -

4 0.150 0.170 -0.020 - 5.5

5 0.005 0.005 0.000 --

6 0.700 0.600 0.100 8 -

7 0.011 0.010 0.001 1 -

8 0.240 0.255 -0.015 - 4

9 1.010 1.245 -0.235 -9

10 0.330 0.305 0.025 7 -

合计---21.5(T+)23.5(T-)本例为定量数据配对设计的小样本资料,其配对差值经正态性检验得

0.717

W=,0.001

P=,即差值不服从正态分布,故不宜选用配对t检验,而应使用Wilcoxon符号秩和检验。

1. 建立检验假设,确定检验水准

H:两种方法测定结果差值的总体中位数等于0

1

H:两种方法测量结果差值的总体中位数不等于0

0.05

α=

2. 计算检验统计量T值

(1) 求差值

i

d,见表12.1第(4)栏。

(2) 编秩依差值的绝对值由小到大编秩。

当差值为0,舍去不计,n随之减少;当差值绝对值相等,若符号不同,求平均秩次;若符号相同,既可顺次编秩,也可求平均秩次,并将各秩次冠以原差值的正、负号。

本例,因5号测定点差值为0,不参与编秩,n随之减1,即有效对子数为9。编秩时,差值为“0.020”和“-0.020”所占位次为5、6,但由于两个差值符号不同,必须取平均秩次(56)/2 5.5

+=。

(3) 分别求正、负秩和 计算正差值的秩和T +和负差值的秩和T -。 由于总有(1)/2T T n n +-+=+,故T +大时,T -必然小;反之T +小时,T -必然大。本例,21.5T +=,23.5T =-,9(91)/245T T +-+=+=,表明秩和计算无误。

(4) 确定检验统计量T 任取T +或T -作为检验统计量T 。 本例取21.5T =或23.5T =。 3. 确定P 值,作出统计推断 (1) 查表法:

当50n ≤时,根据n 和T 查附表10,T 界值表(配对比较的符号秩和检验用)。 查表时,自左侧找到n ,用所得统计量T 值与相邻一栏的界值相比较,若T 值在上、下界值范围内,其P 值大于相应的概率;若T 值恰好等于界值,其P 值一般等于相应概率;若T 值在上、下界值范围外,其P 值小于相应概率,此时右移一栏,再做比较,直至较好地估计出P 值。

由附表10可知,按照0.05α=水准,当5n ≤时,配对符号秩和检验不能得出双侧有统计学意义的概率,故n 必须大于5。

本例,由10n = ,21.5T =或23.5T =查附表10,得0.10P >。按照0.05α=水准不拒绝0H ,差异无统计学意义,尚不能认为甲、乙两种方法测定水源中砷含量有差别。

(2) 正态近似法:

随着n 的增大,T 分布逐渐逼近均数为(1)/4n n +,方差为(1)(21)/24n n n ++的正态分布。当50n >时,近似程度较满意,可由公式(12.1)计算标准正态统计量:

Z (12.1)

式中0.5为连续性校正数,因为Z 值是连续的,而T 值却不连续。

排序时,出现相同秩次的现象称为相持(tie)。当相持的情形较多时(如个体数超过25%),按式(12.1)计算的Z 值偏小,可用公式(12.2)计算校正的统计量c Z ,经校正后,c Z 适当增大,P 值相应减小。

c Z (12.2)

式中j t (j=1,2,…)为第j 个相同秩次(即平均秩次)的个数,例如有2个差值为“1.5”,3个差值为“6”,5个差值为“13”,则1t =2,2t =3,3t =5,故有

3333()(22)+(33)+(55)=150j j t t ----∑=,若无相同秩次,则3

()j j t t -∑=0,c Z Z =。

Wilcoxon 配对符号秩和检验的基本思想:在配对样本中,由于随机误差的存在,其对差值的影响不可避免。假定两种处理的效应相同,则差值的总体分布为对称分布,并且差值的总体中位数为0。若此假设成立,样本差值的正秩和与负秩和应相差不大,均接近(1)/4n n +;当正负秩和相差悬殊,超出抽样误差可解释的范围时,则有理由怀疑该假设,从而拒绝0H 。

二、单一样本与总体中位数比较

Wilcoxon 符号秩和检验的目的是推断样本中位数与已知总体中位数(常为标准值或大量观察的稳定值)有无差别,常用于不满足单样本t 检验应用条件的资料。

单样本资料符号秩和检验的方法步骤见例12.2。

例12.2 某医生从其接诊的不明原因脱发患者中随机抽取14例,测得其发铜含量(μg/g)见表12.2。已知该地健康人群发铜含量的中位数为11.2μg/g 。问脱发患者发铜含量是否低于健康人群?

表12.2 14名不明原因脱发患者发铜含量(μg/g)测定结果

发铜含量i x

差值i d 正差值秩次

负差值秩次

(1) (2)=(1)-11.2 (3) (4) 6.11

-5.09 - 14 6.20 -5.00 - 13 6.27 -4.93 - 12 6.58 -4.62 - 11 6.78 -4.42 - 10 7.22 -3.98 - 9 7.31 -3.89 - 8 8.52 -2.68 - 7 9.59 -1.61 - 6 9.72 -1.48 - 5 10.63 -0.57 - 4 11.16 -0.04 - 2 11.23

0.03

1

11.32 0.12 3 - 合计

4(T +)

101(T -)

根据专业知识可知,发铜含量值呈明显偏态分布,表12.2第(2)栏为样本各观察值与已知总体中位数的差值,对i d 做正态性检验得0.861W =,0.031P =,不满足单样本t 检验条件,故选用Wilcoxon 符号秩和检验。

1. 建立检验假设,确定检验水准

0H :差值的总体中位数等于0,即脱发患者发铜含量与该地健康人群相同 1H :差值的总体中位数小于0,即脱发患者发铜含量低于该地健康人群

单侧0.05α= 2. 计算检验统计量

(1) 求差值 11.2i i d x =-,见表12.2第(2)栏。

(2) 编秩 依差值的绝对值由小到大编秩。本例,各观察值差值的秩次见表12.2第(3)、(4)栏。

(3) 分别求正、负秩和 本例,4T +=,101T =-,14(141)

1052

T T +-++==,

表明秩和计算无误。

(4) 确定检验统计量T 本例,4T T +==或101T T -==。 3. 确定P 值,作出统计推断

本例,由14n =,4T =或101T =查附表10,得单侧0.01P <。按照0.05α=水准,拒绝0H ,接受1H ,差异有统计学意义,可以认为脱发患者发铜含量低于该地健康人群 。

第二节 成组设计两样本比较的秩和检验

Wilcoxon 秩和检验(Wilcoxon rank sum test),目的是推断连续型变量资料或有序变量资料的两个独立样本代表的总体分布位置是否有差别。

一、原始数据的两样本比较

原始数据为连续性变量资料,方法步骤见例12.3。

例12.3 某地职业病防治欲比较使用二巯基丙磺酸钠与二巯基丁二酸钠的驱汞效果。将22例汞中毒患者随机分配到两组,分别测定并计算出两组驱汞的

排汞比值,并将结果列于表12.3。试问两药驱汞效果有无差别?

表12.3 两种驱汞药物排汞效果比较

丁二酸钠

丙磺酸钠

排汞比值 秩次 排汞比值 秩次 0.93 1.5 0.93 1.5 1.19 3 3.34 8 2.46 4 4.82 12 2.60 5 5.22 13 2.62 6 6.11 14 2.75 7 6.13 15 3.50 9 6.34 16 3.83 10 6.80 17 3.83 11 7.28 18 8.50 19 8.54 20 12.59 21

14.92 22 110n =

175.5T =

212n =

2177.5T =

该资料为比值数据,不服从正态分布,现采用Wilcoxon 秩和检验。 1. 建立检验假设,确定检验水准

0H :两种药物排汞比值的总体分布位置相同 1H :两种药物排汞比值的总体分布位置不同

0.05α=

2. 计算检验统计量T 值

(1) 编秩 将两组数据由小到大统一编秩。编秩时,遇相同数值在同一组内,可顺次编秩;当相同数值出现在不同组时,则必须求平均秩次。

如本例,两组数值中各有一个0.93,所占位次为1和2,因属于不同组,则必须取平均秩次为(12)/2 1.5+=;而有两个3.83,因出现在同一组中,可顺次编秩为10、11,不必求平均秩次。

(2) 求各组秩和 以样本例数较小者为1n ,其秩和为1T 。设12N n n =+,则有12(1)/2T T N N +=+。

本例22N =,1222(221)/2253T T +=+=,经验证,秩和计算准确无误。 (3) 确定检验统计量T 值 若12n n ≠,则1T T =;若12n n =,则1T T =或2T T =。本例,12n n ≠,故175.5T T ==。

3. 确定P 值,作出统计推断

(1) 查表法 当110n ≤,且2110n n -≤时,查附表11,T 界值表(两样本比较的秩和检验用)。

先找到1n 与21n n -相交处所对应的4行界值,将检验统计量T 值与T 界值表中逐行相比。若T 值在界值范围内,其P 值大于相应概率;若T 值恰好等于界值,其P 值一般是等于相应概率;若T 值在界值范围外,其P 值小于相应概率,此时下移一行,再做比较,直至较好地估计出P 值。

本例,由110n =,21n n -=2,75.5T =查附表11,得双侧0.0050.01P <<。按照0.05α=水准,拒绝0H ,接受1H ,差异有统计学意义,可认为两种驱汞药物的排汞效果有差别。丁二酸纳组平均秩次为75.5/10=7.55,丙磺酸钠组平均秩次为177.5/12=14.79,可认为丙磺酸钠驱汞效果好于丁二酸钠。

(2) 正态近似法

当110n >或2110n n ->时,超出附表11的可查范围,根据中心极限定理,这时1T 的分布已接近均数为1(1)/2n N +,方差为12(1)/12n n N +的正态分布,故可由公式(12.3)计算Z 值:

12

/)1(5

.02/)1(211+-+-=

N n n N n T Z (12.3)

式中0.5为连续性校正数,因为T 值不连续,而Z 值是连续的。

当相持出现较多(如超过25%)时,按式(12.3)计算的Z 值偏小,可改用公式(12.4)进行校正:

c

Z Z C =

(12.4)

其中)()13

3N N t t c j j --=∑-(,)21

(???=,,j t j 为第j 次相持的秩次个数。 二、等级资料的两样本比较

例12.4 某医生欲比较中西医疗法与西医疗法治疗急性肾盂肾炎的临床疗效,将患者随机分为两组,分别给予中西医疗法或西医疗法治疗,并观察疗效,结果见表8.3,问两种疗法疗效是否有差别?

表12.4 两种疗法治疗急性肾盂肾炎的疗效 疗效

患者数

秩次范围

平均秩次

秩和

中西医疗法

西医疗法

合计

中西医疗

西医疗法

(1) (2) (3) (4) (5) (6) (7)=(2)(6)

(8)=(3)(6) 痊愈 36 18 54 1~54 27.5 990 495 显效 18 12 30 55~84 69.5 1251 834 进步 34 30 64 85~148 116.5 3961 3495 无效 4 8 12 149~160

154.5

618 1236 合计

92

68

160

6820

6060

1. 建立检验假设,确定检验水准

0H :两种疗法治疗急性肾盂肾炎的疗效总体分布位置相同 1H :两种疗法治疗急性肾盂肾炎的疗效总体分布位置不同

0.05α=

2. 计算检验统计量T 值

(1) 编秩 将两组数据按等级顺序由小到大统一编秩。

先按组段计算各等级的合计人数,见表12.4第(4)列,由此确定第(5)列各组段秩次范围,然后计算出各组段的平均秩次,见第(6)列。如疗效为“痊愈”共54例,秩次范围为1~54,平均秩次为(1+54)/2=27.5,余仿此。

(2) 求各组秩和 以各组段的平均秩次分别与各等级例数相乘,再求和得到T 1,T 2,见第(7)、(8)列。

(3) 确定统计量T 值 本例1n =68,2n =92,检验统计量T =6060。由于超出了两样本比较的秩和检验用的T 界值表范围,需用Z 检验。每个等级的人数为相同秩次的个数,即j t ,由于相持较多,故需按式(12.3)和式(12.4)计算C Z 值。

2.0210Z =

=

3333333

1()/()

(5454)(3030)(6464)(1212)

10.8906

160160

j j t t N N c =----+-+-+-=-

=-∑

2.0210 2.1415C Z =

==

3. 确定P 值,作出统计推断

查t 界值表(附表3,ν→∞),得0.02

秩次为6820/92=74.1,西医疗法组平均秩次为6060/68=89.1,可以认为中西医疗法治疗急性肾盂肾炎效果较好。

三、本法的基本思想

Wilcoxon 秩和检验的基本思想:假设含量为1n 与2n 的两个样本(且12n n ≤),来自同一总体或分布相同的两个总体,则1n 样本的秩和1T 与其理论秩和

1(1)/2n N +相差不大,即[11(1)/2T n N -+]仅为抽样误差所致。当二者相差悬殊,

超出抽样误差可解释的范围时,则有理由怀疑该假设,从而拒绝0H 。

第三节 成组设计多个样本比较的秩和检验

多组独立样本比较的秩和检验是由Kruskal 和Wallis 在Wilcoxon 两样本秩和检验的基础上扩展而来,又称Kruskal -Wallis H 秩和检验,用于推断非正态分布定量变量或有序分类变量的多个总体分布位置有无差别。

一、 原始数据的多个样本比较

例12.5 某医师检测3种卵巢功能异常患者血清中促黄体素的含量(U/L)资料见表12.5第(1)、(3)、(5)栏。问3种患者血清中促黄体素的含量(U/L)是否有差别?

表12.5 三种卵巢功能异常患者血清中促黄体素的含量(U/L)

卵巢发育不良

丘脑性闭经 垂体性闭经 促黄体素含量 (1) 秩次

(2) 促黄体素含量 (3) 秩次

(4) 促黄体素含量 (5) 秩次

(6) 31.38 17

1.67 1

1.90 3 33.60 18 1.74 2

2.10 4 35.12 19

3.32 6 2.75 5 35.76 20

4.59 7.5 4.59 7.5 38.31 21 6.71 10

5.98 9 40.50 22 9.45 11.5 9.45 11.5 42.50 23 10.21 13 10.86 15 50> 24

10.51 14

11.14 16

i R 164 65 71 i n 8

8

8 i R

20.500

8.125

8.875

这是定量资料多组独立样本的比较,并且该数据属于一端无确切值的资料,不能采用方差分析,现用Kruskal-Wallis H 秩和检验进行分析。

1. 建立检验假设,确定检验水准

0H :3种卵巢功能异常患者血清中促黄体素的含量总体分布位置相同 1H :3种卵巢功能异常患者血清中促黄体素的含量总体分布位置不全相同

0.05α=

2. 计算检验统计量H 值 (1) 编秩 编秩方法同例12.3。

将三组数据由小到大统一编秩,遇相同数值在同一组内,可顺次编秩;当相同数值出现在不同组时,则必须求平均秩次。见表12.5第(2)、(4)、(6)栏。本例,三组数值中有两个“4.59”,并在不同组,所占位次为7和8,各取平均秩次为

(78)/27.5+=;同样有两个“9.45”也在不同组,它们的位次为11和12,各取平

均秩次为(1112)/211.5+=。

(2) 求各组秩和i R 分别计算各组秩和i R ,下标i 表示组序(1,2,,i k =???)。 本例1164R =,2R =65,3R =71。

(3) 计算检验统计量H 值 用公式(12.5)计算H 值。

∑+-+=)1(3)1(12

2N n R N N H i

i (12.5) 式中i n 为各组例数,k n n n N +???++=21,i R 为各组秩和。

本例222

121646571()3(241)15.4124(241)888

H =

++-?+=?+ 当相持出现较多时,由式(12.5)求得H 值偏小,可用公式(12.6)进行校正得c

H 值。

c

H

H c =

(12.6) 其中)()(13

3N N t t c j j ---=∑,j t 为第j 次相持时相同秩次的个数。

本例相同秩次较少,无需校正。

3. 确定P 值,作出统计推断

(1) 查H 界值表(附表12,三样本比较的秩和检验用) 当组数3k =,且各组例数5i n ≤时,可查H 界值表得到P 值。

因本例3k =,各组例数均为8,超出H 界值表的范围,不能通过查H 界值

表获得P 值。

(2) 查2χ界值表

当组数或各组例数超出H 界值表(附表12)时,由于0H 成立时H 值近似地服从1k ν=-的2χ分布,此时可由2χ界值表得到P 值。

本例,以2ν=,215.41H χ≈=,查2χ界值表,得0.005P <。按照0.05α=水准,拒绝0H ,接受1H ,差异有统计学意义,可认为3种卵巢功能异常患者血清中促黄体素的含量总体分布位置不全相同。

若要具体回答3种卵巢功能异常患者血清中促黄体素的含量每两种之间是否有差别,还需进一步做两两比较。

Kruskal -Wallis H 检验的基本思想:类似于单因素方差分析。设有k 个对比组,各组样本含量、秩和、平均秩次分别记为:j n 、j R 、j R ;12k N n n n =++???+。则总秩和为(1)/2N N +,平均秩次为(1)/2N +。若没有或较少相持现象,则秩次的总离均差平方和为:

2

211()(1)/122

N

i N Q i N N =+=-

=-∑总 (12.7) 秩次的组间离均差平方和为:

2

2

2111(1)()24k

k j j j j j j

R N N N Q n R n ==++=-=-

∑∑组间 (12.8) 由式(12.5)H 值的定义可得:

/(Q H Q N =

组间

总-1)

(12.9)

即检验统计量H 为秩次的组间变异与总变异之比。可见,H 越大,组间变异越大,反之亦然。

二、 等级资料的多个样本比较

例12.6 某医院用三种复方小叶枇杷治疗老年慢性支气管炎,数据见表12.6第(1):(4)栏,试比较三种方剂的疗效有无差异。

表12.6 三种复方小叶枇杷治疗老年慢性支气管炎疗效的比较

疗效等级 例 数

秩次范围 平均秩次 老复方

复方I 复方II 合计 (1)

(2) (3) (4)

(5)

(6)

(7)

无效 47 35 4 86 1~86 43.5 好转 184 44 25 253 87~339 213 显效 115 18 9 142 340~481 410.5 控制 36 4 1 41 482~522 502 合计 382 101 39 522 - -

1. 建立检验假设,确定检验水准

0H :3种方剂疗效的总体分布位置相同 1H :3种方剂疗效的总体分布位置不全相同

0.05α=

2. 计算检验统计量H 值

(1) 编秩 编秩方法同两组等级资料例12.4。各等级合计、秩次范围、平均秩次的计算结果,见表12.6第(5)~(7)栏。

(2) 求各组秩和 计算各组各等级的频数与平均秩次的乘积之和。 本例,14743.5184213115410.536502106516R =?+?+?+?=

23543.54421318410.5450220291.5R =?+?+?+?= 3443.5252139410.515029695.5R =?+?+?+?=

(3) 计算检验统计量H 值

222

1210651620291.59695.5()3(5221)21.6325522(5221)38210139

H =++-?+=+

由于相持出现较多,按式(12.6)计算c H 值。

333331[(8686)(253253)(142142)(4141)]/(522522)0.8611c =--+-+-+--= c 21.6320.861125.1214H ==

3. 确定P 值,作出统计推断

本例3k =,各组例数均大于5,可由312ν=-=查2χ界值表(附表9),得

0.005P <。按照0.05α=水准,拒绝0H ,接受1H ,差异有统计学意义,可认为

3种复方小叶枇杷方剂治疗老年慢性支气管炎的疗效有差别。

若要具体回答3种复方小叶枇杷方剂治疗老年慢性支气管炎的疗效每两种之间是否有差别,还需进一步做两两比较。

三、多个独立样本间的多重比较

多个独立样本比较的Kruskal -Wallis H 秩和检验,当结论为拒绝H 0时,只能得出各总体分布位置不全相同的结论。要回答哪两个总体分布位置不同,还要

进一步做两两比较。两两比较的方法很多,下面介绍扩展的t 检验法。统计量t 值计算公式如下:

t =

, N k ν=- (12.10)

式中i R 、j R 为两对比组的平均秩次;i n 、j n 为两对比组的样本含量;k 为

处理组数,12k N n n n =++???+;H 为Kruskal -Wallis H 秩和检验中的统计量H 或

c H 值;式中分母为)(j i R R -的标准误。

方法步骤见例12.7。

例12.7 对例12.6资料做三个样本间的两两比较。 1. 建立检验假设,确定检验水准

0H :任意两个处理组总体分布位置相同 1H :任意两个处理组总体分布位置不同

0.05α=

2. 计算检验统计量t 值 (1) 求各组平均秩次i R :

老复方 1106516

278.84382

R == 复方I 220291.5

200.91101

R == 复方II 39695.5

248.6039

R =

= (2) 列出两两比较计算表,求得t 值。见表12.7。

表12.7 例12.7资料的两两比较

(1)

(2) (3) (4) (5) (6)

老复方与复方I 382 101 77.93 4.7242 0.001< 老复方与复方II 382 39 30.24 1.0000 0.20> 复方I 与复方II

101

39

47.69

1.7158

0.05>

表中第(5)栏为按式(12.10)计算的t 值。本例N =522,k =3,c H =25.1214,则老复方与复方I 比较的t 值为:

t=

4.7242

仿此得表12.7第(5)栏中的t值。

3. 确定P值,作出统计推断

ν=-=查t界值表(附表3),得P值,根据表12.7第(5)栏中的t值,以5223519

见表12.7第(6)栏。按照α=0.05水准,老复方与复方I,拒绝

H,差异有统计

学意义;而老复方与复方II、复方I与复方II比较均不拒绝

H,差异无统计学

意义,故可认为3种复方小叶枇杷治疗老年慢性支气管炎疗效的差别主要存在于老复方与复方I两种方剂之间。

第四节随机区组设计的秩和检验

一、多个相关样本比较的Friedman M检验

随机区组设计(配伍组设计)的计量资料,在比较各处理组的效应时,若不满足方差分析的条件,可用Friedman秩和检验(Friedman M test)。该法是由M. Fr iedman提出而得名,又称M检验。其目的是推断随机区组设计的多个相关样本

H和备择所来自的多个总体分布位置是否相同。Friedman秩和检验的检验假设

0 H与多个样本比较的Kruskal Wallis H检验相同,但为了比较平衡随机区假设

1

组间的影响后各处理组间的效应,采用了不同的编秩方法。下面结合例12.8介绍Friedman秩和检验的具体步骤。

例12.8 观察某药不同剂量对肝功能的影响,将同种属的28只大白鼠按窝别、性别、体重配为7个配伍组,每个区组的4只大白鼠随机分入不同的4种剂量组,在用药后一周测定各血清中指标DT值的变化,结果见表12.8,问此药不同剂量对血清中指标DT值的影响有无不同?

表12.8 用药后不同剂量血清中指标DT值

(1) (2) (3) (4) (5) (6) (7) (8) (9)

1 63

2 190 4 138

3 5

4 1

2 79 1 238 4 220

3 14

4 2

3 45 1 300

4 92 3 83 2

4 4

5 1 140 3 213 4 100 2

5 51 2 175 4 150 3 3

6 1

7 64 1 207 4 185 3 87 2 R

9

27

22

12

1. 建立检验假设,确定检验水准

0H : 此药不同剂量时血清中DT 值的总体分布位置相同 1H : 此药不同剂量时血清中DT 值的总体分布位置不全相同

0.05α=

2. 计算检验统计量M 值

(1) 编秩 先将各配伍组内的数据由小到大分别编秩,遇相同数据者取平均秩次。本例编秩结果见表12.8第(3)、(5)、(7)、(9)栏。

(2) 求各处理组秩和i R 本例 19R =,227R =,322R =,412R = (3) 计算M 值

()

2

i M R R =-∑ (12.11)

式中,(1)

2

i

R b k R k

+=

=

∑ ,其中i R 为各处理组秩和,k 为处理组数,b 为区组数。

本例:(9272212)/47(41)/217.5R =+++=+=

按式(12.11),2222(917.5)(2717.5)(2217.5)(1217.5)213M =-+-+-+-= 3. 确定P 值,作出统计推断 (1) 查M 界值表

当15b ≤,且15k ≤时,可查M 界值表(附表13,随机区组比较的秩和检验用)。本例以区组数7b =和处理组数4k =查M 界值表得0.05(7,4)92M =,现

0.05213M M =>,则0.05P <。按0.05α=水准拒绝0H ,接受1H ,差异有统计学

意义,故可认为该药不同剂量对血清中DT 值的影响有差异。

若要判断各区组因素间的差异有无统计学意义,可按类似上述步骤进行:首先对每个处理组的数据由小到大编秩,遇相同数据取平均秩次;然后计算各区组的秩和i R ;平均秩次可由公式(1)

2

i

R

k b R b

+=

=

∑计算。再按式(12.11)计算M 值。当,(,)b k M M α≥时,P α≤,即各区组因素之间的差异有统计学意义。

(2) 2χ近似法:

当区组数b 或处理组数k 超出M 界值表的范围时,可以采用2χ近似法。

()

()2212

311i R b k bk k χ=

-++∑, ν=k -1 (12.12) 式中,b 为区组数,k 为处理组数,i R 为各处理组的秩和。

如例12.8,7b =,4k =,19R =,227R =,322R =,412R =则:

()

()()2222212

9272212374118.37441χ=

+++-??+=??+ 以413v =-=查2χ界值表(附表9),0.005P <,差异有统计学意义,故可以认为该药不同剂量对血清中DT 值的影响不同。

当各区组的相同秩次较多时,需用式(12.13)进行校正。

2

2

c

c

χχ=

()32

1()1j j

c t t bk k =---∑ (12.13) 式中,j t 为各区组内第j 个具有相同秩次的个数,b 为区组数,k 为处理组数。由于1c <,故校正的22c χχ>,对应的P 值减小。2c χ在下列情况下意义较大:①相同数据的个数在各区组中所占比重较大;②所得P 值在对应界值附近。

二、多个相关样本的两两比较

当经过多个相关样本比较的Friedman M 检验拒绝0H 接受1H 时,只说明所比较的多个总体分布位置不全相同,若要具体回答哪两个总体分布位置不相同,还需做组间的两两比较。方法步骤如下:

1. 建立检验假设,确定检验水准

0H :任意两组的总体分布位置相同 1H :任意两组的总体分布位置不相同

0.05α=

2. 计算检验统计量Z 值

设i R 和j R 分别为比较的第i 组和第j 组样本的秩和,其平均秩和分别为i R 和j R 。

①Wilcoxon 符号秩和检验:对任意两两组合进行检验,得到尽可能精确的P

值(可借助统计软件)。②正态近似法:样本含量较大时,计算ij Z 值。

i

j

i j ij R R

R R R R Z S ---=

=

(12.14)

3. 确定P 值,作出统计推断

利用标准正态分布表或统计软件求得统计量数值所对应的P 值,将某两组比较所得P 值与调整以后的检验水准α,比较,若P α≤,,则拒绝0H 。

此外,还可采用检验水准调整的方法,如Bonferroni 法。与完全随机设计类似,为保证I 型错误的概率不超过α,按公式(12.15)调整每次比较的I 型错误概率α,。

,2(1)

(1)

2

k k k k α

α

α=

=

-- (12.15)

小 结

1. 非参数检验是不依赖总体分布类型,也不对总体参数进行推断的一类统计方法。它具有广泛的适应性和较好的稳定性;但若资料符合参数检验条件,用非参数检验会损失部分信息,降低检验效能。

2. 非参数检验方法较多,有秩和检验、符号检验、游程检验等。其中秩和检验是比较系统和完整的一类非参数检验方法。

3. 非参数检验适用于:①等级资料;②总体分布类型不明的资料;③非正态分布的资料;④对比组间方差不齐的资料;⑤一端或两端观察值不确切的资料。

4. 秩和检验是将原数据转换为秩次,比较各组秩和的一类非参数检验方法。不同设计类型的秩和检验其编秩、求秩和、计算统计量、确定P 值的方法有所不同。注意编秩时相同数据一般取平均秩次,以及相持现象较多时统计量的校正。

5. 此外还需注意,有序分类变量资料运用非参数检验可推断各等级强度的差别,而R C ?列联表2χ检验是比较频数分布之间的差别。

(薛 茜)

社会调查研究与方法 第十一章自测

社会调查研究与方法第十一章自测 一、填空题(每空2分,共计20分) 题目1 一般认为资料分析包括三方面内容,即()、定量分析和()。 答案: 反馈 正确答案是:定性分析,理论分析 题目2 定量分析是最复杂的资料分析。它按照性质可以分为两大类,一类是();另一类是()。 答案: 反馈 正确答案是:描述性分析,推论性分析 题目3 常用的集中量数有平均数、()与()。 答案: 反馈 正确答案是:中位数,众数 题目4 常见的离中量数有极差、标准差、()与()。 答案: 反馈 正确答案是:标准差系数,四分位差 题目5 目前最流行的专业电脑统计分析软件是()软件和SAS软件。另外应用比较普遍的还有Office 中的()等。 答案: 反馈 正确答案是:SPSS,Excel 题目6 定性分析的基本内容主要是()、()和归类。 答案: 反馈 正确答案是:识别属性,要素分析 题目7 不正确 常用的辩证分析方法有()分析法、具体和抽象分析法、()分析法。 答案: 反馈 正确答案是:矛盾,现象和本质 题目8 ()和()统称证明,是社会调查中相互联系且相互对立的两种思维方式。实践证明和逻辑证明则是证明的两种基本类型。 答案:

反馈 正确答案是:证实,证伪 题目9 9.理论分析中的比较法首先需要(),另外还需要()。 答案: 反馈 正确答案是:指标,比较对象 题目10 抽样推断主要由()和()这两部分内容组成。 答案: 反馈 正确答案是:参数估计,假设检验 题目11 常见的线性回归分析有()回归分析和()回归分析。 答案: 反馈 正确答案是:一元线性,多元线性 题目12 综合评价法的具体操作方法较多,其中较()和()应用范围较广。 答案: 反馈 正确答案是:聚类分析法,综合指数法 标记题目 信息文本 二、选择题(每题2分,共计18分) 题目13 资料分析中常见的描述性分析有()。 选择一项或多项: A. 综合评价分析 B. 相关和回归分析 C. 动态分析 D. 集中量数和离中量数分析 E. 因素分析 F. 相对指标分析 反馈 The correct answers are: 相关和回归分析, 集中量数和离中量数分析, 因素分析, 动态分析题目14 常用的表示发展水平的指标有增长量,平均增长量,发展水平,平均发展水平等。常用的速度指标有发展速度,增长速度,增长1%的绝对值,平均发展速度,平均增长速度等。对它们的统计分析属于()。 选择一项: A. 因素分析 B. 动态分析 C. 综合评价分析

医学统计学第10、11、12章 课后习题

1. 以下检验方法属参数法的是()。 A、t检验 7. 下列统计分析方法属于非参数检验的是()。 A、Wilcoxon单样本秩和检验 7. 下列统计分析方法属于参数检验的是()。 B、完全随机设计的方差分析 8. 关于统计分析方法的选择,下列说法错误的是()。 D、对于定量变量自然是选择它所对应的那些统计方法如t检验、方差分析或检验等 3. 关于参数检验和非参数检验的说法错误的是()。 D、多数非参数检验方法简便,易于理解且检验效能高 4. 对于配对比较的秩和检验,其检验假设为()。 C、样本的差数来自中位数为0的总体 1. 两小样本比较作假设检验首先考虑()。 D、资料符合t检验还是秩和检验 三组比较的秩和检验,样本例数均为5,确定5. P值应查()。 B、H界值表 9. 高血压临床试验分为试验组和对照组,分析考虑治疗0周、2周、4周、6周、8周血压的动态变化和改善情况,为了直观显示出两组血压平均变动情况,宜选用的统计图是()。 B、线图 符合4. t检验条件的数值变量资料如果采用秩和检验,则()。 B、第二类错误增大 2. 在进行两样本比较的秩和检验时,以下无效假设正确的是()。 B、H0:两样本对应的总体分布相同 9. 某研究者打算比较1995-2010年之间两种疾病的死亡率的变化速度,其统计图宜采用()。 A、半对数线图 3. 配对比较的秩和检验的基本思想是--- 如果检验假设成立,则对样本来说()。 D、正秩和和负秩和的绝对值不会相差很大 6. 当观察性研究设计和完全随机设计的数据分析时,不可能选择的统计分析方法是()。 D、配对t检验 10. 欲用统计图表示某市1980年和1990年不同性别高血压的患病情况,应用()。 A、复式条图 5. 欲比较三种药物治疗效果有无差别,如果治疗效果为有序分类变量,宜采用()。 A、Wilcoxon秩和检验

第十一章秩和检验

第十一章秩和检验 【A1型题】 1.配对比较的秩和检验的基本思想是:如果假设成立,则对样本来说 A. 正秩和与负秩和的绝对值不会相差很大 B. 负秩和的绝对值大于正秩和的绝对值 C. 正秩和与负秩和的绝对值相等 D. 正秩和的绝对值大于负秩和的绝对值 E. 正秩和与负秩和的绝对值相差很大 2.三组比较的秩和检验,样本例数均为6时,确定P值应查 A. H界值表 B. T界值表 C. χ2界值表 D. t界值表 E. F界值表 3.在配对比较的差数秩和检验中,如果有两个差数为0,则 A. 对正秩和有0.5和1,对负秩和有-0.5和-1 B. 对正秩和有2,对负秩和有-2 C. 对正秩和有3,对负秩和有-3 D. 0不考虑 E. 以上都不是 4.设配对资料的变量值为x1和x2,则配对资料的秩和检验是

A. 把x1和x2综合按绝对值从小到大编秩 B. 把x1和x2综合从小到大编秩 C. 分别按x1和x2从小到大编秩 D. 把x1和x2的差数从小到大编秩 E. 把x1和x2的差数的绝对值从小到大编秩 5.下列哪项不是非参数统计的优点 A. 不受总体分布的限定 B. 简便、易掌握 C. 适用于等级资料 D. 适用于未知分布型资料 E. 检验效能高于参数检验 6.等级资料的比较宜采用 A. 秩和检验 B. F检验 C. t检验 D. 回归分析 E. 四格表资料χ2检验 7.一组n1例和一组n2例的两组计量资料的比较,用秩和检验所设的总体是 A. n1个秩号:1,2,…,n1 B. n2个秩号:1,2,…,n2 C. n1+n2个秩号:1,2,…,n1+n2 D. n2-n1个秩号:1,2,…,n2-n1

第12章秩和检验答案

【下载本文档,可以自由复制内容或自由编辑修改内容,更多精彩文章,期待你的好评和关注,我将一如既往为您服务】 第十二章秩和检验 【思考与练习】 一、思考题 1. 简述参数检验和非参数检验的区别。 2. 简述非参数检验的适用范围。 3. 同一资料,又出于同一研究目的,当参数检验和非参数检验所得结果不一致时,以何者为准,请简述理由。 二、案例辨析题 某儿科医生比较甲、乙、丙三种药物治疗小儿腹泻的疗效,将379名小儿腹泻患者随机分为三组,分别采用甲、乙、丙三种药物治疗,结果见表12-1。 表12-1 三种药物治疗小儿腹泻的疗效比较 疗效甲药乙药丙药合计 痊愈175 5 1 181 显效95 55 5 155 进步64 6 30 100 无效45 35 6 86 合计379 101 42 522 对于上述资料,该医生采用行×列表检验,得,,故认为三种药物的疗效有差别。该结论是否正确,为什么? 三、最佳选择题 1.以下方法中属于参数检验方法的是 A. 检验 B. 检验 C. 检验 D. Wilcoxon符号秩和检验 E. Wilcoxon秩和检验 2.进行两小样本定量资料比较的假设检验时,首先应考虑 A. 检验 B. 检验 C. 秩和检验 D. 检验 E. 满足参数检验还是非参数检验的条件 3.两组定量资料的比较,若已知、均小于30,总体方差不齐且呈极度偏态分布,宜采用 A. 检验 B. 检验 C. 检验 D. 方差分析 E. 秩和检验 4. 欲比较三种药物治疗效果有无差异,如果治疗效果为有序分类变量,宜采用 A. 检验 B. 方差分析

C. 检验 D.Wilcoxon秩和检验 E. 检验 5. 成组设计两样本比较的秩和检验,检验统计量T通常为 A. 较小的秩和 B. 较大的秩和 C. 样本含量较小组的秩和 D. 样本含量较大组的秩和 E. 任取一组的秩和均可 6. 配对设计秩和检验,若检验假设成立,则 A. 差值为正的秩和与差值为负的秩和相差不会很大 B. 差值为正的秩和与差值为负的秩和可能相差很大 C. 差值为正的秩和与差值为负的秩和肯定相等 D. 正秩和的绝对值大于负秩和的绝对值 E. 正秩和的绝对值小于负秩和的绝对值 7. 下列资料类型中,不宜采用秩和检验的是 A. 正态分布资料 B. 等级资料 C. 分布类型未知资料 D. 极度偏态分布资料 E. 数据一端不确定的资料 8. 某资料经配对秩和检验得,由查双侧界值如下,则值为 双侧概率0.10 0.05 0.02 0.01 界值 60~150 52~158 43~167 37~173 A. B. C. D. E. 9. 下列关于非参数检验的叙述错误的是 A. 非参数检验不依赖于总体的分布类型 B. 非参数检验仅用于等级资料比较 C. 适合参数检验的资料采用非参数检验会降低检验效能 D. 非参数检验会损失部分样本信息 E. 秩和检验是一种非参数检验方法 四、综合分析题 1. 已知某地正常人尿氟含量的中位数为 2.15mmol/L。现在该地某厂随机抽取12名工人,测得尿氟含量(mmol/L)如下: 2.15 2.10 2.20 2.12 2.42 2.52 2.62 2.72 3.00 3.18 3.87 5.67 试问该厂工人的尿氟含量是否高于当地正常人? 2. 按照年龄、性别、病情严重程度将32例扁平足患者配成16对,每对患者其中之一接受甲法治疗,另一患者接受乙法治疗,两种方法治疗效果见表12-2,试比较两种方法治疗效果优劣。 表12-2 甲、乙两法治疗扁平足的效果

第十章 基于秩次的非参数检验

第十章基于秩次的非参数检验习题 一、选择题 1.两小样本均数比较,方差不齐时,下列说法不正确的是(). A. 采用秩和检验 B. 采用t′检验 C. 仍用t检验 D. 变量变换后再作决定 E. 要结合正态性检验结果方能作出决定 H是(). 2. 两样本秩和检验的 A. 两样本秩和相等 B. 两总体分布相同 C. 两样本分布相同 D. 两总体秩和相等 E. 两总体均数相等 3. 在统计检验中是否选用非参数统计方法(). A. 要根据研究目的和数据特征作决定 B. 可在算出几个统计量和得出初步结论后进行选择 C. 要看哪个统计结论符合专业理论 D. 要看哪个P值更小 E. 既然非参数统计对资料没有严格的要求,在任何情况下均能直接使用 4. 配对样本差值的Wilcoxon符号秩和检验,确定P值的方法是(). A. T越大,P值越小 B.T越大,P值越大 C. T值在界值范围内,P值小于相应的α D. T值在界值范围内,P值大于相应的α E. T值在界值范围上,P值大于相应的α 5. 成组设计两样本比较的秩和检验,其检验统计量T是(). A. 为了查T界值表方便,一般以秩和较小者为T B. 为了查T界值表方便,一般以秩和较大者为T C. 为了查T界值表方便,一般以例数较小者秩和为T D. 为了查T界值表方便,一般以例数较大者秩和为T E. 当两样本例数不等时,任取一样本的秩和为T都可以查T界值表

多样本定量资料比较,当分布类型不清时应选择(). A. 方差分析 B. t检验 C. Z检验 D. Kruskal-Wallis检验 E. Wilcoxon检验 6. 多组样本比较的Kruskal-Wallis检验中,当相同秩次较多时,如果用H值而不用校正后 H值,则会(). 的 c A.提高检验的灵敏度 B.把一些无差别的总体推断成有差别 C. 把一些有差别的总体推断成无差别 D.Ⅰ、Ⅱ类错误概率不变 E. 以上说法均不对 二、简答题 1. 对于完全随机设计两样本定量资料的比较,如何选择统计方法? 2. 为什么在秩和检验编秩次时不同组间出现相同数据要给予“平均秩次”,而同一组的相同数据不必计算“平均秩次”? 3. 多组定量资料比较时,统计处理的基本流程是什么?

管理统计学习题参考答案第十一章

十一章 1. 解:回归分析是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。回归分析按照涉及的变量的多少,分为一元回归和多元回归分析;在线性回归中,按照因变量的多少,可分为简单回归分析和多重回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且自变量之间存在线性相关,则称为多元线性回归分析。 相关分析,相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。 相关分析和回归分析是研究客观现象之间数量联系的重要统计方法。既可以从描述统计的角度,也可以从推断统计的角度来说明。所谓相关分析,就是用一个指标来表明现象间相互依存关系的密切程度。所谓回归分析,就是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系。它们具有共同的研究对象,在具体应用时,相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。由于相关分析不能指出变量间相互关系的具体形式,所以回归分析要对具有相关关系的变量之间的数量联系进行测定,从而为估算和预测提供了一个重要的方法。在有关管理问题的定量分析中,推断统计加具有更加广泛的应用价值。 需要指出的是,相关分析和回归分析只是定量分析的手段。通过相关与回归分析,虽然可以从数量上反映现象之间的联系形式及其密切程度,但是现象内在联系的判断和因果关系的确定,必须以有关学科的理论为指导,结合专业知识和实际经验进行分析研究,才能正确解决。因此,在应用时要把定性分析和定量分析结合起来,在定性分析的基础上开展定量分析。 2. 解:进行回归分析通常要设定一定的数学模型。在回归分析中,最简单的模型是只有一个因变量和一个自变量的线性回归模型。这一类模型就是一元线性回归模型,又称简单线性回归模型。该类模型假定因变量Y 主要受自变量X 的影响,它们之间存在着近似的线性函数关系,即有 t t u X ββYt ++=21 该模型函数式被称为总体回归函数模型。式中的β1和β2是未知的参数,又叫回归系数。X t 和Y t 分别是X 和Y 的第t 次观测值。u t 是随机误差项,又称随机干扰项,它是一个特殊的随机变量,反映未列入方程式的其他各种因素对Y 的影响。

第十二章 基于秩转换的非参数检验

第十二章基于秩转换的非参数检验A1型题 1 .两组资料比较中,若样本例数n 较小,总体方差不齐,宜采用() A .对数变换 B .秩和检验 C . t 检验 D .方差分析 E . A 、B 都可以 2 .请指出下列五个秩和检验的结果哪个是错误的() A .配对计量资料n=12 , T +=7 , T - =71 查表T 0.05 =13 ~65 ,P<0.05 B .配对计量资料n=8 , T +=12 , T - =24 查表T 0.05 =3 ~33,P<0.05 C .两组计量资料n 1=12, n 2 =10, T 1 =173, T 2 =80 查表T 0.05 =85~145, P< 0.05 D .两组计量资料n 1=10, n 2 =10, T 1 =55,T 2 =15 查表T 0.05 =79~131 , P< 0.05 E .两组计量资料n 1=9, n 2 =13 , T 1 =58, T 2 =195 查表T 0.05 = 581~24 , P< 0.05 3 .配对比较的秩和检验,若检验假设H 成立,则() A .差值为正的秩和与差值为负的秩和相差不会很大 B .差值为正的秩和与差值为负的秩和可能相差很大 C .正秩和的绝对值大于负秩和的绝对值 D .正秩和的绝对值小于负秩和的绝对值 E .正秩和与负秩和相等 4 .以下检验方法除()外,其余均属非参数统计方法 A . Friedman's M 检验 B . H 检验 C .配对设计符号秩检验 D . t 检验 E .查r s 界值表法 5 .等级资料比较宜采用() A . t 检验 B . x2检验 C . u 检验 D .秩和检验 E .t检验 6 .两个小样本数值变量资料比较的假设检验,首先应考虑() A ,用t 检验 B .用秩和检验 C . t 检验或秩和检验均可 D .用u 检验 E .资料符合t 检验还是秩和检验的条件 7 .符合t检验条件的数值变量资料若采用秩和检验,不拒绝H 时,可使() A . I 型错误增大 B . Ⅱ型错误增大

第十一章多元线性回归与logistic回归

第十一章 多元线性回归与logistic 回归 一、教学大纲要求 (一)掌握内容 1.多元线性回归分析的概念:多元线性回归、偏回归系数、残差。 2.多元线性回归的分析步骤:多元线性回归中偏回归系数及常数项的求法、多元线性回归的应用。 3.多元线性回归分析中的假设检验:建立假设、计算检验统计量、确定P 值下结论。 4.logistic 回归模型结构:模型结构、发病概率比数、比数比。 5.logistic 回归参数估计方法。 6.logistic 回归筛选自变量:似然比检验统计量的计算公式;筛选自变量的方法。 (二)熟悉内容 常用统计软件(SPSS 及SAS )多元线性回归分析方法:数据准备、操作步骤与结果输出。 (三)了解内容 标准化偏回归系数的解释意义。 二、教学内容精要 (一) 多元线性回归分析的概念 将直线回归分析方法加以推广,用回归方程定量地刻画一个应变量Y 与多个自变量X 间的线形依存关系,称为多元线形回归(multiple linear regression ),简称多元回归(multiple regression ) 基本形式: 01122?k k Y b b X b X b X =+++???+ 式中Y ?为各自变量取某定值条件下应变量均数的估计值,1X ,2X ,…,k X 为自变量,k 为自变量个数,0b 为回归方程常数项,也称为截距,其意义同直线回归,1b ,2b ,…, k b 称为偏回归系数(partial regression coefficient ),j b 表示在除j X 以外的自变量固定条件下,j X 每改变一个单位后Y 的平均改变量。 (二) 多元线性回归的分析步骤 Y ?是与一组自变量1X ,2X ,…,k X 相对应的变量Y 的平均估计值。 多元回归方程中的回归系数1b ,2b ,…, k b 可用最小二乘法求得,也就是求出能使估计 值Y ?和实际观察值Y 的残差平方和22)?(∑∑-=Y Y e i 为最小值的一组回归系数1b ,2b ,…, k b 值。根据以上要求,用数学方法可以得出求回归系数1b ,2b ,…, k b 的下列正规方程组 (normal equation ):

第十一章秩和检验

第十一章秩和检验 A型选择题 1、以下对非参数检验的描述,哪一项是错误的()。 A.非参数检验方法不依赖于总体的分布类型 B.应用非参数检验时不考虑被研究对象的分布类型 C.非参数的检验效能低于参数检验 D.一般情况下非参数检验犯第二类错误的概率小于参数检验 E.B、E均不对 2、多样本计量资料比较,当分布类型不清时选择()。 A.t检验 B.u检验 C.秩和检验 χ检验 D、2 E.方差分析 时()。 3、符合t检验条件的数值变量资料如果采用秩和检验,不拒绝H A.第一类错误增大 B.第二类错误增大 C.第一类错误减小 D.第二类错误减小 E.两类错误都增大 4、按等级分组的资料作秩检验时,如果用H值而不用校正后的H值,则会()。 A、提高检验的灵敏度 B、会把一些无差别的总体推断成有差别 C、会把一些有差别的总体推断成无差别 D、第一、二类错误概率不变 E、一类错误增大 5、以上检验方法之中,不属于非参数检验法的是()。 A、t检验 B、符号检验 C、Kruskal-Wallis检验 D、Wilcoxon检验 χ检验 E、2 6、等级资料的比较宜用()。 A、t检验

B、秩和检验 C、F检验 检验 D、2 E、u检验 7、在进行成组设计两样本秩和检验时,以下检验假设正确的是()。 A、H :两样本对应的总体均数相同 :两样本均数相同 B、H C、H :两样本的中位数相同 :两样本对应的总体分布相同 D、H E、以上答案都不正确 8、秩和检验又叫做() A、参数检验 B、近似正态检验 C、非参数检验 D、H检验 E、Wilcoxon检验 9、当总体分布类型不清时,可采用() A、t检验 B、秩和检验 C、x2检验 D、正态检验 E、u检验 10、两个小样本比较的假设检验,应首先考虑()。 A、t检验 B.秩和检验 C.任选一种检验方法 D、资料符合哪种检验的条件 E.以上都不对 11、对于配对比较的秩和检验,其检验假设为()。 A、样本的差数应来自均数0的正态总体 B、样本的差数应来自均数为0的非正态总体 C.样本的差数来自中位数为0的总体

第8章非全参数检验练习的题目

第8章非参数检验练习题 选择题: 1. 与参数检验相比,非参数检验的主要特点是(B ) A. 对总体的分布没有任何要求 B. 不依赖于总体的分布 C. 只考虑总体的位置参数 D. 只考虑总体的分布 2. 如果要检验两个配对总体的分布是否相同,采用的非参数检验方法是(C ) A.弗里德曼(Friedman)检验 B. Kruskal-Wallis检验 C. Wilcoxon符号秩检验 D. Mann-Whitney检验 3. 如果要检验K个独立总体的分布是否相同,采用的非参数检验方法是(D ) A. Wilcoxon符号秩检验 B.弗里德曼(Friedman)检验 C. Mann-Whitney检验 D. Kruskal-Wallis检验 4. Mann-Whitney检验主要用于检验(A )

A. 两个独立总体的分布是否相同 B. 两个配对总体的分布是否相同 C. K个独立总体的分布是否相同 D. K个配对总体的分布是否相同 5. Kruskal-Wallis检验主要用于检验(D) A. 两个配对总体的分布是否相同 B. 两个独立总体的分布是否相同 C. K个配对总体的分布是否相同 D. K个独立总体的分布是否相同 6. 下面为来自两个总体的独立样本数据,要检验两个样本是否来自同一分布的总体,采用的非参数检验方法是(C) 样本1130146124152147 样本292160164197166 A. 弗里德曼(Friedman)检验 B. Wilcoxon符号秩检验 C. Mann-Whitney检验 D. Kruskal-Wallis检验

7. 下面是来自4个总体的独立样本数据,要检验这4个样本数据是否来自同一个总体,采用的非参数检验方法是(A ) 样本1样本2样本3样本4 14101116 1391217 1091216 10121314 A. 等方差的 B. 等均值的 C. 独立的 D. 相关的 8. K个独立样本的Kruskal-Wallis检验所对应的参数检验方法是(C ) A. 两个独立总体均值之差的检验 B. 两个配对总体均值之差的检验 C. 单因子方差分析 D. 双因子方差分析 9. 两个配对样本的Wilcoxon符号秩检验所对应的参数检验方法是(A ) A. 两个配对总体均值之差的检验 B. 两个独立总体均值之差的检验

第十章基于秩次的非参数检验

第十章 1. 两样本定量资料比较的假设检验,首先应考虑。 A. 用t 检验 B. 用秩和检验 C. t检验与秩和检验 D 资料符合t检验还是秩和检验的条件 E. X2检验 2.在作等级资料的比较时,宜用。 A. t 检验 B. X2检验 C. 秩和检验 D. F检验 E. 方差分析 3. 在作两样本均数比较时,已知均小于30,总体方差不齐且呈极度偏峰的资料 宜用。 A. t ′检验 B. t 检验 C.U检验 D. 秩和检验 E t ′检验和秩和检验均可 4.非参数统计的应用条件是。 A. 样本数据来自正态总体 B.若两组比较,要求两样本方差相等 C.总体分布类型未知 D.要求样本例数很大 E.总体属于某种已知的分布类型 5.在进行成组设计两样本秩和检验时,以下检验假设中正确的是。 A. H O两样本对应的总体均数相同 B. H O两样本均数相同 C. H O两样本对应的总体分布位置相同 D. H O两样本的中位数相同 E. H O两样本差值的中位数相同 6.配对设计的符号检验的基本思路是:如果检验假设成立,则对样本来 说。 A.正秩和的绝对值与负秩和的绝对值不会相差很大 B.中的秩和为零 C.正秩和的绝对值与负绝对值不会相差很大 D.正秩和的绝对值与负绝对值相等 E.符号相同,按顺序编秩 7.秩和检验和t 检验相比,其优点是。 A.计算更简便 B.公式更为合理 C. 检验效能高 D.抽样误差小 E.不受分布限制 8.秩和检验是一种。

A.U检验 B. X2检验 C.F检验 D.非参数检验 E.以上都不对 9.非参数统计不适合。 A.正态分布且方差齐的资料 B.偏态分布的资料 C.半定量资料 D.有过大值或小值的资料 E.以上均不可 11.不同人群血清反应(- + ++)资料比较宜用: A.t检验 B.X2检验 C.秩和检验 D.F检验 E. Z检验 12.成组设计两样本比较的秩和检验,其检验统计量T是。 A.以秩和较小者为T B. 以秩和较大者为T C.以例数较小者秩和为T D. 以例数较大者秩和为T E.当两样本例数不等时,科任区一样本的秩和为T 13.请指出下列五个秩和检验的结果哪个是错误的。 A.配对计量资料n=12,T+=7,T-=71,查得T0.05=13~65,P<0.05 B.配对计量资料n=8,T+=12,T-=24,查得T0.05=3~33,P<0.05 C.两组计量资料n1=12, n2=10,T1=173,T2=80,查得T0.05=84~146,P<0.05 D.两组计量资料n1=10, n2=10,T1=55,T2=155,查得T0.05=78~132,P<0.05 E.两组计量资料n1=9, n2=13,T1=58,T2=195,查得T0.05=73~134,P<0.05 14.配对设计的符号秩合检验中,其检验假设H0为。 A 差值总体均数等于零即u d=0 B 差值总体均数不等于零即u d≠0 C 差值总体中倍数等于零即M d=0 D 差值总体中位数不等于零即M d≠0 E 以上都不对 二.是非题: 1.两样本比较的秩和检验,当n1>10,n2-n1>10时采用检验属于参数检验。 ()2.完全随机设计多组独立样本比较的秩和检验得P<0.05,X需进行两两比较。 ()3.非参数检验有称任意分布检验,其意义为与任何分布无关。 ( )

医学统计学课后答案第八章秩和检验习题

1 答:适用于有序分类资料、偏态分布资料、变异较大或方差不齐的资料、分布型不明的资料及有特大、特小值或数据的一端或两端有不确定数值的资料。2答:属于非参数检验。 因为参数检验针对的是总体变量服从某种分布,即具有某个已知的函数形式,而其中的参数是未知的,统计分析的目的就是对这些未知参数进行估计或检验。但本题即使n1 > 10,n2-n1 > 10时采用的是u检验,但它比较的是分布而不是参数,所以它还是属于非差数检验。 3 答:有序分类资料可做秩和检验、等级相关分析。 4 答:(一)建立检验假设 H0:两种药的治疗效果总体分布相同; H1:两种药的治疗效果总体分布不同; α=0.05; (二)编秩和求秩和T 两组治疗心绞痛疗效比较 疗效(1) 人数合计 (4) 秩次 范围 (5) 平均 秩次 (6) 秩和 缓释片 (2) 普通片 (3) 缓释片 (7) 普通片 (8) 显效有效无效加重62 18 5 3 35 31 14 4 97 49 19 7 1-97 98-146 147-165 166-172 49 122 156 169 3038 2196 780 507 1715 3782 2184 676 合计n1=88 n2=84 172 6521 8357 (三)计算检验统计量T 由于n1 > n2 , 则取n2 组的秩和为T,故检验统计量T=T2=8357。 (四)确定P值,做出推断结论 由于n2>10 ,T分布已接近均数为n1 (N+1)/2,方差为n1 n2 (N+1)/12的正态分布,按书上式(8.3)(8.4)求出u c =3.7439 u c > 2.56, P<0.01, 按α=0.05水准拒绝H0,接受H1,差异有统计学意义。可以认为缓释片和普通片治疗心绞痛的疗效有差别。 5 答:(一)建立检验假设 H0:治疗前后HCG值的总体分布相同; H1:治疗前后HCG值的总体分布不同; α=0.05; (二)计算检验统计量T

组别+秩和检验spss方法:显效和非显效

秩 group N 秩均值 秩和 频数 对照组 26 18.88 491.00 治疗组 30 36.83 1105.00 总数 56 Z 值为-4.234,p <0.001,拒绝H 0 经检验,某治疗方法有效,治疗组效果优于对照组。 秩和检验 应用条件 ①总体分布形式未知或分布类型不明; ②偏态分布的资料: 组别 n 痊愈 显效 有效 无效 总有效率 治疗组 30 16(53.3%) 8(26.7%) 6(20.0%) 0(0.0%) 30(100.0%) 对照组 26 5(19.2%) 6(23.1%) 8(30.7%) 7(26.9%) 19(73.1%)

③等级资料:不能精确测定,只能以严重程度、优劣等级、次序先后等表示; ④不满足参数检验条件的资料:各组方差明显不齐。 ⑤数据的一端或两端是不确定数值,如“>50mg”等。 一、配对资料的Wilcoxon符号秩和检验(Wilcoxon signed-rank test) 例1对10名健康人分别用离子交换法与蒸馏法,测得尿汞值,如表9.1的第(2)、(3)栏,问两种方法的结果有无差别? 表1 10名健康人用离子交换法与蒸馏法测定尿汞值(μg/l) 样品号(1)离子交换法 (2) 蒸馏法 (3) 差值 (4)=(2) (3) 秩次 (5) 1 0.5 0.0 0.5 2 2 2.2 1.1 1.1 7 3 0.0 0.0 0.0 — 4 2.3 1.3 1.0 6 5 6.2 3.4 2.8 8 6 1.0 4.6 -3.6 -9 7 1.8 1.1 0.7 3.5 8 4.4 4.6 -0.2 -1 9 2.7 3.4 -0.7 -3.5 10 1.3 2.1 -0.8 -5 T+=+26. 5 T-=-18.5

第十一章 分类资料的统计推断

第十一章分类资料的统计推断 A1型题 1 .样本率与总体率比较时,其检验假设H0应为() A .π=π0 B .P =π0 C .P>π0 D .P<π0 E .P-π0>O 2 .总体率可信区间正态近似法估计的应用条件是() A . n 足够大,π<0.01 , nπ远大于5 B . n 足够大,总体率π或(l 一π)接近于1 C . n 较小,p 接近于50% , np 或n ( 1-P )小于5 D . n 足够大,p 或(1-p)不太小,np 或n (1-P)远大于5 E . n 较大,发生率p 或(1-p)均较小,np 或n ( 1-p)小于5 3 .三个样本率比较的X2检验,H1为() A .π1=π2=π3 B .π1≠π2≠π3 C . p1=p2=p3 D . p1≠p2≠p3 E .三总体率不等或不全相等 4 .在两行三列表资料分析中,有两格理论数分别为T11=4.46 T21=0.76 ,正确 的处理方法是() A .计算校正x2 B .进行两组构成比比较的x2检验 C .继续观察,适当增加观察单位数 D .合理归并1 、2 行,以减小理论频数 E .删除一行一列再作假设检验 5 .四格表资料x2检验中,当1 ≤T< 5 , n >40时,计算校正x2值,与未校正 相比,可使() A .P值增大 B .P值减小 C .P值可能增大也可能减小 D .P值不变 E .P值等于零 6 .经三地区黄曲霉毒素B1污染率比较,结论为拒绝H0,则可认为() A .各总体率彼此间均有差别 B .各总体率彼此间相差较大 C .各总体率间总的来讲有差别 D .任两总体率间差别均有统计学意义 E .各总体率彼此间无差别 7 .经四组率比较的才检验,得P<0.001 ,可认为()

社会调查第十一章资料分析测试

社会调查分析第十一章测试 一、填空题(每空1分,共计24分) 1、一般认为资料分析包括三方面内容,即(定性分析)、定量分析和(理论分析)。 2、定量分析是最复杂的资料分析。它按照性质可以分为两大类,一类是(描述性分析);另一类是(推论性分析)。 3、常用的集中量数有平均数、(中位数)与(众数)。 4、常见的离中量数有极差、标准差、(标准差系数)与(四分位差)。 5、目前最流行的专业电脑统计分析软件是(SPSS)软件和SAS软件。另外应用比较普遍的还有Office 中的(Excel)等。 6、定性分析的基本内容主要是(识别属性)、(要素分析)和归类。 7、常用的辩证分析方法有(矛盾)分析法、具体和抽象分析法、(现象和本质)分析法。 8、(证实)和(证伪)统称证明,是社会调查中相互联系且相互对立的两种思维方式。实践证明和逻辑证明则是证明的两种基本类型。 9、理论分析中的比较法首先需要(指标),另外还需要(比较对象)。 10、抽样推断主要由(参数估计)和(假设检验)这两部分内容组成。 11、常见的线性回归分析有(一元线性)回归分析和(多元线性)回归分析。 12、综合评价法的具体操作方法较多,其中较(聚类分析法)和(综合指数法)应用范围较广。 二、选择题(每题2分,共计18分) 资料分析中常见的描述性分析有()。 13、选择一项或多项: A. 因素分析 B. 集中量数和离中量数分析 C. 综合评价分析 D. 相对指标分析 E. 动态分析 F. 相关和回归分析 14、常用的表示发展水平的指标有增长量,平均增长量,发展水平,平均发展水平等。常用的速度指标有发展速度,增长速度,增长1%的绝对值,平均发展速度,平均增长速度等。对它们的统计分析属于()。 选择一项:

第12章秩和检验答案

第十二章秩和检验 【思考与练习】 一、思考题 1. 简述参数检验和非参数检验的区别。 2. 简述非参数检验的适用范围。 3. 同一资料,又出于同一研究目的,当参数检验和非参数检验所得结果不一致时,以何者为准,请简述理由。 二、案例辨析题 某儿科医生比较甲、乙、丙三种药物治疗小儿腹泻的疗效,将379名小儿腹泻患者随机分为三组,分别采用甲、乙、丙三种药物治疗,结果见表12-1。 表12-1 三种药物治疗小儿腹泻的疗效比较 疗效甲药乙药丙药合计 痊愈175 5 1 181 显效95 55 5 155 进步64 6 30 100 无效45 35 6 86 合计379 101 42 522 对于上述资料,该医生采用行×列表检验,得,,故认为三种药物的疗效有差别。该结论是否正确,为什么? 三、最佳选择题 1.以下方法中属于参数检验方法的是 A. 检验 B. 检验 C. 检验 D. Wilcoxon符号秩和检验 E. Wilcoxon秩和检验 2.进行两小样本定量资料比较的假设检验时,首先应考虑 A. 检验 B. 检验 C. 秩和检验 D. 检验 E. 满足参数检验还是非参数检验的条件 3.两组定量资料的比较,若已知、均小于30,总体方差不齐且呈极度偏态分布,宜采用 A. 检验 B. 检验 C. 检验 D. 方差分析 E. 秩和检验 4. 欲比较三种药物治疗效果有无差异,如果治疗效果为有序分类变量,宜采用 A. 检验 B. 方差分析 C. 检验 D.Wilcoxon秩和检验 E. 检验 5. 成组设计两样本比较的秩和检验,检验统计量T通常为 A. 较小的秩和

B. 较大的秩和 C. 样本含量较小组的秩和 D. 样本含量较大组的秩和 E. 任取一组的秩和均可 6. 配对设计秩和检验,若检验假设成立,则 A. 差值为正的秩和与差值为负的秩和相差不会很大 B. 差值为正的秩和与差值为负的秩和可能相差很大 C. 差值为正的秩和与差值为负的秩和肯定相等 D. 正秩和的绝对值大于负秩和的绝对值 E. 正秩和的绝对值小于负秩和的绝对值 7. 下列资料类型中,不宜采用秩和检验的是 A. 正态分布资料 B. 等级资料 C. 分布类型未知资料 D. 极度偏态分布资料 E. 数据一端不确定的资料 8. 某资料经配对秩和检验得,由查双侧界值如下,则值为 双侧概率0.10 0.05 0.02 0.01 界值 60~150 52~158 43~167 37~173 A. B. C. D. E. 9. 下列关于非参数检验的叙述错误的是 A. 非参数检验不依赖于总体的分布类型 B. 非参数检验仅用于等级资料比较 C. 适合参数检验的资料采用非参数检验会降低检验效能 D. 非参数检验会损失部分样本信息 E. 秩和检验是一种非参数检验方法 四、综合分析题 1. 已知某地正常人尿氟含量的中位数为 2.15mmol/L。现在该地某厂随机抽取12名工人,测得尿氟含量(mmol/L)如下: 2.15 2.10 2.20 2.12 2.42 2.52 2.62 2.72 3.00 3.18 3.87 5.67 试问该厂工人的尿氟含量是否高于当地正常人? 2. 按照年龄、性别、病情严重程度将32例扁平足患者配成16对,每对患者其中之一接受甲法治疗,另一患者接受乙法治疗,两种方法治疗效果见表12-2,试比较两种方法治疗效果优劣。 表12-2 甲、乙两法治疗扁平足的效果 病例号1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 甲法好好好好差中好好中差好差好中好中 乙法差好差中中差中差中差好差中差中差 3. 测得某工厂铅作业与非铅作业工人的血铅值( )见表12-3,请问该厂铅作业工人的血铅值是否高于非铅作业工人?表12-3 铅作业与非铅作业工人血铅值测定结果( )

第十一章 两变量关联性分析

第十一章两变量关联性分析习题 一、是非题 1、Pearson相关系数的假设检验.苦结论为不拒绝H0,可以认为两变量间无关系. () 2、在同样样本量的情况下.Pearson相关系数|r|越接近1(P<0.05).说明两变量间直线关系越密切. ( ) 3、计算关联系数时两随机变量不能为无序分类资料. () 4、|r|越大(P<0.05),说明X对Y的影响幅度越大. () 5、ρ≠0,意味着X和Y之间的因果关系成立. () 二、选择题 1.下列式中可以取负值的是: A.l xx B.l xy C.l yy D.关联系数 2.直线相关系数的假没检验,其自由度为: A.n B.n-1 C.n-2 D.2n-1 3.计算Pearson相关系数要求: A.应变量Y是正态变量.而自变量X可以不满足正态的要求 B.自变量X是正态变量.而应变量Y可以不满足正态的要求 C.应变量Y是定量指标.而自变量X可以是任何类型的数据 D.两变量都要求为满足正态分布规律的随机变量 4.两组资料进行相关性分析.一个r0.01,v1>r1>r0.05,v1,另一个r2>r0.01,v2,可认为:A.第l组资料两变量关系密切

B.第2组资料两变量关系密切 C.很难说哪一组变量关系密切 D.t r1>t r2 三、筒答题 1.r、r s和列联系数的应用条件有何不同? 2.应用线性相关分析时应该意哪些问题? 3.线性相关分析的基本步骤是什么? 4.关联性分析的χ2检验与两个或多个频数分布比较的χ2检验的设计和意义有什么区别? 5.线性相关分析中绘制散点图的目的是什么?能否用散点图来代替相关系数?

第12章秩和检验答案培训资料

第12章秩和检验答 案

第十二章秩和检验 【思考与练习】 一、思考题 1. 简述参数检验和非参数检验的区别。 2. 简述非参数检验的适用范围。 3. 同一资料,又出于同一研究目的,当参数检验和非参数检验所得结果不一致时,以何者为准,请简述理由。 二、案例辨析题 某儿科医生比较甲、乙、丙三种药物治疗小儿腹泻的疗效,将379名小儿腹泻患者随机分为三组,分别采用甲、乙、丙三种药物治疗,结果见表12-1。 表12-1 三种药物治疗小儿腹泻的疗效比较 疗效甲药乙药丙药合计 痊愈 175 5 1 181 显效 95 55 5 155 进步 64 6 30 100 无效 45 35 6 86 合计 379 101 42 522 对于上述资料,该医生采用行×列表检验,得,,故认为三种药物的疗效有差别。该结论是否正确,为什么? 三、最佳选择题 1.以下方法中属于参数检验方法的是 A. 检验 B. 检验 C. 检验 D. Wilcoxon符号秩和检验 E. Wilcoxon秩和检验 2.进行两小样本定量资料比较的假设检验时,首先应考虑 A. 检验 B. 检验 C. 秩和检验 D. 检验 E. 满足参数检验还是非参数检验的条件 3.两组定量资料的比较,若已知、均小于30,总体方差不齐且呈极度偏态分布,宜采用 A. 检验 B. 检验 C. 检验 D. 方差分析 E. 秩和检验 4. 欲比较三种药物治疗效果有无差异,如果治疗效果为有序分类变量,宜采用 A. 检验 B. 方差分析 C. 检验 D.Wilcoxon秩和检验 E. 检验 5. 成组设计两样本比较的秩和检验,检验统计量T通常为 A. 较小的秩和

第十一章 非参数检验

第十一章非参数检验 第一节符号检验 符号检验的方法·符号检验的特点和作用 第二节配对符号秩检验 配对符号秩检验的方法·配对符号秩检验的效力 第三节秩和检验 秩和检验的方法·秩和检验的近似 第四节游程检验 游程的概念·游程检验的方法·差符号游程检验 第五节累计频数检验 累计频数检验的方法·累计频数检验的应用 一、填空 1.非参数检验,泛指“对分布类型已知的总体进行参数检验”()的所有检验方法。 2.符号检验的零假设就是配对观察结果的差平均起来等于()。 3.理论研究表明,对于配对样本非正态分布的差值d,()是最佳检验。 4.秩和检验检验统计量U是U1和U2中较()的一个。 5.秩尺度之统计量的均值和标准差只取决于()。 6.()常被用作经验分布与理论分布的比较。 7.绝对值相等的值,应将它们的秩()。 8.符号检验,在分布自由检验中称为()。 9.符号检验和配对符号秩检验,都只适用于()样本。 10.数据序列ABBABAAABABBABBAAAAAB的总游程数是() 二、单项选择 1.下列检验中,不属于非参数统计的方法的是()。 A总体是否服从正态分布 B 总体的方差是否为某一个值 C 样本的取得是否具有随机性 D 两组随机变量之间是否相互独立 2.下列情况中,最适合非参数统计的方法是()。 A反映两个大学新生成绩的差别 B 反映两个大学新生家庭人均收入的差别 C 反映两个大学三年级学生对就业前景的看法差别 D反映两个大学在校生消费水平的差别 3.不属于非参数检验的是()。 A符号检验B游程检验C累计频数检验 D F检验 4.在累计频数检验中,卡方的自由度为()。 A n1 B 2 C n2 D n1+n2

相关主题
文本预览
相关文档 最新文档