讲稿7秩和检验MBA
- 格式:pdf
- 大小:379.46 KB
- 文档页数:10
秩和检验(rank sum test )四川大学华西临床医学院循证医学与临床流行病学教研室刘关键一. 秩和检验的概述在实践中我们常常遇到以下一些资料,如,需比较患者和正常人的血血铅值、铁蛋白、不同药物的溶解时间、实验鼠发癌后的生存日数、护理效果评分等。
这类资料有如下特点:(1)资料分布类型已知,但不服从正态分布的资料,如偏态分布的计量资料;(2)资料的总体分布未知,如两端无界的计量资料; (3)等级资料。
如果是上述类型的计量资料,目前最使用的统计方法是非参数统计方法。
t 检验、方差分析、均数的可信区间等统计推断方法,通常都要求样本来自正态总体(即分布型是已知的),在这种基础上,对总体参数(如总体均数)进行估计或检验。
这类建立在已知总体的指标(参数)基础上的统计分析方法,称之为参数统计(parametric statistics )。
参数统计方法非参数统计(nonparametric statistics )方法并不依赖于总体分布的形式,应用时可以不考虑被研究的对象为何种分布以及分布是否已知,由于这种假设检验方法,并非是参数间的比较,而是用于分布之间的比较,故此称为非参数检验。
如果不知道所研究样本来自总体的分布形式或已经知道总体分布与检验所要求的假定不符,此时可用非参数统计方法。
非参数统计方法参数法与非参数法的结论需要指出,若总体分布未知或是偏态分布的资料,盲目使用参数检验,由于总体分布的基本假定得不到满足,那么根据这些假定所进行的推断亦难达到准确,所用参数法确定的P值也就不能用于结论。
此时,若用非参数检验,由于不受总体分布的影响,假设检验的P值和结论则是正确的。
非参数检验主要特点不受总体分布的限定、适用范围广。
对数据的要求不像参数法那样严格,不论研究的是何种类型的变量,包括那些难以准确测量、只能以严重程度、优劣等级、次序先后等表示的资料;或有的数据一端或两端是不确定数值。
非参数检验主要缺点符合参数法(如t检验)的资料,如果使用非参数法,因没有充分利用资料提供的信息,检验效率低于参数法,非参数法犯第二类错误(β)的概率比参数法大。
若要使两法的β相同,非参数法比参数法需要更大的样本含量。
故适合参数检验条件的资料,应首选参数检验。
非参数法的种类非参数检验方法很多,如秩和检验、符号检验、趋势检验、游程检验、Ridit分析等。
此处仅介绍非参数法中检验效率较高又比较系统和完整的秩和检验(rank sum test)。
其中秩即按数据大小排定的顺序号。
顺序之和称为秩和,秩和检验就是用秩次(顺序)之和作为统计量进行假设检验的方法。
二.不同设计的秩和检验1.配对秩和检验(signed rank test)2.两组比较的秩和检验(Wilcoxon法)3.多组比较的秩和检验(Kruskal-Wallis法)4.随机区组设计的秩和检验(Friedman法)秩和检验的主要种类(一)配对秩和检验(Wilcoxon signed-rank test)基本思想对配对比较的资料可采用符号秩和检验(Wilcoxon signed-rank test)。
该检验的基本思想是: 若无效假设成立,则差值秩次的总体分布应是对称的,即正负秩和相差不应悬殊太大,否则拒绝无效假设,接受备择假设。
实例分析12份血清两法测定结果的比较编号 原法新法差值 正秩 负秩1 60 80 20 82 142 152 10 53 195 243 48 114 80 82 2 1.55 242 240 -2 1.56 220 220 07 190 205 15 78 25 38 13 69 212 243 31 910 38 44 6 411 236 200 -36 1012 95 100 5 3T+=54.5 T-= 11.5建立假设检验假设如下:H0:两法测定结果差值的总体中位数为零,即M=0;H1:两法测定结果差值的总体中位数不为零,即M≠0;检验水准α=0.05。
计算统计量①计算各对子的差值;②按差值的绝对值大小,由小到大编秩;③若差值的绝对值等于0,则舍去;若差值的绝对值相等时,取平均秩次;④对各秩次分别冠以原差值的正负号;⑤分别计算正、负秩次之和,即T+和T-,较小者为统计量T;实例分析的结论本例,T=11.5,查表得双侧T0.05,11=10−56,P>0.05,按双侧α=0.05水准,不拒绝H, 故尚不能认为两法测定结果有差别。
-3.0-2.0-1.00.0 1.0 2.0 3.0uφ(u )95. 0%99. 0%5404410.01<P<0.050.01<P<0.05P<0.01P<0.01P>0.05(二)两组比较的秩和检验(Wilcoxon 法)基本思想两样本成组资料的比较可采用Wilcoxon 秩和检验。
该检验的基本思想是:若无效假设成立(两组的总体分布相同),则两组的秩次之和不应相差太大;否则拒绝无效假设,接受备择假设。
实例分析肺癌病人与矽肺0期工人的RD 值的比较 肺癌病人 矽肺0期工人 RD 值 秩次 RD 值 秩次 2.78 1 3.23 2.5 3.23 2.5 3.50 4 4.20 7 4.04 5 4.87 14 4.15 6 5.12 17 4.28 8 6.21 18 4.34 9 7.18 19 4.47 10 8.05 20 4.64 11 8.56 21 4.75 12 9.60 22 4.82 13 4.95 15 5.10 16 N 1=10 T 1=141.5 N 2=12 T 2=111.5建立假设秩和检验的假设如下:H 0:肺癌病人与矽肺0期工人的RD 值的总体分布位置相同;H 1:肺癌病人的RD 值高于矽肺0期工人的RD 值(单侧);检验水准α=0.05。
计算统计量①两组不分组别混合编秩; ②若遇数值相等时,取平均秩次; ③分别求两组的秩次之和;④若n 1≠n 2时,用例数较小组的秩和做为统计量T ;若n 1=n 2时,任取一组的秩和为统计量T ;实例分析的结论本例n 1<n 2,取T=141.5,查附表, T 0.05,2,10=89−141,T 0.025,2,10=84−146,得0.025<P<0.05, 按单侧α=0.05水准,拒绝H 0, 接受H 1,故可认为肺癌病人与矽肺0期工人的RD 值不相同,肺癌病人的RD 值高于矽肺0期工人的RD 值。
矽肺0期工人的RD 值的平均秩次为111.5/12=9.29,肺癌病人的RD 值平均秩次为141.5/10=14.15。
-3.0-2.0-1.00.0 1.0 2.0 3.0uφ(u )95. 0%99. 0%84146154760.01<P<0.050.01<P<0.05P<0.01P<0.01P>0.05(三)两组频数表资料(等级资料)比较的秩和检验(Wilcoxon 法)实例分析结果 正常人 病人 合计 - 11 5 16 + 10 18 28 ++ 3 16 19 +++ 0 5 5 合计 24 44 68秩和的计算方法合计 秩次范围 平均秩次 正常人秩和 病人秩和 16 1-16 8.5 93.5 42.5 28 17-44 30.5 305.0 549.0 19 45-63 54.0 162.0 864.0 5 64-68 66.0 0.0 330.0 68 560.5 1785.5计算统计量①两组不分组别混合编秩; ②若遇数值相等时,取平均秩次; ③分别求两组的秩次之和;④若n 1≠n 2时,用例数最小组的秩和做为统计量T ;若n 1=n 2时,任取一组的秩和为统计量T ;实例分析的结论本例n 1<n 2,取T=560.5,查附表, 得P<0.01, 按双侧α=0.05水准,拒绝H 0, 接受H 1,故可认为两组测定结果不相同,正常人平均秩次为23.35,患者组平均秩次为40.58,可认为正常人的测定结果小于对照组。
等级资料错判为计数资料一痊愈 有效 进步 无效 χ2 P甲药 25 11 50 20 8.526 0.036乙药 15 17 40 34Wilcoxon W=10497.0 P=0.061组别轻中重合计χ2P 第1组18 12 30 60 7.900 0.019第2组15 26 19 60合计33 38 49 120Wilcoxon W=3444.0 P=0.298(四)多组比较的秩和检验(Kruskal-Wallis 法)简述多个成组资料的比较不能使用两组比较的方法进行检验。
秩和检验也是如此。
多组资料比较的秩和检验可使用Kruskal-Wallis法。
该法又简称K-W检验或H检验。
实例分析不同时间空气中的CO2含量课前 课中 课后含量 秩和 含量 秩和 含量 秩和0.48 1 4.45 12.5 2.95 7 0.53 2 4.73 14 3.07 8 0.55 3 4.77 15 3.18 9 0.55 4 4.82 16 3.20 10 0.58 5 4.89 17 3.30 11 0.62 6 5.00 18 4.45 12.5R i 21 92.5 57.5 n 6 6 6 平均秩次 3.5 15.42 9.58建立假设不同时间点空气中的CO2含量比较的秩和检验假设如下:H0:不同时间空气中的CO2含量的总体分布相同;H1:不同时间空气中的CO2含量的总体分布不同或不全相同;检验水准α=0.05。
计算统计量(一)①多组不分组别,混合编秩;②若遇数值相等时,取平均秩次;③计算各组秩次之和R i;④利用R i计算出检验统计量H;计算统计量(二)H= 12N(N+1) ∑R i 2n i- 3(N+1)若相同秩次较多时(如超过25%),需进行校正,校正公式如下:H C =HC式中 C=1-∑(t j 3-t j ) (N 3-N) 实例计算本例:H =1218(18+1) ×(2126 + 92.526 +57.526 )- 3(18+1)=14.95H= 12N(N+1) ∑R i 2n i- 3(N+1)K-W 法检验的概率查H 界值表或查χ2值表,确定概率(P )大小,并做出统计结论。
若组数k=3, 每组例数≤5,可查H 界值表得出P 值。
若组数k ≥3,或每组例数>5,H 近似于服从ν=k-1=的χ2分布,故可查χ2界值表。
实例分析结论本例,H=14.95,查ν=2的χ2界值表得P<0.005。
按α=0.05水准,拒绝H 0, 接受拒绝H 1, 故可认为3个不同时间空气中的CO 2含量不等或不全相等。
K-W 法秩和检验两两比较方法与方差分析相似,多个样本组比较的秩和检验,如拒绝H 0,只说明比较各组的总体分布位置不同或不全相同,若要对每两组间进行比较可使用两两比较。