当前位置:文档之家› 第9题【08分】__秩和检验

第9题【08分】__秩和检验

第9题【08分】__秩和检验
第9题【08分】__秩和检验

一、两组计量资料比较(15分)

题干由试题和相关SPSS 分析结果组成 1.根据资料选择正确的统计检验方法;

2.请写出假设检验步骤:检验假设,检验水准,根据SPSS 结果选择正确的统计量值和P 值、并作出结果判断。

3.说明:正态性检验提供K-S 检验结果;方差齐性检验提供Levene ’s 检验结果。

正态性检验和方差齐性检验不必列出检验步骤,作出判断即可。

可能包括的内容:

● 配对设计的两样本均数比较的t 检验 ● 成组设计的两样本均数比较的t 检验 ● 成组设计的两样本均数比较的近似t 检验 ● 配对设计的两样本比较的符号秩和检验 ● 成组设计的两样本比较的秩和检验 举例:

⑴成组设计的两样本均数比较的t 检验

某医生测得18例慢性支气管炎患者及16例健康人的尿17酮类固醇排出量(mg/dl)分别为X 1和X 2, 试问两组的均数有无不同。

X1:3.14 5.83 7.35 4.62 4.05 5.08 4.98 4.22 4.35 2.35 2.89 2.16 5.55 5.94 4.40 5.35 3.80 4.12

X2:4.12 7.89 3.24 6.36 3.48 6.74 4.67 7.38 4.95 4.08 5.34 4.27 6.54 4.62 5.92 5.18

O n e -S a m p l e K o l m o g o r o v -S m i r n o v T e s t

18

16

4.4544

5.29871.3245

1.3820

.102.113.075.113-.102-.091.434.452.992

.987

N

Mean

Std. Deviation Normal Parameters a,b Absolute Positive Negative

Most Extreme

Differences

Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed)

慢支患者

健康者

Test distribution is Normal.a. Calculated from data.

b.

Ind epend ent Sa mples Test

.225.638-1.81832.078

-.8443

.4644

-1.7904.1017-1.813

31.163

.079

-.8443

.4656

-1.7938

.1052

Equal variances assumed

Equal variances not assumed

X

F Sig.Levene's Test for Equality of Variances

t df Sig.(2-tailed)

Mean Difference

Std. Error Difference

Lower Upper 95% Confidence

Interval of the Difference

t-test for Equality of Means

【答案】

1.此资料是计量资料,研究设计为完全随机设计 (又称成组设计);

2.根据正态性单样本K-S 检验结果:P 值分别为 0.992、0.987,均大于 0.1,因此两样本均服从正态分布;

3.根据方差齐性检验结果:F=0.225、P=0.638,P >0.05,因此两样本总体方差齐性;

4.根据以上三点,统计方法选用成组设计两样本t 检验,其假设检验过程如下: ①建立假设检验,确立检验水准:

H 0:u1=u2,即两组的总体均数相同

H 1:u1≠u2,即两组的总体均数不同;α=0.05 ②选择检验方法,计算检验统计量t 值:(Sig.=0.638 >0.1,用第一行的p, t )

ν=18+16-2=32;t= -1.818 ③确定 P 值,做出统计推断:

P=0.078>0.05,按α=0.05的检验水准,不拒绝H0,差异无统计学意义。 因此尚不能认为慢性支气管炎患者和健康人尿17酮类固醇排出量有差别。

⑵成组设计的两样本均数比较的近似t检验或成组设计的两样本比较的秩和检验

【05真题】【04真题】第一题

随机抽样调查了某地绣品厂和蓄电池厂工人各10名,测定其血中锌卟啉含量(μg/100ml)如下表。问这两个工厂工人血中锌卟啉含量有无差别?(15分)

某地绣品厂和蓄电池厂工人血中锌卟啉含量(μg/100ml)结果

绣品厂12.1 42.9 0.0 0.0 11.1 25.0 0.0 26.3 9.1 25.0

蓄电池厂72.5 75.3 28.3 60.0 70.5 73.1 60.0 20.0 20.0 32.6

要求:请写出上述题目假设检验过程:检验假设、检验水准、统计检验方法、检验统计量值和P值,并作出结果判断(正态性检验和方差齐性检验不必列出检验步骤,作出判断即可)。SPSS软件有关分析结果见附页。

【答案1】近似t检验

1.此资料是计量资料,研究设计为完全随机设计(又称成组设计);

2.根据正态性单样本K-S检验结果:P值分别为0.886、0.575,均大于0.1,因此两样本均服从正态分布;

3.根据方差齐性检验结果:F=7.454、P=0.014,P<0.05,因此两样本总体方差不齐;

4.根据以上三点,统计方法选用成组设计两样近似t检验,其假设检验过程如下:

①建立假设检验,确立检验水准:

H0:u1=u2,即两组的总体均数相同;H1:u1≠u2,即两组的总体均数不相同;α=0.05

②选择检验方法,计算检验统计量t值:(Sig.=0.014 < 0.1,用第二行的p, t )

t= -4.013,ν=14.960

③确定P值,做出统计推断:

P=0.001<0.05,按α=0.05的检验水准,拒绝H0,接受H1,差异有统计学意义。

因此认为两个工厂工人血中锌卟啉含量有差别。

【答案2】成组设计秩和检验

1.此资料是计量资料,研究设计为完全随机设计(又称成组设计);

2.根据正态性单样本K-S检验结果:P值分别为0.886、0.575,均大于0.1,因此两样本均服从正态分布;

3.根据方差齐性检验结果:F=7.454、P=0.014,P<0.05,因此两样本总体方差不齐;

4.根据以上三点,统计方法选用两独立样本比较的Wilcoxon符号秩和检验,其假设检验过程如下:

①建立假设检验,确立检验水准:

H0:两个工厂工人血中锌卟啉含量总体分布相同;H1:两个工厂工人血中锌卟啉含量总体分布不同;α=0.05

②选择检验方法,计算检验统计量t值:

混合编秩;分组求秩和;以样本例数较少组对应的秩和为统计量T,若两组样本例数相等则任取一组的秩和为统计量。

T=65或145,n1=10,n2-n1=0

③确定P值,做出统计推断:

查T界值表(P717),得P<0.005,按α=0.05的检验水准,拒绝H0,接受H1,差异有统计学意义。

因此认为两个工厂工人血中锌卟啉含量有差别。

二、两样本率比较(χ2

检验或确切概率法)(15分)

题干由试题和相关SPSS 分析结果组成 1.根据资料选择正确的统计检验方法; 2.列出计算表;

3.请写出假设检验步骤:检验假设,检验水准,列出计算公式,根据SPSS 结果选择正确的统计量值和P 值、 并作出结果判断。

1.成组设计四格表资料χ2检验 举例:

①表3.5 两种药物治疗十二指肠球部溃疡效果 处理 愈合 未愈合 合计 愈合率(%) 呋喃硝胺组 甲氰咪胍组 合计

54(48.22) 8(13.78) 62 87.10 44(49.78) 20(14.22) 64 68.75 98 28 126 77.78

Chi-S q u are T ests

6.133b 1.013

5.1181.024

6.304

1

.012

.018

.011

6.0841

.014

126

Pearson Ch i-S q uare Con tin u ity Correction a Lik elihood Ratio Fish er's Exact Test

Lin ear-b y-Linear Association N of Valid Cases

Valu e

d f Asymp . Sig.(2-sid ed )Exact S ig.(2-sid ed )

Exact S ig.(1-sid ed )

Computed only for a 2x2 table

a. 0 cells (.0%) ha ve ex pected count less than 5. The minimum expected count is 13.78.

b.

四格表χ2

检验——Pearson χ2

(T min =(28*62)/126=13.78,n=126,符合条件T ≥5且n ≥40 )

②某医学院随机抽查四年级和五年级学生的近视眼患病情况如下表,问两个年级的近视眼患病率有无差别?

四年级和五年级学生的近视眼患病率比较 年级 检查人数 近视人数 近视率(%)

四年级

28 2 7.14 五年级

14 5 35.71

四年级和五年级学生的近视眼患病患病率比较计算表 年级 近视人数 无近视人数 合计

四年级

2 26 28 五年级

5 9 14 合计

7 35 42 33.242

14

7T min =?=

四格表校正χ2检验 (符合条件1≤T<5且n>40)

③某防疫站观察当地的一个污水排放口,在高温季节和低温季节水样的伤寒菌检出情况,资料如下表,问两个季节污水的伤寒菌检出率有无差别?

高低温季节污水中伤寒菌的检出率 季节气温 阳性水样数 阴性水样数 合计 阳性率(%)

高 1(4) 11(8) 12 8.33 低 7(4) 5(8) 12 58.33 合计

8

16

24

33.33

四格表Fisher 确切概率法 (n=24 <40)

【05真题】第五题(15分)

为观察药物A,B 治疗某病的疗效,某医生将100例该病患者随机分成两组,一组40人,服A 药;另一组60人服B 药。结果发现:服A 药的40人中有30人治愈;服B 药的60人中有11人治愈。问A 、B 两药对该病的疗效有无差别? 要求:请写出上述题目假设检验过程: 检验假设、检验水准、计算表、统计检验方法、检验统计量值和P 值,并作出结果判断。

Ch i-S qu are Te sts

10.550b

1.001

9.0971.00310.427

1

.001

.002

.001

10.433

1

.001

90

Pe arson Chi-S qua re

Continuity Correc tion

a Lik e lihood Ra tio Fishe r's Exa ct Test

Line ar-by -Linea r Assoc ia tion N of Valid Case s

Value df

Asy mp. S ig.(2-side d)

Exac t Sig.(2-side d)

Exac t Sig.(1-side d)

Computed only for a 2x2 table

a. 0 ce lls (.0%) have expe cted c ount le ss than 5. The minim um e xpec te d count is 11.00.

b.

【答案】

1.此资料是按服A 、B 药疗效(治愈、未治愈)分类的二分类资料,即计数资料。

2.将100例该病患者随机分成两组,属于完全随机设计方案。

3.该资料的目的是通过两样本率的比较来推断它们分别代表的两总体率有无差别,是成组设计两样本率比较,因此,统计方法选用成组设计四格表资料χ2检验(Chi-Square Test )。

4.列出计算表:

处理 治愈 未治愈 合计

治愈率(%) A 药 30(a ) 10(b ) 40(a +b )

75.0 B 药 11(c ) 49(d ) 60(c +d ) 18.3 合计

41(a +c )

59(b +d )

100(n )

41.0

5.假设检验过程如下:

①建立假设检验,确立检验水准:

H 0:两种药物的疗效无差别,即π1=π2=41.0%;H 1:两种药物的疗效有差别,即π1≠π2;α=0.05 ②计算检验统计量χ2值:

理论数(T)值的计算:T=(n R n C )/n ,T min =(41*40)/100=16.4 满足T ≥ 5,而且n ≥ 40条件,因此直接用χ2检验。

;ν=(2-1)(2-1)=1

③确定 P 值,做出统计推断:

根据SPSS 软件有关分析结果,χ2=10.550,ν=1,P =0.001<0.05,按α=0.05的检验水准,拒绝H 0,接受H 1,差异有统计学意义。可以认为两种药物的疗效有差别。 【

04真题】第二题

研究盐酸丁咯地尔改善周围血管闭塞性病变患者的皮肤微循环状况,以安慰剂作对照得结果如下表。问盐酸丁咯地尔是否具有改善缺血组织的皮肤微循环作用?(15分)

盐酸丁咯地尔改善缺血组织的皮肤微循环状况 处 理 例数 改善数 改善率(%)

盐酸丁咯地尔组

20 15 75.00 安慰剂组

16 2 12.50 要求:请写出上述题目假设检验过程:检验假设、检验水准、计算表、统计检验方法、检验统计量值和P 值,并作出结果判断。

【答案】(参考05年第五题) ⑴列出计算表

组别 有效 无效 合计

安慰剂组

2 14 16 盐酸丁咯地尔组

15 5 20 合计 17 19 36 ⑵n=36 <40,应用Fisher 确切概率法。

【06真题】第五题

某医院收治了186例重症乙型脑炎患者,随机分成两组,分别用同样的方法治疗,但其中一组加一定量的人工牛黄,治疗结果如下所示,问加人工牛黄是否增加该方剂的疗效?(15分)

要求:写出上述题目假设检验过程:检验假设、检验水准、计算表、检验统计量的计算公式、检验统计量值和 P 值,并作出结果判断。 【答案】(参考05年第五题)

2.配对设计四格表资料 2

检验

应用条件:

举例:

已确诊肝癌患者100人,每个患者分别用甲,乙两法检测AFP ,结果如下表。问甲、乙两法AFP 阳性检出率有无差别?

甲、乙两法AFP 阳性检出情况

甲法 乙法

合计

+ - + 60 20 80 - 10 10 20 合计 70 30 100

Chi-S q

uare Tests

.099a 100

McNe m ar Test N of Valid Cases Valu e Exac t S ig.

(2-s id ed)

Bino mia l distribution used.

a.

三、方差分析(15分) 提供某一实验资料,可能有如下要求: 1.指出该实验属何种设计(方差分析);

2.按照题义,把总变异分成几个部分,并说明各部分的意义。并计算各部分的自由度。

3.提供SPSS 的方差分析表,作出正确的结论。

4.若方差分析结果有统计学意义,进一步比较的方法选择。

①表5.1 三种方案治疗后血红蛋白增加量(g/L)

A

B C 24 20 20 36 18 11 25 17 6 14 10 3 26 19 0 34 24 -1 23 4

5

②表5.3 三种方法治疗后血红蛋白增加量(g/L)

区组 A 疗法 B 疗法 C 疗法 1 16 18 18 2 15 16 20 3 19 27 35 4 13 13 23 5 11 14 17 6 10 8 12 7 5 3 8 8

-2

-2

3

③表5.6 12名病人用A 、B 两法治疗的血压下降(kPa)

阶段 病 人 编 号 1

2 3 4 5 6 7 8 9 10 11 12 Ⅰ B B A B A A A A B B B A 3.07 1.33 4.40 1.87 3.20 3.73 4.13 1.07 1.07 2.27 3.47 2.40 Ⅱ A A B A B B B B A A A B 2.80 1.47 3.73 3.60 2.67 1.60 2.67 1.73 1.47 1.87 3.47 1.73 合计

5.87

2.80 8.13 5.47 5.87

5.33

6.80

2.80

2.54

4.14

6.94

4.13

④表5.12 A 、B 两药治疗后病人红细胞增加数(1012/L)

A 药

B 药 A+B 药 不用药 1.3 0.9 2.1 0.8 1.2 1.1 2.2 0.9 1.1

1.0

2.0

0.7

随机区组设计资料的方差分析表:

SS 总= SS 组间 + SS 组内

SS 总= SS 处理 + SS 配伍 + SS 误差

---完全随机设计资料的方差分析(单因素方差分析)

---随机区组设计资料的方差分析(双因素方差分析)

SS 总= SS 阶段 + SS 疗法 + SS 个体 + SS 误差

---两阶段交叉设计的方差分析

SS 总= SS A +SS B + SS AB + SS 误差

---析因设计的方差分析

举例:

【06真题】第二题;【03真题】第五题

研究酵解作用对血糖浓度的影响,某医生从8名健康人中抽取了血液并制备成血滤液。每一个受试者的血滤液又分成4份,然后随机把4份血滤液分别放置0、45、90、135分钟测定其中血糖浓度。(15分)

问题:

1.指出该实验属何种设计?

2.按照题义,把总变异分成几个部分,并说明各部分的意义。

3.欲分析放置不同时间的血滤液所含血糖浓度间总的来讲有无变化,经计算,得检验统计量值为77.31,

请确定P值,并作出判断。

4.若进一步作两两比较,以“放置0分”组为共同对照,宜选择何检验方法?

【答案】

1.该实验属于随机区组设计;

2.总变异(SS总)可以分解为三个部分:处理组间变异(SS处理)、区组间变异(SS区组)和误差(SS误差):

SS总:反应所有观察值之间的变异;

SS处理:由处理因素的不同水平作用和随机误差产生的变异;

SS区组:由不同区组作用和随机误差产生的变异;

SS误差:完全由随机误差产生的变异

3.假设检验过程如下:

①建立假设检验,确立检验水准:

对于处理组:H0:四个不同时间血糖浓度的总体均数相等,即μ1=μ2=μ3=μ4;

H1:四个总体均数不等或不全相等;α=0.05

对于区组:H0:八个区组的总体均数相等,即μ1=μ2= (8)

H1:八个区组的总体均数不等或不全相等;α=0.05

②计算检验统计量F值:

F处理=MS处理/MS误差=0.9681/0.0125=77.31

F区组=MS区组/MS误差=0.3569/0.0125=28.552

V总=N-1=32-1=31

V处理=k-1=4-1=3

V区组=b-1=8-1=7

V误差=(k-1)(b-1)=3×7=21

③确定P值,做出统计推断:

推断处理间的差别,按v1=3,v2=21查F界值表(P698),得F0.05(3, 21)=3.07,F0.01(3,21)= 4.87,P<0.01;

推断区组间的差别,按v1=7,v2=21查F界值表(P698),得F0.05(7, 21)= 2.49,F0.01(7,21)= 3.65,P<0.01。

按α=0.05检验水准皆拒绝H0,接受H1,可认为放置时间长短会影响血糖浓度且不同受试者的血糖浓度亦有差别。但尚不能认为任两个不同放置时间的血糖浓度总体均数皆有差别,必要时可进一步作两两比较的q检验。

C=(ΣX)2/n=(169.56)2/32=898.45605

SS总=ΣX2-C=904.1214-898.45605=5.66535

V总=n-1=32-1=31

V处理=k-1=4-1=3

V区组=b-1=8-1=7

V误差=(k-1)(b-1)=3×7=21

SS误差=SS总-SS处理-SS区组=5.66535-2.90438-2.49800=0.26297

MS处理=SS处理/v处理=2.90438/3=0.9681

MS区组=SS区组/v区组=2.49800/7=0.3569

MS误差=SS误差/v误差=0.26297/21=0.0125

4.q检验

为研究雌激素对子宫发育的作用,用四个种系的未成年雌性大白鼠各3只,每只按一定剂量注射雌激素,至一定时间取出子宫并称重,结果如下表所示:(15分)

问题:

1.上述试验属何种试验设计?

2.按照题义,把总变异分成哪几个部分?并说明各部分的意义。

3.根据附页SPSS 计算结果,作出正确的结论。

【答案】

1.此试验属于随机区组设计

2.总变异可以分解为3部分,其各自的意义如下:

SS 处理:由处理因素(雌激素)的不同水平作用和随机误差产生的变异; SS 区组:由不同区组(不同种系)作用和随机误差产生的变异; SS 误差:完全由随机误差产生的变异 3.由SPSS 结果可得出如下结论:

①三种不同剂量的雌激素作用后,子宫重量的总体均数全不相等,即不同剂量的雌激素对子宫的重量有影响。 ②不同种系大白鼠对雌激素的反应也不同。

随机区组方差分析表

多样本均数间的多重比较分析表

某试验研究加用可的松是否影响党参对ATP酶的作用,结果如下表:(15分)

可的松影响党参对ATP酶的试验结果

盐水可的松+盐水可的松+党参盐水党参+盐水

4.621 3.754 3.281 4.881

4.208 3.408 4.011 4.818

4.932 4.634 4.251

5.769

5.139 4.054 4.218 5.181

4.815 4.645 3.239 4.913 问题:

1.上述试验属何种试验设计?

2.按照题意,把总变异分成哪几个部分?并说明各部分的意义。

3.若检验统计量F(可的松×党参)=2.704,请确定P值,并作出判断。

【答案】

1. 2×2析因分析

2.变易分解:

SS总=SS处理+SS误差=SS A+SS B+SS AB+SS误差

=SS可的松+SS党参+SS可的松*党参+SS误差

SS可的松:可的松的主效应

SS党参:党参的主效应

SS可的松*党参:可的松和党参的交互作用

SS误差:完全由随机误差产生的变异

3.P>0.05,结论为可的松不影响党参对A TP酶的作用。

SS df MS F P

党参 1

可的松 1

党参*可的松 1 2.704 >0.05

误差16

总变异19

四、多因素分析(15分) 可能涉及范围:多元线性回归、logistic 回归、COX 回归。要求: 1.提供某一资料,选择统计分析方法

2.偏回归系数、标准偏回归系数、决定系数、校正决定系数、OR 等常用指标的意义与应用

3.列回归方程 举例:

(一) 多元线性回归

27名糖尿病人的血清总胆固醇、甘油三脂、空腹胰岛素、糖化血红蛋白、空腹血糖的测量值如下表:

问题:

1.欲分析影响空腹血糖浓度的有关因素,宜采用什么统计分析方法?

2.已知甘油三酯(X2)、胰岛素(X3)和糖化血红蛋白(X4)是主要影响因素,现欲比较上述因素对血糖浓度的相对影响强度,应计算何种指标?

3.分析其回归模型的好坏宜选用何种指标?

4.根据给出SPSS 结果,做出正确的结论。

5.列出回归方程。

【答案】

1.此资料包含有四个变量,属于多变量计量资料,为多因素设计。要分析多因素对空腹血糖浓度的影响, 宜采用多元线性回归分析。

2.标准偏回归系数可用来比较各自变量Xj 对Y 的影响强度,有统计意义下,回归系数绝对值越大,对Y 的作用越大。 SPSS 输出的多元回归分析结果中给出的各变量的标准偏回归系数,

比较三个标准偏回归系数:甘油三脂: 胰岛素: 糖化血红蛋白=0.354: 0.360: 0.413≈1: 1.02: 1.17(倍) 对血糖的影响强度大小依次为:糖化血红蛋白X4 >胰岛素X3 >甘油三脂X2 3.校正决定系数( R 2a )作为评价标准。

一般说决定系数(R 2)越大越优,但由于R 2是随自变量的增加而增大,因此,不能简单地以R 2作为评价标准, 而是用校正决定系数(R 2a )作为评价标准。R 2a 不会随无意义的自变量增加而增大。 4.空腹血糖浓度与总胆固醇无关,与甘油三脂、空腹胰岛素、糖化血红蛋白线性相关。

5.最优回归方程为:432663.0287.0402.05.6?X X X y

+-+=

【答案具体分析】---多元线性回归

1.此资料包含有四个变量,属于多变量计量资料,为多因素设计。要分析多因素对空腹血糖浓度的影响, 宜采用多元线性回归分析。

2.根据样本数据求得模型参数β0,β1,β2,β3,β4的估计值b0,b1,b2,b3,b4。β0称为截距,β1,β2…βm 称为偏回归系数。

求得回归方程为:4321638.0271.0351.0142.0943.5?X X X X y

+-++= 3.对总的回归方程的假设检验和评价:

检验所有自变量X1,X2,X3,X4作为整体与应变量Y 之间是否具有线性关系。 ⑴方差分析法:

H0:β1=β2=β3=β4=0;

H1:β1, β2, β3,β4不全为0;α=0.05

查表F 界值表得(P698),得F 0.01(4,22) =4.31,F=8.278>4.31,P <0.01

依据SPSS 结果,P=0.000<0.05,按α=0.05的检验水准,拒绝H 0,接受H 1,认为所拟合的回归方程具有统计学意义。

⑵决定系数R 2:根据方差分析结果R 2

=0.601,说明空腹血糖浓度变异的60%可由血清总胆固醇、甘油三脂、空腹胰岛素、糖化血红蛋白的变化来解释。

回归模型的好坏以决定系数(R 2)越大越优,但由于R 2是随自变量的增加而增大,即使无显著性的变量进入方程,其值亦增加。因此,在相近的情况下,以包含的自变量少者为优,也可用校正决定系数(R 2a )作为评价标准。R 2a 不会随无意义的自变量增加而增大。

⑶复相关系数(R):表示表示m 个自变量共同对应变量的相关密切程度。R =0.775 ⑷各自变量的假设检验和评价:采用t 检验法

对每一个自变量的作用进行检验和衡量它们对Y 作用的大小。 H0:βj =0,即Y 与Xj 无线性相关关系

H1:βj ≠0,即Y 与Xj 有线性相关关系;α=0.05

同一资料,不同自变量的t 值间可以相互比较,t 值的绝对值越大,说明该自变量对Y 的回归所起的作用越大。 标准偏回归系数可用来比较各自变量Xj 对Y 的影响强度,有统计意义下,回归系数绝对值越大,对Y 的作用越大。 4.自变量的选择:

通常每次只剔除关系最弱的一个因素。 由方程中剔除因素的标准(通常α=0.10)

根据多元回归方程1的偏回归系数检验结果,X1(总胆固醇)的P =0.701>0.05,Y 与X1无线性相关关系被剔除。

重新建立不包含剔除因素的回归方程2:432663.0287.0402.0500.6?X X X y

+-+= 对新建立的回归方程进行检验:

依据SPSS 结果,P =0.000<0.05,按α=0.05的检验水准,拒绝H 0,接受H 1,认为所拟合的回归方程具有统计学意义。 对新方程的偏回归系数进行检验:检验结果有意义,因此回归方程保留因素X2、X3 、X4。

最后获得回归方程为:432663.0287.0402.0500.6?X X X y

+-+=

(二) logistic 回归

50例急性淋巴细胞白血病病人,在入院时白细胞数X 1(×10/L),淋巴结浸润度X 2(记为 0, 1, 2三级),缓解出院后巩固治疗X 3(巩固治疗时赋值1; 无巩固治疗时赋值0)。随访1年取得每例病人是否死亡Y (死亡赋值1;存活赋值0)的资料。

1.欲筛选哪些因素是影响急性淋巴细胞白血病病人一年内死亡的的主要因素,应选择何种统计分析方法?

2.经统计分析得淋巴结浸润度(X 2)和缓解出院后巩固治疗(X 3)是有意义的影响因素,现计算得b 0= 1.642, b 2=0.707,b 3= -2.784,请列出其回归方程?

3.请解析X3对应的EXP(B)=0.062的含义?

4.缓解出院后有巩固治疗患者一年内死亡的危险性是没有巩固治疗患者的多少?

5.假如此例是研究巩固治疗后生存时间受哪些因素影响,所调查的因素同上,现欲分析哪些因素是主要的影响 胃癌患者术后生存时间的因素,宜选择何种统计分析方法?

【答案】

1.该资料的应变量为二项分类变量,应选择多因素Logistic 回归分析;

2. X1的P =0.682>0.05,X1变量被剔除。

经统计分析得淋巴结浸润度(X 2)和缓解出院后巩固治疗(X 3)是有意义的影响因素,现计算得b 0= 1.642,b 2=0.707,b 3= -2.784,那么其Logistic 回归方程是:

3

23

2784.2707.0642.1784.2707.0642.11x x x x e e P -+-++=

(P 为一年内死亡的概率)

3.X3对应的EXP(B)=0.062的含义:

EXP(B)示的是在其它因素(自变量)固定的情况下,该变量与疾病关联的优势比,即因素x 与疾病的关联程度, 常用OR 表示。称作多变量调整后的优势比(adjusted odds ratio)。优势比(OR)指某一影响因素X i 两个不同暴露 水平(C 1,C 0)的P/Q 值之比(Q =1-P)。

当某影响因素Xi 仅为两个水平(1暴露,0非暴露),则:)exp(i i b OR = 当b i =0时,OR i =1,说明因素X i 对疾病发生不起作用;

当b i >0时,OR i >1,说明因素X i 对疾病发生是危险因素; 当b i <0时,OR i <1,说明因素X i 对疾病发生是保护因素。 4.概率预测:

①一名有巩固治疗的病人,其一年内死亡的概率为:将X=1代入上式得P=0.32。(方程见下面的补充) ②一名没有巩固治疗的病人,其一年内死亡的概率为:将X=0代入上式得P=0.88。

即缓解出院后有巩固治疗患者一年内死亡的危险性是没有巩固治疗患者的0.32/0.88=4/11。 5.影响生存时间的因素分析,宜选择COX 比例风险回归模型。

补充:(第4小题的方程)

显著性→Sig.

对回归方程进行检验: Omnibus Tests of Model Coefficients 20.5832.00020.5832

.00020.5832

.000

Step

Block Model Step 1Chi-square df

Sig.

对自变量进行检验:

Variables in the Equation

.707.428 2.7261.099 2.028-2.784.78012.753

1.000.0621.64

2.638 6.6201

.010 5.165

X2X3Constant Step 1a B S.E.Wald

df Sig.Exp(B)Variable(s) entered on step 1: X2, X3.

a.

若α=0.05, 则X2被剔除。

重建不包含X2新的回归方程:

Variables in the Equation

-2.746.75013.4051.000.064.015.279

1.992

.615

10.480

1

.001

7.333

x3

Constant

Step 1a B S.E.Wald df

Sig.Exp(B)

Lower Upper 95.0% C.I.for EXP(B)

Variable(s) entered on step 1: x3.

a.

3

3

746.2992.1746.2992.11X X e

e

P --+=

五、其它40分(每题≤10分)

提供某一素材,可能要求:

?选择正确的统计方法并简述理由

?对错误进行分析,并予以纠正

?对某些数据、指标的含义作出正确的判断

?正交试验表头设计及结果分析

可能涉及范围:变量的类型、计量资料的统计描述、相对数及其应用注意事项,总体率的区间估计,秩和检验,直线相关与回归,随访资料的生存分析,正交试验设计。

举例:

(一) 正交试验表头设计及结果分析

【06真题、03真题】第四题;【05真题】第八题;【04真题】第六题

某医师研究四种药物(A、B、C、D)联合用药对慢性苯中毒(主要表现为白细胞数减少)的疗效,以白细胞计数增加量为观察指标。每种药物都分成用与不用两个水平,要求试验设计达到分析A、B、C、D 的疗效及交互作用AB、AC、BC 的目的。现采用正交试验设计,选择L8(27)正交表作表头设计如下,并随机抽取8 例慢性苯中毒患者进行试验。

1.请对上述试验设计进行评价,若有错误则改正。(7分)

2.请根据上述资料进行表头设计。【05真题、04真题】

【答案】

1.本试验有4个两水平的因素和3个交互作用需要考察,各项自由度之和为:4×(2-1)+3×(2-1)×(2-1)=7;

若选用L8(27)来作正交表表头设计作,只能安排的因素及其交互作用共7个自由度,就没有空白列来做计算误差项,势必进行重复实验增加实验次数,本实验没有提到重复实验,因此选择L8(27)不合适。

2.本试验有4个两水平的因素和3个交互作用需要考察,各项自由度之和为:4×(2-1)+3×(2-1)×(2-1)=7,

因此可选用L12(211)来安排试验方案。

表头设计

列号

因素数 1 2 3 4 5 6 7 8 9 10 11

7 A B AB C AC BC D

将A因素放在第1列,B因素放在第2列,查表L12(211)交互作用表可知,第1列与第2列的交互作用列是第3列,于是将交互作用AB放在第3列;这样第3列不能再安排其它因素,以免出现“混杂”。然后将C 放在第4列;查表L12(211)交互作用表可知,AC应放在第5列,BC应放在第6列;第7列为ABC交互作用列,本试验不考虑ABC,因此作为空列,作计算误差项;将D放在第8列;列余下列为空列9,10,11,皆作计算误差项。

正交试验表头设计的注意事项:

①要留有空列作为误差的来源;

②各列要注意是否考虑了一阶及二阶甚至三阶交互作用;

③试验样本量不能太少,否则无法获得变异(如06年试卷,试验8次只用了8例患者)

因素间有交互作用的正交设计与分析:在实际研究中,有时试验因素之间存在交互作用。对于既考察因素主效应又考察因素间交互作用的正交设计,除表头设计和结果分析与前面介绍略有不同外,其它基本相同。 举例:

某一种抗菌素的发酵培养基由A 、B 、C 3种成分组成,各有两个水平,除考察A 、B 、C 三个因素的主效外,还考察A 与B 、B 与C 的交互作用。试安排一个正交试验方案并进行结果分析。

1.选用正交表,作表头设计:由于本试验有3个两水平的因素和两个交互作用需要考察,各项自由度之和为: 3×(2-1)+2×(2-1)×(2-1)=5,因此可选用L 8(27)来安排试验方案。 可利用L 8(27)二列间交互作用列表(见表1)来安排各因素和交互作用。

表1 L 8(27)交互作用列表

列号 1 2 3 4 5 6 7 1 3 2 5 4 7 6 2 1 6 7 4 5 3 7 6 5 4 4 1 2 3 5 3 2 6

1

如果将A 因素放在第1列,B 因素放在第2列,查表1可知,第1列与第2列的交互作用列是第3列,于是

将A 与B 的交互作用AB 放在第3列。这样第3列不能再安排其它因素,以免出现“混杂”。然后将C 放在第4列,查表1可知,BC 应放在第6列,余下列为空列,如此可得表头设计,见表2。

表2 表头设计

列号 1 2 3 4 5 6 7 因素

A

B

AB

C

BC

2.列出试验方案:根据表头设计,将A,B,C 各列对应的数字”1”、”2”换成各因素的具体水平,得出试验方案列于表3。

表3 正交试验方案

试 验 号

因 素

1(A) 2(B) 3(C) 1 1(A 1) 1(B 1) 1(C 1) 2 1(A 1) 1(B 1) 2(C 2) 3 1(A 1) 2(B 2) 1(C 1) 4 1(A 1) 2(B 2) 2(C 2) 5 2(A 2) 1(B 1) 1(C 1) 6 2(A 2) 1(B 1) 2(C 2) 7 2(A 2) 2(B 2) 1(C 1) 8

2(A 2)

2(B 2)

2(C 2)

3.结果分析:按表3所列的试验方案进行试验,其结果见表4。

表中T i 、i x 计算方法同前。此例为单独观测值正交试验,总变异划分为A 因素、B 因素、C 因素、AB 、BC 、

与误差变异5部分,平方和与自由度划分式为: SS T =SS A +SS B +SS C +SS AB +SS BC +SS e

df T =df A +df B +df C +df AB +df BC +df e ⑴计算各项平方和与自由度

矫正数:C=T 2/n=6652/8=55278.1250

总平方和:SS T =Σy 2-C=552+382+…+612-55278.1250=6742.8750 A 因素平方和:SS A =ΣT 2A /a-C=(2792+3862)/4-55278.1250=1431.1250 B 因素平方和:SS B =ΣT 2B /b-C=(3392+3262)/4-55278.1250=21.1250 C 因素平方和:SS C =ΣT 2C /c-C=(3532+3122)/4-55278.1250=210.1250

AB 平方和:SS AB =ΣT 2AB /4-C=(2332+4322)/4-55278.1250=4950.1250 BC 平方和:SS BC =ΣT 2BC /4-C=(3272+3382)/4-55278.1250=15.1250 误差平方和:SS e =SS T -SS A -SS B -SS AB -SS BC =6742.8750-1431.1250-21.1250-210.1250-4950.1250-15.1250=115.2500 总自由度:df T =n-1=8-1=7 各因素自由度:df A =df B =df

C =2-1=1 交互作用自由度:df AB =df BC =(2-1)(2-1)=1

误差自由度:df e =df T -df A -df C -df AB -df BC =7-1-1-1-1-1=2

表4 有交互作用的正交试验结果计算表

试验号 因 素

试验结果(%)* A B AB C BC 1 1 1 1 1 1 55(y 1) 2 1 1 1 2 2 38(y 2) 3 1 2 2 1 2 97(y 3) 4 1 2 2 2 1 89(y 4) 5 2 1 2 1 1 122(y 5) 6 2 1 2 2 2 124(y 6) 7 2 2 1 1 2 79(y 7) 8 2 2 1 2 1 61(y 8) T 1 279 339 233 353 327 665(T) T 2 386 326 432 312 338 1x

69.75 84.75 58.25 88.25 81.75

2x

96.50

81.50

108.00

78.00

84.50

*试验结果以对照为100计

⑵列出方差分析表,进行F 检验

表5 方差分析表

变异来源

SS df MS F F 0.05(1, 2) F 0.01(1, 2) 1431.1250 1 1431.1250 24.84* 18.51 98.49 B 21.1250 1 21.1250 <1 C 210.1250 1 210.1250 3.65 AB 4950.1250 1 4950.1250 85.90* BC 15.1250 1 12.1250 <1 误差 115.1250 2 57.6250

总的

6742.8750

7

F 检验结果表明:A 因素和交互作用AB 显著,B 、C 因素及BC 交互作用不显著。因交互作用AB 显著,应对A 与B 的水平组合进行多重比较,以选出A 与B 的最优水平组合。 ⑶A 与B 各水平组合的多重比较

先计算出A 与B 各水平组合的平均数:

A 1

B 1水平组合的平均数11x =(55+38)/2=46.50 A 1B 2水平组合的平均数12x =(97+89)/2=93.00 A 2B 1水平组合的平均数21x =(122+124)/2=123.00 A 2B 2水平组合的平均数22x =(79+61)/2=70.00 列出A 、B 因素各水平组合平均数多重比较表,见表6。 表6 A 、B 因素各水平组合平均数多重比较表(q 法)

水平组合 平均数

ij x -46.5 ij x -70 ij x -93

A 2

B 1 123.00 76.5* 53* 30 A 1B 2 93.00 46.5* 23 A 2B 2 70.00 23.5 A 1B 1 46.50

因为37.52/625.572/===e x MS S ,由df e =2与k =2, 3, 4, 查临界q 值,并计算出LSR 值,见表12-37。 表7 q 值与LSR 值表

dfe k q 0.05 q 0.01 LSR 0.05 LSR 0.01 2 6.09 14.0 32.70 75.18 2 3 8.28 19.0 44.46 102.03 4 9.80 22.3 52.63 119.75

多重比较结果表明,A 2B 1显著优于A 2B 2,A 1B 1;A 1B 2显著优于A 1B 1,其余差异不显著。最优水平组合为A 2B 1。 从以上分析可知,A 因素取A 2,B 因素取B 1,若C 因素取C 1,则本次试验结果的最优水平组合为A 2B 1C 1。

注意,此例因df e =2,F 检验与多重比较的灵敏度低。为了提高检验的灵敏度,可将F <1的SS B 、df B ,SS BC 、df BC 合并到SS e 、df e 中,得合并的误差均方,再用合并误差均方进行F 检验与多重比较。这一工作留给读者完成。

(二) 随访资料的生存分析:

【05真题】第四题;【04真题】第五题;【03真题】第六题

16例某癌症病人在不同时期经随机化分配到A、B两治疗组,并继续进行随访至1974年5月31日结束。

资料如下表:(8分)

16例某种癌症病人随访资料

病人号治疗组分组日期终止日期是否该病死亡截尾值

1 A 68.05.1

2 68.05.30 Y

2 B 70.10.18 71.04.16 Y

3 B 69.02.12 70.11.06 Y

4 A 72.01.30 74.05.31 仍存活√

5 A 73.11.11 74.01.02 Y

6 B 68.03.12 73.03.30 车祸死亡√

7 A 69.01.06 69.01.04 Y

8 A 69.02.08 70.02.08 迁出√

9 B 71.05.02 71.11.13 Y

10 B 68.03.08 68.05.23 Y

11 B 73.12.12 74.02.20 Y

12 A 74.05.01 74.05.09 Y

13 B 72.07.02 72.07.15 Y

14 B 68.12.18 74.04.31 失访√

15 A 69.01.01 74.05.31 仍存活√

16 B 73.09.02 73.09.20 Y

1.上述资料随访时间单位以(日)、(月)、(年)哪个较合适?为什么?

2.判断上述随访时间哪些属截尾值,写出观察对象编号。

3.要比较A、B疗法对该种癌症病人的疗效,宜选用何种统计检验方法?

4.A、B治疗组随访资料生存时间的特征量(代表值)一般用何指标表示?

【答案】

1.上述资料随访时间单位以月较合适。

原因:一般情况下较细的时间单位准确性较高,当随访时间可以作较细的量化时,则应考虑用较细的时间单位。但研究目的不同,时间单位不同,使用恰当的时间单位。本资料的目的是比较A、B疗法对该种癌症病人的疗效,癌症病人的生存时间测度单位如果以(日)太小,因此,本资料随访时间单位以月较合适?

2.产生截尾数据的原因:包括中途失访、研究结束时仍然存活、死于与研究疾病无关的原因。

因此,编号4、6、8、14、15观察对象属截尾值。

3.两样本生存曲线比较,宜选用对数秩检验(log-rank test)。

4.A、B治疗组随访资料生存时间的特征量(代表值)一般用中位生存时间(median survival time)表示。

【06真题】第九题

某医生从2002年1月1日起对某医院收治的6名急性心肌梗塞病人进行跟踪观察,2002年3月25日结束观察,共12周。记录的资料如下:(5分)

1.上述资料随访时间单位以(日)、(月)、(年)哪个较合适?为什么?

2.判断上述随访时间哪些属截尾值?写出观察对象编号。(答案可参考上一题)

(三) 计量资料的统计描述

【06真题、05真题】第三题

某市100名正常成人男性血红蛋白值(g/dL)频数分布表如下:(7分)

组段频数11.5-

2

12.0-

6

12.5-

7

13.0-

14

13.5-

24

14.0-

12

14.5-

18

15.0-

10

15.5-

3

16.0-

4

1.选用何种指标描述其集中位置和离散程度较好?为什么?

2.估计该地正常成年男性血红蛋白的正常值范围。

SPSS软件有关分析结果:

【答案】

1.此资料服从正态分布。原因:中位数和均数较接近,且偏度系数接近0。(偏度系数Skewness=0.044;峰度系数Kurtosis=-0.320;两个系数都小于1)

对于正态分布资料描述其集中位置用算数均数较好,该资料算数均数=14.03;

对于正态分布资料描述其离散程度用标准差较好,该资料标准差=1.0282。

2.对于正态分布资料正常值范围估计用正态分布法较好:

因男性血红蛋白过多或过少均为异常,故按双侧估计,取95%界限:

下限:-1.96S=14.03-1.96×1.0282=12.014(g/dL)

上限:+1.96S=14.03+1.96×1.0282=16.045(g/dL)

因此,该地正常成年男性血红蛋白的正常值范围为(12.014,16.045)g/dL 。

【制定参考值范围】

⑴正态分布法适用于服从正态(或近似正态)分布指标以及可以通过转换后服从正态分布的指标。

⑵百分位数法常用于偏态分布的指标。表3-1 中两种方法的单双侧界值都应熟练掌握。

质量控制:为了控制实验中的测量(或实验)误差,常以X ±2S作为上、下警戒值,以X±3S作为上、下控制值。这样做的依据是:正常情况下测量(或实验)误差服从正态分布。

(四) 相对数应用注意事项;率的标准化

【06 真题】第七题

某地调查农村中不同人群的HbsAg阳性情况,结果如下表,从中得出农民HbsAg阳性情况最严重,医务人员最低的结论。试讨论这样评价是否可信?应作如何补充和修改?(5分)

某地调查农村中不同人群的HbsAg阳性情况

人群检查人数阳性人数阳性百分比(%)

农民1013 128 45.9

医务人员21 4 1.5

中学生99 15 5.4

小学生326 51 18.3

学龄前儿童437 76 27.2

其他47 5 1.8

合计1943 279 100.0

【答案】

①这样评价不正确。原因是以HbsAg阳性构成比代替HbsAg阳性率的错误,即错误地以比代率。

②第四栏“阳性百分比”是每组阳性人数除以总阳性人数得到的。

增加第五栏“阳性率”,阳性率=阳性人数/检查人数×100%

人群检查人数阳性人数阳性百分比(%) 阳性率(%)

农民1013 128 45.9 12.64

医务人员21 4 1.5 19.05

中学生99 15 5.4 15.15

小学生326 51 18.3 15.64

学龄前儿童437 76 27.2 17.39

其他47 5 1.8 10.64

合计1943 279 100 14.36

由HbsAg阳性率计算结果可以看出,农民HbsAg阳性情况最低;医务人员最严重。

【05真题】第七题

抽样调查某企业2839名职工中的高血压病人情况如下表。据此,某医生认为:⑴该企业高血压发病率为8%,

并随年龄递增,其中40岁以上患者占全部病例的90.3%,60岁以上者发病率为100%。⑵高血压发病与性别

有关,男性为10.2%,女性为4.5%,男性明显高于女性(P<0.01)。以上分析是否妥当,试加以评述。(8分)男、女各年龄组高血压病例分布

年龄组

男性女性

受检人数病例数发病率(%) 受检人数病例数发病率(%)

20~ 333 5 1.5 712 4 0.6

30~ 301 4 1.3 142 9 6.3

40~ 517 64 12.4 185 27 14.6

50~ 576 93 16.0 61 9 14.8

60~ 12 12 100.0 - - -

合计1739 178 10.2 1100 49 4.5

【答案】

1.以上分析有很多不妥。

①60~的受检人数仅12,计算相对数的分母过小。因此,“60岁以上者发病率为100%”的评价是不妥的。

②“高血压发病与性别有关,男性为10.2%,女性为4.5%,男性明显高于女性”的结论是不妥的。

原因是男女性别内部构成不同,不具可比性,需进行率的标准化。

2.使用直接法进行率的标准化;把两组年龄段人口合并作为标准组。

年龄组

男性女性

标准人口数原发病率(%) 预期发病率(%) 原发病率(%) 预期发病率(%)

20~ 1045 1.5 0.55 0.6 0.22 30~ 443 1.3 0.20 6.3 0.98 40~ 702 12.4 3.07 14.6 3.61 50~ 637 16 3.59 14.8 3.32 60~ 12 100 0.42 -

合计2839 10.2 10.20 4.5 4.50 3.可见,标准化以后,每个年龄组中男性、女性发病率相当。

(五) 秩和检验(经验:凡等级在3个以上的等级资料一定用秩和检验)

【06真题】第八题

为研究慢性气管炎病人痰液中嗜酸性粒细胞是否高于正常人,选择24名正常人和44名慢性气管炎病人痰液中嗜酸性粒细胞检查结果如下表,宜用何统计分析方法?若求得的检验统计量值为3.6217,如何下结论?(5分)

【答案】成组设计秩和检验

1.此资料是单向有序分类资料,研究设计为完全随机设计(又称成组设计);

2.统计方法选用两独立样本比较的Wilcoxon符号秩和检验,其假设检验过程如下:

⑴建立假设检验,确立检验水准:

H0:慢性气管炎病人与正常人痰液中嗜酸性粒细胞总体分布相同;

H1:慢性气管炎病人与正常人痰液中嗜酸性粒细胞总体分布不同;α=0.05

⑵计算检验统计量T值:

①求各等级的秩次;

②求各等级的平均秩次;为秩次范围上下限相加除以2得平均秩次;

③求秩和;为各级的平均秩次与相应例数相乘;

④确定统计量T值。

(1) (2) (3) (4) (5) (6) (7)=(2)×(6) (8)=(3)×(6)

结果正常人病人合计秩次范围平均秩次正常人秩和病人秩和

-11 5 16 1~16 8.5 93.5 42.5

+10 18 28 17~44 30.5 305 549

++ 3 16 19 45~63 54 162 864

+++0 5 5 64~68 66 0 330

合计24(n1)44(n2) 68 560.5(T1) 1785.5(T2) 以较小的例数组的例数作为n1、其秩和作为统计量T;因此,n1=24,n2=44,T=560.5。本资料中n1=24>10,超过了两组比较T界值表的范围,用正态近似法作U 检验。

⑶确定P值,做出统计推断:

得检验统计量值u=3.6217,查t 界值表,得单侧P<0.005,

因此,可以认为慢性气管炎病人痰液中嗜酸性粒细胞(1785.5/44=40.6)高于正常人(560.5/24=23.4)。

【04真题】第八题

某医院探讨矽肺不同期次患者的胸部平片肺门密度变化,把492名患者的资料归纳如下表。问欲分析矽肺患者肺门密度的增加与矽肺的期次有无关系,宜选用何种统计方法?为什么?(7分)

不同期次矽肺患者肺门密度级别分布

矽肺期次

肺门密度级别

+ ++ +++ 合计

Ⅰ43 188 14 245

Ⅱ 1 96 72 169

Ⅲ 6 17 55 78 合计50 301 141 492 【答案】用等级相关分析

【双向有序属性不同的两分类变量相关分析】用等级相关分析,又称秩相关。“有序分组资料的线性趋势检验”---考试不作要求

医学统计学第10、11、12章 课后习题

1. 以下检验方法属参数法的是()。 A、t检验 7. 下列统计分析方法属于非参数检验的是()。 A、Wilcoxon单样本秩和检验 7. 下列统计分析方法属于参数检验的是()。 B、完全随机设计的方差分析 8. 关于统计分析方法的选择,下列说法错误的是()。 D、对于定量变量自然是选择它所对应的那些统计方法如t检验、方差分析或检验等 3. 关于参数检验和非参数检验的说法错误的是()。 D、多数非参数检验方法简便,易于理解且检验效能高 4. 对于配对比较的秩和检验,其检验假设为()。 C、样本的差数来自中位数为0的总体 1. 两小样本比较作假设检验首先考虑()。 D、资料符合t检验还是秩和检验 三组比较的秩和检验,样本例数均为5,确定5. P值应查()。 B、H界值表 9. 高血压临床试验分为试验组和对照组,分析考虑治疗0周、2周、4周、6周、8周血压的动态变化和改善情况,为了直观显示出两组血压平均变动情况,宜选用的统计图是()。 B、线图 符合4. t检验条件的数值变量资料如果采用秩和检验,则()。 B、第二类错误增大 2. 在进行两样本比较的秩和检验时,以下无效假设正确的是()。 B、H0:两样本对应的总体分布相同 9. 某研究者打算比较1995-2010年之间两种疾病的死亡率的变化速度,其统计图宜采用()。 A、半对数线图 3. 配对比较的秩和检验的基本思想是--- 如果检验假设成立,则对样本来说()。 D、正秩和和负秩和的绝对值不会相差很大 6. 当观察性研究设计和完全随机设计的数据分析时,不可能选择的统计分析方法是()。 D、配对t检验 10. 欲用统计图表示某市1980年和1990年不同性别高血压的患病情况,应用()。 A、复式条图 5. 欲比较三种药物治疗效果有无差别,如果治疗效果为有序分类变量,宜采用()。 A、Wilcoxon秩和检验

第十一章秩和检验

第十一章秩和检验 【A1型题】 1.配对比较的秩和检验的基本思想是:如果假设成立,则对样本来说 A. 正秩和与负秩和的绝对值不会相差很大 B. 负秩和的绝对值大于正秩和的绝对值 C. 正秩和与负秩和的绝对值相等 D. 正秩和的绝对值大于负秩和的绝对值 E. 正秩和与负秩和的绝对值相差很大 2.三组比较的秩和检验,样本例数均为6时,确定P值应查 A. H界值表 B. T界值表 C. χ2界值表 D. t界值表 E. F界值表 3.在配对比较的差数秩和检验中,如果有两个差数为0,则 A. 对正秩和有0.5和1,对负秩和有-0.5和-1 B. 对正秩和有2,对负秩和有-2 C. 对正秩和有3,对负秩和有-3 D. 0不考虑 E. 以上都不是 4.设配对资料的变量值为x1和x2,则配对资料的秩和检验是

A. 把x1和x2综合按绝对值从小到大编秩 B. 把x1和x2综合从小到大编秩 C. 分别按x1和x2从小到大编秩 D. 把x1和x2的差数从小到大编秩 E. 把x1和x2的差数的绝对值从小到大编秩 5.下列哪项不是非参数统计的优点 A. 不受总体分布的限定 B. 简便、易掌握 C. 适用于等级资料 D. 适用于未知分布型资料 E. 检验效能高于参数检验 6.等级资料的比较宜采用 A. 秩和检验 B. F检验 C. t检验 D. 回归分析 E. 四格表资料χ2检验 7.一组n1例和一组n2例的两组计量资料的比较,用秩和检验所设的总体是 A. n1个秩号:1,2,…,n1 B. n2个秩号:1,2,…,n2 C. n1+n2个秩号:1,2,…,n1+n2 D. n2-n1个秩号:1,2,…,n2-n1

第12章秩和检验答案

【下载本文档,可以自由复制内容或自由编辑修改内容,更多精彩文章,期待你的好评和关注,我将一如既往为您服务】 第十二章秩和检验 【思考与练习】 一、思考题 1. 简述参数检验和非参数检验的区别。 2. 简述非参数检验的适用范围。 3. 同一资料,又出于同一研究目的,当参数检验和非参数检验所得结果不一致时,以何者为准,请简述理由。 二、案例辨析题 某儿科医生比较甲、乙、丙三种药物治疗小儿腹泻的疗效,将379名小儿腹泻患者随机分为三组,分别采用甲、乙、丙三种药物治疗,结果见表12-1。 表12-1 三种药物治疗小儿腹泻的疗效比较 疗效甲药乙药丙药合计 痊愈175 5 1 181 显效95 55 5 155 进步64 6 30 100 无效45 35 6 86 合计379 101 42 522 对于上述资料,该医生采用行×列表检验,得,,故认为三种药物的疗效有差别。该结论是否正确,为什么? 三、最佳选择题 1.以下方法中属于参数检验方法的是 A. 检验 B. 检验 C. 检验 D. Wilcoxon符号秩和检验 E. Wilcoxon秩和检验 2.进行两小样本定量资料比较的假设检验时,首先应考虑 A. 检验 B. 检验 C. 秩和检验 D. 检验 E. 满足参数检验还是非参数检验的条件 3.两组定量资料的比较,若已知、均小于30,总体方差不齐且呈极度偏态分布,宜采用 A. 检验 B. 检验 C. 检验 D. 方差分析 E. 秩和检验 4. 欲比较三种药物治疗效果有无差异,如果治疗效果为有序分类变量,宜采用 A. 检验 B. 方差分析

C. 检验 D.Wilcoxon秩和检验 E. 检验 5. 成组设计两样本比较的秩和检验,检验统计量T通常为 A. 较小的秩和 B. 较大的秩和 C. 样本含量较小组的秩和 D. 样本含量较大组的秩和 E. 任取一组的秩和均可 6. 配对设计秩和检验,若检验假设成立,则 A. 差值为正的秩和与差值为负的秩和相差不会很大 B. 差值为正的秩和与差值为负的秩和可能相差很大 C. 差值为正的秩和与差值为负的秩和肯定相等 D. 正秩和的绝对值大于负秩和的绝对值 E. 正秩和的绝对值小于负秩和的绝对值 7. 下列资料类型中,不宜采用秩和检验的是 A. 正态分布资料 B. 等级资料 C. 分布类型未知资料 D. 极度偏态分布资料 E. 数据一端不确定的资料 8. 某资料经配对秩和检验得,由查双侧界值如下,则值为 双侧概率0.10 0.05 0.02 0.01 界值 60~150 52~158 43~167 37~173 A. B. C. D. E. 9. 下列关于非参数检验的叙述错误的是 A. 非参数检验不依赖于总体的分布类型 B. 非参数检验仅用于等级资料比较 C. 适合参数检验的资料采用非参数检验会降低检验效能 D. 非参数检验会损失部分样本信息 E. 秩和检验是一种非参数检验方法 四、综合分析题 1. 已知某地正常人尿氟含量的中位数为 2.15mmol/L。现在该地某厂随机抽取12名工人,测得尿氟含量(mmol/L)如下: 2.15 2.10 2.20 2.12 2.42 2.52 2.62 2.72 3.00 3.18 3.87 5.67 试问该厂工人的尿氟含量是否高于当地正常人? 2. 按照年龄、性别、病情严重程度将32例扁平足患者配成16对,每对患者其中之一接受甲法治疗,另一患者接受乙法治疗,两种方法治疗效果见表12-2,试比较两种方法治疗效果优劣。 表12-2 甲、乙两法治疗扁平足的效果

第十章 基于秩次的非参数检验

第十章基于秩次的非参数检验习题 一、选择题 1.两小样本均数比较,方差不齐时,下列说法不正确的是(). A. 采用秩和检验 B. 采用t′检验 C. 仍用t检验 D. 变量变换后再作决定 E. 要结合正态性检验结果方能作出决定 H是(). 2. 两样本秩和检验的 A. 两样本秩和相等 B. 两总体分布相同 C. 两样本分布相同 D. 两总体秩和相等 E. 两总体均数相等 3. 在统计检验中是否选用非参数统计方法(). A. 要根据研究目的和数据特征作决定 B. 可在算出几个统计量和得出初步结论后进行选择 C. 要看哪个统计结论符合专业理论 D. 要看哪个P值更小 E. 既然非参数统计对资料没有严格的要求,在任何情况下均能直接使用 4. 配对样本差值的Wilcoxon符号秩和检验,确定P值的方法是(). A. T越大,P值越小 B.T越大,P值越大 C. T值在界值范围内,P值小于相应的α D. T值在界值范围内,P值大于相应的α E. T值在界值范围上,P值大于相应的α 5. 成组设计两样本比较的秩和检验,其检验统计量T是(). A. 为了查T界值表方便,一般以秩和较小者为T B. 为了查T界值表方便,一般以秩和较大者为T C. 为了查T界值表方便,一般以例数较小者秩和为T D. 为了查T界值表方便,一般以例数较大者秩和为T E. 当两样本例数不等时,任取一样本的秩和为T都可以查T界值表

多样本定量资料比较,当分布类型不清时应选择(). A. 方差分析 B. t检验 C. Z检验 D. Kruskal-Wallis检验 E. Wilcoxon检验 6. 多组样本比较的Kruskal-Wallis检验中,当相同秩次较多时,如果用H值而不用校正后 H值,则会(). 的 c A.提高检验的灵敏度 B.把一些无差别的总体推断成有差别 C. 把一些有差别的总体推断成无差别 D.Ⅰ、Ⅱ类错误概率不变 E. 以上说法均不对 二、简答题 1. 对于完全随机设计两样本定量资料的比较,如何选择统计方法? 2. 为什么在秩和检验编秩次时不同组间出现相同数据要给予“平均秩次”,而同一组的相同数据不必计算“平均秩次”? 3. 多组定量资料比较时,统计处理的基本流程是什么?

Wilcoxon秩和检验

秩和检验 参数统计与非参数统计的区别: 参数统计:即总体分布类型已知,用样本指标对总体参数进行推断或作假设检验的统计分析方法。 非参数统计:即不考虑总体分布类型是否已知,不比较总体参数,只比较总体分布的位置是否相同的统计方法。 下面我们将介绍非参数统计中一种常用的检验方法--秩和检验,其中“秩”又称等级、即按数据大小排定的次序号。上述次序号的和称“秩和”,秩和检验就是用秩和作为统计量进行假设检验的方法。 二、不同设计和资料类型的秩和检验 1.配对比较的资料: 对配对比较的资料应采用符合秩和检验(Sighed rank test),其基本思想是:若检验假设成立,则差值的总体分布应是对称的,故正负秩和相差不应悬殊。检验的基本步骤为:(1)建立假设; H0:差值的总体中位数为0; H1:差值的总体中位数不为0;检验水准为0.05。 (2)算出各对值的代数差; (3)根据差值的绝对值大小编秩; (4)将秩次冠以正负号,计算正、负秩和; (5)用不为“0”的对子数n及T(任取T+或T-)查检验界值表得到P值作出判断。 应注意的是当n>25时,可用正态近似法计算u值进行u检验,当相同秩次较多时u值需进行校正。 2. 两样本成组比较: 两样本成组资料的比较应用Wilcoxon秩和检验,其基本思想是:若检验假设成立,则两组的秩和不应相差太大。其基本步骤是: (1)建立假设; H0:比较两组的总体分布相同; H1:比较两组的总体分布位置不同;检验水准为0.05。 (2)两组混合编秩; (3)求样本数最小组的秩和作为检验统计量T; (4)以样本含量较小组的个体数n1、两组样本含量之差n2-n1及T值查检验界值表; (5)根据P值作出统计结论。 同样应注意的是,当样本含量较大时,应用正态近似法作u检验;当相同秩次较多时,应用校正公式计算u值。 3.多个样本比较: 多个样本比较的秩和检验可用Kruskal-Wallis法,其基本步骤为: (1)建立假设; H0:比较各组总体分布相同; H1:比较各组总体分布位置不同或不全相同;检验水准为0.05。 (2)多组混合编秩; (3)计算各组秩和Ri; (4)利用Ri计算出检验统计量H; (5)查H界值表或利用卡方值确定概率大小。

组别+秩和检验spss方法:显效和非显效

秩 group N 秩均值 秩和 频数 对照组 26 治疗组 30 总数 56 检验统计量a 频数 组别 n 痊愈 显 效 有效 无效 总有效率 治疗组 30 16%) 8%) 6%) 0%) 30%) 对照组 26 5%) 6%) 8%) 7%) 19%)

Z值为,p<,拒绝H0 经检验,某治疗方法有效,治疗组效果优于对照组。 秩和检验 应用条件 ①总体分布形式未知或分布类型不明; ②偏态分布的资料: ③等级资料:不能精确测定,只能以严重程度、优劣等级、次序先后等表示; ④不满足参数检验条件的资料:各组方差明显不齐。 ⑤数据的一端或两端是不确定数值,如“>50mg”等。 一、配对资料的Wilcoxon符号秩和检验(Wilcoxon signed-rank test) 例1对10名健康人分别用离子交换法与蒸馏法,测得尿汞值,如表的第(2)、(3)栏,问两种方法的结果有无差别 表1 10名健康人用离子交换法与蒸馏法测定尿汞值(μg/l) 样品号(1)离子交换法 (2) 蒸馏法 (3) 差值 (4)=(2)(3) 秩次 (5) 12 27 3—46 58

6 -9 7 8 -1 9 10 -5 T +=+ T -= 差值先进行正态性及方差齐性检验,看是否可以做参数检验,其检验效能高于非参数检验。(下同) H0:Md (差值的总体中位数)=0 H1:Md ≠0 α= T ++T -=1+2+3+…n=n(n+1)/2 ① 小样本(n ≤50)--查T 界值表 基本思想:如果无效假设H0成立,则正负秩和的绝对值从理论上说应相等,都等于n(n+1)/4,既使有抽样误差的影响正负T 值的绝对值相差也不应过大。反过来说,如果实际计算出的正负T 值绝对值相差很大,我们只能认为H0成立的可能性很小。 界值的判断标准 若下限表中概率值 若T ≤下限或T ≥上限,则P 值≤表中概率值 ② 大样本时(n>50),正态近似法(u 检验) 基本思想:假定无效假设H0成立,则正负秩和的绝对值应相等,随着n 增大T 逐渐趋近于均数等于n(n+1)/4、方差为n(n+1)(2n+1)/24的正态分布。所以可用近似正态法计算u 值。即: *校正公式:当相同秩次个数较多时 48 ) (24)12)(1(5.0|4/)1(|3 j j t t n n n n n T u -∑- ++-+-= tj :第j 个相同秩次的个数 SPSS: 建立变量名:

第十一章秩和检验

第十一章秩和检验 A型选择题 1、以下对非参数检验的描述,哪一项是错误的()。 A.非参数检验方法不依赖于总体的分布类型 B.应用非参数检验时不考虑被研究对象的分布类型 C.非参数的检验效能低于参数检验 D.一般情况下非参数检验犯第二类错误的概率小于参数检验 E.B、E均不对 2、多样本计量资料比较,当分布类型不清时选择()。 A.t检验 B.u检验 C.秩和检验 χ检验 D、2 E.方差分析 时()。 3、符合t检验条件的数值变量资料如果采用秩和检验,不拒绝H A.第一类错误增大 B.第二类错误增大 C.第一类错误减小 D.第二类错误减小 E.两类错误都增大 4、按等级分组的资料作秩检验时,如果用H值而不用校正后的H值,则会()。 A、提高检验的灵敏度 B、会把一些无差别的总体推断成有差别 C、会把一些有差别的总体推断成无差别 D、第一、二类错误概率不变 E、一类错误增大 5、以上检验方法之中,不属于非参数检验法的是()。 A、t检验 B、符号检验 C、Kruskal-Wallis检验 D、Wilcoxon检验 χ检验 E、2 6、等级资料的比较宜用()。 A、t检验

B、秩和检验 C、F检验 检验 D、2 E、u检验 7、在进行成组设计两样本秩和检验时,以下检验假设正确的是()。 A、H :两样本对应的总体均数相同 :两样本均数相同 B、H C、H :两样本的中位数相同 :两样本对应的总体分布相同 D、H E、以上答案都不正确 8、秩和检验又叫做() A、参数检验 B、近似正态检验 C、非参数检验 D、H检验 E、Wilcoxon检验 9、当总体分布类型不清时,可采用() A、t检验 B、秩和检验 C、x2检验 D、正态检验 E、u检验 10、两个小样本比较的假设检验,应首先考虑()。 A、t检验 B.秩和检验 C.任选一种检验方法 D、资料符合哪种检验的条件 E.以上都不对 11、对于配对比较的秩和检验,其检验假设为()。 A、样本的差数应来自均数0的正态总体 B、样本的差数应来自均数为0的非正态总体 C.样本的差数来自中位数为0的总体

第十章基于秩次的非参数检验

第十章 1. 两样本定量资料比较的假设检验,首先应考虑。 A. 用t 检验 B. 用秩和检验 C. t检验与秩和检验 D 资料符合t检验还是秩和检验的条件 E. X2检验 2.在作等级资料的比较时,宜用。 A. t 检验 B. X2检验 C. 秩和检验 D. F检验 E. 方差分析 3. 在作两样本均数比较时,已知均小于30,总体方差不齐且呈极度偏峰的资料 宜用。 A. t ′检验 B. t 检验 C.U检验 D. 秩和检验 E t ′检验和秩和检验均可 4.非参数统计的应用条件是。 A. 样本数据来自正态总体 B.若两组比较,要求两样本方差相等 C.总体分布类型未知 D.要求样本例数很大 E.总体属于某种已知的分布类型 5.在进行成组设计两样本秩和检验时,以下检验假设中正确的是。 A. H O两样本对应的总体均数相同 B. H O两样本均数相同 C. H O两样本对应的总体分布位置相同 D. H O两样本的中位数相同 E. H O两样本差值的中位数相同 6.配对设计的符号检验的基本思路是:如果检验假设成立,则对样本来 说。 A.正秩和的绝对值与负秩和的绝对值不会相差很大 B.中的秩和为零 C.正秩和的绝对值与负绝对值不会相差很大 D.正秩和的绝对值与负绝对值相等 E.符号相同,按顺序编秩 7.秩和检验和t 检验相比,其优点是。 A.计算更简便 B.公式更为合理 C. 检验效能高 D.抽样误差小 E.不受分布限制 8.秩和检验是一种。

A.U检验 B. X2检验 C.F检验 D.非参数检验 E.以上都不对 9.非参数统计不适合。 A.正态分布且方差齐的资料 B.偏态分布的资料 C.半定量资料 D.有过大值或小值的资料 E.以上均不可 11.不同人群血清反应(- + ++)资料比较宜用: A.t检验 B.X2检验 C.秩和检验 D.F检验 E. Z检验 12.成组设计两样本比较的秩和检验,其检验统计量T是。 A.以秩和较小者为T B. 以秩和较大者为T C.以例数较小者秩和为T D. 以例数较大者秩和为T E.当两样本例数不等时,科任区一样本的秩和为T 13.请指出下列五个秩和检验的结果哪个是错误的。 A.配对计量资料n=12,T+=7,T-=71,查得T0.05=13~65,P<0.05 B.配对计量资料n=8,T+=12,T-=24,查得T0.05=3~33,P<0.05 C.两组计量资料n1=12, n2=10,T1=173,T2=80,查得T0.05=84~146,P<0.05 D.两组计量资料n1=10, n2=10,T1=55,T2=155,查得T0.05=78~132,P<0.05 E.两组计量资料n1=9, n2=13,T1=58,T2=195,查得T0.05=73~134,P<0.05 14.配对设计的符号秩合检验中,其检验假设H0为。 A 差值总体均数等于零即u d=0 B 差值总体均数不等于零即u d≠0 C 差值总体中倍数等于零即M d=0 D 差值总体中位数不等于零即M d≠0 E 以上都不对 二.是非题: 1.两样本比较的秩和检验,当n1>10,n2-n1>10时采用检验属于参数检验。 ()2.完全随机设计多组独立样本比较的秩和检验得P<0.05,X需进行两两比较。 ()3.非参数检验有称任意分布检验,其意义为与任何分布无关。 ( )

秩和检验

实习秩和检验 一、目的要求 1、了解非参数检验的意义及优缺点 2、掌握常用秩和检验方法 (1)配对符号秩和检验, (2)成组设计两样本资料秩和检验, (3)成组设计多样本资料秩和检验。 二、归纳起来 1、计量资料 (1)单样本资料(样本均数与总体均数比较) 如服从正态分布-----t检验 如不服从正态分布-----秩和检验 (2)成组设计资料(两样本均数) 如方差齐,且两样本服从正态分布-----t检验 如方差不齐但服从正态分布----- t’检验或秩和检验 如方差不齐且不服从正态分布----- 秩和检验 (3)配对设计资料 如差值服从正态分布-----配对t检验 如差值不服从正态分布-----配对秩和检验 (4)多样本均数的比较 如方差齐,且样本服从正态分布-----F检验(方差分析)

如方差不齐或样本服从正态分布----- 秩和检验 2.计数资料 (1)单向有序资料(或称成组等级资料) 如比较分布或构成时----- 行×列表卡方检验 如比较不同组间效应是否有差别时----- 秩和检验 3. 等级资料或开口资料或明显偏态分布资料 不管是配对设计,还是成组设计或多样本比较----- 均采用秩和检验一、配对秩和检验(P172 9-1) 例9-1:配对设计的计量资料。由于资料呈明显偏态分布,首选秩和检验。 SPSS使用要点: (1)数据结构 (2)分析方法 Analyze→Nonparametric Test→2 Related-Samples Tests: (配对设计两样本均数的非参数检验)。

(3)操作过程 1、Analyze==>Nonparametic test==>2 Related Samples.. 2、Test Pair(S) List 框: 成对选入分析两个变量 3、Test type 复选框组:选中Wilcoxon 框 (默认)(符号秩检验) 4、单击

秩和检验

秩和检验 秩和检验方法最早是由维尔克松提出,叫维尔克松两样本检验法。后来曼—惠特尼将其应用到两样本容量不等()的情况,因而又称为曼—惠特尼U检验。这种方法主要用于比较两个独立样本的差异。 1、假设中的等价问题 设有两个连续型总体, 它们的概率密度函数分别为: f 1 (x),f2(x)(均为未知) 已知f1(x) = f2(x?a),a为末知常数,要检验的各假设为:H0:A = 0,H1:a < 0. H0:A = 0,H1:a > 0. . 设两个总体的均值存在,分别记为μ 1,μ 2 ,由于f1,f2最多只差一平移,则 有μ 2 = μ 1 ?a。此时, 上述各假设分别等价于:H0:μ1 = μ2,H1:μ1 < μ2 H0:μ1 = μ2,H1:μ1 > μ2 2、秩的定义 设X为一总体,将容量为n的样本观察值按自小到大的次序编号排列成x(1)< x (2) < Λ < x(n),称x(i)的足标i为x(i)的秩,i = 1,2,Λ,n。 例如:某施行团人员的行李重量数据如表: 写出重量33的秩。 因为28<33<34<39<41,故33的秩为2。

特殊情况: 如果在排列大小时出现了相同大小的观察值, 则其秩的定义为足标的平均值。 例如: 抽得的样本观察值按次序排成0,1,1,1,2,3,3, 则3个1的秩均为, 两个3的秩均为. 3、秩和的定义 现设1,2两总体分别抽取容量为n1,n2的样本,且设两样本独立。这里总假定。 我们将这n1 + n2个观察值放在一起,按自小到大的次序排列,求出每个观察值的秩,然后将属于第1个总体的样本观察值的秩相加,其和记为R1,称为第1样本的秩和,其余观察值的秩的总和记作R2,称为第2样本的秩和。 显然,R1和R2是离散型随机变量,且有 4、秩和检验法的定义 秩和检验是一种非参数检验法, 它是一种用样本秩来代替样本值的检验法。 用秩和检验可以检验两个总体的分布函数是否相等的问题 秩和检验的适用范围 如果两个样本来自两个独立的但非正态获形态不清的两总体,要检验两样本之间的差异是否显著,不应运用参数检验中的T检验,而需采用秩和检验。

spss秩和检验

秩和检验 应用条件 ①总体分布形式未知或分布类型不明; ②偏态分布的资料: ③等级资料:不能精确测定,只能以严重程度、优劣等级、次序先后等表示; ④不满足参数检验条件的资料:各组方差明显不齐。 ⑤数据的一端或两端是不确定数值,如“>50mg”等。 一、配对资料的Wilcoxon符号秩和检验(Wilcoxon signed-rank test) 例1对10名健康人分别用离子交换法与蒸馏法,测得尿汞值,如表9.1的第(2)、(3)栏,问两种方法的结果有无差别? 表1 10名健康人用离子交换法与蒸馏法测定尿汞值(μg/l) 样品号(1)离子交换法 (2) 蒸馏法 (3) 差值 (4)=(2)-(3) 秩次 (5) 1 0.5 0.0 0.5 2 2 2.2 1.1 1.1 7 3 0.0 0.0 0.0 — 4 2.3 1.3 1.0 6 5 6.2 3.4 2.8 8 6 1.0 4.6 -3.6 -9 7 1.8 1.1 0.7 3.5 8 4.4 4.6 -0.2 -1 9 2.7 3.4 -0.7 -3.5 10 1.3 2.1 -0.8 -5 T+=+26.5 T-=-18.5 差值先进行正态性及方差齐性检验,看是否可以做参数检验,其检验效能高于非参数检验。(下同) H0:Md(差值的总体中位数)=0 H1:Md≠0 α=0.05 T++T-=1+2+3+…n=n(n+1)/2 ①小样本(n≤50)--查T界值表 基本思想:如果无效假设H0成立,则正负秩和的绝对值从理论上说应相等,都等于n(n+1)/4,既使有抽样误差的影响正负T值的绝对值相差也不应过大。反过来说,如果实际计算出的正负T值绝对值相差很大,我们只能认为H0成立的可能性很小。 界值的判断标准 若下限表中概率值 若T≤下限或T≥上限,则P值≤表中概率值 ②大样本时(n>50),正态近似法(u检验) 基本思想:假定无效假设H0成立,则正负秩和的绝对值应相等,随着n增大T 逐渐趋近于均数等于n(n+1)/4、方差为n(n+1)(2n+1)/24的正态分布。所以可用近似正态法计算u值。即:

第十一章 非参数检验

第十一章非参数检验 第一节符号检验 符号检验的方法·符号检验的特点和作用 第二节配对符号秩检验 配对符号秩检验的方法·配对符号秩检验的效力 第三节秩和检验 秩和检验的方法·秩和检验的近似 第四节游程检验 游程的概念·游程检验的方法·差符号游程检验 第五节累计频数检验 累计频数检验的方法·累计频数检验的应用 一、填空 1.非参数检验,泛指“对分布类型已知的总体进行参数检验”()的所有检验方法。 2.符号检验的零假设就是配对观察结果的差平均起来等于()。 3.理论研究表明,对于配对样本非正态分布的差值d,()是最佳检验。 4.秩和检验检验统计量U是U1和U2中较()的一个。 5.秩尺度之统计量的均值和标准差只取决于()。 6.()常被用作经验分布与理论分布的比较。 7.绝对值相等的值,应将它们的秩()。 8.符号检验,在分布自由检验中称为()。 9.符号检验和配对符号秩检验,都只适用于()样本。 10.数据序列ABBABAAABABBABBAAAAAB的总游程数是() 二、单项选择 1.下列检验中,不属于非参数统计的方法的是()。 A总体是否服从正态分布 B 总体的方差是否为某一个值 C 样本的取得是否具有随机性 D 两组随机变量之间是否相互独立 2.下列情况中,最适合非参数统计的方法是()。 A反映两个大学新生成绩的差别 B 反映两个大学新生家庭人均收入的差别 C 反映两个大学三年级学生对就业前景的看法差别 D反映两个大学在校生消费水平的差别 3.不属于非参数检验的是()。 A符号检验B游程检验C累计频数检验 D F检验 4.在累计频数检验中,卡方的自由度为()。 A n1 B 2 C n2 D n1+n2

秩和检验秩和检验假设检验通常可划分为参数检验

第十二章秩和检验 假设检验通常可划分为参数检验(parametric test)和非参数检验(nonparamet ric test)两大类。 以特定的总体分布为前提,对未知的总体参数作推断的假设检验方法统称为参数检验。前面章节介绍的t检验和方差分析均要求样本来自正态总体,属于参数检验。非参数检验不以特定的总体分布为前提,也不对总体参数作推断,故也称为任意分布检验(distribution-free test)。 非参数检验具有广泛的适用性。由于总体不必服从特定分布,无论资料总体分布形式如何,一端或两端无界,甚至分布未知,都能适用。在非参数检验中,一般不直接用样本观察值做分析,统计量的计算是基于原始数据在整个样本中按大小所占的位次。由于非参数检验没有利用观察值的具体数值,而只利用了其大小次序的信息,信息利用不够充分,故凡适合参数检验的资料,应首选参数检验。但当总体分布不明确时,则应采用非参数检验。尤其对于那些难以确定分布又出现少量离群值的小样本数据,非参数检验在剔除这些数据前后所得结论显示出了较好的稳健性。 非参数检验方法很多,有秩和检验(rank sum test)、符号检验、游程检验、等级相关分析等。本章介绍在非参数检验中占有重要地位且检验功效相对较高的秩和检验。 第一节Wilcoxon符号秩和检验 1945年Wilcoxon提出的Wilcoxon符号秩和检验(Wilcoxon singned-rank tes t),亦称符号秩和检验,可用于配对设计计量差值的比较,还可用于单一样本与总体中位数的比较。 一、配对设计的两样本比较 (一) 本法的基本思想与步骤 配对设计资料主要是对差值进行分析。通过检验配对样本的差值是否来自中位数为0的总体,来推断两个总体中位数有无差别,即推断两种处理的效应是否不同。现以例12.1说明其基本思想与步骤。 例12.1 某研究用甲、乙两种方法对某地方性砷中毒地区水源中砷含量(mg

秩和检验答案

第十二章秩和检验 【思考与练习】 一、思考题 1. 简述参数检验和非参数检验的区别。 2. 简述非参数检验的适用范围。 3. 同一资料,又出于同一研究目的,当参数检验和非参数检验所得结果不一致时,以何者为准,请简述理由。 二、案例辨析题 某儿科医生比较甲、乙、丙三种药物治疗小儿腹泻的疗效,将379名小儿腹泻患者随机分为三组,分别采用甲、乙、丙三种药物治疗,结果见表12-1。 表12-1? 三种药物治疗小儿腹泻的疗效比较 疗效甲药乙药丙药合计 痊愈175? 5? 1 181 显效95 55? 5 155 进步64? 6 30 100 无效? 45 35? 6? 86 合计379 101 42 522 对于上述资料,该医生采用行×列表检验,得,,故认为三种药物的疗效有差别。该结论是否正确,为什么? 三、最佳选择题 1.以下方法中属于参数检验方法的是 A.? 检验 B.? 检验 C.? 检验 D. Wilcoxon符号秩和检验 E. Wilcoxon秩和检验 2.进行两小样本定量资料比较的假设检验时,首先应考虑 A.? 检验 B.? 检验 C. 秩和检验 D.? 检验 E. 满足参数检验还是非参数检验的条件 3.两组定量资料的比较,若已知、均小于30,总体方差不齐且呈极度偏态分布,宜采用 A.? 检验 B.? 检验 C.? 检验 D. 方差分析 E. 秩和检验 4. 欲比较三种药物治疗效果有无差异,如果治疗效果为有序分类变量,宜采用 A.? 检验 B. 方差分析 C.? 检验 D.Wilcoxon秩和检验 E.? 检验 5. 成组设计两样本比较的秩和检验,检验统计量T通常为 A. 较小的秩和

统计学习题第十一章非参数检验

第十一章 非参数检验 第一节 符号检验 符号检验的方法?符号检验的特点和作用 第二节 配对符号秩检验 配对符号秩检验的方法?配对符号秩检验的效力 第三节 秩和检验 秩和检验的方法?秩和检验的近似 第四节 游程检验 游程的概念?游程检验的方法?差符号游程检验 第五节 累计频数检验 累计频数检验的方法?累计频数检验的应用 填空 1.非参数检验, 泛指“对分布类型已知的总体进行参数检验” ( 2.符号检验的零假设就是配对观察结果的差平均起来等于( )。 3.理论研究表明,对于配对样本非正态分布的差值 d ,( )是最佳检验。 4. 秩和检验检验统计量 U 是Ui 和U 2中较( )的一个。 5.秩尺度之统计量的均值和标准差只取决于( )。 6. ( )常被用作经验分布与理论分布的比较。 7. 绝对值相等的值,应将它们的秩( )。 8. 符号检验,在分布自由检验中称为( )。 9. 符号检验和配对符号秩检验,都只适用于( )样本。 10 ?数据序列 ABBABAAABABBABBAAAA A 总游程数是( ) 单项选择 1. 下列检验中,不属于非参数统计的方法的是( )。 A 总体是否服从正态分布 B 总体的方差是否为某一个值 C 样本的取得是否具有随机性 D 两组随机变量之间是否相互独立 2. 下列情况中,最适合非参数统计的方法是( )。 A 反映两个大学新生成绩的差别 B 反映两个大学新生家庭人均收入的差别 C 反映两个大学三年级学生对就业前景的看法差别 D 反映两个大学在校生消费水平的差别 3. 不属于非参数检验的是( )。 法。 )的所有检验方

A 符号检验 B 游程检验 C 累计频数检验 D F 检验 4. 在累计频数检验中,卡方的自由度为()。 A n1 B 2 C n2 D n1+n2

秩和检验

第十章基于秩次的非参数检验 【教学要求】 掌握:非参数检验的基本概念及其适用的资料类型;参数检验与非参数检验的区别;掌握配对设计、单样本设计、完全随机化设计两独立样本及多独立样本秩和检验的应用条件、实施方法。 熟悉:常用秩和检验方法的步骤、结果解释。 了解:完全随机设计多个独立样本间的多重比较;通过电脑实验了解不同设计类型的秩和检验和相应t 检验的功效问题。 【重点难点】 (一)参数检验与非参数检验 1、参数检验 以特定的总体分布(如正态分布)为前提,对未知的总体参数(如总体均数)作推断的假设检验方法统称为参数检验,也叫参数统计。 2、非参数检验 当样本所来自的总体分布不服从特定分布,或难以用某种函数式来表达,解决这类问题可用非参数检验方法。非参数检验不依赖总体分布的具体形式,不受总体参数的限制,它检验的是分布,而不是参数。 (二)非参数检验的特点和适用范围 1、特点 (1)对样本所来自的总体分布形式没有要求。 (2)收集资料方便,可用“等级”或“符号”来记录观察结果。 (3)多数非参数检验方法比较简便,易于理解和掌握。 (4)缺点是损失信息量,适用于参数检验的资料用非参数检验会降低检验效能。 2、适用范围 (1)等级资料。 (2)偏态分布资料。当观察资料呈明显偏态分布而又未作变量变换,或经变

量变换仍未达到正态或近似正态分布时,宜用非参数检验。 (3)方差不齐,且不能通过变量变换达到齐性。 (4)个体数据偏离过大,或一端或两端无界的资料。 (5)分布类型不明。 (6)初步分析。有些医学资料由于统计工作量大,可采用非参数检验统计方法进行初步分析,挑选其中有意义者再进一步分析(包括参数统计内容)。 (三)配对设计差值的符号秩和检验(Willcoxon 配对法) 1、建立检验假设,确定检验水准 H 0:差值的总体中位数等于0 H 1:差值的总体中位数不等于0 α=0.05 2、计算检验统计量T 值 (1) 求差值d (2)编秩:依差值的绝对值由小到大编秩。当差值为0,弃去不计,n 随之减少;当差值绝对值相同,称为相持,取平均秩次。 (3)求正、负秩和 (4)确定统计量T :任取T +或 T -为统计量T 。 3、确定P 值,作出推断结论 (1)查表法:当n ≤50时,查T 界值表,得出P 值。若检验统计量T 值在上下界值范围内,其P 值大于表上方对应的概率值;若T 值在上下界值范围外,其P 值小于表上方对应的概率值;若T 值恰好等于上下界值,其P 值等于(一般是近似等于)表上方对应的概率值。 (2)正态近似法:若n >50时,可用Z 检验,按如下公式计算: 24 /)12)(1(5.04/)1(5 .0++-+-= --= n n n n n T T Z T T σμ 当相同秩次(相持现象)出现较多时(如超过25%),应改用校正公式: 48 ) (24)12)(1(5.04/)1(3 ∑-- ++-+-= j j c t t n n n n n T Z (四)一组样本资料的符号秩和检验

第十一章 非参数检验

第一节 非参数检验的基本概念及特点 一、非参数检验 (一)什么是“非参数” 非参数模型:缺乏总体分布模式的信息。 (二)非参数检验的定义 非参数检验:不需要假设总体是否为正态分布或方差是否为齐性的假设检验称非参数检验。 (三)非参数检验的优点和缺点: 1、优点: 一般不涉及总体参数,其假设前提也比参数假设检验少得多,适用面较广。 计算简便。 2、缺点: 统计效能远不如参数检验方法。由于当数据满足假设条件时,参数统计检验方法能够从其中广泛地充分地提取有关信息。非参数统计检验方法对数据的限制较为宽松,只能从中提取一般的信息,相对参数统计检验方法会浪费一些信息。 (四)非参数检验的特点: 1、它不需要严格的前提假设; 2、特别适用于顺序数据; 3、适用于小样本,且方法简单; 4、最大的不足是不能充分利用资料的全部信息; 5、不能处理“交互作用”,即多因素情况。 第二节 两个独立样本的非参数检验方法 一、秩和检验法 秩和即秩次的和或等级之和。秩和检验法也叫Mann-Whitney-Wilcoxon 检验,它常被译为曼-惠特尼-维尔克松检验,简称M-W-W 检验,也称Mann-Whitney U 检验。秩和检验法与参数检验法中独立样本的t 检验法相对应。当“总体正态”这一前提不成立时,不能用t 检验,可以用秩和检验法。 (一)秩统计量 秩统计量指样本数据的排序等级。假设从总体中反复抽取样本,就能得到一个对应于样本容量1n 和2n 的秩和U 的分布。这是一个间断而对称的分布,当1n 和2n 都大于10时,秩和T 的分布近期近似正态分布,其平均数和标准差分别为 () 21211++= n n n T μ ()1212 121++=n n n n T σ 其检验值为

相关主题
文本预览
相关文档 最新文档