生物统计第11章非参数检验

格式：ppt
大小：392.50 KB
文档页数：83

下载文档原格式

医学统计学第十一章非参数检验(课堂)

正秩（3）
负秩（4） 1.5
1.5 3 4 5 6 7 8 9 10 11 64.5
1.5
0.05 的 T 范围为 13-53； T=1.5 在此范围之外，P<0.05，按 0.05 水准拒绝 H 0 ，接受 H1 ，可认为该厂工人的尿氟含量高于当地正常人的尿氟含量。
单侧 n 11 ，
3．分别求正负秩次之和，任取正秩和或负秩和为T值 4．根据统计量T确定对应的P值（i）n<=50小样本时，查表（附表9） (ii) n>50大样本时，正态近似
编号
1 2 3
原法
60 142 195
新法
76 152 243
差值
16 10 48
正秩
8 5 11
负秩
4
5 6
80
242 220
82
240 220
第三节 K个独立样本检验
完全随机设计多个样本比较的 Kruskal-Wallis H检验
1. 原始数据的多个样本比较 Kruskal-Wallis H检验
H0 :多个总体分布位置相同 H1 :多个总体分布位置不全相同
0.05
例8-5 用三种药物杀灭钉螺，每批用200 只活钉螺，用药后清点每批钉螺的死亡数，再计算死亡率，结果见表，问三种药物杀灭钉螺的效果有无差别？
数据的总体分布类型不作严格假定，
又称任意分布检验(distribution-free test)，
它直接对总体分布的位置作假设检
验。
应用非参数检验的情况
1.不满足正态和方差齐性条件的小样本资料；
2.总体分布类型不明的小样本资料；
3.一端或二端是不确定数值（如＜0.002、＞65 等）的资料； 4.单向有序列联表资料；

常用的非参数检验（NonparametricTests）总结

常用的非参数检验（NonparametricTests）总结非参数检验(Nonparametric tests)是统计分析方法的重要组成部分，它与参数检验共同构成统计推断的基本内容。

参数检验是在总体分布形式已知的情况下，对总体分布的参数如均值、方差等进行推断的方法。

但是，在数据分析过程中，由于种种原因，人们往往无法对总体分布形态作简单假定，此时参数检验的方法就不再适用了。

非参数检验正是一类基于这种考虑，在总体方差未知或知道甚少的情况下，利用样本数据对总体分布形态等进行推断的方法。

由于非参数检验方法在推断过程中不涉及有关总体分布的参数，因而得名为“非参数”检验。

•两独立样本的非参数检验两独立样本的非参数检验是在对总体分布不甚了解的情况下，通过对两组独立样本的分析来推断样本来自的两个总体的分布等是否存在显著差异的方法。

独立样本是指在一个总体中随机抽样对在另一个总体中随机抽样没有影响的情况下所获得的样本。

SPSS中提供了多种两独立样本的非参数检验方法，其中包括曼-惠特尼U检验、K-S检验、W-W游程检验、极端反应检验等。

某工厂用甲乙两种不同的工艺生产同一种产品。

如果希望检验两种工艺下产品的使用是否存在显著差异，可从两种工艺生产出的产品中随机抽样，得到各自的使用寿命数据。

甲工艺：675 682 692 679 669 661 693乙工艺：662 649 672 663 650 651 646 652（1）曼-惠特尼U检验两独立样本的曼-惠特尼U检验可用于对两总体分布的比例判断。

其原假设：两组独立样本来自的两总体分布无显著差异。

曼-惠特尼U 检验通过对两组样本平均秩的研究来实现判断。

秩简单说就是变量值排序的名次，可以将数据按升序排列，每个变量值都会有一个在整个变量值序列中的位置或名次，这个位置或名次就是变量值的秩。

（2）K-S检验K-S检验不仅能够检验单个总体是否服从某一理论分布，还能够检验两总体分布是否存在显著差异。

生物统计学第11讲2 二项分布的检验+非参数检验

配对设计关心：差值
差值
平均
0.501
标准误差 0.18
中位数
0.49
众数
#N/A标准差源自0.70方差0.50
峰度
0.86
偏度
0.34
区域
2.8
最小值
-0.92
最大值
1.88
求和
8.01
观测数
16
• 例3 差值的描述性统计
8
解 H0：两种处理效果相同. H0 : p 0.5
HA ：H0不成立
大样本时……P125，例3.32
• 例4 Wilcoxon秩和检验
19
每个总体的样本含量>5，总样本含量>15 H0：各总体分布无差异.
2.多个独立样本的秩和检验
20
试判断三种不同人群的血浆总皮质醇测定有无差别？
正常人
0.11 0.52 0.61 0.69 0.77 0.86 1.02 1.08 1.27 1.92
肺癌病人 3.23
肺癌病人
4.2
肺癌病人 4.87
肺癌病人 5.12
肺癌病人 6.21
肺癌病人 7.18
肺癌病人 8.05
肺癌病人 8.56
肺癌病人
9.6
group 肺癌病人矽肺0期工人肺癌病人矽肺0期工人矽肺0期工人矽肺0期工人肺癌病人矽肺0期工人矽肺0期工人矽肺0期工人矽肺0期工人矽肺0期工人矽肺0期工人肺癌病人肺癌病人肺癌病人肺癌病人肺癌病人肺癌病人肺癌病人
6.82 2.78 9.60 59.80
10
16
group
RD
矽肺0期工人 3.23
矽肺0期工人 3.5

非参数检验(提纲)

非参数检验参数检验方法，尤其是对计量资料，需要对研究的总体作一些比较严格的假定。

例如t检验法要求总体分布是正态分布等。

在实际工作中的许多资料不符合这种要求，因此以上的参数检验方法的使用受到了限制。

近代统计学家发明了对总体分布不必作限制性假定的检验技术，这种技术称为非参数检验（Nonparametric tests）。

非参数检验法是指在总体不服从正态分布或分布情况不明时，用来检验数据资料是否来自相同总体假设的一类检验方法。

由于它的假定前堤比参数检验方法少的多，而且在收集资料方面也十分简单，例如可以用“等级”或“符号”来评定观察的结果等，故这类方法在实际中有着广泛的应用。

第一节两相关样本的显著性检验1.1 符号检验法在配对实验中，将每对（或同一）实验单位（或先后）给予两种不同的处理，比较两种处理的效果有无差异或比较一组实验单位处理先后有无不同。

凡配对计量资料不服从正态分布要求时，可选用符号检验法（Sign test）。

例题1 有x,y 12对数据，它们的数值及相差符号由表1给出。

表1 本例的数据资料序号 1 2 3 4 5 6 7 8 9 10 11 12X 3 1 6 3 2 1 4 7 3 8 4 5Y 2 4 4 7 2 2 2 5 3 6 2 2 问这两个序列数值的差异是否具有显著性（α=0.05）？1.2 符号秩和检验法符号检验中只考虑配对数据x i-y i的符号，计算十分简便，但因没有考虑到x i-y i 差值的大小，因此对资料的利用不够充分，检验的灵敏度也不够好。

符号秩和检验法是上述方法的改进，由于关注到了差值的大小，故效果较好。

凡配对计量或计数的资料，可选用符号秩和检验法（Wilcoxon法）。

例题2 为研究长跑运动对增强普通高校学生的心功能效果，对某学院15名男生进行实验，经过5个月的长跑锻炼后观察其晨脉变化情况。

锻炼前后的晨脉数据如下。

问锻炼前后晨脉间的差异有无显著性（α=0.05）？表2 长跑锻炼前后的晨脉数、差值及其秩次序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 前70 76 56 63 63 56 58 60 65 65 75 66 56 59 70 后46 54 60 64 48 55 54 45 51 48 56 48 64 50 54 差值22 22 -4 -1 15 1 4 15 14 17 19 18 -8 9 16 秩次14.5 14.5 –3.5 –1.5 8.5 1.5 3.5 8.5 7 11 13 12 -5 6 101.3 用spss对两相关样本进行非参数检验spss软件包的Nonparametric Tests过程为两相关样本通常提供了3种非参数检验方法，它们是：Sign 检验，用于对两相关样本的总体做符号检验。

非参数检验

非参数检验又称为任意分布检验（distribution-free test），它不考虑研究对象总体分布具体形式，也不对总体参数进行统计推断，而是通过检验样本所代表的总体分布形式是否一致来得出统计结论。
非参数检验的优点：
①适用范围广，不论样本来自的总体分布形式如何，都可适用；
②某些非参数检验方法计算简便，研究者在急需获得初步统计结果时可采用；
的总体分布不同。 α=0.05
2．混合编秩
依据两组数值由小到大编秩，结果见上表。
3．求秩和并确定检验统计量T
把两组秩次分别相加求出两组的秩和值，R1=315.5，R2=149.5。因乳酸钙组样本含量较小，故 T=R2=149.5。
4．确定P值和作出推断结论以较小样本含量为n1，n1=14, n2n1=2，查附表6，两样本比较秩和检验用T界值表（双侧）。
当n1>20或（n2-n1）>10时，附表6 中查不到P值，则可采用正态近似法求u 值来确定P值，其公式如下：
u T n1(N 1) / 2 0.5 n1n2(N 1) 12
上式中T为检验统计量值，n1、n2 分别为两样本含量，N=n1+n2，0.5这连续性校正数。上式为无相同秩次时使用或作为相同秩次较少时的近似值。当两样本相同秩次较多（超过总样本数的 25%）时，应按下式进行校正，u经校正后可略增大，P值则相应减小。
式中，Ri为各组的秩和，ni为各组样本含量，N为总样本含量。
当各组相同秩次较多时，可对H值进行校正，按下式求值。
Hc H c
C 1
(t
3 j
t
j
)
(N3 N)
4．确定P值和作出推断结论
当组数K=3，每组样本含量ni≤5时，可查附表7（H界值表）得到P值。若 k>3或ni>5时，H值的分布近似于自由度为k-1的χ2分布，此时可查附表 4χ2界值表得到P值。最后按P值作出推断结论。

非参数检验——【北大医学统计学】

Z= 3.628，P=0.000<0.05，按α= 0.05水平，拒绝H0，
认为正常人和慢性支气管炎病人痰液此类白细胞的检查结果不相同。
第三节多个样本比较秩和检验（Kruskal-Wallis法）
多样本比较当资料不满足参数检验的条件时，可以采用秩和检验的分析方法。
例4 某医院用中医、西医和中西医结合三种疗法治疗某病，病人所需治愈天数。问三种疗法所需治愈天数有无差异？
人数
频
正常人病人数
累计频数
秩次
平均秩次
秩和 T1
(2)
(3)
（5）范围（7） (8)=(2)
（4）
（6）
(7)
11
5
16
16
1~16
8.5
93.5
10
18
28
44 17~44 30.0
305.0
3
16
19
63 45~63 54.5
162.0
0
5
5
68 64~68 66.0
0
24
44
68
—
—
—
T1=560.
5
秩和 T2
(9)=(3) (7)
42.5 549.0 864.0 330.0 T2=1785
.5
检验的基本原理同例2，由于相同秩
次的个数过多，需对z值进行校正。
SPSS操作同例2。
SPSS操作
dataweight case weight case by : freq
OK Analyze NonparametricTest
Test pairs list : old-new Test Type ：选择Wilcoxon OK

统计学：非参数检验

例10-1 某研究者欲研究保健食品对小鼠抗疲劳作用，将同种属的小鼠按性别和年龄相同、体重相近配成对子，共10对，并将每对中的两只小鼠随机分到保健食品两个不同的剂量组，过一定时期将小鼠杀死，测得其肝糖原含量（mg/100g），结果见表10-1，问不同剂量组的小鼠肝糖原含量是否不同？
5
表10-1 不同剂量组小鼠肝糖原含量（mg/100g）小鼠对号中剂量组高剂量组差值 d (1) (2) (3) (4)=(3)-(2) 1 620.16 958.47 338.31 2 866.50 838.42 -28.08 3 641.22 788.90 147.68 4 812.91 815.20 2.29 5 738.96 783.17 44.21 6 899.38 910.92 11.54 7 760.78 758.49 -2.29 8 694.95 870.80 175.85 9 749.92 862.26 112.34 10 793.94 805.48 11.54
15
表 10-3 某河流甲乙断面亚硝酸盐氮含量（mg/L）监测
河流甲断面亚硝酸盐氮秩次含量 0.014 1.0 0.018 2.5 0.024 8.5 0.025 10.5 0.027 12.0 0.034 15.0 0.038 19.0 0.043 20.0 0.064 22.5 0.100 25.0 n1=10 T1=136 亚硝酸盐氮含量 0.018 0.019 0.020 0.022 0.023 0.024 0.025 0.028 0.030 0.035 河流乙断面秩次亚硝酸盐氮含量 2.5 0.036 4.0 0.037 5.0 0.055 6.0 0.064 7.0 0.067 8.5 10.5 13.0 14.0 16.0 n2=15 秩次 17.0 18.0 21.0 22.5 24.0

非参数检验

➢ 编秩：数据相等则取平均秩,
➢ 求秩和
➢ 计算检验统计量H值
H 12 N(N 1)
Ri2 3( N 1) ni
出生体重（kg）xij ABCD
相应秩次 Rij A BCD
2.7 2.9 3.3 3.5
3
4
7 11
2.4 3.2 3.6 3.6
2 5.5 12.5 12.5
2.2 3.2 3.4 3.7
χ 2 12
R
2 i
3(N1)
N(N1) ni
χ2
12 14(14 1)
152
4
152 3
37.52 4
37.52 3
3(14
1)
χ 2 9.375
χ
2 c
1
χ2
(t
3 j
t
j
)
n3 n
1
(23
9.375 2) (33 3) (23
143 14
2)
9.50
四、随机区组设计资料的秩和检验（Friedman test）
正态近似法
如果n1或n2-n1超出附表的范围，可按下式计算u值：
u | T n1(N 1) / 2 | 0.5 n1n2 (N 1) / 12
在相同秩次较多时，应用下式进行校正：
uC u / C
C 1
(t
3 j
t
j
)
/(N
3
N)
tj为第j组相同秩次的个数
频数表资料（或等级资料）两样本资料比较
xi (2) 86 71 77 68 91 72 77 91 70 71 88 87
12 对双胞胎兄弟心理测试结果
后出生者得分差值

第十一章非参数检验

第十一章非参数检验前面有关章节讨论的参数检验都要求总体服从一定的分布，对总体参数的检验是建立在这种分布基础上的。

例如，两样本平均数比较的t 检验和多个样本平均数比较的F 检验，都要求总体服从正态分布，推断两个或多个总体平均数是否相等。

本章引入另一类检验——非参数检验（non-parametric test ）。

非参数检验是一种与总体分布状况无关的检验方法，它不依赖于总体分布的形式，应用时可以不考虑被研究的对象为何种分布以及分布是否已知。

非参数检验主要是利用样本数据之间的大小比较及大小顺序，对两个或多个样本所属总体是否相同进行检验，而不对总体分布的参数如平均数、标准差等进行统计推断。

当样本观测值的总体分布类型未知或知之甚少，无法肯定其性质，特别是观测值明显偏离正态分布，不具备参数检验的应用条件时，常用非参数检验。

非参数检验具有计算简便、直观，易于掌握，检验速度较快等优点。

非参数检验法从实质上讲，只是检验总体分布的位置（中位数）是否相同，所以对于总体分布已知的样本也可以采用非参数检验法，但是由于它不能充分利用样本内所有的数量信息，检验的效率一般要低于参数检验方法。

例如，非配对资料的秩和检验，其效率为t 检验的86.4%，就是说以相同概率判断出差异显著，t 检验所需的样本个数要少13.6%。

非参数检验内容很多，本章只介绍常用的符号检验（sign test ），秩和检验（rank-sum test ）和等级相关分析（rank correlation analysis ）三种。

第一节符号检验一、配对资料的符号检验（一）配对资料符号检验的意义配对资料符号检验是根据样本各对数据之差的正负符号多少来检验两个总体分布位置的异同，而不去考虑差值的大小。

每对数据之差为正值用“+”表示，负值用“－”表示。

可以设想如果两个总体分布位置相同，则正或负出现的次数应该相等。

若不完全相等，至少不应相差过大，否则超过一定的临界值就认为两个样本所来自的两个总体差异显著，分布的位置不同。

非参数检验的名词解释

非参数检验的名词解释
非参数检验是一种统计方法，用于在数据不满足正态分布或其他假设条件的情况下进行统计推断。

与参数检验相比，非参数检验不需要对总体参数做出假设，而是直接利用样本数据进行推断。

以下是相关名词解释：
1. 非参数：指在进行统计推断时，不对总体的分布形式或参数做出特定的假设。

非参数方法依赖于具体的样本数据，不依赖于总体的分布特征。

2. 假设检验：统计推断的一种方法，用于通过对样本数据进行分析来得出关于总体参数或总体分布的结论。

假设检验通常涉及对某个假设的拒绝或接受。

3. 正态分布：也称为高斯分布，是一种连续概率分布，常用于描述许多自然现象和随机变量的分布。

参数检验通常基于对总体数据服从正态分布的假设。

4. 参数检验：通过对总体参数的估计和假设进行统计推断的
方法。

参数检验通常要求数据满足特定的假设条件，如正态分布、独立性和方差齐性等。

5. 统计显著性：在假设检验中，用于评估观察到的差异或效应是否显著。

统计显著性通常以p值表示，若p值小于预设的显著性水平（如0.05），则可以拒绝零假设。

非参数检验在实际应用中具有灵活性和广泛适用性，特别适合处理样本数据不满足假设条件的情况。

它们不依赖于总体分布的形式，因此更加鲁棒，并可以应用于各种类型的数据集。

生物统计学：非参数检验

｛ n+,n-｝= n+=2 。
3、统计推断当n=15时，查附表11 得临界值K0.05(15)=3 ， K0.01(15) = 2 ，因为 K = 2 = K0.01(15)，P≤0.01，表明噪数与总体中位数比较的符号检验
1、建立假设 HO：样本所在的总体中位数=已知总体中位数； HA ：样本所在的总体中位数≠已知总体中位数。（若将备择假设 HA 中的“≠”改为“＜” 或“＞”，则进行一尾检验）
依赖于特定分布类型，比较的是参数
优点：方法简便、易学易用，易于推广使用、应用范围广；可用于参数检验难以处理的资料（如等级资料，或含数值 “>50mg”等）。缺点：方法比较粗糙，对于符合参数检验条件者，采用非参数检验会损失部分信息，其检验效能低；样本含量较大时，两者结论常相同。
第一节符号检验
非参数检验的弱点可能会浪费一些信息特别当数据可以使用参数模型的时候大样本手算相对麻烦一些表不易得到
参数检验（parametric test）
非参数检验（nonparametric test）
已知总体分布类型，对未知参数进行统计推断
对总体的分布类型不作严格要求不受分布类型的影响，比较的是总体分布位置
124.3 147.9 -15.7 7.9 +
1、提出无效假设与备择假设
HO ：该地成年公黄牛胸围的平均数=140厘米, HA ：该地成年公黄牛胸围的平均数≠140厘米。
2、计算差值、确定符号及其个数样本各观测值与总体平均数的差值及其符号列于表 11-2 ，并由此得 n+=6 ，n-=4 ，
非参数统计的名字中“非参数”意味着其方法不涉及描述总体分布的有关参数；

第十一章-非参数检验

R>R0.05时，P>0.05， R≤R0.05时，P≤0.05
本例: R=10<R0.05＝14，n=12， P<0.05，拒绝H0，故认为A，B两种照射方式造成的急性皮肤损伤程度不同，B照射的损伤程度比A照20射24年严9月重2。1日
（ii）大样本（n>10）时, 可采用正态近似
u | R n(n 1) / 4 | 10 12(12 1) / 4 2.275 n(n 1)(2n 1) / 24 12(12 1)(2 12 1) / 24
在0.05检验水平拒绝H0，接受H1,认为三组脾淋巴细胞对HPA刺激的增值反应不全相同。
2024年9月21日
频数表法: 属于同一组段的观察值，一律取平均秩次（组中值），再以该组段频数加权，计算Hc值。表分娩时孕周与乳量的关系
乳量
早产
足月产
过期产
合计
秩次范围
平均
秩和
秩次早产足月产过期产
查标准正态分布表，得 P 值校正公式：（当相同秩次个数较多时）
| R n(n 1) / 4 |
u
n(n 1)(2n 1) / 24 (ti3 ti ) / 48
10 12(12 1) / 4 2.282
12(12 1)(212 1) / 24 [(33 3) (33 3)]/ 48
2024年9月21日
⑴ H0: 两样本来自相同总体； H1: 两样本来自不同总体（双侧）
=0.05
或H1: 样本A高于样本B（单侧）
⑵ 编秩：两样本混合编秩次，求得R1、R2.T。
相同观察值（即相同秩，ties），不同组------平均秩次。 ⑶ 确定P值作结论:
①查表法 (n0≤10，n2 n1≤10) 查附表9

十一章节非参数检验

方法：—将观察值按由小到大的次序排列， —编定秩次， —求出秩和进行假设检验。
一、配对试验资料的符号秩和检验二、非配对试验资料的秩和检验三、多个样本比较的秩和检验四、多个样本两两比较的秩和检验
一、配对试验资料的符号秩和检验（Wilcoxon配对法）
1、建立假设 HO：差值d总体的中位数=0； HA：差值d总体的中位数≠0。 2、秩次和符号求配对数据的差值d；按d绝对值从小到大编秩次；根据原差值正负在各秩次前标上正负号
134.1, 124.3, 147.9, 143.0（cm）。问该
地成年公黄牛胸围与该品种胸围平均数是否有显著差异？
表11-2 成年公黄牛胸围测定值符号检验表
牛号 1
23
4
56
7
8
9 10
胸围 128.1 144.4 150.3 146.2 140.6 139.7 134.1 124.3 147.9 143
3、统计推断
由 n = 10 ，查附表 11，得
K0.05(10)=1，K＞K0.05(10) ，P＞0.05，不能否定HO ，表明样本
平均数与总体平均数差异不显著，可以认为该地成年公黄牛
胸围的平均数与该品种胸围总体平均数相同。
第二节秩和检验
秩和检验也叫做符号秩和检验（signed rank-sum test），或称Wilcoxon检验，其统计效率远较符号检验为高。秩和检验与符号检验法不同，要求差数来自某些对称分布的总体，但并不要求每一差数来自相同的分布。
3、确定统计量T
将两个样本重新分开，计算各自的秩和。将较
小的样本含量作为n1，其秩和作为检验的统计量T。若n1=n2，则任取一组的秩和为T。
4、统计推断

生物统计学在生物医学研究中的非参数检验

生物统计学在生物医学研究中的非参数检验关键信息项：1、非参数检验的定义和适用范围2、生物医学研究的类型和特点3、非参数检验在生物医学研究中的具体应用方法4、数据收集和预处理的要求5、非参数检验结果的解读和分析6、与参数检验的比较和选择依据7、非参数检验的优势和局限性8、研究中的误差控制和质量保证9、相关统计软件和工具的使用10、数据存储和共享的规定1、引言11 生物统计学在生物医学研究中的重要性111 为研究提供科学的设计和分析方法112 确保研究结果的可靠性和有效性2、非参数检验的概述21 定义和基本原理211 不依赖于特定的总体分布假设212 基于数据的秩次或顺序信息进行分析22 适用范围221 数据不符合正态分布222 存在极端值或离群点223 数据为定类或有序分类变量3、生物医学研究的类型与特点31 临床试验311 随机对照试验312 观察性研究32 流行病学研究321 病例对照研究322 队列研究33 基础医学研究331 细胞和分子生物学实验4、非参数检验在生物医学研究中的应用41 生存分析411 KaplanMeier 估计412 Logrank 检验42 秩和检验421 Wilcoxon 秩和检验422 KruskalWallis 检验43 符号检验和符号秩检验431 配对设计中的应用5、数据收集和预处理51 数据来源的可靠性和准确性511 临床记录512 实验室检测结果52 缺失值的处理521 完全随机缺失、随机缺失和非随机缺失的区分522 常用的处理方法，如删除、填补等53 数据的标准化和归一化6、非参数检验结果的解读与分析61 P 值的意义和判断611 显著水平的设定612 结果的统计学显著性与实际意义的结合62 效应量的估计和解释621 常见的效应量指标，如中位数差值、秩相关系数等63 多重比较的调整7、与参数检验的比较和选择71 参数检验的特点和适用条件711 数据满足正态性和方差齐性假设72 非参数检验与参数检验的优劣721 非参数检验的稳健性722 参数检验的效率73 选择的依据和决策流程8、非参数检验的优势和局限性81 优势811 对数据分布要求宽松812 适用范围广泛82 局限性821 检验效能相对较低822 结果的解释相对复杂9、研究中的误差控制和质量保证91 抽样误差的控制911 合理的抽样方法和样本量计算92 测量误差的控制921 仪器校准和操作规范93 数据录入和分析过程中的质量控制10、相关统计软件和工具101 常用的统计软件，如 SPSS、SAS、R 等1011 非参数检验模块的功能和操作102 在线统计工具的应用11、数据存储和共享111 数据的安全存储1111 数据库的建立和管理1112 备份和恢复策略112 数据共享的原则和规范1121 保护研究参与者的隐私12、结论121 非参数检验在生物医学研究中的重要地位和作用122 对未来研究中应用的展望和建议以上协议内容仅供参考，您可根据实际需求进行修改和完善。

非参数统计方法在生物统计中的应用

非参数统计方法在生物统计中的应用在生物统计领域，统计方法是进行数据分析和推断的重要工具。

其中，非参数统计方法是一种不需对总体分布函数做出假设的方法，因此应用较为广泛。

本文将探讨非参数统计方法在生物统计中的应用，并从实际研究案例中展示其强大的功能。

一、基本概念非参数统计方法是一类不依赖于总体分布假设的统计方法，主要适用于数据不服从常见分布或样本容量较小的情况。

与参数统计方法相比，非参数方法没有要求对数据进行特定的变换或假设分布的拟合，因此更具灵活性和应用性。

二、生物统计中的应用1. 非参数假设检验非参数假设检验是非参数统计方法的核心应用之一。

在生物统计研究中，常见的假设检验问题包括两样本比较、多样本比较和相关性分析等。

非参数假设检验方法如Wilcoxon秩和检验、Kruskal-Wallis检验和Spearman等级相关性检验可以在数据分布未知、非正态或存在异常值的情况下进行有效的统计推断。

例如，一个研究人员想要比较两组动物的体重变化是否存在显著差异。

对于两组样本中每个动物的体重进行秩和检验，就可以得到结果是否存在显著差异，而不需要对体重数据的分布进行假设。

2. 非参数回归分析非参数回归分析是一种用于建立和评估自变量与因变量之间关系的方法，适用于没有线性假设或非线性关系的数据。

它可以更好地适应复杂的数据关系，并避免过拟合或欠拟合的问题。

例如，一个研究人员想要探究温度对植物生长的影响，但不确定其关系是线性还是非线性的。

使用非参数回归分析方法，可以拟合出温度和植物生长之间的关系曲线，并通过检验其显著性来评估影响。

3. 生存分析生存分析是用于研究事件发生时间或生存时间的统计方法。

在生物统计研究中，生存分析常用于研究患者生存时间、药效持续时间等重要问题。

非参数生存分析方法如Kaplan-Meier曲线和Log-Rank检验是生存分析中常用的工具，可用于估计生存曲线并比较不同组别之间的生存差异。

三、案例分析为了更好地展示非参数统计方法在生物统计中的应用，我们以一项针对药物疗效的研究为例进行案例分析。

医学统计学-非参数检验

10
无效
8
合计
B(10-12天)
9
10
7
4
C(21-30天) 16
10
3
1
视分组为无序，即为单向有序表
三总体分布位置相同
三总体分布位置不全同
2. SPSS中实现过程
在菜单中选择“K Independent Samples”命令
“Several Independent Samples：Define Range”对话框
2. SPSS中实现过程
研究问题对19只小鼠中的9只接种第一种伤寒杆菌，其余接种第二种伤寒杆菌，接种后的存活天数见表，判定两种伤寒杆菌的存活天数是否不同。
两总体分布位置相同
两总体分布位置不同
2. SPSS中实现过程
3. 结果
不能认为两总体分布位置不同，不能认为接种两种伤寒杆菌的存活天数不同。
各总体分布位置相同
各总体分布位置不全同
2. SPSS中实现过程
在菜单中选择“K Independent Samples”命令
“Several Independent Samples：Define Range”对话框
3.结果
三个总体分布位置不全同，三种药物杀灭钉螺的效果有差别。
三. 两配对样本非参数检验（配对秩和）
post_2 70.00 71.00 75.00 68.00 74.00 70.00 63.00 70.00 65.00 70.00 70.00
post_3 69.00 70.00 75.00 70.00 70.00 69.00 61.00 70.00 65.00 60.00 69.00
实现步骤
（Wilcoxon Signed Rank Test)

非参数统计

例外
例外
有的统计问题，从不同的角度，可以理解为参数性的，也可以理解为非参数性的。例如线性回归（见回归分析）问题，若关心的是估计回归系数，它只是有限个实参数，因而可以看成是参数性的。但是，如果对随机误差的分布类型没有作任何假定，则从问题的总体分布这个角度看，也可以看成是非参数性的。
统计方法
统计方法
谢谢观看
重要的非参数统计方法秩方法是基于秩统计量（见统计量）的一类重要的非参数统计方法。设有样本 X1,X2，…，Xn，把它们由小到大排列，若Xi在这个次序中占第Ri个位置（最小的占第1个位置），则称Xi的秩为 Ri(i=1,2，…，n）。1945年F.威尔科克森提出的"两样本秩和检验"是一个有代表性的例子。设X1,X2，…，Xm 和Y1,Y2，…，Yn分别是从分布为 F(x）和 F(x-θ）的总体中抽出的样本，F连续但未知，θ也未知，检验假设 H：θ=0，备择假设为θ>0（见假设检验）。记Yi在混合样本（X1,X2，…，Xm，Y1，Y2，…，Yn）中的秩为Ri，且为诸秩的和，当W >C时，否定假设H，这里C决定于检验的水平。这是一个性能良好的检验。秩方法的一个早期结果是C.斯皮尔曼于1904年提出的秩相关系数。设（X1，Y1),(X2，Y2），…，（Xn,Yn）是从二维总体（X，Y）中抽出的样本，Ri为Xi在（X1,X2，…，Xn）中的秩，Qi为Yi在（Y1,Y2，…，Yn）中的秩，定义秩相关系数为（Ri,Qi)(i=1,2，…n）的通常的相关系数（见相关分析）。它可以作为X、Y之间相关程度的度量，也可用于检验关于X、Y独立性的假设。
次序统计量和U统计量在非参数统计中也有重要应用。前者可用于估计总体分布的分位数（见概率分布）、检验两总体有相同的分布及构造连续总体分布的容忍限和容忍区间（见区间估计）等。后者主要用于构造总体分布的数字特征的一致最小方差无偏估计（见点估计）及基于这种估计的假设检验。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

2.计算差值、确定符号及其个数
统计样本观察值与已知总体中位数的差值的符号
n= n++ n检验的统计量K 为n+、n-中的较小者。
3.统计推断（同配对资料的符号检验）
注意：
样本的配对数少于6对时，不能检验出差别，
在7-20对时也不敏感，在20对以上则比较有用。
【例11.2】已知某品种成年公黄牛胸围平均数为140
某试验用大白鼠研究饲料维生素E缺
乏与肝脏中维生素A含量的关系，先将大白鼠按性
别、月龄、体重等配为10对，再把每对中的两只
大白鼠随机分配到正常饲料组和维生素E缺乏饲料
组，试验结束后测定大白鼠肝中维生素A的含量如
表11-4。试检验两组大白鼠肝中维生素A的含量是
否有显著差异。
表11-3 不同饲料鼠肝维生素A含量资料
二、非配对试验资料的秩和检验（Wilcoxon非配对法） 1.建立假设
HO：甲样本所在的总体的中位数=乙样本所在的总体的中位数； HA：甲样本所在的总体的中位数≠乙样本所在的总体的中位数。
2、求两个样本合并数据的秩次
将两样本合并后的数据按从小到大的顺序排列，与每个数据对应的序号即为该数据的秩次，最小数值的秩次为“1”，最大数值的秩次为“n1+n2”。
n= n++ n检验的统计量为K 为n+、n-中的较小者
3、统计推断
由n查附表9（P310）得临界值K0.05(n)，
K0.01(n)，作统计推断：
如果K＞K0.05(n) ，P＞0.05，则不能否定
HO，两个试验处理差异不显著；如果K0.01(n) ＜K≤K0.05(n) ，0.01＜ P≤0.05，则否定HO，接受HA，两个试验处理差异组 1
3550
2
3
4
5
6
7
8
9
10
2000 3100 3000 3950 3800 3620 3750 3450 3050
维生素E 2450 2400 3100 1800 3200 3250 3620 2700 2700 1750 缺乏组差值di 秩次
1100 -400 0 1200 750 550 0 1050 750 1300
+6
-1
+7
+3.5
+2
+5
+3.5
+8
1.提出无效假设与备择假设
HO：差值d总体的中位数=0；
HA：差值d总体的中位数≠0。
2.编秩次、定符号计算表11-3中配对数据差值di，将d =0的舍去，共有差值n=8 个。按绝对值从小到大排列秩次并标上相应的符号，差值绝对值为750的有两个，它们的秩次为3和4，所以其平均秩次为（3+4）/2=3.5，结果见表11-3。
3、求H值
H
n(n 1)
12
2 Ri
3(n 1)
ni
式中，Ri为第i个样本的秩次之和；
ni为第i个样本的含量；n=∑ni
4、统计推断
根据 n, ni 查附表 10 （ 3 ），得临界值：
H0.05，H0.01。
若H＜H0.05，P＞0.05，不能否定HO，可以认
厘米，今在某地随机抽取10头该品种成年公黄牛，
测得一组胸围数字：128.1, 144.4 ,
150.3 ,
146.2, 140.6, 139.7, 134.1, 124.3, 147.9,
143.0（cm）。问该地成年公黄牛胸围与该品种胸
围平均数是否有显著差异？
表11-2 成年公黄牛胸围测定值符号检验表
3.确定统计量T
此例，正号有7个，其秩次为2，3.5，3.5，5，
6，7，8，秩次和为：2+3.5+3.5+5+6+7=35；负
号只有1个，其秩次为1，秩次和等于1。负号秩
次和较小，所以T=1。
4.统计推断由n=8查附表10(1)得， T0.05(8)=3，T0.01(n)=0，因为T0.01(8) ＜T＜T0.05(8) ，0.01＜P＜0.05，否定HO，接受HA，表明两个试验处理差异显著。
第十一章
非参数检验
非参数检验是一种与总体分布状况无关的检验方法，它主要是利用样本数据之间的大小比较及大小顺序，对样本及其所属总体作差别检验，而不对总体分布的参数如平均数、标准差等进行估计推断。
优点
计算简便、直观，易于掌握，检验速度较快
缺点
降低了检验的准确性，效率一般要低于参数检验方法
HO ：噪声刺激前后猪的心率差值d总体
中位数 =0；
HA ：噪声刺激前后猪的心率差值d总体
中位数≠0。
2.计算差值并赋予符号噪声刺激前后的差值符号列于表11-1第 4 行和第 5 行，从而得 n+=2 ， n-=13 ， n=2+13=15，K=min｛ n+,n-｝= n+=2 。
本章主要内容
第一节第二节第三节符号检验（sign test）秩和检验（rank-sum test）等级相关分析（rank correlation analysis）
第一节
符号检验
一、配对资料的符号检验二、样本中位数与总体中位数比较的符号检验
一、配对资料的符号检验
配对资料符号检验是根据样本各对数据
方法：
① 将观察值按由小到大的次序排列， ② 编定秩次， ③ 求出秩和进行假设检验。
本节主要内容
一、配对试验资料的符号秩和检验
二、非配对试验资料的秩和检验三、多个样本比较的秩和检验四、多个样本两两比较的秩和检验
一、配对试验资料的符号秩和检验
(Wilcoxon配对法）
1.建立假设 HO：差值d总体的中位数=0； HA：差值d总体的中位数≠0。
如果T＞T0.05(n) ，P＞0.05，则不能否定HO，表
明两个试验处理差异不显著；
如果T0.01(n) ＜T≤T0.05(n) ，0.01＜P≤0.05，则
否定HO，接受HA，表明两个试验处理差异显著；
如果T≤T0.01(n)，P≤0.01，则否定HO，接受HA，
表明两个试验处理差异极显著。
【例11.3】
低能量秩次
45 56 58 46 512 512 591 531 7 7 5 7 1 4 7 5 8.5 10 6 2
1.提出无效假设与备择假设
HO：高能量饲料增重总体的中位数=低能
量饲料增重总体的中位数；
HA：高能量饲料增重总体的中位数≠低
能量饲料增重总体的中位数。
2、编秩次
将两组数据混合从小到大排列为秩次。
牛号
1
2
144. 4 4.4 +
3
4
5
6
7
8
124. 3 -15.7 -
9
147. 9 7.9 +
10
143 3 +
胸围 128.1 差值符号 -11.9 -
150. 140. 146.2 139.7 134.1 3 6 6.3 + 6.2 + 0.6 + -0.3 -5.9 -
1.提出无效假设与备择假设
3.统计推断
当n=15时，查附表9得临界值K0.05(15)=3 ，
K0.01(15) = 2 ，因为 K = 2 = K0.01(15)，P≤0.01，
表明噪声刺激对猪的心率影响极显著。
二、样本中位数与总体中位数比较的符号检验
1.建立假设
HO：样本所在的总体中位数=已知总体中位数； HA ：样本所在的总体中位数≠已知总体中位数。（若将备择假设HA中的“≠”改为“＜”或“＞ ”，则进行一尾检验）
两种不同能量水平的饲料对肉仔鸡增重的影响有无
差异？
表11-4 两种不同能量水平饲料的肉仔鸡增重及秩和检验
饲料 60 3 肉仔鸡增重（g） 58 62 65 598 617 5 0 0 11 14 13 15 n1=6 T1=73.5 n2=9 T2=46.5
高能量秩次
12 8.5 48 9 3
当分布对称时，中位数与平均数相等。
配对资料的符号检验的步骤
1.建立假设无效假设HO：两处理差值d总体中位数=0 备择假设HA：两处理差值d总体中位数≠0 或d总体中位数＜0 (一尾检验) 或d总体中位数＞0 (一尾检验)
2.计算差值并赋予符号
d＞0者记为“+”，总个数记为n+ d＜0者记为“－”,总个数记为nd=0记为“0”，总个数记为n0
2、秩次和符号
①
② ③
求配对数据的差值d；
按d绝对值从小到大编秩次；根据原差值正负在各秩次前标上正负号
3.统计量T ① ② 分别计算正秩次及负秩次的和，以绝对值较小的秩和绝对值为检验的统计量T。
4、统计推断根据n（正、负差值的总个数为n ）查附表10(1) 符号秩和检验用T 临界值表，得T0.05(n)，T0.01(n)。
定HO，
若 T 在T’0.05—T0.05 之外但在T’0.01—T0.01 之内，
0.01＜P≤0.05，则否定HO，接受HA;
若T在T’0.01—T0.01之外，P＜0.01，则否定HO，
接受HA。
【例11.4】
研究两种不同能量水平饲料对5-6周龄
肉仔鸡增重（克）的影响，资料如表11-4所示。问
在低能量组有两个“512”，不求平均秩次，其
秩次分别为4和5；在高、低两组有一对数据为
“585”，需求它们的平均秩次：(8+9)/2=8.5。
结果见表11-4。
3.确定统计量T

生物统计第11章非参数检验

合集下载

医学统计学第十一章非参数检验(课堂)

常用的非参数检验（NonparametricTests）总结

生物统计学第11讲2 二项分布的检验+非参数检验

非参数检验(提纲)

非参数检验

非参数检验——【北大医学统计学】

统计学：非参数检验

非参数检验

第十一章非参数检验

非参数检验的名词解释

生物统计学：非参数检验

第十一章-非参数检验

十一章节非参数检验

生物统计学在生物医学研究中的非参数检验

非参数统计方法在生物统计中的应用

医学统计学-非参数检验

非参数统计

文档推荐

最新文档

生物统计 第11章 非参数检验

合集下载

医学统计学第十一章 非参数检验(课堂)

常用的非参数检验（NonparametricTests）总结

生物统计学 第11讲2 二项分布的检验+非参数检验

非参数检验(提纲)

非参数检验

非参数检验——【北大 医学统计学】

统计学：非参数检验

非参数检验

第十一章非参数检验

非参数检验的名词解释

生物统计学：非参数检验

第十一章-非参数检验

十一章节非参数检验

生物统计学在生物医学研究中的非参数检验

非参数统计方法在生物统计中的应用

医学统计学-非参数检验

非参数统计

文档推荐

最新文档

生物统计第11章非参数检验

医学统计学第十一章非参数检验(课堂)

生物统计学第11讲2 二项分布的检验+非参数检验

非参数检验——【北大医学统计学】