秩和检验
- 格式:ppt
- 大小:1.60 MB
- 文档页数:40
秩和检验数据要求
秩和检验(Rank Sum Test),也称为Mann-Whitney U检验,是一种非参数统计检验方法,用于比较两个独立样本的中位数是否相同。
这种检验不依赖于数据的分布,特别适用于分布未知或非正态分布的数据。
进行秩和检验时,对数据的要求通常包括:
1. 独立性:两个比较的样本应该是独立的,即一个样本的数据不应该受到另一个样本数据的影响。
2. 可比性:虽然秩和检验不要求数据必须来自正态分布,但是数据应该是有可比性的,意味着每个样本应该是一个总体的一部分。
3. 同质性:通常,秩和检验要求两个样本的总体分布应该是同质的,这意味着两个总体的分布不应该有显著的差异。
4. 样本大小:虽然秩和检验可以用于小样本数据,但是当样本大小非常小(例如,每个样本小于10)时,检验的准确性可能会受到影响。
5. 数据的数值性质:秩和检验适用于定量数据,可以是连续的或离散的。
对于分类数据,需要先转换为定量数据,例如,通过计算每个类别的频数或频率。
6. 无异常值:虽然秩和检验在一定程度上可以处理异常值,但是过多的异常值可能会影响检验的准确性。
在进行秩和检验之前,通常需要对数据进行适当的预处理,例如,将分类数据转换为数值,处理缺失值,以及将异常值纳入考虑。
此外,
还需要检查数据的分布特性,以确定秩和检验是否适合。
在某些情况下,可能需要使用秩和检验的改进版本,如Wilcoxon符号秩检验或Wilcoxon秩和检验,来处理特定类型的问题。
秩和检验方差公式推导一、秩和检验简介。
秩和检验(rank sum test)是一种非参数检验方法,用于比较两个独立样本或配对样本的分布情况,它不依赖于总体分布的具体形式,对总体分布的形状不做严格假设。
二、秩和检验方差公式的推导。
(一)两独立样本秩和检验(Mann - Whitney U检验)中方差的推导。
设两组样本量分别为n_1和n_2,且n = n_1 + n_2。
1. 定义秩次。
- 将两组数据混合后从小到大排序,每个数据对应的序号就是秩次。
设第一组样本的秩和为T_1。
2. 计算期望。
- 根据概率原理,在所有可能的排列下,第一组样本的每个数据取到每个秩次的概率是相等的。
- 混合后所有数据秩次之和为∑_i = 1^ni=(n(n + 1))/(2)。
- 第一组样本秩和T_1的期望E(T_1)=(n_1(n+1))/(2)。
3. 推导方差。
- 设R_ij表示第i组(i = 1,2)中第j个数据的秩次。
- 对于第一组样本,T_1=∑_j = 1^n_1R_1j。
- 根据方差的性质D(T_1)=∑_j = 1^n_1D(R_1j)+2∑_1≤slan t j。
- 计算D(R_ij):- 对于单个秩次R_ij,它在1,2,·s,n中取值是等可能的。
- E(R_ij)=(n + 1)/(2)。
- D(R_ij)=(n(n + 1))/(12)。
- 计算Cov(R_1j,R_1k)(j≠ k):- 由于Cov(R_1j,R_1k)=(-n(n + 1))/(12(n-1))。
- 代入上述方差公式可得:- D(T_1)=(n_1n_2(n + 1))/(12)(二)配对样本秩和检验(Wilcoxon符号秩和检验)中方差的推导。
设配对样本的对子数为n。
1. 计算差值并编秩。
- 先计算每对数据的差值d_i,然后对| d_i|从小到大编秩,若d_i = 0,则舍去该对数据,对子数n相应减少。
设正差值的秩和为T^+。