Rank Sum Test )
- 格式:pps
- 大小:353.50 KB
- 文档页数:32
问题5: ranksum和ttest的区别
《中国工业经济》2018年4月的文章《高管股权激励合约业绩目标的强制设计对公司管理绩效的影响》提供的代码中,在应用psmatch2函数进行配对之后,用了ttest和ranksum做检验,请问ttest和ranksum除了一个是t检验,一个是Z检验,分别适用于小样本和大样本之外,还有别的区别吗?
回答5
pstest, both做匹配后均衡性检验,理论上说此处只能对连续变量做均衡性检验,对分类变量的均衡性检验应该重新整理数据后运用χ2检验或者秩和检验。
但此处对于分类变量也有一定的参考价值。
两者之间最主要的区别是ttest是参数检验,ranksum是非参数检验,非参数检验不需要满足参数检验所需的数量条件。
在具体使用上,两组之间连续性变量的比较,如果为正态分布,可采用独立样本t检验,偏态分布可采用Wilcoxon秩和检验(即ranksum 检验);两组之间分类变量之间的比较,可采用卡方检验,如果是等级变量,则采用秩和检验。
秩和检验英语"秩和检验"的英文表述有"Rank sum test"或"Wilcoxon rank-sum test"。
"Rank sum test"直接翻译为"秩和检验",是一种非参数统计方法,用于比较两个或多个独立样本的差异。
它不依赖于样本的正态分布假设,适用于各种数据类型。
"Wilcoxon rank-sum test"则是一种具体的秩和检验方法,也被称为"Wilcoxon 两样本秩和检验"。
它用于比较两个独立样本的中位数是否有显著差异。
例如,在医学研究中,可以使用秩和检验来比较两种治疗方法对患者症状改善的效果,或者比较不同群体在某个指标上的差异。
在统计学中,秩和检验常用于当数据不满足参数检验的前提条件(如正态分布)时。
除了"Rank sum test"和"Wilcoxon rank-sum test",还有其他一些与秩和检验相关的英文术语,如"Kruskal-Wallis test"(克鲁斯卡尔-沃利斯检验),用于比较多个独立样本的差异,"Mann-Whitney U test"(曼-惠特尼 U 检验),是一种特殊情况下的秩和检验。
总的来说,"秩和检验"在统计学中是一个常用的方法,用于评估样本之间的差异,而具体的英文表述可能会根据不同的统计软件或文献有所差异。
如果你需要在英语语境中使用"秩和检验"这个概念,可以根据具体情况选择合适的表述方式。
如果你对秩和检验还有其他疑问,或者需要更深入的解释,我将尽力为你提供帮助。
秩和检验数据要求
秩和检验(Rank Sum Test),也称为Mann-Whitney U检验,是一种非参数统计检验方法,用于比较两个独立样本的中位数是否相同。
这种检验不依赖于数据的分布,特别适用于分布未知或非正态分布的数据。
进行秩和检验时,对数据的要求通常包括:
1. 独立性:两个比较的样本应该是独立的,即一个样本的数据不应该受到另一个样本数据的影响。
2. 可比性:虽然秩和检验不要求数据必须来自正态分布,但是数据应该是有可比性的,意味着每个样本应该是一个总体的一部分。
3. 同质性:通常,秩和检验要求两个样本的总体分布应该是同质的,这意味着两个总体的分布不应该有显著的差异。
4. 样本大小:虽然秩和检验可以用于小样本数据,但是当样本大小非常小(例如,每个样本小于10)时,检验的准确性可能会受到影响。
5. 数据的数值性质:秩和检验适用于定量数据,可以是连续的或离散的。
对于分类数据,需要先转换为定量数据,例如,通过计算每个类别的频数或频率。
6. 无异常值:虽然秩和检验在一定程度上可以处理异常值,但是过多的异常值可能会影响检验的准确性。
在进行秩和检验之前,通常需要对数据进行适当的预处理,例如,将分类数据转换为数值,处理缺失值,以及将异常值纳入考虑。
此外,
还需要检查数据的分布特性,以确定秩和检验是否适合。
在某些情况下,可能需要使用秩和检验的改进版本,如Wilcoxon符号秩检验或Wilcoxon秩和检验,来处理特定类型的问题。
秩和检验前面介绍的均数的区间估计及假设检验,都是要求个体变量值服从正态分布,或根据中心极限定理,当样本较大时,样本均数服从正态分布。
这种要求样本来自总体分布型是已知的,在此基础上对总体参数进行估计或检验,称为参数统计(parametric statistics)。
但在医学研究中,许多数据不符合参数统计的要求,这时有两种处理的方法。
一是,进行数据转换,使其符合参数统计方法的要求。
二是,选择非参数检验方法,非参数检验(non-parametric test)方法是对样本来自的总体分布不作要求(如不要求样本来自正态分布)的一类假设检验方法。
非参数检验的主要优点是对样本的总体分布不作要求,适用的范围广,尤其是当变量中有不确定数值时,如<0.5mg,可用非参数检验。
同时,非参数检验方法存在其致命的缺点,其检验功效低于相应的参数统计方法。
因此,如果数据符合参数统计的要求首选参数统计方法;如果数据不符合参数统计的要求有两个选择,一是选择非参数检验方法。
下面介绍了属于非参检验的两种秩和检验(rank sum test)方法。
二是,将数据经过变换使其符合参数统计方法,再选择参数统计方法,本节介绍了几种数据变换方法。
应用条件①总体分布形式未知或分布类型不明;②偏态分布的资料:③等级资料:不能精确测定,只能以严重程度、优劣等级、次序先后等表示;④不满足参数检验条件的资料:各组方差明显不齐。
⑤数据的一端或两端是不确定数值,如“>50mg”等。
一、配对资料的Wilcoxon符号秩和检验(Wilcoxon signed-rank test)例1对10名健康人分别用离子交换法与蒸馏法,测得尿汞值,如表9.1的第(2)、(3)栏,问两种方法的结果有无差别?表1 10名健康人用离子交换法与蒸馏法测定尿汞值(μg/l)样品号(1)离子交换法(2)蒸馏法(3)差值(4)=(2) (3)秩次(5)1 0.5 0.0 0.5 22 2.2 1.1 1.1 73 0.0 0.0 0.0 —4 2.3 1.3 1.0 65 6.2 3.4 2.8 86 1.0 4.6 -3.6 -97 1.8 1.1 0.7 3.58 4.4 4.6 -0.2 -19 2.7 3.4 -0.7 -3.510 1.3 2.1 -0.8 -5T+=+26.5T-=-18.5差值先进行正态性及方差齐性检验,看是否可以做参数检验,其检验效能高于非参数检验。