非参数统计分析方法总结

  • 格式:doc
  • 大小:36.50 KB
  • 文档页数:7

下载文档原格式

  / 9
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

非参数统计分析方法

一单样本问题

1,二项式检验:检验样本参数是否与整体参数有什么关系。

样本量为n,给定一个实数M0(代表题目给出的分位点数),和分位点∏(0.25,0.5,0.75)。用S-记做样本中比M0小的数的个数,S+记做样本中比M0大的数的个数。如果原假设H0成立那么S-与n的比之应为∏。

H0:M=M0

H1:M≠MO或者M>M0或者M

Spss步骤:分析—非参数检验—二项式检验。

可以得出统计量为K=min(S-,S+)和统计量Z和p值

当p值小于0.05时拒绝原假设,没有充足理由证明M=M0.,

2,Wilcoxon符号秩序检验

Wilcoxon检验的目的和二项式检验是一样的,

Spss步骤:分析—非参数检验—两个相关样本

得出统计量Z和p值

当p值小于0.05时拒绝原假设,没有充足理由证明M=M0

3,随机性游程检验

给出一组数据看次数据出现的情况是不是随机的。

列如:00011011110001110100001110

H0:是随机的

H1:不是随机的(混合倾向,游程多,长度短)(成群倾向,游程少,

长度长)

Spss步骤:分析—非参数检验—游程

得出统计量R和p值

当p值小于0.05时拒绝原假设,没有充足理由证明该数据出现是随机的

二,两个样本位置问题

1,Brown—Mood中位数检验

给出两个样本比较两个样本的中位数或者四分位数等是否相等或者有一定关系,设一个中值为M1,一个为M2

H0:M1=M2.

H1:M1≠M2或者M1>M2或者M1

Spss步骤:分析—非参数检验—k个独立样本

得出统计量Z和p值

当p值小于0.05时拒绝原假设,没有充足理由证明M1=M2.

2,Wilcoxon(Mann—Whitniey)秩和检验

该检验和Brown—Mood检验的原理是一样的,但是该检验利用了更多的样本信息,从而比Brown—Mood检验更有说服力。

Spss步骤:分析—非参数检验—2个独立样本

得到Z统计量和p值,

当p值小于0.05时拒绝原假设,没有充足理由证明M1=M2.

3,成对样本Wilcoxon秩和检验

用M1代表开始时的数据某一特征值,用M2代表结束后的数据某一特

征值,比较前后关系。

H0:M1=M2

H1:M1≠M2或者M1>M2或者M1

Spss步骤:分析—非参数检验—2个相关样本。

得到统计量Z和p值

当p值小于0.05时拒绝原假设,没有充足理由证明M1=M2

三,多样本数据问题

1,Kruskal—Wallis秩和检验

多样本的分布是否相等问题,每个样本的特征值用U1,U2,U3,U4 ...来表示。

H0:U1=U2=U3=U4...(每个样本的分布是相等的)

H1:U1≠U2≠U3≠U4...(样本的分布至少有一个不相等)

Spss步骤:分析—非参数检验—k个独立样本

得到统计量F和p值

当p值小于0.05时就拒绝原假设,说明样本的分布至少有一个是不相等的

2,完全区组设计:Friedman秩和检验(该检验即可用于k个独立样本也可用于k个相关样本)

此检验和Kruskal—Wallis秩和检验原理是一样的

Spss步骤:分析—非参数检验—k个相关样本

得出统计量F和p值,当p值小于0.05时拒绝原假设,说明样本的分布至少有一个是不相等的

3,Kendall协同系数检验

在实践中,经常需要按照某特别的性质来多次(m次)对n个个体进行评估或者排序。比如m个裁判对n种酒类的排队,m个选民对n个候选人的评价。(也可用Fridman秩和检验)

H0:这些评价对于不同的个体是不相关的或者是随机的

H1:它们对于各个个体的评价是正相关的或者多少是一致的。

Spss步骤:分析—非参数检验—k个相关样本

得到统计量W和p值,当W值越大说明个个体在评价中有着明显的不同,可以认为这样得到的评估结果是有道理的。如果W不显著意味着评估者对于诸位个体的意见很不一致,则没有理由认为能够产生一个共同的评估结果。当p值小于0.05时就拒绝原假设。没有充足的理由证明评估者对于个个体的评价是随机的。

4,二元响应的Cochran检验

有时观测值以“是”和“否”,“同意”和“不同意”,“+”和“-”等二元响应(两种取值)的数据形式出现,我们关心的是这些数据在评估者的眼里是否有区别。

列如:人们对A,B,C,D四种产品的好坏评价

A:11100010101100011

B:11001100011010001

C:01010010100011110

D:01010111100011011

H0:U1=U2=U3=U4

H1:不是所有位置参数都相等

Spss步骤:分析—非参数—k个相关样本

得到统计量Q和p值

当p值小于0.05时,拒绝原假设。说明个个体在评估者的眼里是不想的的。

四,相关和回归

我们通常关心两个变量之间的关系,如吸烟与某种疾病的关系,寿命于海拔的关系

1,Spearman秩相关检验

给出一列数对(X1,Y1)(X2,Y2)(X3,Y3)(X4,Y4)(X5,Y5)

H0:X与Y是不相关的

H1:X与Y是相关的,或者X与Y是正相关,或者X与Y是负相关的Spss步骤:分析—相关—双变量

得到Rs(秩相关系数越大越相关,一般大于0.8为非常相关,大于0.5为相关)和p值,先看p值(即显著性)再看相关性。当p值小于0.05时说明显著性。

2,Kendall(T)相关检验

该检验和Spearman秩相关检验原理是一样的,不过其得到的是T系数

Spss步骤:分析—相关—双变量

3,Pearson相关检验

该检验和Spearman秩相关检验原理是一样的,不过其得到的是r相