当前位置:文档之家› 第十三章 非参数检验

第十三章 非参数检验

第十三章 非参数检验
第十三章 非参数检验

第十三章非参数检验

第一节 Chi-Square过程

13.1.1 主要功能

13.1.2 实例操作

第二节 Binomial过程

13.2.1 主要功能

13.2.2 实例操作

第三节 Runs过程

13.3.1 主要功能

13.3.2 实例操作

第四节 1-Sample K-S过程

13.4.1 主要功能

13.4.2 实例操作

第五节 2 Independent Samples过程

13.5.1 主要功能

13.5.2 实例操作

第六节 k Independent Samples过程

13.6.1 主要功能

13.6.2 实例操作

第七节 2 Related Samples过程

13.7.1 主要功能

13.7.2 实例操作

第八节 K Related Samples过程

13.8.1 主要功能

13.8.2 实例操作

许多统计分析方法的应用对总体有特殊的要求,如t检验要求总体符合正态分布,F检验要求误差呈正态分布且各组方差整齐,等等。这些方法常用来估计或检验总体参数,统称为参数统计。

但许多调查或实验所得的科研数据,其总体分布未知或无法确定,这时做统计分析常常不是针对总体参数,而是针对总体的某些一般性假设(如总体分布),这类方法称非参数统计(Nonparametric tests)。

非参数统计方法简便,适用性强,但检验效率较低,应用时应加以考虑。第一节 Chi-Square过程

13.1.1 主要功能

调用此过程可对样本数据的分布进行卡方检验。卡方检验适用于配合度检验,主要用于分析实际频数与某理论频数是否相符。

返回目录返回全书目录

13.1.2 实例操作

[例13-1]某地一周内各日死亡数的分布如下表,请检验一周内各日的死亡危险性是否相同?

周日死亡数

一二三四五六日11 19 17 15

15

16 19

13.1.2.1 数据准备

激活数据管理窗口,定义变量名:各周日为day,死亡数为death。按顺序输入数据,结果见图13.1。激活Data菜单选Weight Cases...命令项,弹出Weight Cases对话框(如图13.2),选death点击钮使之进入Frequency Variable 框,定义死亡数为权数,再点击OK钮即可。

图13.1 数据录入窗口

图13.2 数据加权对话框

13.1.2.2 统计分析

激活Statistics菜单选Nonparametric Tests中的Chi-Square...命令项,弹出Chi-Square Test对话框(图13.3)。现欲对一周内各日的死亡数进行分布分析,故在对话框左侧的变量列表中选day,点击钮使之进入Test Variable List 框,点击OK钮即可。

图13.3 卡方检验对话框

13.1.2.3 结果解释

在结果输出窗口中将看到如下统计数据:

运算结果显示一周内各日死亡的理论数(Expected)为15.71,即一周内各日死亡均数;还算出实际死亡数与理论死亡数的差值(Residual);卡方值χ2= 3.4000,自由度数(D.F.)= 6 ,P = 0.7572 ,可认为一周内各日的死亡危险性是相同的。

DAY

Cases

Category Observed Expected Residual

1.00 11 15.71 -4.71

2.00 19 15.71

3.29

3.00 17 15.71 1.29

4.00 15 1

5.71 -.71

5.00 13 15.71 -2.71

6.00 16 15.71 .29

7.00 19 15.71 3.29

---

Total 110

Chi-Square D.F.

Significance

3.4000

6 .7572

返回目录返回全书目录第二节 Binomial过程

13.2.1 主要功能

有些总体只能划分为两类,如医学中的生与死、患病的有与无。从这种二分类总体中抽取的所有可能结果,要么是对立分类中的这一类,要么是另一类,其频数分布称为二项分布。调用Binomial过程可对样本资料进行二项分布分析。

返回目录返回全书目录

13.2.2 实例操作

[例13-2]某地某一时期内出生40名婴儿,其中女性12名(定Sex=0),男性28名(定Sex=1)。问这个地方出生婴儿的性比例与通常的男女性比例(总体概率约为0.5)是否不同?

13.2.2.1 数据准备

激活数据管理窗口,定义性别变量为sex。按出生顺序输入数据,男性为1 ,女性为0。

13.2.2.2 统计分析

激活Statistics菜单选Nonparametric Tests中的Binomial Test...命令项,弹出 Binomial Test对话框(图13.4)。在对话框左侧的变量列表中选sex,点击钮使之进入Test Variable List框,在Test Proportion框中键入0.50,再点击OK钮即可。

图13.4 二项分布检验对话框

13.2.2.3 结果解释

在结果输出窗口中将看到如下统计数据:

二项分布检验表明,女婴12名,男婴28名,观察概率为0.7000(即男婴占70%),检验概率为0.5000,二项分布检验的结果是双侧概率为0.0177,可认为男女比例的差异有高度显著性,即与通常0.5的性比例相比,该地男婴比女婴明显为多。

SEX

Cases

Test Prop.

= .5000

28 = 1.00 Obs. Prop.

= .7000

12 = .00

-- Z Approximation

40 Total 2-Tailed P

= .0177

返回目录返回全书目录第三节 Runs过程

13.3.1 主要功能

依时间或其他顺序排列的有序数列中,具有相同的事件或符号的连续部分称为一个游程。调用Runs过程可进行游程检验,即用于检验序列中事件发生过程的随机性分析。

返回目录返回全书目录

13.3.2 实例操作

[例13-3]某村发生一种地方病,其住户沿一条河排列,调查时对发病的住户标记为“1”,对非发病的住户标记为“0”,共17户:

0 1 1 0 0 0 1 0 0 1 0 0 0 0 1 1 0 0 1 0 0 0 0

1 0 1

问病户的分布排列是呈聚集趋势,还是随机分布?

13.3.2.1 数据准备

激活数据管理窗口,定义住户变量为epi。按住户顺序输入数据,发病的住户为1 ,非发病的住户为0。

13.3.2.2 统计分析

激活Statistics菜单选Nonparametric Tests中的Runs Test...项,弹出Runs Test对话框(图13.5)。在对话框左侧的变量列表中选epi,点击钮使之进入Test Variable List框。在临界割点Cut Point框中有四个选项:

图13.5 游程检验对话框

1、Median:中位数作临界割点,其值在临界割点之下的为一类,大于或等于临界割点的为另一类;

2、Mode:众数作临界割点,其值在临界割点之下的为一类,大于或等于临界割点的为另一类;

3、Mean:均数作临界割点,其值在临界割点之下的为一类,大于或等于临界割点的为另一类;

4、Custom:用户指定临界割点,其值在临界割点之下的为一类,大于或等于临界割点的为另一类;

本例选Custom项,在其方框中键入1(根据需要选项,本例是0、1二分变量,故临界割点值用1),再点击OK钮即可。

13.3.2.3 结果解释

在结果输出窗口中将看到如下统计数据:

检验结果可见本例游程个数为14,检验临界割点值(Test value) = 1.00,小于1.00者有17个案例,而大于或等于1.00者有9个案例。Z = 0.3246,双侧 P = 0.7455。所以认为此地方病的病户沿河分布的情况无聚集性,而是呈随机分布。

EPI

Runs: 14 Test value =

1.00

Cases: 17 LT 1.00

9 GE 1.00 Z

= .3246

--

26 Total 2-Tailed P

= .7455

返回目录返回全书目录

第四节 1-Sample K-S过程

13.4.1 主要功能

调用此过程可对单样本进行Kolmogorov-Smirnov Z检验,它将一个变量的实际频数分布与正态分布(Normal)、均匀分布(Uniform)、泊松分布(Poisson)进行比较。

返回目录返回全书目录13.4.2 实例操作

[例13-4]某地正常成年男子144人红细胞计数(万/立方毫米)的频数资料如下,问该资料的频数是否呈正态分布?

红细胞计

人数红细胞计数人数

420- 440- 460- 480- 500- 520-

2

4

7

16

20

25

540-

560-

580-

600-

620-

640-

24

22

16

2

6

1

13.4.2.1 数据准备

激活数据管理窗口,定义频数变量名为f,依次输入人数资料。

13.4.2.2 统计分析

激活Statistics菜单选Nonparametric Tests中的1-Sample K-S ...命令项,弹出One-Sample Kolmogorov-Smirnov Test 对话框(图13.6)。在对话框左侧的变量列表中选f,点击钮使之进入Test Variable List框,在Test Distribution框中选Normal项,表明与正态分布形式相比较,再点击OK钮即可。

图13.6 单样本Kolmogorov-Smirnov Z检验对话框

13.4.2.3 结果解释

在结果输出窗口中将看到如下统计数据:

K-S正态性检验的结果显示,Z值=0.7032,双侧P值=0.7060,可认为该地正常成年男子的红细胞计数符合正态分布。

F

Test distribution - Normal Mean: 12.0000

Standard Deviation: 9.3808

Cases: 12

Most extreme differences

Absolute Positive Negative K-S Z 2-Tailed P

.20298 .20298 -.16509 .7032 .7060

返回目录返回全书目录

第五节 2 Independent Samples过程

13.5.1 主要功能

调用此过程可对两个独立样本的均数、中位数、离散趋势、偏度等进行差异

比较检验。

返回目录返回全书目录

13.5.2 实例操作

[例13-5]调查某厂的铅作业工人7人和非铅作业工人10人的血铅值(μg / 100g)如下,问两组工人的血铅值有无差别?

非铅作业组铅作业组

5 5

6

7 9 12 13 15 1

8 21 17 18 20 25 34 43 44

13.5.2.1 数据准备

激活数据管理窗口,定义分组变量为group(非铅作业组为1,铅作业组为2),血铅值为Pb。按顺序输入数据。

13.5.2.2 统计分析

激活Statistics菜单选Nonparametric Tests中的 2 Independent Samples...命令项,弹出Two-Independent-Samples-Test对话框(图13.7)。在对话框左侧的变量列表中选Pb,点击钮使之进入Test Variable List框;选group,点击钮使之进入Grouping Variable框,点击Define Groups...钮,在弹出的Two Independent Samples:Define Groups对话框内定义Group 1为1,Group 2为2,之后点击Continue钮返回Two-Independent-Samples-Test对话框;在Test Type框中有四种检验方法:

图13.7 两独立样本检验对话框

Mann-Whitney U:主要用于判别两个独立样本所属的总体是否有相同的分布;

Kolmogorov-Smirnov Z:推测两个样本是否来自具有相同分布的总体;

Moses extreme reactions:检验两个独立样本之观察值的散布范围是否有差异存在,以检验两个样本是否来自具有同一分布的总体;

Wald-Wolfowitz runs:考察两个独立样本是否来自具有相同分布的总体。

本例选Mann-Whitney U检验方法,之后点击OK钮即可。

13.5.2.3 结果解释

在结果输出窗口中将看到如下统计数据:

结果表明,第1组的平均秩次(Mean Rank)为5.95,第2组的平均秩次为13.36,U = 4.5,W = 93.5,精确双侧概率P = 0.0012,可认为铅作业组工人的血铅值高于非铅作业组。

PB by GROUP

Mean Rank Cases

5.95 10 GROUP = 1

13.36 7 GROUP = 2

--

17 Total

Exact Corrected for ties

U W 2-Tailed P Z 2-Tailed P

4.5 93.5 .0012

-2.9801 .0029

返回目录返回全书目录

第六节 k Independent Samples过程

13.6.1 主要功能

调用此过程可对多个独立样本进行中位数检验和Kruskal-Wallis H检验。

返回目录返回全书目录

13.6.2 实例操作

[例13-6]随机抽样得以下三组人的血桨总皮质醇测定值(μg / L),试比较有无差异?

正常人单纯性肥胖皮质醇增多

0.4

1.9

2.2 2.5

2.8

3.1 3.7

3.9

4.6 7.0

0.6

1.2

2.0

2.4

3.1

4.1

5.0

5.9

7.4

13.6

9.8

10.2

10.6

13.0

14.0

14.8

15.6

15.6

21.6

24.0

13.6.2.1 数据准备

激活数据管理窗口,定义分组变量为 group(正常人为1,单纯性肥胖为2,皮质醇增多症为3),总皮质醇测定值为pzc。按顺序输入数据。

13.6.2.2 统计分析

激活Statistics菜单选Nonparametric Tests中的k Independent Samples...项,弹出 Tests for Several Independent Samples对话框(图13.8)。在对话框左侧的变量列表中选pzc,点击钮使之进入Test Variable List框。选group,点击钮使之进入Grouping Variable框,点击Define Range...钮,在弹出的K Independent Samples:Define Range对话框内定义Mininum为1,Maxinum为2,之后点击Continue钮返回Two-Independent-Samples-Test对话框。在Test Type框中有两个检验方法的选项:Kruskal-Wallis H为单向方差分析,检验多个样本在中位数上是否有差异,Median为中位数检验,检验多个

样本是否来自具有相同中位数的总体;本例选Kruskal-Wallis H项。之后点击OK钮即可。

图13.8 多样本资料的秩和检验对话框

13.6.2.3 结果解释

在结果输出窗口中将看到如下统计数据:

结果表明,1至3组的平均秩次(Mean Rank)分别为9.65、11.75、25.10,χ2值(即H值)为 18.1219,P = 0.0001;可认为三组人的血桨总皮质醇测定值有

差异,根据本例情况可看出皮质醇增多症组高于其他两组人。

PZC by GROUP

Mean Rank Cases

9.65 10 GROUP = 1

11.75 10 GROUP = 2

25.10 10 GROUP = 3

--

30 Total Corrected for ties Chi-Square D.F. Significance Chi-Square D.F. Significance

18.1219 2 .0001 18.1300 2 .0001

返回目录返回全书目录

第七节 2 Related Samples过程

13.7.1 主要功能

调用此过程可对两个相关样本资料(如配对、配伍资料)进行秩和检验。

返回目录返回全书目录

13.7.2 实例操作

[例13-7]研究饲料中缺乏Vit E对大鼠肝中Vit A含量的关系,将大鼠按性别相同、体重相近的原则配成8对,并将每对大鼠随机分为2组(正常饲料组、Vit E缺乏饲料组),一定时间后杀死大鼠,测定肝中Vit A含量,结果如下表,问:饲料中缺乏Vit E对大鼠肝中Vit A含量有无影响?

大鼠对别正常饲料组Vit E 缺乏饲料

1 2 3 4 5 6 7 8 37.2

20.9

31.4

41.4

39.8

39.3

36.1

31.9

25.7

25.1

18.8

33.5

34.0

28.3

26.2

18.3

13.7.2.1 数据准备

激活数据管理窗口,定义正常饲料组变量名为va1, Vit E 缺乏饲料组变量名为va2, 按顺序输入数据。

13.7.2.2 统计分析

激活Statistics菜单选Nonparametric Tests中 2 Related Samples...项,弹出Two-Related-Samples Tests对话框(图13.9)。在对话框左侧的变量列表中选va1,在Current Selections栏的Variable 1处出现va1,选va2,在Current Selections栏的Variable 2处出现va2,然后点击钮使va1 -va2(表明是配对变量)进入Test Pair(s) List框。在Test Type框中有三种检验方法:

图13.9 两相关样本的秩和检验对话框

1、Wilcoxon:配对符号等级秩次检验,

2、Sign:符号检验;

3、McNemar:以研究对象作自身对照,检验其“前后”的变化是否显著,该法适用于相关的二分变量数据。

本例选Wilcoxon和Sign两项。点击Options...钮,弹出Two-Related-Samples:Options

对话框,在Statistics栏中选Decriptive项,要求计算均数、标准差等指标,点击Continue钮返回Two-Related-Samples Tests对话框,之后点击OK钮即可。

13.7.2.3 结果解释

在结果输出窗口中将看到如下统计数据:

首先显示两变量va1和va2的例数、均数、标准差、最大值和最小值;配对符号秩和检验(Wilcoxon Matched-Pairs Signed-Ranks Test)结果,其平均秩分别为5.00 和1.00 ,Z = -2.3805,双侧P = 0.0173,可认为两组大鼠肝中Vit A含量有差别,饲料中缺乏Vit E会使大鼠肝中Vit A含量降低;但符号检验(Sign Test)的结果,双侧P = 0.0703,则认为两组大鼠肝中Vit A含量无差别。在这种情况下,应取配对符号秩和检验(Wilcoxon)结果,因两法比较之下,配对符号秩和检验较为敏感,效率较高。

N Mean Std Dev Minimum Maximum

VA1 8 34.75000 6.64852 20.90 41.40

VA2 8 26.23750 5.82064 18.30 34.00

- - - - - Wilcoxon Matched-Pairs Signed-Ranks Test

VA1

with VA2

Mean Rank Cases

5.00 7 - Ranks (VA2 LT VA1)

1.00 1 + Ranks (VA2 GT VA1)

0 Ties (VA2 EQ VA1)

--

8 Total

Z = -2.3805 2-Tailed P = .0173

- - - - - Sign Test

VA1

with VA2

Cases

7 - Diffs (VA2 LT VA1)

1 + Diffs (VA

2 GT VA1) (Binomial)

0 Ties 2-Tailed P

= .0703

--

8 Total

返回目录返回全书目录

第八节 K Related Samples过程

13.8.1 主要功能

调用此过程可对多个相关样本资料(如配伍资料)进行秩和检验。

返回目录返回全书目录

13.8.2 实例操作

[例13-8]用某药治疗血吸虫病患者,在治疗前和治疗后一周、二周和四周各测定7名患者血清SGPT值的变化,以观察该药对肝功能的影响,结果如下表,问:患者四个阶段的血清SGPT值有无不同?

患者编号治疗前治疗后

一周二周四周

1 2 3 4 5 6 7 63

90

54

45

54

72

64

188

238

300

140

175

300

207

138

220

83

213

150

163

185

54

144

92

100

36

90

87

13.8.2.1 数据准备

激活数据管理窗口,定义变量名:治疗前为before、治疗后一周为w1、二周为w2、四周为w4,按顺序输入各组SGPT数据。

13.8.2.2 统计分析

激活Statistics菜单选Nonparametric Tests中的k Related Samples...命令项,弹出 Tests for Serveral Related Samples对话框(图13.10)。在对话框左侧的变量列表中选before、w1、w2和w4, 点击钮使before、w1、w2和w4均进入Test Variables框。在Test Type框中有三种选项:

1、Friedman:双向方差分析,考察多个相关样本是否来自同一总体;

2、Cochran's Q:作为两相关样本McNemar检验的多样本推广,特别适用于定性变量和二分字符变量;

3、Kendall's W:Kendall和谐系数检验,通过计算Kendall和谐系数W,以检验多个相关样本是否来自同一分布的总体。

本例选Friedman和Kendall’s W两种检验方法,再点击Statistics...钮,弹出K Related-Samples:Statistics对话框,在Statistics栏中选Decriptive 项,要求计算均数、标准差等指标,点击Continue钮返回K Related-Samples Tests对话框;最后点击OK钮即可。

图13.9 多个相关样本的秩和检验对话框

13.8.2.3 结果解释

在结果输出窗口中将看到如下统计数据:

首先显示的是四个变量before、w1、w2、w4的例数、均数、标准差、最大值和最小值。

接着显示检验结果:

Friedman双向方差分析,平均秩次分别1.29、3.86、3.00和1.86 ,χ2= 16.7143,P = 0.0008,可认为患者四个阶段的血清SGPT值有差别。

Kendall和谐系数检验,平均秩次分别1.29、3.86、3.00和1.86 ,和谐系数W = 0.7959,χ2= 16.7143,P = 0.0008,结论同前。

N Mean Std Dev Minimum Maximum BEFORE 7 63.14286 14.70180 45.00 90.00

W1 7 221.14285 61.55331 140.00 300.00

W2 7 164.57143 47.27528 83.00 220.00

W4 7 86.14286 34.48878 36.00 144.00

- - - - - Friedman Two-Way Anova

Mean Rank Variable

1.29 BEFORE

3.86 W1

3.00 W2

1.86 W4

Cases Chi-Square D.F. Significance

7 16.7143 3 .0008

- - - - - Kendall Coefficient of Concordance

Mean Rank Variable

1.29 BEFORE

3.86 W1

3.00 W2

1.86 W4

Cases W Chi-Square D.F. Significance

7 .7959 16.7143 3 .0008

第十一章 非参数检验

第一节 非参数检验的基本概念及特点 一、非参数检验 (一)什么是“非参数” 非参数模型:缺乏总体分布模式的信息。 (二)非参数检验的定义 非参数检验:不需要假设总体是否为正态分布或方差是否为齐性的假设检验称非参数检验。 (三)非参数检验的优点和缺点: 1、优点: 一般不涉及总体参数,其假设前提也比参数假设检验少得多,适用面较广。 计算简便。 2、缺点: 统计效能远不如参数检验方法。由于当数据满足假设条件时,参数统计检验方法能够从其中广泛地充分地提取有关信息。非参数统计检验方法对数据的限制较为宽松,只能从中提取一般的信息,相对参数统计检验方法会浪费一些信息。 (四)非参数检验的特点: 1、它不需要严格的前提假设; 2、特别适用于顺序数据; 3、适用于小样本,且方法简单; 4、最大的不足是不能充分利用资料的全部信息; 5、不能处理“交互作用”,即多因素情况。 第二节 两个独立样本的非参数检验方法 一、秩和检验法 秩和即秩次的和或等级之和。秩和检验法也叫Mann-Whitney-Wilcoxon 检验,它常被译为曼-惠特尼-维尔克松检验,简称M-W-W 检验,也称Mann-Whitney U 检验。秩和检验法与参数检验法中独立样本的t 检验法相对应。当“总体正态”这一前提不成立时,不能用t 检验,可以用秩和检验法。 (一)秩统计量 秩统计量指样本数据的排序等级。假设从总体中反复抽取样本,就能得到一个对应于样本容量1n 和2n 的秩和U 的分布。这是一个间断而对称的分布,当1n 和2n 都大于10时,秩和T 的分布近期近似正态分布,其平均数和标准差分别为 () 21211++= n n n T μ ()12121 21++=n n n n T σ 其检验值为

第五章+统计学教案(假设检验)

第五章+统计学教案(假设检验)参数估计和假设检验是统计推断的两个组成部分,它们分别从不同的角度利用样本信息对总体参数 进行推断。前者讨论的是在一定的总体分布形式下,借助样本构造的统计量,对总体未知参数作出估计 的问题;后者讨论的是如何运用样本信息对总体未知参数的取值或总体行为所做的事先假定进行验证, 从而作出真假判断。通俗地、简单地说,前者是利用样本信息估计总体参数将落在什么范围里;而后者 则是利用样本信息回答总体参数是不是会落在事先假定的某一个范围里。 通过本章学习,要求学生在充分理解有关抽样分布理论的基础上,理解掌握假设检验的有关基本概 念;明确在假设检验中可能犯的两种错误,以及这两种错误之间的联系;熟练掌握总体均值和总体成数 的检验方法,主要是 Z 检验和 t 检验;对于非参数的检验,也应有所了解,包括符号检验、秩和检验与游程检验等。 2 一、假设检验概述与基本概念 1、假设检验概述 2、假设检验的有关基本概念 二、总体参数检验 1、总体平均数的检验 2、总体成数的检验

3、总体方差的检验 三、总体非参数检验 1、符号检验 2、秩和检验 3、游程检验 一、假设检验的有关基本概念; 二、总体平均数与总体成数的检验; 三、非参数检验; 一、假设检验的基本思路与有关概念; 二、两类错误的理解及其关系; 一、假设检验概述 假设检验:利用统计方法检验一个事先所作出的假设的真伪,这一假设称为统计假设,对这一假设 所作出的检验就是假设检验。 基本思路:首先,对总体参数作出某种假设,并假定它是成立的。然后,根据样本得到的信息(统 计量),考虑接受这个假设后是否会导致不合理的结果,如果合理就接受这个假设,不合理就拒绝这个 假设。 所谓合理性,就是看是否在一次的观察中出现了小概率事件。 小概率原理:就是指概率很小的事件,在一次试验中实际上是几乎不可能出现。这种事件可以称其 为“实际不可能事件”。 二、假设检验的基本概念

第二讲-非参数统计检验教学内容

第二讲 非参数检验 1. 实验目的 1.了解非参数假设检验基本思想; 2.会用SAS 软件中的proc npar1way 过程进行非参数假设检验和proc freq 过程进行列联表的独立性检验。 2. 实验要求 1.会用SAS 软件建立数据集,并进行统计分析; 2.掌握proc npar1way 过程进行非参数假设检验的基本步骤; 3.掌握proc freq 过程进行列联表的独立性检验的基本步骤。 3. 实验基本原理 3.1 符号检验 0:H 两种方法的处理效果无显著性差异 令10 i i I i ?=??第个个体中新方法优于对照方法第个个体中新方法劣于对照方法1,2,,i N =L 统计量1N N i i S I ==∑ N S 表示新方法的处理效果优于对照方法的配对组总数。若新方法的处理效果显著的优于对照方法,则N S 的值应明显偏大。因此,若对给定的置信水平α,有 {}N P S c α≥<, 则拒绝0H 。 0H 为真时,(1)N S 服从二项分布1(,)2 b N (),()24N N N N E S Var S ==。拒绝域为:{}N N S S c > (2)由中心极限定理可知,当2 ,1N N S N - →∞的零分布趋于标准正态分布。

拒绝域为 :N S u α??????>???????? 3.2 Wilcoxon 秩和检验 (1)单边假设检验 0:H 两种方法的处理效果无显著性差异 as 1:H :新方法优于对照方法。 用于检验0H 的统计量为:1n s i i W I ==∑ 若对给定的置信水平α,有 {}s P W c α≥<,则拒绝0H 。且s W 的分布列为: 0#{;,}{}H s w n m P W w N n ==?? ??? 根据观测结果计算s W 的观测值0s W ,计算检验的p 值: 00{}{}s H s s H s k w p P W w P W k ≥=≥= =∑ 然后将p 值与显著水平α作比较,若p α<,则拒绝0H ,否则接受0H 。 (2)双边假设检验 给定的显著水平21,c c 和α应该满足: ε=≥+≤}{}{2100c W P c W P A H A H 仅由上式还不能唯一确定21c c 和,当我们对两种方法谁优谁劣不得而知时,通常取 2}{}{2100α =≥=≤c W P c W P A H A H 若利用p 值进行检验,设A A W ω的观测值为,计算概率值 }{}{00A A H A A H W P W P ωω≤≥或 由对称性可知,检验的p 值为上述两概率中小于1/2的那一个的2倍。例如

统计学习题 第十一章 非参数检验

第十一章非参数检验 第一节符号检验 符号检验的方法·符号检验的特点和作用 第二节配对符号秩检验 配对符号秩检验的方法·配对符号秩检验的效力 第三节秩和检验 秩和检验的方法·秩和检验的近似 第四节游程检验 游程的概念·游程检验的方法·差符号游程检验 第五节累计频数检验 累计频数检验的方法·累计频数检验的应用 一、填空 1.非参数检验,泛指“对分布类型已知的总体进行参数检验”()的所有检验方法。 2.符号检验的零假设就是配对观察结果的差平均起来等于()。 3.理论研究表明,对于配对样本非正态分布的差值d,()是最佳检验。 4.秩和检验检验统计量U是U1和U2中较()的一个。 5.秩尺度之统计量的均值和标准差只取决于()。 6.()常被用作经验分布与理论分布的比较。 7.绝对值相等的值,应将它们的秩()。 8.符号检验,在分布自由检验中称为()。 9.符号检验和配对符号秩检验,都只适用于()样本。 10.数据序列ABBABAAABABBABBAAAAAB的总游程数是() 二、单项选择 1.下列检验中,不属于非参数统计的方法的是()。 A总体是否服从正态分布 B 总体的方差是否为某一个值 C 样本的取得是否具有随机性 D 两组随机变量之间是否相互独立 2.下列情况中,最适合非参数统计的方法是()。 A反映两个大学新生成绩的差别 B 反映两个大学新生家庭人均收入的差别 C 反映两个大学三年级学生对就业前景的看法差别 D反映两个大学在校生消费水平的差别 3.不属于非参数检验的是()。 A符号检验B游程检验C累计频数检验 D F检验 4.在累计频数检验中,卡方的自由度为()。 A n1 B 2 C n2 D n1+n2

第10章__非参数检验

第10章非参数检验 平时我们使用的统计推断方法大多为参数统计方法,它们都是在已知总体分布的条件下,对相应分布的总体参数进行估计和检验。比如单样本u检验就是假定该样本所在总体服从正态分布,然后推断总体的均数是否和已知的总体均数相同。本节要讨论的统计方法着眼点不是总体参数,而是总体分布情况,即研究目标总体的分布是否与已知理论分布相同,或者各样本所在的分布位置/形状是否相同。由于这一类方法不涉及总体参数,因而称为非参数统计方法。 SPSS的Nonparametric Tests菜单中一共提供了8种非参数分析方法,它们可以被分为两大类: 1、分布类型检验方法:亦称拟合优度检验方法。即检验样本所在总体是否服从已知的理论分布。具体包括: Chi-square test:用卡方检验来检验二项/多项分类变量的几个取值所占百分比是否和我们期望的比例有没有统计学差异。 Binomial Test:用于检测所给的变量是否符合二项分布,变量可以是两分类的,也可以使连续性变量,然后按你给出的分界点一分为二。 Runs Test:用于检验样本序列随机性。观察某变量的取值是否是围绕着某个数值随机地上下波动,该数值可以是均数、中位数、众数或人为制定。一般来说,如果该检验P值有统计学意义,则提示有其他变量对该变量的取值有影响,或该变量存在自相关。 One-Sample Kolmogorov-Smirnov Test:采用柯尔莫哥诺夫-斯米尔诺夫检验来分析变量是否符合某种分布,可以检验的分布有正态分布、均匀分布、Poission 分布和指数分布。 2、分布位置检验方法:用于检验样本所在总体的分布位置/形状是否相同。具体包括: Two-Independent-Samples Tests:即成组设计的两独立样本的秩和检验。 Tests for Several Independent Samples:成组设计的多个独立样本的秩和检验,此处不提供两两比较方法。 Two-Related-Samples Tests:配对设计的两样本秩和检验。 Tests for Several Related Samples:配伍设计的多样本秩和检验,此处同样不提供两两比较。 一、分布位置检验方法

STATA 多组计量 比较的非参数检验命令与输出结果说明

第五章多组计量资料比较的非参数检验命令与输出结果说明本节STATA? 命令摘要 秩和检验 ( Mann,Whitney and Wilcoxon 非参数检验) 对于计量资料不满足正态分布要求或方差不齐性,但样本资料之间是独立抽取的,则可以应用秩和检验方法进行比较两组资料的中位数是否有差异。STATA命令为:ranksum?? 观察变量, by( 分组变量) 例:研究不同饲料对雌鼠体重增加的关系。表中用x表示雌鼠体重增加(克),用group=1表示高蛋白饲料组以及用group=2 表示低蛋白饲料组。 无效假设 Ho:两组增加体重的中位数相同。 ranksum x,? by(group)

①为第二组(低饲料组)的秩的和;② 若效假设成立,则第二组的秩的和期望值为70; ③秩和统计检验量z;④对于无效假设Ho对应的p值。 在本例中,虽然第二组的秩和为49.5而期望值估计为70,但p值为0.0832,所以根据该资料和统计结果一般不能认为用高蛋白饲料喂养能明显增加雌鼠的体重。 多组资料中位数比较(完全随机化设计资料的检验) 对于完全随机化设计资料的比较,若各组资料不全服从正态分布(即:至少有一组的资料均不服从正态分布)或各组的资料方差不齐性,则可以用Kruskal and Wallis方法进行检验(Ho:各组的中位数相同)。STATA命令为: kwallis?观察变量,by(分组变量)

例:50只小鼠随机分配到5个不同饲料组,每组10只小鼠。在喂养一定时间后,测定鼠肝中的铁的含量(mg/g)如表所示:试比较各组鼠肝中铁的含量是否有显着性差别。用x?表示鼠肝中铁的含量以及用group=1,2,3,4,5分别表示对应的5个组。 kwallis? x, by(group)

非参数检验

非参数检验 SPSS(中文版)统计分析实用教程(第版)电子工业出版社*第五章非参数检验SPSS(中文版)统计分析实用教程(第版)电子工业出版社*主要内容参数检验与非参数检验的比较单样本的非参数检验独立样本非参数检验相关样本的非参数检验SPSS(中文版)统计分析实用教程(第版)电子工业出版社*参数检验与非参数检验的比较参数检验和非参数检验的区别参数检验和非参数检验最本质的区别:参数检验需要事先确定或假定总体的分布非参数检验则不需要假定总体的分布而是直接用样本来推断总体的分布。 可以通过是否假定总体的分布来区分参数检验和非参数检验除此之外二者之间还可以从很多方面来区分。 ()研究的对象和目标不同。 参数检验研究的是总体的参数不涉及总体的分布检验一旦总体的参数确定总体的分布也就确定了非参数检验的目标是直接从样本推导总体的分布或两个总体的分布是否相同。 ()研究的统计量有所不同。 参数检验中很少用到秩来构造统计量无论样本量大小都能对总体进行推断非参数检验中常用秩、秩和等来构造统计量且常要求样本量较大。 SPSS(中文版)统计分析实用教程(第版)电子工业出版社*参数检验与非参数检验的比较非参数检验的优点()它对总体分布一般不做过多的限制性假设任何分布都可以用非参数检验进行研究从应用范围

看其应用范围大于参数检验。 ()由于非参数检验不依赖于总体的分布形式因而它天然具有稳健性特征。 ()对资料的测量水平要求不高这给资料的搜集带来了很大的方便可以大大减轻统计资料的搜集工作量。 同时也为属性资料研究提供了广泛的基础。 ()非参数检验比较直观很容易理解不需要太多数学知识和统计理论。 多数非参数检验的运算比较简单可以较快地取得统计结果。 非参数检验的上述优点表明在实际问题的研究中它是一种比较有用的统计方法。 SPSS(中文版)统计分析实用教程(第版)电子工业出版社*参数检验与非参数检验的比较非参数检验的缺点有些人主张用非参数检验取代参数检验这种看法有点偏激因为非参数检验毕竟存在着一些自身难以克服的不足表现在:()两者的效率有差距。 非参数检验主要处理定序资料这类资料的测量尺度比较低如果把那些能够用参数检验处理的资料转化为定类和定序资料必然会丢失检验数据的一部分信息因此非参数检验的有效性或检验效率不如参数检验。 ()当样本容量比较大时非参数检验的计算也比较繁杂、困难。 ()参数检验与非参数检验各有各的特点并非所有的参数检验都能转用非参数检验。

非参数假设检验法及其运用

非参数假设检验法及其运用 摘要:在国际金融危机下,以中国股市数据为依据,运用S-plus 统计分析软件和Excel ,对中国股市正态分布假设进行了Kolmogorv拟合优度检验,运用方差平方秩检验方法,比较分析了上证指数和深证综指的波动性。 关键字:股市;Kolmogorov拟合优度检验;秩检验。 引言:对中国股市分布的研究,国内各学者对中国股市进行了非参数检验。王金玉、李霞、潘德惠(2005)通过引入一种新的估计方法“非参数假设检验方法”,以达到对证券投资咨询机构,对证券市场大盘走势预测准确度的估计。周明磊(2004)运用非参数非线性协整检验,对上证指数与深成指间协整关系进行了研究,结论是:上证指数与深圳成指之间确实存在非线性的协整关系。方国斌(2007)从分析中国股市收益率序列的特征入手,寻找描述中国股市波动性特征的合适的统计模型。 在研究相关文献的基础上,将非参检验应用于中国股市统计特征的研究。运用Kolmogorov拟合优度检验,对中国股市进行了正态分布假设检验;运用方差平方秩检验方法,比较分析了上海指数和深圳综指的波动性。 正文: 一、Kolmogorov拟合优度检验以及方差的平方秩检验方法。 (一)Kolmogorov拟合优度检验 1. 原假设和备择假设 原假设H :样本来自于正态分布总体。 备择假设H 1 :样本不是来自于正态分布总体。 2. 检验统计量 令S (x) 是样本X 1、X 2 、…X n 、的经验分布函数,F*(x)是完全已知的假设分布函数, 则检验统计量T为S (x) 与F*(x)的最大垂直距离,即:T = sup| F*(x)- S (x)|。 3. P值计算 近似P值可以通过在表A13中插值得到,或者利用2倍的单边检验的P值。 单边P值= 1 )] 1( [ 1 1 - - - = ? ? ? ? ? + ? ? ? ? ? - - ?? ? ? ? ? ∑j j n t n j n j t n j t j n 这里t的是检验统计量的观测值,[n(1-t)] 且是小于等于n(1-t)的最大整数。当给定的显著性水平α大于或等于P值时,拒绝原假设。 在本文中,该检验是运用S-plus 统计分析软件实现的。 (二) 方差的平方秩检验 1. 原假设和备择假设 ( 1 ) 双边检验 1 原假设H :除了它们的均值可能不同外,X和Y同分布。

第十一章 非参数检验

?第十一章非参数检验 ?第一节符号检验 ?第二节秩和检验 ?第三节等级相关分析 ?非参数检验是一种与总体分布状况无关的检验方法,它主要是利用样本数据之间的大 小比较及大小顺序,对样本及其所属总体作差别检验,而不对总体分布的参数如平均数、标准差等进行估计推断。 ?优点—计算简便、直观, ?—易于掌握,检验速度较快 ?缺点—降低了检验的准确性,效率一般要低于参数检验方法 ?本章只介绍常用的 —符号检验(sign test) —秩和检验(rank-sum test) —等级相关分析(rank correlation analysis) ?第一节符号检验 一、配对资料的符号检验 二、样本中位数与总体中位数比较的符号检验 ?一、配对资料的符号检验 1、建立假设 无效假设H O:两处理差值d总体中位数=0 备择假设H A:两处理差值d总体中位数≠0 或d总体中位数<0 (一尾检验) 或d总体中位数>0(一尾检验) 2、计算差值并赋予符号 d>0者记为“+”,总个数记为n+ d<0者记为“-”,总个数记为n- d=0记为“0”, 总个数记为n0 n= n++ n- 检验的统计量为K 为n+、n-中的较小者 ? 3、统计推断 由n查附表15得临界值K0.05(n),K0.01(n),作统计推断: 如果K>K0.05(n),P>0.05,则不能否定H O,两个试验处理差异不显著; 如果K0.01(n)<K≤K0.05(n),0.01<P≤0.05,则否定H O,接受H A,两个试验处理差异显著; 如果K≤K0.01(n),P≤0.01,则否定H O,接受H A,两个试验处理差异极显著。 【例11.1】某研究测定了噪声刺激前后15头猪的心率,结果见表11-1。问噪声对猪的心率有无影响? ?表11-1 猪噪声刺激前后的心率(次/分钟) 1、提出无效假设与备择假设 H O:噪声刺激前后猪的心率差值d总体中位数 =0;

第十章 基于秩次的非参数检验

第十章基于秩次的非参数检验习题 一、选择题 1.两小样本均数比较,方差不齐时,下列说法不正确的是(). A. 采用秩和检验 B. 采用t′检验 C. 仍用t检验 D. 变量变换后再作决定 E. 要结合正态性检验结果方能作出决定 H是(). 2. 两样本秩和检验的 A. 两样本秩和相等 B. 两总体分布相同 C. 两样本分布相同 D. 两总体秩和相等 E. 两总体均数相等 3. 在统计检验中是否选用非参数统计方法(). A. 要根据研究目的和数据特征作决定 B. 可在算出几个统计量和得出初步结论后进行选择 C. 要看哪个统计结论符合专业理论 D. 要看哪个P值更小 E. 既然非参数统计对资料没有严格的要求,在任何情况下均能直接使用 4. 配对样本差值的Wilcoxon符号秩和检验,确定P值的方法是(). A. T越大,P值越小 B.T越大,P值越大 C. T值在界值范围内,P值小于相应的α D. T值在界值范围内,P值大于相应的α E. T值在界值范围上,P值大于相应的α 5. 成组设计两样本比较的秩和检验,其检验统计量T是(). A. 为了查T界值表方便,一般以秩和较小者为T B. 为了查T界值表方便,一般以秩和较大者为T C. 为了查T界值表方便,一般以例数较小者秩和为T D. 为了查T界值表方便,一般以例数较大者秩和为T E. 当两样本例数不等时,任取一样本的秩和为T都可以查T界值表

多样本定量资料比较,当分布类型不清时应选择(). A. 方差分析 B. t检验 C. Z检验 D. Kruskal-Wallis检验 E. Wilcoxon检验 6. 多组样本比较的Kruskal-Wallis检验中,当相同秩次较多时,如果用H值而不用校正后 H值,则会(). 的 c A.提高检验的灵敏度 B.把一些无差别的总体推断成有差别 C. 把一些有差别的总体推断成无差别 D.Ⅰ、Ⅱ类错误概率不变 E. 以上说法均不对 二、简答题 1. 对于完全随机设计两样本定量资料的比较,如何选择统计方法? 2. 为什么在秩和检验编秩次时不同组间出现相同数据要给予“平均秩次”,而同一组的相同数据不必计算“平均秩次”? 3. 多组定量资料比较时,统计处理的基本流程是什么?

第十一章非数检验

第十一章 非参数检验 前面有关章节讨论的参数检验都要求总体服从一定的分布,对总体参数的检验是建立在这种分布基础上的。例如,两样本平均数比较的t 检验和多个样本平均数比较的F 检验,都要求总体服从正态分布,推断两个或多个总体平均数是否相等。本章引入另一类检验——非参数检验(non-parametric test )。非参数检验是一种与总体分布状况无关的检验方法,它不依赖于总体分布的形式,应用时可以不考虑被研究的对象为何种分布以及分布是否已知。非参数检验主要是利用样本数据之间的大小比较及大小顺序,对两个或多个样本所属总体是否相同进行检验,而不对总体分布的参数如平均数、标准差等进行统计推断。当样本观测值的总体分布类型未知或知之甚少,无法肯定其性质,特别是观测值明显偏离正态分布,不具备参数检验的应用条件时,常用非参数检验。非参数检验具有计算简便、直观,易于掌握,检验速度较快等优点。 非参数检验法从实质上讲,只是检验总体分布的位置(中位数)是否相同,所以对于总体分布已知的样本也可以采用非参数检验法,但是由于它不能充分利用样本内所有的数量信息,检验的效率一般要低于参数检验方法。例如,非配对资料的秩和检验,其效率为t 检验的86.4%,就是说以相同概率判断出差异显著,t 检验所需的样本个数要少13.6%。非参数检验内容很多,本章只介绍常用的符号检验(sign test ),秩和检验(rank-sum test )和等级相关分析(rank correlation analysis )三种。 第一节 符号检验 一、配对资料的符号检验 (一)配对资料符号检验的意义 配对资料符号检验是根据样本各对数据之差的 正负符号多少来检验两个总体分布位置的异同,而不去考虑差值的大小。每对数据之差为正值用“+”表示,负值用“-”表示。可以设想如果两个总体分布位置相同,则正或负出现的次数应该相等。若不完全相等,至少不应相差过大,否则超过一定的临界值就认为两个样本所来自的两个总体差异显著,分布的位置不同。显然这种检验比较的是中位数而不是平均数,当分布对称时,中位数与平均数相等。 (二)配对资料符号检验的基本步骤 1、提出无效假设与备择假设 H O :甲、乙两处理差值d 总体中位数=0; H A :甲、乙两处理差值d 总体中位数≠0。 此时进行两尾检验。若将H A 中的“≠”改为“<”或“>”,则进行一尾检验。 2、计算差值并赋予符号 求甲、乙两个处理的配对数据的差值d ,d >0者记为“+”,d <0者记为“-”,d =0记为“0”。统计“+”、“-”、“0”的个数,分别记为0,,n n n -+,令-++=n n n 。检验的统计量为K ,等于+n 、-n 中的较小者,即},min{-+=n n K 。

假设检验——非参数检验

假设检验(二)——非参数检验 假设检验的统计方法,从其统计假设的角度可分为两类:参数检验与非参数检验。上一节我们所介绍的Z 检验、t 检验,都是参数检验。它们的共同特点是总体分布正态,并满足某些总体参数的假定条件。参数检验就是要通过样本统计量去推断或估计总体参数。然而,在实践中我们常常会遇到一些问题的总体分布并不明确,或者总体参数的假设条件不成立,不能使用参数检 验。这一类问题的检验应该采用统计学中的另一类方法,即非参数检验。非参数检验是通过检验总体分布情况来实现对总体参数的推断。 非参数检验法与参数检验法相比,特点可以归纳如下: (1)非参数检验一般不需要严格的前提假设; (2)非参数检验特别适用于顺序资料; (3)非参数检验很适用于小样本,并且计算简单; (4)非参数检验法最大的不足是没能充分利用数据资料的全部信息; (5 )非参数检验法目前还不能用于处理因素间的交互作用。 非参数检验的方法很多,分别适用于各种特点的资料。本节将介绍几种常用的非参数检验方法。 一.2检验 2 检验主要用于对按属性分类的计数资料的分析,对于数据资料本身的分布形态不作任何假设,所以从一定的意义上来讲,它是一种检验计数数据分布状态的最常用的非参数检验方法。 2 2 检验的方法主要包括适合性检验和独立性检验。 (一)2检验概述 2 是实得数据与理论数据偏离程度的指标。其基本公式为: 2 ( f0 f e)(公式11—9) f e 式中,f0 为实际观察次数,f e 为理论次数。 分析公式可知,把实际观测次数和依据某种假设所期望的次数(或理论次数)的差数平方,除以理论次数,求出比值,再将n 个比值相加,其和就是2。观察公式可发现,如果实际观察

第10章非参数检验(精)

第10章非参数检验 非参数检验是指在总体不服从正态分布或分布情况不明时,用来检验数据资料是否来自同一个总体假设的一类检验方法。 SPSS提供的非参数检验共有以下几种: Chi-Square:卡方检验(举例data16-01,data16-02) 在前面介绍的方法中,往往都事先假定总体服从正态分布,然后对其均值或方差作检验。但某个随机变量是否服从某种特定的分布是需要进行检验的。可以根据以往的经验或实际的观测数据的分布情况,推测总体可能服从某种分布函数F(x),利用这些样本数据来具体检验该总体分布函数是否真的就是F(x)。卡方检验(Chi-Square)就是这样一种用来检验给定的概率值下数据来自同一总体的无效假设的方法。 data16-01:掷一颗六面体300次,用1、2、3、4、5、6分别代表六面的六个点,试问这颗六面体是否均匀。 表16—1 300次掷一颗六面体实验观测结果 data16-02:100名健康成年女子血清总蛋白含量,试它是否服从正态分布。 Binomial:二项检验(举例data16-03) 二项分布检验(Binomial test)是一种用来检验在给定的落入二项式中第一项概率值的前提下数据来自二项分布的无效假设的方法。(二项分布是从二分类总体抽得的随机样本中可能观察到的两类比例的抽样分布。这就是说,它给出了在零假设成立时两类比例的各种可能值。这里,零假设是指总体值为P的假设,当一项研究的“结果”可分为两类时,就可以用二项分布来检验零假设。这种检验属于拟合优度型。它告诉我们是否能够认为从样本中观察到的两类比例(或频数)来自于具有指定P值的总体。) data16-03:掷一枚球类比赛用的挑边器31次,出现A面、B面在上的次数见表16-3,取变量名为“tbh”,用数字型数据1代表“A”,用数字型数据1代表“B”,试问这枚挑边器是否均匀。 表16-3 31次掷一枚球类比赛用的挑边器实验观测结果 Runs:游程检验(举例data16-04) 例如,假定观察的结果用加、减号表示,得到一组这样的记录顺序: ++---++----++-+ 我们总共观察到7个游程。 游程检验是指根据游程数所作的二分变量的随机性检验。游程检验可用来检验样本的随机性,这对统计推断是很重要的,游程检验也可用来检验任何序列的随机性,而不管这个

第6章非参数检验

第6章非参数检验 非参数检验是针对那些总体分布不能用有限个实参数来刻画,而只能对其作一些诸如分布连续、有密度、具有某阶矩等一般性假定的统计问题。例如,检验“两个总体有相同分布”这个假设,若只假定两总体的分布为连续,此外一无所知,问题涉及的分布不能用有限个实参数刻画,这就是非参数统计问题。又如,估计总体分布的期望,若假定总体分布为正态分布,则问题是参数性的;若只假定总体分布的期望值存在,则问题是非参数性的。不过参数统计与非参数统计之间并没有泾渭分明的界线,有的统计问题,从不同的角度可以理解为参数性的,也可以理解为非参数性的。例如线性回归(见回归分析)问题,若关心的是估计回归系数,它只是有限个实参数,因而可以看成是参数性的;但如果对随机误差的分布类型没有作任何假定,则从问题总体分布这个角度看,也可以看成是非参数性的。 非参数统计的一个重要特点是非参数统计问题中对总体分布的假定要求的条件很宽,因而使得针对这种问题而构造的非参数统计方法,不致于因为对总体分布的假定不当而导致重大错误,所以它往往有较好的稳健性。但正是因为非参数统计方法需要照顾范围很广的分布,在某些情况下会导致其效率的降低。不过,近代理论证明:当一些重要的非参数统计方法,当与相应的参数方法比较时,即使在最有利于后者的情况下,其效率上的损失也很小。 第1节符号检验 符号检验是根据正、负符号个数的假设检验方法。首先需要将原始数据按设定的规则,转换成正、负号,然后计数正、负号的个数做出检验。该检验可用于样本中位数和总体中位数的比较,数据升降趋势检验,特别可用于总体分布不服从正态分布或分布不明的配对资料,有时当配对比较的结果只能定性的表达时,也可用本方法。 配对资料符号检验的计算步骤为:将成对数据以一定规则编码(或原始数量型数据),然后相减,得到的结果后,计数大于0的样本个数以及小于0的样本个数分别为n+和n-,当样本大小时,计算近似卡方值。

统计学习题第十一章非参数检验

第十一章 非参数检验 第一节 符号检验 符号检验的方法?符号检验的特点和作用 第二节 配对符号秩检验 配对符号秩检验的方法?配对符号秩检验的效力 第三节 秩和检验 秩和检验的方法?秩和检验的近似 第四节 游程检验 游程的概念?游程检验的方法?差符号游程检验 第五节 累计频数检验 累计频数检验的方法?累计频数检验的应用 填空 1.非参数检验, 泛指“对分布类型已知的总体进行参数检验” ( 2.符号检验的零假设就是配对观察结果的差平均起来等于( )。 3.理论研究表明,对于配对样本非正态分布的差值 d ,( )是最佳检验。 4. 秩和检验检验统计量 U 是Ui 和U 2中较( )的一个。 5.秩尺度之统计量的均值和标准差只取决于( )。 6. ( )常被用作经验分布与理论分布的比较。 7. 绝对值相等的值,应将它们的秩( )。 8. 符号检验,在分布自由检验中称为( )。 9. 符号检验和配对符号秩检验,都只适用于( )样本。 10 ?数据序列 ABBABAAABABBABBAAAA A 总游程数是( ) 单项选择 1. 下列检验中,不属于非参数统计的方法的是( )。 A 总体是否服从正态分布 B 总体的方差是否为某一个值 C 样本的取得是否具有随机性 D 两组随机变量之间是否相互独立 2. 下列情况中,最适合非参数统计的方法是( )。 A 反映两个大学新生成绩的差别 B 反映两个大学新生家庭人均收入的差别 C 反映两个大学三年级学生对就业前景的看法差别 D 反映两个大学在校生消费水平的差别 3. 不属于非参数检验的是( )。 法。 )的所有检验方

A 符号检验 B 游程检验 C 累计频数检验 D F 检验 4. 在累计频数检验中,卡方的自由度为()。 A n1 B 2 C n2 D n1+n2

STATA 第五章 多组计量资料比较的非参数检验命令与输出结果说明

第五章多组计量资料比较的非参数检验命令与输出结果说明 对于计量资料不满足正态分布要求或方差不齐性,但样本资料之间是独立抽取的,则可以应用秩和检验方法进行比较两组资料的中位数是否有差异。STATA 命令为: ranksum 观察变量, by( 分组变量) 例:研究不同饲料对雌鼠体重增加的关系。表中用x表示雌鼠体重增加(克), . ranksum x, by(group) Two-sample Wilcoxon rank-sum (Mann-Whitney) test group obs rank sum expected 1 1 2 140.5 120 2 7 49.5 70 combined 19 190 190 unadjusted variance 140.00 adjustment for ties -0.12 adjusted variance 139.88 Ho: x(group==1) = x(group==2) z = 1.733 Prob > |z| = 0.0830 望值为70;③秩和统计检验量z;④对于无效假设Ho对应的p值。 在本例中,虽然第二组的秩和为49.5而期望值估计为70,但p值为0.0832,所以根据该资料和统计结果一般不能认为用高蛋白饲料喂养能明显增加雌鼠的体重。 多组资料中位数比较(完全随机化设计资料的检验)

对于完全随机化设计资料的比较,若各组资料不全服从正态分布(即:至少有一组的资料均不服从正态分布)或各组的资料方差不齐性,则可以用Kruskal and Wallis方法进行检验(Ho:各组的中位数相同)。STATA命令为: kwallis 观察变量,by(分组变量) 例:50只小鼠随机分配到5个不同饲料组,每组10只小鼠。在喂养一定时间后,测定鼠肝中的铁的含量(mg/g)如表所示:试比较各组鼠肝中铁的含量是否有显著性差别。用x 表示鼠肝中铁的含量以及用group=1,2,3,4,5分别表 Kruskal-Wallis equality-of-populations rank test group Obs Rank Sum 1 10 188.50 2 10 280.50 3 10 420.00 4 10 95.00 5 10 291.00 chi-squared = 27.856 with 4 d.f. probability = 0.0001 chi-squared with ties = 27.858 with 4 d.f. probability = 0.0001 值。 本例结果表明:5组的中位数有显著的差异。即:5个不同饲料组的小鼠肝脏中铁的含量有显著差异,说明小鼠肝脏中铁的含量与喂养的饲料有关。

第十一章 秩和检验

第十一章秩和检验 A型选择题 1、以下对非参数检验的描述,哪一项是错误的()。 A.非参数检验方法不依赖于总体的分布类型 B.应用非参数检验时不考虑被研究对象的分布类型 C.非参数的检验效能低于参数检验 D.一般情况下非参数检验犯第二类错误的概率小于参数检验 E.B、E均不对 2、多样本计量资料比较,当分布类型不清时选择()。 A.t检验 B.u检验 C.秩和检验 χ检验 D、2 E.方差分析 时()。3、符合t检验条件的数值变量资料如果采用秩和检验,不拒绝H A.第一类错误增大 B.第二类错误增大 C.第一类错误减小 D.第二类错误减小 E.两类错误都增大 4、按等级分组的资料作秩检验时,如果用H值而不用校正后的H值,则会()。 A、提高检验的灵敏度 B、会把一些无差别的总体推断成有差别 C、会把一些有差别的总体推断成无差别 D、第一、二类错误概率不变 E、一类错误增大 5、以上检验方法之中,不属于非参数检验法的是()。 A、t检验 B、符号检验 C、Kruskal-Wallis检验 D、Wilcoxon检验 χ检验 E、2 6、等级资料的比较宜用()。

A、t检验 B、秩和检验 C、F检验 检验 D、2 E、u检验 7、在进行成组设计两样本秩和检验时,以下检验假设正确的是()。 :两样本对应的总体均数相同 A、H :两样本均数相同 B、H :两样本的中位数相同 C、H :两样本对应的总体分布相同 D、H E、以上答案都不正确 8、秩和检验又叫做() A、参数检验 B、近似正态检验 C、非参数检验 D、H检验 E、Wilcoxon检验 9、当总体分布类型不清时,可采用() A、t检验 B、秩和检验 C、x2检验 D、正态检验 E、u检验 10、两个小样本比较的假设检验,应首先考虑()。 A、t检验 B.秩和检验 C.任选一种检验方法 D、资料符合哪种检验的条件 E.以上都不对

相关主题
文本预览
相关文档 最新文档