当前位置:文档之家› 06 假设检验基础

06 假设检验基础

第六章 假设检验基础

[教学要求]
了解:通过电脑实验了解常用的正态性检验的方法;区间估计与假设检验之间的关系。
熟悉:假设检验的概念与原理;假设检验的基本步骤;假设检验功效的意义及计算;假设检验的两类错误之间的区别与联系。
掌握:掌握常用的t检验、二项分布资料的Z检验以及Poisson分布资料的Z检验的分析与计算过程,包括每种检验方法的适用条件和不同类型;学会综合考虑研究目的、设计类型、变量类型、样本含量等要素选择合适的假设检验方法的技巧。

[重点难点]
第一节 假设检验的概念与原理
一、假设检验的思维逻辑
基本推断原理:小概率事件在一次随机试验中不(大)可能发生。
特点:从研究总体中抽取大小合适的随机样本,应用假设检验理论和方法,依据样本提供的有限信息对总体做推断。

二、假设检验的基本步骤
基本概念:检验水准是假设检验预先规定的一个“较小”的概率值,应用中常取0.05或0.01等数值,是人为的判断标准。统计量是随机样本的函数;由样本计算出统计量的具体数值,据以决策。如果总体状况和H0一致,统计量获得现有数值以及更不利于H0的数值的可能性(概率)就是P值。
假设检验的基本步骤:
1. 选择检验方法,建立检验假设并确定检验水准
2. 计算检验统计量
3. 确定P值
4. 做出推断结论

第二节 t检验
t检验的应用条件:样本取自正态总体。
一、一组样本资料的t检验
检验统计量:

其中,μ0为已知的总体均数(一般为理论值、标准值或经过大量观察所得的稳定值等)。
二、配对设计资料的t检验
基本概念:配对设计是研究者为了控制可能存在的主要非处理因素而采用的一种试验设计方法。
检验统计量:

其中, 为差值的均数, 为差值的样本标准差, n是对子数。
三、两组独立样本资料的t检验
㈠ 两样本所属总体方差相等
检验统计量:


其中, 是合并方差。
㈡ 两样本所属总体方差不等(t’检验)
检验统计量:

其中, 和 分别为两组样本均数的标准误。
四、两组独立样本资料的方差齐性检验
检验统计量:
, ν1=n1-1,ν2=n2-1
其中, 与 是被比较的两个样本方差。

第三节 二项分布与Poisson分布资料的Z检验
二项分布的正态近似条件:n较大、π不接近0也不接近1。实践中,若np与n(1-p)均大于5,便可认为符合条件。
Poisson分布的正态近似条件:总体均数λ较大。实践中,若X≥20,便可认为符合条件。
一、二项分布资料的Z检验
㈠ 一组样本资料的Z检验
检验统计量:


n不太大时, 需作如下的连续性校正:

其中,π0为已知的总体概率(一般为理论值、标准值或经过大量观察所得的稳定值等), 。
㈡ 两组独立样本资料的Z检验
检验统计量:

其中, 、 分别为两个样本的样本量; 和 分别为两组的样本的阳性频率; 为两组样本合并的阳性频率。分子中的 为连续性校正项; ; 和 分别为两组阳性例数。
二、Poisson分布资料的Z检验
㈠ 一组样本资料的Z检验
检验统计量:

其中,λ0为一个定值(一般为理论值、标准值或经过大量观察所得的稳定值等)。
㈡ 两组独立样本资料的Z检验
检验统计量:
1. 当两样本观测单位数相等时:

其中 与 分别为两样本的计数值。
2. 当两样本观测单位数不等时:

其中, 与 分别为两样本均数,n1与n2分别为观测单位数。

第四节 假设检验与区间估计的关系
1. 置信区间具有假设检验的主要功能。
2. 置信区间在回答差别有无统计学意义的同时,还可以提示差别是否具有实
际意义。
3. 假设检验可以报告确切的P值,还可以对检验的功效做出估计。

第五节 假设检验的功效
一、假设检验的两类错误
附表 推断结论和两类错误的概率
实际情况 检验结果
拒绝H0 不拒绝H0
H0真 第Ⅰ类错误 (α) 结论正确(1-α)
H0 不真 结论正确 (1-β) 第Ⅱ类错误(β)
当样本容量n一定时,α越小β越大;α越大β越小;要想同时降低α与β,唯一的方法是增大样本容量。
二、假设检验的功效
基本概念:1-β称为假设检验的功效,其意义是,当所研究的总体与H0确有差别时,按检验水平α能够发现它(拒绝H0)的概率。
1. 一组样本资料t检验的功效
计算 :
其中,n为样本容量,δ为欲发现的最小差异或容许误差,σ为总体标准差, 为假设检验的临界值(取单侧)。然后根据 反查标准正态分布表, 标准正态分布的密度曲线下, 左侧的面积就是功效1-β。
2. 两组独立样本资料t检验的功效
计算 :
其中, 、 分别为两个样本的样本量,其余符号含义同上。
3. 二项分布两组独立样本资料Z检验的功效
计算 :
其中,π1、π2分别为两个被推断的总体概率,其余符号含义同上。
三、应用假设检验需要注意的问题
略。

*第六节 正态性检验
一、图示法
1. P-P图法
2. Q-Q图法
二、统计检验法
1. W检验
2. D检验
3. 矩法

[案例讨论参考答案]
案例6-1:该资料属于对受试对象施加某种处理、观察处理前后实验指标的差异大小的配对设计,应该选用相应的配对设计资料的t检验,该医生对此数据应用两组独立样本的t检验是不恰当的。有统计学意义不等于有实

际意义,差异的平均水平达到或超过有实际意义的差值,或差异的平均水平的置信区间包含有实际意义的差值,方可说明治疗有效。本资料使用SAS分析结果为:t=6.47,P<0.0001,有统计学意义; =56.9 U/ml, 的95%置信区间为(37.92,75.93)U/ml。SAS源程序参见电脑实验6-1。

[电脑实验程序及结果解释]
实验6-1 配对设计的 t 检验
程序6-1 配对设计的t检验
01 DATA t; 建立SAS数据集t;
02 INPUT no x1 x2 @@; 定义并连续读入变量no、x1和x2;
03 d=x2-x1; 计算x2和x1的差值d;
04 CARDS; 数据块开始语句;
05 1 0.94 0.92
06 … …
07 12 2.02 2.04
08 ; 数据块结束;
09 PROC MEANS N MEAN STDERR T PRT DATA=t; 调用means过程,指定输出例数、均数、标准误、t值和P值;
10 VAR d; 指定分析变量d;
11 TITLE 'paired-comparisons t test'; 定义输出结果的标题;
12 RUN; 运行;

注:本程序是利用SAS的MEANS过程选择T和PRT选项对差值作t检验达到作配对t检验的目的。
运行结果:
Output窗口:
paired-comparisons t test 1
The MEANS Procedure
Analysis Variable : d
N Mean Std Error t Value Pr > |t|
---------------------------------------------------------------------------
12 -0.0033333 0.0043228 -0.77 0.4569
---------------------------------------------------------------------------
实验6-2 完全随机设计两总体均数比较的 t 检验
程序6-2 完全随机设计两总体均数比较的t检验
01 Data t; 建立SAS数据集t;
02 INPUT x g @@; 定义并连续读入变量x和g;
03 CARDS; 数据块开始语句;
04 3.22 1 3.70 1 3.98 1 3.59 1
05 ……
06 3.71 2 3.55 2
07 ; 数据块结束语句;
08 PROC TTEST DATA=t; 调用TTEST过程完成两组t检验;
09 CLASS g; 指定分组变量g;
10 VAR x; 指定分析变量x;
11 RUN; 运行;
运行结果:
Output窗口:
The TTEST Procedure
Statistics
(基本统计量)
Lower CL Upper CL Lower CL Upper CL
Variable g N Mean Mean Mean Std Dev Std Dev Std Dev Std Err
x 1 12 3.3567 3.53 3.7033 0.1932 0.2728 0.4632 0.0787
x 2 14 3.5156 3.6193 3.723 0.1302 0.1796 0.2893 0.048
x Diff (1-2) -0.274 -0.089 0.0951 0.1773 0.2271 0.3159 0.0893

T-Tests
(t检验结果)
Variable Method Variances DF t Value Pr > |t|
x Pooled Equal (

方差齐) 24 -1.00 0.3276
x Satterthwaite Unequal (方差不齐) 18.5 -0.97 0.3454

Equality of Variances
(方差齐性检验结果)
Variable Method Num DF Den DF F Value Pr > F
(分子自由度) (分母自由度) (F值) (P值)
x Folded F 11 13 2.31 0.1539
实验6-3 正态性检验(W 检验)
程序6-3 正态性检验
01 Data t; 建立SAS数据集t;
02 INPUT x @@; 定义并连续读入变量x;
03 CARDS; 数据块开始语句;
04 63 106 112 88 150
05 104 88 75 78 140
06 167 155 122 128 99
07 130 113 45 133 133
08 124 187 101 87 70
09 ; 数据块结束语句;
10 PROC UNIVARIATE NORMAL PLOT DATA=t; 调用UNIVARIATE过程,指定进行正态性检验并绘图;
11 VAR x; 指定分析变量x;
12 RUN; 运行;
注:本程序是利用SAS的UNIVARIATE过程选择NORMAL和PLOT选项对变量值进行正态性检验。
运行结果:
Output窗口:
The UNIVARIATE Procedure
Variable: x
Moments
N 25 Sum Weights 25
Mean 111.92 Sum Observations 2798
Std Deviation 34.0219537 Variance 1157.49333
Skewness 0.17531758 Kurtosis -0.1835343
Uncorrected SS 340932 Corrected SS 27779.84
Coeff Variation 30.3984576 Std Error Mean 6.80439074

Basic Statistical Measures
Location Variability
Mean 111.9200 Std Deviation 34.02195
Median 112.0000 Variance 1157
Mode 88.0000 Range 142.00000
Interquartile Range 45.00000
NOTE: The mode displayed is the smallest of 2 modes with a count of 2.

Tests for Location: Mu0=0
Test ----Statistic---- --------p Value------
Student's t t 16.4482 Pr > |t| <.0001
Sign M 12.5 Pr >= |M| <.0001
Signed Rank S 162.5 Pr >= |S| <.0001

Tests for Normality
(正态性检验结果)
Test -----Statistic------ --------p Value------
Shapiro-Wilk W 0.992971 Pr < W 0.9996
Kolmogorov-Smirnov D 0.078996 Pr > D >0.1500

Cramer-von Mises W-Sq 0.015275 Pr > W-Sq >0.2500
Anderson-Darling A-Sq 0.103689 Pr > A-Sq >0.2500

Quantiles (Definition 5)
Quantile Estimate
100% Max 187
99% 187
95% 167
90% 155
75% Q3 133
50% Median 112
25% Q1 88
10% 70
5% 63
1% 45
0% Min 45

Extreme Observations
------Lowest------ ------Highest-----
Value Obs Value Obs
45 18 140 10
63 1 150 5
70 25 155 12
75 8 167 11
78 9 187 22

Stem Leaf # Boxplot
(茎叶图) (箱式图)
18 7 1 |
16 7 1 |
14 005 3 |
12 248033 6 +-----+
10 14623 5 *--+--*
8 7889 4 +-----+
6 3058 4 |
4 5 1 |
------+------+------+------+
Multiply Stem.Leaf by 10**+1

The UNIVARIATE Procedure
Variable: x
Normal Probability Plot
(正态概率图)
190+ *+++++
| *+++++
| *+*+*+
| *****++
| *****+

| +*+*+*
| *+*+*+*
50+ +*++++
+------+------+------+------+------+------+------+------+------+------+
-2 -1 0 +1 +2

实验6-4 假设检验(总体均数等于某一常数的 t 检验)两类错误的模拟实验
程序6-4 t检验两类错误的模拟实验
01 DATA t; 建立SAS数据集t;
02 mu=2; std=1.5; 指定总体均数和标准差;
03 n=10; 指定样本含量n;
04 w=1000; 指定实验重复次数w;
05 DO j=1 TO w; 设立w次循环;
06 DO i=1 TO n; 设立n次循环;
07 x=mu+std *RANNOR(0); 从指定的正态总体中随机抽样;
08 OUTPUT; 数据写入数据集;
09 END; 循环结束;
10 END; 循环结束;
11 PROC UNIVARIATE mu0=0 NOPRINT; 调用UNIVARIATE过程,指定与总体均数mu0=0进行t检验;
12 VAR x; BY j; 指定分析变量x;按变量j分组;
13 OUTPUT OUT=a T=t_value PRT=p_value; 指定将分析结果中的t值t_value及P值p_value输出到数据集a中,;
14 DATA b; 建立SAS数据集b;
15 SET a(DROP=j); alpha=0.05; 继承a的数据,不包含变量j;确定α;
16 h0=p_value> alpha; 当P>α时,h0=1,否则为0;
17 h1=p_value<= alpha; 当P≤α时,h1=1,否则为0;
18 PROC PRINT; 调用PRINT过程输出结果;
19 SUM h0 h1; 指定对h0、h1求和;
20 RUN; 运行;
注:此程序只适用于8版以上的SAS。若要在SAS6.12中运行,只要删去第11行语句“PROC UNIVARIATE mu0=0 NOPRINT;”中的“mu0=0”即可。
运行结果:
Output窗口:
Obs t_value p_value alpha h0 h1
1 2.42379 0.038372 0.05 0 1
2 7.23564 0.000049 0.05 0 1
3 3.87294 0.003772 0.05 0 1
… … … … …
996 2.2246 0.053161 0.05 1 0
997 3.9212 0.003505 0.05 0 1
998 7.7941 0.000027 0.05 0 1
999 6.0861 0.000182 0.05 0 1
1000 4.9084 0.000838 0.05 0 1
== ===
42 958
注:此输出结果只列出部分内容;由于调用随机函数RANNOR(0),此结果在每次运行程序后都有所不同。

[思考与练习的参考答案]
1. 根据临床经验可知正常产男性新生儿临产前双顶径(BPD)数据服从正态分
布,又根据资料特点,本题属于一组样本资料的t检验。
t=1.03,P=0.3271>0.05,无统计学意义,说明该地区男性新生儿临产前双顶径(BPD)符合一般新生儿规律。
2. 本研

究为通过不同群体的小样本数据比较定量指标lgG的平均水平,故本题
属于两组独立样本资料的t检验。首先检验两组方差是否具有齐性(参见教材例6-6方法),求得F=17.36,P<0.05,方差不齐;选用t’检验(参见教材例6-5方法)求得t’=14.14,ν=35,P<0.05,有统计学意义。说明习惯性流产者与正常妇女lgG水平是不同的。
3. 本题属于两组独立样本资料的t检验。首先检验两组方差是否具有齐性(参
见教材例6-6方法)求得F=1.57,P>0.10,方差齐;选用t检验(参见教材例6-4方法)求得t=10.97,ν=28,P<0.05,有统计学意义。说明Hp对生长抑制素含量有影响。
4. 本题属于两组独立样本资料的t检验,虽然研究中采用配对设计,但研究的
主要目的是观察两组各自治疗前后血清Sil-2R水平(U/ml)差值的总体均数是否不同。首先应计算每组各自的血清Sil-2R水平(U/ml)差值dA和dB,然后对两组差值的方差作齐性检验,根据检验结果决定选用t检验还是t’检验。
输出结果显示,方差齐性检验 F=6.24,P=0.0048<0.05,方差不齐; t’=-5.54,P=0.0001<0.05,有统计学意义,说明平消胶囊对接受放疗患者血清Sil-2R水平有影响。
5. 本题按两组独立样本资料的t检验分析为佳。方差齐性检验 F=2.20,
P=0.2547>0.05,方差齐; t=-19.57,P=0.0001<0.05,有统计学意义,说明两组动物每日进食量不相同。
6. 本研究的观察指标为定性资料,并且具有二分类特性,故本题可用二项分布
资料的Z检验,即两组独立样本资料的Z检验(参见教材例6-9方法),求得Z=2.07,P<0.05,有统计学意义。可认为补钙对妊高症有预防作用。
7. 本研究为回顾调查两个不同地区发生数非常低的脑血管病死亡的情况,可用
Poisson分布两组独立样本资料的Z检验(参见教材例6-11方法),求得Z=1.75,P>0.05,无统计学意义。可认为两地区脑血管病死亡水平是相同的。
8.(1) 假设检验的理论依据是“小概率事件在一次随机试验中不(大)可能发生”的推断原理。
(2) 假设检验时,拒绝实际上成立的H0,犯第I类错误,俗称“弃真”错误;不拒绝实际上并不成立的H0,犯第II类错误,俗称“存伪”错误。犯第I类错误的概率用α表示,假设检验时,根据研究者的要求来确定;犯第II类错误的概率用β表示,它只有与特定的H1结合起来才有意义。对于某一具体的检验来说,当样本容量n一定时,α越小β越大;α越大β越小。
(3)t检验的应用条件是:样本取自正态总体。
(4)假设检验中P值的意义是:如果总体状况和H0一致,统计量获得现有数值以及更不利于H0的数值的概率。
(5)检验水准的确定需根据研究设计的类型、研究目的、变量

类型及变异水平、样本大小等诸多因素。
(6)单侧与双侧检验的应用首先应考虑所要解决问题的目的,根据专业知识来确定。若从专业知识判断一种方法的结果不可能低于或高于另一种方法的结果时,可用单侧检验;在尚不能从专业知识判断两种结果谁高谁低时,则用双侧检验。一般认为双侧检验较保守和稳妥。

[补充练习题]
一、选择题
㈠ A1型:每一道题下面有A、B、C、D、E五个备选答案,请从中选择一个最佳答案。

1. 当n≠∞时,Z0.05的值与t0.05,n-1的值有关系式 。
A. Z0.05>t0.05,n-1 B. Z0.05<t0.05,n-1 C. Z0.05=t0.05,n-1
D. Z0.05≥t0.05,n-1 E. Z0.05≤t0.05,n-1
2. 做两个总体均数比较的t检验,计算得 时,可以认为 。
A.反复随机抽样时,出现这种大小差异的可能性大于0.01
B.这种差异由随机抽样误差所致的可能性小于0.01
C.接受H0,但判断错误的可能性小于0.01
D.拒绝H0,但犯第一类错误的概率小于0.01
E.拒绝H0,但判断错误的概率未知

3. 下述 为第一类错误的定义。
A. 拒绝实际上并不成立的H0
B. 接受实际上并不成立的H0
C. 拒绝实际上是成立的H0
D. 接受实际上是成立的H0
E. 拒绝实际上并不成立的H1

4. 二项分布 近似正态分布的条件是 。
A. >5 B. >5 C. <5 且 >5
D. >5 且 >5 E. >5 且 <5

㈡ A2型:每一道题以一个小案例出现,其下面有A、B、C、D、E五个备选答案,请从中选择一个最佳答案。

1. 已知某市20岁以上男子平均身高为171cm,该市某大学随机抽查36名20岁以上男生,测得平均身高为176.1cm,标准差为8.4cm。按照α=0.05检验水准,认为该大学20岁以上男生的平均身高与该市的平均值的关系是 。(t0.05,35=1.690)
A. 高于该市的平均值 B. 等于该市的平均值 C. 低于该市的平均值 D. 与该市的平均值差不多 E. 无法确定

2. 某研究者抽样调查甲市22名20岁以上男子身高情况,测得平均值为174.1cm,标准差为8.2cm;抽样调查乙市30名20岁以上男子,测得平均身高为172.4cm,标准差为7.8cm。按照α=0.05检验水准,本资料满足方差齐性。甲乙两市20岁以上男子平均身高的关系是 。(t0.05/2,50=2.009)
A. 甲市高于乙市 B. 甲市等于乙市 C. 甲市低于乙市
D. 甲乙两市差不多 E. 无法确定

3. 已知某病用某传统药物治疗,治愈率一般为85%,今采用某新药治疗该种病患者150人,结果治愈138人。按照α=0.05检验水准,可认为新药与传统药物的治愈率的关系是 。
A. 新药高于传统药物 B. 新药等于传统药物 C. 新药低于传统药物
D. 两种药物差不多 E. 无法确定


4. 某研究者研究一新疗法治疗糖尿病,已知传统疗法尿糖降低率一般为82%,今用新法共治疗200人,结果症状改善(尿糖降低)者167人。按照α=0.05检验水准,可认为新疗法与传统疗法的关系是 。
A. 新疗法好于传统疗法 B. 新疗法与传统疗法完全相同
C. 新疗法差于传统疗法 D. 两种疗法差不多 E. 无法确定

㈡ B1型:以下提供若干组题目,每一组题目前列出A、B、C、D、E五个备选答案,请从中为每一道题目选择一个最佳答案。某个备选答案可被选择一次、多次或不被选择。
(1~4题共用备选答案)
A. P<0.05
B. 0.05>P>0.01
C. P>0.01
D. P<0.01
E. P>0.05
1. 单侧检验,当t<t0.05,n-1时, 。
2. 单侧检验,当t0.05,n-1<t<t0.01,n-1时, 。
3. 单侧检验,当t>t0.01,n-1时, 。
4. 单侧检验,当t>t0.05,n-1时, 。
(5~7题共用备选答案)
A. 个体变异
B. 抽样误差
C. 总体均数不同
D. 抽样误差和总体均数不同
E. 抽样误差或总体均数不同
5. 某单位普查得男职工的红细胞数的均数为5.036×1012/L,标准差为0.499×1012/L。其中,标准差反映的是 。
6. 从该单位随机抽取25名男职工的红细胞数的数据,求得均数为4.924×1012/L,
标准差为0.877×1012/L,则4.924×1012/L与上题中5.036×1012/L不同,主要原因是 。(t0.05/2,24=2.064)
7. 又从该单位随机抽取25名女职工,测得其红细胞数的均数为4.284×1012/L,
标准差为0.354×1012/L,则4.284×1012/L与上题中4.924×1012/L不同,主要原因是 。(本题满足方差齐性;t0.05/2,48=2.011)

[参考答案]
选择题
㈠ 1. B 2. B 3. C 4. D
㈡ 1. A 2. D 3. A 4. D
㈢ 1. E 2. B 3. D 4. A 5. A 6. B 7. C

(陶育纯,刘钢)

相关主题
文本预览
相关文档 最新文档