四格表资料的Fisher确切概率法

格式：ppt
大小：962.00 KB
文档页数：79

下载文档原格式

spss中怎样进行fisher精确概率法统计

spss中怎样进行fisher精确概率法统计最短距离法是把两个类之间的距离定义为一个类中的所有案例与另一类中的所有案例之间的距离最小者.缺点是它有链接聚合的趋势,因为类与类之间的距离为所有距离中最短者,两类合并以后,它与其他类之间的距离缩小了,这样容易形成一个较大的类.所以此方法效果并不好,实际中不太用. 2.最长距离法是把类与类之间的距离定义为两类中离得最远的两个案例之间的距离.最长距离法克服了最短距离法链接聚合的缺点,两类合并后与其他类的距离是原来两个类中的距离最大者,加大了合并后的类与其他类的距离. 3.平均联结法,最短最长距离法都只用两个案例之间的距离来确定两类之间的距离,没有充分利用所有案例的信息,平均联结法把两类之间的距离定义为两类中所有案例之间距离的平均值,不再依赖于特殊点之间的距离,有把方差小的类聚到一起的趋势,效果较好,应用较广泛. 4.重心法,把两类之间的距离定义为两类重心之间的距离,每一类的重心是该类中所有案例在各个变量的均值所代表的点.与上面三种不同的是,每合并一次都要重新计算重心.重心法也较少受到特殊点的影响.重心法要求用欧氏距离,其主要缺点是在聚类过程中,不能保证合并的类之间的距离呈单调增加的趋势,也即本次合并的两类之间的距离可能小于上一次合并的两类之间的距离. 5.离差平方和法,也称沃尔德法.思想是同一类内案例的离差平方和应该较小,不同类之间案例的离差平方和应该较大.求解过程是首先使每个案例自成一类,每一步使离差平方和增加最小的两类合并为一类,直到所有的案例都归为一类为止.采用欧氏距离,它倾向于把案例数少的类聚到一起,发现规模和形状大致相同的类.此方法效果较好,使用较广.个独立样本率比较的χ2检验属四格表资料χ2检验。

这类资料在医学研究中较为多见。

例如比较两种方法治疗某种疾病的有效率是否相同？治疗结果如下：有效无效有效率（％）试验组12 1 92.31对照组 3 8 27.27可以在SPSS中进行统计分析，具体操作详见附件中的.EXE文件。

spss中怎样进行fisher精确概率法统计

spss中怎样进行fisher精确概率法统计最短距离法是把两个类之间的距离定义为一个类中的所有案例与另一类中的所有案例之间的距离最小者.缺点是它有链接聚合的趋势,因为类与类之间的距离为所有距离中最短者,两类合并以后,它与其他类之间的距离缩小了,这样容易形成一个较大的类.所以此方法效果并不好,实际中不太用. 2.最长距离法是把类与类之间的距离定义为两类中离得最远的两个案例之间的距离.最长距离法克服了最短距离法链接聚合的缺点,两类合并后与其他类的距离是原来两个类中的距离最大者,加大了合并后的类与其他类的距离. 3.平均联结法,最短最长距离法都只用两个案例之间的距离来确定两类之间的距离,没有充分利用所有案例的信息,平均联结法把两类之间的距离定义为两类中所有案例之间距离的平均值,不再依赖于特殊点之间的距离,有把方差小的类聚到一起的趋势,效果较好,应用较广泛. 4.重心法,把两类之间的距离定义为两类重心之间的距离,每一类的重心是该类中所有案例在各个变量的均值所代表的点.与上面三种不同的是,每合并一次都要重新计算重心.重心法也较少受到特殊点的影响.重心法要求用欧氏距离,其主要缺点是在聚类过程中,不能保证合并的类之间的距离呈单调增加的趋势,也即本次合并的两类之间的距离可能小于上一次合并的两类之间的距离.5.离差平方和法,也称沃尔德法.思想是同一类内案例的离差平方和应该较小,不同类之间案例的离差平方和应该较大.求解过程是首先使每个案例自成一类,每一步使离差平方和增加最小的两类合并为一类,直到所有的案例都归为一类为止.采用欧氏距离,它倾向于把案例数少的类聚到一起,发现规模和形状大致相同的类.此方法效果较好,使用较广.个独立样本率比较的χ2检验属四格表资料χ2检验。

这类资料在医学研究中较为多见。

例如比较两种方法治疗某种疾病的有效率是否相同治疗结果如下：有效无效有效率（％）试验组 12 1对照组 3 8可以在SPSS中进行统计分析，具体操作详见附件中的.EXE文件。

定性资料常用的统计学方法

定性资料常用的统计学方法一、χ2检验χ2检验（chi-square test）是一种主要用于分析分类变量数据的假设检验方法，该方法主要目的是推断两个或多个总体率或构成比之间有无差别。

（一）四格表资料的χ2检验例17：为了解吲达帕胺片治疗原发性高血压的疗效，将70名高血压患者随机分为两组，试验组用吲达帕胺片加辅助治疗，对照组用安慰剂加辅助治疗，观察结果见表4 -5-1，试分析吲达帕胺片治疗原发性高血压的有效性。

表4 -5-1 两种疗法治疗原发性高血压的疗效1.四格表χ2检验的原理：对于四格表资料，χ2检验的基本公式为：式中，A为实际频数（actual frequency），T为理论频数（theoreticalfrequency）。

理论频数T根据检验假设H0：π1=π2确定，其中π1和π2分别为两组的总体率。

计算理论频数T的公式为：式中Tij 为第i行第j列的理论频数，ni+和n+j分别为相应行与列的周边合计数，n为总例数。

现以例17为例说明χ2检验的步骤：（1）建立检验假设并确定检验水准。

H0：π1=π2，即试验组与对照组的总体有效率相等H1：π1≠π2，即试验组与对照组的总体有效率不等α=0.05（2）计算检验统计量。

按式（4 -5-2）计算T11，然后利用四格表的各行列的合计数计算T12、T21和T22，即T11=（44×41）／70=25.77，T12=44-25.77=18.23T21=41-25.77=15.23，T22=26-15.23=10.77按式（4 -5-3）计算χ2值（3）确定P值，作出推断结论。

以ν=1查χ2分布界值表，得P＜0.005。

按α=0.05水准，拒绝H，接受H1，可以认为两组治疗原发性高血压的总体有效率不等，即可以认为吲达帕胺片治疗原发性高血压优于对照组。

2.四格表资料χ2检验的专用公式：在对两样本率比较时，当总例数n≥40且所有格子的T≥5时，可用χ2检验的通用公式（4 -5-1）。

四格表资料的Fisher确切概率法资料讲解

(goodness of fit)中也发现了这一相同的分布，可用于检验资料的实际频数和理论频数是否相符等问题。
33
2 分布的密度函数
f
(
2)
1
2(
)
(
2
2
1 2
)2 e 2
2
0 2 , 1,2,3,...
34
2 分布曲线
2 分布
(=1,2,3,4,6)
卡方检验基本思想
2 分布的概念
例11 某省肿瘤研究所分别在甲、乙两县随机抽查10万育龄妇女，进行追踪观察。三年中甲县死于宫颈癌的有28人，乙县死于宫颈癌者47人。问甲乙两县宫颈癌死亡率有无差别？
23
两样本阳性数的比较
例12 某车间在改革生产工艺前，随机测量三次车间空气中的粉尘浓度，每次取1升空气，分别测得有38、29、36颗粉尘；改革生产工艺后又测量3 次，每次取1升空气，分别测得有25、18、21颗粉尘。问工艺改革前后粉尘浓度是否有变化？
2分布的分位数
2
2 ,
2
2 ,
P P
2(,)
38
卡方检验基本思想
2. 2 检验的基本思想(以两个样本率的比较为例)
例14 某院欲比较异梨醇口服液（试验组）和氢氯噻嗪+地塞米松（对照组）降低颅内压的疗效。将200例颅内压增高症患者随机分为两组，结果如下。问两组降低颅内压的总体有效
率有无差别？
p1=70/100=0.70 p2=60/120=0.50 pc =(70+60)/(100+120)=0.5909
12
☆二项分布的应用☆
1. 估计总体率的可信区间（1）查表法 (n50，特别是p远离0.5时) （2）正态近似法 (n>50 且 np5 和n(1-p) 5 ) 2. 样本率与已知总体率比较的假设检验（1）直接计算概率法（ π0偏离0.5较远, X 较小, 单侧检验）

四格表的确切概率法

例7-6 设有56份咽喉涂抹标本，把每一份标本一分为二，依同样的条件分别接种于甲、乙两种白喉杆菌培养基上，观察白喉杆菌的生长情况，结果如表7-10，问两种培养基上白喉杆菌的生长概率有无差别？
表7-10 两种培养基白喉杆菌生长情况
甲培养基
阳性阴性合计
阳性
22 (a) 2 (c) 24
乙培养基阴性 18 (b) 14 (d) 32
20
由 2临界值表，
2 0.05(1)

3.84,11.25

3.84,
P

0.05,
按 0.05 水准拒绝 H0 ，差别有统计学意义，可以认为，两种培养基上白喉杆菌生长的阳性
概率不相等。鉴于甲培养基阳性频率为
40/56==71.4%，乙培养基为24/56=42.9%，可以认为，
甲培养基阳性概率高于乙培养基。
bc
（7-12）
若 b c 40,需对公式（7-14）校正公式为
2 ( b c 1)2 v 1
bc
（7-13）
对于例7-6数据，因为 b c 40, 按式（7-15）计算
2 (18 2 1)2 225 11.25, v 1
18 2
检验水准 0.05
变量1
1 2 … R 合计
表7-13 配对设计下多分类资料的R×R列联表
变量2
1
2
…
R
合计
A11
A12
…
A1c
n1（固定值）
A21
A22
…
A2c
n2（固定值）
…
…
…
…
…
AR1
AR2

四格表资料的fisher确切概率法公式

四格表资料的fisher确切概率法公式
我们要了解四格表资料的Fisher确切概率法公式。

首先，我们需要了解什么是四格表资料和Fisher确切概率法。

四格表资料是指一个包含四个单元格的数据表格，通常用于展示两个分类变量之间的关系。

Fisher确切概率法是一种用于计算四格表中每个单元格概率的方法。

假设四格表的四个单元格分别为 A, B, C 和 D。

则Fisher确切概率法公式为：
P(A) = (a+b+c)!(a+b+c+d)! / (a!b!c!d!)，
P(B) = (a+c)!(a+c+d)! / (a!b!c!d!)，
P(C) = (a+b)!(a+b+d)! / (a!b!c!d!)，
P(D) = (b+c)!(a+b+c+d)! / (a!b!c!d!)。

其中，a, b, c 和 d 分别表示四格表中的四个单元格的计数。

这个公式可以用于计算四格表中每个单元格的概率，从而帮助我们了解两个分类变量之间的关系。

计数资料常用检验方法

.219
1
.640
N of Valid Cases
24
a. Computed only for a 2x2 table
b. 2 cells (50.0%) have expected count less than 5. The minimum exp is 2.50.
三组疗法有效率比较
分组有效数无效数合计
在R×C表中，如T<5的格子数超过基本格子的1/5时，不能直接用R×C表公式。
两组病人某项指标分级构成
组别 I 甲组 72
II III 28 5
IV
合
计
2（1.46） 107
乙组 74
32 6
1（1.54） 113
合计 146 60 11 3
220
表中有两个基本格子的理论数小于5
处理的方法 ①增加观察单位数目 ②合并相邻的两列（或两行） ③去掉某行或某列
计数资料常用检验方法
BIM
当两组样本较大（n>100），而率又不太小时（比如np或n(1p)均大于5，此时率的分布近似正态分布），可选择u检验（或X2
检验）见公式
1.计数资料两大样本u检验
u=
p1 − p2
PQ( 1 + 1 )
n1 n2
或 u =
p1 − p2 , u = 1.96, P = 0.05
Value Pearson Chi-Square 4.326b Continuity Correctaio 4.067
Asymp. Sig. Exact Sig. Exact Sig.
df
(2-sided) (2-sided) (1-sided)

四格表卡方检验

四格表确切概率法的基本思想
在四格表周边合计固定不变的条件下，改变某一格子的实际频数，列出a、b、c、d各种组合的四格表，按公式8-9计算每个四格表的概率，然后计算单侧或双侧累积概率，并与检验水准α比较，作出是否拒绝H0的结论。
P （a b)!(c d )!(a c)!(b d )! a! b! c! d ! n!
第13页/共42页
例8-1 用专用公式计算 2 值：
2 (271 26 5 74)2 376 56.77 , df 1
276100 345 31
查
2界
值
表
，
2 0.05,1
3.84
下结论：
2
2 0.05,1
3.84;
P 0.05，按 0.05水准，
拒
绝H
，
0
接
受H
，
1
可
以
认
为
疗
效
四格表确切概率法系英国统计学家fisher于1934年提出又称fisher精切概率法fiserexacttest在四格表周边合计固定不变的条件下改变某一格子的实际频数列出abcd各种组合的四格表按公式89计算每个四格表的概率然后计算单侧或双侧累积概率并与检验水准比较作出是否拒绝h组别改善无效合计红花散1520安慰剂1417181937例83研究中药制剂红花散改善周围血管闭塞性病变患者的皮肤微循环状况以安慰剂作对照将37个病例随机分到两组结果如表85分析红花散的疗效
第6页/共42页
一、卡方检验的基本思想
例8-1 对表8-1资料推断两药的疗效有无差别
H0:
1
，即两药总体有效率相等
2
由于总体有效率未知，将两组数据合并，计算合并

Fisher确切概率法

第三节四格表资料的Fisher确切概率法前面提及，当四格表资料中出现久，或,或用公式(8-1)与公式(8-4)计算出工值后所得的概率巴:::二时，需改用四格表资料的Fisher确切概率(Fisher probabilities in 2 x 2 table)。

该法是由R.A.Fisher(1934 年)提出的，其理论依据是超几何分布(hypergeometric distributen) ，并非工检验的范畴但由于在实际应用中常用它作为四格表资料假设检验的补充，故把此法列入本章＜下面以例8-1介绍其基本思想与检验步骤。

例8-1某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果，将33例HBsAg阳性孕妇随机分为预防注射组和非预防组，结果见表8-3。

问两组新生儿的HBV总体感染率有无差别？表8-3 两组新生儿HBV感染率的比较组别阳性阴性合计感染率(%)预防注射组 4 18 22 18.18非预防组 5 6 11 45.45合计9 24 33 27.27、基本思想在四格表周边合计数固定不变的条件下，计算表内4个实际频数变动时的各种组合之概率厂；再按检验假设用单侧或双侧的累计概率匸，依据所取的检验水准- 做出推断。

1 •各组合概率厂的计算在四格表周边合计数不变的条件下，表内4个实际频数变动的组合数共有“周边合计中最小数+1 ”个。

如例7-4，表内4个实际频数变动的组合数共有卢-1-个，依次为：(1) (2) (3) (4) (5)0 22 1 21 2 20 3 19 4 189 2 8 3 7 4 6 5 5 6ad-bc = -198 ad-bc = -165 ad-bc =：-132 ad-bc =-99 ad-bc = -66⑹(7) (8) (9) (10)5 176 167 158 149 134 7 3 8 2 9 1 10 0 11ad-bc = -33 ad-bc =0 ad-bc =33 ad-bc =66 ad-bc = 99各组合的概率'服从超几何分布，其和为1。

卡方检验方法..

1 2 (

2
( )

2

2
)
2
1
e

2
2
0 2 , 1,2,3,...
17

2分布是一种连续型分布(Continuous distribution)，v 个相互独立的标准正态变量 (standard normal variable) ui (i 1,2,, ) 的平方和称为 2 变量，其分布即为 2 分布；自由度(degree of freedom)为v 。

22
第一节四格表资料χ2检验
一般四格表的基本形式 B1 A1 A2 合计 a c a+c B2 b d b+d 合计 a+b c+d n=a+b+c+d
23
表7-1 完全随机设计两样本率比较的四格表
属性处理组 1 阳性 A11 (T11) 阴性 A12 (T12) 合计
n1(固定值)
2
合计
16

(Continuous distribution)，v 个相互独立的标准正态变量(standard normal variable) 2 2 的平方和称为变量，其分布即为分布；自由度(degree of freedom) 为v 。
f ( )
2
分布是一种连续型分布
2

2
0.4
v=1
0.3
0.2
v=4 v=6
0.1
v=9
0.0 0 3 6 9 12 15
18
2分布的形状依赖于自由度ν 的大小：
① 当自由度ν≤2时，曲线呈“L”型； ② 随着ν 的增加，曲线逐渐趋于对称；

计数资料常用检验方法

b. 1 cells (25.0%) have expected count less than 5. The minimum expected coun is 2.24.
(3) 、当总例数n>40，但有理论数0<T<1，或总例数n<40，有实际观察数为0的情况，此时应采用确切概率法直接算出概率P
1
.038
Fisher's Exact Test
.043
.022
Linear-by-Linear Association
4.322
1
.038
McNemar Test
.c
N of Valid Cases
1069
a. Computed only for a 2x2 table
b. 0 cells (.0%) have expected count less than 5. The minimum expected co 180.59.
103 25.1%
高中
76 32.9%
67 37.4%
143 34.9%
大专
38 16.5%
34 19.0%
72 17.6%
本科
42 18.2%
17 9.5%
59 14.4%
研究生及以上
10 4.3%
10 2.4%
Total 231
100.0% 179
100.0% 410
100.0%
Chi-Square Tests
结果
各个格子的理论数T≥5 卡方检验: 未校正卡方值= 4.3261
概率 P = 0.0375 校正卡方值 = 4.0666
概率 P = 0.0437

07章卡方检验 2016-7-2

87.00
基本思想：可通过 2 检验的基本公式来理解。
2 (A T )2, (行数 - 1 )(列数 1 )
T
式中，A为实际频数（actual frequency），
T为理论频数（theoretical frequency）。
理论频数由下式求得：
TRC
nR nC n
式中，TRC 为第R 行C 列的理论频数 nR 为相应的行合计 nC 为相应的列合计
校正。
c2
( AT 0.5)2 T
(|ad-bc|-n)2n
c2=(a+b)(c+d)(a+2c)(b+d)
四格表资料 2 检验公式选择条件：
n40, T5，专用公式； n40, 1T5，校正公式； n40或 T1，直接计算概率。
连续性校正仅用于 1的四格表资料，当
2 时， 2 一般不作校正。
即相对应的P 值很小，若
P ，则反过来
推断A与T相差太大，超出了抽样误差允许的
范围，从而怀疑H0的正确性，继而拒绝 H0，接受其对立假设H1，即π1≠π2 。
检 2 验的自由度( )取决于可以自由取值
的基本数据的格子数目，而不是样本含量 n。四格表资料只有两行两列，=1，即在周边合计数固定的情况下，4个基本数据当中只有一个可以自由取值。
2 c
(12 2 1)2 12 2
5.79
1 ，查 2 界值表得0.01 P 0.025 。
按 0.05 检验水准拒绝H 0 ，接受H1 ，可以认为两种方法的检测结果不同，免疫荧
光法的阳性检测率较高。
第三节
四格表资料的Fisher确切概率法
条件：n 40 ，或T 1 ，或 P 时，

专升本模拟题-卫生统计学-1-3

《卫生统计学》模拟题1一、填空1、统计工作的基本步骤分为设计、搜集资料、整理资料、分析资料。

2、常用的定量资料集中趋势的描述指标有均数、几何均数、中位数。

3、正态分布N（μ，σ2）曲线下，从μ-1.96σ到μ+2.58σ的面积占曲线下总面积的百分比是97.5% 99% 。

4、方差分析的应用条件是各样本是相互独立的随机样本、各样本来自正态分布总体、各总体方差相等，即方差齐。

二、名词解释1、样本：研究中实际观测或调查的一部分个体称为样本(sample)。

2、抽样误差：抽样方法本身所引起的误差。

3、第Ⅱ类错误：检验假设H0本来不成立的，经过检验后被接受了，即“取伪”。

其发生的概率为β，属未知数。

三、问答题：1. 正态分布曲线的特征有哪些？答：（1）、集中性：正态曲线的高峰位于正中央，即均数所在的位置；（2）、对称性：正态曲线以均数为中心，左右对称，曲线两端永远不与横轴相交；（3）、均匀变动性：正态曲线由均数所在处开始，分别向左右两侧逐渐均匀下降；（4）、正态分布有两个参数，即均数μ和标准差σ，可记作N（μ，σ）：均数μ决定正态曲线的中心位置；标准差σ决定正态曲线的陡峭或扁平程度。

σ越小，曲线越陡峭；σ越大，曲线越扁平；（5）、u变换：为了便于描述和应用，常将正态变量作数据转换；2．试述标准差与变异系数的异同点。

答：相同点：标准差（standard deviation）与变异系数（variation coefficient）是常用统计量，用于反映资料的离散性，即观测值离中分散变异的性质。

不同点：变异系数是衡量资料中各观测值变异程度的另一个统计量。

当进行两个或多个资料变异程度的比较时，如果度量单位与平均数相同，可以直接利用标准差来比较。

如果单位和（或）平均数不同时，比较其变异程度就不能采用标准差，而需采用标准差与平均数的比值（相对值）来比较。

标准差与平均数的比值称为变异系数，记为C·V。

变异系数可以消除单位和（或）平均数不同对两个或多个资料变异程度比较的影响。

卫生统计学第七章卡方检验

答案解析：四个百分率做比较，资料可整理为4×2的行×列表，多个率比较的行×列表资料不适宜采用秩和检验，当满足行×列表资料χ2检验的应用条件(理论频数T<5的格子数不超过总格子数的1／5)时，可进行χ2检验，否则，可增大样本含量，或进行合理的合并或删除，使资料满足应用条件后进行χ2检验，还可直接采用Fisher精确概率检验。本题8个格子中1个格子理论数小于5，可直接进行χ2检验。
做答人数:0
做对人数:0
所占比例: 0
题号： 15 本题分数： 2
χ2检验应用范围不包括
A．两个或多个率的差别
B．两个或多个构成比的差别
C．小样本配对设计计量资料均数的比较
D．两种属性间的相关分析
E．检验频数分布的似合优度
正确答案： C
A．三个总体率不同或不全相同
B．三个总体率都不相同
C．三个样本率都不相同
D．三个样本率不同或不全相同
E．三个总体率中有两个不同
正确答案： A
答案解析：三个率比较的假设检验中，H0：三个总体率全相等，H1：三个总体率不全相等，包括三个总体率全不同或不全相同，当χ2＞χ20.01(2)，P<0.01，拒绝H0，接受H1，可认为三个总体率不同或不全相同，故答案为A。
做答人数:0
做对人数:0
所占比例: 0
题号： 12 本题分数： 2
对于总合计数n为400的4个样本率的资料做χ2检验，其自由度为
A． 399
B． 396
C． 1
D． 4
E． 3
正确答案： E
答案解析：4个样本率的比较，资料可整理为4×2的行×列表，χ2统计量所对应的自由度为(4-1)×(2-1)=3。

Fisher确切概率法

第三节四格表资料的Fisher确切概率法前面提及，当四格表资料中出现，或，或用公式(8-1)与公式(8-4)计算出值后所得的概率时，需改用四格表资料的Fisher确切概率(Fisher probabilities in 2×2 table)。

该法是由，其理论依据是超几何分布(hypergeometric distribution)，并非检验的范畴。

但由于在实际应用中常用它作为四格表资料假设检验的补充，故把此法列入本章。

下面以例8-1介绍其基本思想与检验步骤。

例8-1 某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果，将33例HBsAg阳性孕妇随机分为预防注射组和非预防组，结果见表8-3。

问两组新生儿的HBV总体感染率有无差别？表8-3两组新生儿HBV感染率的比较组别阳性阴性合计感染率（%）预防注射组 4 18 22 18.18非预防组 5 6 11 45.45合计9 24 33 27.27一、基本思想在四格表周边合计数固定不变的条件下，计算表内4个实际频数变动时的各种组合之概率；再按检验假设用单侧或双侧的累计概率，依据所取的检验水准做出推断。

1．各组合概率的计算在四格表周边合计数不变的条件下，表内4个实际频数, ,,变动的组合数共有“周边合计中最小数+1”个。

如例7-4，表内4个实际频数变动的组合数共有个，依次为：(1) (2) (3) (4) (5)0 22 1 21 2 20 3 19 4 189 2 8 3 7 4 6 5 5 6ad-bc= -198ad-bc= -165ad-bc= -132ad-bc =-99ad-bc= -66(6) (7) (8) (9) (10)5 176 167 158 149 134 7 3 8 2 9 1 10 0 11ad-bc= -33ad-bc=0ad-bc=33ad-bc=66ad-bc= 99各组合的概率服从超几何分布，其和为1。

第六节四格表资料的确切概率法

2.卡方检验的基本原理
若检验假设H0:π1=π2成立，四个格子的实际频数A与理论频数T相差不应该很大，即统计量该很大。如果
2
不应
2值很大，即相对应的 P 值很小，
若 P ，则反过来推断A与T相差太大，超出了抽样
误差允许的范围，从而怀疑 H0的正确性，继而拒绝
H0，接受其对立假设H1，即π1≠π2。
f
(1) 2.65 | 2.95 | 3.25 | 3.55 | 3.85 | 4.15 | 4.45 | 4.75 | 5.05 | 5.35 | 5.65
(2) 5 5 4 19 12 12 24 10 5 4 100
(3) -1.85 -1.41 -0.96 -0.51 -0.07 0.38 0.82 1.27 1.71
医学生，测定空腹血糖值 (mmol/L)，其频数分布如表 6-1 中第 (1)栏和第 (2)栏所示，试用 2 检验判断该资料是否符合正态分布。
H0：空腹血糖的实际频数与正态分布的理论频数符合
H1 ： … 不符合
15
18
性质:若 (1 ), ( 2 ) 互相独立,
2 2
则
(1 ) ( 2 ) 服从分布, 自由度 1 2
2 2 2
( 1 ) ( 2 ) 服从分布, 自由度 1 2
2 2 2
第二节拟合优度检验
类别或组段观察频数理论频数
一、四格表（2×2表）卡方检验
二、行×列表卡方检验三、配对四格表卡方检验
一、四格表 (fourfold table)资料的 2 检验 (两个样本率的比较 )

医学统计学卡方检验

02 P =P1+ P2 + P3 + P6 =0.370 ＞ 0.05，不拒绝H0 。
03 左侧概率为P =P1+ P2 + P3 =0.316 ，右侧概率为P =P3+ P4 + P5 + P6 =0.929，故单侧检验P值为0.316。
Part 02.
配对四格表资料的检验
χ2
概述
计数资料的配对设计常用于两种检验方法、培养方法、诊断方法的比较。特点是对样本中各观察单位分别用两种方法处理，然后观察两种处理方法的某两分类变量的计数结果，整理为
的条件下，利用超几何分布
Fisher确切概率法的基本思想
（hypergeometric distribution）公式直接计算表内四个格子数据的各种组合的概率，然后计算单侧或双侧
“！”为阶乘符号， n !=1×2×…×n，0 !=1， ∑Pi=1。
累计概率，并与检验水准比较，
P( ab)( c 作! 出 a 是! 否db 拒! ) 绝cH! ( 0a d 的! ! 结论n! 。c)( b!d)!
当T<1或n<40，四格表资料χ2检验结果可能会有偏性，需采用Fisher确切检验进行分析。该法由R. A. Fisher提出，且直接计算概率，因此也叫Fisher确切概率检验（Fisher’s exact probability test）。
四格表资料的Fisher确切概率法
在四格表周边合计数固定不变
否有差别？
⑴设H0 ：π1=π2 ，即两药有效率相同；H1 ： π1≠π2 α=0.05
⑵n>40，Tmin>5
2 5 5 2 . 1 7 2 8 1 1 9 . 8 3 2 2 3 3 9 . 8 3 2 2 3 8 . 1 2 8 6 . 48 5 . 1 7 81 . 8 3 23 . 8 3 28 . 18

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

近似
u
n 0 1 0
X n 0
p 0 u 0 (1 0 ) / n
8
样本率与总体率的比较-----正态近似法
例3 据报道，某常规疗法对某种疾病的治愈率为65%。现
某医生用中西医结合疗法治疗了100例该病患者，共治愈80
人。问该中西医结合疗法的疗效是否比常规疗法好？
（2）正态近似法（X＞50） 2. 样本平均数与已知总体平均数比较的假设检验
（1）直接计算概率法（ μ0<20, X 较小, 作单侧检验）
（2）正态近似法（ μ0≥20） 3. 两样本平均数比较的假设检验（ X1, X2 均大于20 ）（1）两样本观察单位相同（2）两样本观察单位不同
29
§3 卡方检验
5
样本率与已知总体率的比较----直接计算概率法
H0成立时，随机抽查的10人中治愈人数x 的分布
本例π0=0.80，1-π0=0.20，n=10，根据题意需求最少治愈9人的概率。
6
样本率与总体率的比较----直接计算概率法
例2 据以往经验，新生儿染色体异常率一般为1％，某医生观察了当地400名新生儿，发现有1例染色体异常，问该地新生儿染色体异常率是否低于一般？
H0(=0=50) 成立时,1小时内该装置发出的质点数的概率分布
20
样本阳性数与总体平均数的比较----直接计算概率法
例10 某省肺癌死亡率为35.2/10万，在该省某地抽查10万人，进行三年死亡回顾调查，得肺
癌死亡数为82人。已知该地人口年龄别构成与
全省基本相同。问该地肺癌死亡率与全省有无差别？
得有38、29、36颗粉尘；改革生产工艺后又测量3
次，每次取1升空气，分别测得有25、18、21颗粉
尘。问工艺改革前后粉尘浓度是否有变化？
25
两样本阳性数的比较----u检验
2. 两样本观察单位(时间、面积、容积等 )不同需先将观察单位化为相等，即分别计算出两样本阳性数的平均数。
u
X1 X2 X 1 n1 X 2 n2
表 6-1 两组降低颅内压有效率的比较
组别试验组对照组合计
有效 99(90.48) a 174 (a c)
无效 5(13.52) b 26 (b d )
合计 104 (a b) 96 (c d ) 200 (n)
23
两样本阳性数的比较
例11 某省肿瘤研究所分别在甲、乙两县随机抽查10万育龄妇女，进行追踪观察。三年中甲县死于宫颈癌的有28人，乙县死于宫颈癌者47人。问甲乙两县宫颈癌死亡率有无差别？
24
两样本阳性数的比较
例12 某车间在改革生产工艺前，随机测量三次车间空气中的粉尘浓度，每次取1升空气，分别测

根据资料的具体情况，可选用： 1. 直接计算概率法 2. 正态近似法
4
样本率与总体率的比较
1. 直接计算概率法

应用条件：π0偏离0.5较远，且阳性数X 较小作单侧检验时。例1 根据以往长期的实践，证明某常用药的

治愈率为80%。现在某种新药的临床试验中，
随机观察了10名用该新药的患者，治愈9人。问该新药的疗效是否比传统的常用药好？
Xi
u u u
2 2 1 2 2
2
ui

33
卡方检验基本思想
2 分布的拓展与应用

2 分布的概念
1875年，F. Helmet得出：来自正态总体的样本方差的分布服从 2 分布；

1900年K. Pearson又从检验分布的拟合优度 (goodness of fit)中也发现了这一相同的 2 分布，可用于检验资料的实际频数和理论频数
H0成立时, 400名新生儿中染色体异常例数的概率分布
7
样本率与总体率的比较
2. 正态近似法

应用条件：当π0不太靠近0或1，且样本含量n
足够大；或nπ0≥5且n(1-π0)≥5时，
X ~ N n 0 , n 0 1 0
近似
可利用二项分布的正态近似原理做检验。
1 0 p ~ N 0 , 0 n
（1）直接计算概率法（ π0偏离0.5较远, X 较小, 单侧检验）
n2p25 , n2(1-p2) 5
14
§2 服从Poisson分布资料的假设检验
样本阳性数与总体平均数的比较两样本阳性数的比较
15
一、样本阳性数与总体平均数的比较

目的：推断样本所代表的未知总体平均数 μ 与已知总体平均数 μ0 是否相等。根据资料的具体情况，可选用： 1. 直接计算概率法 2. 正态近似法
一、 2 检验的基本思想
二、四格表资料的 2检验三、行×列表资料的检验
2
四、配对四格表资料的 2检验五、多个样本率比较的 2分割法
六、有序分组资料的线性趋势检验
七、频数分布拟合优度的 2 检验八、四格表资料的Fisher确切概率法
30
x2 检验(chi-square test)是以 x2分布为理论依据，
17
样本阳性数与总体平均数的比较----直接计算概率法
例8 卫生标准规定, 生活饮用水大肠杆菌数不得超过3个/ml。现对某饮用水进行抽检，抽取1ml 水样培养得到5个大肠杆菌。问该水样中的大肠杆菌是否超标？
H0(=3)成立时, 每毫升水中大肠杆菌数的概率分布
18
样本阳性数与总体平均数的比较
当H0成立时, 100例患者中治愈人数的概率分布
9
样本率与总体率的比较-----正态近似法
例4 经长期临床观察, 发现胃溃疡患者发生胃出血症状的占20%。现某医院观察了304例65岁以上的老年胃溃疡患者，有96例发生胃出血症状，占31.58%。问老年胃溃疡患者是否较一般患者更易发生胃出血？
H0成立时, 304例老年胃溃疡患者中胃出血发生人数的分布
2 ③ 当自由度ν →∞时，曲线逼近于正态曲线。
38
卡方检验基本思想
2分布的分位数 (Percentile)

2分布的概念
当ν 确定后， 2分布曲线下右侧尾部的面积为 2 时，横轴上相应的 2 值，记为 , ，如下图。
实际应用时，可根据ν 由 2 界值表 (percentage
用途颇广的假设检验方法。可用于：两个或多个样本率的比较；两个或多个样本构成比的比较；两个分类变量间关联性的检验；有序分组资料的线性趋势检验；频数分布的拟合优度检验。
31
2 检验的基本思想一、

2 分布的概念
2 检验的基本思想
P 值的确定
2 检验的基本检验步骤
pc =(70+60)/(100+120)=0.5909
13
☆二项分布的应用☆
1. 估计总体率的可信区间
（1）查表法 (n50，特别是p远离0.5时) （2）正态近似法 (n>50 且 np5 和n(1-p) 5 ) 2. 样本率与已知总体率比较的假设检验（2）正态近似法(n>50 且 n05 和n(1-0) 5 ) 3. 两大样本率比较的假设检验正态近似法 n1, n2>50 且 n1p15 , n1(1-p1) 5
2. 正态近似法

当μ0≥20时， x ~ N ( 0 , 0，可利用Poisson分 )
布的正态近似原理做检验。
近似
u
X 0
0
19
样本阳性数与总体平均数的比较----直接计算概率法
例9 质量控制标准规定某装置平均每小时发出质点
数不超过50个。今抽查一次，在1小时内测得该装置
发出的质点数为58个，问该装置是否符合要求？
2 分布曲线
2 分布
(=10,20,30,50)
2分布的概念
=10 =20 =30 =50
37
卡方检验基本思想
2 分布特点

2分布的概念
2 分布的形状依赖于自由度ν 的大小：
2 ① 当自由度ν≤2时，曲线呈“L”型；
2曲线逐渐趋于对称； ② 随着ν 的增加，

16
样本阳性数与总体平均数的比较
1. 直接计算概率法

应用条件：μ0<20，且样本阳性数 X 较小作单侧检
验时。

例7 已知接种某疫苗时，一般严重反应率为1‰。现用某批号的该种疫苗接种150人，有2人发生严重
反应，问该批号疫苗的严重反应率是否高于一般？
H0(＝0.001)成立时150人中发生严重反应人数的概率分布
21
二、两样本阳性数的比较

目的：推断两个样本各自代表的两总体平
均数是否相等。

当两个样本阳性数X1, X2 均大于20时，可
用 u 检验。
22
两样本阳性数的比较----u检验
1. 两样本观察单位(时间、面积、容积等 )相同
X1 X 2 u X1 X 2
或
X 1 X 2 u X 1 X 2
32
卡方检验基本思想
2分布的概念 1.

2分布是一种连续型分布(Continuous distribution)，
v 个相互独立的标准正态变量(standard normal
2 变量， variable) ui (i 1,2,, ) 的平方和称为
其分布即为为v 。分布；自由度(degree of freedom) 2
10
二、两样本率比较

目的：推断两个样本各自代表的两总体率是否相等
应用条件：当两个样本率均满足正态近似条件时，
可用u检验。
p1 p2 u s p1 p2

四格表资料的Fisher确切概率法

合集下载

spss中怎样进行fisher精确概率法统计

spss中怎样进行fisher精确概率法统计

定性资料常用的统计学方法

四格表资料的Fisher确切概率法资料讲解

四格表的确切概率法

四格表资料的fisher确切概率法公式

计数资料常用检验方法

四格表卡方检验

Fisher确切概率法

卡方检验方法..

计数资料常用检验方法

07章卡方检验 2016-7-2

专升本模拟题-卫生统计学-1-3

卫生统计学第七章卡方检验

Fisher确切概率法

第六节四格表资料的确切概率法

医学统计学卡方检验

文档推荐

最新文档

四格表资料的Fisher确切概率法

合集下载

spss中怎样进行fisher精确概率法统计

spss中怎样进行fisher精确概率法统计

定性资料常用的统计学方法

四格表资料的Fisher确切概率法资料讲解

四格表的确切概率法

四格表资料的fisher确切概率法公式

计数资料常用检验方法

四格表卡方检验

Fisher确切概率法

卡方检验方法..

计数资料常用检验方法

07章 卡方检验 2016-7-2

专升本模拟题-卫生统计学-1-3

卫生统计学第七章卡方检验

Fisher确切概率法

第六节 四格表资料的确切概率法

医学统计学卡方检验

文档推荐

最新文档

07章卡方检验 2016-7-2

第六节四格表资料的确切概率法