四格表资料的Fisher确切概率法
- 格式:ppt
- 大小:962.00 KB
- 文档页数:79
spss中怎样进行fisher精确概率法统计最短距离法是把两个类之间的距离定义为一个类中的所有案例与另一类中的所有案例之间的距离最小者.缺点是它有链接聚合的趋势,因为类与类之间的距离为所有距离中最短者,两类合并以后,它与其他类之间的距离缩小了,这样容易形成一个较大的类.所以此方法效果并不好,实际中不太用. 2.最长距离法是把类与类之间的距离定义为两类中离得最远的两个案例之间的距离.最长距离法克服了最短距离法链接聚合的缺点,两类合并后与其他类的距离是原来两个类中的距离最大者,加大了合并后的类与其他类的距离. 3.平均联结法,最短最长距离法都只用两个案例之间的距离来确定两类之间的距离,没有充分利用所有案例的信息,平均联结法把两类之间的距离定义为两类中所有案例之间距离的平均值,不再依赖于特殊点之间的距离,有把方差小的类聚到一起的趋势,效果较好,应用较广泛. 4.重心法,把两类之间的距离定义为两类重心之间的距离,每一类的重心是该类中所有案例在各个变量的均值所代表的点.与上面三种不同的是,每合并一次都要重新计算重心.重心法也较少受到特殊点的影响.重心法要求用欧氏距离,其主要缺点是在聚类过程中,不能保证合并的类之间的距离呈单调增加的趋势,也即本次合并的两类之间的距离可能小于上一次合并的两类之间的距离. 5.离差平方和法,也称沃尔德法.思想是同一类内案例的离差平方和应该较小,不同类之间案例的离差平方和应该较大.求解过程是首先使每个案例自成一类,每一步使离差平方和增加最小的两类合并为一类,直到所有的案例都归为一类为止.采用欧氏距离,它倾向于把案例数少的类聚到一起,发现规模和形状大致相同的类.此方法效果较好,使用较广.个独立样本率比较的χ2检验属四格表资料χ2检验。
这类资料在医学研究中较为多见。
例如比较两种方法治疗某种疾病的有效率是否相同?治疗结果如下:有效无效有效率(%)试验组12 1 92.31对照组 3 8 27.27可以在SPSS中进行统计分析,具体操作详见附件中的.EXE文件。
spss中怎样进行fisher精确概率法统计最短距离法是把两个类之间的距离定义为一个类中的所有案例与另一类中的所有案例之间的距离最小者.缺点是它有链接聚合的趋势,因为类与类之间的距离为所有距离中最短者,两类合并以后,它与其他类之间的距离缩小了,这样容易形成一个较大的类.所以此方法效果并不好,实际中不太用. 2.最长距离法是把类与类之间的距离定义为两类中离得最远的两个案例之间的距离.最长距离法克服了最短距离法链接聚合的缺点,两类合并后与其他类的距离是原来两个类中的距离最大者,加大了合并后的类与其他类的距离. 3.平均联结法,最短最长距离法都只用两个案例之间的距离来确定两类之间的距离,没有充分利用所有案例的信息,平均联结法把两类之间的距离定义为两类中所有案例之间距离的平均值,不再依赖于特殊点之间的距离,有把方差小的类聚到一起的趋势,效果较好,应用较广泛. 4.重心法,把两类之间的距离定义为两类重心之间的距离,每一类的重心是该类中所有案例在各个变量的均值所代表的点.与上面三种不同的是,每合并一次都要重新计算重心.重心法也较少受到特殊点的影响.重心法要求用欧氏距离,其主要缺点是在聚类过程中,不能保证合并的类之间的距离呈单调增加的趋势,也即本次合并的两类之间的距离可能小于上一次合并的两类之间的距离.5.离差平方和法,也称沃尔德法.思想是同一类内案例的离差平方和应该较小,不同类之间案例的离差平方和应该较大.求解过程是首先使每个案例自成一类,每一步使离差平方和增加最小的两类合并为一类,直到所有的案例都归为一类为止.采用欧氏距离,它倾向于把案例数少的类聚到一起,发现规模和形状大致相同的类.此方法效果较好,使用较广.个独立样本率比较的χ2检验属四格表资料χ2检验。
这类资料在医学研究中较为多见。
例如比较两种方法治疗某种疾病的有效率是否相同治疗结果如下:有效无效有效率(%)试验组 12 1对照组 3 8可以在SPSS中进行统计分析,具体操作详见附件中的.EXE文件。
定性资料常用的统计学方法一、χ2检验χ2检验(chi-square test)是一种主要用于分析分类变量数据的假设检验方法,该方法主要目的是推断两个或多个总体率或构成比之间有无差别。
(一)四格表资料的χ2检验例17:为了解吲达帕胺片治疗原发性高血压的疗效,将70名高血压患者随机分为两组,试验组用吲达帕胺片加辅助治疗,对照组用安慰剂加辅助治疗,观察结果见表4 -5-1,试分析吲达帕胺片治疗原发性高血压的有效性。
表4 -5-1 两种疗法治疗原发性高血压的疗效1.四格表χ2检验的原理:对于四格表资料,χ2检验的基本公式为:式中,A为实际频数(actual frequency),T为理论频数(theoreticalfrequency)。
理论频数T根据检验假设H0:π1=π2确定,其中π1和π2分别为两组的总体率。
计算理论频数T的公式为:式中Tij 为第i行第j列的理论频数,ni+和n+j分别为相应行与列的周边合计数,n为总例数。
现以例17为例说明χ2检验的步骤:(1)建立检验假设并确定检验水准。
H0:π1=π2,即试验组与对照组的总体有效率相等H1:π1≠π2,即试验组与对照组的总体有效率不等α=0.05(2)计算检验统计量。
按式(4 -5-2)计算T11,然后利用四格表的各行列的合计数计算T12、T21和T22,即T11=(44×41)/70=25.77,T12=44-25.77=18.23T21=41-25.77=15.23,T22=26-15.23=10.77按式(4 -5-3)计算χ2值(3)确定P值,作出推断结论。
以ν=1查χ2分布界值表,得P<0.005。
按α=0.05水准,拒绝H,接受H1,可以认为两组治疗原发性高血压的总体有效率不等,即可以认为吲达帕胺片治疗原发性高血压优于对照组。
2.四格表资料χ2检验的专用公式:在对两样本率比较时,当总例数n≥40且所有格子的T≥5时,可用χ2检验的通用公式(4 -5-1)。
四格表资料的fisher确切概率法公式
我们要了解四格表资料的Fisher确切概率法公式。
首先,我们需要了解什么是四格表资料和Fisher确切概率法。
四格表资料是指一个包含四个单元格的数据表格,通常用于展示两个分类变量之间的关系。
Fisher确切概率法是一种用于计算四格表中每个单元格概率的方法。
假设四格表的四个单元格分别为 A, B, C 和 D。
则Fisher确切概率法公式为:
P(A) = (a+b+c)!(a+b+c+d)! / (a!b!c!d!),
P(B) = (a+c)!(a+c+d)! / (a!b!c!d!),
P(C) = (a+b)!(a+b+d)! / (a!b!c!d!),
P(D) = (b+c)!(a+b+c+d)! / (a!b!c!d!)。
其中,a, b, c 和 d 分别表示四格表中的四个单元格的计数。
这个公式可以用于计算四格表中每个单元格的概率,从而帮助我们了解两个分类变量之间的关系。
第三节四格表资料的Fisher确切概率法前面提及,当四格表资料中出现久,或,或用公式(8-1)与公式(8-4)计算出工值后所得的概率巴:::二时,需改用四格表资料的Fisher确切概率(Fisher probabilities in 2 x 2 table)。
该法是由R.A.Fisher(1934 年)提出的,其理论依据是超几何分布(hypergeometric distributen) ,并非工检验的范畴但由于在实际应用中常用它作为四格表资料假设检验的补充,故把此法列入本章<下面以例8-1介绍其基本思想与检验步骤。
例8-1某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果,将33例HBsAg阳性孕妇随机分为预防注射组和非预防组,结果见表8-3。
问两组新生儿的HBV总体感染率有无差别?表8-3 两组新生儿HBV感染率的比较组别阳性阴性合计感染率(%)预防注射组 4 18 22 18.18非预防组 5 6 11 45.45合计9 24 33 27.27、基本思想在四格表周边合计数固定不变的条件下,计算表内4个实际频数变动时的各种组合之概率厂;再按检验假设用单侧或双侧的累计概率匸,依据所取的检验水准- 做出推断。
1 •各组合概率厂的计算在四格表周边合计数不变的条件下,表内4个实际频数变动的组合数共有“周边合计中最小数+1 ”个。
如例7-4,表内4个实际频数变动的组合数共有卢-1-个,依次为:(1) (2) (3) (4) (5)0 22 1 21 2 20 3 19 4 189 2 8 3 7 4 6 5 5 6ad-bc = -198 ad-bc = -165 ad-bc =:-132 ad-bc =-99 ad-bc = -66⑹(7) (8) (9) (10)5 176 167 158 149 134 7 3 8 2 9 1 10 0 11ad-bc = -33 ad-bc =0 ad-bc =33 ad-bc =66 ad-bc = 99各组合的概率'服从超几何分布,其和为1。