中国医科大学研究生医学统计学第五讲计数资料与卡方检验2
- 格式:ppt
- 大小:3.70 MB
- 文档页数:67
第一页PPT:同学们好,我们今天来一起学习卡方检验的基本思想。
第二页PPT:我们看一个研究案例,某神经内科医师欲比较A、B两种药物治疗脑血栓病人的疗效,将病情轻重、病程相近且满足实验人选标准的200例脑血管栓塞患者随机分为两组,结果见表1。
问两药治疗近期有效率是否有差别?请同学们思考一个问题,结合已学的知识关于两个率的比较我们会使用什么方法呢,那我们继续带着这个问题进入到我们今天的课程学习。
第三页PPT:这节课需要掌握的理论知识有:1.X2检验的定义、主要用途2.X2分布、X2检验的基本思想(这是重点内容)以及应用完全随机设计的四格表X2检验方法是我们这节课的难点内容。
第四页PPT:离散型概率分布有二项分布和泊松分布基于二项分布的假设检验方法可以做两样本率比较的检验问题,条件是np、n(1-p)均大于5,可以做Z检验进行,也是解决我们的案例问题。
第五页PPT:在医学研究中,进行两组或多组样本的总体率(或构成比)之间的差别是否具有统计学意义,X2检验(chi-square test)是解决此类问题较为常用的统计方法,。
X2检验是英国统计学家K.Pearson提出的一种具有广泛用途的假设检验方法,常用于分类变量资料的统计推断。
第六页PPT:X2检验主要用于:1.推断两个及多个总体率或总体构成比之间有无差别2.两种属性或两个变量之间有无关联性3.频数分布的拟合优度检验4.百分率线性趋势检验第七页PPT:我们来继续看我们的案例,两药有效率的比较问题。
表中我们A 药、B药的有效和无效分别为99、5、75、21,我们可以用a.b.c.d 来表示,表中其余的数据是由abcd这4个数据推算出来,我们习惯将这种资料形式称为四格表。
为什么叫四个表因为它有效的就是四个格子。
a.b.c.d是我们实际观察所得到的频数,我们叫实际频数(actual frequency),用A表示。
根据我们的研究目的,我们要比较两个率是否有差别的问题。
卡方检验(计数资料)四格表资料的卡方检验四格表资料的卡方检验用于进行两个率或两个构成比的比较。
1. 专用公式:若四格表资料四个格子的频数分别为a,b,c,d,则四格表资料卡方检验的卡方值=(ad-bc)2*n/(a+b)(c+d)(a+c)(b+d),自由度v=(行数-1)(列数-1)2. 应用条件:要求样本含量应大于40且每个格子中的理论频数不应小于5。
当样本含量大于40但理论频数有小于5的情况时卡方值需要校正,当样本含量小于40时只能用确切概率法计算概率。
行X列表资料的卡方检验行X列表资料的卡方检验用于多个率或多个构成比的比较。
1. 专用公式:r行c列表资料卡方检验的卡方值=n[(A11/n1n1+A12/n1n2+...+Arc/nrnc)-1]2. 应用条件:要求每个格子中的理论频数T均大于5或1<t<1或1<t<5的格子较多时,可采用并行并列、删行删列、增大样本含量的办法使其符合行x列表资料卡方检验的应用条件。
而多个率的两两比较可采用行x 列表分割的办法。
列联表资料的卡方检验:同一组对象,观察每一个个体对两种分类方法的表现,结果构成双向交叉排列的统计表就是列联表。
1. R*C 列联表的卡方检验:R*C 列联表的卡方检验用于R*C列联表的相关分析,卡方值的计算和检验过程与行X列表资料的卡方检验相同。
2. 2*2列联表的卡方检验:2*2列联表的卡方检验又称配对记数资料或配对四格表资料的卡方检验,根据卡方值计算公式的不同,可以达到不同的目的。
当用一般四格表的卡方检验计算时,卡方值=(ad-bc)2n/(a+b)(c+d)(a+c)(b+d),此时用于进行配对四格表的相关分析,如考察两种检验方法的结果有无关系;当卡方值=(|b-c|-1)2/(b+c)时,此时卡方检验用来进行四格表的差异检验,如考察两种检验方法的检出率有无差别。
列联表卡方检验应用中的注意事项同R*C表的卡方检验相同。
医学统计方法之卡方检验卡方检验,又称卡方分布检验(Chi-Square Test),是一种常用的统计方法,用于检验两个或多个分类变量之间是否存在显著差异。
本文将详细介绍卡方检验的原理、应用范围以及具体的步骤。
一、原理:卡方检验的原理是基于卡方分布的性质。
卡方分布是指具有自由度的正态分布的平方和,记为χ^2(k),其中k为自由度。
在卡方检验中,我们将观察到的频数与理论预期频数进行比较,从而判断两个或多个分类变量之间的差异是否显著。
二、应用范围:卡方检验广泛应用于医学研究中的数据分析,尤其是在对两个或多个分类变量之间的关联进行检验时。
常见的应用场景包括但不限于以下几种:1.检验观察频数与理论预期频数之间的差异,以判断观察结果是否与理论预期相符。
2.检验两个或多个分类变量之间的关联性,以确定它们之间是否存在显著的相关性。
3.比较两个或多个群体在一个或多个分类变量上的分布差异,从而判断它们之间是否存在显著差异。
三、步骤:卡方检验的主要步骤包括以下几个:1. 建立假设:首先需要明确检验的假设。
在卡方检验中,通常有两种假设:“原假设”(null hypothesis,H0)和“备择假设”(alternative hypothesis,H1)。
原假设通常表示没有差异或关联,备择假设则表示存在差异或关联。
2.计算期望频数:根据原假设,计算出理论预期频数。
理论预期频数是基于既定的分布假设和样本总体的参数计算得出的。
3.计算卡方值:将观察频数与理论预期频数进行比较,计算出卡方值。
卡方值是观察频数与理论预期频数之间的差异的平方和。
4.确定自由度:根据检验问题的具体情况确定自由度。
在卡方检验中,自由度通常由分类变量的水平数目决定。
5.查表找出p值:根据卡方分布表,找出相应自由度下的临界值。
将计算得到的卡方值与临界值进行比较,确定其显著性水平。
p值是指在原假设成立的前提下,观察到的差异大于或等于当前差异的概率。
6.做出判断:根据p值与显著性水平的比较,做出判断是否拒绝原假设。