第六章 卡方检验
- 格式:ppt
- 大小:182.50 KB
- 文档页数:19
Stata第六章卡方检验本节STATA命令摘要[by分层变量名:]tab2变量1变量2[,allchi2exactcellcolumnrow]tabi#11#12[...]\[#21#22[...][\...][,allchi2exactcellcolumnrow]•列联表分析STATA命令:[by分层变量:]tab2变量1变量2[,allchi2lichi2exactcellcolumnrow]上述命令中,变量1为行计数变量;变量2为列计数变量;all表示卡方(c2)检验,似然比(likelihoodratio)检验以及一些统计描述指标和检验,但不包括Fisher精确检验;exact表示Fisher精确检验;chi2表示c2检验;lichi2表示likelihoodratio检验;cell表示输出的列联表中显示每个观察计数值占该列联表总观察计数值的比例;row表示输出的列联表中显示每个观察计数值占该观察计数值所在行的各观察计数值总数的比例;coloumn表示输出的列联表中显示每个观察计数值占该观察计数值所在的列各观察计数值总数的比例。
例:某地调查肝癌病人与健康人饮用“醋冷水”(一种以冷水和醋为主要成分的饮料)的习惯。
用group=1表示肝癌组患者和group=2表示健康人;用custom=1表示经常饮用醋冷水;custom=2表示偶尔饮用醋冷水和custom=3表示从不饮用醋冷水。
具体资料为:(摘自医学统计方法,金丕焕主编,p163)。
组别经常偶尔从不饮用合计肝癌组26442898健康组28491794合计549345192显然这是一个病例对照研究,所以每组人数是人为确定的,因此只需计算各组"经常","偶而"和"从不饮用"占本组的频数以及检验患肝癌是否与饮水习惯有关。
tab2groupcustom,rowchi2->tabulationofgroupbycustom|customgroup|123|Total-----------+--------------------------------------------+----------1|①264428|98|②26.5344.9028.57|100.00-----------+--------------------------------------------+----------2|③284917|94|④29.7952.1318.09|100.00-----------+--------------------------------------------+----------Total|⑤549345|192|⑥28.1248.4423.44|100.00Pearsonchi2(2)=2.9497Pr=0.229①该行表示第一组(肝癌组)的3个观察数;②该行表示第一组的各个观察数的占第一组观察总数的百分比;③该行表示第二组(健康组)的3个观察数;④该行表示第二组的各个观察数的占第二组观察总数的百分比;⑤该行表示关于饮用醋冷水习惯的三个分类:“经常”,“偶尔”和“从不”的合计数;⑥该行表示上述三个合计数分别占总样本数的百分比。
卡方检验是一种统计检验方法,其原理是比较理论频数和实际频数的吻合度或拟合优度。
基本思想是通过统计样本的实际观测值与理论推断值之间的偏离程度,来判断理论值是否符合。
卡方检验的应用范围包括检验某个连续变量或离散变量是否与某种理论分布接近,即分布拟合检验;以及检验类别变量之间是否存在相关性,即列联分析。
卡方检验的基本公式是卡方值,它是由实际频数和理论频数之间的差的平方与理论频数的比值计算得出的。
卡方值的计算公式如下:
卡方值=∑(实际频数-理论频数)^2 / 理论频数
其中,∑表示求和,实际频数和理论频数分别表示观测频数和期望频数。
如果卡方值越大,说明观测频数和期望频数之间的偏离程度越大;如果卡方值越小,说明观测频数和期望频数之间的偏离程度越小,越趋于符合。
需要注意的是,卡方检验的前提假设是样本数据服从卡方分布,且样本量足够大。
同时,卡方检验对于样本量较小的数据可能不太稳定,此时可以考虑使用其他统计方法如Fisher's exact test等。