卡方检验
- 格式:pdf
- 大小:130.06 KB
- 文档页数:7
统计方法卡方检验卡方检验(Chi-Square Test)是一种统计方法,用于检验两个或多个分类变量之间的关系。
它通过比较观察到的频数与期望的频数之间的差异,来判断这些变量是否独立或存在相关性。
卡方检验可以用于不同类型的问题,包括:1.两个分类变量之间的关系:例如,我们可以使用卡方检验来确定性别和吸烟偏好之间是否存在关联。
2.多个分类变量之间的关系:例如,我们可以使用卡方检验来确定教育水平、职业和收入之间是否有关联。
卡方检验的原理是基于观察到的频数与期望的频数之间的差异。
观察到的频数是指在实际数据中观察到的变量组合的频数。
期望的频数是指在假设独立的情况下,根据变量边际分布计算得到的预期频数。
卡方检验通过计算卡方统计量来衡量这两组频数之间的差异。
在进行卡方检验之前,需要设置零假设(H0)和备择假设(Ha)。
零假设通常是指两个或多个分类变量之间独立的假设,而备择假设则是指两个或多个分类变量之间存在相关性的假设。
卡方检验的计算过程可以分为以下几个步骤:1.收集观察数据:将观察到的数据以交叉表格的形式整理起来。
表格的行和列分别代表两个或多个分类变量的不同组合,表格中的数值表示观察到的频数。
2.计算期望频数:根据变量边际分布计算得到期望频数。
期望频数是在零假设成立的情况下,根据变量边际分布计算得到的预期频数。
3.计算卡方统计量:根据观察频数和期望频数之间的差异计算卡方统计量。
卡方统计量的计算公式为:X^2=Σ((O-E)^2/E)其中,Σ代表对所有单元格进行求和,O表示观察到的频数,E表示期望频数。
4. 计算自由度:自由度(degrees of freedom)是进行卡方检验时需要考虑的自由变量或条件的数量。
在卡方检验中,自由度等于(行数 - 1)乘以(列数 - 1)。
5.查找临界值:使用给定的自由度和显著性水平(通常为0.05)查找卡方分布表格,以确定接受或拒绝零假设。
6.比较卡方统计量和临界值:如果卡方统计量大于临界值,则拒绝零假设,认为两个或多个分类变量之间存在相关性;如果卡方统计量小于临界值,则接受零假设,认为两个或多个分类变量之间独立。
卡方检验的名词解释
卡方检验是一种非参数检验方法,用于检验样本是否符合某种分布,或者两个样本是否来自于同一分布。
其基本思想是根据样本数据计算出某个统计量,然后通过这个统计量的值与期望值的比较来判断样本数据是否偏离预期分布。
卡方检验适用于样本数据不服从正态分布或样本大小较小的情况。
卡方检验的应用非常广泛,例如在医学研究中用于比较治疗方法的效果、在社会学研究中用于比较不同群体的特征等。
卡方检验的结果可以用卡方值、自由度和显著性水平来表示。
其中,卡方值表示样本数据与预期分布之间的差异,自由度表示卡方检验中减去的理论频数,显著性水平表示样本数据是否显著偏离预期分布。
在实际应用中,要根据具体情况选择合适的卡方检验方法,并根据卡方检验结果做出相应的决策。
卡方检验名词解释
卡方检验属于非参数检验,由于非参检验不存在具体参数和总体正态分布的假设,所以有时被称为自由分布检验。
参数和非参数检验最明显的区别是它们使用数据的类型。
非参检验通常将被试分类,如民主党和共和党,这些分类涉及名义量表或顺序量表,无法计算平均数和方差。
卡方检验分为拟合度的卡方检验和卡方独立性检验。
我们用几个例子来区分这两种卡方检验:
•对于可口可乐公司的两个领导品牌,大多数美国人喜欢哪一种?•公司采用了新的网页页面B,相较于旧版页面A,网民更喜欢哪一种页面?
以上两个例子属于拟合度的卡方检验,原因在于它们都是有关总体比例的问题。
我们只是将个体分类,并想知道每个类别中的总体比例。
它检验的内容仅涉及一个因素多项分类的计数资料,检验的是单一变量在多项分类中实际观察次数分布与某理论次数是否有显著差异。
拟合度的卡方检验定义:
主要使用样本数据检验总体分布形态或比例的假说。
测验决定所获得的的样本比例与虚无假设中的总体比例的拟合程度如何。
拟合度的卡方检验又叫最佳拟合度的卡方检验,为何取名“最佳拟合”?这是因为最佳拟合度的卡方检验的目的是比较数据(实际频数)与虚无假设。
确定数据如何拟合虚无假设指定的分布,因此取名“最佳拟合”。
关于拟合度的卡方检验有一些翻译上的区别,其实表达的是一个意思:
拟合度的卡方检验=卡方拟合优度检验=最佳拟合度卡方检验
以下统称:卡方拟合优度检验
卡方统计的公式:卡方卡方=χ2=Σ(fo−fe)2fe
公式中O代表observation,即实际频数;E代表Expectation,即期望频数。
卡方检验格式一、什么是卡方检验?卡方检验(chi-square test)是一种常用的假设检验方法,用于比较实际观测值与理论预期值之间的差异是否显著。
它适用于离散型的数据,通常用于比较两个或多个分类变量之间的关联性。
卡方检验可以帮助我们判断观察到的数据是否符合某种期望的分布模式,从而评估变量之间的独立性。
二、卡方检验的原理卡方检验的原理基于卡方统计量(chi-square statistic),它用于度量观测值与理论预期值之间的差异程度。
卡方统计量的计算公式如下:^2}{E_i})其中,为观测值,为理论预期值。
三、卡方检验的步骤卡方检验一般包括以下步骤:1. 设置假设在进行卡方检验前,需要明确研究者想要验证的假设。
通常会设立两个假设:零假设(H0)和备择假设(H1)。
零假设常常是指变量之间没有关联或没有差异,备择假设则是指变量之间存在关联或差异。
2. 构建列联表在进行卡方检验时,需要构建一个列联表(contingency table),用于记录观测值和理论预期值。
列联表是一个二维表格,行代表一个变量的不同类别,列代表另一个变量的不同类别。
观测值填写实际观测到的频数,理论预期值填写根据假设计算得到的期望频数。
3. 计算卡方统计量根据构建的列联表,可以计算卡方统计量。
按照公式 ^2}{E_i}) 计算每个观测值与期望值的差异平方和,并相加得到卡方统计量。
4. 确定显著性水平在进行卡方检验时,需要设定一个显著性水平(significance level)来评估卡方统计量的显著性。
常用的显著性水平有0.05和0.01两种。
更小的显著性水平表示对差异的要求更高。
5. 查表或计算临界值根据显著性水平和自由度(degree of freedom),可以查找卡方分布表得到临界值。
根据卡方统计量和临界值的比较,可以判断观测值与理论预期值之间的差异是否显著。
6. 判断结论根据卡方统计量与临界值的比较结果,可以判断零假设是否被拒绝。
卡方检验及校正卡方检验的计算卡方检验(Chi-squared test)是一种用于比较观察值与期望值之间的差异是否显著的统计方法。
它可以用于分析两个或多个分类变量之间的关联性或独立性。
卡方检验的原假设是观察值与期望值没有显著差异,备择假设是它们有显著差异。
在进行卡方检验之前,需要计算期望值以比较与观察值的差异。
这可以通过以下步骤完成:1.建立假设:首先,建立原假设和备择假设。
原假设通常假设两个变量之间没有关联性或独立性,备择假设则是它们之间存在关联性或独立性。
2.计算期望频数:对于给定的样本数据,可以计算出每个分类变量的期望频数。
期望频数是基于原假设计算出来的,它表示了在原假设成立的情况下,每个分类变量中的期望观察值数量。
3.计算卡方值:卡方值是观察频数与期望频数的差异的平方的总和除以期望频数的总和。
卡方值越大,观察值与期望值之间的差异越大,意味着更有可能拒绝原假设。
4.确定自由度:自由度是用于计算卡方分布的参数。
对于二维列联表(2x2),自由度为1;对于更大的列联表,自由度为(行数-1)x(列数-1)。
5.判断统计显著性:根据自由度和卡方值,可以查找卡方分布表以确定观察值与期望值之间的差异是否显著。
如果卡方值大于临界值,则可以拒绝原假设,认为观察值与期望值之间存在显著差异。
校正卡方检验(Adjusted Chi-squared test)是对卡方检验的改进,它通过应用连续性修正或其他修正方法来解决离散数据中的小样本问题。
当样本容量较小时,卡方检验可能会产生不准确的结果,因为期望频数可能会小于5,从而违反了卡方检验的假设条件。
校正卡方检验的计算步骤与普通卡方检验类似,但需要应用修正方法来计算期望频数。
修正方法可以是连续性校正(continuity correction)、费希尔校正(Fisher's exact test)或模拟校正(simulation correction)等。
连续性校正是在计算期望频数时,对每个单元格中的观察频数进行微小的调整。
Stata第六章卡方检验
本节STATA命令摘要
[by分层变量名:]tab2变量1变量2[,allchi2exactcellcolumnrow]
tabi#11#12[...]\[#21#22[...][\...][,allchi2exactcellcolumnrow]
•列联表分析
STATA命令:
[by分层变量:]tab2变量1变量2[,
allchi2lichi2exactcellcolumnrow]
上述命令中,变量1为行计数变量;变量2为列计数变量;all表示卡方(c2)检验,似然比(likelihoodratio)检验以及一些统计描述指标和检验,但不包括Fisher精确检验;exact表示Fisher精确检验;chi2表示c2检验;lichi2表示likelihoodratio检验;cell表示输出的列联表中显示每个观察计数值占该列联表总观察计数值的比例;row表示输出的列联表中显示每个观察计数值占该观察计数值所在行的各观察计数值总数的比例;coloumn表示输出的列联表中显示每个观察计数值占该观察计数值所在的列各观察计数值总数的比例。
例:某地调查肝癌病人与健康人饮用“醋冷水”(一种以冷水和醋为主要成分的饮料)的习惯。
用group=1表示肝癌组患者和group=2表示健康人;用custom=1表示经常饮用醋冷水;custom=2表示偶尔饮用醋冷水和custom=3表示从不饮用醋冷水。
具体资料为:(摘自医学统计方法,金丕焕主编,p163)。
组别经常偶尔从不饮用合计肝癌组26442898
健康组28491794
合计549345192
显然这是一个病例对照研究,所以每组人数是人为确定的,因此只需计算各组"经常","偶而"和"从不饮用"占本组的频数以及检验患肝癌是否与饮水习惯有关。
tab2groupcustom,rowchi2
->tabulationofgroupbycustom
|custom
group|123|Total
-----------+--------------------------------------------+----------
1|①264428|98
|②26.5344.9028.57|100.00
-----------+--------------------------------------------+----------
2|③284917|94
|④29.7952.1318.09|100.00
-----------+--------------------------------------------+----------
Total|⑤549345|192
|⑥28.1248.4423.44|100.00
Pearsonchi2(2)=2.9497Pr=0.229
①该行表示第一组(肝癌组)的3个观察数;②该行表示第一组的各个观察数的
占第一组观察总数的百分比;③该行表示第二组(健康组)的3个观察数;④该行表示第二组的各个观察数的占第二组观察总数的百分比;⑤该行表示关于饮用醋冷水习惯的三个分类:“经常”,“偶尔”和“从不”的合计数;⑥该行表示上述三个合计数分别占总样本数的百分比。
从上述结果可知:卡方值为2.9497以及自由度为2,p为0.229,所以根据当前资料和结果显示:患肝癌病与是否饮用醋冷水无关。
•列联表分析也可以用立即命令执行:
tabi#11#12[...]\[#21#22[...][\...][,allchi2exactcellcolumnrow]
#11表示列联表中第一行第一列的观察数;#12表示列联表中第一行第二列的观察数;\表示换一行;#21表示列联表中第二行第一列的观察数,其它以此类推。
子命令:allchi2exactcellcolumnrow与上述命令完全相同。
以上例的资料为
例:相应的STATA命令为:
tabi264428\284917,chi2lichi2
|col
row|123|Total
-----------+----------------------------------+----------
1|264428|98
|26.5344.9028.57|100.00
-----------+----------------------------------+----------
2|284917|94
|29.7952.1318.09|100.00
-----------+----------------------------------+----------
Total|549345|192
|28.1248.4423.44|100.00
Pearsonchi2(2)=2.9497Pr=0.229
likelihood-ratiochi2(2)=2.9760Pr=0.226
两种方法结果对应相同。
另外数学上可以证明:当大样本是,卡方检验(Pearsonchi2test)与似然比检验(likelihoodratiochi2test)趋向一致。
•Fisher精确检验
例:用新旧两种药治疗某种疾病(资料如下表所示),试问:两药对该病的治愈率是否不同?(资料摘自医学卫生统计,金丕焕主编,p165)组别未治愈治愈合计
旧药4(2.2)2(3.8)6
新药0(1.8)5(3.2)5
合计4711
表中括号中的数为理论数(即:两种药的疗效无差异的无效假设Ho 成立时的期望频数)。
由于理论数均小于5,故必须用Fisher精确检验法。
相应的STATA命令为:
tabi42\05,exactcolrow
|col
row|12|Total
------------+--------------------------+----------
1|42|6
|66.6733.33|100.00
|100.0028.57|54.55
-----------+---------------------------+----------
2|05|5
|0.00100.00|100.00
|0.0071.43|45.45
-----------+----------------------------+----------
Total|47|11
|36.3663.64|100.00
|100.00100.00|100.00
①Fisher'sexact=0.061
②1-sidedFisher'sexact=0.045
①为双侧Fisher检验;②单侧Fisher检验
在Fisher精确检验中,假定每列和每行的合计数都是常数情况下,计算相应概率。
在本例中,单侧Fisher检验要计算下表的概率:
426
055
4711
双侧Fisher检验是考虑可能新药优于旧药,也可能旧药优于新药的情况。
以新药治愈人数为例:观察数-理论数=
5-3.2=1.8,因此要考虑观察数大于理论数的差是考虑抽样误差引起的,所以不仅要计算所有观察数-理论数(3.2)大于1.8的p值[1],还要计算所有理论数(3.2)-观察数大于1.8的p值。
即:计算所有|理论数-观察数|>1.8的p值的和,因此在每列和每行的合计数都是常数情况的假定下,还有一种情况满足理论数(3.2)-观察数大于1.8:
066
415
4711
所以本例Fisher双侧检验的p值为0.04545+0.01515»0.061。
•由于Fisher检验是在每列和每行的合计数都是常数的假定下的精确检验,而对于一般的研究:如病例对照(仅病例组和对照组的人数是常数,即:仅每行的合计数是常数),横断面抽样调查(样本总数是常数),所以对于不满足每列和每行的合计数都是常数假定的资料
而言,Fisher检验也是一种近似检验。
Fisher r检验仅计算该表的p值:[1]本例中只有上述的这张表的情况,所以单侧Fishe
观察数-理论数>1.8的p值,类似t检验:单侧检验的p值为t分布曲线下大于t样本计算值的面积,双侧检验的p值为t分布曲线下大于t样本计数值的面积和小于-t样本计数值的面积之和,而Fisher双侧检验:计算|观察剩-理论数|>1.8的p值的和。
即:在本例中,观察数-理论数=1.8相应t检验中的t样本计算值。