χ2检验.
- 格式:ppt
- 大小:286.00 KB
- 文档页数:13
检验(chi-square test)检验(chi-square test)或称卡方检验,是一种用途较广的假设检验方法。
可以分为成组比较(不配对资料)和个别比较(配对,或同一对象两种处理的比较)两类。
一、四格表资料的检验例20.7某医院分别用化学疗法和化疗结合放射治疗卵巢癌肿患者,结果如表20-11,问两种疗法有无差别?表20-11 两种疗法治疗卵巢癌的疗效比较组别有效无效合计有效率(%)化疗组19244344.2化疗加放疗组34104477.3合计53348760.9表内用虚线隔开的这四个数据是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的两种疗法有效率分别为44.2%和77.3%,两者的差别可能是抽样误差所致,亦可能是两种治疗有效率(总体率)确有所不同。
这里可通过检验来区别其差异有无统计学意义,检验的基本公式为:式中A为实际数,以上四格表的四个数据就是实际数。
T为理论数,是根据检验假设推断出来的;即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。
这里可将两种疗法合计有效率作为理论上的有效率,即53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。
兹以表20-11资料为例检验如下。
检验步骤:1.建立检验假设:H0:π1=π2H1:π1≠π2α=0.052.计算理论数(TRC),计算公式为:公式(20.13)式中TRC是表示第R行C列格子的理论数,n R为理论数同行的合计数,n C为与理论数同列的合计数,n为总例数。
第1行1列:43×53/87=26.2第1行2列:43×34/87=16.8第2行1列:44×53/87=26.8第2行2列:4×34/87=17.2以推算结果,可与原四项实际数并列成表20-12:表20-12 两种疗法治疗卵巢癌的疗效比较组别有效无效合计化疗组19(26.2)24(16.8)43化疗加放疗组34(26.8)10(17.2)44合计533487因为上表每行和每列合计数都是固定的,所以只要用TRC式求得其中一项理论数(例如T1.1=26.2),则其余三项理论数都可用同行或同列合计数相减,直接求出,示范如下:T1.1=26.2T1.2=43-26.2=16.8T2.1=53-26.2=26.8T2.2=44-26.2=17.23.计算值按公式20.12代入4.查值表求P值在查表之前应知本题自由度。
χ2检验的公式χ2检验是一种常用的统计方法,用于检验两个分类变量之间是否存在相关性。
它的全称是卡方检验,是由卡方分布衍生而来的统计检验方法。
χ2检验的公式如下:χ2 = Σ ( (Oij - Eij)^2 / Eij )其中,χ2表示卡方值,Oij表示观察到的频数,Eij表示期望的频数。
在χ2检验中,我们需要先确定一个原假设和备择假设,然后根据实际观察到的频数和期望频数,计算出卡方值。
最后,根据卡方值和自由度的关系,确定拒绝域,从而判断原假设的可信程度。
χ2检验可以用于比较两个分类变量的分布情况,例如比较两组样本在不同类别上的分布是否存在差异。
这种差异可能源于不同类别之间的关联性,也可能是由于其他因素导致的。
χ2检验的目的就是通过计算卡方值,判断这种差异是否显著。
在进行χ2检验时,需要注意以下几点:1. 样本容量要足够大。
当样本容量较小时,χ2检验的结果可能不准确。
2. 数据应该是独立的。
χ2检验要求样本观测值之间是相互独立的,否则会导致结果的偏差。
3. 期望频数要大于5。
当期望频数小于5时,χ2检验的结果可能不可靠。
4. 自由度的确定。
在计算卡方值时,需要根据分类变量的类别数和样本容量来确定自由度的取值。
χ2检验的步骤如下:1. 建立假设。
根据研究问题,确定原假设和备择假设。
2. 收集数据。
根据研究问题,收集相应的数据样本。
3. 计算期望频数。
根据总体分布的假设,计算出每个类别的期望频数。
4. 计算卡方值。
根据观察频数和期望频数,使用χ2检验公式计算出卡方值。
5. 确定拒绝域。
根据显著性水平和自由度的关系,确定拒绝域的边界。
6. 做出判断。
比较计算得到的卡方值和拒绝域的边界,判断原假设的接受或拒绝。
χ2检验的应用非常广泛,特别是在医学、社会科学和市场研究等领域。
例如,医学研究可以使用χ2检验来比较不同治疗组的治愈率是否存在差异;社会科学研究可以使用χ2检验来分析不同人群之间的社会行为是否存在关联;市场研究可以使用χ2检验来分析不同产品的偏好是否存在差异。