卡方检验配对四个表资料的x2检验
- 格式:doc
- 大小:41.00 KB
- 文档页数:1
卡方检验(Chi-square test)Li Junrongstat9@7.1 四格表资料的χ2检验χ2检验(Chi-square test)是现代统计学的创始人之一,K. Pearson(1857-1936)于1900年提出的一种具有广泛用途的统计方法,可用于两个或多个率(或者构成比)之间的比较,计数资料的关联度分析,拟合优度检验等。
一、卡方检验的基本思想卡方分布⏹属连续型分布⏹可加性是其基本性质⏹唯一参数,即自由度(1) 自由度为1的χ2分布若Z N ~(,),01则Z 2的分布称为自由度为1的χ2分布.(chi-square distribution),记为χ()12或χ21(). 图形:从纵轴某个点开始单调下降,先凸后凹.02468100.00.10.20.3 2220.05(1)0.05/22220.01(1)0.01/23.84(1.96)6.63(2.5758)Z Zχχ======(2) νZ Z Z ,...,,21互相独立,均服从N (,)01,则22221...νZ Z Z +++的分布称自由度为 ν的χ2分布,记为χν()2或)(2νχ,或简记为χ2.* 图形:单峰,正偏峰;自由度ν很大时,2()νχ近似地服从正态分布.有2()2(),22Z ννχνχννν-=服从均数为,方差为的正态分布.00.10.20.30.40.50369121518¿¨·½Öµ×Ý·ß×ÔÓɶȣ½1×ÔÓɶȣ½2×ÔÓɶȣ½3Óɶȣ½62/)12/(2222)2/(21)(χνχνχ--⎪⎪⎭⎫⎝⎛Γ=ef 3.847.8112.59P =0.05的临界值χ2分布(chi-square distribution )性质:若χνχν2122(),()互相独立, 则χνχν2122()()+服从χ2分布, 自由度=+νν12 χνχν2122()()-服从χ2分布, 自由度=-νν12卡方检验的基本思想组别有效无效合计有效率(%)试验组99 5 10495.20(p 1)对照组7521 9678.13(p 2)合计1742620087.00(p c )表7-1两组降低颅内压有效率的比较实际频数A (actual frequency)理论频数T (theoretical frequency)nn n column row T C R =⨯=总例数合计列合计行)()(RC四格表(fourfold table)它反映了理论数与实际数的吻合情况,该统计量近似地服从自由度为ν的卡方分布。
表内用虚线隔开的这四个数据是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的两种疗法有效率分别为44.2%和77.3%,两者的差别可能是抽样误差所致,亦可能是两种治疗有效率(总体率)确有所不同。
这里可通过x2检验来区别其差异有无统计学意义,检验的基本公式为:式中A为实际数,以上四格表的四个数据就是实际数。
T为理论数,是根据检验假设推断出来的;即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。
这里可将两种疗法合计有效率作为理论上的有效率,即53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。
兹以表20-11资料为例检验如下。
检验步骤:1.建立检验假设:H0:π1=π2H1:π1≠π2α=0.052.计算理论数(TRC),计算公式为:TRC=nR.nc/n 公式(20.13)因为上表每行和每列合计数都是固定的,所以只要用TRC式求得其中一项理论数(例如T1. 1=26.2),则其余三项理论数都可用同行或同列合计数相减,直接求出,示范如下:T1.1=26.2T1.2=43-26.2=16.8T2.1=53-26.2=26.8T2.2=44-26.2=17.23.计算x2值按公式20.12代入4.查x2值表求P值在查表之前应知本题自由度。
按x2检验的自由度v=(行数-1)(列数-1),则该题的自由度v=(2-1)(2-1)=1,查x2界值表(附表20-1),找到x20.001(1)=6.63,而本题x2=10.0 1即x2>x20.001(1),P<0.01,差异有高度统计学意义,按α=0.05水准,拒绝H0,可以认为采用化疗加放疗治疗卵巢癌的疗效比单用化疗佳。
通过实例计算,读者对卡方的基本公式有如下理解:若各理论数与相应实际数相差越小,x2值越小;如两者相同,则x2值必为零,而x2永远为正值。
x2检验或卡方检验和校正卡方检验的计算x2检验(chi-square test)或称卡方检验x2检验(chi-square test)或称卡方检验,是一种用途较广的假设检验方法。
可以分为成组比较(不配对资料)和个别比较(配对,或同一对象两种处理的比较)两类。
一、四格表资料的x2检验例20.7某医院分别用化学疗法和化疗结合放射治疗卵巢癌肿患者,结果如表20-11,问两种疗法有无差别?表20-11 两种疗法治疗卵巢癌的疗效比较组别有效无效合计有效率(%)化疗组19 24 43 44.2 化疗加放疗组34 10 44 77.3合计53 34 87 60.9表内用虚线隔开的这四个数据是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的两种疗法有效率分别为44.2%和77.3%,两者的差别可能是抽样误差所致,亦可能是两种治疗有效率(总体率)确有所不同。
这里可通过x2检验来区别其差异有无统计学意义,检验的基本公式为:式中A为实际数,以上四格表的四个数据就是实际数。
T为理论数,是根据检验假设推断出来的;即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。
这里可将两种疗法合计有效率作为理论上的有效率,即53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。
兹以表20-11资料为例检验如下。
检验步骤:1.建立检验假设:H0:π1=π2H1:π1≠π2α=0.052.计算理论数(TRC),计算公式为:TRC=nR.nc/n 公式(20.13)式中TRC是表示第R行C列格子的理论数,nR为理论数同行的合计数,nC为与理论数同列的合计数,n为总例数。
第1行1列: 43×53/87=26.2第1行2列: 43×34/87=16.8第2行1列: 44×53/87=26.8第2行2列: 4×34/87=17.2以推算结果,可与原四项实际数并列成表20-12:表20-12 两种疗法治疗卵巢癌的疗效比较因为上表每行和每列合计数都是固定的,所以只要用TRC式求得其中一项理论数(例如T1.1=26.2),则其余三项理论数都可用同行或同列合计数相减,直接求出,示范如下:T1.1=26.2T1.2=43-26.2=16.8T2.1=53-26.2=26.8T2.2=44-26.2=17.23.计算x2值按公式20.12代入4.查x2值表求P值在查表之前应知本题自由度。
表内用虚线隔开的这四个数据是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的两种疗法有效率分别为44.2%和77.3%,两者的差别可能是抽样误差所致,亦可能是两种治疗有效率(总体率)确有所不同。
这里可通过x2检验来区别其差异有无统计学意义,检验的基本公式为:式中A为实际数,以上四格表的四个数据就是实际数。
T为理论数,是根据检验假设推断出来的;即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。
这里可将两种疗法合计有效率作为理论上的有效率,即53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。
兹以表20-11资料为例检验如下。
检验步骤:1.建立检验假设:H0:π1=π2H1:π1≠π2α=0.052.计算理论数(TRC),计算公式为:因为上表每行和每列合计数都是固定的,所以只要用TRC式求得其中一项理论数(例如T1. 1=26.2),则其余三项理论数都可用同行或同列合计数相减,直接求出,示范如下:T1.1=26.2T1.2=43-26.2=16.8T2.1=53-26.2=26.8T2.2=44-26.2=17.23.计算x2值按公式20.12代入4.查x2值表求P值在查表之前应知本题自由度。
按x2检验的自由度v=(行数-1)(列数-1),则该题的自由度v=(2-1)(2-1)=1,查x2界值表(附表20-1),找到x20.001(1)=6.63,而本题x2=10.0 1即x2>x20.001(1),P<0.01,差异有高度统计学意义,按α=0.05水准,拒绝H0,可以认为采用化疗加放疗治疗卵巢癌的疗效比单用化疗佳。
通过实例计算,读者对卡方的基本公式有如下理解:若各理论数与相应实际数相差越小,x2值越小;如两者相同,则x2值必为零,而x2永远为正值。
x2检验或卡方检验和校正卡方检验的计算x2检验(chi-square test)或称卡方检验x2检验(chi-square test)或称卡方检验,是一种用途较广的假设检验方法。
可以分为成组比较(不配对资料)和个别比较(配对,或同一对象两种处理的比较)两类。
一、四格表资料的x2检验例20.7某医院分别用化学疗法和化疗结合放射治疗卵巢癌肿患者,结果如表20-11,问两种疗法有无差别?表20-11 两种疗法治疗卵巢癌的疗效比较表用虚线隔开的这四个数据是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的两种疗法有效率分别为44.2%和77.3%,两者的差别可能是抽样误差所致,亦可能是两种治疗有效率(总体率)确有所不同。
这里可通过x2检验来区别其差异有无统计学意义,检验的基本公式为:式中A为实际数,以上四格表的四个数据就是实际数。
T为理论数,是根据检验假设推断出来的;即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。
这里可将两种疗法合计有效率作为理论上的有效率,即53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。
兹以表20-11资料为例检验如下。
检验步骤:1.建立检验假设:H0:π1=π2H1:π1≠π2α=0.052.计算理论数(TRC),计算公式为:TRC=nR.nc/n 公式(20.13)式中TRC是表示第R行C列格子的理论数,nR为理论数同行的合计数,nC为与理论数同列的合计数,n为总例数。
第1行1列: 43×53/87=26.2第1行2列: 43×34/87=16.8第2行1列: 44×53/87=26.8第2行2列: 4×34/87=17.2以推算结果,可与原四项实际数并列成表20-12:表20-12 两种疗法治疗卵巢癌的疗效比较因为上表每行和每列合计数都是固定的,所以只要用TRC式求得其中一项理论数(例如T1.1=26.2),则其余三项理论数都可用同行或同列合计数相减,直接求出,示如下:T1.1=26.2T1.2=43-26.2=16.8T2.1=53-26.2=26.8T2.2=44-26.2=17.23.计算x2值按公式20.12代入4.查x2值表求P值在查表之前应知本题自由度。
6.某医院147例大肠杆菌标本分别在A ,B 两种培养基上培养,然后进行检验,资料见下表,试分析两种培养基的检验结果是否有显著性差别? 表 A 、B 两种培养基上培养大肠杆菌标本结果
A 培养基
B 培养基 合 计 + - + 59 36 95 - 15 37 52 合 计
74
73
147
[参考答案]
本题是一个配对设计的二分类资料,采用配对四个表资料的2χ检验。
(1)建立检验假设并确定检验水准
0H :C B =,即两种培养基的阳性培养率相等
1H :C B ≠,即两种培养基的阳性培养率不相等
05.0=α
(2)计算检验统计量
本例b +c =36+15=51> 40 ,用配对四个表2χ检验公式,计算检验统计量2χ值
c
b c b +-=22
)(χ=
()65.8153615362
=+-, 1=ν 3. 确定P 值,作出推断结论
查2χ界值表得P < 0.05。
按0.05α=水准,拒绝0H 。
认为两种培养基的阳性培养率不同。