- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(ad bc) n χ= (a + b)(c + d )(a + c)(b + d )
2 2
校正公式为:
χ=
2
( ad bc -n / 2) n
2
(a + b)(c + d )(a + c)(b + d )
组别 甲 乙 合计
阳性 a c a+c
阴性 b d b+d
合计 a+b c+d a+b+c+d= n
�
1)实际数与理论数之间的差别等价于两 样本率的差别 2)检验假设H0:四格表的构成比相同, 等价于H0:两总体率相等 3)对实际数与理论数差值的假设检验, 等价于对两样本率差值的假设检验
6,χ2检验的基本思想(及计算步骤) 1)假设两总体率相等(构成比相同) – HO:π1=π2,即两总体阳性率相等 – H1:π1≠π2,即两总体阳性率不等 – α=0.05 – 不妨把H0看作:π1=π2=两样本合并的 阳性率 2)实际数与理论数的差值服从χ2分布,又 称pearson χ2 :
∑a n
j =1
j +j
n
r j =1
∑各疗效得分×各疗效合计人数 =
总例数
να =
(aj α )2 (n+ j ) ∑
n χs2近似服从自由度为的卡方分布 1
平均得分统计量的样本大小较容易达到: 只要主观确定一个分割点,把列分为1 ~J和J+1~r两部分,变成四格表,把新的 四格中各部分实际数相加,只要四格表 中大部分超过5即可
(O T ) χ =∑ T
2
2
– χ2值是以理论数为基数的相对误差, 它反映了实际数与理论数吻合的程度 (差别的程度).若检验假设成立,则实 际数与理论数的差别不会很大,出现 大的χ2值的概率是很小的,若P≤α,就 怀疑假设,因而拒绝它;若P>α,则尚 无理由拒绝它 – χ2值的大小随着格子数的增加而变大, 即χ2分布与自由度有关.因而考虑χ2值 大小的意义时,要考虑到格子数.当 周边合计数固定的情况下,四个基本 数据当中只有一个可以自由取值,即 自由度为1.
合计 70 135 205
其中b,c为两种培养基生长情况不同的 数字,a,b两培养基相同可不考虑
(b c) 2 2 χ = ,ν = 1 b+c ( b c 1) 2 2 χ = ,ν = 1(校正公式) b+c
当b+c ≥40时可不校正,而b+c<40时,则 一定要用校正公式
注意: 1,配对四格表中的数字为对子数 2,当a格与d格的数字都特别大,而b,c 格的数字都相对较小时,即使配对四格 表卡方检验结果有统计意义,其实际意 义也不大.因此,配对四格表的卡方检 验一般用于检验样本含量不太大的资料
1,有实际数为0的情况下,只需代入公 式计算P值即可 2,没有实际数为0的情况时,要把更加 极端的情况都算入. – 更加极端的情况是指:原来治愈率高 的治愈人数更要加多,治愈率低的治 愈人数更要减少,直至出现0为止,但 保持合计及总合计数字不变.见P157 例12-4 – 最后将几情况的概率相加得P值(单侧) – 可用查表法或计算机直接给出
– Trc=(nrnc)/n:理论数为行合计乘列合计 除总合计 – 理论数有两个特征:1)理论频数表的构 成比相同,即不但各行构成比相同, 而且各列亦相同;2)各个基本格子实际 数与理论数的差别(绝对值)相同 5,样本率的差别演绎为实际数与理论数 的差别: – 两样本率相差愈大,则实际数与理论 数的差别就愈大.若无效假设成立, 实际数与理论数之差就不会很大.
R×C表χ2检验注意事项 – 若表格有一个方向按多个等级分类, 则称为单向有序行列表,当等级数大 于3时,一般用秩和检验分析更为合适.
似然比卡方统计量
Likelihood ratio chi-square 自由度的确定及临界值与Pearson卡方一致
A i χ = 2∑Ai ×ln( ) Ti i=1
2 L
k
理论上当样本量相当大时,Pearson卡方和似然比 卡方都接近卡方分布;样本不够大时都偏离卡方 分布,两者的数值不同但接近,实践中这两个统 计量可同时使用,结合起来下结论.
第三节 四格表精确检验法
卡方检验的基本公式和校正公式有其应 用条件,且仅为近似.当四格表中有理 论数小于1或总观察例数小于40时,需改 用四格表的确切概率法exact probabilities in 2×2 table.
二,两种以上处理方法的比较 见P170~171例12-15 仅供了解
第五节 列变量为顺序变量的列联 表—行平均分差检验
一,2×C表 P163 例12-10 Pearson 卡方只能得出两组构成是否相同 的结论,不能得出哪组疗效较好的结论 人为地给各疗效一个分数,如无效为1, 好转为2,显效为3,痊愈为4,计算其均 数,称行平均分row mean score
ν=(R-1)(C-1) – R行C列时,R行中有一行数据受到列 合计的限制而不能自由变动,C列中亦 有一列数据在行合计的限制下不能自 由取值 3)查χ2分布界值表确定P值并作出推论 – χ2 =39.93,自由度为1,查附表6-7 – χ2 0.05(1)=3.84; χ2 0.01(1) =6.63; χ2 0.001(1) =10.83 – 一般类型的治愈率高于特殊类型(结合 样本率作实际推论)
Hale Waihona Puke χ2检验条件:(四格表) – 1,当n≥40且所有T≥5时,用普通的χ2 检验;若所得P≈ α ,改用确切概率法. – 2,当n≥40但有1≤T<5时,用校正χ2检 验 – 3,当n<40或有T<1时,不能用χ2检验, 改用确切概率法.
(O-T -0.5) χ= T
2
2
8,四格表专用公式 为方便起见,当基本格子的实际数命名 为a,b,c,d;行合计写为a+b,c+d,列合计 写为a+c,b+d,n为总观察数
基本思想:在四格表周边合计不变的情 况下,获得某个四格表的概率为
(a + b)!(c + d )!(a + c)!(b + d )! P= a!b!c!d !n!
a!表示factorial a 或a factorial 0!=1; 3!=3×2×1=6 该方法计算出的概率为分布中单侧的概 率,故双侧时应以0.025为显著性水平. 结合实际确定采用单侧还是双侧
第二节 行×列表的χ2检验
当行或列超过2组时通称为行×列表,或 R×C表,亦称列联表contingency table. 可用于 1,多个率的比较 可用以下简化公式(无相应校正公式)
O χ = n(∑ 1) nr nc
2
2
适用条件:不能有理论数小于1,并且1≤T≤5
的格子数不超过总格子数1/5.
aj为各疗效得分,n1j为第一行各疗效的频数,n1+ 为第一行合计 同理计算第二行平均分 再进行行平均得分差检验—χs2
f1 = ∑
j =1
4
aj n1 j n1+
( f1 α )2 2 χs = {(n n1+ ) /[n1+ (n 1)]}να
α为平均期望得分,να为方差
r
α =
两种类型胃溃疡病内科疗法治疗结果
组别 治愈 未愈 合计 80 99 179
一般类型 63(42.01) 17(37.99) 特殊类型 31(51.99) 68(47.01) 合计 94 85
– 为检验是否为第二种情况,无效假设 为两种治愈率本无不同,差别仅由抽 样误差所致. 3,理论治愈率: – 根据两组治愈率相同的假设,合计治 疗179人,总治愈94人,得理论治愈率 为 94/179=52.51% 4,理论数: – 一般溃疡患者80,按理论治愈率应治 愈80×52.51%=42.01,称theoretical value, theoretical frequency. 记为T.同理可得 其余理论数.亦可由减法求得
如果把数据排成等级rank,而不用整数评分法则 卡方检验与Spearman等级相关结果极为接近. 可任选其一
χ = r (N 1)
2 cs 2 s
第七节 多层列联表的分析
一,多层2×C表 采用扩展的Mantel-Haenszel 平均得分统 计量—χ2SMH 各层间效应的方向一致时,检验效果较 好.
条件不足时的三种处理方法: – 1)增大样本例数使理论数变大 – 2)删除理论数太小的行或列 – 3)将理论数太小的行或列与性质相近的 邻行或邻列合并,使重新计算的理论 数增大.但是此处理可能损失信息, 也会损害样本的随机性,不同的合并 方式所得的结果也不一样,因而在不 得已时慎用
2,多个构成比比较 3,双向有序分类资料的关联性检验 – 表格是按两个变量从小到大顺序分类 整理出来的,目的是研究两变量间有 无关联性.从左上角往右下角看,频 数有无集中在此对角线上的趋势,即 两变量有关联.若频数在这些格子均 匀分布,或各行分布(构成比)相同,且 各列分布(构成比)相同,则表示两个变 量无关联性了.
双侧检验时: 1)单侧概率加倍 2)加上对侧<当前四格表的概率的所有概 率. 这两种方法的结果有时可能会有所不同, 教科书建议以第二种方法为准
第四节 配对计数资料的χ2检验
一,两种处理方法的比较,P169
乙培养基 生长 不生长 合计
甲培养基 生长 不生长 36(a) 34(b) 0(c) 36 135(d) 169
– P<0.001, 按α=0.05水准,拒绝H0接受 H1,因而认为两总体的阳性率有差别 (统计学推论).结果说明,两组胃溃疡 病人治愈率的差别有高度统计意义, 7, χ2值的校正,四格表χ2检验的条件 实际上χ2值是根据正态分布中χ2 =∑[(xi) /σ]2的定义计算出来的,用前述公式算 得的值只能说近似于χ2分布,在自由度 大于1,理论数皆大于5时,这种近似较 好;自由度为1,当有理论数小于5时, 需进行(连续性)校正