x2检验练习题教程文件
- 格式:doc
- 大小:123.00 KB
- 文档页数:6
2χ检验练 习 题一、单项选择题1. 利用2χ检验公式不适合解决的实际问题是A. 比较两种药物的有效率B. 检验某种疾病与基因多态性的关系C. 两组有序试验结果的药物疗效D. 药物三种不同剂量显效率有无差别E. 两组病情“轻、中、重”的构成比例2.欲比较两组阳性反应率, 在样本量非常小的情况下(如1210,10n n <<), 应采用A. 四格表2χ检验B. 校正四格表2χ检验C. Fisher 确切概率法D. 配对2χ检验E. 校正配对2χ检验3.进行四组样本率比较的2χ检验,如220.01,3χχ>,可认为A. 四组样本率均不相同B. 四组总体率均不相同C. 四组样本率相差较大D. 至少有两组样本率不相同E. 至少有两组总体率不相同4. 从甲、乙两文中,查到同类研究的两个率比较的2χ检验,甲文220.01,1χχ>,乙文220.05,1χχ>,可认为A. 两文结果有矛盾B. 两文结果完全相同C. 甲文结果更为可信D. 乙文结果更为可信E. 甲文说明总体的差异较大5. 两组有效率比较检验功效的相关因素是A. 检验水准和样本率B. 总体率差别和样本含量C. 样本含量和样本率D. 总体率差别和理论频数E. 容许误差和检验水准答案:C C E C B二、计算与分析1.某神经内科医师观察291例脑梗塞病人,其中102例病人用西医疗法,其它189 例病人采用西医疗法加中医疗法,观察一年后,单纯用西医疗法组的病人死亡13例,采用中西医疗法组的病人死亡9例,请分析两组病人的死亡率差异是否有统计学意义?2.某医院研究中药治疗急性心肌梗死的疗效,临床观察结果见下表。
问接受两种不同疗法的患者病死率是否不同?两种药治疗急性心肌梗死的疗效组别存活死亡合计病死率(%)中药组65 3 68 4.41非中药组12 2 14 14.29合计77 5 82 6.103.某医师观察三种降血脂药A,B,C的临床疗效,观察3个月后,按照患者的血脂下降程度分为有效与无效,结果如下表,问三种药物的降血脂效果是否不同?三种药物降血脂的疗效药物有效无效合计A 120 25 145B 60 27 87C 40 22 624.为研究某补钙制剂的临床效果,观察56例儿童,其中一组给与这种新药,另一组给与钙片,观察结果如表,问两种药物预防儿童的佝偻病患病率是否不同?表两组儿童的佝偻病患病情况组别病例数非病例数合计患病率(%)新药组 8 32 40 20.0 钙片组 6 10 16 37.5 合计14425625.0[参考答案]本题是两组二分类频数分布的比较,用四个表2χ检验。
X2检验X2检验是用途广泛的假设检验方法,它的原理是检验实际分布和理论分布的吻合程度。
主要用途有:两个及以上样本率(或构成比)之间差异比较,推断两变量间有无相关关系。
X2检验类型有:四格表资料X2检验(用于两样本率的检验),行×列表X2检验(用于两个及两个以上样本率或构成比的检验), 行×列列联表X2检验(用于计数资料的相关分析)。
在SPSS中,所有X2检验均用Crosstabs完成。
界面说明【Rows框】用于选择行*列表中的行变量。
【Columns框】用于选择行*列表中的列变量。
【Layer框】Layer指的是层,对话框中的许多设置都可以分层设定,在同一层中的变量使用相同的设置,而不同层中的变量分别使用各自层的设置。
如果要让不同的变量做不同的分析,则将其选入Layer框,并用Previous和Next钮设为不同层。
Layer在这里用的比较少,在多元回归中我们将进行详细的解释。
【Display clustered bar charts复选框】显示重叠条图。
【Suppress table复选框】禁止在结果中输出行*列表。
【Statistics】按钮弹出Statistics对话框,用于定义所需计算的统计量。
Chi-square复选框:计算X2值。
Correlations复选框:计算行、列两变量的Pearson相关系数和Spearman等级相关系数。
Norminal复选框组:选择是否输出反映分类资料相关性的指标,很少使用。
Contingency coefficient复选框:即列联系数,其值界于0~1之间;Phi and Cramer's V复选框:这两者也是基于X2值的,Phi在四格表X2检验中界于-1~1之间,在R*C表X2检验中界于0~1之间;Cramer's V 则界于0~1之间;Lambda复选框:在自变量预测中用于反映比例缩减误差,其值为1时表明自变量预测应变量好,为0时表明自变量预测应变量差;Uncertainty coefficient复选框:不确定系数,以熵为标准的比例缩减误差,其值接近1时表明后一变量的信息很大程度来自前一变量,其值接近0时表明后一变量的信息与前一变量无关。
X2检验X2检验是用途广泛的假设检验方法,它的原理是检验实际分布和理论分布的吻合程度。
主要用途有:两个及以上样本率(或构成比)之间差异比较,推断两变量间有无相关关系。
X2检验类型有:四格表资料X2检验(用于两样本率的检验),行×列表X2检验(用于两个及两个以上样本率或构成比的检验), 行×列列联表X2检验(用于计数资料的相关分析)。
在SPSS中,所有X2检验均用Crosstabs完成。
界面说明【Rows框】用于选择行*列表中的行变量。
【Columns框】用于选择行*列表中的列变量。
【Layer框】Layer指的是层,对话框中的许多设置都可以分层设定,在同一层中的变量使用相同的设置,而不同层中的变量分别使用各自层的设置。
如果要让不同的变量做不同的分析,则将其选入Layer框,并用Previous和Next钮设为不同层。
Layer在这里用的比较少,在多元回归中我们将进行详细的解释。
【Display clustered bar charts复选框】显示重叠条图。
【Suppress table复选框】禁止在结果中输出行*列表。
【Statistics】按钮弹出Statistics对话框,用于定义所需计算的统计量。
Chi-square复选框:计算X2值。
Correlations复选框:计算行、列两变量的Pearson相关系数和Spearman等级相关系数。
Norminal复选框组:选择是否输出反映分类资料相关性的指标,很少使用。
Contingency coefficient复选框:即列联系数,其值界于0~1之间;Phi and Cramer's V复选框:这两者也是基于X2值的,Phi在四格表X2检验中界于-1~1之间,在R*C表X2检验中界于0~1之间;Cramer's V 则界于0~1之间;Lambda复选框:在自变量预测中用于反映比例缩减误差,其值为1时表明自变量预测应变量好,为0时表明自变量预测应变量差;Uncertainty coefficient复选框:不确定系数,以熵为标准的比例缩减误差,其值接近1时表明后一变量的信息很大程度来自前一变量,其值接近0时表明后一变量的信息与前一变量无关。
第七章 X2检验Chi-square testX2分布——计数资料第一节四格表资料的X2检验一、X2检验的基本思想1、X2分布(1)X2分布是一种连续型分布:X2分布(chi-square distribution)只有一个参数,即自由度。
当自由度V《2时,曲线呈L形随着V的增加,曲线逐渐趋于对称当自由度V—00无穷时,X2分布趋近正态分布(2)X2分布的一个基本性质是它的可加性:(X1+X2)——X2 (V1+V2)(3)X2 分布的界值:X2值愈大,P值愈小;反之,X2值愈小,P值愈大。
2、X2检验的基本思想四格表(fourfold table)资料PearsonX2——X2={Σ(A-T)2/T } V =(行数-1)(列数-1)A为实际频数(actual frequency)T为理论频数(theoretical frequency)——根据检验假设H0:π1=π2确定的。
T(RC)=nRnC/nT(RC)为第R行(row)第C列(column)的理论频数,nR为相应行的合计,nC为相应列的合计,n为总列数。
X2值反映了实际频数与理论频数的吻合程度。
3、X2检验的步骤H0::π1=π2,即试验组与对照组——总体有效率相等H1::π1≠π2,即——————————————不等ɑ=0.05——T值——V——P值二、四格表资料X2检验的专用公式X2=(ad-bc)2n/(a+b)(a+c)(d+b)(d+c)a,b,c,d为四格表的实际频数;(a+b)(a+c)(d+b)(d+c)是周边合计数;n为总例数,n=a+b+c+d. 四格表资料X2检验的校正公式三、X2C=(Iad-bcI-n/2)2n/(a+b)(a+c)(d+b)(d+c)(1)当n》40且所有的T》5时,用X2检验的基本公式或四格表资料X2检验的专有公式;(2)当n》40但有1《T《5时,用四格表资料X2检验的校正公式。
(3)当n<40,或T<1时,用四格表资料的Fisher确切概率法。
χ2检验公式例题
#### 例题:
假设抽查一批玩具,该批玩具总共有500件,其中有50件不符合标准。
下表给出有关它们的质量合格率的资料:
| 产地 | 合格(件) | 不合格(件) |
| :- | :- | :- |
| 国产 | 300 | 20 |
| 进口 | 200 | 30 |
在此假设该批玩具的质量合格率是一样的,请使用χ2检验公式进行检验。
#### 解析:
* 为了检验这一假设,需要构建观测值的全概率分布(即期望值)比较实际观测值。
* 所检测的总体变量分为二类:质量合格和质量不合格,故构建2×2表,其各个单元计算如下:
n=500,μ11=μ22=μ=500×0.9=450,μ12=μ21=n-μ=50
观测计数X11=300,X22=200,X12=20,X21=30
* 根据X^2检验的计算公式如下:
X^2=Σ((Xij-μij)^2/μij)
=(300-450)^2/450+(20-50)^2/50+(200-450)^2/450+(30-50)^2/50
=25+40+25+40=130
* 根据χ2检验表,自由度为1,α=0.05时,检验结果X^2≤3.84,由于130>3.84,故在α=0.05的显著性水平上,拒绝零假设,认为此批玩具的质量合格率不相同。
第七章X2检验第七章X2检验X2(称卡方)检验用途较广,但主要用于检验两个或两个以上样本率或构成比之间差别的显著性,也可检验两类事物之间是否存在一定的关系。
一、两个率的比较(一)X2检验的基本公式下页末行的例3.1是两组心肌梗塞病人病死率的比较,见表3.5,其中对照组未用抗凝药。
两组病人的病死率不同,抗凝药组为25.33%,对照组为40.8%。
造成这种不同的原因可能有两种:一种是仅由抽样误差所致;另一种是两个总体病死率确实有所不同。
为了区别这两种情况,应当进行X2检验。
其基本步骤如下:1.首先将资料写成四格表形式,如表3.6。
将每个组的治疗人数分为死亡与生存两部分,各占四格表中的一格,这些数字称为实际频数,符号为A,即实际观察得来的数字。
2.建立检验假设为了进行检验,首先作检验假设:两种疗法的两总体病死率相等,为35%(即70/200),记为H0:π1=π2。
即不论用或不用抗凝药,病死率都是35%,所以亦可以换一种说法:病死率与疗法无关。
上述假设经过下面步骤的检验后,可以被接受也可以被拒绝。
当H0被拒绝时,就意味着接受其对立假设即备择假设H1。
此例备择假设为两总体病死率不相等,记为H1:π1≠π2因为我们观察的是随机现象,所以无论是接受或拒绝H0都冒有一定风险,即存在着错判的可能性。
一般要求,当错误地被拒绝的概率α不超过一定的数值,如5%(或0.05),此值称为检验水准,记为α=0.05。
3.计算理论频数根据“检验假设”推算出来的频数称理论频数,符号为T。
计算方法如下:假设两总体病死率相同,都是35.0%,那么抗凝血组治疗75人,其死亡的理论频数应为75×35.0%=26.25人,而生存的理论频数为75-26.25=48.75人。
用同样方法可求出对照组的死亡与生存的理论频数,前者为43.75人。
后者为81.25人。
然后,把这些理论频数填入相应的实际频数格内,见表3.6括号内数字。
计算理论频数也可用下式(3.4)TRC=nRnC/N (3.4)式中,TRC为R行与C列相交格子的理论频数,nR为与计算的理论频数同行的合计数,nC为与该理论频数同列的合计数,N为总例数。
河南大学医学院授课教案首页预防医学教研室教研室主任签名注:教后记放在讲义最后一页。
基本内容第一节 四格表资料的χ2检验一、2χ检验的基本思想以两样本率比较的2χ检验为例,介绍2χ检验的基本思想。
2χ分布是一种连续型分布 2χ分布的形状依赖于自由度ν的大小,当自由度ν≤2时,曲线呈L 型;随着ν的增加,曲线逐渐趋于对称;当自由度ν→∞时, 2χ分布趋向正态分布。
2χ分布的具有可加性。
表8-1 完全随机设计两样本率比较的四格表处理属性合计 阳性阴性 1)(1111T A )(1212T A 1n (固定值) 2)(2121T A )(2222T A 2n (固定值) 合计 1m 2mn 有时为方便用a 、b 、c 、d 分别为四格表中四个实际频数22211211A A A A 、、、,n =a+b+c+d 。
2χ检验的检验统计量为2χ基本公式(亦称Pearson 2χ) ∑-=T T A 22)(χ (8-1)ν=(行数-1)(列数-1) (8-2)理论频数T 的计算公式 nn n T C R RC .= (8-3)式中RC T 为第R 行(row)第C 列(column)的理论频数,R n 为相应行的合计,c n 为相应列的合计,n 为总例数。
由公式(8-1)可以看出:2χ值反映了实际频数与理论频数的吻合程度,其中TT A 2)(-反映了某个格子实际频数与理论频数的吻合程度。
若检验假设0H 成立,实际频数与理论频数的差值会小,则2χ值也会小;反之,若检验假设0H 不成立,实际频数与理论频数的差值会大,则2χ值也会大。
2χ值的大小还取决于T T A 2)(-个数的多少(严格地说是自由度ν的大小)。
由于各TT A 2)(-皆是正值,故自由度ν愈大,2χ值也会愈大;所以只有考虑了自由度ν的影响,2χ值才能正确地反映实际频数A 和理论频数T 的吻合程度。
2χ检验时,要根据自由度ν查2χ界值表。
当2χ≥2,ναχ时,P ≤α,拒绝0H ,接受1H ;当2,2ναχχ<时,α>P ,尚没有理由拒绝0H 。
x2检验练习题
2χ检验
练 习 题
一、单项选择题
1. 利用2χ检验公式不适合解决的实际问题是
A. 比较两种药物的有效率
B. 检验某种疾病与基因多态性的关系
C. 两组有序试验结果的药物疗效
D. 药物三种不同剂量显效率有无差别
E. 两组病情“轻、中、重”的构成比例
2.欲比较两组阳性反应率, 在样本量非常小的情况下(如1210,10n n <<), 应采用
A. 四格表2χ检验
B. 校正四格表2χ检验
C. Fisher 确切概率法
D. 配对2χ检验
E. 校正配对2χ检验
3.进行四组样本率比较的2χ检验,如22
0.01,3χχ>,可认为
A. 四组样本率均不相同
B. 四组总体率均不相同
C. 四组样本率相差较大
D. 至少有两组样本率不相同
E. 至少有两组总体率不相同
4. 从甲、乙两文中,查到同类研究的两个率比较的2χ检验,甲文
220.01,1
χχ>,乙文22
0.05,1χχ>,可认为 A. 两文结果有矛盾 B. 两文结果完全相同 C. 甲文结果更为可信 D. 乙文结果更为可信 E. 甲文说明总体的差异较大
5. 两组有效率比较检验功效的相关因素是
A. 检验水准和样本率
B. 总体率差别和样本含量
C. 样本含量和样本率
D. 总体率差别和理论频数
E. 容许误差和检验水准
答案:C C E C B
二、计算与分析
1.某神经内科医师观察291例脑梗塞病人,其中102例病人用西医疗法,其它189 例病人采用西医疗法加中医疗法,观察一年后,单纯用西医疗法组的病人死亡13例,采用中西医疗法组的病人死亡9例,请分析两组病人的死亡率差异是否有统计学意义?
2.某医院研究中药治疗急性心肌梗死的疗效,临床观察结果见下表。
问接受两种不同疗法的患者病死率是否不同?
两种药治疗急性心肌梗死的疗效
组别存活死亡合计病死率
(%)中药组65 3 68 4.41
非中药组12 2 14 14.29
合计77 5 82 6.10
3.某医师观察三种降血脂药A,B,C的临床疗效,观察3个月后,按照患者的血脂下降程度分为有效与无效,结果如下表,问三种药物的降血脂效果是否不同?
三种药物降血脂的疗效
药物有效无效合计
A 120 25
145 B 60 27 87 C
40 22 62
4.为研究某补钙制剂的临床效果,观察56例儿童,其中一组给与这种新药,另一组给与钙片,观察结果如表,问两种药物预防儿童的佝偻病患病率是否不同?
表 两组儿童的佝偻病患病情况
组别 病例数 非病例数 合计 患病率(%) 新药组 8 32 40 20.0 钙片组 6 10 16 37.5 合计
14
42
56
25.0
[参考答案]
本题是两组二分类频数分布的比较,用四个表2χ检验。
表中n =56>40,且有一个格子的理论频数小于5,须采用四个表2χ检验的校正公式进行计算。
(1)建立检验假设并确定检验水准
0H :21ππ=,即新药组与钙片组儿童佝偻病患病概率相同
1H :21ππ≠,即新药组与钙片组儿童佝偻病患病概率不同
α=0.05
(2)用四个表2χ检验的校正公式,计算检验统计量2χ值:
2
2(/2)()()()()c |ad -bc |-n n =a+b c+d a+c b+d χ=050.152141640562566321082
=⨯⨯⨯⨯⎪⎭
⎫ ⎝⎛
-⨯-⨯
ν=1
3. 确定P 值,作出推断结论
以ν=1查附表7的2χ界值表得()32.12125.0=χ,2χ<()2125.0χ, P > 0.05。
按
05.0=α水准,不拒绝0H ,无统计学意义,还不能认为新药组与钙片组儿童佝
偻病患病概率不同。
5.某医院147例大肠杆菌标本分别在A ,B 两种培养基上培养,然后进行检验,资料见下表,试分析两种培养基的检验结果是否有显著性差别? 表 A 、B 两种培养基上培养大肠杆菌标本结果
A 培养基
B 培养基
合 计 +
- + 59 36 95 - 15 37 52 合 计
74
73
147
[参考答案]
本题是一个配对设计的二分类资料,采用配对四个表资料的2χ检验。
(1)建立检验假设并确定检验水准
0H :C B =,即两种培养基的阳性培养率相等
1H :C B ≠,即两种培养基的阳性培养率不相等
05.0=α
(2)计算检验统计量
本例b +c =36+15=51> 40 ,用配对四个表2χ检验公式,计算检验统计量2χ值
c
b c b +-=22
)(χ=
()65.8153615362
=+-, 1=ν 3. 确定P 值,作出推断结论
查2χ界值表得P < 0.05。
按0.05α=水准,拒绝0H 。
认为两种培养基的阳性培养率不同。