统计方法spss实例:四格表卡方检验
- 格式:doc
- 大小:932.00 KB
- 文档页数:6
Q:如何在SPSS中实现四格表的卡方检验?A:在多数统计软件中,四格表(和行*列表)的数据格式均为行变量、列变量和频数变量。
如下面这个四格表的数据及相应格式如下:分析时首先选择菜单Data->Weight Cases,将频数变量选入Frequency格中,按OK确认。
此时系统就会以频数表的形式来读取所输入的数据,既记录数应为34+12+23+26=95例,而不是4例。
然后选择菜单Analyze->Descriptive Statistics->Cross Tables,将行、列变量分别选入相应的Row、Column格中,再按下方的Statistics钮,选中左上角的Chi-square复选框,按Continue钮,最后按OK即可。
Spss电脑实验-第三节(1) 您要打印的文件是:Spss电脑实验-第三节(1) 打印本文Spss电脑实验-第三节(1)作者:佚名转贴自:本站原创点击数:74第三节不同对象有关指标发生率(百分比)间的比较Ⅰ.两种对象率(百分比)间的比较—四格表χ2 检验χ2 检验(chi-square test),χ为希腊文字母,读作 [kai](卡);chi-square读作“卡方”;χ2检验即“卡方检验”。
它是一种用途较广的假设检验方法,是分析计率或百分比及某些等级资料常用的方法,可分析两个或两个以上率(或百分比)差别的显著性。
1. 两个样本率(百分比)比较—一般四格表的χ2检验四格表的χ2检验用于分析两组或两组以上率(或百分比)差别的显著性。
χ2 = ∑[(∣A - T∣)2 / T ].....................................(3-1)式中 A 为四格表各格子中的实际数,T 为理论数。
χ2 =(ad-bc)2 n / [(a+b)(c+d)(a+c)(b+d)].........................(3-2)例如: 某医院用两种疗法(drug)治疗慢性肾炎病人,结果(effect)西药组有效率为 79.7%(63/79);中药组有效率为87.0(47/54),见表 3-1-a。
独立样本:1. 两独立样本的四格表分析;多组独立样本的R*C列联表分析(双向无序,单向有序,双向有序属性相同,双向有序属性不同)2. 配对样本:3. 配对四个表分析;配对 R*R列联表分析;4. 趋势卡方检验5. 卡方分割与卡方合并1.1两独立样本的四格表分析基本思想:两总体率的比较;两分类变量的相关性分析;两组分布的比较;应用条件:当n > 40且所有T >5时,用普通卡方检验;所得p疋a,改用确切概率法;当n > 40但有1 < T< 5时时,改用校正卡方检验;当n < 40或有T v 1时,不能用卡方检验,改用确切概率法。
報13-1 不同砂癌料柞用下大白載的发庙率先要将频数进行个案加权:Data--weight cases分别选入行列*I9 8HF 4Uz-1 T SPi«e £*t yew QMagihj g 2O 口_k og2MiZsm s f a --s --c 甘滋弟 「Giwil^g麗一¥cm壘盅sSUEEHWvla 匸空鴛■t f l E n f — r E FM】一* 一E k器lg 3....工窖EVN02寄IrlF mn m lG£莎:0S -3£K 3»『号£NgrTtE5hi一常歳一gntngmnrs n s s<mdO I A nlcndari>『arwnm¥r r w l *aK.4FI赴「«!tau-krrueNW■n4chfllri.・ s &1£8d —TriMlWW总丿、“F IBM 硒即丹伽2 Editor —口;A曹:方爲■1 1M)1i i w3 1W q4 2M2912 u |g 叶chjslerM 沖chads鼻DIM最后选择Continue 苗 1 HMStabc Cell OtfMjyE^pKhd H«K trnaiciwnb-C4H1£* WlUE PfMHmn iK| ?i>ju^r;凤8o・』^3Hitar>lz»diDFlai 4J4US N Si3n4vdi»d ripnwTivyfr■ q$md • mmC' NauAffC^A* 申町he Ci Tiur也It ea|.lC T IMW I B cats irtigg^0 Nfr jkjiLrabiaria[A P A IM J ' Cud ,:g」(注:表格素材和资料部分来自网络,供参考。
SPSS实例:四格表卡方检验我们先来讲一个案例,我们想要知道两个年龄组的儿童在同一个问题上回答的正确性是否不同,统计出来的四格表是这样的:年龄组分为0和1两个水平,是否正确分为0和1两个水平,怎样检验不同年龄组回答正确性是否相同?这就用到了四格表卡方检验。
从上表中知道,表中任何一个单元格的数字都大于5,说明可以使用正常的卡方检验,如果有一个或者多个单元格数字少于5,需要进行精确卡方检验,以后会有教程。
下面先看一下具体这个案例的操作过程:情况1:有原始数据1.原始数据的数据结构,见下图。
在这里没有频数,只有年龄组和是否正确这两个牟龄组是杏正确00 .aoM.00 1.00.00 .001.00 i.ao1.00t&o1.00.001 00 .001.0C,001.00 1.001.00too1 00 1 001.00 1.001.00 1.001.00 1.0Ctoo too1.00 .001.00 i.ao1.00 1001.0 0.001.00变量I ' '-U 1LL2.在菜单栏上执行:分析--描述统计--交叉表I :"分言芒方绘邂怎吕九[DataSetl] - 1BV SPSS Statistics Data Editor^File Edit View Data Transforn Anahze Direct Marketing Graphs Utilities ^dd-ons V二H日5厂杯组■异H-FF融33GQ( 34 00q35co36 0037too¥Re£3rt5Des:ripWe StalisicsTaotesCumpdie MidribCentral Linear ModelLinearMixed MedelsCorrelateReg'e&sion0 Freque-icieE...]D escripfives...■ Ratio.. 耳三叭:心;3.将年龄组设置为行变量,是否正确设置为列变量;然后设置统计量,点击statistic4.勾值 卡 方 样 选 才这5.首先看到的表格是基本的频数统计,没什么好说的,大家都懂6.看第二个表格是最关键的信息,我们看sig值,如果小于0.05就可以认为达到了显著水平,拒绝虚无假设,认为年龄对答案的正确性产生了影响b Cori puled OTily toi a 2x2 laal^情况2 :没有原始数据假如没有原始数据,只有一个四个表,如下图:Count我们只需要将数据进行加权就可以了。
独立样本:
1.两独立样本的四格表分析;多组独立样本的R*C列联表分析(双向无序,单向有序,双向有序属性相同,双向有序属性不同)
2. 配对样本:
3. 配对四个表分析;配对R*R列联表分析;
4. 趋势卡方检验
5. 卡方分割与卡方合并
1.1两独立样本的四格表分析
基本思想:两总体率的比较;两分类变量的相关性分析;两组分布的比较;
应用条件:当n≥40且所有T≥5时,用普通卡方检验;所得p≈a,改用确切概率法;
当n≥40但有1≤T≤5时时,改用校正卡方检验;
当n≤40或有T<1时,不能用卡方检验,改用确切概率法。
先要将频数进行个案加权:Data--weight cases
分别选入行列
在Statistic中选择Chi-squre
如果想要行列信息的话,在Cell即单元格中选定行列百分比
最后选择Continue。
χ2卡⽅检验——独⽴样本四格表资料Spss Statistic 23在卫⽣统计中的应⽤10χ2统计量, 是由⽪尔逊(Karl Pearson)于1899年提出来的, 它是度量实际频数与理论频数之间的偏差的统计量。
公式表⽰为:A为实际频数(actual frequency)T为理论频数(theoretical frequency)⼀、⼲什么事情,要注意条件,不同样本,应⽤的公式不⼀样。
1.所有的理论数T≥5并且总样本量n≥40,⽤Pearson卡⽅进⾏检验。
2.如果理论数T<5但T≥1,并且n≥40,⽤连续性校正的卡⽅进⾏检验。
3.如果有理论数T<1或n<40,则⽤Fisher’s检验。
⼆、例题(P150)1、建⽴spss数据⽂件2、加权个案点击“频数”,选择为加权变量点击“确定”,加权结束。
我初学是不理解“个案加权”的意思,这⾥解释共⼤家参考:当数据⽂件中存在有⼤量相同的变量值时,增加⼀个频数变量来表⽰相同变量值出现的频数,可带来很⼤的便利,变量加权就可⽤于设定某个变量为频数变量。
3点击菜单点击“统计”按钮,勾选“卡⽅”点击继续,点击“单元格”,勾选“期望”点击“继续”——“确定”,输出如下:备注:其中期望计数57.8、27.2、57.2、26.8 是理论频数,理论频数的计算请见书本P151页。
统计量的值是“⽪尔逊卡⽅”计算得到4.130,p值未0.042<0.05,所以两种药物治疗消化道溃疡的愈合率有显著差异,⽤统计学的话讲:两个样本来源于不同总体。
“连续修正b” :连续性校正卡⽅值(df=1,只⽤于2*2列联表);在2X2表格中,特别是某格的预期次数要⼩于等于5的,需要看修正的卡⽅。
(这⾥没有意义)似然⽐:对数似然⽐法计算的卡⽅值(类似⽪尔逊卡⽅检验),这个概念⽐较难懂,请同志们参考其它资料吧。
如果您觉得有⽤处请点个“赞”!(您的⿎励是我继续下去的动⼒)。
四格表的卡方检验1.录入数据:组(Row,R),图1中的gr1,例如医学中常见的实验组和对照组;列(Column,C),图1中的gr2,例如医学中的阳性和阴性;频数,也就是各个格子(Cell)中的例数,这里是实际频数。
这几个项目分别成一列(见图1)。
图1.2.定权重:先在Data中找到Weight case(见图2-1),打开后见图2-2,此时将ff选作权重(见图2-3),点·“OK”,完成此步。
图2-1图2-2图2-33.打开列联表设置:从Analyze(分析)菜单中找到Descriptive Statistics(描述性统计),再找到Crosstabs(列联表),打开(见图3-1)图3-1进入该界面后(见图3-2),将gr1加入行(Row),而gr2加入列(Column)(图3-3)。
图3-2图3-3此时,根据分析目的,打开Statistics(统计),选择统计方法,这里我们是要对两个组的率进行比较,所以选择卡方检验Chi-squair和kappa(见图3-4)。
点Continue(继续),继续下一步设置。
图3-4现在,再对Cell(格子)进行设置,点击Cells,选定Observed(实际频数)和Expected(理论频数)(图3-5),如果要计算率,可以继续选R和C。
还可以选残差(Residuals).这里举例没有再分析这些内容。
图3-54.结果解释:选完上面这些,就可以点击“OK”了,这时结果就出来了(图4)第1个表就是经典的四格表,每个格子上面数字为实际频数,下面数字是理论频数。
第2个表格是卡方检验的结果,根据适应条件:四格表,n>=40,理论频数>=5,随机成组两组设计的计数资料,适宜使用Pearson 卡方检验,结果:卡方值(value)23.117,自由度(df);1,双侧概率(Asymp.Sig.)(2-sided);0.000.结论:按照双侧a=0.05的水准,拒绝两组率相等的假设,可以认为两组的(阳性)率有差别。
卡方检验1.四格表的卡方检验例1.某药品检验所随机抽取了574名成年人,研究某抗生素的耐药性。
其中179人未曾使用该抗生素,其耐药率为%;而在395例曾用过该药的人群中,耐药率为%,结果见表1,试兑现人和上人群的耐药率是否一样表1 某抗生素的人群耐药性情况用药史不敏感敏感合计曾服该药180()215()395未服该药73()106()179合计253321574建立变量名:录入数值:加权统计分析指定横标目和纵标目,注意不要选反了,选反了会有什么后果择分析方法:卡方检验Chi-square结果:实际频数理论频数表一:总例数为574,没有数值遗漏表二:可观察实际频数,理论频数,各组实际频数占各行各列及总数的百分比。
此例题总例数n=574≥40,且所有理论频数T≥5用基本公式或四个表专用公式计算卡方值,结果参照表三第一行。
P=≥还不能认为两组耐药率不同。
表三:(1)总例数n=574≥40,且所有理论频数T≥5用基本公式或四格表专用公式计算卡方值,结果参照表第一行。
(2)如果n≥40但有1<T<5用校正公式计算卡方值或用Fisher确切概率法直接计算概率,结果分别参照第二行和第四行。
(3)n<40或T<1时用Fisher确切概率法直接计算概率,结果参照第四行。
2.配对四格表的卡方检验例5.有28份咽喉涂片标本,把每份标本一分为二,分别接种在甲、乙两种白喉杆菌培养基上,观察白喉杆菌生长的情况,其结果如表5,问两种培养基的阳性检出率是否相等表5 两种白喉杆菌培养基培养结果比较乙培养基甲培养基+-合计+11112-9716合计20828建立变量名:录入数值:统计分析:结果:3.R*C表(行或列超过两个)的卡方检验(1)多个样本率的比较例6.某医院用三种方案治疗急性无黄疸型病毒性肝炎结果如下,问三种疗法的有效率是否一致表6三种方案治疗肝炎疗效的结果比较组别有效无效合计有效率(%)西药组5149100中药组354580中西结合591574145109254建立变量名:录入数值:统计分析:结果分析:理论均数均大于5,卡方值为。
独立样本:
1.两独立样本的四格表分析;多组独立样本的R*C列联表分析(双向无序,单向有序,双向有序属性相同,双向有序属性不同)
2. 配对样本:
3. 配对四个表分析;配对R*R列联表分析;
4. 趋势卡方检验
5. 卡方分割与卡方合并
1.1两独立样本的四格表分析
基本思想:两总体率的比较;两分类变量的相关性分析;两组分布的比较;
应用条件:当n≥40且所有T≥5时,用普通卡方检验;所得p≈a,改用确切概率法;
当n≥40但有1≤T≤5时时,改用校正卡方检验;
当n≤40或有T<1时,不能用卡方检验,改用确切概率法。
先要将频数进行个案加权:Data--weight cases
分别选入行列
在Statistic中选择Chi-squre
如果想要行列信息的话,在Cell即单元格中选定行列百分比
最后选择Continue。
卡方检验1.四格表的卡方检验例1.某药品检验所随机抽取了574名成年人,研究某抗生素的耐药性.其中179人未曾使用该抗生素,其耐药率为40。
78%;而在395例曾用过该药的人群中,耐药率为45。
57%,结果见表1,试兑现人和上人群的耐药率是否一样?表1 某抗生素的人群耐药性情况用药史不敏感敏感合计曾服该药180(174.10)215(220.90)395未服该药73(78。
90)106(100.10)179合计253 321 574建立变量名:录入数值:加权统计分析指定横标目和纵标目,注意不要选反了,选反了会有什么后果?择分析方法:卡方检验Chi-square结果:实际频数理论频数表一:总例数为574,没有数值遗漏表二:可观察实际频数,理论频数,各组实际频数占各行各列及总数的百分比。
此例题总例数n=574≥40,且所有理论频数T≥5用基本公式或四个表专用公式计算卡方值,结果参照表三第一行。
P=0.285≥0.05还不能认为两组耐药率不同.表三:(1)总例数n=574≥40,且所有理论频数T≥5用基本公式或四格表专用公式计算卡方值,结果参照表第一行。
(2)如果n≥40但有1<T<5用校正公式计算卡方值或用Fisher确切概率法直接计算概率,结果分别参照第二行和第四行。
(3)n<40或T<1时用Fisher确切概率法直接计算概率,结果参照第四行。
2.配对四格表的卡方检验例5.有28份咽喉涂片标本,把每份标本一分为二,分别接种在甲、乙两种白喉杆菌培养基上,观察白喉杆菌生长的情况,其结果如表5,问两种培养基的阳性检出率是否相等?表5 两种白喉杆菌培养基培养结果比较甲培养基乙培养基+ —合计+ 11 1 12—9 7 16合计20 8 28 建立变量名:录入数值:统计分析:结果:3.R*C表(行或列超过两个)的卡方检验(1)多个样本率的比较例6.某医院用三种方案治疗急性无黄疸型病毒性肝炎结果如下,问三种疗法的有效率是否一致?表6三种方案治疗肝炎疗效的结果比较组别有效无效合计有效率(%)西药组51 49 100 51。
独立样本:
1.两独立样本的四格表分析;多组独立样本的R*C列联表分析(双向无序,单向有序,双向有序属性相同,双向有序属性不同)
2. 配对样本:
3. 配对四个表分析;配对R*R列联表分析;
4. 趋势卡方检验
5. 卡方分割与卡方合并
1.1两独立样本的四格表分析
基本思想:两总体率的比较;两分类变量的相关性分析;两组分布的比较;
应用条件:当n≥40且所有T≥5时,用普通卡方检验;所得p≈a,改用确切概率法;
当n≥40但有1≤T≤5时时,改用校正卡方检验;
当n≤40或有T<1时,不能用卡方检验,改用确切概率法。
先要将频数进行个案加权:Data--weight cases
然后进行卡方分析:Analyze--Describtive statistic-- crosstabs 分别选入行列
在Statistic中选择Chi-squre
如果想要行列信息的话,在Cell即单元格中选定行列百分比
最后选择Continue。
SPSS实例:四格表卡方检验
我们先来讲一个案例,我们想要知道两个年龄组的儿童在同一个问题上回答的正确性是否不同,统计出来的四格表是这样的:
年龄组分为0和1两个水平,是否正确分为0和1两个水平,怎样检验不同年龄组回答正确性是否相同这就用到了四格表卡方检验。
从上表中知道,表中任何一个单元格的数字都大于5,说明可以使用正常的卡方检验,如果有一个或者多个单元格数字少于5,需要进行精确卡方检验,以后会有教程。
下面先看一下具体这个案例的操作过程:
情况1:有原始数据
1.原始数据的数据结构,见下图。
在这里没有频数,只有年龄组和是否正确
这两个变量
2.在菜单栏上执行:分析--描述统计--交叉表
3.将年龄组设置为行变量,是否正确设置为列变量;然后设置统计量,点击
statistic
4.勾选卡方值,这样才能输出卡方值
5.首先看到的表格是基本的频数统计,没什么好说的,大家都懂
6.看第二个表格是最关键的信息,我们看sig值,如果小于就可以认为达到
了显着水平,拒绝虚无假设,认为年龄对答案的正确性产生了影响。
情况2:没有原始数据
假如没有原始数据,只有一个四个表,如下图:
我们只需要将数据进行加权就可以了。
下面是具体的步骤:
1.先整理数据,数据结构见下图
2.接着进行加权
3.用频数进行加权,点击
ok
4.接下来的步骤都是一样的,见上面。