利用SPSS17.0软件进行卡方检验
- 格式:doc
- 大小:116.50 KB
- 文档页数:3
SPSS数据的参数检验和方差分析参数检验和方差分析是统计学中常用的两种分析方法。
本文将详细介绍SPSS软件中如何进行参数检验和方差分析,并提供一个示例来说明具体的操作步骤。
参数检验(Parametric Tests)适用于已知总体分布类型的数据,通过比较样本数据与总体参数之间的差异,来判断样本数据是否与总体相符。
常见的参数检验包括:1. 单样本t检验(One-sample t-test):用于比较一个样本的均值是否与总体均值相等。
2. 独立样本t检验(Independent samples t-test):用于比较两个独立样本的均值是否相等。
3. 配对样本t检验(Paired samples t-test):用于比较两个相关样本的均值是否相等。
4. 卡方检验(Chi-square test):用于比较两个或多个分类变量之间的关联性。
接下来,将以一个具体的实例来说明SPSS软件中如何进行单样本t检验和卡方检验。
实例:假设我们有一个数据集,记录了一所学校不同班级学生的身高信息。
我们想要进行以下两种分析:1. 单样本t检验:假设我们想要检验学生身高平均值是否等于169cm(假设总体均值为169cm)。
步骤如下:b.选择“分析”菜单,然后选择“比较均值”下的“单样本t检验”。
c.在弹出的对话框中,选择需要进行t检验的变量(身高),并将值169输入到“测试值”框中。
d.点击“确定”按钮,SPSS将生成t检验的结果,包括样本均值、标准差、t值和p值。
2.卡方检验:假设我们想要检验学生身高与体重之间是否存在关联。
步骤如下:a.打开SPSS软件,并导入数据集。
b.选择“分析”菜单,然后选择“非参数检验”下的“卡方”。
c.在弹出的对话框中,选择需要进行卡方检验的两个变量(身高和体重)。
d.点击“确定”按钮,SPSS将生成卡方检验的结果,包括卡方值、自由度和p值。
方差分析(Analysis of Variance,简称ANOVA)用于比较两个或以上样本之间的均值差异。
用SPSS对问卷调查中多选题数据进行的卡方检验福建省教育科学研究所林斯坦多选题,又叫复选题、多重应答题或多重响应题,计算此类问卷题时,用SPSS处理比单选题稍复杂,都要先定义变量集,然后才能进行频率的统计和交叉分析。
如下图。
但是,SPSS对多重响应虽然能进行频率统计和交叉表分析,却不能在其操作界面上直接进行卡方检验。
现将解决这个问题的方法介绍如下。
一、多重应答题整体分析的卡方检验下面一问卷题有五个选项,可多选。
现在想了解对这个问题选项的不同选择频率之间是否存在显著的差异。
例:您认为,中小学教师职称聘任的主体最好应当是:[多选题]A.学校;B.中心校或学区;C.县级教育行政部门;D.设区市级教育行政部门;E.省级教育行政部门如同一般多选题的频率统计,把这个五个选项定为五个二分变量,每个变量的取值为0或1,以表示该项是否被选中。
第一:把这个五个选项定义为一个变量集。
“分析”--“多重响应”---“定义变量集”。
在“将变量编码为”方框中选择“二分法”,“计数值”输入“1”;“名称”和“标签”输入相应的内容,点击“添加”到“多响应集”。
第二:对变量集进行频率分析。
“分析”---“多重响应”---“频率”。
将“多响应集”中的相应名称添加到“表格”第三:把得到的五个选项各项的频率,重新制成SPSS表格。
一个变量命名为“聘任主体”,数值为1,2,3,4,5,分别表示这五个选项,另一变量命名为“频率”,即刚得到的变量集的频率。
可分别对“聘任主体”的五个选项1,2,3,4,5赋予标签。
第四:个案加权频率。
“数据”--“加权个案”--“频率加权”。
(这一步很重要)第五:可以对五个选项被选中的频率进行分析。
“分析”--“非参数检验”--“卡方检验”,(SPSS第19版要选择“旧对话框”)把变量(聘任主体)选入检验变量中即可。
结果说明,对这五个选项被选中的频次存在着显著的差异。
二、多重应答题交叉分析的卡方检验例:您认为教师绩效考核主体最好是:(可多选)A、教育行政部门B、教育督导部门C、学校领导层D、教代会E、家长委员会F、其他回答这个题目的样本总体中有男有女,我们想检验不同性别对这五个选项被选中的频率是否有差别。
SPSS超详细操作:卡⽅检验(R×C列联表)医咖会之前推送过⼀些卡⽅检验相关的⽂章,包括:卡⽅检验(2x2)、卡⽅检验(2xC)、配对卡⽅检验、分层卡⽅检验等。
今天我们再和⼤家分享⼀下,如何⽤SPSS来做RxC列联表的卡⽅检验。
⼀、问题与数据研究者拟分析购房⼈与购房类型的关系,共招募了在过去12个⽉中有过购房记录的333位受试者,收集了购房⼈类型(buyer_type)和房屋类型(property_type)的变量信息。
其中研究对象类型按照单⾝男性(single male)、单⾝⼥性(single female)、已婚两⼈(married couple)和多⼈家庭(family)分类;房屋类型按照楼房(flat)、平房(bungalow)、独栋别墅(detached house)和联排别墅(terrace)分类,部分数据如下图。
其中,Individual scores for each paticipant(左图)列出了每⼀个研究对象的情况,⽽Total count data (frequencies)(右图)则是对相同情况研究对象的数据进⾏了汇总。
⼆、对问题的分析研究者想分析多种购房⼈类型与多种房屋类型的关系,建议使⽤卡⽅检验(R×C),但需要先满⾜3项假设:假设1:存在两个⽆序多分类变量,如本研究中购房⼈类型和房屋类型均为⽆序分类变量。
假设2:具有相互独⽴的观测值,如本研究中各位研究对象的信息都是独⽴的,不会相互⼲扰。
假设3:样本量⾜够⼤,最⼩的样本量要求为分析中的任⼀期望频数⼤于5。
本研究数据符合假设1和假设2,那么应该如何检验假设3,并进⾏卡⽅检验(R×C)呢?三、SPSS操作1. 数据加权如果数据是汇总格式(如上图中的Total count data),则在进⾏卡⽅检验之前,需要先对数据加权。
如果数据是个案格式(如上图中的Individual scores for each paticipant),则可以跳过“数据加权”步骤,直接进⾏卡⽅检验的SPSS操作。
SPSS详细操作:配对卡⽅检验(McNemar’stest)⼀、问题与数据某研究者想要观察戒烟⼲预的效果,招募了50名研究对象,其中吸烟者和不吸烟者各25名。
所有研究对象均观看吸烟导致癌症的视频。
两周后,研究者询问研究对象是否还在吸烟。
研究者收集了所有研究对象的⼲预前吸烟状态(before)和⼲预后吸烟状态(after)。
两个变量均为⼆分类变量,即不吸烟与吸烟(分别赋值为1和2),部分数据如下图。
其中,Individual scores for each paticipant列出了每⼀个研究对象的情况,⽽Total count data (frequencies)则是对相同情况研究对象的数据进⾏了汇总。
⼆、对问题的分析研究者想了解同⼀⼈群⼲预前后的吸烟状态,且吸烟状态为⼆分类变量。
针对这种情况,可以使⽤McNemar’s检验,但需要先满⾜2项假设。
假设1:变量为⼆分类,且两类之间互斥。
假设2:所有研究对象均有前后两次测量数据。
这2项假设均与研究设计和数据类型有关。
三、SPSS操作1. 数据加权如果数据是汇总格式(如上图中的Total count data),则在进⾏卡⽅检验之前,需要先对数据加权。
如果数据是个案格式(如上图中的Individual scores for each paticipant),则可以跳过“数据加权”步骤,直接进⾏SPSS操作。
数据加权的步骤如下:在主界⾯点击Data→Weight Cases,弹出Weight Cases对话框后,点击Weight cases by,激活Frequency Variable窗⼝。
将freq变量放⼊Frequency Variable栏,点击OK。
2. McNemar’s检验在主界⾯点击Analyze→Nonparametric Tests→Related Samples。
出现Nonparametric Tests:Two or More Related Samples对话框。
SPSS实例:四格表卡方检验我们先来讲一个案例,我们想要知道两个年龄组的儿童在同一个问题上回答的正确性是否不同,统计出来的四格表是这样的:年龄组分为0和1两个水平,是否正确分为0和1两个水平,怎样检验不同年龄组回答正确性是否相同?这就用到了四格表卡方检验。
从上表中知道,表中任何一个单元格的数字都大于5,说明可以使用正常的卡方检验,如果有一个或者多个单元格数字少于5,需要进行精确卡方检验,以后会有教程。
下面先看一下具体这个案例的操作过程:情况1:有原始数据1.原始数据的数据结构,见下图。
在这里没有频数,只有年龄组和是否正确这两个牟龄组是杏正确00 .aoM.00 1.00.00 .001.00 i.ao1.00t&o1.00.001 00 .001.0C,001.00 1.001.00too1 00 1 001.00 1.001.00 1.001.00 1.0Ctoo too1.00 .001.00 i.ao1.00 1001.0 0.001.00变量I ' '-U 1LL2.在菜单栏上执行:分析--描述统计--交叉表I :"分言芒方绘邂怎吕九[DataSetl] - 1BV SPSS Statistics Data Editor^File Edit View Data Transforn Anahze Direct Marketing Graphs Utilities ^dd-ons V二H日5厂杯组■异H-FF融33GQ( 34 00q35co36 0037too¥Re£3rt5Des:ripWe StalisicsTaotesCumpdie MidribCentral Linear ModelLinearMixed MedelsCorrelateReg'e&sion0 Freque-icieE...]D escripfives...■ Ratio.. 耳三叭:心;3.将年龄组设置为行变量,是否正确设置为列变量;然后设置统计量,点击statistic4.勾值 卡 方 样 选 才这5.首先看到的表格是基本的频数统计,没什么好说的,大家都懂6.看第二个表格是最关键的信息,我们看sig值,如果小于0.05就可以认为达到了显著水平,拒绝虚无假设,认为年龄对答案的正确性产生了影响b Cori puled OTily toi a 2x2 laal^情况2 :没有原始数据假如没有原始数据,只有一个四个表,如下图:Count我们只需要将数据进行加权就可以了。
梅毒螺旋体抗体测定方法比较目的:对胶体金法、酶联免疫法(ELISA)、免疫发光法、凝集法(TPPA)四种梅毒螺旋体抗体测定方式进行比较。
方法:选取我院60份确诊为梅毒患者的血清,同时抽取60例健康人群的血清,对四种检测方式进行比较。
结果:四种检测方法中凝集法检测率为100%,准确率最高,酶联免疫法与免疫法光法的阳性平均检出率为98%,而胶体金法的梅毒阳性检出率为95%,且假阳性出现比例为3%,与其他三种检测率比较,p<0.05,差异具有统计学意义。
结论:胶体金法在操作中简便快速,但假阳性假阴性均有发生,质量控制没有另外三种方法好,凝集法检出率最高,为最准确的梅毒抗体检测方式。
标签:梅毒螺旋体抗体;胶体金;测定梅毒是一种由苍白密螺旋体苍白亚种病毒所引起的疾病,本病起病较慢,是一种全身性的疾病,主要通过性来传播。
由于本病对患者的伤害较大且发病缓慢,因此本病的早期诊断是非常重要的。
血清诊断为主要的诊断方式,目前在临床中通常有胶体金法、酶联免疫法、免疫发光法、凝集法四种,本院将对四种抗体测定方式进行研究比较,寻找准确率最高的测定方式。
1资料与方法1.1一般资料选取我院2012年3月——2014年3月间60份确诊为梅毒患者的血清,同时抽取60例健康人群的血清,60例梅毒患者中有37例为一期梅毒患者,16例为二期梅毒患者,7例为三期梅毒患者。
所有患者血清均来自于我院体检以及住院部患者群中,所有标本收集完成后均行血清分离处理,放置冰箱保存。
1.2仪器试剂方法一:胶体金法(SYP)试剂来源:北京万泰生物药业股份有限公司。
方法二:酶联免疫法(ELISA)仪器:科华ST-360酶标仪试剂来源:英科新创(厦门)科技有限公司。
方法三:免疫发光法(CMIA)仪器:ABBORT C16200 全自动生化免疫分析仪,试剂配套。
方法四:凝集法(TPPA)试剂来源:富士瑞必欧珠式会社。
1.3结果观察对四种测定方式测定的梅毒阳性率进行比较,并做好详细记录。
在医学论文写作中,通常要用到Pearson卡方检验。
用途:用于检验两个或多个率或构成比的差别有无统计学意义的方法。
它常用于四格表和行列资料的分析,基于无效假设成立时理论频数与实际频数的差别不大的思想进行假设检验。
它对样本量有一定的要求,样本量条件不满足时,需使用其他方法如校正卡方或确切概率法检验。
对下面一组数据分别进行卡方检验。
2005-2007年高一新生HBSAg检测结果
?
1.分组1=男生 2=女生;类别 1=阳性人数 2=阴性人数
2.打开SPSS界面:
3.编辑菜单,插入变量→类别、分组、频数。
4.在类别、分组、频数中输入相应数值。
5.数据菜单,个案加权→选中频数→单击确定。
6.分析菜单→描述统计→交叉表→把分组加入到行,把类别加入到列, 单击统计量,选中卡方,单击继续,单击确定。
7. 卡方检验(X2)结果显示如下:
8.依照上述方法可以对2006年及2007年进行卡方检验(X2)结果,其结果分别为、。