SPSS数据整理及t检验
- 格式:ppt
- 大小:1.52 MB
- 文档页数:72
S P S S简明教程(X2检验和T检验)-CAL-FENGHAI.-(YICAI)-Company One1SPSS最适用的统计学方法(X2检验和T检验)1.SPSS的启动(1)在windows[开始]→[程序]→[spss20],进入SPSS for Windows对话框,2.创建一个数据文件三个步骤:(1)选择菜单【文件】→【新建】→【数据】新建一个数据文件。
(2)单击左下角【变量视窗】标签进入变量视图界面,定义每个变量类型。
(3)单击【数据视窗】标签进入数据视窗界面,录入数据库单元格内。
3.读取外部数据当前版本的SPSS可以很容易地读取Excel数据,步骤如下:(1)按【文件】→【打开】→【数据】的顺序使用菜单命令调出打开数据对话框,在文件类型下拉列表中选择数据文件,如图所示。
图 Open File对话框(2)选择要打开的Excel文件,单击“打开”按钮,调出打开Excel数据源对话框,如图所示。
对话框中各选项的意义如下:工作表下拉列表:选择被读取数据所在的Excel工作表。
范围输入框:用于限制被读取数据在Excel工作表中的位置。
图 Open Excel Data Source对话框4.数据编辑在SPSS中,对数据进行基本编辑操作的功能集中在Edit和Data菜单中。
5.SPSS数据的保存SPSS数据录入并编辑整理完成以后应及时保存,以防数据丢失。
保存数据文件可以通过【文件】→【保存】或者【文件】→【另存为】菜单方式来执行。
在数据保存对话框(如图所示)中根据不同要求进行SPSS数据保存。
图 SPSS数据的保存5. 数据分析在SPSS中,数据整理的功能主要集中在【数据】和【分析】两个主菜单下6.语言切换:编辑(E)—选项(N)--用户界面-语言--简体中文第六章:描述性统计分析(X2检验)完成计数资料和等级资料的统计描述和一般的统计检验,我们常用的X2检验也在其中完成。
6.1.1界面说明界面如下所示:分析—描述统计—频率用于定义需要计算的其他描述统计量。
数据的整理与分析chy一、数据收集-问卷星1、检查与剔除不合格问卷,比如答题时间太短、年龄不符合、问卷填写不完整等。
2、应答率/回收率:是指定的或者抽中的需要作答的对象中,最终完成作答的百分比。
3、合格率:合格数量/作答数量。
4、一般的,访问问卷的回收率最高,回收率一般要求在90%以上;邮寄问卷的回收率低,回收率在50%左右就可以了;发送式自填问卷的回收率一般,回收率要求在67%以上。
5、如果不高尽量不要写入,反而起反作用。
6、可以运用问卷星中的图与表描述,直观描述。
二、数据整理-Excel1、结果导出方式:文本、数字、分数,保存excel原版。
2、再另存一版你用于SPSS分析的表格。
3、注意反向计分的题目。
4、如果量表分为几个维度,可以单独列出来进行分析。
(如我发到群里的表格,可以用总分与其他条目分析,也可以用这个量表包括的几个维度分别与其他条目分析,观察其关联)。
5、如果分不清楚,可以标注一下变量的类型,如分类变量还是数据变量(如我的Excel的第二行,但是导入到SPSS中时需要删除)。
三、数据录入-SPSSSPSS中“变量视图”输入各变量如下:1、“类型”尽量都转换为“数字”;(选中右边的…)(点击“数字”即可)3、“值”的标记:(用于计数资料的标记,在结果中易于观察)点击…,分别输入对应的值和代表的标签,点击“添加”和确定即可4、“测量”分为三类:(1)标度:指计数资料,如年龄、108总分等;(2)有序:指等级资料,如年级等;(3)名义:指计数资料,如性别、性格等。
5、如何把计数资料转换为计量资料,即赋值(以“拖延总分为例”)步骤:(注意填写名称和标签,点击“变化量”) ----点击“旧值和新值”进行赋值:0-20赋值为1:--添加--20.1-40赋值为2:--添加--40.1-60赋值为3:--添加--然后“变量视图”最后一行就会出现新的变量“拖延分数三分类”,可以把“名义”改为“有序”,也可不改。
本学期一共学习了七项spss使用方法,分别是数据整理、数据的转换、t检验、方差分析、卡方检验、相关分析与回归方程、图表的制作与编辑。
我觉得spss对我用处非常大,就平时学习来说,我用它计算了几道生物统计题,完成了spss作业和数学建模作业。
因为实验指导书有几个实验实验方法与步骤很不详细,我还练习了写实验方法与步骤,但在写实验感受方面还有所欠缺。
统计学是一门研究随机事件的学科,这类偶然现象是遵循统计规律的,当随机现象是由大量的成份组成,或者随机现象出现大量的次数时,就能体现统计平均规律。
我们只有对数据资料作统计处理,才可能发现它们的内在规律,掌握现象的特征,检验研究的假设,才能得出准确的、可靠的研究结果。
每次实验我开始时都觉得很难,很多时候是因为不知道怎么做表格,比如做卡方检验的时候要交叉值表,一开始我都一直是认为应该把不同因素和不同水平放到不同列里,之后才发现同一因素要写在同一列里,然后在另一列里些他们的水平,这样就会被自动分开。
相关分析我到现在还有一点不明白。
相关分析和回归方程里的那几道题那些应该用相关分析做,那些应该用回归方程做,当然这是统计学方面的问题了。
我以后还要加强对实验结果的解读能力,spss给出的计算结果往往有双侧sig.值等,而我还不太会查表(有个别不清楚查那个表),所以一些题目没有写最终分析。
Spss作为一个工具,本身并无太多原理可言,主要是掌握它的使用方法。
数据输入主要是分为数据列表和变量列表。
和excel最不一样的是变量列表。
变量列表可以对变量名,变量类型作出规定。
而这些尤其是变量类型对后续的统计分析工作有很大影响。
数据整理很重要的一点是排序。
Spss可以先按一个变量排,再在此基础上按另一个变量排。
这是我以前不了解的一个功能。
1.在数据文件中单击菜单项“Data→Sort Cases”,在变量列表中选定按哪(几)个变量的值排序,并用箭头按钮将其移入Sort by矩形框中,单击按纽即会对数据文件中的case进行排序。
在统计学中,我们往往从样本的特性推知随机变量总体的特性。
但由于总体中个体之间存在差异,样本的统计量和总体的参数之间往往会有误差。
因此,均值不相等的样本未必来自不同分布的总体,而均值相等的样本未必来自有相同分布的总体。
也就是说,如何从样本均值的差异推知总体的差异,这就是均值比较的内容。
SPSS提供了均值比较过程,在主菜单栏单击“Analyze”菜单下的“Compare Means”项,该项下有5个过程,如图4-1。
平均数比较Means过程用于统计分组变量的的基本统计量。
这些基本统计量包括:均值(Mean)、标准差(Standard Deviation)、观察量数目(Number of Cases)、方差(Variance)。
Means过程还可以列出方差表和线性检验结果。
[例子]调查了棉铃虫百株卵量在暴雨前后的数量变化,统计暴雨前和暴雨后的统计量,其数据如下:暴雨前 110 115 133 133 128 108 110 110 140 104 160 120 120暴雨后 90 116 101 131 110 88 92 104 126 86 114 88 112该数据保存在“DATA4-1.SAV”文件中。
1)准备分析数据在数据编辑窗口输入分析的数据,如图4-2所示。
或者打开需要分析的数据文件“DATA4-1.SAV”。
图4-2 数据窗口2)启动分析过程在SPSS主菜单中依次选择“Analyze→Compare Means→Means”。
出现对话框如图4-3。
图4-3 Means设置窗口3)设置分析变量从左边的变量列表中选中“百株卵量”变量后,点击变量选择右拉按钮,该变量就进入到因子变量列表“Dependent List:”框里,用户可以从左边变量列表里选择一个或多个变量进行统计。
从左边的变量列表中选中“调查时候”变量,点击“Independent List”框左边的右拉按钮,该变量就进入分组变量“IndependentList”框里,用户可以从左边变量列表里选择一个或多个分组变量。
SPSS对数据进行T检验统计分析下面将做此项目的最后一个环节,即使用SPSS进行统计分析。
先用SPSS来做组设计两样本均数比较的T检验,其步骤如下。
(1)执行Analyze/Compare Means/Independent-Samples T test命令,打开如图1-43所示的对话框。
(2)在该对话框中选择X放入TEST列表框中,选择Group放入Grouping Variable文本框中,如图1-44所示。
图1-43 打开T检验对话框图1-44 选择入列表(3)单击Define Groups按钮,系统弹出比较组定义对话框,如图1-45所示。
(4)在该对话框中的两个值框中分别输入1和2,然后单击Continue按钮,如图1-46所示。
图1-45 比较组定义对话框图1-46 输入值(5)单击T检验对话框中的OK按钮,如图1-47所示。
图1-47 进行T检验(6)系统经过计算后,会弹出结果浏览窗口。
首先给出的是两组的基本情况描述,如样本量、均数等,然后是T检验的结果,如图1-48所示。
图1-48 T检验结果从上图中可见,结果分为两大部分:第一部分为Levene's方差检验,用于判断两体方差是否齐,这里的检验结果为F=0.032,p=0.860,可见在本例中方差齐;第二部分则分别给出两组所在部体方差齐和方差不齐时的T检验结果,即上面一行列出的T=2.542,V=22,p=0.019。
从而最终的统计结论为按=0.05水准,拒绝H0,认为克山病患者与健康人的血磷值是不同的。
从样本均数来看,可以确定克山病患者的血磷值较高。
《证券理论与实务》模块八考试精要(证券市场基础知识)模块八考试精要一、单项选择题1、涉及证券市场的法律、法规第一个层次是指()。
A、法律B、行政法规C、厂纪厂规D、部门规章2、涉及证券市场的法律、法规第二个层次是指()。
A、法律B、行政法规C、厂纪厂规D、部门规章3、涉及证券市场的法律、法规第三个层次是指()。
SPSS:数据分析3、T检验(TTest)⽅差分析(ANOVA)(Chi-squareTe。
⽬录1、数据采集2、数据是否服从正态分布3、T检验(T Test)4、⽅差分析(ANOVA)5、卡⽅检验(Chi-square Test)6、灰⾊关联度分析(Grey Relation Analysis,GRA)7、弗⾥德曼检验(Friedman Test)8、箱图(Box)1、数据采集1、数据分类定性观察、访谈、调查定量⼿动测量、⾃动测量、问卷打分主观等级、排序、感觉、有⽤性客观时间、数量、错误率、分数⾃变量不同的实验条件因素,研究的因素因变量不同的实验条件所影响的、要观测的因素连续数量值(preference)时间、数量、错误率------离散数量值(usability问卷打分等级数量值(usability)等级、排序变量类型Norminal Data 定类变量 | 变量的不同取值仅仅代表了不同类的事物,这样的变量叫定类变量。
问卷的⼈⼝特征中最常使⽤的问题,⽽调查被访对象的“性别”,就是定类变量。
对于定类变量,加减乘除等运算是没有实际意义的。
Ordinal Data 定序变量 | 变量的值不仅能够代表事物的分类,还能代表事物按某种特性的排序,这样的变量叫定序变量。
问卷的⼈⼝特征中最常使⽤的问题“教育程度“,以及态度量表题⽬等都是定序变量,定序变量的值之间可以⽐较⼤⼩,或者有强弱顺序,但两个值的差⼀般没有什么实际意义。
Interval Data 定距变量 | 变量的值之间可以⽐较⼤⼩,两个值的差有实际意义,这样的变量叫定距变量。
有时问卷在调查被访者的“年龄”和“每⽉平均收⼊”,都是定距变量。
Ratio Data 定⽐变量 | 有绝对0点,如质量,⾼度。
定⽐变量与定距变量在市场调查中⼀般不加以区分,它们的差别在于,定距变量取值为“0”时,不表⽰“没有”,仅仅是取值为0。
定⽐变量取值为“0”时,则表⽰“没有”。
t检验使用条件及在SPSS中的应用t检验是对均值的检验,有三种用途,分别对应不同的应用场景:1)单样本t检验(One Sample T Test):对一组样本,检验相应总体均值是否等于某个值;2)相互独立样本t检验(Independent-Sample T Test):利用来自某两个总体的独立样本,推断两个总体的均值是否存在显著性差异;3)配对样本t检验:是采用配对设计方法观察以下几种情形,1,两个同质受试对象分别接受两种不同的处理;2,同一受试对象接受两种不同的处理;3,同一受试对象处理前后。
下文将分别介绍三种t检验的使用条件以及在SPSS中的实现。
一、单样本t检验1.1简介1)单样本t检验的目的利用来自某总体的样本数据,推断该总体的均值是否与指定的检验值之间存在显著性差异,它是对总体均值的检验。
2)单样本t检验的前提样本来自的总体应服从和近似服从正态分布,且只涉及一个总体。
如果样本不符合正态分布或不清楚总体分布的形状,就不能用单样本t检验,而要改用单样本的非参数检验。
3)单样本t检验的步骤a)提出假设单样本t检验需要检验总体的均值是否与指定的检验值之间存在显著性差异,为此,,提出假设:给定检验值μH0:μ= μ(原假设,null hypothesis)H1:μ≠μ(备择假设,alternative hypothesis,)b)选择检验统计量属于总体均值和方差都未知的检验采用t统计量:t =X ̅−μ0S ̂√n ⁄,其中,X ̅和S ̂分别为样本均值和方差,t 的自由度为n-1SPSS 中还将显示均值标准误差,计算公式为S ̂√n⁄,即t 统计量的分母部分。
c) 计算统计量的观测值和概率将样本均值、样本方差、μ0带入t 统计量,得到t 统计量的观测值,查t 分布界值表计算出概率P 值。
d) 给出显著性水平α,作出统计判断给出显著性水平α,与检验统计量的概率P 值作比较。
当检验统计量的概率值小于显著性水平时,则拒绝原假设,认为总体均值与检验值μ0之间有显著性差异;反之,如果检验统计量的概率值大于显著性水平,则接受原假设,认为总体均值与检验值μ0之间没有显著性差异。
检验步骤总结:1、t检验2、方差分析3、卡方检验4、秩和检验5、相关分析6、线性回归1、t检验(要求数据来自正态总体,可能需要先做正态检验)(1)单一样本t检验数据特征:单一样本变量均数与某固定已知均数进行比较方法:ANALYZE—COMPARE MEANS-ONE SAMPLE t TEST(2)独立样本t检验数据特征:两个独立、没有配对关系的样本(有专门变量表示组数)方法:ANALYZE—COMPARE MEANS-INDEPENDENT SAMPLES t TEST注意观察方差分析结果,判断查看的数据是哪一行!(3)配对样本t检验数据特征:两个不独立的,有配对关系的样本(没有专门变量表示组数)方法:ANALYZE—COMPARE MEANS—PAIRED SAMPLES t TEST不需要方差分析结果检验步骤:(1)正态性检验1(有同学推荐,老师没有强调,但依据理论应进行)(2)建立假设(H0:。
来自同一样本。
H1:。
.。
不来自同一样本)(3)确定检验水准(4)计算统计量(依据上面不同样本类型选择检验方法,注意独立样本t检验要先注明方差分析结果)(5)确定概率值P(6)得出结论2、方差分析(要求数据来自正态总体,可能需要先做正态检验)(1)单因素方差分析数据特征:相互独立、来自正态总体、随机、方差齐性的多样本(有专门变量表示组数,且组数大于2)方法:ANALYZE—COMPARE MEANS—ONE WAY ANOVA注意需要在options 里面选择homogeneity variance test 做方差分析符合方差齐性才可以得出结论!(〉0.1)(2)双因素方差分析1正态性检验方法:analyze-explore-plot里面选择normality test数据特征:有三列数据,1列是主要研究因素,1列是配伍组因素,1列是研究数据。
方法:GENERAL LINEAR MODEL—UNIVARIATE (注意选择model里的custom,type是main effect,注意把两个因素选择为fixed factor)检验步骤:(1)正态性检验(有同学推荐,老师没有强调,但依据理论应进行)(2)建立假设(H0:.。
实习二 SPSS计量描述与t检验一、计量描述1.打开“例02-01.sav”数据,用frequencies菜单计算血清总胆固醇的均数、中位数、四分位数、标准差;用descriptives计算均数、标准差。
2.用explore计算均数、均数95%可信区间、中位数、四分位数间距、标准差等指标,并进行正态性检验。
二、t检验1.将P58【例7-1】数据输入SPSS,检验正态性,如正态性条件满足进行单样本的t检验。
【例7-1】某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。
问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?36名从事铅作业男性工人的血红蛋白含量的数据如下:112,137,129,126,88,90,105,178,130,128,126,103,172,116,125,90,96,62,157,151,135,113,175,129,165,171,128,128,160,110,140,163,100,129,116,1272.将P61【例7-2】数据输入SPSS,检验配对差值的正态性,如正态性条件满足进行配对设计的t 检验。
【例7-2】为比较两种不同方法对乳酸饮料中脂肪含量测定结果是否不同,随机抽取了10份乳酸饮料制品,分别用脂肪酸水解法和哥特里-罗紫法测定其结果如下表第(1)-(3)栏。
问两种测定结果是否不同。
两法测定乳酸饮料中脂肪含量的结果编号(1) 哥特里-罗紫法(2)脂肪酸水解法(3)1 0.840 0.5802 0.591 0.5093 0.674 0.5004 0.632 0.3165 0.687 0.3376 0.978 0.5177 0.750 0.4548 0.730 0.5129 1.200 0.99710 0.870 0.506合计……3.将P63【例7-3】输入数据SPSS,分组检验正态性,并检验两组的方差齐性,如正态性和方差齐性条件满足,进行完全随机设计的t检验。
t 检验使用条件及在SPSS 中的应用t 检验是对均值的检验,有三种用途,分别对应不同的应用场景:1) 单样本t 检验(One Sample T Test ):对一组样本,检验相应总体均值是否等于某个值;2) 相互独立样本t 检验(Independent-Sample T Test ):利用来自某两个总体的独立样本,推断两个总体的均值是否存在显著性差异;3) 配对样本t 检验:是采用配对设计方法观察以下几种情形,1,两个同质受试对象分别接受两种不同的处理;2,同一受试对象接受两种不同的处理;3,同一受试对象处理前后。
下文将分别介绍三种t 检验的使用条件以及在SPSS 中的实现。
一、 单样本t 检验1.1简介1) 单样本t 检验的目的利用来自某总体的样本数据,推断该总体的均值是否与指定的检验值之间存在显著性差异,它是对总体均值的检验。
2) 单样本t 检验的前提样本来自的总体应服从和近似服从正态分布,且只涉及一个总体。
如果样本不符合正态分布或不清楚总体分布的形状,就不能用单样本t 检验,而要改用单样本的非参数检验。
3) 单样本t 检验的步骤a) 提出假设单样本t 检验需要检验总体的均值是否与指定的检验值之间存在显著性差异,为此,给定检验值μ0,提出假设:H 0:μ = μ0 (原假设,null hypothesis )H 1:μ ≠ μ0(备择假设,alternative hypothesis ,)b) 选择检验统计量属于总体均值和方差都未知的检验采用t 统计量:t =X ̅−μ0S ̂√n ⁄,其中,X ̅和S ̂分别为样本均值和方差,t 的自由度为n-1SPSS 中还将显示均值标准误差,计算公式为S ̂√n⁄,即t 统计量的分母部分。
c) 计算统计量的观测值和概率将样本均值、样本方差、μ0带入t 统计量,得到t 统计量的观测值,查t 分布界值表计算出概率P 值。
d) 给出显著性水平α,作出统计判断给出显著性水平α,与检验统计量的概率P 值作比较。