当前位置:文档之家› spss数据处理基础

spss数据处理基础

spss数据处理基础
spss数据处理基础

第一篇 SPSS数据处理基础

本篇要点导读:

第1章 SPSS数据的录入

数据录入的一般步骤,数据结构的定义,文件合并,文本数据的导入;

第2章数据文件的操作和预处理

【Data】菜单中对变量和案例的操作,【Transform】菜单中计数和分类赋值的操

作。

本篇说明:

1. 本篇重点说明数据录入和文件整理的整个过程,以及过程中特别需要读者注意的问题,对于SPSS操作简明扼要,没有对每一个选项进行详细说明,只是配合例题针对常用和重点选项进行说明,如读者想了解详细说明请查阅相关书籍,本书会给出标示。在以后的章节中我们也会遵循这一原则,不再特别说明;

2. 如果读者是有一定的SPSS使用基础,了解SPSS的一些基本操作,对数据录入和预处理比较清楚,可以简略浏览本篇,重点了解数据录入的一般流程和预处理中注意的问题。也可直接略过本篇从第二篇开始学习;

3. 如果读者是SPSS初学者,由于本篇在软件操作上的介绍比较简略,请初学者在学习此篇的时候一定遵循我们的例题操作并注意图例标示,必要时查阅书中列出的相关参考书籍,并完成课后两道以上的习题操作,务求掌握此篇内容,为以后SPSS软件学习奠定基础。

『 2 』

第1章SPSS数据的录入

第1章SPSS数据的录入

SPSS既是Statistical Package for the Social Science(社会科学统计软件包)的缩写,也是Statistical Product and Service Solution (统计产品与服务解决方案)的缩写,是世界上几大统计分析软件(SPSS、SAS、S-plus/R、STA TA、GUASS)中使用最广泛,界面最友好,操作最方便的统计软件,其强大的功能和易掌握性对于非统计专业特别是经济和管理专业的学生和工作人员,是一个不可多得的统计分析和数据处理的好工具、好助手。本书将基于SPSS 17.0给读者介绍SPSS的强大功能,关于SPSS的安装和一般Windows应用软件没有什么不同,让我们从SPSS的基础——建立数据文件和录入数据开始吧。

1.1 SPSS数据文件的建立和数据录入

在本节中我们从一个简单例题入手,让读者了解SPSS是如何建立数据文件,以及如何录入数据的。

表1.1车险投保人的数据1

性别年龄交通事故数性别年龄交通事故数

男23 2 女25 1

男35 1 女24 3

男26 1 女31 1

男25 0 女26 0

男28 2 女26 0

男31 1 女29 0

男23 1 女22 2

男31 3 女25 5

首先,进入SPSS软件,双击桌面上的SPSS图标,或者从“开始”菜单→“所有程序”→“SPSS Statistics”→“SPSS Statistics”图标进入软件,将会看到如图1-1的软件界面:

在启动SPSS后,一般先进入一个导航框,其中有一些常用操作和上次使用过的数据文件和结

果文件等,不用太过理会导航框,直接选择Cancel就可以进入软件主界面。

1为节省篇幅,表中仅列出部分投保人案例,完整数据请见光盘中的数据集1-1

第一篇 SPSS 数据处理基础

在软件界面中,除了看到与一般软件相同的菜单、快捷按钮以外,还可以看到灰色的“变量(英文界面是Var )”和“1、2、3”分别代表变量和案例,由于我们还没有建立任何变量和案例,所以这些都是灰色的。在界面的右上角可以看到“Visible :0 of 0 Variables ”表明数据中共有0个变量,可见的是0个变量。接下来我们就在这个操作界面中建立变量和案例。

关于变量和案例,分别对应操作界面的列和行,这与一般的数据库软件相同,有些书称为变量和记录,统计上通常称为指标和样本,意思大同小异。

图 1-1 SPSS 软件界面

建立SPSS 数据文件和一般的数据库文件建立的考虑基本相同,主要是两个步骤:

Step1:定义文件的数据结构;

Step2:录入数据。

在Step1中,重点需要考虑用多少个变量,每个变量的结构,例如是整数型变量还是浮点小数型变量,小数位数取多少合适,变量取值是否代表某种分类,需要如何显示等等;在Step2中,主要考虑根据案例的多少来决定是一个人单独输入所有数据还是多人分别输入然后合成完整的数据。下面我们结合例题具体讲解。

1.1.1 SPSS 的数据文件结构

在本例中,我们主要考虑三个变量,分别是投保人的性别、年龄和发生的交通事故次数。其中性别是一个分类变量,它只有男、女两个值;对于年龄,是一个整数型变量;而交通事故次数也是一个整数型变量。以上就是对变量的考虑。对于案例,由于总共有500个案例,单独输入工作量过大,因此可以考虑分别录入再进行合并。

接下来我们就在SPSS 中定义变量的结构。图1-1的软件操作界面左下角有两个类似Excel 工作表一样的选项卡,分别叫做【Data View 】和【Variable View 】,其作用和Excel 工作表的平行数据表大不相同,有着严格的分工:【Variable View 】称为【变量视图】,专门用于定义SPSS 变量的结构,而【Data View 】称为【数据视图】,用于对案例的录入;换言之,变量视图只用于定义结构,不能用于录入数据,相反数据视图只用于录入数据,不能定义变量结构,对于不同的操作要在不同的视图中完成,这一点请读者务必明确。例如,接下来我们要先定义变量的结构,就应该在【Variable View 】中定义。 案例1、案例2… 变量

总共有多少个变量,其中可见的

有多少个变量

数据视图和变量视图

第1章 SPSS 数据的录入

『 4 』

点击【Variable View 】选项卡,进图1-2如下操作界面:

可以看到在此视图中,每一行代表一个变量,本例题定义3个变量,因此有3行,列名称中分别有“Name ”、“Type ”等,我们已经在图上做出了标示,此处就不赘述了,只是对于重点的几个列进行说明:

“Name ”菜单表示变量名称,可以用英文字母、数字和下划线给变量命名,也可用中文命名,但是不推荐使用中文作为变量名。

从SPSS 10.07后,就可以用汉字给变量命名,以前要求变量名长度不超过8个字符,即4个汉字,在SPSS 13.0以后放宽到64个字符,所以可以用汉字命名;但是SPSS 的汉字兼容性不太好,以前笔者使用汉字命名时,不止一次分析结果的变量名出现乱码,因此不推荐使用汉字作为变量名,强烈推荐用英文命名变量,变量名标签用汉字说明变量的含义。

图 “Type ”表示变量类型,总共有“Numeric ”数值型、“Comma ”逗号型、“String ” 字符串型等八种类型供选择,一般使用数值型就可以了2;需要特别说明的是,字符串型变量不能用SPSS 进行分析,只能起案例名称标注的作用,因此要分析的变量都要转化为数值型变量,例如,本例题中性别这个变量就要转化为取值为1和2的变量,不能直接使用“男”、“女”作为变量值。

“Label ”变量名标签的作用非常巨大,由于变量名标签和变量是绑定显示的,在变量分析和显示分析结果时可以一目了然了解变量的含义,对于SPSS 的使用者都要养成给变量添加变量名标签的习惯,本例中,对每个变量我们都根据其含义指定了变量名标签,在以后的学习中读者将体会到变量名标签的方便。

“Value ”变量值标签也是非常重要的,对于分类变量和定序变量,一般只能取有限的几个值,前面已经了解必须要对其进行编码才能用于SPSS 分析,这可以通过编制变量值标签来实现,还可以说明每个取值代表什么含义,例如,本例题性别变量中,我们用1代表“男”,用2代表“女”,这就需要在变量值标签中说明,一旦编制了变量值标签,软件在分析时按照数字进行分析,在显示时按照变量值对应的文字进行显示,这样大大方便对结果的理解。我们通过下述操作编制变量值标签:

点击变量值标签“V alue ”下对应变量的单元格,出现,点击右边的三个小点,出现如图1-3所示对话框,在Value 框中填写“1”,在Label 框中填写“男”,说明在SPSS 性别变量中取值为1代

2关于变量类型的说明,可以参看薛薇编著,《统计分析与SPSS 应用》,北京人民大学出版社

第一篇 SPSS 数据处理基础

表是男性,定义好后,点击

添加定义,将在右边的框中显示定义,以后还可以对右边框中定义进行修改(对应按钮)和删除(对应

按钮)。重复操作可以定义取值为2代表是女性。定义好的标签如图1-4。定义好标签以后,点击,完成变量值标签的定义,以后可以类似定义变量值标签。另外两个变量“年龄”和“交通事故数”由于不是分类变量,不需要编制变量值标签。

图1-3 添加变量值标签的操作 图1-4 添加好的变量值标签

“Measure ”变量的尺度,分为三种, “Scale ”称为间隔尺度,说明变量取值有大小之分,并且变量值的差代表差异程度,本例中的“年

龄”和“交通事故次数”就属于间隔尺度,有些书籍也称为“定量变量”;

“Ordinal ”称为顺序尺度,说明变量取值有大小之分,但是变量值仅表示顺序先后,变量值的差不

能代表差异程度,本例中没有顺序尺度变量,但是我们经常接触到的产品分级,职称高低、学历高低都属于顺序尺度变量,有些书籍也称为“定序变量”;

“Nominal ”称为名义尺度,说明变量取值没有大小之分,不同变量取值只表示案例属于不同的分类,

例如本例中的性别就属于名义尺度,1和2仅仅代表“男”和“女”两个分类,也称为“定类变量”。

其实变量的尺度非常好判断,首先判断变量取值有没有代表大小,如果没有,那一定是名义尺度,如果取值代表了大小,再看取值相减有没有意义,如果没有意义,那就是顺序尺度,有意义就是间隔尺度。

根据本例中的变量尺度,我们应该将第一个变量“性别”定义为名义尺度,第二个变量和第三个变量定义为间隔尺度。对于尺度的定义很简单,用鼠标点击“Measure ”下变量对应的单元格

点击右侧的箭头打开下拉菜单,进行相应选择就可以了。 通过以上的定义,我们基本定义好了变量结构3,回到【Data View 】,我们看到有三个变量的名称变成了我们刚才定义的变量名,并且变黑了,但是案例的1、2、3还是灰色的,说明虽然定义了变量结构,但还没有输入任何的案例数据。

3关于变量其他属性的定义和说明,请参看张文彤《SPSS11统计分析教程》,北京希望电子出版社。

取值的实际含义,文字

添加定义

『 6 』

第1章SPSS数据的录入

如果读者对变量要求不高,也可以不定义变量直接在【Date View】中输入案例数据,此时会使用缺省变量名“var00001”、“var00002”等来命名变量,但是在以后的分析中我们将发现没有定义变量结构将会有许多不便,想节省时间,结果反而浪费更多时间。所谓“磨刀不误砍柴工”,推荐读者在使用SPSS分析数据时,都先定义变量结构再录入数据。

1.1.2SPSS的数据录入

现在我们开始变量录入的工作了,如果说变量结构定义是设计整个数据文件的框架和大梁,那么现在的工作就是往框架中添砖加瓦,这是整个数据录入阶段最基础,也是最累人,工作量最大的操作了,但是没有办法,只有一条条案例往数据里敲。这个和任意一个数据录入软件如Excel没有太大差异,只是中间有一些技巧和窍门,是笔者使用的心得,现在和读者共享,读者在使用SPSS中多多总结,也会发现自己的窍门。

数据录入的一些技巧:

1. Copy & Paste 方法,在数据录入过程中,要充分利用Copy & Paste 方法,例如,变量输入中有多个单元格数值相同,则可以输入第一个单元格数值,然后Copy单元格数值,选中第二个单元格,按住Shift键再点最后一个单元格,再点鼠标右键,选择Paste,就可以一次输入多个单元格内容,例如在本例中前250个性别变量取值都是1,则可以如此操作,一次输入所有的1;

2. 如果数据在Excel或者其他数据库文件中,则可以直接在Excel中复制数据内容,再在SPSS中点击第一个单元格,选择Paste,就可以输入数据了,最后别忘了,如果数据没有定义变量结构一定要补充定义变量结构;

3. Word,或者文本格式中,也可以选择复制和粘贴,只不过必须确定全部是数值,否则在粘贴的过程中会出现问题,会使得文本在SPSS中变成缺失值,这是因为SPSS默认变量类型是数值型,对于字符型变量就处理成缺失值了。对于此种情况的处理办法我们在第二节将介绍。

数据编辑的一些技巧

1. 如果在数据录入中想快速找到某一条案例,可以选择Edit菜单→Go to case,输入案例编号,点确定系统就会定位到该案例的位置,如果不知道案例号,只是知道某变量的取值,可以选择Edit菜单→Find,输入要查找的值,一个个查找案例即可;

2. 充分利用变量值标签,此处显示出变量值标签的一个优势,只需选择View菜单→Value labels或者点击快捷按钮上的,此时所有定义了变量值标签的变量输入可以利用下拉菜单完成,点击每个单元格时,右侧会出现箭头,点击会出现下拉菜单,选择下拉菜单的选项就可以完成输入,本例中性别变量就可以按此快速输入;

用此功能检查变量输入是否出错也很方便,选择Value labels后,有变量值标签的变量所有单元格将显示变量值的说明,例如在本例中,取值为1的单元格中将出现“男”,取值为2的单元格中将出现“女”,如果单元格中不出现“男”或“女”而出现数值,那就说明输入时出错了。

3. 如果数据量较大,此时单独录入容易疲劳,越到后面越容易出错,此时最好在定义好了数据结构以后,将案例分成多份,由多人输入,形成多个数据文件再合并,这样可以提高录入效率,减少录入错误,例如本例就可以将案例数据分成两份,男性案例和女性案例各为一份,由两人分别录入,再进行文件合并,文件合并的操作将在下一小节介绍。

第一篇SPSS数据处理基础

1.1.3 SPSS数据文件的合并

上一小节我们将数据量较大的数据分成两份录入,形成了两个数据文件,比如1-1-1和1-1-2,接下来的问题是如何将两个数据文件的数据合并到一个问卷中,有读者会问,直接把1-1-2的内容复制下来粘贴到1-1-1中不就完了吗?实际上没有这么简单,SPSS是单窗口软件,打开1-1-1文件必须先关闭1-1-2,伴随文件关闭,剪贴板中的内容也不在了,复制粘贴操作必须借助第三方软件,例如Excel;但是随着SPSS版本的升高,SPSS已经从一个单窗口软件变成多窗口软件,这个问题已经不再那么突出,但是我们还是加以介绍,让读者了解文件合并的操作。

以前SPSS是一个单窗口的软件,不能同时打开两个数据集文件1-1-1和1-1-2,这就使得Copy & Paste数据必须先打开1-1-2,将其内容复制粘贴到Excel中,再打开1-1-1,将Excel中的内容复制粘贴到1-1-1。SPSS17.0已经可以同时打开多个数据集文件了,复制粘贴也可以直接从1-1-2到1-1-1,因此以前的困难现在已经不再存在,这也算是一个进步吧。

读到此处,读者也许会觉得,问题已经解决了,不需要再往下说了,但是这其中还有问题,比如,两个文件完全采用了不同的变量顺序,比如1-1-1按照性别、年龄、交通事故次数的顺序输入数据,1-1-2却按照年龄、交通事故次数、性别的顺序输入数据,此时直接复制粘贴就会张冠李戴,行不通了;也许读者会问,那我调整一下变量顺序不就行了,没什么问题啊,在变量不多的情况下,例如本例,确实可以这样操作,但是如果变量很多,要调整顺序也许就是一个非常麻烦的事情了。有没有一个让变量自动“识别”,自动“对齐”的办法呢?办法就是SPSS文件合并。

SPSS的文件合并分为纵向合并和横向合并,因为纵向合并是在已有数据的下面增加案例,所以称为“Add Cases”,同理,横向合并是在已有数据的右边增加变量,因此称为“Add Variables”。到底采用横向合并还是纵向合并是根据待合并文件的结构和数据录入的分工来决定的。

如果数据录入分工是每人录入一部分案例(通常的情形),那待合并文件的结构就是全部的变量相同,但是案例不同,此时该使用纵向合并增加案例;如果数据录入分工是每人录入一部分变量(当然这样做效率比较低),那待合并文件的结构就是全部的案例相同,变量不同,当然选横向合并增加变量,很简单吧!

无论是纵向合并还是横向合并,都有一个如何对齐的问题,我们先来介绍纵向合并,既然是纵向增加案例,当然是按照变量对齐,按照如下操作:

Step1:打开第一个文件1-1-1,

Step2:选择【Data】菜单→【Merge Files】菜单→【Add Cases】菜单

图1-5

出现图1-5对话框该对话框是询问待合并文件是已打开的文件还是磁盘上存储的文件,选择已打开的文件可以在已打开文件列表中直接选取,选择磁盘文件必须指定路径,由于本例中文件1-1-2已经打开,

第1章 SPSS 数据的录入

『 8 』 故直接选取,如果没有打开请从第二个选项中指定路径。

Step3:选择文件,点击按钮

图1-6 纵向合并文件选项对话框

出现图1-6对话框,左边框中是为配对的变量,分别来自两个文件,来自当前文件变量名后有“*”,来自打开或者磁盘文件的变量名后有“+”,右边框中是合并后文件的变量,我们通过中间两个按钮将变量从左边选到右边,可以选择两个文件中意义相同的变量,点击“pair ”按钮配对生成右边一个变量,表示这两个变量的值对齐生成合并后文件的一个变量,也可以直接选择一个变量,不经过配对,直接点击箭头按钮直接进入合并后文件,此时由于没有变量与之对齐,将会在相应位置出现缺省值;还可以勾选文件来源复选框,将在合并后的文件中新生成一个变量用来记录案例是来自哪个文件。

感觉很复杂吧,其实不难,对于两个文件中变量名相同的变量,SPSS 会自动配对,比如本例就是自动配对的;所以如果想操作简单,就把两个文件中意义相同的变量取同样的名字吧!当然名字不同也可以配对,例如第一个文件中性别变量名是gender ,第二个文件中是sex ,选择两个变量点pair ,右边会生成一个新变量gender&sex ,&前面是第一个文件中的变量名,&后面是第二个文件中的变量名,是不是感觉容易些了?当然,你也可以通过rename 按钮将第二个文件的变量名改为gender ,那么点配对以后,右边框中只会出现gender 这个变量名了。

关于缺省值,我们说明如下:变量配对以后不会在合并后的文件中产生缺省值,变量不经过配对直接进入合并后文件,会产生缺省值,如果变量来自第一个文件,那第二个文件没有变量与之对齐,所以第二文件的案例在该变量上是缺省值,反之,第一个文件案例在变量上时缺省值;判断变量有没有配对主要看右边框中变量名后面有没有跟着“*”或者“+”。

Step4:选项选择完成后,点击按钮,完成文件的纵向合并

由于本例题中所有意义相同的变量的名称都一样,因此变量自动配对对齐,纵向合并的操作非常简单,这从一个方面说明预先定义变量结构的方便性。

下面介绍横向合并,需要说明的是,纵向合并在实际中使用比较多,而横向合并使用很少;这一方面是因为它效率低,另一方面也是因为它在SPSS 上的操作比纵向合并复杂,假如我们在进行输入工作分工的时候不是按照案例将输入分工,而是按照变量将输入分工,当然这样分工比较奇怪,因为对于不同案例的输入可以同时进行,而对于不同变量的输入一般不能同时进行,除非有很多个数据的备份,否则在甲输入第一个变量的时候,他必须使用所有的数据,其他输入员就只有等着,效率当然就低了,这个现象在市场调查问卷录入时尤其明显;但是横向合并也有自己的用武之地,比如已有许多变量数据了,后来需要补充输入几个变量,此时可以将要补充的数据形成一个新的文件,再运用横向合并添加到已有文件中,这种情况在市场补充调查中有一些应用。

第一篇SPSS数据处理基础

我们先不管基于什么原因,我们的输入工作确实是按照变量分工的,各录入员也录入数据得到了各自的文件,比如本例中,一个输入员输入性别和年龄变量,另一个输入员输入交通事故次数这个变量,得到两个文件1-1-3和1-1-4,下面将两文件合并。

横向合并是在横向增加变量,当然其对齐的标志只能是案例了,必须清楚每个变量值添加到那个案例后面,为此需要建立一个关键变量,每个案例在此变量上取值都不同,关键变量通常是编号(ID),两个文件都有编号这个关键变量以后,我们就知道5号案例的交通事故次数要加在5号案例的性别和年龄之后,而不会加在2号案例的后面,这样就实现了对齐,不会出错了。

纵向合并要求变量和变量能区分,以便清楚性别的值接在性别后面而不是年龄的值后面,这很容易,因为SPSS中不同变量的变量名必须是不同的,变量是自然区别的;横向合并要求案例能区分,这就不那么容易了,因为两个案例完全可以在所有变量上取值都相同,因此,本例中我们需要增加一个编号变量,保证每个案例在编号上取值不同!当然,如果数

据本身有编号这个变量,我们就省下力气了。

当然,用于区分案例的变量不一定是编号,只要是每个案例取值全不相同的变量就可以作为关

键变量,所以,关键变量就好像是一个“案例识别器”,运用它就可以把每个案例准确识别出来,就好像给每个案例发一个“身份证”,每个案例的“身份证号”都不相同。

当保证两个数据文件中都有关键变量以后,就可以进行横向合并了,其操作如下:

Step1:打开第一个文件1-1-3,

Step2:选择【Data】菜单→【Merge Files】菜单→【Add Variables】菜单

图1-7 合并文件选项

出现图1-7对话框,设置基本相同,此处是选择磁盘文件1-1-4而不是已打开文件。

Step3:选择文件,点击Continue按钮,出现图1-8对话框

对于此选项框,按照图上标示,将关键变量“编号(ID)”选入“Key Variable”框中,并确定案例是按此变量升序排列,右边的“New Active Dataset”框中是合并后新文件中将出现的变量,左边的“Excluded Variables”框中是剔除的变量,将不会出现在新文件中,选中一个变量,点击中间箭头按钮,就可以将变量从一个框移到另一个框,这样就可以决定新文件中将出现哪些变量了,例如,本例中,新文件中将会有性别、年龄和交通事故次数,当然,还有关键变量“编号”。

第1章 SPSS 数据的录入

『 10

图1-8 横向合并选项框

Step4:选项选择完成后,点击按钮,完成文件的横向合并4

感觉横向合并比纵向合并更难了,事实确实如此,横向合并的关键是选择关键变量(Key Variable ),关键变量找好了就成功了一半,然后再将需要在新文件中出现的变量选入“New Active Dataset ”就大功告成,可以直接点OK 了,这个讲解不太难了吧。

现在我们已经能够建立SPSS 数据文件的变量结构,并通过键盘输入数据了,如果输入工作量太大,还可以进行分工后运用文件合并功能高效的生成文件;但是在数据分析中,数据用SPSS 格式保存的太少了,接下来的一节将介绍如何利用SPSS 将已有的其他格式文件转化为SPSS 格式。

1.2 从其他文件中导入数据建立SPSS 数据文件

SPSS 不仅可以自己建立数据文件,还可以将其他应用程序生成的数据文件转化为SPSS 的数据文件,SPSS 良好的兼容性也是其广泛应用的基础;我们从互联网上,数据库中,或者其他数据处理软件上得到的数据,都能够方便的转化为SPSS 数据文件进行分析处理,SPSS 不能处理的数据文件是很少的。由于数据文件主要以三种形式存储:应用软件数据文件形式、数据库文件形式还有文本形式,下面我们就分小节对这三种形式的文件分别说明。

1.2.1 从电子表格文件中读入数据

随着MS Excel 广泛用于办公和简单数据处理,电子表格文件(后缀名为.xls )成为非常常见的一类数据文件,对于小型或者零散的数据,多数用电子表格文件记录;另外,《中国统计年鉴》以及一些省市的年鉴数据,也是用电子表格文件发布的,因此,掌握了电子表格文件转化为SPSS 数据文件的方法,无形中我们的数据来源就丰富了许多。下面通过一个具体的例子让大家了解转化的过程。

4关于案例来源单选框,解释起来很复杂,而且用处不大,就用默认选项就好了,有兴趣读者可以参看相关书籍。

然后选择关键变量-ID

最后点此确定关键变量

第一篇 SPSS 数据处理基础

由于SPSS 能够直接打开电子表格文件,因此,转化的过程可以归纳为三步:

Step1:选择【File 】菜单→【Open 】菜单→【Data 】 打开电子表格文件,或者直接点击快捷按钮,进入如图1-9打开文件对话框,按照图上表示,点击打开类型下拉菜单,选择Excel 文件类型,电子表格文件1-2将会出现,再选中此文件,点,出现如图1-10对话框,该对话框询问是否要从第一行读取变量名,以及读取变量的范围,点击复选框,其他选项用默认值,点

,将数据读入到SPSS ;

图1-9 打开文件对话框 图1-10 读取变量对话框

Step2. 处理缺失值(如果出现缺失值)或者字符变量的值 数据读入以后,我们看到变量已经有变量名了,但是有两个变量取值是字符型,分别是“Ptid ”变量和“Clinic ”变量,通过查看变量,我们了解了前一个变量是类似编号的编号,可以保持字符型,但是后一变量是表示案例来自那个诊疗科的类别数据,因此要对此变量进行重新编码,将A 、B 、C 、D 对应编码为1、2、3、4,将该变量转化为数值型。

Step3. 定义变量结构

为每个变量添加变量名标签,为“Clinic ”和“Sex ”变量添加变量值标签,定义好变量结构。正确的变量结构如图1-11所示

图1-11 变量结构示例图

这样,数据就导入完毕,可以将数据保存为SPSS 数据文件了(见光盘1-2.sav )。

SPSS 从其他的应用软件(如SAS )中读取文件操作类似,这里就不再赘述了,留作读者练习。 选择文件类型下拉菜单

中的Excel 文件类型

『12

第1章SPSS数据的录入

1.2.2 从数据库文件中读入数据

数据库文件是另外一种常用的数据存储格式文件,从专业数据库中得到的数据大多采用此种格式存储,现今使用越来越多的数据仓库,从中获取的数据也多是用数据库文件格式存储的;因此,掌握从数据库文件中读入数据对于扩展SPSS数据源是非常重要的。下面通过一个例子说明如何读取:

从数据库文件中读取数据类似于从电子表格中读取数据,大体也分为三步(和上面相同,此处不列出):

Step1:选择【File】菜单→【Open】菜单→【Data】

出现如图1-9所示打开文件对话框,点击打开类型下拉菜单,选择数据库格式“.dbf”,选择文件“1-3.dbf”点,将数据读入SPSS;

Step2:对数据集文件进行必要的修改

如图1-12可以看到,读入的数据不很规范,因此需要对数据文件进行整理,将中文变量名改成英文,去掉多余的变量“D_R”,将变量名“n1”改为“yearmon”,表示年月,对数据也进行整理,去掉第一个无效案例。

图1-12 数据库文件的读入数据结构

Step3:定义变量结构

除“yearmon”保持不变,其余变量全部转化成数值型,变量长度指定为8,同时添加变量名标签,将变量显示宽度调整为8,变量尺度也全部变成“Scale”。修改好的数据文件保存为SPSS文件(见光盘“1-3.Sav”)。

上面介绍的是比较简便的读取数据库文件的方法,另外SPSS还提供数据库向导的方式读入数据库文件,分为三步:

Step1:选择【File】菜单→【Open DataBase】菜单→【New Query】

将看到图1-13所示的数据库向导窗口,看到SPSS提供三种数据库读入向导:dBase、Excel、Access 格式,光盘中有1-3.xls的Excel文件,因此我们选择第2种文件格式,因此选择第2个向导选项,点击“Next”;进入一个文件路径对话框,指定路径后点击“Ok”,即进入如图1-14所示的变量选择对话框;

5数据来源:中经网数据库

第一篇 SPSS 数据处理基础 Step2:选择变量、案例、变量名等相关设置

图1-14左边变量框列出Excel 工作表中的所有变量,可以将变量选到右边的变量框中,右边的变量框中是将被读入SPSS 文件的变量,中间按钮用于选择变量,右边的两个按钮用于调整变量的顺序,选择好变量后,点击“Next ”,进入案例选择对话框,如图1-15所示;

一般说来都会读取全部案例,所以这个对话框将不会有任何操作,直接点“Next ”进入下一对话框。

读者可以通过指定条件只读取满足条件的案例,但是我们并不推荐这样做,一方面是因为此处指定条件比较麻烦,必须熟悉数据库的操作,另一方面也因为读取全部案例以后在SPSS 中进行选取更加方便。

图1-16是变量名称、变量类型和变量显示长度定义对话框,将名称改为英文,将变量类型修改为数值型,再将变量长度修改为8个字符,点击“Next ”进入最后一个对话框,显示数据库选择语法,不用理会,直接点击“Finish ”完成设置,读入数据。

Step3:定义变量结构

为每个变量添加变量名标签,需要的话添加变量值标签,指定变量类型,这些操作和上面类似,就不再赘述了。

图1-13 数据库向导窗口 图1-14 变量选择对话框 选择Excel Files

后点此按钮

调整变量

顺序按钮

第1章 SPSS 数据的录入

『 14

图1-15 案例选择对话框 图1-16 变量名、变量类型、长度等定义对话框 1.2.3 从文本文件中读入数据

文本格式文件是另外一大类数据存储格式,由于文本文件容量小,便于存储和传输,我们从互联网下载的数据,就有很多是用文本格式存储的;国外的很多研究机构和调查公司发布数据,也偏爱文本格式,因此,我们必须掌握将文本格式数据导入SPSS 中,才能将数据文件的建立掌握的更全面。

SPSS 能够导入两种格式的文本文件,分别是后缀名为.txt 和.dat 的文件,从文本文件向SPSS 导入数据相对比较复杂,我们也为读者准备了一个例子,用这个例子一步步讲解数据导入的过程。

Step1:选择【File 】菜单→【Read Text Data 】

进入如图1-9的打开文件对话框,然后在文件类型下拉菜单中选择“Text ”,在文件列表中选中1-4.txt 文件,点击“Open ”,进入文本文件向导。 读者也可以选【File 】菜单→【Ope n 】→【Data 】进入打开文件对话框,然后在文件类型下拉菜单中选择文本文件(后缀名为.txt ),点击,同样会进入文本文件向导流程。

变量名称中文改成英文

变量长度改

成8个字符

第一篇 SPSS 数据处理基础

图1-17 文本导入对话框1 图1-18 文本导入对话框2

Step2:完成文本导入设置 在图1-17的中,主要询问是否已有一个导入模式用于导入文本,由于是第一次导入数据,没有模式,所以选“No ”,点击“Next ”进入图1-13文本导入对话框2。

在图1-18中,主要询问两个问题,问题1询问文本中变量的组织形式,一般选择第1选项“由分隔符将变量分开”,第2选项“变量被指定固定宽度”,只有在变量数据没有分开是才选择。问题2询问第一行是否是变量名,通过观察下面的数据内容,可以确定第一行是变量名,因此,问题2选“Yes ”。

图1-19 文本导入对话框3 图1-20 文本导入对话框4 进入图1-19,主要询问3个问题,问题1,数据从哪一行开始,如果前面选了第一行是变量名,数据就从第二行开始,此处用默认值就可以;问题2,案例是如何安排的,选项1“每行表示1个案例”适用于案例分行放置的数据,选项2“每个案例由X 个变量值组成”,其中X 在后面的框中选择,适用于案例不分行连续放置的数据;问题3,读取案例的数目,选项1“案例全部读取”,选项2“读取前X 个案例”,选项3“随机读取X%的案例”,在本例中,数据按行放置,要全部读取,因此问题2和3都选1选项。

进入图1-20,选择变量之间的分隔符,分隔符有跳格、空格、逗号、分号和自定义符号,可以复选,分割符选择正确以后下方的数据会自动分开对齐变量,如果没有分开对齐变量,说明分隔符没选对。

后面还有一些对话框,都不重要了,直接一直点“Next ”,然后点“Finish ”完成文件读取。

Step3:定义变量结构

『16

第1章SPSS数据的录入

千万不要忘记定义变量结构,指定变量类型,添加必要的变量名标签和变量值标签,数据文件建立过程结束将文件保存成SPSS数据文件(见光盘1-4.sav)。

最后一个对话框,询问是否将读取文件的设置存储为固定的模式,以便下次读取文件时使用,如果是一次读取多个文件,推荐保存模型,再次读取时就可以在对话框1直接载入模式直接读取,提高效率。

【本章知识点】

数据文件的建立是SPSS分析的基础,而且为了以后的使用和分析方便,在建立数据文件时尽量做到变量清楚,结构完善,特别注意添加变量名标签和变量值标签。

数据文件的打开和数据导入是从二手数据获得SPSS数据集的重要途径,读者应该熟练掌握直接打开Excel文件、数据库文件和SAS数据集文件的操作;清楚利用文本向导和数据库向导从相应格式文件中读入数据的步骤,并掌握其SPSS操作。

数据合并和提高SPSS数据录入效率的有效途径,读者应该仔细区别纵向合并和横向合并从应用条件、对齐标准、SPSS操作等诸多方面的不同,并能够根据实际情况的需要灵活的运用两种文件合并的技术,迅速完整的输入数据。

【思考和练习】

1. SPSS文件和普通的数据文件如Ecxel文件和数据库文件有什么不同,其特点是什么?

2. SPSS对一手数据和二手数据的录入上有没有不同?如何处理这两类数据?

3. 随机附赠的光盘中有一个bp5.sas7bdat的SAS数据集文件,请利用SPSS打开文件的功能打开此文件,并为其定义适当的变量结构。

4.对照书籍利用1-4.txt文件重新熟悉文本导入的操作,并自行寻找一个文本格式的数据文件练习数据导入的操作。

5. 对照数据利用1-3.xls文件熟悉数据库文件导入的操作,并自行寻找一个数据库文件练习数据导入操作。

Spss数据处理方法

Spss数据处理方法 1.打开软件,新建文件,双击变量一栏,出现一个表格,在名称一栏中依次填写指标名称 (只能是字母),输入后其他栏自动显示,小数点可调整到3,其他可不变;同时要输入组别名称 2.输完后在视图中点数据,就会出现数据栏,在相应的指标名称下输入数据,在组别名称 下输入样本标记,每组样本用同一个数字表示。 3.输完后点窗口上面的分析下拉菜单中的比较均衡,其中有单因素方差分析,出现对话框, 因变量中输入指标名称,因子中输入组的名称。 4.对话框中有选项,对比,两两比较,选项中描述性和两两比较中的LSD必选,其他的 项目也可以选,选完后确定就可以了。 LSD最小显著性差别S-N-K waller-duncan dunnett Tukey检验scheffe多重比较 Bonferroni邦弗伦尼统计量 Using repeated-measures single factor analysis of variance and Bonferroni statistical tests (P < 0. 05), intervertebral motion redistribution of each construct was compared with the intact. 使用重复测量变异的单因子分析和Bonferroni统计学测试,我们将每个结构的椎间盘运动再分布与完整运动进行了比较。 levene Tukey HSD Dunnett T3 bonferroni Using repeated-measures single factor analysis of variance and Bonferroni statistical tests (P < 0. 05), intervertebral motion redistribution of each construct was compared with the intact. 使用重复测量变异的单因子分析和Bonferroni统计学测试,我们将每个结构的椎间盘运动再分布与完整运动进行了比较。 LSD:最小显著性差异 ?Scheffe: (四)雪費法(Scheffe)事後檢定:經單因子變異數分析之後,如果F值達到顯著水準,再以雪費法(Scheffe)進行事後比較以瞭解真正存有差異組別之基于20个网页 - 搜索相关网页 ?雪费 本研究结果显示研究对象在籍贯的不同其牙医医疗服务利用有显著差异(P=0.046),且经雪费(Scheffe)的事后检定显示外省人在牙医医疗服务利用高于本省闽南,在其他的研究中未有此发现,研究者于是进一步的去了解,发现本研究对象中... 基于13个网页 - 搜索相关网页 ?以雪費 分析檢定;若P值小於0.05達到顯著水準,再以雪費(Scheffe)進行事後檢定,比較其差異,以下將一一進行分析。 基于12个网页 - 搜索相关网页 ?雪費法 (四)雪費法(Scheffe)事後檢定:經單因子變異數分析之後,如果F值達到顯著水準,再以雪費法(Scheffe)進行事後比較以瞭解真正存有差異組別之基于12个网页 - 搜索相关网页 -Scheffe Method:事后比较 ?事后比较

spss数据处理结构分析

公司的行政人员认为自己与市场部的人员和研发部的人员差异太大;公司总经理则认 为行政人员的综合技能、教育背景与市场部人员和研发部人员也存在明显差异,行政 人员如何通过统计方法证实自己的结论?请构造相关数据,选择合适的统计方法进行 统计验证,并对统计结果进行分析和说明 (1)本例中职工按行政人员、市场人员、研发人员依次设为 合技能、教育背景和工资四个变量,采用单因素方差分析。 (2)SPSS 分析过程: 1、进入SPSS10.0,打开相关数据文件,选择“分析 均值检验 单因素方差分析”, 弹出单因素方差分析对话框,选择变量“职位”使其进入因子( F )框中,选择变量 “综合技能、教育背景、工资”使其进入因变量列表( D )框中。 I I L 対比紗… 两心做 凹?, Boatctrap(fl). ?定]岸陽曰]单? [取消J 、帮切J 2、单击两两比较按钮,选中假定方差齐性框中的 LSD (最小显著差法),同时选中 Equal 未假定方差齐性框中的 Tamhane 'T2。 趟羊吕秦AHOVA;两比较 | S | 佃疋性 1( L5D L) □ S-N-KO) Wall IF -Dune an □ 口出钾 1 . Sid^k 1 T ukey s-b f 豔跌別:最后一牛旧 丁 □ R-E-G-WF(RJ 匚 Hachboro s GT 2(H ) i_ R -E -G 川 a? Cdtorir!l?j) '鼻2 j c J' Oj > [着制 | ■] i — EWi — ■ fc" J ■■ r — 1 未供定方垄冇 1( T 创in 凸 T2(M) Dumcti'; T3O) Game3 Howsll Ai i Durnftit i CflJ) 盘眷tt 衣平Q : 0.05 | (W ]皿洁、劭耽| 3、单击选项按钮,选中描述性和方差同质性检验,其他使用系统默认设置 1、2、3,因此有职位、综 因干;F : 5麵

spss数据分析报告怎么写

spss数据分析报告怎么写 今天乔布简历小编就和大家一起来看看spss数据分析报告怎么写。 关键词:spss数据分析报告怎么写 我们用一个例子来分析spss数据分析报告的写法——以某公司474名职工的综合状况为例进行分析。 一、数据介绍 本次分析的数据是某公司474名职工的状况统计表,其中有11个变量,分别是:职工编号、性别、出生日期、受教育水平程度、职务等级、起始工资、现工资、本单位工作经历、以前工作经历、民族类型、年龄。我们通过使用spss统计软件,对变量分别进行频数分析、描述性统计、方差分析,还有相关分析,来了解该公司职工上述方面的综合状况,并分析个别变量的分布特点和相互之间的关系。 二、数据分析 1、频数分析。我们通过频数分析可以了解变量的取值情况,对把握数据的分布特征非常重要。此次分析利用了某公司474名职工基本状况的统计数据表,在性别、受教育水平程度不同的状况下的频数分析,从而了解该公司职工的男女职工数量、受教育状况的基本分布。 首先,对该公司的男女性别分布进行频数分析,其次对原有数据中的受教育程度进行频数分析,并分别以表格的形式呈现出来。 2、描述统计分析。再通过简单的频数统计分析了解了职工在性别和受教育水平上的总体分布状况后,我们还需要对数据中的其他变量特征有更为精确的认识,这就需要通过计算基本描述统计的方法来实现。下面就对各个变量进行描述统计分析,得到它们的均值、标准差、片度峰度等数据,以进一步把我数据的集中趋势和离散趋势。 3、Exploratory data analysis。 (1)交叉分析。 在实际分析中,除了了解单个变量的分布特征,还要分析多个变量不同取值下的分布,掌握多个变量的联合分布特征,进而分析变量之间的相互影响和关系。就本数据而言,需要了解现工资与性别、年龄、受教育水平、起始工资、本单位工作经历、以前工作经历、职务等级的交叉分析。 (2)单因素方差分析。 我们把受教育水平和起始工资作为控制变量,现工资为观测变量,通过单因素方差分析方法研究受教育水平和起始工资对现工资的影响进行分析。

SPSS数据处理与分析【模板】

图1 本研究假设概念模型图 4研究方法 4.1被试 本研究采用方便取样法选取东莞市和中山市多所普通公办初级中学1102名学生为被试。其中,男生552人,女生550人;初一年级719人,初二年级348人;被试的平均年龄为13.17岁,标准差为0.69,年龄范围介于12-16岁。

5 结果与分析 5.1 各个变量的平均数、标准差和相关系数 表1呈现了本研究所涉及的主要变量的平均数、标准差和相关矩阵。结果发现:(1)亲子关系与网络成瘾显著正相关,这表明亲子关系是青少年网络成瘾的风险性因素,亲子关系越多,青少年的网络成瘾症状越强。(2)抑郁与网络成瘾显著正相关,这表明抑郁是青少年网络成瘾的风险性因素,抑郁越多,青少年的网络成瘾行为越多。(3)亲子关系与抑郁显著正相关,而师生关系与网络成瘾相关不显著。这些研究发现为进一步检验抑郁的中介效应以及师生关系的调节效应提供了支持。 表1 各变量的平均数、标准差和相关系数 变量 1 2 3 4 5 6 Mean 5.2.师生关系在亲子关系对青少年网络成瘾直接效应的调节作用 本研究采用Hayes(2013)提出的PROCESS for SPSS的Model 1进行调节效应检验。以往研究指出性别、年龄、学业成绩、冲动性等是导致青少年网络成瘾的重要影响因素(补充参考文献),因此,本研究将上述变量作为控制变量纳入到回归方程。在数据处理之前,依据温忠麟, 张雷和侯杰泰(2006)的建议,本研究对对所有连续变量均进行了中心化处理。 如表2所示,研究发现,亲子关系可显著正向预测网络成瘾(b = 0.24,SE = 0.03, t = 8.67, p < 0.01),然而,师生关系(b = 0.03,SE = 0.03, t = 1.21, p > 0.05)、亲子

SPSS所处理的数据文件有两种来源

SPSS所处理的数据文件有两种来源:一是SPSS环境下建立的数据文件;二是调用其它软件建立的数据文件。 1 在SPSS数据编辑窗口建立数据文件 当用户启动SPSS后,系统首先显示一个提示窗口,询问用户要SPSS做什么时,把鼠标移至“Type in data”项上单击左键选中,然后单击“OK”按钮;或者该窗口中单击“Cancel”按钮进入SPSS数据编辑窗屏幕,如图所示。 图进入SPSS数据编辑器 (1) 数据编辑(SPSS Data Editor)界面介绍 窗口名显示栏:在窗口的顶部,显示窗口名称和编辑的数据文件名,没有文件名时显示为“Untitled-SPPS Data Editor”。 窗口控制按钮:在窗口的顶部的右上角,第一个按钮是窗口最小化,第二个按钮是窗口最大化,第三个按钮是关闭窗口。SPSS主菜单:在窗口显示的第二行上,有:File文档,Edit编辑,View显视,Data数据,Transform转换,Analyze分析,Graphs 图形,Utilities公用项,Windows视窗。

图 SPSS窗口界面 常用工具按钮:在窗口显示的第三行上,有:打开文档,保存文档,打印,对话检索,取消当前操作,重做操作,转到图形窗口,指向记录,指定变量操作,查找,在当前记录的上方插入新的空白记录,在当前变量的左边插入新的空白变量,切分文件,设置权重单元,标记单元,显示价值标签。 数据单元格信息显示栏:在编辑显示区的上方,左边显示单元格和变量名(单元格:变量名),右边显示单元里的内容。 编辑显示区:在窗口的中部,最左边列显示单元序列号,最上边一行显示变量名称,缺省为“Var”。 编辑区选择栏:在编辑显示区下方,Data View 在编辑显示区中显示编辑数据,Variable View在编辑显示区中显示编辑数据变量信息。 状态显示栏:在窗口的底部,左边显示执行的系统命令,右边显示窗口状态。 (2) 数据文件格式 数据文件格式以每一行为一个记录,或称观察单位(Cases),每一列为一个变量(Variable)。由于SPSS不同的统计分

spss缺失值处理

spss数据录入时缺失值怎么处理 录入的时候可以直接省略不录入 分析的时候也一般剔除这样的样本。但也有替换的方法,一般有: 均值替换法(mean imputation),即用其他个案中该变量观测值的平均数对缺失的数据进行替换,但这种方法会产生有偏估计,所以并不被推崇。 个别替换法(single imputation)通常也被叫做回归替换法(regression imputation),在该个案的其他变量值都是通过回归估计得到的情况下,这种 方法用缺失数据的条件期望值对它进行替换。这虽然是一个无偏估计,但是却倾向于低估标准差和其他未知性质的测量值,而且这一问题会随着缺失信息的增多而变得更加严重。 多重替代法(multiple imputation)(Rubin, 1977) 。 ?它从相似情况中或根据后来在可观测的数据上得到的缺省数据的分布情况给每个缺省数据赋予一个模拟值。结合这种方法,研究者可以比较容易地,在不舍弃任何数据的情况下对缺失数据的未知性质进行推断(Little and Rubin,1987; ubin,1987, 1996)。 (一)个案剔除法(Listwise Deletion) 最常见、最简单的处理缺失数据的方法是用个案剔除法(listwise deletion),也是很多统计软件(如SPSS和SAS)默认的缺失值处理方法。在这种方法中如果任何一个变量含有缺失数据的话,就把相对应的个案从分析中剔除。如果缺失值所占比例比较小的话,这一方法十分有效。至于具体多大的缺失比例算是“小”比例,专家们意见也存在较大的差距。有学者认为应在5%以下,也有学者认为20%以下即可。然而,这种方法却有很大的局限性。它是以减少样本量来换取信息的完备,会造成资源的大量浪费,丢弃了大量隐藏在这些对象中的信息。在样本量较小的情况下,删除少量对象就足以严重影响到数据的客观性和结果的正确性。因此,当缺失数据所占比例较大,特别是当缺数据非随机分布时,这种方法可能导致数据发生偏离,从而得出错误的结论。 (二)均值替换法(Mean Imputation) 在变量十分重要而所缺失的数据量又较为庞大的时候,个案剔除法就遇到了困难,因为许多有用的数据也同时被剔除。围绕着这一问题,研究者尝试了各种各样的办法。其中的一个方法是均值替换法(mean imputation)。我们将变量的属性分为数值型和非数值型来分别进行处理。如果缺失值是数值型的,就根据该变量在其他所有对象的取值的平均值来填充该缺失的变量值;如果缺失值是非数值型的,就根据统计学中的众数原理,用该变量在其他所有对象的取值次数最多的值来补齐该缺失的变量值。但这种方法会产生有偏估计,所以并不被推崇。均值替换法也是一种简便、快速的缺失数据处理方法。使用均值替换法插补缺失数据,对该变量的均值估计不会产生影响。但这种方法是建立在完全随机缺失(MCAR)的假设之上的,而且会造成变量的方差和标准差变小。 (三)热卡填充法(Hotdecking)

SPSS数据初步整理须知

SPSS数据初步整理须知 对于问卷收集到的调查数据或通过其它方法,如眼动仪、脑电仪以及生理记录仪等获得的数据,在进入SPSS分析前最好对数据进行预处理,其作用:防止错误数据导致不恰当的推论。本次主要谈谈问卷数据在分析前的一些预处理工作。 数据预处理的步骤: 1. 对所有数据源的质量进行初步审核。 1.1 剔除无效答卷。如是问卷数据,可以查看被调查者的回答是否呈现某种规律,或者回答者不符合我们调查的人群,或者存在大量题目漏答现象。 1.2 检查是否有明显错误回答。如是否按指导语进行回答,基本信息是否有误。是否有明显的回答矛盾等等。 2. 对数据进行编码。 编码主要有事前编码和事后编码,事前编码主要针对封闭式问卷,而事后编码则主要是针对开放式问题。 编码有三个工作:第一是定义数据的变量名,第二定义变量名标签,即这个变量代表什么意思。第三定义变量值及值标签。即变量的取值,以及这个取值的含义。如变量名为sex,其变量标签为“性别”,其变量的取值为“1”或“2”,分别表示“男”和“女”(变量值标签)。 2 2.1 单选题的编码。第一定义变量名,一般用题目序号,如第6题,则变量名为Q6,其变量名标签一般用问题。而变量的取值则为单选题的选项。有几个选项就有几个变量值,而值的标签则是选项的内容。 2.2 多选题的编码。每一个选项就得作为一个新变量。如第7题是多选题,有五个选项,可多选三项。则五道选项分别定义变量名为Q71,……Q75,每个变量名的标签即这五道选项的内容。而变量值及标签为“0”或“1”,0表示未选,1表示选中。 2.3 排序题的编码。有两种方法:其一跟多选题类似。如第7题要求对所选的三个选项进行排序。变量名及标签同上。而变量值除了“0”(表示未选)外,还有“1”“2”“3”分别表示排序第一,排序第二,排序第三。其二根据要求选择三项进行排序,则只需要定义三个变量,Q71,Q72,Q73,变量名标签则表示排序第一,排序第二,排序第三。变量值为五道选项的序号,而变量值标签则分别是五道选项的内容。 2.4 开放题的编码。首先应将开放题中受试所填写的选项进行分类汇总。初次归类尽量归细一点。再做统计分析时如果觉得分类太细可以再次进行归大类。

手把手教你怎么用SPSS分析数据

使用SPSS软件进行数据分析 文档通过自己论证属实。 【例子】以全国31个省市的8项经济指标为例,进行主成分分析。 第一步:录入或调入数据(图1)。 图1 原始数据(未经标准化) 第二步:打开“因子分析”对话框。 沿着主菜单的“Analyze→Data Reduction→Factor ”的路径(图2)打开因子分析选项框(图3)。

图2 打开因子分析对话框的路径 图3 因子分析选项框 第三步:选项设置。 首先,在源变量框中选中需要进行分析的变量,点击右边的箭头符号,将需要的变量调入变量(Variables)栏中(图3)。在本例中,全部8个变量都要用上,故全部调入(图4)。因无特殊需要,故不必理会“Value ”栏。下面逐项设置。 图4 将变量移到变量栏以后 ⒈设置Descriptives选项。 单击Descriptives按钮(图4),弹出Descriptives对话框(图5)。

图5 描述选项框 在Statistics 栏中选中Univariate descriptives 复选项,则输出结果中将会给出原始数据的抽样均值、方差和样本数目(这一栏结果可供检验参考);选中Initial solution 复选项,则会给出主成分载荷的公因子方差(这一栏数据分析时有用)。 在Correlation Matrix 栏中,选中Coefficients 复选项,则会给出原始变量的相关系数矩阵(分析时可参考);选中Determinant 复选项,则会给出相关系数矩阵的行列式,如果希望在Excel 中对某些计算过程进行了解,可选此项,否则用途不大。其它复选项一般不用,但在特殊情况下可以用到(本例不选)。 设置完成以后,单击Continue 按钮完成设置(图5)。 ⒉ 设置Extraction 选项。 打开Extraction 对话框(图6)。因子提取方法主要有7种,在Method 栏中可以看到,系统默认的提取方法是主成分(∏ρινχιπαλ χομπονεντσ),因此对此栏不作变动,就是认可了主成分分析方法。 在Analyze 栏中,选中Correlation matirx 复选项,则因子分析基于数据的相关系数矩阵进行分析;如果选中Covariance matrix 复选项,则因子分析基于数据的协方差矩阵进行分析。对于主成分分析而言,由于数据标准化了,这两个结果没有分别,因此任选其一即可。 在Display 栏中,选中Unrotated factor solution (非旋转因子解)复选项,则在分析结果中给出未经旋转的因子提取结果。对于主成分分析而言,这一项选择与否都一样;对于旋转因子分析,选择此项,可将旋转前后的结果同时给出,以便对比。 选中Scree Plot (“山麓”图),则在分析结果中给出特征根按大小分布的折线图(形如山麓截面,故得名),以便我们直观地判定因子的提取数量是否准确。 在Extract 栏中,有两种方法可以决定提取主成分(因子)的数目。一是根据特征根(Eigenvalues )的数值,系统默认的是1=c λ。我们知道,在主成分分析中,主成分得分的方差就是对应的特征根数值。如果默认1=c λ,则所有方差大于等于1的主成分将被保留,其余舍弃。如果觉得最后选取的主成分数量不足,可以将c λ值降低,例如取9.0=c λ;如果认为最后的提取的主成分数量偏多,则可以提高c λ值,例如取 1.1=c λ。主成分数目是否合适,要在进行一轮分析以后才能肯定。因此,特征根数值 的设定,要在反复试验以后才能决定。一般而言,在初次分析时,最好降低特征根的临

调查问卷的SPSS的基本处理方法

调查问卷的SPSS的基本处理方法(Z)SPSS是常用的数理统计软件之一,也可以用于调查问卷的统计分析,一下就调查问卷的一些基本分析处理方法做一些简单的描写。另外,虽然SPSS也有图表功能,但个人认为不是很好用,建议还是将统计分析的数据导到EXCEL中再作图表。 频度分析 频度就是某个选项出现的次数,一般用来描述单选项。 问卷设计实例: 企业经营规模为(年销售额:人民币): □>30亿□5~30亿□0.5~5亿□<0.5亿 数据记录要点: 单列记录,第几项选中记录数值几,例如选中“0.5~5亿”则记录3。 SPSS基本操作方法: 导入数据; Analyze……Descriptive statistics……Freq uencies 选入该列数据,“OK”。 多项频次分析 用来描述多选项目的频次。 问卷设计实例: 贵公司产品的主要竞争力表现在(多选): □外观□功能□质量□个性化□价格(成本)□交货期□其它 数据记录要点: 多列记录,有几个选项记几列,选中记为1,未选中记为0。例如如果选中了外观和质量,则多列的记录为1,0,1,0,0,0,0。 SPSS基本操作方法: 导入数据; Analyze……Multiple Response……Define Sets 选入该问题的多列数据,给新的集合变量取名(在Name那里填一个名字,例如“竞争力”),在Dichotomies Counted value中输入1,“Add”。 Analyze……Multiple Response……Frequencies 选人自定义的集合变量,“OK”。 交叉频次分析

用来描述变量之间的关联性,比如分析不同销售额企业的产品竞争力的关联关系(这两项之间不一定有关系,可以用logistic分析验证一下)。 问卷设计实例: 参见上面的两项。 数据记录要点: 参见上面两项。 SPSS基本操作方法(单选对单选,单选对多选,单选对多选在操作上略有不同): 导入数据;如果有多选项需要按2的方法定义集合变量。 如果是单选对单选 Analyze……Descriptive statistics……Crosstabs 否则: Analyze……Multiple Response……Crosstabs 将两变量分别选入行和列中(多选项是选人集合变量,如果是单选对多选还要设置单选项的最大最小值),“OK” 描述分析 一般用来描述单变量的描述统计量,这些述统计量有平均值、算术和、标准差,最大值、最小值、方差、范围和平均数标准误等。问卷中用得不是特别多。 问卷设计实例(一般是开放性问题): 贵企业三维CAD已经应用了年。 数据记录要点: 单列记录,直接记录所填数据。 SPSS基本操作方法: 导入数据; Analyze……Descriptive statistics……Descriptives 选入该列数据,“Options…”,在其中选择需要的统计项目,问卷常用的项目有Mean(平均值)、Minimum( 最小值)、Maximum(最大值)等,“Continue”, “OK”。

常用SPSS数据处理方法

常用SPSS数据处理方法,你都会吗? 数据编辑处理是在统计和分析数据时,第一步要做的。尤其是当面对大量数据时,数据处理是一个重要的过程,可以达到提高处理效率及精度的目的。 为配合进行更好的分析,研究过程过可能涉及到以下数据处理工作: 1、定义变量名 2、制定数据标签 3、数据编码 4、计算变量 5、无效样本处理 6、特殊值处理等 定义变量 定义变量,就是给每个指标起名字。每个变量都需要有对应的变量名,以便得到更规范的表格呈现和操作体验,spssau中通过“标题修改”定义变量名,一般用于以下情况: ●上传数据后,对不规范标题修改 ●完成数据编码后,进行标题修改 ●完成生成变量后,进行标题修改 ●有多余无意义的标题,进行删除标题(一次只能删除一个标题)

数据标签 除了标题名需要定义,数据标签也是一个重要的属性。数据标签用于标识数据中的数字代表的意义,对数据的含义进行解释说明,比如用1表示男,用2表示女。数据标签仅影响表格展示,完全不影响分析结果。 数据编码 量表问卷中经常会使用到反向计分,反项题得到数据在分析以前,要先进行重新编码。

数据编码通常除了用于处理反项题,还会用于数据组合。 比如1代表高中,2代表大专,3代表本科,4代表硕士,5代表博士。希望组合成三组分别是:本科以下,本科,硕士及以上.则可处理为:1->1,2->1,3->2,4->3,5->3,最终数字1代表本科以下,2代表本科,3代表硕士及以上 无效样本 在数据分析之前,首先需要进行数据查看,包括数据中是否有异常值,无效样本等。如果有无效样本则需要进行处理,然后再进行分析。另外如果数据中有异常值也需要进行处理后再进行分析。无效样本会干扰分析研究,扭曲数据结论等,因而在分析前先对无效样本进行标识显示尤其必要。 如果数据来源为问卷,则很可能出现无效样本,因为填写问卷的样本是否真实填写无从判定;如果数据库下载或者使用二手数据等,也可能出现大量缺失数据等无效样本。

调查问卷数据SPSS分析中—多项选择问题处理方法

SPSS多项选择问题处理方法 多项选择题是定量问卷调查中常见的封闭式选择题,这种选择题的出现可以在确定的范围内更多的考察被调研对象的看法。在针对消费者的调研中,这种选择题多是出现在针对品牌知名度,包括提示前知名度、第一提及率,提示后知名度的分析中。 ?常见的分析方法 一般的研究分析手段主要应用包括EXCEL与SPSS在内的频次分析,然后再将在不同数据字段同一类选项数据进行加总,然后再以被调研对象的总体数量为基数,二者相除来得到多项选择题中各选项在总体中的占有率,这种各选项占有率的加总大于1。 例如某类产品品牌知名度调查中,关于该类产品您能想起哪些品牌? 01 品牌A 02品牌B 03品牌C 04品牌D 05品牌E 06品牌F 07其它品牌_____ 该问题在数据字段设计时最少要设计10个字段以供数据录入与分析。按上面的数据分析方法,先在这10个字段中进行分别的频次计算,然后进行加总再除以总基数,得到该选项的总体占有比率。以A选项为例: (01字段中A的占有率+02字段中A的占有率+ …… +06字段中A的占有率)/被调对象总数=A的占有率以此类推分别计算出其它品牌的占有率,频次计算次数与分类加和计算次数比较繁杂,其工作量在被选项较少时还算省事,但当被选项数量在十几个、二十几个甚至三十几个时,该分析方法则极大降低了分析人员的工作效率。 ?高效率数据分析方法 运用SPSS重组再分析的数据方法将极大提高数据分析效率并降低人为计算失误。 在SPSS数据库中运用 “Multiple Response”对多组数据进行组合再定义,这样会针对每个单一选择题定义出一个新的字段组,在新字段组中对变量区间进行定义,再针对新字段组进行频次分析。当完成单一字段设置后,可运用程序段对其它多项选择题进行再利用分析,这样可以大大提高多项选择题数据分析效率。 分析程序例举: ************** MULT RESPONSE GROUPS=$tsh '新字段组名称' (var00018 var00019 var00020 var00021 var00022 var00013 var00014 var00015 var00016 var00017 (1,111))

SPSS数据处理过程

《基于西北物流企业对物流组织网络化程度与企业顾客产出水平分 析》之样本数据处理报告 (数据来源: "物流组织网络化程度"、“服务质量”、“顾客满意度”、“顾客忠诚度”的指标变量采用随机数生成int(rand()*6+1)“物流服务成本”随机数生成方式为int(rand()*9+1),设定结果为上市公司25个,115个为未上市公司) 一、数据定量化 本人构造的模型,其中潜变量主要有五个:物流组织网络化程度、物流服务成本、服务质量、顾客满意度与顾客忠诚度。指标变量有15个,其中作为潜变量的指标14个,还有一个是“上市情况”主要是衡量公司规模情况。由于该指标为定类变量,需要进行虚拟化,虚拟化采用if语句进行转化形成“上市情况虚拟”变量,最终产生对检验有用的变量是15个。说明哪些变量需要转化为定量变量,以及转化后产生了那几个变量 二、缺失值及奇异值处理 由于数据是由随机数产生故缺失值,没有发现(处理缺失值的方法打算采用均值替代法,因 为在处理奇异值时,我采用的方法是将X不在()范围内的删除,然后全部用均 值替代)。通过分析---描述统计------探索,将所有变量导入因变量列表(版本与实验室不同),最终形成箱形图,

奇异值判定表2-1 “物流组织网络化程度4”与“物流组织网络化程度2”中数据“6”超过上限,所以应该删去。 文字描述、箱形图,处理办法,产生的新的变量 三、测量的信度、效度、共同方法偏差 1.信度分析: 步骤:分析-----度量------可靠性分析,将处理过缺失值的新数据中“物流组织网络化程度1~4”放入项目中,确定后生成数据Cronbach系数α1;同理可处理“服务质量1~3”、“顾客满意 克朗巴哈系数表3-1.1 由于各潜变量的信度都是很好的,所以整个测量的信度是可接受的。 2.效度分析: 步骤:分析---降维----因子分析,将处理过缺失值的新数据中“物流组织网络化程度1~4”放入“变量”中,确定后生成数据,形成各个因子载荷;同理可处理“服务质量1~3”、“顾客 值 因子载荷表3-2.1 由于物流组织网络化程度4的因子载荷较小,所以不能充分反应潜变量。从spss中删除“物流组织网络话程度4”题项。重新操作“物流组织网络化1~3”的因子载荷,整理得到下表 值 因子载荷表3-2.2

SPSS分析调查问卷数据的方法

SPSS分析调查问卷数据的方法 (2012-05-29 21:45:13) 分类:学习 标签: 杂谈 当我们的调查问卷在把调查数据拿回来后,我们该做的工作就是用相关的统计软件进行处理,在此,我们以spss为处理软件,来简要说明一下问卷的处理过程,它的过程大致可分为四个过程:定义变量﹑数据录入﹑统计分析和结果保存.下面将从这四个方面来对问卷的处理做详细的介绍. Spss处理: 第一步:定义变量 大多数情况下我们需要从头定义变量,在打开SPSS后,我们可以看到和excel相似的界面,在界面的左下方可以看到Data View, Variable View两个标签,只需单击左下方的Variable View标签就可以切换到变量定义界面开始定义新变量。在表格上方可以看到一个变量要设置如下几项:name(变量名)、type(变量类型)、width(变量值的宽度)、decimals(小数位) 、label(变量标签) 、Values(定义具体变量值的标签)、Missing(定义变量缺失值)、Colomns(定义显示列宽)、Align(定义显示对齐方式)、Measure(定义变量类型是连续、有序分类还是无序分类). 我们知道在spss中,我们可以把一份问卷上面的每一个问题设为一个变量,这样一份问卷有多少个问题就要有多少个变量与之对应,每一个问题的答案即为变量的取值.现在我们以问卷第一个问题为例来说明变量的设置.为了便于说明,可假设此题为: 1.请问你的年龄属于下面哪一个年龄段( )? A:20—29 B:30—39 C:40—49 D:50--59 那么我们的变量设置可如下: name即变量名为1,type即类型可根据答案的类型设置,答案我们可以用1、2、3、4来代替A、B、C、D,所以我们选择数字型的,即选择Numeric, width 宽度为4,decimals即小数位数位为0(因为答案没有小数点),label即变量标签为“年龄段查询”。Values用于定义具体变量值的标签,单击Value框右半部的省略号,会弹出变量值标签对话框,在第一个文本框里输入1,第二个输入20—29,然后单击添加即可.同样道理我们可做如下设置,即1=20—29、2=30—39、3=40—49、4=50--59;Missing,用于定义变量缺失值, 单击missing框右侧的省略号,会弹出缺失值对话框, 界面上有一列三个单选钮,默认值为最上方的“无缺失值”;第二项为“不连续缺失值”,最多可以定义3个值;最后一项为“缺失值范围加可选的一个缺失值”,在此我们不设置缺省值,所以选中第一项如图;Colomns,定义显示列宽,可自己根据实际情况设置;Align,定义显示对齐方式,有居左、居右、居中三种方式;Measure,定义变量类型是连续、有序分类还是无序分类。 以上为问卷中常见的单项选择题型的变量设置,下面将对一些特殊情况的变量设置也作一下说明. 1.开放式题型的设置:诸如你所在的省份是_____这样的填空题即为开放题,设置这些变量的时候只需要将Value 、Missing两项不设置即可. 2.多选题的变量设置:这类题型的设置有两种方法即多重二分法和多重分类法,在这里我们只对多重二分法进行介绍.这种方法的基本思想是把该题每一个选项设置成一个变量,然后将每一个选项拆分为两个选项项,即选中该项和不选中该项.现在举例来说明在spss中的具体操作.比如如下一例: 请问您通常获取新闻的方式有哪些( ) 1 报纸 2 杂志 3 电视 4 收音机 5 网络

SPSS数据分析的主要步骤

SPSS数据分析的主要步骤 利用SPSS进行数据分析的关键在于遵循数据分析的一般步骤,但涉及的方面会相对较少。主要集中在以下几个阶段。 1.SPSS数据的准备阶段 在该阶段应按照SPSS的要求,利用SPSS提供的功能准备SPSS数据文件。其中包括在数据编辑窗口中定义SPSS数据的结构、录入和修改SPSS 数据等。 2.SPSS数据的加工整理阶段 该阶段主要对数据编辑窗口中的数据进行必要的预处理。 3.SPSS数据的分析阶段 选择正确的统计分析方法对数据编辑窗口中的数据进行分析建模是该阶段的核心任务。由于SPSS能够自动完成建模过程中的数学计算并能自动给出计算结果,因而有效屏蔽了许多对一般应用者来说非常晦涩的数学公式,分析人员无需记忆数学公式,这无疑给统计分析方法和SPSS 的广泛应用铺平了道路。 4.SPSS分析结果的阅读和解释 该阶段的主要任务是读懂SPSS输出编辑窗口中的分析结果,明确其统计含义,并结合应用背景知识做出切合实际的合理解释。

数据分析必须掌握的分析术语 1、增长: 增长就是指连续发生的经济事实的变动,其意义就是考查对象数量的增多或减少。 2、百分点: 百分点是指不同时期以百分数的形式表示的相对指标的变动幅度。 3、倍数与番数: 倍数:两个数字做商,得到两个数间的倍数。 番数:翻几番,就是变成2的几次方倍。 4、指数: 指数是指将被比较数视为100,比较数相当于被比较数的多少得到的数。 5、比重: 比重是指总体中某部分占总体的百分比 6、拉动。。。增长。。。: 即总体中某部分的增加值造成的总体增长的百分比。

例子:某业务增量除以上年度的整体基数=某业务增量贡献度乘以整体业务的增长率。例如:去年收入为23(其中增值业务3),今年收入为34(其中增值业务5),则增值业务拉动收入增长计算公式就为:(5-2)/23=(5-2)/(34-23)×(34-23)/23,解释3/(34-23)为数据业务增量的贡献,后面的(34-23)/23为增长率。 7、年均增长率: 即某变量平均每年的增长幅度。 8、平均数: 平均数是指在一组数据中所有数据之和再除以数据的个数。它是反映数据集中趋势的一项指标。 公式为:总数量和÷总份数=平均数。 9、同比与环比 同比:同比发展速度主要是为了消除季节变动的影响,用以说明本期发展水平与去年同期发展水平对比而达到的相对发展速度。如,本期2月比去年2月,本期6月比去年6月等。 环比:环比发展速度是报告期水平与前一时期水平之比,表明现象逐期的发展速度。如计算一年内各月与前一个月对比,即2月比1月,3月比2月,4月比3月……12月比11月,说明逐月的发展程度。

Spss的数据预处理

Spss的数据预处理 一、数据预处理的目的: 在数据文件建立好后,通常还要对待分析的数据进行必要的预加工处理,这是数据分析过程中不可缺少的一个关键环节。数据的预加工处理是服务与数据分析和建模的,需要解决的问题如下: 1、缺失值和异常数据的处理。 2、数据的转换处理。数据的转换处理是在原有数据的基础上,计算产生 一些含有更丰富信息的新数据或对数据原有分布进行转换等。 3、数据抽样。从实际问题、算法或效率等方面考虑,并非收集到的所有 数据(个案)在某项分析中都有用途,有必要按照一定的规则从大量 数据中选取部分样本参与分析。 4、选取变量。并非所有数据项(变量)在某项分析中均有意以,选取部 分变量参与分析是必要的。 Spss提供了一些专门的功能辅助用户实现数据的预加工处理工作,通过预处理还可以使用户对数据的总体分布有所了解。 二、数据预处理步骤: 1、数据的排序: (1)数据排序的目的: a、通常数据编辑窗口中个案的前后次序是由数据数录入的先后顺序决 定的,数据排序便于数据的浏览,有助于了解数据取值状况、缺失 值数量的多少。 b\、通过数据排序能够快速找到最大值和最小值,进而可以计算出数据的全距,快速把握和比较数据的离散程度。 c、通过数据排序能够快速发现数据的异常值。 (2)、数据排序的步骤: a、选择菜单:【Date】→【Sort Cases】 b、指定主排序量到【Sort by】框中,并选择【Sort Order】框中的选项指出

该变量按升序还是降序排序排序。【Ascending】表示升序,【Descending】表 示降序。 c、如果是多重排序,还要依次指定第二、第三排序变量及相应的排序规则。否 则本部可略。 排序窗口如下图: 图1 2、变量计算: (1)变量计算的目的: a、通过数据的转换处理,在原有数据的基础上,计算产生一些含量更丰富的新数 据。 b\、对数据的原有分布状态进行转换,由于数据分析和建模中某些模型对数据分布 有一定的要求,因此可以利用变量计算对原有数据的分布进行转换。 c、spss变量计算是在原有数据的基础上,根据用户给出的spss的算术表达式以及

1-spss介绍及简单的数据处理

第一讲spss介绍及数据预处理 实验目的:引导学生了解spss软件的界面、主要功能、主要窗口及数据编辑,常见数据的统计处理。 实验内容: 一:spss的界面介绍 1. Spss的运行(介绍启动选择对话框见1-1) 2. Spss的主要窗口:数据编辑窗口和结果输出窗口。每个窗口都有相应的菜单栏、工具栏、状态栏等。下面我们主要先看一下数据编辑窗口的界面(印发菜单的中文)P4 3.现在看一下结果输出窗口,结果输出窗口是显示和管理spss统计分析结果、报表以及图形的窗口。P5。SPSS结果转换为其他格式,如常见的word格式,在FILE中进行转换.. 他的后缀是.spo(打开一个结果看一下)双击可以编辑输出结果。在练习文件中演示 4.spss的帮助系统。一:通过对话框去的帮助;二:对于一些基本模块提供了手把手式的指导(在statistics coach下) 5. Spss的主要功能-----统计功能,分为两部分,数值分析和图形分析,如界面的菜单栏中的analyze和graphs下完成。见1-2 二:数据编辑及应用 Spss的应用主要分三步,首先是打开应用软件,然后数据编辑,最后选择相应的统计分析对数据进行分析处理,得到结果。 1.下面看一下数据编辑:

研究的问题:求某班学生在一次英语测验中的平均成绩、均值标准差、中位数、众数、方差及标准差等。 首先定义变量p10, 2个变量,姓名和成绩 其次数据的输入与保存p14 第三变量和数据的编辑,增减数据和变量p16 (也可以对数据进行分类汇总p19) 2.最后选择统计分析进行数值分析p68 在analyze菜单下完成。演示 选择性的练习:(1)观测量的排序(DATA—Sort cases中进行排序) (2)行列的转置(DATA-tsanspose)? (3)合并文件(data-merge file) (4)分割文件(splite file) (5)数据的分类汇总(data-aggregate) 三:读入其他格式的文件,spss数据文件可以保存成其他格式的文件,所以spss也可以读取其他格式的数据文件。比如文本文件、数据库文件包括.dbf、EXCEL等格式,p38 演示读取文本文件p38 演示读取数据库文件包括.dbf(是dbase数据库软件的文件)、EXCEL 等P44 四:练习 练习数据编辑以及用excel导入数据,然后用spss预处理数据。实现某班学生一次测验数学成绩语文成绩的均值、中位数、众数、方差与标准差等。

Spss数据分析报告

S p s s数据分析报告 SANY GROUP system office room 【SANYUA16H-

Spss数据分析报告 1实验材料和原始数据 1.1引入 本文主要利用SPSS通过对3 个除汗剂品牌:妮维娅、 AXE、多芬在两个超市(沃尔玛和家乐福)的价格、促销,和 AXE 的周销售量数据,分析这两个因素对AXE周销售量的影响,为AXE这个除汗剂品牌设定一个恰当的模型形式。进一步检验模型中是否存在自相关、异方差、共线性等问题,练习如何在SPSS 中处理自相关、异方差,进一步完善模型,检验模型的表面效度,残差图,并最终计算模型的预测效度。 1.2AXE案例 1.2.1三个品牌除汗剂的数据 ?妮维娅 ?AXE ?多芬 1.2.2变量 销售量(Sales) 价格(Price) 只有摆台(Display-only) 只有促销(Feature-only) 摆台和促销都有(Feature and Display) 2分析操作 2.1数据线性拟合 对家乐福的AXE数据进行线性拟合,所得到的结果如下: 对沃尔玛的数据进行线性拟合,所得到的结果如下:

2.2Pooling Test 由于有两个超市Carrefour和Walmart的AXE的数据,因此在分析之前要先用SPSS进行Pooling Test。 Pooling Test所用到的公式是 通过这个公式计算出F大小,然后通过在线网站计算出P值大小,从而判定能否混合计算。 2.2.1OLS Pooling 所得到的P值结果: 结论是:P<0.0001,两个超市的AXE销售数据不能混合。 2.2.2OLSDV Pooling 结论是:P<0.0001,两个超市的AXE销售数据不能混合。 通过OLS Pooling和OLSDV Pooling都说明了两个超市的AXE销售数据不能混合。所以接下来的分析和模型设立都会按照两个超市进行。 2.3描述性统计和模型设立 2.3.1描述性统计 沃尔玛 AXE的销售情况 接下来分析Display-only、Feature-only以及Display和Feature这三个变量对价格的影响。 考虑竞争对手的定价 家乐福 价格与销量相对于时间的变化 促销手段对价格的影响 竞争对手的价格定位 2.3.2模型设立 模型类型有两种:加法模型和乘法模型。 加法模型 乘法模型 在这里我们选择的是乘法模型,这是因为我们先尝试了加法模型,发现并不符合正态分布,所以我们选择乘法模型。 根据以上的乘法模型,带入数据,拟合出参数β0、β1、β2、β3、β4。 X1t=Price of AXE in week t X2t=Display of AXE in week t X3t=Feature of AXE in week t X4t=Display & Feature of AXE in week t 家乐福

相关主题
文本预览
相关文档 最新文档