3第三章 SPSS数据处理wyb
- 格式:ppt
- 大小:636.50 KB
- 文档页数:37
第三章SPSS数据的预处理为什么查进行预处理在数据文件建立之后,通常还需要对分析的数据进行必要的预加工处理,这是数据分析过程中必不可少的一个关键步骤。
数据的预加工处理服务于数据分析和建模,主要包括以下几个问题:数据的排序变量计算数据选取计数分类汇总数据分组数据预处理的其他功能:转置、加权、数据拆分、缺失值处理、数据排秩、定义变量集。
3.1 数据的排序3.1.1数据排序的作用3.1.2 数据排序的基本操作将观测量按照统计分析的具体要求进行合理的分类整理是数据文件整理的重要工作。
仍以文件“研究生.sav”来说明,观测量分类整理的基本操作步骤如下:(1)执行Data→Sort Cases (观测量分类) 命令,打开Sort Cases对话框。
(2)从源变量列表框中选择一个或几个分类变量,单击中间的箭头按钮将它们移入Sort by框中,不妨称移入该框的变量为By变量。
选择By变量的意义是将按这个变量对观测量进行分类整理。
如果选择了几个By变量,从上至下依次称为第一By变量、第二By变量等。
分类整理将按每一个By变量层叠分类整理。
例如,选择了两个分类变量,sex为第一By变量,score为第二By变量,在sex的每一个分类中观测值将按score分类。
(3)在Sort Order栏中选择一种排序方式。
如对某分类变量选择Ascending (升序),则在Sort by框里该变量名之后用连线连接Ascending;如选择Descending (降序),该变量名连接Descending。
各分类变量的排序方式可以不同。
(4)以上选择确定后,单击OK,返回数据窗口,分类排序结果显示于数据窗口内。
此外,对字符串变量按分类次序大写字母将优先于小写的同一字母。
在我们引用的数本来有一个Order (序号) 变量,它的值为自然数顺序。
按照某些By变量分类后,要将文件恢复成原来的顺序,可以再用Order作为By变量执行观测量分类即可。
1、利用第2章第7题数据,采用SPSS数据筛选功能将数据分成两份文件。
其中,第一份数据文件存储常住地是“沿海或中心繁华城市”且本次存款金额在1000至5000之间的调查数据:第二份数据文件是按照简单随机抽样所选取的70%的样本数据。
第一份文件:选取数据数据一选择个案一如果条件满足一存款>= 1000&存款<5000&常住地=沿海或中心繁华城市。
第二份文件:选取数据数据一选择个案一随机个案样本一输入70。
2、利用第2章第7题数据,将其按常住地(升序)、收入水平(升序)、存款金额(降序)进行多重排序。
排序数据一排序个案一把常住地、收入水平、存款金额作为排序依据分别设置排列顺序。
3、利用第2章第9题的完整数据,对每个学生计算得优课程数和得良课程数,并按得优课程数的降序排序。
计算转换一对个案内的值计数输入目标变量及日标标签,把所有课程选取到数字变量,定义值一设分数的区间,之后再排序。
4、利用第2章第9题的完整数据,计算每个学生课程的平均分以及标准差。
同时,计算男生和女生各科成绩的平均分。
方法- -:利用描述性统计,数据一转置学号放在名称变量,全部课程放在变量框中,确.定后,完成转置。
分析--描述统计一描述,将所有学生变量全选到变量框中,点击选项勾选均值、标准差。
先拆分数据_ 拆分文件按性别拆分,分析一描述统计一描述,全部课程放在变量框中,选项一均值。
方法二:利用变量计算,转换--计算变量分别输入日标变量名称及标签一--均值用函数mean完成平均分的计算,标准差用的数SD完成标准差的计算。
数据一分类汇总一性别作为分组变量、全部课程作为变量摘要、(创建只包含汇总变量的新数据集并命名)一确定5、利用第2章第7题数据,大致浏览存款金额的数据分布状况,并选择恰当的组限和组距进行组距分组。
根据存款金额排序,观察其最大值与最小值,算出组数和组距。
转换重新编码为其他变量一将存款金额作为输出变量一定义输出变量的名称及标签一设定旧值和新值.6、在第2章第7题数据中,如果认为调查中“今年的收入比去年增加”月.预计未来一两年收入仍会增加”的人是对自己收入比较满意和乐观的人,请利用SPSS的计数和数据筛选功能找到这些人。
描述性统计分析(Descriptive Statistics)统计分析往往是从了解数据的基本特征开始的。
描述数据分布特征的统计量可分为两类:一类表示数量的中心位置,另一类表示数量的变异程度(或称离散程度)。
两者相互补充,共同反映数据的全貌。
这些内容可以通过SPSS中的“Descriptive Statistics”菜单中的过程来完成。
1 频数分析 (Descriptive Statistics - Frequencies)频数分布分析主要通过频数分布表、条形图和直方图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征。
下面我们通过例子来学习单变量频数分析操作。
1) 输入分析数据在数据编辑器窗口打开“data1-2.sav”数据文件。
2)调用分析过程在主菜单栏单击“Analyze”,在出现的下拉菜单里移动鼠标至“Descriptive Statistics”项上,在出现的次菜单里单击“Frequencies”项,打开如图3-4所示的对话框。
图3-4 “Frequencies” 对话框3)设置分析变量从左则的源变量框里选择一个和多个变量进入“Variable(s):”框里。
在这里我们选“三化螟蚁螟 [虫口数]”变量进入“Variable(s):”框。
4)输出频数分布表Display frequency tables,选中显示。
5)设置输出的统计量单击“Statistics”按钮,打开图3-5所示的对话框,该对话框用于选择统计量:图3-5 “Statistics”对话框① 选择百分位显示“Percentiles Values”栏:Quartiles:四分位数,显示25%、50%和75%的百分位数。
Cut points for 10 equal groups:将数据平分为输入的10个等份。
Percentile(s)::用户自定义百分位数,输入值0—100之间。
选中此项后,可以利用“Add”、“Change”和“Remove”按钮设置多个百分位数。
第3章SPSS的基本操作 (35)1 认识SPSS窗口 (35)1.1 数据编辑窗口(Data Editor) (35)1.2 输出窗口(Viewer) (35)1.3 语句窗口(Syntax Editor) (36)1.4 脚本编辑窗口(Script) (37)1.5 图表编辑窗口(Chart Editor) (38)1.6 交互图表编辑窗口(Interactive Chart) (38)1.7 草稿输出窗口(Draft Output) (39)2 输出窗口的操作 (40)2.1 查看输出对象 (40)2.2 编辑输出窗口 (41)2.3 添加角注 (42)3 输出结果的输出和保存 (42)3.1 在另一个应用程序嵌入数据透视表 (42)3.2 将表格和图表粘贴为图片 (43)3.3 将数据透视表粘贴为无格式文本 (43)3.4 保存输出 (43)4 数据透视表的基本操作 (43)4.1 改变数据透视表外观 (43)4.2 应用样本表格 (44)4.3 创建自定义表格样式 (44)5 认识枢轴沙盘(Pivoting Tray) (45)5.1 概述 (45)5.2 主要组成 (45)5.3 通过枢轴沙盘实施行列互换 (45)6 系统参数的设置 (48)6.1 通用参数设置(General) (48)6.2 观察窗口设置(Viewer) (49)6.3 草稿窗口参数设置(Draft Viewer) (50)6.4 标签输出设置(Output Label) (51)6.5 图形参数设置(Chart) (51)6.6 要点表格参数设置(Pivot Tables) (51)6.7 数据窗口(Data) (52)6.8 数值型变量自定义格式设定(Currency) (52)6.9 脚本编辑窗口(Script) (53)6.10 交互图表编辑窗口(interactive ) (53)6.11 设置或增加工具栏中的图标按钮 (53)第3章SPSS的基本操作1 认识SPSS窗口1.1 数据编辑窗口(Data Editor)用来显示数据文件内容,可以建立一个新的数据文件,也可以导入一个已存在的数据文件并对其进行编辑和处理。