SPSS Statistics 培训(1)
- 格式:pdf
- 大小:6.67 MB
- 文档页数:76
第一章SPSS统计分析系统软件简介1)SPSS的几种基本运行方式:①菜单操作方式:这种方法图形用户界面友好、操作简单、形象直观,能够一步步引导用户完成对数据的描述和模型的建立。
②程序运用方式:是在Syntax编辑窗口输入程序。
也可以用任何文本编辑器中输入,也可以在相应菜单操作的对话框中,用“Paste”按钮可以把相应的操作转化为Syntax语言。
选择所有的语法命令行,单击“Run”运行程序。
或者在SPSS的语法编辑器窗口输入语法。
③ Include运行方式:在编写Syntax命令中,如果要调用其他语法文件时,除了复制粘贴现有的资源外,还可以用Include的命令。
④ Production Facility方式:Production Facility生产作业方式提供了以自动化方式运行SPSS Statistics 的功能。
2)SPSS界面提供的五个窗口:①数据编辑窗口:这个窗口主要用来处理数据和定义数据字典,它分为两个视图。
一个是用来显示数据的数据视图(数据视图用来显示数据集中的记录或个案),另外一个是变量视图(变量视图的功能是定义数据集的数据字典)。
②结果管理窗口:也称为结果视图或者结果浏览器,该窗口用于存放SPSS软件的分析结果。
分为左边目录区,是SPSS分析结果的目录;右边是内容区,显示与目录相应的内容。
③结果编辑窗口:是编辑分析结果的窗口。
选中要编辑的内容,双击或者点击右键选择“编辑内容”,选中的图形就会出现在“图表编辑器”中,可以开始编辑。
④语法编辑窗口:语法编程方式,能够完成窗口操作所能完成的所有任务,还可以完成许多窗口操作所不能完成的其他工作。
在这个窗口中,还可以调用开源软件R中的任何程序。
⑤脚本窗口:是用Sax Basic 语言编写的程序。
脚本可以使SPSS内部操作自动化,可以自定义结果格式,可以连接VB和VBA应用程序。
第二章数据文件的建立和管理1)数据管理的特点:数据编辑器的每一行数据称为一个个案,每一列数据代表个体属性,即变量。
SPSS Statistics 培训(一)SPSS ChinaDate Session SubjectDay 1 [6H]统计分析简介[1H]1.1 统计分析概念 1.1.1 Introduction to Statistical Analysis1.2 统计分析过程与实例1.2.1 统计分析过程1.2.2 一个调查研究的实例SPSS Statistics[1H] 2.1 SPSS Statistics 介绍2.1.1 Introduction to SPSS Statistics2.1.2 SPSS Statistics 21 新特性2.1.3 利用SPSS进行数据分析的一般步骤午餐SPSS Statistics数据准备[4H]3.1 数据录入与获取 3.1.1 数据格式,数据录入与引入,数据保存3.2 数据管理和变换3.2.1 新变量的生成3.2.2 变量类型和数据结构的转换3.2.3 数据合并、汇总、选择和拆分Day 2 [6H] 描述统计[2H]4.1 数值描述4.1.1 定性变量的数值描述4.1.2 定量变量的数值描述4.2 图形与图表 4.2.1 图形与图表午餐简单推断[2H] 5.1 简单推断与方差分析5.1.1 简单推断5.1.2 方差分析相关分析[1H] 6.1 相关分析 6.1.1 相关分析回归分析[1H] 6.2 一元线性回归分析 6.2.1 一元线性回归分析第一讲:统计分析简介目录⏹1.1 统计分析概念⏹1.2 统计分析过程与实例●1.1.1 统计分析过程●1.1.2 一个调查研究的实例2. 什么时候用数据分析◆统计模型的严格数学表达很复杂、繁琐,但是其背后的思想往往很简单 ◆作为统计学的使用者,重要的是掌握统计学的思想、解决问题的步骤和结果的解读1. 数据分析、统计学、统计工具的关系数据分析•背景:拥有一定量的数据•产生需求:从数据中提取信息统计学•数据分析的依据 •统计学:随机性与规律性统计工具•利用统计学原理 •服务于数据分析数据问题实际问题实际问题及解决方案把实际问题转化为数据问题数据分析及结果把数据结果转化为实际问题的解决方案4. 统计学的一句话概括3. 数据的价值◆数据无处不在◆数据包含的信息很多,但是数据中的信息往往是分散的,单个数据很难直接被应用起来◆统计学就是把数据转化为信息的科学◆ 统计学是用以收集数据、整理分析数据和由数据得出结论的一组概念、原则和方法。
✓统计的一个重要但又往往不易为人所理解的特点是统计从来不绝对地说“是”或“不是”✓统计只能够说可能,而且往往提供某事可能发生的概率 ✓统计只说可能性是实际世界的真实体现。
真实世界充满了不确定性✓从某种意义来说,生活中唯一确定的事情就是其不确定性◆“明天降水概率为40%” ◆“该节目收视率是30%” ◆“某县是贫困县” ◆“该药品疗效是99%”5. 如何理解下面的说法◆统计可以指导我们收集数据◆当拥有来自一些变量(指标)的数据或记录,但缺乏模型来描述这些变量之间关系的情况下,可用统计方法建立模型.◆在有了一定的模型时,统计可以确定手中数据是否令人信服地支持某种论点.模型也用来对未来进行预测.◆统计直观的图表展示,可以使各个领域的专家容易理解6. 统计的一些做法2. 统计的应用领域1. 一些应用的例子1.2 统计分析过程与实例◆如何根据一些财务数据发现漏税的嫌疑单位◆如何进行偏差较少的民意调查◆如何确定一个产品可靠性◆如何按照各种指标评价雇员◆如何根据不同环境估计某商店的顾客人数◆如何对电视节目排名次▪精算▪审计学▪医学诊断▪农业▪动物学▪人类学▪考古学▪晶体学▪人口统计学▪牙医学▪社会统计学▪牙医学▪生态学▪教育学▪经济计量学▪流行病学▪心理学▪气象学▪军事科学▪核材料安全管理▪眼科学▪制药学▪物理学▪政治学▪心理物理学▪质量控制▪分类学▪气象改善▪博采,等等▪金融▪水产渔业研究▪遗传学▪地质学▪地理学▪历史研究▪人类遗传学▪工业▪法律▪语言学▪文学▪劳动计划学▪管理科学▪市场营销学2. 计划编制1. 概述◆ 计划编制确定研究问题建立项目预算确定研究范围 即确定研究的总体和个体确定样本的抽取方法分析评估所需样本量确定数据收集方式确定与研究问题相关的数据 即确定应该收集个体的哪些数据确定研究问题的分析方法和分析工具1. 计划编制数据分析 5. 部署 7.数据报告6. 2. 数据收集3. 数据访问4. 数据管理和准备◆数据访问目的:将分散的原始格式各不相同的数据读入分析工具中,使分析工具可以对数据进行分析。
4. 数据访问◆ 数据收集收集目标依赖于计划的编制 方式:•观察、访谈、问卷调查•利用已有数据资源注:收集的数据要和预期研究的问题相关,要能够从中得出有意义的结论3. 数据收集◆ 数据分析预分析:•概括性统计描述•探索性推断精确分析•拟合最佳的统计模型•需要统计知识和专业相互补充6. 数据分析◆ 数据管理和准备清理数据以保证数据的准确性 对数据进行必要的转换 填充缺失数据对数据进行合并、汇总等5. 数据管理和准备1.2.1 统计分析过程(3/3)7. 数据报告◆数据报告目的:将数据分析项目的结果以恰当的方式表达方式:文本文档、表格、图形或者网页注:报告应使得决策者能够快速理解,并做出决策8. 布署◆部署目标:将分析阶段得到的模型、信息和知识带给决策者方法:将生成的模型编译成单独运行的控件或程序,将其整合到应用平台中去2. 计划编制-收集个体的数据信息◆研究的问题中国大学生对于AIDS 知识的整体了解情况是如何的?◆研究的总体中国高校大学生◆样本抽取方法分层抽样,抽样个体为来自天津四所医学和非医学院校的学生◆数据收集方式发放调查问卷的方式1. 计划编制◆参加调查者的人口统计信息包括性别、年龄、年级、学校表现、健康状况等 ◆家庭成员的相关信息包括如父母受教育程度、家庭收入、家庭类型等 ◆对AIDS 的认知 ◆AIDS 信息的来源包括是否从公众/媒体获得任何关于AIDS 的任何方面的信息、是否参与过关于AIDS 的讨论、哪种AIDS 信息渠道被认为是最可靠的等等◆AIDS 知识:包括如下四个方面的问题(共21个问题)AIDS 的定义/症状 传播方式 临床症状 治疗/预防4. 数据访问◆统计问题:根据研究的目的,初步判定主要采用描述性统计、均值比较和方差分析 ◆分析工具:SPSS Statistics 21◆数据收集主要采用现场发放问卷的形式 ◆最后收回有效问卷930份3. 计划编制-数据分析方法和分析工具、数据收集◆通过对调查问卷整理,最后通过SPSS 读入数据 ◆FINAL-KAP-CLEANED-DATA.sav5. 数据管理与准备(2/5)◆由于收集到的数据存储方式很不规则,读入到SPSS 的数据不便于分析 ◆数据管理与准备除了要解决原始数据自身的问题外,还要围绕要研究的问题展开 ◆根据此次研究的目的以及收集到的数据内容,我们把分析集中在被调查者对AIDS 知识回答情况的分析。
为了有针对性的管理和准备数据,提出如下待解决的问题1. 930名学生对关于AIDS 知识的21个问题回答的正确率2. 930名学生的平均回答正确率3. 不同类型的学校、不同性别、不同受教育水平学生的平均正确率: 医科大学&非医科大学;男性&女性;硕士&博士5. 数据管理与准备(1/5)◆检验如下群体回答正确率之间是否有差别医学&非医学学生 男性&女性 硕士&博士 不同年级的硕士生 不同年级的博士生5. 数据管理与准备(4/5)•D01=Cannot•D02-1=Likely•D03-1=Likely•D04-1=Likely•D05-1=Likely•D06-1=Likely•D07-2=Unlikely•D08-2=Unlikely•D09-2=Unlikely•D10-1=Likely5. 数据管理与准备(3/5)•D11-1=Likely •D12-2=Unlikely •D13-2=Unlikely•D14-2=Unlikely •D15-2=Unlikely •D16-2=Unlikely •D17-2=Unlikely •D18-1=True •D19-2=False •D20-1=True •D21-2=False21个问题的正确选项这样的数据如何进行分析?6. 数据分析◆主要思路规范数据格式,以数值编码代替字符(串) 正确选项的编码均设置为“1”◆在SPSS 中可以通过两种方式来完成:菜单运行方式 编程方式 ◆具体数据管理和准备过程DATA CLEANING.sps5. 数据管理与准备(5/5)◆利用处理好的数据,选择恰当的统计方法,解决基于此次调查提出的问题HIV_Data_Analysized.sav analysis.sps7. 分析报告 最终输出结果:final result.spo第二讲 SPSS Statistics介绍目录⏹2.1 SPSS Statistics介绍●2.1.1 SPSS Statistics 简介●2.1.2 SPSS Statistics 界面●2.1.3 SPSS Statistics 帮助⏹2.2 SPSS Statistics 21.0新特性⏹2.3 利用SPSS Statistics进行数据分析的一般步骤2. SPSS Statistics 的常用概念◆易用性强操作界面极为友好,操作简单 良好的帮助系统和自学功能为高级用户提供编程功能◆功能强大成熟的统计过程 完美的图形处理功能提供多种数据准备技术◆兼容性好数据输入: Excel, Lotus, Oracle, SQL Server, Access, dBASE, 文本,以及各类统计软件的数据形式SAS ,Stata 文件数据输出: Word, HTML, XML, Excel, PowerPoint, PDF1. SPSS Statistics 的基本特点2.1 SPSS Statistics 介绍◆6个窗口:数据编辑器、结构浏览器、语法编辑器、枢轴表编辑器、图表编辑器、文本输出编辑器◆4种运行方式:菜单对话框、程序、 Include 命令、SPSS Production Facility(结合SPSS 宏)◆4种结果输出:表格、文本、标准图、交互图2.1.1 SPSS Statistics简介1. SPSS Statistics名称和版本介绍SPSS Statistics是一款在调查统计行业、市场研究行业、医学统计、政府和企业的数据分析应用中久享盛名的统计分析工具,是世界上最早的统计分析软件。
全球约有28万家产品用户,它们分布于通讯、医疗、银行、证券、保险、制造、商业、市场研究、科研教育等多个领域和行业。