当前位置：文档之家› SPSS复习整理

SPSS复习整理

一、统计学中数据分析的一般步骤

①明确数据分析目标；②正确收集数据；③数据加工整理；④明确统计方法的含义和适用范围；⑤正确解释分析结果

二、利用SPSS进行数据分析的一般步骤

①SPSS数据的准备阶段；②SPSS数据的加工整理阶段；③SPSS数据的分析阶段；④SPSS分析结果的解释

三、统计数据的度量尺度

①名义尺度（人口性别、商品名称……）②定序尺度（如考试成绩优良中差、身高高中矮）③间隔尺度（成绩重量温度区间）

四、建立SPSS数据文件时应完成两项任务

①描述SPSS数据的结构②录入、编辑SPSS数据

五、纵向合并注意点

①两个待合并的SPSS数据文件的内容合并起来应具有实际意义。

②两个数据文件的结构最好一致。

③不同数据文件中含义相同的变量最好用相同的变量名，数据类型要相同。六、描述集中趋势的统计量

均值、中位数、众数、总和、百分位数

七、描述离散程度的统计量

样本方差、样本标准差、均值标准误差、极差

八、交叉表分析的概念：

一个变量是否对其他变量的取值存在影响，分析变量之间是否存在关系

九、假设检验（概念）

①统计假设

定义：要做出某些决策，常常要对总体先做出某些假设，这些假设正确也可能不正确。一般是关于总体概率分布的某些陈述。

包括：原假设和责备假设（二者互相排斥，并且同时只有一个正确）

原假设：被检验的假设，通过检验可能被接受，也可能被否定。（一般都是为了否定）

责备假设：任何不同于原假设的都是。

拒绝域、临界点：当检验统计量取某个区域中的值时，拒绝原假设，则称该取值区域为拒绝域，称拒绝域的边界点为临界点。

②假设检验的两类错误

（1）“弃真”错误：在假设检验中拒绝了本来是正确的原假设。

（2）“取伪”错误：在假设检验中没有拒绝了错误的原假设。

③显著性水平与置信水平

显著性水平：在做假设检验时，我们可以接受犯第一类错误的最大概率。记为α，通常抽样前就指定好，这样结果不会影响我们选择。常用0.05或0.01，试验中对精确度要求高或者试验结论重大的，α应该小。

置信水平：1-α

④概率P值

P值是当原假设正确时，观测到样本信息出现的概率。如果这个概率很小，就拒绝原假设。如何判断：与预先设定的显著性水平α值比较，小于α就拒绝原假设。“sig”意为“显著性”，后面的值就是P值。

十、单样本T 检验

概念：利用来自某总体的样本数据，推断该总体的均值与指定的检验值之间是否存在显著性差异，它是对总体均值的假设检验。检验均值，原假设：，其中是总体均值。

此检验涉及单个总体，并采用T 检验方法。前提：样本来自的总体服从或近似服从正态分布，

检验统计量：前提是服从正态分布，其中为总体均值0μ，2σ为总体方差。例：样本容量n ，

样本均值X ，则仍服从正态分布，即2

~)X N n σ（μ，在原假设成立的条件下，均值检验构造t 统计量：/X u t S n

μ用0μ代入，t 统计量服从自由度为n-1的T 分布，S 为样本标准差。均值标准误差是分母。

在给定原假设的前提下，SPSS 将检验值0μ代入t 统计量，得到检验统计量观测

值，以及根据T 的分布函数计算出概率P 值。

步骤：与假设检验一样

十一、老师PPT 部分

①条形图：给出每一类的频率，长方形的高度与频率成比例。

②帕累托图：帕累托图又叫排列图、主次图,是按照发生频率大小顺序绘制的直方图，表示有多少结果是由已确认类型或范畴的原因所造成。它是将出现的质量问题和质量改进项目按照重要程度依次排列而采用的一种图表。可以用来分析质量问题，确定产生质量问题的主要因素。

帕累托法则往往称为二八原理，即百分之八十的问题是百分之二十的原因所造成的。帕累托图在项目管理中主要用来找出产生大多数问题的关键原因，用来解决大多数问题

③饼图：显示一个数据系列中各项的大小与各项总和的比例。饼图中的数据点显示为整个饼图的百分比。

④直方图：又称质量分布图，柱状图。它是表示资料变化情况的一种主要工具。用直方图可以解析出资料的规则性，比较直观地看出产品质量特性的分布状态，对于资料分布状况一目了然，便于判断其总体质量分布情况。

⑤茎叶图：又称“枝叶图”，由统计学家约翰托奇设计，它的思路是将数组中的数按位数进行比较，将数的大小基本不变或变化不大的位作为一个主干（茎），将变化大的位的数作为分枝（叶），列在主干的后面，这样就可以清楚地看到每个主干后面的几个数，每个数具体是多少。

⑥直方图与茎叶图的区别：茎叶图是一个与直方图相类似的特殊工具，但又与直方图不同，茎叶图保留原始资料的资讯，直方图则失去原始资料的讯息。将茎叶图茎和叶逆时针方向旋转9O 度，实际上就是一个直方图，可以从中统计出次数，计算出各数据段的频率或百分比。从而可以看出分布是否与正态分布或单峰偏态分布逼近。

⑦在SPSS 统计中，个案加权有什么用途？

Ⅰ以频数格式录入数据时

在默认情况下，数据集中的每一行就是一条原始的记录，这在多数情况下是没

有问题的，但有时却非常麻烦。例如列联表的卡方检验，如果每一行就是一个原始记录就要输入N （总数）行！这时候一般使用频数格式录入数据，即相同取值的个案只录入一次，另加一个频数变量用于记录该数值共出现了多少次，这样就需要在分析时候使用“加权个案”，将数据指定为频数格式，这样SPSS 软件就认识了。

Ⅱ案例数据抽样权重的调整：统计抽样在理想情况下是等概率随机抽样，但许多时候是将整个总体拆分成若干层，然后对每层采取不同的抽样方法，这就造成了事实上的不等概率抽样，需要在数据采集抽样完毕进行统计分析之前，对每条数据进行抽样权重的计算和调整。抽样权重可以理解为一系列因素影响的乘积，每个影响因素对应某种抽样概率、覆盖率、应答率等方面的差异所导致的偏倚的调整。

十二、操作说明题书上例题

①【例4-1】以下是调查问卷中针对被调查人设置的两个问题：

1、您的家庭月收入大约是：（请包括所有工资、奖金、津贴等在内，以人民币为单位）单选

500-1000........1 1000-1999......2 2000-2999......3 3000-3999......4 4000-4999......5 5000-5999......6 6000-6999......7 7000-7999......8 8000-8999......9 9000-9999......10 10000及以上 (11)

2、您的教育程度：（指您受过的最高或正在接受的教育程度）单选没有受过正式教育/小学……….1 初中…………2 高中/中专/技校……3 大专/大学非本科/高职高专……4 大学本科……….5 研究生及以上……6 从问卷中收集到的数据如表4.1所示 , 试对收集到的数据进行频数分析解：

Step1数据组织建2个变量：“收入”、“教育”，度量标准均为序号 Step2频率分析设置 ▲选择菜单：“分析→ 描述统计 → 频率”，打开“频率（F ）”对话框，将“教育”和“收入”加入到“变量”列表框中。 ▲打开“统计量”对话框，选中“百分位数”“众数”，并在“百分位数”中添加30.0、60.0、90.0； ▲打开“图表”对话框，选中“直方图”及后面的复选框

Step3主要结果及分析

②【例4-2】图4-8是5岁儿童体重、身高、胸围的部分SPSS 数据，试对儿童身高作描述性统计分析。（数据文件：data4-2.sav ）

体重 17

15 21 16 18 20 17 17 18 身高 110.6 103.2 112.5 106.8 109.7 111.1 105.8 109.5 109.2

胸围 55

50 55 50 56 55 51 53 53 解：step1 打开数据文件data4-2.sav;

Step2 描述性分析设置

▲选择菜单“分析→ 描述统计 →描述” ，打开“描述性”主对话框，将要分析的变量“身高”加入“变量”列表框中。

收入教育 3 5

1 5

2 5 1 5 1 5 …… …… 6 10 10 5 4 5

▲打开“描述：选项”对话框，选中“均值”、“标准差”、“最小值”、“最大值”、“峰度”、“偏度”及显示顺序的“变量列表”等选项。

Step3运行结果及分析

③【例4-3】下表是某班3门课程对应成绩的统计数据，试对其作探索性分析并做是否服从正态分布的检验。

科目111111222

成绩837473306095731116

科目222333333

成绩755619859111553256

解：step1 数据组织：定义2个变量，分别为：“科目”、“成绩”，“科目”的度量标准为“名义”，“成绩”的度量标准为“度量”。

Step2探索分析设置：

▲选择菜单“分析→描述统计→探索”，打开“探索”对话框，，将“成绩”字段移入“因变量列表”，“科目”移入“因子列表”。

▲打开“统计量”对话框，选中“描述性”及“M-估计量”选项；

▲打开“探索：图”对话框，选中“按因子水平分组”、“茎叶图”、“带检验的正态图”等选项。

▲打开“探索：选项”，选中“按列表排除个案”选项。

Step3运行结果及分析

④【例4-4】在设置学生评价实验教学的调查表中，“实验准备”是其中的一项指标，为分析“实验准备”情况与评价结果的关系，建立的SPSS数据文件中的部分数据如下图所示，变量值标签如下表所示。（参见数据文件：data4-4.sav。）

解：第1步数据组织：数据文件中建立两个变量：“实验准备”、“评价结果”，两个变量均为数值型或字符型的分类变量，其度量标准为“名义”，保存为SPSS数据文件data4-3.sav。

第2步交叉表分析设置：

选择菜单：“分析→描述统计→交叉表”，打开“交叉表”对话框，将“实验准备”及“评价结果”字段分别加入“行(s)”及“列(c)”列表框中。

打开“统计量”对话框，选中“卡方”选项。

打开“单元显示”对话框，选中“观察值”及“四舍五入单元格计数”选项，二者都是缺省设置。

第3步主要结果及分析：

spss统计分析期末考试题

《统计分析软件》试（题）卷班级 xxx班姓名 xxx 学号 xxx 说明：1.本试卷分析结果写在每个题目下面（即所留空白处）； 2.考试时间为100分钟； 3.每个试题20分。一、（20分）已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件，学生成绩一.sav；学生成绩二.sav。要求：（1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并，并保存为“成绩.sav.” （2）对所建立的数据文件“成绩.sav”进行以下处理： 1）按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。 2）计算每个学生的总成绩、并按照总成绩的大小进行排序 3）把数学成绩分成优、良、中三个等级，规则为优(X≥85)，良(75≤X ≤84),中(X≤74)，并对优良中的人数进行统计。

分析：描述统计量性别N极小值极大值均值标准差男数学477.0085.0082.2500 3.77492有效的 N （列表状态）4 女数学1667.0090.0078.50007.09930有效的 N （列表状态）16

注：成绩优良表示栏位sxcj 优为1 良为2 中为3 由表统计得，成绩为优的同学有4人，占总人数的20%；良的同学有12人，占总人数的60%；中的同学有4人，占总人数的40%。二、（20分）为了解笔记本电脑的市场情况，针对笔记本电脑的3种品牌，进行了满意度调查，随机访问了30位消费者，让他们选出自己满意的品牌，调查结果见下表，其中变量“职业”的取值中，1表示文秘人员，2表示管理人员，3表示工程师，4表示其他人；3个品牌变量的取值中，1表示选择，0表示未选数据见Excel数据文件“调查.exe”。根据所给数据完成以下问题（1）将所给数据的Excel文件导入到SPSS中，要求SPSS数据文件写出数据结构（包括变量名，变量类型，变量值标签等）命，并保存为：“调查. Sav”。（2）试利用多选项分析，利用频数分析来分析消费者对不同品牌电脑的满意度状况；分析不同职业消费者对笔记本品牌满意度状况。分析：

spss复习整理讲课教案

一、单项选择题：(本大题小题,1 分/每小题,共分) 1.SPSS 的数据文件后缀名是: (A) .sav 2. 对数据的各种统计处理，SPSS是在下面哪一个选项中进行： (A) 数据编辑窗口； 3. 在SPSS中，下面哪一个不是SPSS的运行方式 (A) 输入运行方式； 4. 下面哪一个选项不属于SPSS的数据分析步骤： (D)数据扩展； 5. 在SPSS中，下面哪一个选项不属于对变量(列)的描述： (B) 变量名称大小； 6. 在SPSS的定义中，下面哪一个变量名的定义是错误的： (D)A_BFG_ ；首字符应以英文字母开头，后面可以跟除了！、？、*之外的字母或数字。下划线、圆点不能为变量名的最后一个字符。SPSS允许用汉字作为变量名。 7. 在SPSS的定义中，下面哪一个变量名的定义是错误的： (A)AND ；SPSS有默认的变量名，以字母"VAR开头，后面补足5位数字，如VAR00001 VAR00012等。变量名不能与SPSS内部特有的具有特定含义的保留字同名，如ALL、BY、AND、NOT、OR等。 8. 在SPSS数据文件中，下面那一项不属于数据的结构： (D)数据值； 9. 在SPSS数据文件中，下面那一项属于数据的内容： (D)数据值； 10. 通常来说，发放了900份问卷，可直接得到的有效问卷有800份，贝U SPSS所建立的相关数据文件中的行数为 (D)800； 11. 下面那一项不属于SPSS的基本变量类型： (D)整数型； 12. 当在SPSS数据文件中输入变量为“职工姓名”，则应选择的变量类型是： (B) 字符串型； 13. 当在SPSS数据文件中输入变量为“职工工资数”，则应选择的变量类型是： (A) 数值型； 13. 当在SPSS数据文件中输入变量为“公司成立日期”，则应选择的变量类型是： (C) 日期型； 14. 在SPSS的数据结构中，下面那一项不是“缺失数据”的定义： (D) 数据不是科学计数法； 15. 统计学依据变量的计量尺度将变量分为三类，以下哪一类不属于这三类： (D)科学计数类型； 16. 在统计学中，变量“身高”属于计量尺度中的： (A) 数值型变量；身高(定距)、优良中差(定序)、性别(定类) 17. 在统计学中，将变量“年龄”分为“老年”、“中年”、“青年”三个取值，分别用1、2、3 表示，则变量“年龄”属于计量尺度中的： (B) 定序型变量； 18. 在统计学中，将变量“性别”分为“男”、“女”、两个取值，分别用1、2表示，则变量 “性别”属于计量尺度中的： (C) 定类型变量； 19. 下面哪一个选项不能被SPSS系统正常打开： (C) 文本文件格式； 20. 下面哪一个选项不能被SPSS系统正常打开： (D) .exe ； 21. 在SPSS数据编辑窗口中，需要定义变量的数据结构，以下哪一项不属于变量的数据结构： (D) 变量值；

spss 期末题库

课程名称:《SPSS分析方法与应用》课程号: 2007422 一、单项选择题(共112小题） 1、试题编号：1000110,答案：RetEncryption(D)。 SPSS的安装类型有（） A. 典型安装 B.压缩安装 C.用户自定义安装 D.以上都是 2、试题编号：1000310,答案：RetEncryption(D)。数据编辑窗口的主要功能有（） A.定义SPSS数据的结构 B.录入编辑和管理待分析的数据 C.结果输出和B 3、试题编号：1000410,答案：RetEncryption(A)。（）文件格式是SPSS独有的，一般无法通过Word，Excel等其他软件打开。 4、试题编号：1000510,答案：RetEncryption(D)。（）是SPSS为用户提供的基本运行方式。 A.完全窗口菜单方式 B.程序运行方式 C.混合运行方式 D.以上都是 5、试题编号：1000810,答案：RetEncryption(D)。（）是SPSS中有可用的基本数据类型 A.数值型 B.字符型 C.日期型 D.以上都是 6、试题编号：1000910,答案：RetEncryption(D)。 spss数据文件的扩展名是( ) A..htm B..xls C..dat D..sav 7、试题编号：1001010,答案：RetEncryption(B)。数据编辑窗口中的一行称为一个（） A.变量 B.个案 C.属性 D.元组 8、试题编号：1001110,答案：RetEncryption(C)。

变量的起名规则一般：变量名的字符个数不多于（） A. 6 B. 7 C. 8 D. 9 9、试题编号：1001210,答案：RetEncryption(A)。统计学依据数据的计量尺度将数据划分为三大类，它不包括（） A. 定值型数据 B.定距型数据 C.定序型数据 D.定类型数据 10、试题编号：1001310,答案：RetEncryption(A)。在横向合并数据文件时，两个数据文件都必须事先按关键变量值（） A.升序排序 B.降序排序 C.不排序 D.可升可降 11、试题编号：1001810,答案：RetEncryption(A)。 SPSS算术表达式中，字符型（）应该用引号引起来。 A 常量 B变量 C算术运算符 D函数 12、试题编号：1001910,答案：RetEncryption(A)。复合条件表达式又称逻辑表达式，在逻辑运算中，下列（）运算最优先。 B AND C OR D都不是 13、试题编号：1002010,答案：RetEncryption(A)。数据选取的方法中，（）是按符合条件的数据进行选取。 A 按指定条件选取 B 随即选取 C选取某一区域内样本 D过滤变量选取 14、试题编号：1002110,答案：RetEncryption(B)。通过（）可以达到将数据编辑窗口中的技术数据还原为原始数据的目的。 A 数据转置 B 加权处理 C 数据才分 D以上都是 15、试题编号：1002210,答案：RetEncryption(A)。 SPSS的（）就是将数据编辑窗口中数据的行列互换 A 数据转置 B 加权处理 C 数据才分 D以上不都是 16、试题编号：1002310,答案：RetEncryption(B)。 SPSS软件是20世纪60年代末，由（）大学的三位研究生最早研制开发的。 A、哈佛大学 B、斯坦福大学 C、波士顿大学 D、剑桥大学 17、试题编号：1002710,答案：RetEncryption(D)。 SPSS中进行参数检验应选择（）主窗口菜单。 A、视图 B、编辑 C、文件 D、分析 18、试题编号：1002810,答案：RetEncryption(A)。 SPSS中进行输出结果的保存应选择（）主窗口菜单。 A、视图 B、编辑 C、文件 D、分析 19、试题编号：1002910,答案：RetEncryption(C)。 SPSS中进行数据的排序应选择（）主窗口菜单。 A、视图 B、编辑 C、数据 D、分析

如何用spss做相关性分析

如何用spss做相关性分析 ? ?|DBQG4NOBE8KM2CR6GZWM83US94ILCFVVBJR9HEPF8WU7ONR4JD5KZ98GXIE5OPT7YGN BN6RT2X2NUI2MCI2E5JPUEYSB ?浏览：20013 ?| ?更新：2014-06-14 10:19 简介相关性是指两个变量之间的变化趋势的一致性,如果两个变量变化趋势一致,那么就可以认为这两个变量之间存在着一定的关系(但必须是有实际经济意义的两个变量才能说有一定的关系)。相关性分析也是常用的统计方法,用SPSS统计软件操作起来也很简单,具体方法步骤如下。方法步骤 1.选取在理论上有一定关系的两个变量,如用X,Y表示,数据输入到SPSS中。

2.从总体上来看,X和Y的趋势有一定的一致性。 3.为了解决相似性强弱用SPSS进行分析,从分析-相关-双变量。 4.打开双变量相关对话框,将X和Y选中导入到变量窗口。

5.然后相关系数选择Pearson相关系数,也可以选择其他两个,这个只是统计方法稍有差异,一般不影响结论。

6.点击确定在结果输出窗口显示相关性分析结果,可以看到X和Y的相关性系数为 0.766,对应的显著性为0.076,如果设置的显著性水平位0.05,则未通过显著性检验,即认为虽然两个变量总体趋势有一致性,但并不显著。

相关分析研究的是两个变量的相关性,但你研究的两个变量必须是有关联的,如果你把历年人口总量和你历年的身高做相关性分析,分析结果会呈现显著地相关,但它没有实际的意义,因为人口总量和你的身高都是逐步增加的,从数据上来说是有一致性,但他们没有现实意义。

SPSS期末重点整理

t检验：一般是用于检验两组观测值的均值之间差异是否显著的统计分析方法。单样本t检验：用于检验样本均值与总体均值或某个已知值之间的差异的显著性。如果总体均值已知，那么样本均值与总体均值之间的差异显著性检验就属于单样本的t检验。独立样本t检验：独立样本指的是样本之间彼此独立，没有任何关联。两个独立样本的t检验用于检验两个不相关样本在相同变量上的观测值均值之间差异的显著性。要求①正态性，各个样本均来自于正态分布的总体；②方差齐性，各个样本所在的总体的方差相等；③独立性，两组数据之间是相互独立的，不能够相互影响。配对样本t检验：配对样本（或相关样本）指两个样本的数据之间彼此有关联。配对样本t 检验用于检验两个相关样本的均值或一个样本，两次测量结果的均值之间差异的显著性。方差分析：是一种通过分析样本数据的各项变异来源，以检验三个或三个以上样本平均数是否具有显著性差异的一种统计方法。单因素方差分析：用于检验一个因素变量的不同水平是否给一个（或几个相互独立的）因变量造成了显著的差异或变化。多重比较：进行了全方差分析之后，当自变量有3个或3个以上水平时，还有要对每两个组之间均值的差异进行比较，这称作事后组间均值的“多重比较”。多因素方差分析：是检验两个或两个以上因素变量（自变量）的不同水平是否给一个（或几个相互独立的）因变量造成了显著的差异或变化的分析方法。主效应和“交互作用”效应：主效应考察的是在忽略其他因素的情况下一个自变量对观察变量的影响，即这一个因素变量的不同水平分组下的观测值的均值之间的差异是否显著。当一个自变量的单独效应随另一个自变量的水平的不同而不同时，则这两个自变量对因变量的影响存在交互作用。协变量方差分析：是在进行方差分析时将那些除了要考察的自变量之外的、很难控制的、且对因变量产生显著影响的无关变量作为“协变量”，在分析自变量对因变量的影响时，消除协变量对因变量的影响，从而使分析的结果更准确。。多元方差分析：有两个或两个以上的因变量的方差分析（可以是单因素的，也可以是多因素的）称为多元方差分析。重复测量的方差分析：用于某个测量指标对每个被试在不同的时间内进行多次（3次或3次以上）重复测量的情况。组间因素：是被试分组的因素，组间因素有几个水平就把被试划分成几个组。组内因素：又称重复测量因素，就是测试的不同水平或不同次数，是在每个被试内的因素。组内因素的不同水平决定了重复测量的次数。方差成分分析：是对混合效应模型的分析，如对单变量重复测量和随机区组设计的分析，用于分析混合效应模型中各随机效应对因变量变异贡献的大小。通过对方差的成分进行分析，可以确定如何减小方差。相关分析：是分析两个变量观测值变化的一致性程度或密切程度的统计方法。简单相关分析：用于只对两个变量的数据做相关分析，其中包括两个连续变量之间的相关和两个等级变量之间的秩相关。偏相关分析：是控制第三变量（或其他多个变量）的影响后，两变量间相关程度的统计方法。皮尔逊相关：是对两列变量为连续等间隔（等距、等比）数据，而且数据呈正态分布的相关

实验一 SPSS简介及统计整理教学内容

实验一S P S S简介及统计整理

实验一SPSS简介及统计整理一、实验目的和要求 1掌握SPSS安装、启动、主界面和退出； 2掌握SPSS的变量定义信息； 3掌握SPSS的数据录入与保存方法； 4掌握在SPSS中的实现各种统计描述参数的计算。引到学生利用正确的统计方法对数据进行适当的整理和显示，描述并探索出数据内在的数量规律性，掌握统计思想，培养学生学习统计学的兴趣，为继续学习推断统计方法及应用各种统计方法解决实际问题打下必要而坚实的基础。 5理解并掌握SPSS软件包有关数据文件创建和整理的基本操作 6学习如何将收集到的数据输入计算机，建成一个正确的SPSS数据文件 7掌握如何对原始数据文件进行整理，包括数据查询，数据修改、删除，数据的排序8 实验类型：验证型；实验时间：2学时二、实验主要仪器和设备计算机一台，Windows XP操作系统，SPSS环境。三、实验原理 SPSS数据文件是一种结构性数据文件，由数据的结构和数据的内容两部分构成，也可以说由变量和观测两部分构成。一个典型的SPSS数据文件如表2.1 所示。 SPSS变量的属性

SPSS中的变量共有10个属性，分别是变量名（Name）、变量类型（Type）、长度（Width）、小数点位置（Decimals）、变量名标签（Label）、变量名值标签（Value）、缺失值（Missing）、数据列的显示宽度（Columns）、对其方式（Align）和度量尺度（Measure）。定义一个变量至少要定义它的两个属性，即变量名和变量类型，其他属性可以暂时采用系统默认值，待以后分析过程中如果有需要再对其进行设置。在spss数据编辑窗口中单击“变量视窗”标签，进入变量视窗界面（如图2.1所示）即可对变量的各个属性进行设置。四、实验内容与步骤实验1.1数据文件管理 1．创建一个数据文件数据文件的创建分成三个步骤：（1）选择菜单【文件】→【新建】→【数据】新建一个数据文件，进入数据编辑窗口。窗口顶部标题为“PASW Statistics数据编辑器”。（2）单击左下角【变量视窗】标签进入变量视图界面，根据实验的设计定义每个变量类型。（3）变量定义完成以后，单击【数据视窗】标签进入数据视窗界面，将每个具体的变量值录入数据库单元格内。 2．读取外部数据

研究生SPSS练习题

SPSS上机练习题一、10名15岁中学生身高体重数据如下：编号 1 2 3 4 5 6 7 8 9 10 性别男男男男男女女女女女身高（cm）166.0 169.0 170.0 165.1 172.0 159.4 161.3 158.0 158.6 169.0 体重（kg）57.0 58.5 51.0 58.0 55.0 44.7 45.4 44.3 42.8 51.5 体重指数（BMI）＝体重(kg) / 身高(m)2，即体重(kg)除以身高(m)的平方。回答下列问题：（1）男生体重指数的均数为（kg/m2）；标准差为：（kg/m2）（2）女生体重指数的均数为（kg/m2）；标准差为：（kg/m2）二、将126例十二指肠球部溃疡病人随机分为两组。甲药组治疗62人，54人有效；乙药组治疗64人，44人有效。问两种药物的治疗效果有无差别？三、为研究口服二号避孕药对血液凝固的影响，随机抽取服药组10例，对照组10例，分别测定其抗凝血酶活力（u）如下。问服用二号避孕药对抗凝血酶活力是否有影响？(3.sav) 口服二号避孕药对血液凝固的影响四、为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同，随机抽取了10份乳酸饮料制品，分别用脂肪酸水解法和哥特里－罗紫法测定其结果如表3-5第(1)~(3)栏。问两法测定结果是否不同？表3-5 两种方法对乳酸饮料中脂肪含量的测定结果(%) 编号(1) 哥特里－罗紫法 (2) 脂肪酸水解法 (3) 1 0.840 0.580 2 0.591 0.509 3 0.67 4 0.500

4 0.632 0.316 5 0.687 0.337 6 0.978 0.517 7 0.750 0.454 8 0.730 0.512 9 1.200 0.997 10 0.870 0.506 五、某单位欲研究3种药物对小白鼠肉瘤的抑制作用，将性别相同、体重相近的同一配伍组的3只小白鼠分别用3种药物抑癌，共5个配伍组。实验结果得瘤重（克）如下。试比较3种药物的抑癌作用有无差别？三种药物的抑癌作用（瘤重：克）六、某医院用A、B两种配方治疗慢性阑尾炎，治疗结果如下。试分析两种配方治疗慢性阑尾炎的疗效有无差别？两种配方治疗慢性阑尾炎疗效七、10名不同年龄妇女（岁）的收缩压测定值（kPa）如下，试进行回归分析。妇女号 1 2 3 4 5 6 7 7 9 10 年龄X i56427236634755493842 收缩压Y i19.616.721.315.719.817.120.019.315.318.7

典型相关分析SPSS例析

典型相关分析典型相关分析（Canonical correlation ）又称规则相关分析，用以分析两组变量间关系的一种方法；两个变量组均包含多个变量，所以简单相关和多元回归的解惑都是规则相关的特例。典型相关将各组变量作为整体对待，描述的是两个变量组之间整体的相关，而不是两个变量组个别变量之间的相关。典型相关与主成分相关有类似，不过主成分考虑的是一组变量，而典型相关考虑的是两组变量间的关系，有学者将规则相关视为双管的主成分分析；因为它主要在寻找一组变量的成分使之与另一组的成分具有最大的线性关系。典型相关模型的基本假设：两组变量间是线性关系，每对典型变量之间是线性关系，每个典型变量与本组变量之间也是线性关系；典型相关还要求各组内变量间不能有高度的复共线性。典型相关两组变量地位相等，如有隐含的因果关系，可令一组为自变量，另一组为因变量。典型相关会找出一组变量的线性组合**=i i j j X a x Y b y =∑∑与，称为典型变量；以使两个典型变量之间所能获得相关系数达到最大，这一相关系数称为典型相关系数。i a 和j b 称为典型系数。如果对变量进行标准化后再进行上述操作，得到的是标准化的典型系数。典型变量的性质每个典型变量智慧与对应的另一组典型变量相关，而不与其他典型变量相关；原来所有变量的总方差通过典型变量而成为几个相互独立的维度。一个典型相关系数只是两个典型变量之间的相关，不能代

表两个变量组的相关；各对典型变量构成的多维典型相关，共同代表两组变量间的整体相关。典型负荷系数和交叉负荷系数典型负荷系数也称结构相关系数，指的是一个典型变量与本组所有变量的简单相关系数，交叉负荷系数指的是一个典型变量与另一组变量组各个变量的简单相关系数。典型系数隐含着偏相关的意思，而典型负荷系数代表的是典型变量与变量间的简单相关，两者有很大区别。重叠指数如果一组变量的部分方差可以又另一个变量的方差来解释和预测，就可以说这部分方差与另一个变量的方差之间相重叠，或可由另一变量所解释。将重叠应用到典型相关时，只要简单地将典型相关系数平方（2 CR）,就得到这对典型变量方差的共同比例，代表一个典型变量的方差可有另一个典型变量解释的比例，如果将此比例再乘以典型变量所能解释的本组变量总方差的比例，得到的就是一组变量的方差所能够被另一组变量的典型变量所能解释的比例，即为重叠系数。例1：CRM（Customer Relationship Management）即客户关系管理案例，有三组变量，分别是公司规模变量两个（资本额，销售额），六个CRM实施程度变量（WEB网站，电子邮件，客服中心，DM 快讯广告Direct mail缩写，无线上网，简讯服务），三个CRM绩效维度（行销绩效，销售绩效，服务绩效）。试对三组变量做典型相关分析。

spss期末大数据分析报告

SPSS在教育研究中的应用某大学学生对本校的满意度调查学院：教育学院专业：课程与教学论学号：201411000156 姓名：李平 2014年12月13日

目录一、研究问题的提出 (3) 二、研究内容与方法 (3) (一) 研究内容 (3) (二) 研究方法 (3) 三、调查对象及人数 (4) 四、问卷分析 (5) （一）回收情况 (5) （二）信度分析 (5) 五、数据统计与分析 (6) （一）数据输入 (6) （二）数据分析 (7) 1.描述统计 (7) （1）多选题描述统计 (7) （2）单选题描述统计 (9) 2.推断统计 (12) （1）独立样本T检验 (12) （2）单一样本T检验 (15) （3）单因素方差分析 (17) （4） X2检验 (21) 3.相关分析 (22) （1）变量间相关分析 (22) （2）维度间相关分析 (23) 六、结论 (27) 七、附录 (28)

一、研究问题的提出学生的学校生活和成长密切相关。我们通过对他们的大学生活满意度的调查结果向有关部门提出建议，并希望能引起学校对这一系列问题的关注，最终希望大学生对其大学的满意度有所提升，大学生是一个庞大的群体，特别是近几年，随着高校的扩招，我国越来越多人能够上大学。上大学是很多人的梦想，他们都憧憬着大学校园的生活，然而当他们进了大学后才发现大学生活并非所想的美好，取而代之的却是对校园生活的不满，大学生是十分宝贵的人才资源，他们对校园生活的体验和感受，与他们的更好的学习。二、研究内容与方法 (一)研究内容了解学生对于学校的师资水平、环境、日常管理等各方面的满意度。 (二)研究方法 1.问卷编制本研究采用自编问卷，问卷共由两部分组成：基本情况部分包括被调查者的性别、年级等，问卷主体部分包括师资水平、学校环境、日常管理三大维度，细分为12个三级指标（见表2-1），问卷采用五点制计分法，即“非常满意”、“满意”、“一般”、“不满意”、“非常不满意”，分别赋值5分、4分、3分、2分、1分。表2-1 某大学学生对本校的满意度测评指标体系一级指标二级指标（潜在变量）三级指标（观测变量）对自己师资水平对教师教学方法、对教师工作态度、对教师人品修养、对师资配备学校的意学校环境对学习环境、对就餐环境、对居住环境、对校园绿化环境满度指数日常管理对专业课时安排、对收费标准、对奖、助学金制度、对学校治安

SPSS期末考试整理

●一。变量的赋值 1.乘方（**），例如二的三次方：2**3 2.不同规则的赋值：转换→计算变量（如果），每一个规则的赋值都要重新进行此步骤（但注意每一遍的变量名都不变，并且他都会问你要不要替换成新的变量，你选是就行了） 3.不同规则的赋值：（1）转换→重新编码为不同变量：输入变量，输出变量，要点击“变化量”才可保存输出变量→新值和旧值：值（直接选取取值）、范围（最大到最小的范围，包含端点值），点击“添加”成功保存新值和旧值→所有不同取值规则都完成后点击继续、确定，则在变量视图多出一个新变量（2）若不想包含端点值，可以采取小数的方式变换，eg. 899.9（小数位比该变量属性的小数位多一位就行了）（3）这种要先把BMI按照男女分开，然后再分组的，可以在对话框中点击“如果”选项进行设置，并且要分别对男女进行上述操作（一共做两遍）。二。离散化 1可视离散化：转换→可视分箱，分割点：所以想生成几组，就定义几个分割点；填写第一个分割点的时候就必须填写最小值；一定要选中上端点排除。三。排序 1.转换→自动重新编码：不分组，从头到尾排序 2.转换→个案排秩（1）多层次数据：基于A变量对B变量进行排序。（例如，基于职称对收入进行排序，就是不同职称各自组内排工资的高低）（2）设置秩1；绑定值四。时间序列：转换→变动值五。查找与计数：转换→对个案内的值计数（查找“基本工资800-900女职工”，生成新变量，满足这个条件的标为1，不符合这个标准的标为0，男职工标为缺失。范围：包含上限下限） ●六。数据→个案排序：把变量顺序完全按照你想要的标准排序，所有的变量顺序都会改变七。拆分文件：要分男女进行数据统计：数据→拆分文件→比较组/按组输出，分组依据。不分男女进行数据统计：数据→拆分文件→分析所有个案八。选择个案（例如只选择三年级的变量进行分析）：数据→选择个案→如果条件满足：如果；随机个案样本；基于时间或个案范围；使用过滤变量（例如要把身高为缺失值和值为0的剔除）→输出：过滤（不符合条件的数据会画上“/”，原始数据并未删除）；将选定个案复制到新数据集（形成一个新的SPSS数据文件，原始数据并未删除）；删除未选定的个案（删除原始数据，不建议使用）→之后在分析的时候就只会分析三年级的变量。不想只分析三年及，记得重新做这一步。九。加权个案：数据→加权个案（例。100分的有5人）。不想加权了，记得重新做这一步。十。分类汇总（1）例如算不同年级的人的身高的均值、方差…（只能计算函数）（2）数据→汇总，分界变量（分类标准变量），变量摘要（计算变量），函数：选择计算变量函数，变量名称与标签：定义新生成变量的名称与标签 ●十一。长宽数据的转换 1.长数据变宽数据：索引变量消失变成score的尾缀（1）数据→重组（重构）→个案重组为变量，标识变量，索引变量，电脑会自动帮你选出是xx xx要重构（不同疗程值不同的变量）。选完上述这些之后就一直点下一步&完成&立即重构&确定即可（2）注意：当有多个变量需要重构时要自己决定“新变量组的顺序”。（A1A2B1B2;A1B1A2B2） 2.宽数据变长数据：score的尾缀消失变成索引变量（1）数据→重组（重构）→变量重组为个案，个案组标识：使用选定变量，固定变量（手动选择，电脑不会自动帮你选出了），要转置的变量即值不固定的要重构的变量（手动选择，电脑不会自动帮你选出了）。选完上述这些之后就一直点击下一步&完成&立即重构数据&确定就行了（2）当有多个变量需要重构时，这块的操作要特别注意：○1首先在“变量组数目”中选择“多个”○2然后在“选择变量”里要对于不同的“目标变量”分别定义“要转置的变量”（在本题中，即对于kidid目标变量定义一遍要转置的变量；对于age目标变量在定义一遍要转置的变量。其中，这两个要转置的变量必须是完全不同的）。但只需要定义一次“个案组标识”&“固定变量”（固定变量是相对于kidid & age都固定的那些变量；而不是说在对kidid进行转置的时候，age就是固定变量了；因此，固定变量只用定义一次且固定变量可以为空）。并且，你要特别注意，“个案组标识”里选择的变量& n个“要转置的变量”里选择的变量&“固定变量”里选择的变量都必须是完全不相同的。

SPSS典型相关分析

SPSS数据统计分析与实践第二十二章：典型相关分析（Canonical Correlation）主讲：周涛副教授北京师范大学资源学院教学网站：https://www.doczj.com/doc/ce10535295.html,/Courses/SPSS

典型相关分析（Canonical Correlation）本章内容：一、典型相关分析的基本思想二、典型相关分析的数学描述三、SPSS实例四、小节

典型相关分析的基本思想 z典型相关分析是研究两组变量之间相关关系的一种多元统计方法。 z简单相关系数；复相关系数；典型相关系数 z典型相关分析首先在每组变量中找出变量的线性组合，使其具有最大相关性； z然后再在每组变量中找出第二对线性组合，使其与第一对线性组合不相关，而第二对本身具有最大相关性； z如此继续下去，直到两组变量之间的相关性被提取完毕为止； z这些综合变量被称为典型变量（canonical variates）；第I对典型变量间的相关系数则被称为第I 典型相关系数（一般来说，只需提取1～2对典型变量即可较为充分的概括样本信息）。

典型相关分析的目的 T q T p Y Y Y Y X X X X ),,,() ,,,(2121K K ==设两组分别为p 与q 维 (p ≤q)的变量X ,Y ：设p + q 维随机向量协方差阵，????????=Y X Z ??? ?????ΣΣΣΣ=Σ222112 11其中Σ11是X 的协方差阵，Σ22是Y 的协方差阵，Σ12=ΣT 21是X ，Y 的协方差阵典型相关分析用X 和Y 的线性组合U =a T X , V =b T Y 之间的相关来研究X 和Y 之间的相关性。其目的就是希望找到向量a 和b ，使ρ（U ，V ）最大，从而找到替代原始变量的典型变量U 和V 。

spss复习资料整理

第一章 1.SPSS是软件英文名称的首字母缩写，其最初为Statistical Package for the Social Sciences的缩写，即“社会科学统计软件包”。 2.SPSS系统运行管理方式（SPSS的几种基本运行方式）有：（1）完全窗口菜单运行方式（2）程序运行管理方式（3）混合运行管理方式 3.SPSS的界面提供的五个窗口：数据编辑窗口、结果管理窗口、结果编辑窗口、语法编辑窗口、脚本窗口。第二章 1.SPSS的文件类型：语法文件（*.sps）、数据文件（*.sav）、结果输出文件（*.spv）。 2.SPSS数据编辑器的每一行数据称为一个个案（Case）,每一个数据代表个体的属性，即变量（V ariable）。 3.SPSS变量名的命名规则： 1）必须以英文字母开头，其他部分可以含有字母、数字、下划线（即“-”）； 2）变量名尽量避免和SPSS已有的关键字重复，例如sum、compute、anova等； 3）SPSS13及以后版本支持变量名最长为64Byte,即变量名最长为64个英文字符，或者32个中文字符； 4）SPSS变量名不区分大小写，即SPSS认为Name、name、nAme这三个变量名没有区别。 4.变量度量类型：定量（个数、高度、温度等）、定序（“十分重要”、“重要”、“一般”、“不重要”）、定类（名字、地址、电话等）。 5.列和宽度的区别：变量宽度：对字符型变量，该数值决定了你能输入的字符串的长度；列：设定该变量数据视图中列的宽度。 7.默认的缺失值类型：数值型类型（.）、字符串类型（空格）。 8.数据文件的合并包括：纵向合并和横向合并（合并个案和合并变量），合并变量包括一对一合并和一对多合并。 9.SPSS用“（*）”表示变量来自于当前活动数据文件中的变量，而用“（+）”表示将要和当前数据文件进行合并的数据文件中的变量。 10.在合并数据文件之前，所有需要合并的数据文件必须预先按照关键变量进行升序排列。否则，合并文件程序将失败。 11.（选择题）一对一合并变量时，两个文件都要提供个案；一对多合并时，活动的和非活动的文件都可以作为关键字。课后练习题： 6.下列可以作为SPSS变量名的是 A).PRENTS12 B).1Name C).NOT TRUE D).@result 7.SPSS中可以设置工作目录，具体设置可以按照以下菜单： A).【选项】→【设置】 B).【编辑】→【选项】→【设置】 C).【编辑】→【选项】→【文件位置】

SPSS相关分析案例讲解

相关分析一、两个变量的相关分析：Bivariate 1．相关系数的含义相关分析是研究变量间密切程度的一种常用统计方法。相关系数是描述相关关系强弱程度和方向的统计量，通常用r 表示。 ①相关系数的取值范围在-1和+1之间，即：–1≤r ≤ 1。 ②计算结果，若r 为正，则表明两变量为正相关；若r 为负，则表明两变量为负相关。 ③相关系数r 的数值越接近于1（–1或+1），表示相关系数越强；越接近于0，表示相关系数越弱。如果r=1或–1，则表示两个现象完全直线性相关。如果=0，则表示两个现象完全不相关（不是直线相关）。 ④3.0

spss精选整理笔记

1、spss的三种输出结果: 表格格式格式文本格式标准图与交互图 2、变量名的定义与保留字不同，同时变量名不能一数字开头。变量名不能与spss保留字相同，spss的保留字有ALL、END、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、TO、WITH。 3、字符型：字符型数据的默认显示宽度为8个字符位，系统不区分变量名中的大小写字母，并且不能进行数学运算。注意：在输入数据时不应输入引号，否则双引号将会作为字符型数据的一部分。 4、（1）定类尺度（Nominal Measurement）：定类尺度是对事物的类别或属性的一种测度，按照事物的某种属性对其进行分类或分组。离散型特点：其值仅代表了事物的类别和属性，即能测度类别差异，不能比较各类之间的大小，所以各类之间没有顺序和等级。对定类尺度的变量只能计算频数和频率。在spss中，能适用定类尺度的数据可以是数值型，也可以是字符型变量。使用定类变量对事物进行分类时，必须符合穷尽原则和互斥原则。（2）定序尺度（Ordinal Measurement）：定序尺度是对事物之间的等级或顺序差别的一种测度，可比较优劣或排序。离散型

特点：由于定序变量只能侧度类别之间的顺序，无法测出类别之间的准确差值，即测量数值不代表绝对的数量大小，所以其测量结果只能排序，不能进行运算。（3）定矩尺度（Interval Measurement）：定矩尺度是对事物类别或次序之间间距的测度。特点：不仅能将事物区分为不同类型并进行排序，而且可能准确指出类别之间的差距是多少；定矩变量通常以自然或物理单位为计量尺度，因此测量结果往往表现为数值，所以计量结果可以进行加减运算。（4）定比尺度（Scale Measurement）：定比尺度是能够测算两个测度值之间比值的一种计量尺度，它的测量结果同定距变量一样表现为数值。特点：定比变量是测量尺度的最高水平，它除了具有其他三种测量尺度的全部特点外，还具有可计算两个测度之间比值的特点，因此它可以进行加、减、乘、除运算，而定矩变量值可进行加减运算。定类、定序、定距、定比变量的比较适用的运算形式=、??、?+、- X、∕ 变量

回归分析SPSS习题复习资料

回归分析习题 1通常用来评价商业中心经营好坏的一个综合指标是单位面积的营业额，它是单位时间内(通常为一年)的营业额与经营面积的比值。对单位面积营业额的影响因素的指标有单位小时车流量、日人流量、居民年平均消费额、消费者对商场的环境、设施及商品的丰富程度的满意度评分。这几个指标中车流量和人流量是通过同时对几个商业中心进行实地观测而得到的。而居民年平均消费额、消费者对商场的环境、设施及商品的丰富程度的满意度评分是通过随机采访顾客而得到的平均值数据。（数据集wyzl4_2中存放了从某市随机抽取的20个商业中心有关指标的数据，利用该数据完成下列工作（1）研究变量间的相关程度。（其余6个变量与“单位面积年营业额”间的相关程度，其余6个变量之间的相关程度）；（2）由（1）的结论建立“单位面积年营业额”与和其线性相关程度最高的变量的一元线性回归方程；（3）采用逐步回归方法建立“单位面积年营业额”的预测公式。表20个商业中心有关指标的数据 2．我国从1982~2001年间的20年的财政收入(Y)和国内生产总值（X）的数据存放在数据集wyz4_4_7.中。试分别采用指数回归、对数回归、幂函数回归和多项式回归给出回归方程，并选择最佳回归方程。 1．解：（1）变量间的相关性分析利用SPSS软件构造所有变量的散点图矩阵和相关矩阵，结果见图1和表1 从散点图矩阵直观可以看出Y “单位面积年营业额”与x2“日人流量(万人) ”和x3“居民年消费额(万元) ”线性关系较密切。

x2“日人流量 (万人) ”与x6 “对商场商品丰富程度满意度” 线性关系较密切从表1得)3,(x y ρ=0.795**，)2,(x y ρ=0.790**，)6,(x y ρ=.0 .697**，说明 Y “单位面积年营业额”与x3“居民年消费额(万元) ”，x2“日人流量 (万人) ”，x6 “对商场商品丰富程度满意度”及x5 “对商场设施满意度”在0 .01 水平（双侧）上显著相关线性关。可以考虑采用多元线性回归模型来建立“单位面积年营业额”的预测公式。图1散点图矩阵单位面积年营业额（万元/m2) 每小时机动车流量（万辆）日人流量（万人）居民年消费额（万元）对商场环境满意度对商场设施满意度对商场商品丰富程度满意度单位面积年营业额（万元/m2) Pearson 相关性 1 .413 .790** .795** .341 .450* .697** 显著性（双侧） .071 .000 .000 .141 .046 .001 N 20 20 20 20 20 20 20 每小时机动车流量（万辆） Pearson 相关性 .413 1 .751** -.129 .664** .424 .774** 显著性（双侧） .071 .000 .588 .001 .062 .000 N 20 20 20 20 20 20 20 日人流量（万人） Pearson 相关性 .790** .751** 1 .273 .594** .279 .983**

spss统计分析期末考试题

《统计分析软件》试（题）卷班级xxx班姓名xxx 学号xxx 题号一二三四五六总成绩成绩说明：1.本试卷分析结果写在每个题目下面（即所留空白处）； 2.考试时间为100分钟； 3.每个试题20分。一、（20分）已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件，学生成绩一.sav；学生成绩二.sav。要求：（1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并，并保存为“成绩.sav.” （2）对所建立的数据文件“成绩.sav”进行以下处理： 1）按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。 2）计算每个学生的总成绩、并按照总成绩的大小进行排序 3）把数学成绩分成优、良、中三个等级，规则为优(X≥85)，良(75≤X ≤84),中(X≤74)，并对优良中的人数进行统计。

分析：（2）描述统计量性别N 极小值极大值均值标准差男数学 4 77.00 85.00 82.2500 3.77492 有效的N （列表状态） 4 女数学16 67.00 90.00 78.5000 7.09930 有效的N （列表状态）16

SPSS的相关分析

第8章SPSS的相关分析学习目标： 1.明确相关关系的含义以及相关分析的主要目标。 2.掌握散点图的含义，熟练掌握绘制散点图的具体操作。 3.理解简单相关系数、Spearman相关系数、Kendall相关系数的基本原理，熟练掌握计算各种相关系数的具体操作，能够读懂分析结果。 4.理解偏相关系分析的主要目标以及与相关分析之间的关系，熟练掌握偏相关分析的具体操作，能够读懂分析结果。 8.1 相关分析相关分析是分析客观事物之间关系的数量分析方法，明确客观事物之间有怎样的关系对理解和运用相关分析是极为重要的。客观事物之间的关系大致可归纳为两大类关系，它们是函数关系和统计关系。相关分析是用来分析事物之间统计关系的方法。所谓函数关系指的是两事物之间的一种一一对应的关系，即荡一个变量x取一定值时，另一变量y可以依确定的函数取唯一确定的值。例如，商品的销售额与销售量之间的关系，在单价确定时，给出销售量可以唯一地确定出销售额，销售额与销售量之间是一一对应的关系，且这个关系可以被y=Ρx（y表示销售额，Ρ表示单价，x表示销售量）这个数学函数精确地描述出来。客观世界中这样的函数关系有很多，如圆面积和圆半径、出租车费和行程公里数之间的关系等。另一类普遍存在的关系是统计关系。统计关系指的是两事物之间的一种非一一对应的关系，即当一个变量x取一定值时，另一变量y无法依确定的函数取唯一确定的值。例如，家庭收入和支出、子女身高和父母身高之间的关系等。这些事物之间存在一定的关系，但这些关系却不能像函数关系那样可用一个确定的数字函数描述，且当一个变量x取一定值时，另一变量y的值可能有若干个。统计关系可再进一步划分为线性相关和非线性相关关系。线性相关又可分为正线性相关和负线性相关。正线性相关关系指两个变量线性的相随变动方向相同，而负线性相关关系指两个变量线性的相随变动方向相反。事物之间的函数关系比较容易分析和测度，而事物之间的统计关系却不像函数关系那样直接，但确实普遍存在，并且有的关系强，有的关系弱，程度各有差异。如何测度事物间统计关系的强弱是人们关注的问题。相关分析正是一种简单易行的测度事物之间统计关系的有效工具。绘制散点图和计算相关系数是相关分析最常用的工具，他们的互相结合能够达到较为理想的分析效果。 8.2绘制散点图 8.2.1散点图的特点绘制散点图是相关分析过程中极为常用且非常直观的分析方式。它将数据以点的形式画在直角平面上。通过观察散点图能够直观地发现变量间的统计关系以及它们的强弱程度和数据对的可能走向。在实际分析中，散点图经常表现出某些特定的形状。如绝大多数的数据点组成类似于“橄榄球”的形状，或集中形成一根“棒状”，而剩余的少数数据点零散地分布在四周。通常“橄榄球”和“棒状”代表了数据对的主要结构和特征，可以利用曲线将这种主要结构的轮廓描绘出来，使数据的主要特征更突显。图8—1是常见的几种散点图以及反映出的统计关系的强弱程度。