当前位置:文档之家› 利用spss对某个班成绩的多元统计分析

利用spss对某个班成绩的多元统计分析

利用spss对某个班成绩的多元统计分析
利用spss对某个班成绩的多元统计分析

对一所重点学校某个班成绩的综合分析

摘要

随着社会竞争的越来越激烈,家长和老师对于学生成绩的态度愈加重视,对于学生将来的发展与前途也同样感到一丝忧虑,因此及时公布学生的学习成绩并且能够增其长补其短对于学生将会有很大的帮助。本文利用某所重点学校某个班的成绩单来分析这个班学生成绩的优劣,以达到取长补短的目的,主要应用了SPSS软件对成绩进行了综合性的分析。

关键词:综合分析;SPSS软件;成绩

目录

1.对应分析的概述 (1)

2.聚类分析的概述 (3)

2.1聚类分析的定义 (3)

2.2聚类的方法分类 (3)

2.3系统聚类法的基本步骤 (3)

3.判别分析的概述 (4)

3.1判别分析的基本思想 (4)

3.2判别分析与聚类分析的关系 (4)

4.在SPSS软件上的操作步骤 (5)

4.1对应分析的操作步骤 (5)

4.2聚类分析与判别分析的操作步骤 (6)

5.结果分析 (7)

5.1对应表 (7)

5.2汇总 (7)

5.3概述行点和概述列点 (8)

5.6 特征值 (11)

5.7 显著性检验 (11)

5.8 标准化典型判别式函数系数 (11)

5.9 结构矩阵 (12)

5.10 群组重心的函数 (12)

5.11 分类函数系数 (13)

6.结论 (14)

7.对创新的认识 (15)

参考文献 (16)

附录 (17)

1.对应分析的概述

对应分析(correspondence analysis )又称为相应分析,是一种目的在于揭示变量和样品之间或者定性变量资料中变量与其类别之间的相互关系的多元统计分析方法。

根据分析资料的类型不同,对应分析分为定性资料(分类资料)的对应分析和连续性资料的对应分析(基于均数的对应分析)。其中,根据分析变量个数的多少,定性资料的对应分析又分为简单对应分析和多重对应分析。对两个分类变量进行的对应分析称为简单对应分析,对两个以上的分类变量进行的对应分析称为多重对应分析。

对应分析实际是在R 型因子分析和Q 型因子分析的基础上发展起来的一种方法。

对应分析将R 型因子分析和Q 型因子分析结合起来进行统计分析,它是从R 型因子分析出发,而直接获得Q 型因子分析的结果。克服了由于样品容量大,进行Q 型因子分析带来的计算上的困难。另外根据对原始数据进行规格化处理,找出R 型因子分析和Q 型因子分析的在联系,可将变量和样品同时反映到相同坐标轴的一图形上,便于对问题的分析和解释。

对应分析的重要输出结果之一在于,把变量与样品同时反映到相同坐标轴(因子轴)的一图形上,结合计算结果,在绘出的图形上能够直观地观察变量之间的关系、样品之间的关系以及变量与样品之间的对应关系。为此也有人认为,对应分析的实质是将变量、样品的交叉表变换成为一散点图,从而将表格中包含的变量、样品的关联信息用各散点空间位置关系的形式表现出来。

随着计算机软件的应用,对应分析的方法在社会科学和自然科学领域都有着广泛的应用价值。特别是近年来在市场调查与研究中,有关市场细分、产品定位、品牌形象以及满意度研究等领域正得到越来越广泛的重视和应用。

对应分析的关键是利用一种数据变换,使含有p 个变量n 个样品的原始数据矩阵,变换成为一个过渡矩阵Z ,并通过矩阵Z 将R 型因子分析和Q 型因子分析有机地结合起来。具体地说,首先给出进行R 型因子分析时变量点的协差阵Z Z A '=和进行Q 型因子分析时样品点的协差阵Z Z B '=,由于Z Z '和Z Z '有相同的非零特征根,记为

m λλλ≥≥≥ 21,),min(0n p m ≤<,

依据证明,如果A 的特征根i λ对应的特征向量为i U ,则B 的特征根i λ对应的特征向量就是i i V ZU ?,根据这个结论就可以很方便地借助R 型因子分析而得到Q 型因子分析的结果。因为求出A 的特征根和特征向量后很容易地写出变量点协差阵对应的因子载荷矩阵,记为F 。则

??????

? ??=m pm p p m m m m u u u u u u u u u F λλλλλλλλλ

221122221

211212111 这样,利用关系式i i V ZU ?也很容易地写出样品点协差阵B 对应的因子载荷阵,记为G 。则

??????

? ??=m nm n n m m m m v v v v v v v v v G λλλλλλλλλ

221122221

211212111 从分析结果的展示上,由于A 和B 具有相同的非零特征根,而这些特征根正是公共因子的方差,因此可以用相同的因子轴同时表示变量点和样品点,即把变量点和样品点同时反映在具有相同坐标轴的因子平面上,以便显示出变量点和样品点之间的相互关系,并且可以一并考虑进行分类分析。

2.聚类分析的概述

2.1聚类分析的定义

聚类分析是统计学中研究“物以类聚”问题的多元统计分析方法。聚类分析又称群分析,它是研究对样品或指标进行分类的一种多元统计方法。所谓的“类”,通俗地说就是相似元素的集合。

2.2聚类的方法分类

聚类分析的容十分丰富,按其聚类的方法可分为以下几种:系统聚类法、调优法、最优分割法、模糊聚类法、图论聚类法、聚类预报法。本文中应用的是系统聚类法:开始每个对象自成一类,然后每次将最相似的两类合并,合并后重新计算新类与其他类的距离或相近性测度,这一过程一直继续直到所有对象归为一类为止。并类的过程可用一谱系聚类图描述。

2.3系统聚类法的基本步骤

(1)计算n 个样品两两间的距离,得样品间的距离矩阵)0(D 。类与类之间的距离本文应用的是类平均法。所谓类平均法就是:两类样品两两之间平方距离的平均作为类之间的距离,即:221

e e e pq ij i G j p q D d n n =∑采用这种类间距离的聚 类方

法,称为类平均法。

(2) 初始(第一步:i=1)n 个样本各自构成一类,类的个数k=n ,第t

类 {})(t t X G =(t=1,2···,n )。此时类间的距离就是样品间的距离(即)0()1(D D =)。

(3)对步骤i 得到的距离矩阵)1(-i D ,合并类间距离最小的两类为一新类。此时类的总个数k 减少1类,即k=n-i+1.

(4)计算新类与其他类的距离,得新的距离矩阵)0(D 。若合并后类的总个数k 扔大于1,重新步骤(3)和(4);直到类的总个数为1时转到步骤(5)。

(5)画谱系聚类图;

(6)决定总类的个数及各类的成员。

3.判别分析的概述

3.1判别分析的基本思想

判别分析是用于判断个体所属类别的一种统计方法。根据已知观测对象的分类和若干表明观测对象特征的变量值,建立判别函数和判别准则,并使其错判率最小,对于一个未知分类的样本,将所测指标代入判别方程,从而判断它来自哪个总体。当然,这种准则在某种意义上是最优的,如错判概率最小或错判损失最小等。其前提是总体均值有显著差异,否则错分率大,判别分析无意义。

3.2判别分析与聚类分析的关系

区别:判别分析是在研究对象分类已知的情况下,根据样本数据推导出一个或一组判别函数,同时指定一种判别准则,用于确定待判样品的所属类别,使错判率最小。聚类分析预先不知道分类,它要解决的问题,正是对给定的未知分类的样品进行分类,它是一种纯统计技术,只要有多指标存在,就能根据各观测的变量值近似程度排序,只是描述性的统计,而判别分析能对未知分类观测判别分类,带有预测性质。

联系:两者都是研究分类问题,两种方法往往联合起来使用。样品聚类是进行判别分析之前的必要工作,根据样品聚类的结果进行判别分析。

4.在SPSS软件上的操作步骤

4.1对应分析的操作步骤

(1)打开SPSS文件,在表格下方有两个选项,分别是数据试图和变量视图,点击变量视图选项,在前三行分别输入“学号”、“科目”、“成绩”,其中学号与科目的值项需要做如下设置:在弹出的值标签对话框里,在值这一项里输入“1”,标签输入“1”,再点击“添加”按钮,依次添加到40为止,在科目的值标签对话框,在值这一项中输入“1”,标签输入“语文”,点击“添加”按钮,再依次添加“2”对应标签为“数学”,“3”对应标签为“外语”,“4”对应标签为“体育”,综上分别完成对1号至40号学号以及4项科目进行数字的赋值。

然后点击数据视图进行数据输入,数据输入按照成绩单输入(成绩单见附录),如:第一行第一列输入“1”,第二列输入“1”,第三列输入“82”,第二行第一列输入“2”,第二列输入“1”,第三列输入“81”,以此类推,共输入160行数据。在SPSS的数据视图中输入数据后,再依次点选数据→加权个案,进入加权个案的对话框,系统默认是对观测值不使用权重,选中加权个案选项,此时下面的频率变量被激活,选中成绩并点击箭头,使变量成绩充当权数的作用,点击确定。

(2)数据输入完成后,选择分析→降维→对应分析,然后把“学号”选入“行”,再点击“定义围…”来定义围为1(最小数值)到40(最大数值),之后点击更新,再点击继续。之后同样地,把“科目”选入“列”,并定义其围为1~4。然后点选“模型”,在出现的对话框中选择数据标准化方法,本次分析距离度量点选Eucliden,下面的标准化方法选择选项被激活,有5种可供选择的数据标准化方法,本次分析选择第5种:使列总和相等,删除均值,其余选项为默认,点击确定运行。

(3)图表编辑:根据SPSS对数据的计算,会得到一系列的表格,对对后一叠加散点图进行部分操作,双击叠加散点图会弹出一个图表编辑器,点击“向X轴添加参考线”又会弹出一个属性对话框,把位置坐标改为0,关闭对话框,点击“向Y轴添加参考线”,同上步骤将位置坐标改为0,关闭图表编辑器,此时叠加散点图被分为4各区域,方便于接下来的结果分析。

相关主题
文本预览
相关文档 最新文档