利用spss对某个班成绩的多元统计分析.doc

  • 格式:doc
  • 大小:245.99 KB
  • 文档页数:19

下载文档原格式

  / 19
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

对一所重点学校某个班成绩的综合分析

摘要

随着社会竞争的越来越激烈,家长和老师对于学生成绩的态度愈加重视,对于学生将来的发展与前途也同样感到一丝忧虑,因此及时公布学生的学习成绩并且能够增其长补其短对于学生将会有很大的帮助。本文利用某所重点学校某个班的成绩单来分析这个班学生成绩的优劣,以达到取长补短的目的,主要应用了SPSS软件对成绩进行了综合性的分析。

关键词:综合分析;SPSS软件;成绩

目录

1.对应分析的概述 (1)

2.聚类分析的概述 (3)

2.1聚类分析的定义 (3)

2.2聚类的方法分类 (3)

2.3系统聚类法的基本步骤 (3)

3.判别分析的概述 (4)

3.1判别分析的基本思想 (4)

3.2判别分析与聚类分析的关系 (4)

4.在SPSS软件上的操作步骤 (5)

4.1对应分析的操作步骤 (5)

4.2聚类分析与判别分析的操作步骤 (6)

5.结果分析 (7)

5.1对应表 (7)

5.2汇总 (7)

5.3概述行点和概述列点 (8)

5.6 特征值 (11)

5.7 显著性检验 (11)

5.8 标准化典型判别式函数系数 (11)

5.9 结构矩阵 (12)

5.10 群组重心的函数 (12)

5.11 分类函数系数 (13)

6.结论 (14)

7.对创新的认识 (15)

参考文献 (16)

附录 (17)

1.对应分析的概述

对应分析(correspondence analysis )又称为相应分析,是一种目的在于揭示变量和样品之间或者定性变量资料中变量与其类别之间的相互关系的多元统计分析方法。

根据分析资料的类型不同,对应分析分为定性资料(分类资料)的对应分析和连续性资料的对应分析(基于均数的对应分析)。其中,根据分析变量个数的多少,定性资料的对应分析又分为简单对应分析和多重对应分析。对两个分类变量进行的对应分析称为简单对应分析,对两个以上的分类变量进行的对应分析称为多重对应分析。

对应分析实际是在R 型因子分析和Q 型因子分析的基础上发展起来的一种方法。

对应分析将R 型因子分析和Q 型因子分析结合起来进行统计分析,它是从R 型因子分析出发,而直接获得Q 型因子分析的结果。克服了由于样品容量大,进行Q 型因子分析带来的计算上的困难。另外根据对原始数据进行规格化处理,找出R 型因子分析和Q 型因子分析的内在联系,可将变量和样品同时反映到相同坐标轴的一张图形上,便于对问题的分析和解释。

对应分析的重要输出结果之一在于,把变量与样品同时反映到相同坐标轴(因子轴)的一张图形上,结合计算结果,在绘出的图形上能够直观地观察变量之间的关系、样品之间的关系以及变量与样品之间的对应关系。为此也有人认为,对应分析的实质是将变量、样品的交叉表变换成为一张散点图,从而将表格中包含的变量、样品的关联信息用各散点空间位置关系的形式表现出来。

随着计算机软件的应用,对应分析的方法在社会科学和自然科学领域都有着广泛的应用价值。特别是近年来在市场调查与研究中,有关市场细分、产品定位、品牌形象以及满意度研究等领域正得到越来越广泛的重视和应用。

对应分析的关键是利用一种数据变换,使含有p 个变量n 个样品的原始数据矩阵,变换成为一个过渡矩阵Z ,并通过矩阵Z 将R 型因子分析和Q 型因子分析有机地结合起来。具体地说,首先给出进行R 型因子分析时变量点的协差阵

Z Z A '=和进行Q 型因子分析时样品点的协差阵Z Z B '=,由于Z Z '和Z Z '有相同

的非零特征根,记为

m λλλ≥≥≥Λ21,),min(0n p m ≤<,

依据证明,如果A 的特征根i λ对应的特征向量为i U ,则B 的特征根i λ对应的特征向量就是i i V ZU ∆,根据这个结论就可以很方便地借助R 型因子分析而得到Q 型因子分析的结果。因为求出A 的特征根和特征向量后很容易地写出变量点协差阵对应的因子载荷矩阵,记为F 。则

⎪⎪⎪⎪

⎝⎛=m pm p p m m m m u u u u u u u u u F λλλλλλλλλΛ

M M M ΛΛ2

21

122

221

2112121

11 这样,利用关系式i i V ZU ∆也很容易地写出样品点协差阵B 对应的因子载荷阵,记为G 。则

⎪⎪⎪⎪

⎝⎛=m nm n n m m m m v v v v v v v v v G λλλλλλλλλΛ

M M M ΛΛ2

21

122

221

2112121

11 从分析结果的展示上,由于A 和B 具有相同的非零特征根,而这些特征根正是公共因子的方差,因此可以用相同的因子轴同时表示变量点和样品点,即把变量点和样品点同时反映在具有相同坐标轴的因子平面上,以便显示出变量点和样品点之间的相互关系,并且可以一并考虑进行分类分析。

2.聚类分析的概述

2.1聚类分析的定义

聚类分析是统计学中研究“物以类聚”问题的多元统计分析方法。聚类分析又称群分析,它是研究对样品或指标进行分类的一种多元统计方法。所谓的“类”,通俗地说就是相似元素的集合。

2.2聚类的方法分类

聚类分析的内容十分丰富,按其聚类的方法可分为以下几种:系统聚类法、调优法、最优分割法、模糊聚类法、图论聚类法、聚类预报法。本文中应用的是系统聚类法:开始每个对象自成一类,然后每次将最相似的两类合并,合并后重新计算新类与其他类的距离或相近性测度,这一过程一直继续直到所有对象归为一类为止。并类的过程可用一张谱系聚类图描述。

2.3系统聚类法的基本步骤

(1)计算n 个样品两两间的距离,得样品间的距离矩阵)0(D 。类与类之间的距离本文应用的是类平均法。所谓类平均法就是:两类样品两两之间平方距离的

平均作为类之间的距离,即:221

e e e

pq ij

i G j p q

D d

n n =

∑采用这种类间距离的聚 类方法,

称为类平均法。

(2) 初始(第一步:i=1)n 个样本各自构成一类,类的个数k=n ,第t 类 {})(t t X G =(t=1,2···,n )。此时类间的距离就是样品间的距离(即)0()1(D D =)。 (3)对步骤i 得到的距离矩阵)1(-i D ,合并类间距离最小的两类为一新类。此时类的总个数k 减少1类,即k=n-i+1.

(4)计算新类与其他类的距离,得新的距离矩阵)0(D 。若合并后类的总个数k 扔大于1,重新步骤(3)和(4);直到类的总个数为1时转到步骤(5)。 (5)画谱系聚类图;

(6)决定总类的个数及各类的成员。