系统工程实验报告--基于SPSS的聚类分析实验
- 格式:docx
- 大小:658.15 KB
- 文档页数:15
SPSS聚类分析实验报告一、实验目的本实验的目的是通过应用SPSS软件进行聚类分析,对样本进行分类和分组,通过群组间的比较来发现变量之间的关系和特征。
通过聚类分析的结果,可以帮助我们更好地理解和解释数据。
二、实验步骤1.数据准备:选择合适的数据集进行分析。
数据集应包含若干个已知变量,以及我们需要进行聚类的目标变量。
2.打开SPSS软件,导入数据集。
3.对数据集进行数据清洗和预处理,包括处理缺失数据、异常值等。
4.进行聚类分析:选择合适的聚类方法和变量,进行聚类分析。
5.对聚类结果进行解释和分析,确定最佳的聚类数目。
6.对不同的聚类进行比较,看是否存在显著差异。
7.结果展示和报告撰写。
三、实验结果及分析在实验过程中,我们选择了学校学生的体测数据作为聚类分析的样本。
数据集共包含身高、体重、肺活量等指标,共有200个样本。
首先,我们进行了数据预处理,包括处理缺失数据和异常值。
对于缺失数据,我们选择用平均值进行填充;对于异常值,我们使用离群值检测方法进行处理。
然后,我们选择了合适的聚类方法和变量,使用K-means聚类算法对样本进行分组。
我们尝试了不同的聚类数目,从2到10进行了分析。
根据轮廓系数和手肘法定量评估了不同聚类数目下聚类效果的好坏。
最终,我们选择了聚类数目为4的结果进行进一步分析。
通过比较不同聚类结果的均值,我们发现不同聚类之间的身高、体重和肺活量等指标存在较大差异。
这说明聚类分析对样本的分类和分组是合理和有效的。
四、实验总结本次实验通过应用SPSS软件进行聚类分析,对样本进行分类和分组,通过群组间的比较来发现变量之间的关系和特征。
通过分析聚类结果,我们发现不同聚类之间存在显著差异,这为进一步研究和探索提供了参考。
聚类分析是一种常用的数据分析方法,可以帮助我们更好地理解和解释数据,对于从大量数据中发现规律和特征具有重要的应用价值。
总之,聚类分析是一种有力的数据分析工具,可以帮助我们更好地理解和解释数据。
《基于SPSS的聚类分析在行业统计数据中的应用》篇一一、引言随着大数据时代的到来,数据挖掘与分析技术已成为各行业研究的重要工具。
聚类分析作为一种无监督的学习方法,在处理大量数据并发现数据间的潜在关系方面具有显著优势。
本文将探讨基于SPSS的聚类分析在行业统计数据中的应用,旨在通过实例分析展示其有效性和实用性。
二、聚类分析概述聚类分析是一种将数据集分为几个不同的组或簇的统计方法。
这些组内的数据点在某种度量(如距离)下具有相似性,而不同组之间的数据点则具有较大的差异性。
聚类分析可以帮助我们更好地理解数据的分布和结构,发现数据的潜在规律。
三、SPSS软件在聚类分析中的应用SPSS是一款功能强大的统计分析软件,广泛应用于数据挖掘、数据分析等领域。
在聚类分析方面,SPSS提供了多种聚类方法,如K-均值聚类、层次聚类等。
通过SPSS,我们可以方便地进行聚类分析,快速得到聚类结果。
四、行业统计数据聚类分析实例以某电商平台销售数据为例,我们将利用SPSS进行聚类分析,以发现不同商品之间的潜在关系。
1. 数据准备:收集某电商平台的销售数据,包括商品类别、价格、销量、用户评价等信息。
2. 数据清洗:对收集到的数据进行清洗,去除重复、缺失或异常的数据。
3. 数据预处理:对数据进行标准化或归一化处理,以便进行聚类分析。
4. 聚类分析:利用SPSS进行K-均值聚类分析,将商品分为几个不同的簇。
5. 结果解读:根据聚类结果,分析各簇商品的特点和用户需求。
例如,可以发现某些价格相近、销量较高的商品被归为一类,说明这些商品可能具有相似的用户群体和消费习惯。
6. 结果应用:根据聚类分析结果,电商平台可以制定更精准的营销策略,如针对不同簇的用户群体推出相应的促销活动或定制化服务。
五、结论与展望通过基于SPSS的聚类分析在行业统计数据中的应用实例,我们可以看出聚类分析在数据处理和挖掘方面的优势。
聚类分析可以帮助我们更好地理解数据的分布和结构,发现数据的潜在规律,为决策提供有力支持。
实验五:聚类分析一.实验目的1.学会用spss进行聚类分析。
2.了解层次聚类和K值聚类法的有缺点。
二.实验要求利用2001年全国31个省市自治区各类小康和现代化指数的数据,对地区别作分层聚类和K-Means聚类分析。
数据见:聚类分析数据(小康指数)。
三.实验内容方法一:层次聚类1.试验步骤:依次点击“分析”——“分类”——“系统聚类”如下图一所示,将“省市”放入标注个案中,将其余放入“变量”中。
【图一】点击统计量,选中“合并进程表,相似性矩阵”如下图二所示:【图二】点击“图”,设置相应操作,如下图三所示:【图三】选中“方法”,设置如下图四:【图四】点击“确定”得到输出结果,如下表一:【表一】聚类案例处理汇总(a)案例有效缺失总计N 百分比N 百分比N 百分比31 100.0 0 .0 31 100.0a Ward 联结聚类表阶群集组合系数首次出现阶群集下一阶* * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * *Dendrogram using Ward MethodRescaled Distance Cluster CombineC A SE 0 5 10 15 2025Label Num +---------+---------+---------+---------+---------+甘肃 26江西 28贵州 30青海 20安徽 24广西 27河南 29云南 25宁夏 22西藏 31湖北 12陕西 13内蒙古 18山西 15重庆 17湖南 19四川 21河北 14海南 16北京 1上海 2天津 3浙江 4广东 5福建 8黑龙江 10吉林 11新疆 23江苏 6山东 9辽宁 7试验结果分析:在聚类表中:第一列表示聚类分析的第几步,第二列第三列表示本步骤类中哪两个样本或小类聚成一类,第四列是个体距离或小类距离,第五列第六列表示本步骤类中参与聚类的是个体还是小类,0表示样本,非0表示由第几步骤生成的小类参与本布聚类,第七列表示本步骤类的结果将在以下第几步中用到。
实验名称:系统聚类分析一、实验目的和要求通过上机操作,完成spss软件的系统聚类分析二、实验内容和步骤:系统聚类法:如图所示,依次点击图中黄色选项如图所示,进行以下操作点击statistics,进行以下操作点击plots,进行以下操作点击method,进行以下操作点击ok结果与分析Case Processing Summary aCasesValid MissingTotalNPercent NPercentNPercent 34100.0%0 0.0%34 100.0%a. Squared Euclidean Distance used上表为样本汇总表,由表中可得,样本的有效值个数为34,无样本缺失值。
上表表示为样本之间接近度程度,反映了样本之间相似性或相异性的矩阵,由于计算距离使用的是平方欧式距离,所以样本间距离越大,样本越相异Agglomeration ScheduleStage Cluster CombinedCoefficientsStage Cluster First Appears Next StageCluster 1Cluster 2Cluster 1Cluster 21 33 34 .194 0 0 62 7 14 .210 0 0 43 31 32 .229 0 0 124 7 8 .289 2 0 115 25 28 .325 0 0 126 4 33 .357 0 1 14 7 16 29 .372 0 0 118 3 19 .429 0 0 13 9 10 11 .438 0 0 17 10 18 21 .520 0 0 15 11 7 16 .538 4 7 13 122531.667532013 3 7 .748 8 11 1814 4 24 .786 6 0 2015 17 18 .819 0 10 2116 20 30 .920 0 0 2117 10 12 1.054 9 0 2318 3 13 1.104 13 0 2419 5 6 1.141 0 0 2220 4 25 1.205 14 12 2421 17 20 1.385 15 16 2222 5 17 1.663 19 21 2323 5 10 2.106 22 17 2624 3 4 2.408 18 20 2525 3 15 3.104 24 0 2626 3 5 5.019 25 23 3027 26 27 8.120 0 0 2928 2 22 8.220 0 0 2929 2 26 14.493 28 27 3030 2 3 20.724 29 26 3331 1 9 21.895 0 0 3232 1 23 54.558 31 0 3333 1 2 69.632 32 30 0上表为组之间聚类表,表的第2列和第三例表示聚合的类,第4列是表示聚合系数,是距离测定值。
SPSS聚类分析实验报告一、实验目的本实验旨在通过SPSS软件对样本数据进行聚类分析,找出样本数据中的相似性,并将样本划分为不同的群体。
二、实验步骤1.数据准备:在SPSS软件中导入样本数据,并对数据进行处理,包括数据清洗、异常值处理等。
2.聚类分析设置:在SPSS软件中选择聚类分析方法,并设置分析参数,如距离度量方法、聚类方法、群体数量等。
3.聚类分析结果:根据分析结果,对样本数据进行聚类,并生成聚类结果。
4.结果解释:分析聚类结果,确定每个群体的特征,观察不同群体之间的差异性。
三、实验数据本实验使用了一个包含1000个样本的数据集,每个样本包含了5个变量,分别为年龄、性别、收入、教育水平和消费偏好。
下表展示了部分样本数据:样本编号,年龄,性别,收入,教育水平,消费偏好---------,------,------,------,---------,---------1,30,男,5000,大专,电子产品2,25,女,3000,本科,服装鞋包3,35,男,7000,硕士,食品饮料...,...,...,...,...,...四、实验结果1. 聚类分析设置:在SPSS软件中,我们选择了K-means聚类方法,并设置群体数量为3,距离度量方法为欧氏距离。
2.聚类结果:经过聚类分析后,我们将样本分为了3个群体,分别为群体1、群体2和群体3、每个群体的特征如下:-群体1:年龄偏年轻,女性居多,收入较低,教育水平集中在本科,消费偏好为服装鞋包。
-群体2:年龄跨度较大,男女比例均衡,收入中等,教育水平较高,消费偏好为电子产品。
-群体3:年龄偏高,男性居多,收入较高,教育水平较高,消费偏好为食品饮料。
3.结果解释:根据聚类结果,我们可以看到不同群体之间的差异性较大,每个群体都有明显的特征。
这些结果可以帮助企业更好地了解不同群体的消费习惯,为市场营销活动提供参考。
五、实验结论通过本次实验,我们成功地对样本数据进行了聚类分析,并得出了3个不同的群体。
作业2:城镇居民消费结构的K-means聚类模型
本次作业为基于IBM SPSS Statistics 24的K-means聚类运算
一、第一步:导入数据,点击文件下方的图标,选中”案例2-城镇居民消费结构“,点击打开,
二、分析数据
1、点击Spss界面的“分析”,然后依次点击“分类”、“K-均值聚类”,如下图
2、在弹出的界面中点击“选项”,勾选“ANOVA表”,如下图,再点击“继续”
3、在弹出的界面中点击“保存”,勾选“聚类成员”、“与聚类中心距离”,如下图所示,点击“继续”
4、最后在弹出的界面中,把“地区”放入“个案标注依据”,其余的放入“变量”中,如下图所示,点击“确定”。
三、结果展示
ANOVA。
《基于SPSS的聚类分析在行业统计数据中的应用》篇一一、引言随着科技的不断进步与信息化的发展,数据处理技术日益受到关注。
其中,聚类分析作为数据处理的一种重要手段,已被广泛应用于各个行业统计数据的分析和研究中。
SPSS软件以其强大的数据处理和统计分析功能,在聚类分析中发挥着重要作用。
本文将探讨基于SPSS的聚类分析在行业统计数据中的应用,以期为相关研究提供参考。
二、聚类分析概述聚类分析是一种无监督学习方法,旨在将数据集划分为若干个簇或类,使得同一簇内的数据具有相似性,而不同簇之间的数据差异较大。
聚类分析广泛应用于市场细分、客户分类、图像识别等领域。
在行业统计数据中,聚类分析可以帮助我们了解不同行业的特点、发展趋势以及行业间的关系。
三、SPSS软件在聚类分析中的应用SPSS软件是一款功能强大的统计分析软件,具有操作简便、结果直观等优点。
在聚类分析中,SPSS软件可以有效地处理大量数据,帮助我们快速找出数据之间的潜在关系和规律。
具体而言,SPSS软件在聚类分析中的应用包括以下几个方面:1. 数据准备与预处理:SPSS软件支持多种数据格式的导入与导出,方便我们收集和整理行业统计数据。
此外,SPSS还提供了丰富的数据预处理功能,如缺失值处理、数据标准化等,为后续的聚类分析打下基础。
2. 聚类方法选择:SPSS软件提供了多种聚类方法,如K-means聚类、层次聚类等。
我们可以根据数据的特点和需求选择合适的聚类方法。
3. 聚类结果分析:SPSS软件可以生成直观的聚类结果图和统计量,帮助我们快速理解聚类结果。
此外,我们还可以通过SPSS 软件进行进一步的数据分析和挖掘,以深入了解各行业的特点和发展趋势。
四、基于SPSS的聚类分析在行业统计数据中的应用案例以某地区制造业为例,我们利用SPSS软件进行聚类分析。
首先,我们收集了该地区制造业的相关统计数据,包括企业规模、产品类型、市场份额等。
然后,我们使用SPSS软件进行数据预处理和聚类分析。
SPSS聚类分析实验报告摘要:本实验旨在利用SPSS软件进行聚类分析,并通过实验结果分析数据的分布情况,揭示数据中的隐含规律。
通过聚类分析,我们将数据样本划分为不同的类别,以便更好地理解数据的特征、相似性以及群组之间的差异。
实验结果表明,SPSS软件在聚类分析方面具有较高的可靠性和准确性,能够有效地提取数据的特征和隐含信息,为数据分析提供有力支持。
1.引言2.实验方法2.1数据收集与准备本实验使用到的数据集是从公开渠道获取的一份包含各个地区收入、消费、教育等特征的数据集。
为了保护数据安全和隐私,将被分析的数据进行了匿名化处理。
2.2SPSS操作步骤(1)导入数据集:将数据集导入SPSS软件,并进行数据检查和处理,确保数据的完整性和准确性。
(2)选择合适的聚类算法:根据实验目的和数据特点选择适合的聚类算法,这里选择了k-means算法作为聚类算法。
(3)设置聚类参数:设置聚类的类别数、迭代次数等参数,以得到最优的聚类结果。
(4)进行聚类分析:运行聚类分析模块,观察聚类结果和聚类中心的分布情况。
(5)结果解释与分析:根据聚类结果,对不同类别的数据进行特征分析和差异比较,以更好地理解数据的特点和分布规律。
3.实验结果与分析通过SPSS软件进行聚类分析,得到了数据样本的聚类结果。
根据平均轮廓系数和间隔分析等指标,确定了最优的聚类类别数,并得到了每个类别的聚类中心和分布情况。
3.1聚类类别数的确定为了确定合适的聚类类别数,使用平均轮廓系数方法和间隔分析方法进行评估。
通过计算不同聚类类别数下的平均轮廓系数和间隔分析值,选择具有最大平均轮廓系数和最小间隔分析值的类别数作为最优的聚类类别数。
经过计算分析,确定了聚类类别数为33.2聚类结果与分析根据聚类类别数为3的聚类结果,将数据样本分为了三组。
分别对每组数据进行了特征分析和差异比较。
3.2.1类别1:高收入、高教育水平、低消费该类别的个体具有较高的收入水平和教育水平,但消费水平较低。
西南交通大学
交通运输及物流学院
实验报告
《系统工程》
2014~2015学年第二学期
实验名称:基于SPSS的聚类分析实验
学号姓名: 20121986 罗静
指导教师:蒋赛
实验时间: 2014年4月25号
实验一基于SPSS的聚类分析实验
一、实验背景
数据表示我国商业主要银行的10个综合竞争力指标,人均净利润、净利润率、资产回报率、核心资本充足率、人均费用额、资产负债率、股东权益乘数、不良贷款比率、存款市场份额和贷款市场份额。
本实验是基于SPSS利用系统聚类法对这些商业银行的综合竞争力进行评价分析。
二、实验步骤
1.建立SAV格式的数据
2.点击【分析】……【分类】……【系统聚类】,开始进行系统聚类分析。
3.将要分析的变量x1到x10移入变量的列表框中,将Y移入标注个案,用于标注每一个个案。
分群中点选个案,表示对样品进行聚类。
4.点击【统计量】,点选“单一方案”,结合实际分析,将银行分为3类较合适,所以在聚类数的方框中填写3,表示此次聚类把样品分为3类。
点击“继续”返回系统聚类分析对话框。
5.点击【绘制】,点选“树状图”,以形象地显示聚类的整个过程,点击“继续”返回系统聚类分析对话框。
6.点击【方法】,在转换值框中,下拉对话框,选择Z得分,表示数据标准化到Z分数,其余项保持系统默认状态,点击“继续”返回系统聚类分析对话框。
7.各选项设置完成后,点击确定进行系统聚类。
三、实验结果分析
1. 聚类分析过程表
在表3-1中,根据聚类系数的变化可以得到,第6步的聚类系数是8.1,第5步是6.764,它们相差1.336个单位,第7步和第6步相差3.32个单位,可见,从理论上来说,聚类过程结束于第7步是合理的,此时所有的数据被分为2类,可是当结合实际时,分类数太少,没有办法更好的反映银行之间的差异性,因此我们决定聚类数为3。
表3-1
2.树状图
树状图3-1表示了整个聚类过程
图3-1
3.聚类分析结果显示表
表3-2表示了此次聚类分析的结果,可以看到聚类分析最终分为以下几类:第Ⅰ类:工商银行,建设银行,中国银行。
第Ⅱ类:交通银行,光大银行,深发银行,浦发银行。
第Ⅲ类:中信银行,民生银行,招商银行。
表3-2
四、实验心得
通过本次实验,我学会了使用SPSS对样本进行系统聚类分析,在实验的过程中收获颇多,但仍然存在很多问题,对于实验结果的树状图冰柱图的读解还存在一定的问题,对实验结果中系数的实际含义理解上也存在一些问题。
在本次实验数据中,指标有10个,变量数目过多,我认为在做聚类分析之前也可以结合主成分分析,先对变量做一个降维过程,在对样本做聚类分析,这样的结果会更加优越,然而由于主成分分析对数据要求较高,我在用此次数据做主成分分析时,发现结果并不是很理想,提取的两个公因子对变量的贡献率只有81.596%,在贷款市场份额,存款市场份额,不良贷款比率,核心资本充足率指标上的解释,两个因子显得含糊不清,它们的载荷系数区别并不明显,因此,我认为该结合实际情况适当将因子分析和聚类分析相结合。
聚类分析在物流领域中应用广泛,例如物流园区空间类型定位中的应用,区域物流中心综合评价,多级物流配送中心选址中的应用等等。
五、参考资料
[1] 汪应洛,《系统工程(第4版)》,机械工业主板社,北京,2008
[2] 西南交通大学交通运输及物流学院,系统工程,《案例及实验指导》,2011
[3] 王璐,王沁,《统计软件SPSS完全学习手册及实战精粹》,化学工业出版社,北京,2013
西南交通大学
交通运输及物流学院
实验报告
《系统工程》
2014~2015学年第二学期
实验名称:基于SPSS的主成分分析实验
学号姓名: 20121986 罗静
指导教师:蒋赛
实验时间: 2014年4月25号
实验二基于SPSS主成分分析实验
一、实验背景
数据表示某市居民2000年到2007年的消费结构,具体表示为食品,衣着,家庭设备用品及服务、医疗保健、交通和通信、文化娱乐服务、居住及杂项商品及服务。
据此定量得研究该市居民的消费结构。
二、实验步骤
1.建立实验数据,输入实验数据
2.对数据进行主成分分析,具体步骤为:
【分析】……【降维】……【因子分析】
3.将要分析的变量移入变量的对话框中
4.点击【描述】进行设置,勾选“单变量描述性”以为主成分分析提供一个直观的分析结果,其余项保持系统默认状态,点击“继续”返回因子分析对话框。
5.点击【抽取】进行设置,方法选择“主成分”,其余项保持系统默认状态,点击“继续”返回因子分析对话框。
6.点击【旋转】进行设置,使得因子变量更具有解释性,方法选择“最大方差法”,使每个因子具有最高载荷的变量数最小,以简化对因子的解释,点击“继续”返回因子分析对话框。
7.点击【得分】进行设置,勾选“保存为变量”,将因子得分作为新变量保存在数据文件中,此时激活方法选项,再勾选“回归”,此方法使得因子得分的均值为“0”,勾选“显示因子得分系数矩阵”,点击“继续”返回因子分析对话框。
8.点击【选项】进行设置,系数显示格式中勾选“按大小排序”,将载荷系数按大小排列构成矩阵,使在同一因子上具有较高载荷的变量排列在一起,以便于得出结论,其余项保持系统默认状态,点击“继续”返回因子分析对话框。
9.各选项设置完成后,单击“确认”进行主成分分析。
三、实验结果分析
1.描述性统计表
表3-1显示了食品、衣着等八个消费指标的描述性统计量,从中可以看出,食品消费所占的比重最大,其均值为39.475%。
其次是文化娱乐服务和居住,医疗保健和杂项占的比重则比较小。
表3-1
2.因子分析共同度
表3-2给出了8个变量的共同度数据,它给出了因子分析初始解下的变量共同度,表明原有变量的所有方差都可被解释,变量的共同度均为1。
表3-2
3.因子分析的总方差解释
从表3-3中第4列中可看出,前三个因子的累积贡献率已达到94.196%,并且在表格的第2列中显示只有它们的取值大于1,说明前三个因子基本包含了变量的主要信息,因此选择前三个因子为主因子即可,同时从提取后和旋转后的因子方差解释情况看来,它们也支持选择前三个因子。
表3-3
4.旋转前的因子载荷矩阵
表3-4显示了旋转前的因子载荷矩阵,从表中可看出这三个因子对第四个变量家庭设备用品及服务解释能力较差,同样,对于食品这个变量,在三个因子的载荷系数区别也不大,说明此时需要采用因子旋转使得因子对变量的解释效果更好。
表3-4
5.旋转后的因子载荷矩阵
表3-5为旋转后的因子载荷矩阵,从表中可看出,各指标在各因子的载荷系数有了较大的区别,此时的结果较旋转前对变量有了更好的解释性。
从表中可看出,第一个因子主要反映了交通和通信、医疗保健、文化娱乐服务、家庭设备用品及服务和食品这5个指标,因此我们可以将第一个公因子命名为第一基本生活消费因子,即享受型消费因子,同时在2000年到2007年之间,交通和通信、医疗保健和文化娱乐服务的载荷系数为正,即0.946,0.938,0.931,表明这几年这些指标在居民消费结构中时递增的,而载荷系数为负即-0.895,-0.793的家庭设备用品及服务和食品指标在居民消费结构中程递减趋势。
由表中数据得到,第二个公因子主要反映了居住和衣着指标,载荷系数为-0.974,0.889,因此将第二个公因子命名为第二基本生活消费因子,即发展性消费因子。
数据显示,居民在居住方面的消费支出是递减的,而越来越专注衣着水平的提高。
由表中数据得,第三个公因子主要反映杂项商品及服务指标,其载荷系数为0.968,因此将第三个公因子命名为第三生活消费因子,即其他型消费因子,由其载荷系数也可看出,居民已经不再是单一得追求满足基本生活消费,在对杂项商品服务的追求是逐年提升的,此指标在居民消费结构中程递增趋势。
表3-5
6.因子得分系数
表3-7给出了采用回归法估计的因子得分系数,根据表中内容得到以下因子得分系数:
1230.19810.05820.22630.21240.22150.21160.07970.01580.12310.42520.230.09440.00850.09660.49870.01580.36510.05920.17430.06940.11950.07760.08870.7798F x x x x x x x x F x x x x x x x x F x x x x x x x x =-+-+++++=+++++-+=--++--+
表3-6 7.综合评价模型
根据以上计算的因子得分,并以因子的方差贡献率为权,建立综合评价的模型,数学表达式如下:
1230.539470.248690.1538F F F F =++
四、实验心得
通过本次实验,我学会了使用SPSS软件进行主成分分析,主成分分析的目的就是让变量数目变得尽可能少,也就是降维,以更简洁明了得反映我们所要研究的事物的特征。
这种分析方法在我们以后进行系统评价的时候提供了较大的方便。
主成分分析在物流领域中,应用广泛,可以用来分析物流的发展水平,货物的周转量影响因素,对物流绩效的评价以及区域物流的规划等等。
五、参考资料
[1] 汪应洛,《系统工程(第4版)》,机械工业主板社,北京,2008
[2] 西南交通大学交通运输及物流学院,系统工程,《案例及实验指导》,2011
[3] 王璐,王沁,《统计软件SPSS完全学习手册及实战精粹》,化学工业出版社,北京,2013。