世界三大统计分析软件比较
- 格式:doc
- 大小:387.00 KB
- 文档页数:39
4种数据分析处理软件简介在试验数据分析处理前,首先要了解数据分析处理的理论基础,如试验数据表示即误差分析、统计学分析与曲线拟合、方差与估计分析、回归于假设检验分析等,这些分析方法是试验数据分析中最为常用的理论基础。
这里主要介绍Microsoft Office Excel 2003、Origin7.5、MATLAB7.1和SPSS13.0 for Windows四种常用软件在数据处理中的优缺点,通过了解它们各自的特点,然后再试验数据分析处理中选择合适的软件,在保证分析结果的情况下,使分析处理过程达到最简单、最省时、最省力。
下面对这四种常用软件的优点与缺点进行一下比较。
MicrosoftOffice Excel MicrosoftOffice Excel是一个电子表格软件,它能干什么,我想大家基本都清楚这里就不啰嗦了。
Excel在数据分析处理中的优点* ; ; ; ; ; ; ; ;Excel具有强大的图表绘制功能,通过Excel绘制的图表能清晰全面地反映复杂数据的变化趋势,而且图表属性的更改十分方便、快捷。
* ; ; ; ; ; ; ; ;Excel能进行多种数值运算,可在单元格中直接输入计算公式,而且他同类计算可双击自动生成,具有方便快捷的特点。
* ; ; ; ; ; ; ; ;Excel能提供常用的数据分析工具,如统计分析、相关系数分析、方差分析、F检验分析、t检验分析、回归分析等。
Excel的缺点* ; ; ; ; ; ; ; ;Excel文件格式太大,处理大量数据时速度太慢。
SPSS基本操作一、SPSS简介SPSS(Statistical Package for the Social Science,社会科学统计软件包)是目前世界上最知名和最为流行的统计分析软件之一,它与SAS、BMDP一起被称为国际上最有影响的三大统计分析软件。
SAS由于是为专业统计分析人员设计的,具有功能强大,灵活多样的特点,为专业人士所喜爱。
而SPSS是为广大的非专业人士设计。
它集数据整理、分析过程、结果输出等功能于一身,操作简便,好学易懂,简单实用,并且具有强大的图形功能,可以得到直观、清晰、漂亮的统计图。
因而很受非专业人士的青睐。
此外,比起SAS软件来,SPSS主要针对着社会科学研究领域开发,因而更适合应用于教学科研活动,是国内外教学科研人员必备的科研工具。
SPSS软件的统计功能包括常规的集中量数和差异量数、相关分析、回归分析、方差分析、卡方检验、t检验和非参数检验;也包括近期发展的多元统计技术,如多元回归分析、聚类分析、判别分析、主成分分析和因素分析等方法,并能在屏幕(或打印机)上显示(打印)如正态分布图、直方图、散点图等各种统计图表。
使用者仅需要关心某个问题应该采用何种统计方法,并初步掌握对计算结果的解释,而不需要了解其具体运算过程。
另外,SPSS软件具有广泛的数据转换接口,数据适用性强,可处理不同格式的数据,如关系数据库生成的DBF文件、或用文本编辑软件生产的ASCII码数据文件、或EXCEL 数据文件等,均可方便地转换成可供分析的SPSS的数据文件。
二、SPSS软件的界面和运行方式在SPSS主窗口中(如图1.1所示),从上到下分别为:菜单、快捷工具栏、数据输入栏(在SPSS中,以二维数据表的形式来组织数据,每列为一个变量,每行为一个个案)和视图切换按钮(包括数据视图和变量视图,变量视图如图1.2所示)。
SPSS软件的运行方式可以分为两种:1.完全窗口菜单运行管理方式SPSS启动后即在屏幕上显示主页面,即数据编辑窗口,如图1.1所示。
第1章初识SPSSSPSS(Statistical Product and Service Solutions,SPSS),即统计产品与服务解决方案软件,是当前世界上最为流行的三大统计分析软件之一。
它以强大的统计分析功能、方便易用的用户操作方式、灵活的表格式分析报告和精美的图形展示形式,以及可以直接读取Excel及DBF数据文档优势,充分赢得了各个领域广大数据分析人员的喜爱,并得到了广泛的应用。
在本章中,将从SPSS软件的产生、发展、功能与特点,以及SPSS软件的安装、界面介绍等方面,详细介绍SPSS软件的基础知识,帮助用户认识并熟悉SPSS软件。
本章学习目标:SPSS概述SPSS软件安装SPSS软件介绍SPSS数据统计分析基础步骤SPSS 是世界上最早的统计分析软件,它是一个组合式的软件包,集数据整理、分析功能于一身,不仅可以为用户提供数据管理、统计分析、趋势分析、制表、绘图服务,还可用于计划、经济、教育、心理、医学、生物、气象及其他社会科学领域。
SPSS 是由美国斯坦福大学中的Norman H 等三位研究生于1968年研发成功,同时于1975年在芝加哥成立了SPSS 公司。
1984年SPSS 总部首先推出了世界上第一个统计分析软件的微机版本SPSS/PC+,并得到了广大的应用与高度的评价。
SPSS 公司于1992年推出了Windows 版本统计软件,同时开始了全球化的发展。
1994——1998年,SPSS 公司先后并购了SYSTAT 、BMDP 、Quantime 、ISL 等公司,通过收购引进了数据挖掘技术、为IBM 的eServer iSeries 开发的商业智能套件、Web 分析、复杂分析组件以及文本挖掘等功能,进而使SPSS 公司从原来的单一产品开发与销售,转向为企业、政府机构和教育科研提供全面信息统计决策的支出与服务。
SPSS 软件最初的全称为“社会科学统计软件包”,随着SPSS 产品服务领域的扩大和服务深度的增加,于2000年SPSS 公司正式将英文名全称更改为“统计产品与服务解决方案”。
四个常用统计软件SAS,STATA,SPSS,R语言分析比较及其他统计软件概述一、SAS,STATA,SPSS,R语言简介(一)SAS简介SAS(全称Statistical Analysis System,简称SAS,翻译成汉语是统计分析系统)是全球最大的软件公司之一,是由美国NORTH CAROLINA州立大学1966年开发的统计分析软件。
1976年SAS软件研究所(SAS INSTITUTE INC)成立,开始进行SAS系统的维护、开发、销售和培训工作。
期间经历了许多版本,并经过多年来的完善和发展,SAS系统在国际上已被誉为统计分析的标准软件,在各个领域得到广泛应用。
其网址是:/(二)STSTA简介STATA统计软件由美国计算机资源中心(Computer Resource Center)1985年研制。
STATA 是一套提供其使用者数据分析、数据管理以及绘制专业图表的完整及整合性统计软件。
它提供许许多多功能,包含线性混合模型、均衡重复反复及多项式普罗比模式。
新版本的STATA采用最具亲和力的窗口接口,使用者自行建立程序时,软件能提供具有直接命令式的语法。
STATA提供完整的使用手册,包含统计样本建立、解释、模型与语法、文献等超过一万余页的出版品。
除此之外,STATA软件可以透过网络实时更新每天的最新功能,更可以得知世界各地的使用者对于STATA公司提出的问题与解决之道。
使用者也可以透过STATA Journal 获得许许多多的相关讯息以及书籍介绍等。
另外一个获取庞大资源的管道就是STATAlist,它是一个独立的listserver,每月交替提供使用者超过1000个讯息以及50个程序。
其网址是:/(三)SPSS简介SPSS(Statistical Product and Service Solutions),“统计产品与服务解决方案”软件。
最初软件全称为“社会科学统计软件包”(Statistical Package for the Social Sciences),但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称更改为“统计产品与服务解决方案”,标志着SPSS 的战略方向正在做出重大调整。
第二章 SPSS统计应用第一节 SPSS基础SPSS(Statistical Package for the Social Sciences)即社会科学统计软件包,是当今世界上公认的最流行、最强大的三大统计分析软件(SPSS、SAS和BMDP)之一。
SPSS从10.0版本开始就基于Microsoft Windows 95操作系统上运行,具有Windows软件的共同特征。
由于SPSS具有统计、绘图功能强、使用简单方便等优点。
受到广大科研工作者的青睐。
在这里主要以12.0版为基础,介绍SPSS的基本使用方法。
一、SPSS安装和运行1 SPSS v12.0 安装打开计算机,启动Windows XP操作系统。
1) 将课程配备的光碟放入光盘驱动器中。
2) 启动Windows资源管理器,双击光盘驱动器图标,在目录窗口中找到“SPSS12 install”文件夹,双击进入该文件夹;找到“setup”应用程序,双击后就启动安装。
显示欢迎安装SPSS 12.0版以及版权声明(图2-1),浏览后单击“Next”按钮进入下一个画面。
图2-1 SPSS12.0欢迎窗口3)同意SPSS12.0软件协议用户阅读“协议”,同意协议,单击“I accept the terms in license agreement”选项。
否则单击“Cancel”退出安装,如图2-2。
图2-2 软件协议窗口4)阅读SPSS 12.0 自述文件后,单击“Next”按钮,进入下一个界面。
5)填写用户信息。
例如:在用户名“Name:”栏填写: Student在单位名称“Organization:”栏填写: SWU如图2-3。
单击“Next”按钮,进入下一个界面。
图2-3填写用户信息5)指定SPSS12.0系统的安装目录(图2-4)图2-4 指定安装目录同意安装程序自动安装到“C:\Program file\spss”,单击“Next”后进入下一个画面继续安装。
关于SPSS1.当今世界最流行的三大统计分析软件包:SPSS、SAS、BMDP2.SPSS公司其英文全称以前是Statistical Package for the Social Science,现在变为Statistical Product and Service SolutionsSPSS 15.0 的特点和优势3.可以同时打开多个数据文件4.提供了2种作图方法:新的交互式作图法+原来的对话框作图。
两种方法各有特点,但交互式作图法更直接、方便,认识SPSS1.数据窗口:系统按打开数据文件的顺序给个临时编号,例如[dataset 2]2.变量窗口:类型为numeric的变量又分为三个测量层次,即nominal、ordinal、scale3.数据文件窗口菜单常用功能简介《Y》P15-184.输出文件窗口:(1)每执行一个需要记录的操作,系统会自动弹出一个记录操作过程的输出文件窗口,以供选择是否对该步操作进行记录。
(一般只保存最重要的数据文件和输出结果文件,无需将所有的操作过程都保存下来。
)(2)系统会按输出文件窗口弹出的顺序给个临时编号,例如[document 3](3)左侧的目录树与右侧具体输出结果的一一对应关系数据文件的建立1.变量的属性及设置(1)必须要自己设定的几个属性:变量名(Name)、变量类型(Type)、测量层次(Measurement)●变量名(Name)必须以汉字或字母开头,且系统不区分大小写●变量类型(Type)有若干:数值型(Numeric)、字符型(String,例如姓名类问题变量)、日期型(Date,例如出生年月类问题变量)等,本课程涉及最多的为数值型变量。
(Y:展示各种类型的数据)●测量层次(Measurement)分为三类:Nominal、Ordinal、Scale(2)其他属性可采用系统默认,例如默认的缺失值为空格《Y》P402.将问卷中的问题转换为数据文件中的变量(1)单选题:通常用题号本身作变量名(2)矩阵表格题:设计成可以属性不同的4个变量《Y》P42(3)多选题:设计成几个属性相同的变量,例如《Y》P433.数据的录入(Y:休闲调查)(1)用View菜单下的value label命令来变换数据录入窗口中的显示——变量的取值/取值标签(2)查看变量的信息:用Utilities菜单下的Variables命令 / 通过变量窗口查看4.Excel数据文件的导入(T)在SPSS中先新建一个空白数据文档 File-New-Data选好要导入的Excel文档 File-Open-Data (注意该文档在Excel中不能是打开状态;且在导入前最好将该Excel文档中每个变量的取值性质统一,详见《Y》P47)接下来的对话框中系统默认的选项为 Read variable names from the first row of data练习:将“考试成绩”Excel文件导入SPSS中保存为数据文件数据文件的管理、处理与整理1.File菜单下的命令:新建、打开、保存、显示、预览、打印《Y》P24-282.Edit菜单下的命令:Undo、Redo、Paste、Paste Variables、Clear、Insert Variables、Insert Cases、Find、Go to Case等《Y》P29练习:主要练习操作以上下划线部分的命令3.Data菜单下的命令:(1)Identify Duplicate Cases 《Y》P31 《Z》P60-61●如果某个案的信息的确被重复录入了,则删除●T:用数据文件“数学和英语成绩”练习□ Indicator of primary cases (1 = unique or primary,0 = duplicate)功能●有时用于开放式问题的归类整理,此时a)可以勾选□ Sequential count of matching case in each group ( 0 = nonmatching case )□ Move matching cases to the top of the fileb)但不要勾选□ Display frequencies for created variables ,否则输出的频数统计表容易误导理解●T(用于开放式问题的归类整理):询问被访者关于政府应该如何控制房价方面的意见或建议,从开放式答案中可以归纳出意见比较集中的几种措施,在数据文件中设置一个nominal scale的变量以便对该问题的答案进行归类和整理。
世界三大统计分析软件的比较:2007-04-10SAS(多变量数据分析技术与统计软件)SAS是美国SAS(赛仕)软件研究所研制的一套大型集成应用软件系统,具有比较完备的数据存取、数据管理、数据分析和数据展现的系列功能。
尤其是它的创业产品—统计分析系统部分,由于具有强大的数据分析能力,一直是业界中比较著名的应用软件,在数据处理方法和统计分析领域,被誉为国际上的标准软件和最具权威的优秀统计软件包,SAS系统中提供的主要分析功能包括统计分析、经济计量分析、时间序列分析、决策分析、财务分析和全面质量管理工具等。
SAS系统是一个组合的软件系统,它由多个功能模块配合而成,其基本部分是BASE SAS模块。
BASE SAS模块是SAS系统的核心,承担着主要的数据管理任务,并管理着用户使用环境,进行用户语言的处理,调用其他SAS模块和产品。
也就是说,SAS系统的运行,首先必须启动BASE SAS模块,它除了本身所具有数据管理、程序设计及描述统计计算功能以外,还是SAS系统的中央调度室。
它除了可单独存在外,也可与其他产品或模块共同构成一个完整的系统。
各模块的安装及更新都可通过其安装程序比较方便地进行。
SAS系统具有比较灵活的功能扩展接口和强大的功能模块,在BASE SAS的基础上,还可以增加如下不同的模块而增加不同的功能:SAS/STAT(统计分析模块)、SAS/GRAPH (绘图模块)、SAS/QC(质量控制模块)、SAS/ETS(经济计量学和时间序列分析模块)、SAS/OR(运筹学模块)、SAS/IML(交互式矩阵程序设计语言模块)、SAS/FSP(快速数据处理的交互式菜单系统模块)、SAS/AF(交互式全屏幕软件应用系统模块)等等。
SAS提供的绘图系统,不仅能绘各种统计图,还能绘出地图。
SAS提供多个统计过程,每个过程均含有极丰富的任选项。
用户还可以通过对数据集的一连串加工,实现更为复杂的统计分析。
此外,SAS还提供了各类概率分析函数、分位数函数、样本统计函数和随机数生成函数,使用户能方便地实现特殊统计要求。
目前SAS软件对Windows和Unix两种平台都提供支持,最新版本分别为8.X和6.X。
与以往的版本比较,6.X版的SAS系统除了在功能和性能方面得到增加和提高外,GUI界面也进一步加强。
在6.12版中,SAS系统增加了一个PC平台和三个新的UNIX平台,使SAS 系统这一支持多硬件厂商,跨平台的大家族又增加了新成员。
SAS 6.12的另一个显著特征是通过对ODBC、OLE和MailAPIs等业界标准的支持,大大加强了SAS系统和其它软件厂商的应用系统之间相互操作的能力,为各应用系统之间的信息共享和交流奠定了坚实的基础。
虽然在我国SAS的逐步应用还是近几年的事,但是随着计算机应用的普及和信息事业的不断发展,越来越多的单位采用了SAS软件。
尤其在教育、科研领域等大型机构,SAS软件已成为专业研究人员实用的进行统计分析的标准软件。
然而,由于SAS系统是从大型机上的系统发展而来,其操作至今仍以编程为主,人机对话界面不太友好,系统地学习和掌握SAS,需要花费一定的精力。
而对大多数实际部门工作者而言,需要掌握的仅是如何利用统计分析软件来解决自己的实际问题,因此往往会与大型SAS软件系统失之交臂。
但不管怎样,SAS作为专业统计分析软件中的巨无霸,现在鲜有软件在规模系列上与之抗衡。
SPSSSPSS原名社会科学统计软件包,现已改名为统计解决方案服务软件。
是世界著名的统计分析软件之一。
20世纪60年代末,美国斯坦福大学的三位研究生研制开发了最早的统计分析软件SPSS,同时成立了SPSS公司,并于1975年在芝加哥组建了SPSS总部。
20世纪80年代以前,SPSS统计软件主要应用于企事业单位。
1984年SPSS总部首先推出了世界第一套统计分析软件微机版本SPSS/PC+,开创了SPSS微机系列产品的先河,从而确立了个人用户市场第一的地位。
同时SPSS公司推行本土化策略,目前已推出9个语种版本。
SPSS/PC+的推出,极大地扩充了它的应用范围,使其能很快地应用于自然科学、技术科学、社会科学的各个领域,世界上许多有影响的报刊杂志纷纷就SPSS的自动统计绘图、数据深入分析、使用灵活方便、功能设计齐全等方面给予了高度的评价与称赞。
目前已经在国内广泛流行起来。
它使用Windows的窗口方式展示各种管理和分析数据方法的功能,使用对话框展示出各种功能选择项,只要是掌握一定的Windows操作技能,粗通统计分析原理,就可以使用该软件进行各种数据分析,为实际工作服务。
SPSS for Windows是一个组合式软件包,目前已经开发出SPSS12版本,它集数据整理、分析功能于一身。
用户可以根据实际需要和计算机的功能选择模块,以降低对系统硬盘容量的要求,有利于该软件的推广应用。
SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等等。
SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分好几个统计过程,比如回归分析中又分线性回归分析、曲线估计、Logistic回归、Probit回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。
SPSS也有专门的绘图系统,可以根据数据绘制各种统计图形和地图。
SPSS for Windows的分析结果清晰、直观、易学易用,而且可以直接读取EXCEL及DBF数据文件,现已推广到多种操作系统的计算机上,最新的版采用DAA (Distributed Analysis Architecture,分布式分析系统),全面适应互联网,支持动态收集、分析数据和HTML格式报告,领先于诸多竞争对手。
方便易用是SPSS for Windows的主要优点,同时也是SPSS不够全面的原因所在。
SPSS for Windows的分析结果清晰、直观、易学易用,而且可以直接读取EXCEL及DBF数据文件,现已推广到多种各种操作系统的计算机上,它和SAS、BMDP并称为国际上最有影响的三大统计软件。
和国际上几种统计分析软件比较,它的优越性更加突出。
在众多用户对国际常用统计软件SAS、BMDP、GLIM、GENSTAT、EPILOG、MiniTab的总体印象分的统计中,其诸项功能均获得最高分。
在国际学术界有条不成文的规定,即在国际学术交流中,凡是用SPSS软件完成的计算和统计分析,可以不必说明算法,由此可见其影响之大和信誉之高。
最新的12.0版采用DAA(Distributed Analysis Architechture,分布式分析系统),全面适应互联网,支持动态收集、分析数据和HTML格式报告,依靠于诸多竞争对手。
但是它很难与一般办公软件如Office或是WPS2000直接兼容,在撰写调查报告时往往要用电子表格软件及专业制图软件来重新绘制相关图表,已经遭到诸多统计学人士的批评;而且SPSS作为三大综合性统计软件之一,其统计分析功能与另外两个软件即SAS和BMDP 相比仍有一定欠缺。
S-PLUS(此部分摘自厂家的软件宣传资料)Insightful公司是世界著名的商务智能软件提供商,产品涵盖分析统计、数据挖掘、知识获取、决策支持等多个领域。
公司总部设在美国西雅图。
S-PLUS作为一个工业数据分析工具与数据分析应用开发平台,在各行各业已经有较长的使用历史。
并曾获得著名的“美国计算机协会优秀软件奖。
S-PLUS提供了方便、灵活、交互、可视化的操作环境,帮助您找出数据之间的关系和趋势,让您做出更好地决策。
在科学研究、市场营销、产品研发、质量保证、财务分析、金融证券、资料统计等各个方面,S-PLUS都有广泛的应用。
S-PLUS有流畅、直观的操作界面,广泛的输入输出功能,不论您的数据在何处、数据的格式如何,都可以轻松地存取,生成的结果可以以任意格式进行输出(图形、文档、表格、网页)。
特别是:S-PLUS的操作界面与Microsoft Office完全一致,用鼠标轻松点击,就可以把S-PLUS 的分析结果嵌入到Word文档和PowerPoint文档中;S-PLUS与Excel无缝集成,您可以在S-PLUS 环境中随意操作Excel数据,也可以在Excel环境中使用S-PLUS功能,无需花时间在Excel及S-PLUS之间,将数据来回转换;S- PLUS可以在Internet环境中进行数据分析和结果发布。
S-PLUS领先于业界的探索式图形技术,使得您可以直观地展现隐藏在数据中的关系和趋势,不致迷失在简单的统计数值及文字报表中。
S-PLUS提供超过80种的二维和三维图形库,您可以轻松修改每一层图形的细节,包括线条、颜色、字体等,产生您想要的图形。
S-PLUS提供超过4200种统计分析函数,包含了传统和现代的统计分析、数据挖掘、预测分析的算法。
软件所有的分析功能都是向导式的,使您轻松完成数据的分析任务。
S-PLUS的开放性,允许您自己开发新的算法,集成到S-PLUS软件中。
您也可以从S-PLUS 网站或者其它统计网站上免费下载算法,集成到S-PLUS软件中。
通过S-PLUS的脚本语言,可以记录和存储分析过程;或者,用鼠标拖拉对象(如按钮、菜单等等)到命令窗口,会立即产生相应的执行指令;反之,拖拉指令到工具列上,会产生相应的功能按钮。
使得您的分析过程可以进行存储、共享和重复执行,大大减少您的重复工作量。
S-PLUS还提供强大的编程语言——S语言,您可以使用它来开发专门适合于您的个性化系统,也可以建立企业级的应用系统。
而且,S-PLUS几乎可以集成到其它任何系统中,如:在Unix系统上,S-PLUS的CONNECT/Java接口,可以让S-PLUS集成到Java程序中。
在Windows系统上,S-PLUS的CONNECT/C++接口,可以在您开发的C++程序內使用全部的S-PLUS分析方法。
另外S-PLUS的DDE及OLE接口,可以让您集成S- PLUS到其他Windows应用程序中,允许您从Excel或Visual Basic应用程序中执行S-PLUS功能。
简明统计分析软件——Concise Statistics数据的统计分析经常困扰着广大科研人员。
缺乏适合非统计专业的科研人员使用的统计软件是一个主要的原因。
许多著名的统计软件都要求使用者具备较丰富的统计学知识和统计技巧。
这一要求尽管不算太高,但往往令许多科研人员望而却步。
鉴于此,该软件充分考虑了非统计学专业人员的统计学知识水平及其思维特点,力求开发一套简明、实用的智能化统计软件,使得只要具备最基本的统计学知识的科研人员,也可以做到无师自通。