SAS课件——第02讲 SAS系统对数据文件的管理
- 格式:ppt
- 大小:1.15 MB
- 文档页数:43
第二章SAS软件的BASE(数据库功能)第一节简介Base SAS软件是SAS系统的基础和核心。
主要功能是数据管理和数据加工处理,并有报表生成和描述统计的功能,管理用户使用环境,进行用户语言的处理,调用其他SAS模块和产品。
Base SAS软件可以单独使用,SAS其他软件产品以它为基础实现功能。
提供以下几方面功能:一、数据管理功能1、信息存储和检索2、数据修改与程序设计3、文件操作二、基础统计计算功能Base SAS软件中有一些基本过程和SAS函数能够完成基础统计计算。
它包括:1、计算简单描述统计量2、对数据进行标准化、求秩以及有关统计量3、生成并分析列联表4、计算概率分布函数、分位数、样本统计量以及产生随机数三、报表生成和图形显示功能Base SAS软件输出数据与读入数据时同样可以采用任何格式。
除了SAS过程产生的固定格式的报表外,用户可根据自己的需要来设计报表的输出格式,包括输出文件到磁盘上。
SAS的一些基本过程可绘制水平的或垂直的直方图、饼图、块图和星形图,分布图、曲线图、时间序列图等等。
四、SAS数据集的结构SAS数据集是关系型的,它通常分为两部分:●描述部分——包含了一些关于数据属性的信息●数据部分——包括数据值SAS的数据值被安排在一个矩阵式的表状结构中,见图3-1所示。
●表的列称之为变量(Variable),变量类似于其它文件类型的域或字段(Field);●表的行称之为观察(Observation),观察相当于记录(Record)。
图3-1 一个SAS数据文件输入和输出格式SAS数据集的数据值的内部存放格式并不一定与该数据值的输入和输出格式一致,这取决于SAS的两个重要功能:输入格式(Informats)和输出格式(Formats)。
输入格式指示SAS系统如何读入数据,而输出格式指示SAS系统如何输出数据。
它们的一般形式如下:●输入格式:<$>informat<w>.<d>●输出格式:<$>format<w>.<d>其中$符号指示这是个字符输入输出格式,没有$符号表示是数值输入输出格式;Informat是一个输入格式的名字,format是一个输出格式的名字;w是宽度值,对许多输入输出格式这个值是输入输出数据的列数;d在数值输入输出格式中是小数部分的长度;点”.”是所有输入输出格式中必须包含的分隔符,作为名字的一部分。
第2章SAS语言与数据管理SAS系统强大的数据管理能力、计算能力、分析能力依赖于作为其基础的SAS语言。
SAS语言是一个专用的数据管理与分析语言,它的数据管理功能类似于数据库语言(如FoxPro),但又添加了一般高级程序设计语言的许多成分(如分支、循环、数组),以及专用于数据管理、统计计算的函数。
S AS系统的数据管理、报表、图形、统计分析等功能都可以用SAS语言程序来调用,只要指定要完成的任务就可以由SAS系统按照预先设计好的程序去执行,所以SAS语言和FoxPro等属于第四代语言。
本章简单介绍SAS语言的基本成分与规则,SAS语言如何用来管理数据,SA S语言作为一个统计计算语言的用法。
§2.1 SAS语言构成2.1.1 SAS语旬SAS语言程序由数据步和过程步组成。
数据步用来生成数据集、计算、整理数据,过程步用来对数据进行分析、报告。
SAS语言的基本单位是语句,每个SAS语句一般由一个关键字(如DATA, PROC,INPUT,CARDS,BY)开头,包含SA S名字、特殊字符、运算符等,以分号结束。
SAS关键字是用于SAS语句开头的特殊单词,SAS语句除了赋值、累加、注释、空语句以外都以关键字开头。
SAS名字在SAS程序中标识各种SAS成分,如变量、数据集、数据库,等等。
SAS名字由1到32个字母、数字、下划线组成,第一个字符必须是字母或下划线。
SAS关键字和SAS名字都不分大小写。
2.1.2 SAS表达式SAS数据步程序中的计算用表达式完成。
表达式巴常量、变量、函数调用用运算符、括号连接起来得到一个计算结果。
SAS常量主要有数值型、字符型两种,并且还提供了用于表达日期、时间的数据类型。
例如•数值型:12,-7.5,2.5E-10•字符型:‘Beijing‘,"Li Ming","q-�"•日期型:‘13JUL1998‘d•时间型:‘14:20‘t•日期时间型:‘13JUL1998:14:20:32‘d t数值型常数可以用整数、定点实数、科学计数法实数表示。
第2章SAS系统对数据文件的管理2-1 SAS文件和SAS逻辑库1.SAS文件1.SAS数据集(SAS Datasets)SAS系统的数据文件, 后缀名是sas7bdat(V8), sd2(库引擎为V6)等.2.SAS目录文件(Catalog)用来保存各种不能表示成行列结构表格形式的数据,比如系统设置、图象、声音等。
在这类文件中可以存储整个应用系统,包括它的界面,源程序和各种对象间的连接。
………..注:SAS文件不同于SAS程序(SAS程序(SAS PROGRAM)是SAS用户运用SAS语言编写的一段程序。
)。
2.SAS逻辑库一个SAS逻辑库(Library)就是存放在一个文件夹或几个文件夹中的一组SAS文件。
库名遵循SAS命名原则。
在Windows环境中,一个SAS逻辑库实际对应于磁盘上的一个子目录(特殊情况下一个数据库可以由几个子目录组成)。
在SAS系统中,为了访问一个SAS 文件,最好为该SAS文件所在的位置指定一个SAS逻辑库,这样就不必引用可能很长的目录,变得十分简洁。
当退出系统时,自定义的逻辑库会被删除。
SAS系统规定逻辑库的命名必须遵循以下规则:●由英文字母(大写和小写皆可)或下划线开始;●由数字,字母和下划线构成;●长度可以是1-8个字符.引用SAS文件:两级命名方式逻辑库名.文件名在进人SAS系统时,系统会自动地指定一些逻辑库供用户使用:·Sashelp:该数据文件夹中的文件是SAS系统在运作时会使用到的系统文件,对环境的数据设置都会存放在此。
用户不要修改该数据文件夹中的文件数据。
·Sasuser:SAS系统会设置Sasuser数据文件夹路径。
若用户没有设置其他路径,则Sasuser指定的路径或文件每次都相同,该路径下的数据文件是永久存在的。
如果有SAS数据文件要存储时,用户无需在自己的程序代码中设置任何的数据文件夹名称,便可以使用Sasuser数据文件夹来存储SAS数据文件。