SAS讲义1-3
- 格式:rtf
- 大小:89.56 KB
- 文档页数:7
第一章1.缺省情况下,快捷键F1, F3, F4, F5, F6, F7, F8, F9和Ctrl+E的作用是什么?F1帮助,F3 end,F4 recall调回提交的代码,F5 激活编辑器窗口,F6激活日志窗口,F7键激活输出窗口,F8 提交,F9键查看所有功能键功能,Ctrl+E键清除窗口内容。
2.缺省情况下SAS系统的五个功能窗口及各自的作用是什么?怎样定义激活这些窗口的快捷键?1)资源管理器窗口。
作用:访问数据的中心位置。
2)结果窗口。
作用:对程序的输出结果进行浏览和管理。
3)增强型编辑器窗口。
作用:比普通编辑窗口增加了一些功能,如定义缩写,显示行号,对程序段实现展开和收缩等。
4)日志窗口。
作用:查看程序运行信息。
5)输出窗口。
查看SAS程序的输出结果。
3.怎样增加和删除SAS工具?使用菜单栏中的工具=>定制=>“定制”标签实现工具的增加和删除。
4.SAS日志窗口的信息构成。
提交的程序语句;系统消息和错误;程序运行速度和时间。
5.在显示管理系统下,切换窗口和完成各种特定的功能等,有四种发布命令的方式:即,在命令框直接键入命令;使用下拉菜单;使用工具栏;按功能键。
试举例说明这些用法。
如提交运行的命令。
程序写完后,按F3键或F8键提交程序,或单击工具条中的提交按纽,或在命令框中输入submit命令,或使用菜单栏中的运行下的提交,这样所提交的程序就会被运行。
6.用菜单方式新建一个SAS逻辑库。
在菜单栏选择工具—》新建逻辑库出现如图所示界面。
在名称中输入新的逻辑库名称。
在引擎中根据数据来源选择不同的引擎,如果只是想建立本机地址上的一个普通的SAS数据集数据库,可以选择默认。
然后选中“启动时启用”复选框,在逻辑库信息中,单击路径后的“浏览”按钮,选择窗口可以不填,单击确定产生一个新的逻辑库。
7.说明下面SAS命令的用途并举例:keys,dlglib,libname,dir,var,options,submit,recall.Keys激活功能键的设定窗口。
★第一章:SAS系统简介SAS文件及命名1、SAS数据集文件(后缀为sas7bdat)2、SAS程序文件(后缀为sas)3、SAS日志文件(后缀为log)4、SAS输出文件(后缀为list)★第二章:SAS数据集的分类临时数据集和永久数据集(一)临时数据集存放在work数据库中(二)永久数据集存放在永久数据库中,除了work数据库之外,其他的数据库都是永久数据库。
1、SAS文件的2级命名方式:目录.文件名2、使用Libname语句创建永久数据集,libname 自建目录名‘目录地址’;Libname例创建与读取永久数据库1、创建永久数据集永久数据集的扩展名是sas7bdat。
libname例:libname sasroom "d:\sasdata"; data sasroom.data1; input y $ x1 x2 x3@@; cards; run; proc print; run;2、读取永久数据集 read例libname sasroom "d:\sasdata"; data sasroom.data1; input y $ x1 x2 x3@@; cards;run;建立SAS数据集的5种方法1、用data步输入数据建立。
newdata例data newdata; input group $ x1 x2 x3; cards;2、利用infile语句从外部调入数据文件建立SAS数据集,注意:infile语句必须放在input语句的前面。
(Infile例)3、利用“导入数据”功能建立。
(Excel例)4、利用EFI(external file interface)功能导入(classifydata例)。
5、data步利用set 语句建立。
(Set1例)查看SAS数据集的内容1、使用contents过程查看数据的相关信息。
Contents例proc contents data=数据集名 position;2、用print过程来显示数据。
全等三角形状元笔记【知识要点】1.全等三角形能够完全重合的两个三角形叫做全等三角形.2.全等三角形的性质全等三角形的对应边相等,全等三角形的对应角相等.3.三角形全等的判定方法(1)三边分别相等的两个三角形全等(简写成“边边边”或“SSS”).(2)两边和它们的夹角分别相等的两个三角形全等(简写成“边角边”或“SAS”).(3)两角和它们的夹边分别相等的两个三角形全等(简写成“角边角”或“ASA”).(4)两个角和其中一个角的对边分别相等的两个三角形全等(简写成“角角边”或“AAS”).4.直角三角形全等的判定方法斜边和一条直角边分别相等的两个直角三角形全等(简写成“斜边、直角边”或“HL”).【温馨提示】1.两个三角形全等的条件中必须有一条边分别相等,只有角分别相等不能证明两个三角形全等.2.有两边和其中一边的对角分别相等的两个三角形不一定全等.3.“HL”定理指的是斜边和一条直角边分别相等,而不是斜边和直角分别相等.【方法技巧】1.应用全等三角形性质解决问题的前提是准确地确定全等三角形的对应边和对应角,其规律主要有以下几点:(1)以对应顶点为顶点的角是对应角;(2)对应顶点所对应的边是对应边;(3)公共边(角)是对应边(角);(4)对顶角是对应角;(5)最大边(角)是对应边(角),最小边(角)是对应边(角).全等三角形的对应边和对应角可以依据字母的对应位置来确定,如若△ABC≌△DEF,说明A与D,B与E, C与F是对应点,则∠ABC与∠DEF是对应角,边AC与边DF是对应边.2.判定两个三角形全等的解题思路:专题一 三角形全等的判定1.如图,BD 是平行四边形ABCD 的对角线,∠ABD 的平分线BE 交AD 于点E ,∠CDB 的平分线DF 交BC 于点F .求证:△ABE≌△CDF .2.如图,在△ABC 中,D 是BC 边上的点(不与B ,C 重合),F ,E 分别是AD 及其延长线上的点,CF ∥BE . 请你添加一个条件,使△BDE ≌△CDF (不再添加其他线段,不再标注或使用其他字母),并给出证明.(1)你添加的条件是:__________; (2)证明:SAS SSS AAS SAS ASA AAS ASA AAS ⎧⎧⎨⎪⎩⎪⎪⎧⎪⎪⎪⎧⎪⎪⎨⎨⎪⎨⎪⎪⎪⎪⎪⎩⎩⎪⎪⎧⎪⎨⎪⎩⎩找夹角——已知两边找另一边——边为角的对边——找任一角——找夹角的另一边——已知一边一角边为角的邻边找夹边的另一角——找边的对角——找夹边——已知两角找任一边——3.如图,△ABC中,点D在BC上,点E在AB上,BD=BE,要使△ADB≌△CEB,还需添加一个条件.(1)给出下列四个条件:①AD=CE;②AE=CD;③∠BAC=∠BCA;④∠ADB=∠CEB;请你从中选出一个能使△ADB≌△CEB的条件,并给出证明;(2)在(1)中所给出的条件中,能使△ADB≌△CEB的还有哪些?直接在题后横线上写出满足题意的条件序号.__________________.专题二 全等三角形的判定与性质4.如图,已知△ABC 中,∠ABC =45°,AC =4,H 是高AD 和BE 的交点,则线段BH 的长度为( )AB .4C .D .55.【2013·襄阳】如图,在△ABC 中,AB =AC ,AD ⊥BC 于点D ,将△ADC 绕点A 顺时针旋转,使AC 与AB 重合,点D 落在点E 处,AE 的延长线交CB 的延长线于点M ,EB 的延长线交AD 的延长线于点N .求证:AM =AN .6.【2012·泸州】如图,△ABC 是等边三角形,D 是AB 边上一点,以CD 为边作等边三角形CDE ,使点E 、A 在直线DC 的同侧,连接AE .求证:AE ∥BC .NME D B CA专题三全等三角形的应用7.如图,有两个长度相同的滑梯靠在一面墙上.已知左边滑梯的高度AC与右边滑梯水平方向的长度DF相等,则这两个滑梯与地面夹角∠ABC与∠DFE的度数和是()A.60° B.90° C.120° D.150°8.有一座小山,现要在小山A、B的两端开一条隧道,施工队要知道A、B两端的距离,于是先在平地上取一个可以直接到达A和B的点C,连接AC并延长到D,使CD=CA,连接BC并延长到E,使CE=CB,连接DE,那么量出DE的长,就是A、B两端的距离,你能说说其中的道理吗?9.已知如图,要测量水池的宽AB ,可过点A 作直线AC ⊥AB ,再由点C 观测,在BA 延长线上找一点B′,使∠ACB′=∠ACB ,这时只要量出AB′的长,就知道AB 的长,对吗?为什么?10.如图,点D 、B 分别在∠A 的两边上,C 是∠A 内一点,AB = AD ,BC = CD ,CE ⊥AD 于E ,CF ⊥AF于F .求证:CE = CF11.已知:如图,在△ABC 中,∠A =90°,AB = AC ,BD 平分∠ABC .求证:BC = AB + ADFA BECD12.如图,已知AD ∥BC ,∠PAB 的平分线与∠CBA 的平分线相交于E ,CE 的连线交AP 于D .求证:AD +BC =AB13.如图,△ABC 中,AD 是∠CAB 的平分线,且AB =AC +CD ,求证:∠C =2∠B14.如图①,E 、F 分别为线段AC 上的两个动点,且DE ⊥AC 于E ,BF ⊥AC 于F ,若AB =CD ,AF =CE ,BD 交AC 于点M . (1)求证:MB =MD ,ME =MF(2)当E 、F 两点移动到如图②的位置时,其余条件不变,上述结论能否成立?若成立请给予证明;若不成立请说明理由.DBACPEDCBA D CBA15.已知:如图,DC ∥AB ,且DC =AE ,E 为AB 的中点, (1)求证:△AED ≌△EBC .(2)观看图前,在不添辅助线的情况下,除△EBC 外,请再写出两个与△AED 的面积相等的三角形.(直接写出结果,不要求证明):16.如图,△ABC 中,∠BAC =90度,AB =AC ,BD 是∠ABC 的平分线,BD 的延长线垂直于过C 点的直线于E ,直线CE 交BA 的延长线于F .求证:BD =2CE .OEDCBAFEA17.已知:在△ABC中,∠BAC=90,AB=AC,AE是过点A的一条直线,且BD⊥AE于D,CE⊥AE于E.(1)当直线AE处于如图①的位置时,有BD=DE+CE,请说明理由;(2)当直线AE处于如图②的位置时,则BD、DE、CE的关系如何?请说明理由;(3)归纳(1)、(2),请用简洁的语言表达BD、DE、CE之间的关系.18、两个大小不同的等腰直角三角形三角板如图1所示放置,图2是由它抽象出的几何图形,B C E,,在同一条直线上,连结DC.(1)请找出图2中的全等三角形,并给予证明(说明:结论中不得含有未标识的字母);图1图2DCAB(2)证明:DC BE⊥.19.如图-1,ABC△的边BC在直线l上,AC BC⊥,且AC BC=;EFP△的边FP也在直线l上,边EF与边AC重合,且EF FP=.(1)在图-1中,请你通过观察、测量,猜想并写出AB与AP关系;(2)将EFP△沿直线l向左平移到图-2的位置时,EP交AC于点Q,连结AP,BQ.猜想并写出BQ与AP的关系,请证明你的猜想;(3)将EFP△沿直线l向左平移到图-3的位置时,EP的延长线交AC的延长线于点Q,连结AP,BQ.你认为(2)中所猜想的BQ与AP的关系还成立吗?若成立,给出证明;若不成立,请说明理由.A (E)B C (F)Pl l l图-1 图-2图-3全等三角形——角的平分线的性质状元笔记【知识要点】1.角的平分线的性质角的平分线上的点到角的两边的距离相等.2.角的平分线的判定角的内部到角的两边的距离相等的点在角的平分线上.【温馨提示】1.到三角形三边距离相等的点是三角形三条角平分线的交点,不是其他线段的交点.2.到三角形三边距离相等的点不仅有内角的平分线的交点,还有相邻两外角的平分线的交点,这样的点共有4个.【方法技巧】1.利用角的平分线的性质解决问题的关键是:挖掘角的平分线上的一点到角两边的垂线段.若已知条件存在两条垂线段——直接考虑垂线段相等,若已知条件存在一条垂线段——考虑通过作辅助线补出另一条垂线段,若已知条件不存在垂线段——考虑通过作辅助线补出两条垂线段.2.利用角平分线的判定解决问题的策略是:挖掘已知图形中一点到角两边的垂线段.若已知条件存在两条垂线段——先证明两条垂线段相等,然后说明角平分线或角的关系;若已知条件存在一条垂线段——考虑通过作辅助线补出另一条垂线段,再证明两条垂线段相等;若已知条件不存在垂线段——考虑通过作辅助线补出两条垂线段后,证明两条垂线段相等.专题一利用角的平分线的性质解题1.如图,在△ABC中,AC=AB,D在BC上,若DF⊥AB,垂足为F,DG⊥AC,垂足为G,且DF=DG.求证:AD⊥BC.2.如图,已知CD⊥AB于点D,BE⊥AC于点E,BE,CD交于点O,且AO平分∠BAC.求证:OB=OC.3.如图,在Rt △ABC 中,∠C=90°,,AD 是∠BAC 的角平分线,DE ⊥AB 于点E ,AC =3 cm ,求BE 的长.专题二 角平分线的性质的应用 4.如图,三条公路把A 、B 、C 三个村庄连成一个三角形区域,某地区决定在这个三角形区域内修建一个集贸市场,要使集贸市场到三条公路的距离相等,则这个集贸市场应建在()A .在AC 、BC 两边高线的交点处B .在AC 、BC 两边中线的交点处C .在∠A 、∠B 两内角平分线的交点处D .在AC 、BC 两边垂直平分线的交点处5.如图,要在河流的南边,公路的左侧M 区处建一个工厂,位置选在到河流和公路的距离相等,并且到河流与公路交叉A 处的距离为1cm (指图上距离),则图中工厂的位置应在__________,理由是__________.21BAC B ∶∶∠∠6. 如图, ∠ B= ∠ C=90 °, M 是 BC 中点, DM 平分 ∠ ADC ,求证: AM 平分 ∠ DAB .7. 如图,已知 △ ABC 的周长是 22 , OB 、 OC 分别平分 ∠ ABC 和 ∠ ACB , OD ⊥ BC 于 D ,且 OD=3 , △ ABC 的面积是多少?8.如图,已知 ∠ 1= ∠ 2 , P 为 BN 上的一点, PF ⊥ BC 于 F , PA=PC ,求证: ∠ PCB+ ∠ BAP=180 º9.如图,△ ABC 中, P 是角平分线 AD , BE 的交点. 求证:点 P 在∠ C 的平分线上.10. 如图,在 △ ABC 中, BD 为 ∠ ABC 的平分线, DE ⊥ AB 于点 E ,且 DE=2cm , AB=9cm , BC=6cm ,求 △ ABC 的面积.21NP F C BA11.如图, D 、 E 、 F 分别是△ ABC 的三条边上的点, CE=BF ,△ DCE 和△ DBF 的面积相等.求证: AD 平分∠ BAC .。
SAS讲义-第三课一、SAS算符(1)算术算符** 乘方;* 乘;/ 除;+ 加;- 减。
例:算术算符应用。
data;X=3.5**2.5;put X=;Y=9+1/3;put Y=;X=.;Y=1+X;put Y=; /*Y也是缺失值*/run;(2)比较算符(重要)(3)“|”或运算,“||”连接符。
例:运算符的运用。
data a;x=(1>2)|(1<2);y=(1>2)&(1<2);z='good '||'morning';run;二、变量类型转换(1)字符自动转为数值例:data a;a=1;b=2; /*a、b数值型*/x='10';y='a'; /*x、y字符型*/a=x; /*字符型成功转为数值型*/b=y; /*字符型转为数值型失败*/if _error_ then b=3;y=x; /*将长字符赋值给短字符会被截取*/run;(2)函数input将字符转为数值例:data a(keep=code);set resdat.lstkinfo;code=input(stkcd,6.);run;(3)函数put将数值转为字符data a(keep=Date x);set resdat.stk000001;x=put(clpr,8.2);run;三、SAS函数SAS函数的形式:函数名(X1,X2,….)例表达式中用函数data a(keep=date y d min);set resdat.idx000001;y=year(date);d=weekday(date);min=min(sum(oppr,hipr,lopr,clpr),1000);run;例条件语句中使用函数data a;set resdat.idx000001;where year(date)>1996;run;。
SAS讲义-第五课一、BY语句数据步中,BY语句规定分组变量。
用于控制SET,MERGE,UPDATE或MODIFY语句的操作。
SAS系统对每个BY组创建两个自动变量:First.variable 和Last.variable, 用来标识每个BY组的第一个和最后一个观测。
对于一个BY组的第一个观测值,First.variable取1,其余取0。
对于一个BY组的最后一个观测值,Last.variable 取1,其余取0。
这些变量不含在新产生的数据集中。
例1保留各BY组的最后一个观测值。
data a;set resdat.stk000001;month=month(date);year=year(date);proc sort data=a;by year month;data b;set a;by year month;if last.month; /*保留每月最后一个观测值*/run;例2* 想一想,该例子应该输出什么,理解BY语句。
/*创建测试数据集*/data by_data;input prov$ cty$ mth income @@;cards;JS c1 1 100 JS c1 2 110JS c1 3 101 JS c2 1 200JS c2 2 210 JS c2 3 201SH c1 1 500 SH c1 2 510SH c1 3 501 SH c2 1 400SH c2 2 410 SH c2 3 4201;run;/*对数据集排序*/proc sortdata=by_data;by prov cty mth;run;/*产生first及last变量*/data fst_lst;set by_data;by prov cty mth;fst_p=first.prov;lst_p=last.prov;fst_c=first.cty;lst_c=last.cty;fst_m=first.mth;lst_m=last.mth;run;二、MERGE 语句MERGE语句将多个数据集中的观测合并为新数据集的一个观测。
全等三角形》讲义(完整版)全等三角形讲义全等三角形定义:若两个三角形形状大小相同,能够完全重合,则它们是全等形三角形。
对应顶点、对应边、对应角均重合。
全等三角形的性质是对应边相等,对应角相等。
全等三角形判定定理:1.边边边定理(SSS):若两个三角形的三条边对应相等,则它们是全等三角形。
2.边角边定理(SAS):若两个三角形的一条边和它们的夹角对应相等,且另一条边对应相等,则它们是全等三角形。
3.角边角定理(ASA):若两个三角形的两个角和它们的夹边对应相等,则它们是全等三角形。
4.角角边定理(AAS):若两个三角形的两个角和其中一个角的对边对应相等,则它们是全等三角形。
5.斜边直角边定理(HL):若两个直角三角形的斜边和一条直角边对应相等,则它们是全等三角形。
角平分线的性质:在角平分线上的点到角的两边的距离相等。
角平分线的判定:到角的两边距离相等的点在角的平分线上。
三角形的角平分线的性质:三角形三个内角的平分线交于一点,并且这一点到三边的距离相等。
典型例题举例:1.已知△ABN≌△ACM,对应角为∠B和∠C,对应边为AB和AC。
2.已知AB=AC,AD是连结点A与BC中点D的支架,求证△ABD≌△ACD。
3.已知点A、F、E、C在同一条直线上,AF=CE,BE∥DF,BE=DF,求证△ABE≌△CDF。
4.在△ABC中,D在AB上,E在AC上,AB=AC,∠B =∠C,求证AD=AE。
5.已知∠1=∠2,∠3=∠4,求证AC=AD,其中D是线段BC上的一点,且BD=DC。
6.在图中,B、E、F、C在同一直线上,AF⊥BC于F,DE⊥BC于E,AB=DC,BE=CF,判断AB是否平行于CD,说明理由。
7.在图1中,△ABC的边AB、AC为边分别向外作正方形ABDE和正方形ACFG,连结EG,判断△ABC与△AEG 面积之间的关系,并说明理由。
8.在图中,OC是∠AOB的平分线,P是OC上的一点,PD⊥OA交OA于D,PE⊥OB交OB于E,F是OC上的另一点,连接DF,EF,求证DF=EF。
第三章:对SAS 数据文件的合并与存取本章主要内容,是介绍SAS 软件对整个数据文件的存取及合并的方法,而上一章则主要是介绍对一个数据文件内变量的读取及处理方法。
我们先讲一讲如何用SAS 指令合并两个或多个数据文件。
一、 S AS 软件对两个及以上数据文件的合并在数据分析时,将两个不同的数据文件并为一个,以进行进一步的综合研究,有时是很必要的。
SAS 软件有两种合并两个数据文件的方法。
1、 垂直合并:垂直合并的方法,适用于已经用DA TA 类指令建立起的两个或多个SAS 数据文件,这些数据文件必须具有完全相同的变量(名称及内容),换句话说,两个数据矩阵应具有相同的列数。
这种合并是在一个新的DA TA 阶段里,通过“垂直合并表格指令”SET 来实现的。
合并后,一个表格接在另一个表格之下.........。
下面是一个这类合并的图例:我们有两张分别叫作“Table 1”和“Table 2”的SAS 表格,如下图:Table 1 Table 2 obs v1 v2 obs v1 v2可为地址,人名 观测单位用DA TA 类指令建立合并这两张表的程式可如下编写:在程式运行后,我们可以得到一个新的叫作Table3的SAS表格,这张新表包含有名叫Table1与Table 2的两张SAS数据表,是这两张表的垂直合并。
其形式如下图(Table2被接在表Table1之下):Table3如果被合并的表格(如上例Table1、Table2)并没有完全一样的结构,或者说没有一样的变量,合并指令仍会执行,所有有问题的数据在新的合并表中,将会以残缺数据符号“·”代替。
2、水平合并:与“垂直合并”一样,水平合并也是将已经建立好的两个或多个SAS数据文件,合并成一个新的数据文件,供数据分析之用。
被合并的数据文件,必须具有完全相同的观测单位。
或者说,两个数据矩阵的“行数”要完全相同,在合并前...,两个矩阵各自的第一列的元素也应当完全相同。
水平合并后,一个SAS数据文件与另一个SAS数据文件并列(并排)生成为一个新的SAS数据文件。
为了保证不同数据矩阵的每一行都相互对应,或者说两个不同数据矩阵的第一列相同元素互相对应,在两个数据文件合并之前,比较稳妥的作法是先用两个即将合并文件的“公共标志符”进行分类。
由于“水平合并”要求两个数据矩阵的“行数”完全相同,两个矩阵合并前各自第一列的元素也完全相等。
事实上,就是要求两个即将合并的原始数据矩阵的观测单位要完全等同。
因此,两个矩阵相互等同的观测单位即成为它们合并的“公共标志符”,我们可以利用SAS软件的分类指令(PROC SORT),在“水平合并”指令发出之前,先将两个数据矩阵各自用“分类指令”按相同的“公共标志符”——观测单位——进行分类排列;然后再用“水平合并指令”MERGE,将两个数据矩阵按它们的“公共标志符”——观测单位——加以合并。
由于“分类指令”PROC SORT与“水平合并指令”MERGE都需要使用“公共标志符”,所以在程式的编写时,还需要使用SAS软件的“控制公共标志符指令”BY。
下面是两个数据矩阵水平合并的实例与图例:我们有两个SAS数据文件LISTE1和;LISTE2:LISTE1 LISTE2欲水平合并之将其用DA TA指令分别建立成SAS数据表,并用分类指令和控制指令分类排列;最后将两个数据文件水平合并的程式可如下表示:DA TA LISTE1;…PROC SORT;BY NO;按变量NO分类排列;DA TA LISTE2;…PROC SORT;BY NO;DA TA LISTE3;MERGE LISTE1 LISTE2;BY NO ;我们通过水平合并,最后得到了一个叫作LISTE3 的SAS 数据文件,这一文件是两个数据文件LISTE1与LISTE2的水平合并,其图示如下:SAS 数据文件名LISTE3变量名 NO A B x y如果合并前的两个数据矩阵的“行数”不是完全相同,或者说有的数据文件缺漏了对一些观测单位变量的登记,在水平合并以后,有缺陷的不对应数据会被SAS 的数据残缺符号“·”所代替。
从以上SAS 软件对两个或多个数据文件的合并可以看出,无论是在数据库的管理,或是在原始数据的录入方面,这些专用指令的灵活运用是很实用的,可以为用户提供很多方便,显示出SAS 软件灵活性,实用性的一面。
当工作的数据库过于庞大时,使用这些指令并配合其他DA TA 指令,可以完成被称为“数据采掘”的工作,大大提高计算机工作的效率。
下面,我们介绍SAS 程式对原始数据文件的不同读取方法。
二、 SAS 程式对原始数据文件的存取1、 在SAS 程式内直接插进原始数据矩阵的方法:将原始数据矩阵和SAS 指令一同写进一个SAS 程式是可以的。
其规则是,①原始数据矩阵必须写在DA TA 阶段指令的最后面,放置在“原始数据输入指令”CARDS (属DA TA 类指令)和第一个子程式指令PROC 之间;②数据矩阵与两条指令CARDS 和PROC 之间,不能留有空行;③输入原始数据矩阵的最后一个数据后,不能再加分号“;”。
下面是一个例子:DA TA class ;INPUT name x y z ;; Qian 28 1 5Sun 25 1 6FREQ ;RUN ;2.对程式外的一个SAS 数据文件的读取:当数据文件的观测单位很多时,例如有数百个以上的观测单位,将原始数据矩阵单独以一个数据文件的形式建立并存贮起来是更为常用的简便方法。
其好处是显而易见的,既有利于SAS 程式的编写,修改及运行,也有利于保护原始数据,不被意外的人为错误所损坏。
这样,用户实际上是在两个相互独立的SAS 文件上工作,一个是存盘的SAS 原始数据文件,另一种是SAS 程式文件。
因此,在SAS 程式文件上,必须标注出SAS 数据文件的名称和所存贮的位置。
在不同型号的计算机上,和不同的计算机操作系统下(如VM/CMS ,UNIX 系统;DOS 系统及Windows 系统),标注的指令或句法是不同的。
由于在Windows 系统下使用SAS 软件是当前的主流趋势,我们在这里仅向大家介绍在这种系统下,对数据文件的读取指令。
对数据文件的读取指令是INFILE ,这一指令的后面要注明原始数据文件所处在的确切位置,并要用引号把数据文件的名称,文件类型和其位置括起来。
这条指令必须放在DA TA 阶段的关键词DA TA 之后,和变量输入指令INPUT 之前。
下面是在 Windows 操作系统下,这一指令的一个实例(在DOS 操作系统下,也同样可以适用):DA TA class ;INFILE “A :\ table. DA T ”; 或“A :\wp02-98.dat ”;INPUT ……;这段程式的涵义是,用DA TA 指令建立一个名叫“class ”的SAS 数据表,这个数据表要首先读取存在“A ”驱动器上软盘内的名叫table 的原始数据文件(DA T 是这一文件的类型);此后,需从这一数据文件上输入(读取)变量……(依靠INPUT 指令)。
*选修* :3、用SAS 程式建立并输出一个外部数据文件对于其它的计算机软件来说,用“SAS格式化”了的数据文件是不能被取读的。
当我们需要一个未经专门格式化的原始数据文件,或者是为另一个计算机软件(比如EXCEL 或SPSS)取读用的专门数据文件,就必须把SAS 数据文件转换为一个“外部数据文件”。
这种转换的SAS指令是由“文件输出指令”FILE,以及“文件(存写)格式化指令”PUT所组成的,这两条指令应写在DA TA阶段程式的结尾处。
“文件输出指令”FILE是用来定义输出的数据文件名,文件类型,以及文件存贮的位置的(硬盘或软盘)。
与文件输入指令INFILE一样,不同的计算机操作系统下,这条指令的句法是不一样的。
下面是在DOS操作系统下和Windows操作系统下这条指令的一般表达式与一个应用实例:FILE “外部数据文件名”;(一般表达式)FILE “B:\ export.dat”;(应用实例)应当注意的是,输出的数据文件名及存贮位置(如上例:B:\export.dat)必须要用引导括起来,而且是由用户自己去定义的。
“文件格式化指令”PUT是专门用来定义数据库变量名清单以及变量的存写格式的。
其一般表达式为:PUT (变量名清单)(变量的存写格式);“变量名清单”和“变量的存写格式”的书写规则与变量在“固定格式”下的读取规则完全相同(参第二章:一:2)。
如:PUT (V1-V10)(10*2.)。
上例表明,输出的数据文件共有从V1到V10十个变量,每一个变量的数值各占两列的空间。
三、SAS软件对残缺数据的存取作为SAS软件的书写规则,在一个数据文件里,当数字变量的变量值用符号“.”表示时,和字符串变量的变量值用一个“空格”表示时,即表明该变量值是“残缺数据”(如调查登记时的“拒答”,或某一观测单位里缺乏的变量——如1982年我国人口普查时,西藏的1982年分年龄死亡人口没有登记)。
如果变量在编码时,对残缺数据的编码是用其它的方式,比如是用许多教科书建议的“0”或“9”来代表残缺数据的编码,那么在使用SAS软件做数据分析时,就必须要在SAS程式里对这些变量重新编码。
使其与SAS软件对此的特定规则相一致。
重新编码的工作,在SAS程式里可以用条件语句指令IF…THEN来完成。
例如:IF V1=9 THEN V1=.;IF V3>50 THEN V3= .;IF name =“9”THEN name =“”;可以看出,这里V1和V3是数字变量,变量name是字符串变量。
经过条件语句指令的处理,用“9”表示的V1变量,用“50”以上的数字表示的V3变量,以及用“9”表示的变量name ,都再次按SAS软件的规则被重新编码为残缺数据。
这一章,我们介绍了对SAS数据文件的合并与存取,以及对一个数据文件中,残缺数据的存取方法。
下一章,我们将介绍SAS软件对变量的数据处理方法。