sas 常用函数
- 格式:doc
- 大小:133.50 KB
- 文档页数:7
SAS常用函数介绍
SAS常用函数介绍
SAS的功能非常强大和全面,这一点在函数上得到了极为充分的体现,SAS 8.2中共有25大类函数,功能涉及到文件管理、金触、数学计算、统计计算、字符串处理、货币转换等各个方面。
因篇幅限制,这里无法将数百种函数一一解释,只列举出饺为常用的十大类函数,关于这些函数的详细信息,以及术列出的货币转换函数、金融函数、地区以及邮政编码函数等相关信息请大家参见SAS帮助。
1.算术函数
2.字符函数
3.数学函数
4.概率与密度函数
5.分位数函数
6.随机函数
7.样本统计函数
8.三角函数
9.截断函数
10.日期时间函数。
第50章 SAS函数简介SAS函数是一个子程序,它由0个或几个自变量返回一个结果值。
每个SAS函数都有一个关键词名字。
为了引用函数,要写出它的名字,然后写出一个自变量或几个自变量,将其用放入括号中,而后这个函数对这些自变量进行某种运算。
SAS函数形式为 functionname (argument ,…)。
本章列举了常用SAS函数10类,以及关于这些函数的信息。
50.1 日期时间函数应用举例【例50-1】计算两个日期之间的天数。
具体SAS程序(程序名为SASTJFX50_1):程序说明data _null_;sdate=’01jan2008’d;edate=’01jan2009’d;days=datdif(sdate,edate,’act/act’); days360=datdif(sdate,edate,’30/360’); put days= days360=;run; 调用datdif函数按每个月实际天数计算按每个月30天计算结果显示为:days=366 days360=360【例50-2】计算两个日期之间的年数。
具体SAS程序(程序名为SASTJFX50_2): 程序说明data _null_;sdate=’01jan1999’d;edate=’01jan2009’d;year1= yrdif(sdate,edate,’30/360’); year2= yrdif(sdate,edate,’act/act’); year3=yrdif(sdate,edate,'act/360'); year4=yrdif(sdate,edate,'act/365'); put year1= year2= year3= year4= ; run; 调用yrdif函数按一年360天一个月30天计算按实际天数计算按一年360天每个月实际天数计算按一年365天每个月实际天数计算结果显示为:year1=10.083333333 year2=10.084931507 year3=10.233333333 year4=10.093150685【例50-3】计算当前时间的小时数和分钟数。
引言1. 字符函数2. 日期和时间函数3. 数组函数4. 数学函数5. 样本描述统计函数6. 特殊函数7. 随机数函数8. 宏函数9. 变量信息函数10. 分布密度函数、分布函数11. 分位数函数一、字符函数1. TRIM(s):返回去掉字符串s的尾随空格的结果。
2. UPCASE(s):把字符串s中所有小写字母转换为大写字母后的结果。
3. LOWCASE(s):把字符串s中所有大写字母转换为小写字母后的结果。
4. INDEX(s,s1):查找s1在s中出现的位置。
找不到时返回0。
5. RANK(s):字符s的ASCII码值。
6. BYTE(n):第n个ASCII码值的对应字符。
7. REPEAT(s,n):字符表达式s重复n次。
8. SUBSTR(s,p,n):从字符串s中的第p个字符开始抽取n个字符长的子串9. TRANWRD(s,s1,s2):从字符串s中把所有字符串s1替换成字符串s2后的结果。
10. PROPCASE(s):把字符串s的第一个字母大写。
11. CATX(d,s1,s2):把字符串s1和字符串s2通过d(如'-')连接返回结果。
12. COMPBL(s):把字符串s中的不同长度空格变为长度为1的空格返回结果。
13. COMPRESS(s,c,m):将字符串c(默认为空格)从字符串中移除,m为对d的添加项如下:d增加数字到初始字符里(chars)。
f增加下划线和字母(A-Z,a-z)到初始字符里(chars)。
g增加图形字符到初始字符里(chars)。
k不移除初始字符(chars)而是返回这些字符。
l增加小写字母(a-z)。
n增加数字、下划线和字母(A-Z,a-z)。
p增加标点符号。
s增加空格,包括空格,水平制表符,垂直制表符,回车符,换行符和换页符u增加大写字母(A-Z)。
a增加(A-Z,a-z)到初始字符里(chars)。
14. ANYALNUM(s,start):查找字符串s中从start位置开始第一个数字或字母的位置。
sas sql中常用函数SAS SQL中常用函数在SAS中,SQL是一种用于管理和操作关系数据库的语言。
通过使用SAS SQL,可以对数据进行查询、筛选、排序、汇总等操作,以便更好地理解数据以及满足需求。
在SAS SQL中,函数是非常重要的一部分,它们可以对数据进行处理,提取有用信息,并进行计算和转换。
本文将介绍SAS SQL中常用函数,并逐步进行详细讲解。
1. COUNT函数:COUNT函数用于统计某个列中非空值的个数。
语法如下:COUNT(column_name)其中,column_name表示要进行统计的列名。
COUNT函数返回一个表示计数结果的整数值。
2. SUM函数:SUM函数用于计算某个列的数值总和。
语法如下:SUM(column_name)其中,column_name表示要进行计算的列名。
SUM函数返回一个表示总和结果的数值。
3. AVG函数:AVG函数用于计算某个列的数值平均值。
语法如下:AVG(column_name)其中,column_name表示要进行计算的列名。
AVG函数返回一个表示平均值结果的数值。
4. MAX函数:MAX函数用于找出某个列中的最大值。
语法如下:MAX(column_name)其中,column_name表示要进行查找的列名。
MAX函数返回一个表示最大值结果的数值。
5. MIN函数:MIN函数用于找出某个列中的最小值。
语法如下:MIN(column_name)其中,column_name表示要进行查找的列名。
MIN函数返回一个表示最小值结果的数值。
6. CONCAT函数:CONCAT函数用于将多个字符串连接在一起。
语法如下:CONCAT(string1, string2, ...)其中,string1、string2等参数表示要进行连接的字符串。
CONCAT函数返回一个表示连接结果的字符串。
7. SUBSTRING函数:SUBSTRING函数用于提取某个字符串的部分内容。
一、数学函数ABS(x) 求x的绝对值。
MAX(x1,x2,…,xn) 求所有自变量中的最大一个。
MIN(x1,x2,…,xn) 求所有自变量中的最小一个。
MOD(x,y) 求x除以y的余数。
SQRT(x) 求x的平方根。
ROUND(x,eps) 求x按照eps指定的精度四舍五入后的结果,比如ROUND(5654.5654,0.01) 结果为5654.57,ROUND(5654.5654,10)结果为5650。
CEIL(x) 求大于等于x的最小整数。
当x为整数时就是x本身,否则为x右边最近的整数。
FLOOR(x) 求小于等于x的最大整数。
当x为整数时就是x本身,否则为x左边最近的整数。
INT(x) 求x扔掉小数部分后的结果。
FUZZ(x) 当x与其四舍五入整数值相差小于1E-12时取四舍五入。
LOG(x) 求x的自然对数。
LOG10(x) 求x的常用对数。
EXP(x) 指数函数。
SIN(x), COS(x), TAN(x) 求x的正弦、余弦、正切函数。
ARSIN(y) 计算函数y=sin(x)在区间的反函数,y取[-1,1]间值。
ARCOS(y) 计算函数y=cos(x)在的反函数,y取[-1,1]间值。
ATAN(y) 计算函数y=tan(x)在的反函数,y取间值。
SINH(x), COSH(x), TANH(x) 双曲正弦、余弦、正切ERF(x) 误差函数GAMMA(x) 完全函数此外还有符号函数SIGN,函数一阶导数函数DIGAMMA,二阶导数函数TRIGAMMA ,误差函数余函数ERFC,函数自然对数LGAMMA,ORDINAL函数,AIRY 函数,DAIRY函数,Bessel 函数JBESSEL,修正的Bessel函数IBESSEL,等等。
二、数组函数数组函数计算数组的维数、上下界,有利于写出可移植的程序。
数组函数包括:DIM(x) 求数组x第一维的元素的个数(注意当下界为1时元素个数与上界相同,否则元素个数不一定与上界相同)。
一、数学函数ABS(x) 求x的绝对值。
MAX(x1,x2,…,xn) 求所有自变量中的最大一个。
MIN(x1,x2,…,xn) 求所有自变量中的最小一个。
MOD(x,y) 求x除以y的余数。
SQRT(x) 求x的平方根。
ROUND(x,eps) 求x按照eps指定的精度四舍五入后的结果,比如ROUND(5654.5654,0.01) 结果为5654.57,ROUND(5654.5654,10)结果为5650。
CEIL(x) 求大于等于x的最小整数。
当x为整数时就是x本身,否则为x右边最近的整数。
FLOOR(x) 求小于等于x的最大整数。
当x为整数时就是x本身,否则为x左边最近的整数。
INT(x) 求x扔掉小数部分后的结果。
FUZZ(x) 当x与其四舍五入整数值相差小于1E-12时取四舍五入。
LOG(x) 求x的自然对数。
LOG10(x) 求x的常用对数。
EXP(x) 指数函数。
SIN(x), COS(x), TAN(x) 求x的正弦、余弦、正切函数。
ARSIN(y) 计算函数y=sin(x)在区间的反函数,y取[-1,1]间值。
ARCOS(y) 计算函数y=cos(x)在的反函数,y取[-1,1]间值。
ATAN(y) 计算函数y=tan(x)在的反函数,y取间值。
SINH(x), COSH(x), TANH(x) 双曲正弦、余弦、正切ERF(x) 误差函数GAMMA(x) 完全函数此外还有符号函数SIGN,函数一阶导数函数DIGAMMA,二阶导数函数TRIGAMMA ,误差函数余函数ERFC,函数自然对数LGAMMA,ORDINAL函数,AIRY 函数,DAIRY 函数,Bessel函数JBESSEL,修正的Bessel函数IBESSEL,等等。
二、数组函数数组函数计算数组的维数、上下界,有利于写出可移植的程序。
数组函数包括:DIM(x) 求数组x第一维的元素的个数(注意当下界为1时元素个数与上界相同,否则元素个数不一定与上界相同)。
DIM k(x) 求数组x第k维的元素的个数。
LBOUND(x) 求数组x第一维的下界。
HBOUND(x) 求数组x第一维的上界。
LBOUND k(x) 求数组x第k维的下界。
HBOUND k(x) 求数组x第k维的上界。
三、字符函数较重要的字符函数有:TRIM(s) 返回去掉字符串s的尾随空格的结果。
UPCASE(s) 把字符串s中所有小写字母转换为大写字母后的结果。
LOWCASE(s) 把字符串s中所有大写字母转换为小写字母后的结果。
INDEX(s,s1) 查找s1在s中出现的位置。
找不到时返回0。
RANK(s) 字符s的ASCII码值。
BYTE(n) 第n个ASCII码值的对应字符。
REPEAT(s,n) 字符表达式s重复n次。
SUBSTR(s,p,n) 从字符串s中的第p个字符开始抽取n个字符长的子串TRANWRD(s,s1,s2) 从字符串s中把所有字符串s1替换成字符串s2后的结果。
其它字符函数还有COLLATE,COMPRESS,INDEXC,LEFT,LENGTH,REVERSE,RIGHT,SCAN ,TRANSLATE,VERIFY,COMPBL,DEQUOTE,INDEXW,QUOTE,SOUNDEX,TRIMN,INDEXW。
四、日期和时间函数常用日期和时间函数有:MDY(m,d,yr) 生成yr年m月d日的SAS日期值YEAR(date) 由SAS日期值date得到年MONTH(date) 由SAS日期值date得到月DAY(date) 由SAS日期值date得到日WEEKDAY(date) 由SAS日期值date得到星期几QTR(date) 由SAS日期值date得到季度值HMS(h,m,s) 由小时h、分钟m、秒s生成SAS时间值DHMS(d,h,m,s) 由SAS日期值d、小时h、分钟m、秒s生成SAS日期时间值DA TEPART(dt) 求SAS日期时间值dt的日期部分INTNX(interval,from,n) 计算从from开始经过n个in间隔后的SAS日期。
其中interval 可以取'YEAR'、'QTR'、'MONTH'、'WEEK'、'DAY'等。
比如,INTNX('MONTH', '16Dec1997'd, 3)结果为1998年3月1日。
注意它总是返回一个周期的开始值。
INTCK(interval,from,to) 计算从日期from到日期to中间经过的interval间隔的个数,其中interval取'MONTH'等。
比如,INTCK('YEAR', '31Dec1996'd, '1Jan1998'd)计算1996年12 月31日到1998年1月1日经过的年间隔的个数,结果得2,尽管这两个日期之间实际只隔1年。
其它日期和时间函数还有DA TE、TODAY、DA TETIME、DATEJUL、JULDA TE、HOUR、MINUTE、SECOND 、TIME、TIMEPART等。
详见《SAS系统-Base SAS软件使用手册》、《SAS系统-SAS/ETS软件使用手册》。
五、分布密度函数、分布函数作为一个统计计算语言,SAS提供了多种概率分布的有关函数。
分布密度、概率、累积分布函数等可以通过几种统一的格式调用,格式为分布函数值= CDF(' 分布', x <, 参数表>);密度值= PDF(' 分布', x <, 参数表>);概率值= PMF(' 分布', x <, 参数表>);对数密度值= LOGPDF(' 分布', x <, 参数表>);对数概率值= LOGPMF(' 分布', x <, 参数表>);CDF计算由'分布'指定的分布的分布函数,PDF计算分布密度函数值,PMF计算离散分布的分布概率,LOGPDF为PDF的自然对数,LOGPMF为PMF的自然对数。
函数在自变量x 处计算,<, 参数表>表示可选的参数表。
分布类型取值可以为: BERNOULLI, BETA, BINOMIAL, CAUCHY, CHISQUARED, EXPONENTIAL, F, GAMMA, GEOMETRIC, HYPERGEOMETRIC, LAPLACE, LOGISTIC, LOGNORMAL, NEGBINOMIAL, NORMAL 或GAUSSIAN, PARETO, POISSON, T, UNIFORM, WALD 或IGAUSS, and WEIBULL。
可以只写前四个字母。
例如,PDF('NORMAL', 1.96)计算标准正态分布在 1.96处的密度值(0.05844),CDF('NORMAL', 1.96)计算标准正态分布在1.96处的分布函数值(0.975)。
PMF对连续型分布即PDF。
除了用上述统一的格式调用外,SAS还单独提供了常用的分布的密度、分布函数。
PROBNORM(x) 标准正态分布函数PROBT(x,df<,nc>) 自由度为df的t分布函数。
可选参数nc为非中心参数。
PROBCHI(x,df<,nc>) 自由度为df的卡方分布函数。
可选参数nc为非中心参数。
PROBF(x,ndf,ddf<,nc>) F(ndf,ddf)分布的分布函数。
可选参数nc为非中心参数。
PROBBNML(p,n,m) 设随机变量Y服从二项分布B(n,p),此函数计算P(Y m)。
POISSON((lambda,n) 参数为lambda的Poisson分布Y n的概率。
PROBNEGB(p,n,m) 参数为(n,p)的负二项分布Y m的概率。
PROBHYPR(N,K,n,x<,r>) 超几何分布的分布函数。
设N个产品中有K个不合格品,抽取n 个样品,其中不合格品数小于等于x的概率为此函数值。
可选参数r是不匀率,缺省为1 ,r代表抽到不合格品的概率是抽到合格品概率的多少倍。
PROBBETA(x,a,b) 参数为(a,b)的Beta分布的分布函数。
PROBGAM(x,a) 参数为a的Gamma分布的分布函数。
PROBMC 计算多组均值的多重比较检验的概率值和临界值。
PROBBNRM(x,y,r) 标准二元正态分布的分布函数,r为相关系数。
六、分位数函数分位数函数是概率分布函数的反函数。
其自变量在0到1之间取值。
分位数函数计算的是分布的左侧分位数。
SAS提供了六种常见连续型分布的分位数函数。
PROBIT(p) 标准正态分布左侧p分位数。
结果在-5到5之间。
TINV(p, df <,nc>) 自由度为df的t分布的左侧p分位数。
可选参数nc为非中心参数。
CINV(p,df<,nc>) 自由度为df的卡方分布的左侧p分位数。
可选参数nc为非中心参数。
FINV(p,ndf,ddf<,nc>) F(ndf,ddf)分布的左侧p分位数。
可选参数nc为非中心参数。
GAMINV(p,a) 参数为a的伽马分布的左侧p分位数。
BETAINV(p,a,b) 参数为(a,b)的贝塔分布的左侧p分位数。
七、随机数函数SAS可以用来进行随机模拟。
它提供了常见分布的伪随机数生成函数。
1.均匀分布随机数有两个均匀分布随机数函数:UNIFORM(seed),seed必须是常数,为0,或5位、6位、7位的奇数。
RANUNI(seed),seed为小于2**31-1的任意常数。
在同一个数据步中对同一个随机数函数的多次调用将得到不同的结果,但不同数据步中从同一种子出发将得到相同的随机数序列。
随机数种子如果取0或者负数则种子采用系统日期时间。
2.正态分布随机数有两种,NORMAL(seed),seed为0,或5位、6位、7位的奇数。
RANNOR(seed),seed为任意数值常数。
3.指数分布随机数RANEXP(seed),seed为任意数值,产生参数为1的指数分布的随机数。
参数为lambda的指数分布可以用RANEXP(seed)/lambda得到。
另外若Y=alpha-beta*LOG(RANEXP(seed)),则Y为位置参数为alpha,尺度参数为beta的极值分布。
若Y=FLOOR(-RANEXP(seed)/LOG(p)),那么Y是具有参数p的几何分布变量。