Oracle 分析函数
- 格式:pdf
- 大小:58.12 KB
- 文档页数:4
ORACLE_分析函数大全Oracle分析函数是一种高级SQL函数,它可以在查询中实现一系列复杂的分析操作。
这些函数可以帮助我们在数据库中执行各种数据分析和报表生成任务。
本文将介绍Oracle数据库中的一些常用分析函数。
1.ROW_NUMBER函数:该函数为查询结果中的每一行分配一个唯一的数字。
可以用它对结果进行排序或分组。
例如,可以使用ROW_NUMBER函数在结果集中为每个员工计算唯一的编号。
2.RANK和DENSE_RANK函数:这两个函数用于计算结果集中每个行的排名。
RANK函数返回相同值的行具有相同的排名,并且下一个排名值将被跳过。
DENSE_RANK函数类似,但是下一个排名值不会被跳过。
G和LEAD函数:LAG函数返回结果集中指定列的前一个(上一个)行的值,而LEAD函数返回后一个(下一个)行的值。
这些函数通常用于计算增长率或发现趋势。
4.FIRST和LAST函数:这两个函数用于返回结果集中分组的第一个和最后一个行的值。
可以与GROUPBY子句一起使用。
5.CUME_DIST函数:该函数用于计算给定值的累积分布。
它返回值的累积分布在结果集中的位置(百分比)。
6.PERCENT_RANK函数:该函数用于计算结果集中每个行的百分位数排名。
它返回值的百分位数排名(0到1之间的小数)。
7. NTILE函数:该函数用于将结果集分成指定数量的桶(Bucket),并为每个行分配一个桶号。
通常用于将数据分组为更小的块。
8.LISTAGG函数:该函数将指定列的值连接成一个字符串,并使用指定的分隔符分隔每个值。
可以用它将多个值合并在一起形成一个字符串。
9.AVG、SUM、COUNT和MAX/MIN函数:这些是常见的聚合函数,可以在分析函数中使用。
它们用于计算结果集中的平均值、总和、计数和最大/最小值。
以上只是Oracle数据库中的一些常用分析函数。
还有其他一些分析函数,如PERCENTILE_CONT、PERCENTILE_DISC等可以用于更高级的分析计算。
Oracle分析函数Oracle分析函数实际上操作对象是查询出的数据集,也就是说不需二次查询数据库,实际上就是oracle实现了一些我们自身需要编码实现的统计功能,对于简化开发工作量有很大的帮助,特别在开发第三方报表软件时是非常有帮助的。
Oracle从8.1.6开始提供分析函数。
一、基本语法oracle分析函数的语法:function_name(arg1,arg2,...)over(<partition-clause> <order-by-clause ><windowing clause>)说明:1.partition-clause 数据记录集分组2.order-by-clause 数据记录集排序3.windowing clause 功能非常强大、比较复杂,定义分析函数在操作行的集合。
有三种开窗方式: range、row、specifying。
二、常用分析函数1. avg(distinct|all expression) 计算组内平均值,distinct 可去除组内重复数据select deptno,empno,sal,avg(sal) over (partition by deptno) avg_sal from t;DEPTNO EMPNO SAL AVG_SAL---------- ---------- ---------- ----------10 7782 2450 2916.666677839 5000 2916.666677934 1300 2916.6666720 7566 2975 21757902 3000 21757876 1100 21757369 800 21757788 3000 217530 7521 1250 1566.666677844 1500 1566.666677499 1600 1566.666677900 950 1566.666677698 2850 1566.666677654 1250 1566.666672.count(<distinct><*><expression>) 对组内数据进行计数3.rank() 和dense_rank()dense_rank()根据 order by 子句表达式的值,从查询返回的每一行,计算和其他行的相对位置,序号从 1 开始,有重复值时序号不跳号。
ORACLE中的ROW_NUMBEROVER分析函数的用法ROW_NUMBER(OVER(是ORACLE数据库中的一个分析函数,用来为结果集中的每一行分配一个唯一的序号。
ROW_NUMBER(OVER(的语法是:ROW_NUMBER( OVER ( [ PARTITION BY expr1 [, expr2, ...] ]ORDER BY clause )其中,PARTITIONBY子句可选,用来指定分区依据的列或表达式;ORDERBY子句用来指定排序的列或表达式。
ROW_NUMBER(OVER(常用在查询结果需要进行分页或者进行排序后获取前几行的场景中。
以下是ROW_NUMBER(OVER(的用法示例:示例1:查询员工表中每个部门的员工数,并按照员工数降序排序。
SELECT department_id, count(*) as employee_count,ROW_NUMBER( OVER (ORDER BY count(*) DESC) as rankFROM employeesGROUP BY department_idORDER BY count(*) DESC;在这个示例中,ROW_NUMBER(OVER(函数根据部门中的员工数进行降序排序,并为每个部门分配一个唯一的序号。
示例2:查询员工表中每个部门的员工数,并按照员工数降序排序,并且只返回前三名。
SELECT department_id, count(*) as employee_count,ROW_NUMBER( OVER (ORDER BY count(*) DESC) as rankFROM employeesGROUP BY department_idWHERE rank <= 3ORDER BY count(*) DESC;在这个示例中,ROW_NUMBER(OVER(函数的结果用于限制查询结果只返回前三名。
示例3:查询员工表中每个部门的员工信息,并按照部门和薪水进行排序。
Oracle分析函数row_number()over(partitionbyorderby)1、格式row_number() over(partition by 列名1 order by 列名2 desc)2、解析表⽰根据列名1 分组,然后在分组内部根据列名2 排序,⽽此函数计算的值就表⽰每组内部排序后的顺序编号,可以⽤于去重复值与rownum的区别在于:使⽤rownum进⾏排序的时候是先对结果集加⼊伪列rownum然后再进⾏排序,⽽此函数在包含排序从句后是先排序再计算⾏号码.3、实例--分析函数SELECT USER_NAME,SCHOOL,DEPART,ROW_NUMBER() OVER(PARTITION BY USER_NAME ORDER BY SCHOOL, DEPART DESC)FROM USER_M;结果--分析函数SELECT *FROM (SELECT USER_NAME,SCHOOL,DEPART,ROW_NUMBER() OVER(PARTITION BY USER_NAME ORDER BY SCHOOL, DEPART DESC) RNFROM USER_M)WHERE RN = 1;结果--结合分页SELECT *FROM (SELECT ER_NAME,A.SCHOOL,A.DEPART,ROW_NUMBER() OVER(PARTITION BY SCHOOL ORDER BY USER_NAME, DEPART DESC) RNFROM (SELECT * FROM USER_M) AWHERE ROWNUM <= 10)WHERE RN >= 1;结果。
oracle常⽤的分析函数常⽤的分析函数如下所列:row_number() over(partition by ... order by ...)rank() over(partition by ... order by ...)dense_rank() over(partition by ... order by ...)count() over(partition by ... order by ...)max() over(partition by ... order by ...)min() over(partition by ... order by ...)sum() over(partition by ... order by ...)avg() over(partition by ... order by ...)first_value() over(partition by ... order by ...)last_value() over(partition by ... order by ...)lag() over(partition by ... order by ...)lead() over(partition by ... order by ...)⼀、Oracle分析函数简介:在⽇常的⽣产环境中,我们接触得⽐较多的是OLTP系统(即Online Transaction Process),这些系统的特点是具备实时要求,或者⾄少说对响应的时间多长有⼀定的要求;其次这些系统的业务逻辑⼀般⽐较复杂,可能需要经过多次的运算。
⽐如我们经常接触到的电⼦商城。
在这些系统之外,还有⼀种称之为OLAP的系统(即Online Aanalyse Process),这些系统⼀般⽤于系统决策使⽤。
通常和数据仓库、数据分析、数据挖掘等概念联系在⼀起。
这些系统的特点是数据量⼤,对实时响应的要求不⾼或者根本不关注这⽅⾯的要求,以查询、统计操作为主。
Oracle分析函数-排序排列(rank、dense_rank、row_number、ntile)(1)rank函数返回⼀个唯⼀的值,除⾮遇到相同的数据时,此时所有相同数据的排名是⼀样的,同时会在最后⼀条相同记录和下⼀条不同记录的排名之间空出排名。
(2)dense_rank函数返回⼀个唯⼀的值,除⾮当碰到相同数据时,此时所有相同数据的排名都是⼀样的。
(3)row_number函数返回⼀个唯⼀的值,当碰到相同数据时,排名按照记录集中记录的顺序依次递增。
(4)ntile是要把查询得到的结果平均分为⼏组,如果不平均则分给第⼀组。
例如:create table s_score( s_id number(6),score number(4,2));insert into s_score values(001,98);insert into s_score values(002,66.5);insert into s_score values(003,99);insert into s_score values(004,98);insert into s_score values(005,98);insert into s_score values(006,80);selects_id,score,rank() over(order by score desc) rank --按照成绩排名,纯排名,dense_rank() over(order by score desc) dense_rank --按照成绩排名,相同成绩排名⼀致,row_number() over(order by score desc) row_number --按照成绩依次排名,ntile(3) over (order by score desc) group_s --按照分数划分成绩梯队from s_score;排名/排序的时候,有时候,我们会想到利⽤伪列row_num,利⽤row_num确实可以解决某些场景下的问题(但是相对也⽐较复杂),⽽且有些场景下的问题却很难解决。
Oracle之分析函数⼀、分析函数 1、分析函数 分析函数是Oracle专门⽤于解决复杂报表统计需求的功能强⼤的函数,它可以在数据中进⾏分组然后计算基于组的某种统计值,并且每⼀组的每⼀⾏都可以返回⼀个统计值。
2、分析函数和聚合函数的区别 普通的聚合函数⽤group by分组,每个分组返回⼀个统计值,⽽分析函数采⽤partition by分组,并且每组每⾏都可以返回⼀个统计值。
3、分析函数的形式 分析函数带有⼀个开窗函数over(),包含分析⼦句。
分析⼦句⼜由下⾯三部分组成: partition by :分组⼦句,表⽰分析函数的计算范围,不同的组互不相⼲; ORDER BY:排序⼦句,表⽰分组后,组内的排序⽅式; ROWS/RANGE:窗⼝⼦句,是在分组(PARTITION BY)后,组内的⼦分组(也称窗⼝),此时分析函数的计算范围窗⼝,⽽不是PARTITON。
窗⼝有两种,ROWS和RANGE; 使⽤形式如下:OVER(PARTITION BY xxx PORDER BY yyy ROWS BETWEEN rowStart AND rowEnd) 注:窗⼝⼦句在这⾥我只说rows⽅式的窗⼝,range⽅式和滑动窗⼝也不提。
⼆、OVER() 函数 1、sql 查询语句的 order by 和 OVER() 函数中的 ORDER BY 的执⾏顺序 分析函数是在整个sql查询结束后(sql语句中的order by的执⾏⽐较特殊)再进⾏的操作, 也就是说sql语句中的order by也会影响分析函数的执⾏结果: [1] 两者⼀致:如果sql语句中的order by满⾜分析函数分析时要求的排序,那么sql语句中的排序将先执⾏,分析函数在分析时就不必再排序; [2] 两者不⼀致:如果sql语句中的order by不满⾜分析函数分析时要求的排序,那么sql语句中的排序将最后在分析函数分析结束后执⾏排序。
2、分析函数中的分组/排序/窗⼝分析函数包含三个分析⼦句:分组(partition by),排序(order by),窗⼝(rows/range)窗⼝就是分析函数分析时要处理的数据范围,就拿sum来说,它是sum窗⼝中的记录⽽不是整个分组中的记录,因此我们在想得到某个栏位的累计值时,我们需要把窗⼝指定到该分组中的第⼀⾏数据到当前⾏, 如果你指定该窗⼝从该分组中的第⼀⾏到最后⼀⾏,那么该组中的每⼀个sum值都会⼀样,即整个组的总和。
Oracle分析函数sumover介绍其中,sum over函数是一种常用的分析函数,它用于对指定列进行求和计算,并返回每一行的累计总和。
以下是sum over函数的基本语法:```SUM(expression) OVER (PARTITION BY col1 [, col2, ...] ORDER BY col3 [, col4, ...] [ROWS <frame specification>])```其中,expression是要进行求和的列或表达式,col1、col2等是用于分组的列,col3、col4等是用于排序的列,frame specification是用于定义计算总和的范围。
sum over函数的作用可以通过一个简单的示例来说明。
假设我们有一个包含销售订单的表,其中包含订单号、产品名称和销售量等列。
我们想要计算每个产品的累计销售量,可以使用sum over函数来实现:```sqlSELECT order_id, product_name, sales_quantity,SUM(sales_quantity) OVER (PARTITION BY product_name ORDER BYorder_id) AS cumulative_salesFROM sales_orders;```在上述示例中,我们使用了PARTITION BY子句来按照产品名称进行分组,然后使用ORDER BY子句按照订单号进行排序。
通过在SUM函数中使用over子句,我们可以计算每个产品的累计销售量,并将结果作为新的列返回。
除了基本的用法之外,sum over函数还可以与其他函数组合使用,进一步扩展其功能。
例如,我们可以使用sum over函数来计算百分比:```sqlSELECT order_id, product_name, sales_quantity,sales_quantity / SUM(sales_quantity) OVER (PARTITION BY product_name) * 100 AS percentageFROM sales_orders;```在上述示例中,我们使用SUM函数计算每个产品的总销售量,并将结果作为分母,然后将每个销售数量除以总销售量并乘以100,得到每个产品的销售百分比。
Oracle分析函数Over()阅读⽬录⼀、Over()分析函数1、rank()/dense_rank over(partition by ... order by ...)2、min()/max() over(partition by ...)3、lead()/lag() over(partition by ... order by ...) 取前⾯/后⾯第n⾏记录4、FIRST_VALUE/LAST_VALUE() OVER(PARTITION BY ...) 取⾸尾记录5、ROW_NUMBER() OVER(PARTITION BY.. ORDER BY ..) 排序(应⽤:分页)6、sum/avg/count() over(partition by ..)7、 rows/range between … preceding and … following 上下范围内求值rows between … preceding and … following⼆、其他1、NULLS FIRST/LAST 将空值字段记录放到最前或最后显⽰2、NTILE(n)3、keep(dense_rank first/last)回到顶部⼀、Over()分析函数说明:聚合函数(如sum()、max()等)可以计算基于组的某种聚合值,但是聚合函数对于某个组只能返回⼀⾏记录。
若想对于某组返回多⾏记录,则需要使⽤分析函数。
1、rank()/dense_rank over(partition by ... order by ...)说明:over()在什么条件之上; partition by 按哪个字段划分组; order by 按哪个字段排序;注意: (1)使⽤rank()/dense_rank() 时,必须要带order by否则⾮法 (2)rank()/dense_rank()分级的区别: rank(): 跳跃排序,如果有两个第⼀级时,接下来就是第三级。
Oracle数据库分析函数⽤法⽬录1、什么是窗⼝函数?2、窗⼝函数——开窗3、⼀些分析函数的使⽤⽅法4、OVER()参数——分组函数5、OVER()参数——排序函数1、什么是窗⼝函数?窗⼝函数也属于分析函数。
Oracle从8.1.6开始提供窗⼝函数,窗⼝函数⽤于计算基于组的某种聚合值,窗⼝函数指定了分析函数⼯作的数据窗⼝⼤⼩,这个数据窗⼝⼤⼩可能会随着⾏的变化⽽变化。
与聚合函数的不同之处是:对于每个组返回多⾏,⽽聚合函数对于每个组只返回⼀⾏基本语法: ‹分析函数› over (partition by ‹⽤于分组的列名› order by ‹⽤于排序的列名›)。
语法中的‹分析函数›主要由序列函数(rank、dense_rank和row_number等组成)与聚合函数(sum、avg、count、max和min等)作为窗⼝函数组成。
从窗⼝函数组成上看,它是group by 和 order by的功能组合,group by分组汇总后改变了表的⾏数,⼀⾏只有⼀个类别,⽽partiition by则不会减少原表中的⾏数。
恰如窗⼝函数的组成,它同时具有分组和排序的功能,且不减少原表的⾏数。
OVER 关键字表⽰把函数当成窗⼝函数⽽不是聚合函数。
SQL 标准允许将所有聚合函数⽤做窗⼝函数,使⽤ OVER 关键字来区分这两种⽤法。
2、窗⼝函数——开窗OVER 关键字后的括号中经常添加选项⽤以改变进⾏聚合运算的窗⼝范围。
如果 OVER 关键字后的括号中的选项为空,则窗⼝函数会对结果集中的所有⾏进⾏聚合运算。
分析函数 over(partition by 列名 order by 列名 rows between 开始位置 and 结束位置)为什么叫开窗呢?因为在over()括号中的,partition() 函数可以将查询到的数据进⾏单独开⼀个窗⼝处理。
譬如,查询每个班级的学⽣的排名情况,查询每个国家的历年⼈⼝等,诸如此类,都是在查询到的每⼀个班级、每⼀个国家中都开⼀个窗⼝,单独去执⾏命令。
oracle函数大全(分析函数,聚合函数,转换函数,日期型函数,字符型函数,数值型函数,其他函数)oracle函数大全 (1)oracle分析函数--SQL*PLUS环境 (1)oracle 10g函数大全--聚合函数 (19)oracle 10g函数大全--转换函数 (23)oracle 10g函数大全--日期型函数 (40)oracle 10g函数大全--字符型函数 (45)oracle 10g函数大全--数值型函数 (55)oracle 10g函数大全--其他函数 (58)oracle分析函数--SQL*PLUS环境一、总体介绍1.1.分析函数如何工作语法 FUNCTION_NAME(<参数>,…) OVER (<PARTITION BY 表达式,…> <ORDER BY 表达式 <ASC DESC> <NULLS FIRST NULLS LAST>> <WINDOWING子句>) PARTITION子句ORDER BY子句 WINDOWING子句缺省时相当于RANGE UNBOUNDED PRECEDING1. 值域窗(RANGE WINDOW)RANGE N PRECEDING 仅对数值或日期类型有效,选定窗为排序后当前行之前,某列(即排序列)值大于/小于(当前行该列值–/+ N)的所有行,因此与ORDER BY子句有关系。
2. 行窗(ROW WINDOW)ROWS N PRECEDING 选定窗为当前行及之前N行。
还可以加上BETWEEN AND 形式,例如RANGE BETWEEN m PRECEDING AND n FOLLOWING 函数 AVG(<distinct all> eXPr)一组或选定窗中表达式的平均值 CORR(expr, expr) 即COVAR_POP(exp1,exp2) / (STDDEV_POP(expr1) * STDDEV_POP(expr2)),两个表达式的互相关,-1(反相关) ~1(正相关),0表示不相关COUNT(<distinct> <*> <expr>) 计数COVAR_POP(expr, expr) 总体协方差COVAR_SAMP(expr, expr) 样本协方差CUME_DIST 累积分布,即行在组中的相对位置,返回0 ~ 1DENSE_RANK 行的相对排序(与ORDER BY搭配),相同的值具有一样的序数(NULL计为相同),并不留空序数FIRST_VALUE 一个组的第一个值LAG(expr, <offset>, <default>) 访问之前的行,OFFSET是缺省为1 的正数,表示相对行数,DEFAULT是当超出选定窗范围时的返回值(如第一行不存在之前行)LAST_VALUE 一个组的最后一个值LEAD(expr, <offset>, <default>) 访问之后的行,OFFSET是缺省为1 的正数,表示相对行数,DEFAULT是当超出选定窗范围时的返回值(如最后行不存在之前行)MAX(expr) 最大值MIN(expr) 最小值NTILE(expr) 按表达式的值和行在组中的位置编号,如表达式为4,则组分4份,分别为1 ~ 4的值,而不能等分则多出的部分在值最小的那组PERCENT_RANK 类似CUME_DIST,1/(行的序数 - 1)RANK 相对序数,答应并列,并空出随后序号RATIO_TO_REPORT(expr) 表达式值 / SUM(表达式值)ROW_NUMBER 排序的组中行的偏移STDDEV(expr) 标准差STDDEV_POP(expr) 总体标准差STDDEV_SAMP(expr) 样本标准差SUM(expr) 合计VAR_POP(expr) 总体方差VAR_SAMP(expr) 样本方差VARIANCE(expr) 方差REGR_ xxxx(expr, expr) 线性回归函数REGR_SLOPE:返回斜率,等于COVAR_POP(expr1, expr2) / VAR_POP(expr2) REGR_INTERCEPT:返回回归线的y截距,等于AVG(expr1) - REGR_SLOPE(expr1, expr2) * AVG(expr2)REGR_COUNT:返回用于填充回归线的非空数字对的数目REGR_R2:返回回归线的决定系数,计算式为:If VAR_POP(expr2) = 0 then return NULLIf VAR_POP(expr1) = 0 and VAR_POP(expr2) != 0 then return 1If VAR_POP(expr1) > 0 and VAR_POP(expr2 != 0 thenreturn POWER(CORR(expr1,expr),2)REGR_AVGX:计算回归线的自变量(expr2)的平均值,去掉了空对(expr1, expr2)后,等于AVG(expr2)REGR_AVGY:计算回归线的应变量(expr1)的平均值,去掉了空对(expr1, expr2)后,等于AVG(expr1)REGR_SXX:返回值等于REGR_COUNT(expr1, expr2) * VAR_POP(expr2)REGR_SYY:返回值等于REGR_COUNT(expr1, expr2) * VAR_POP(expr1)REGR_SXY: 返回值等于REGR_COUNT(expr1, expr2) * COVAR_POP(expr1, expr2) 首先:创建表及接入测试数据。
oracle over partition by 原理-回复Oracle中的over partition by是一种强大的分析函数,用于在查询结果集中执行聚合计算和排名操作。
通过对分析函数的理解和正确使用,可以轻松地进行比较、排序和分组操作。
本文将详细介绍over partition by 的原理,以帮助读者深入理解该功能的工作原理和使用方法。
1. 什么是分析函数?在介绍over partition by之前,我们先来了解一下什么是分析函数。
分析函数是一种在查询结果集中执行聚合计算和排名操作的功能。
它们可以根据指定的窗口条件,在数据集中的不同行之间执行计算,而不修改实际的查询结果。
常用的分析函数包括SUM、AVG、COUNT、ROW_NUMBER 等。
2. over partition by的作用over partition by是一种用于对查询结果进行分组操作的子句。
它允许我们通过指定一个或多个列进行分组,并在每个分组内执行聚合计算。
使用over partition by可以轻松地实现按组计算、排序和排名的需求,而无需编写复杂的子查询或连接操作。
3. over partition by的语法over partition by的语法如下:<聚合函数> over (partition by <列1>, <列2>, ...)其中,<聚合函数>可以是SUM、AVG、COUNT、ROW_NUMBER等分析函数,<列1>、<列2>等表示需要分组的列。
4. over partition by的原理over partition by的原理实际上是通过分析函数+窗口函数实现的。
当我们在查询中使用over partition by时,实际上是对查询结果集应用了一个窗口,将其分成多个分区,每个分区都有一个特定的窗口范围。
分析函数会在每个分区内依次计算,并将计算结果返回给查询结果。
Oracle analysis function(Oracle分析函数)ORACLE advanced function application- grouping function1, ROLLUPTotal, subtotal -- statistical standards and the corresponding dimension of the packet- decrease from right to left: group by rollup (a, B, c): A, B, C; a, B (C; a (b total), C subtotal total);--1)CALL VPD_PKG.SET_CONTEXT_COMPID ('-1');SELECT, A.VPD_COMPID, TO_CHAR (A.TTIME,'MM'), COUNT (*)FROM XTBILL2011 AGROUP, BY, ROLLUP (A.VPD_COMPID, TO_CHAR (A.TTIME,'MM'));--2) partial rollup groupingFor after grouping, sum of a.typeidSELECT, A.DWDH, A.YEAR, A.TYPEID, COUNT (*)FROM XTYWBILL AGROUP, BY, A.DWDH, A.YEAR, ROLLUP (A.TYPEID);2, CUBE--rollup can only "right to left", such as the need for a full range of dimensions for statistics, you need to use the cube function--1)SELECT, A.VPD_COMPID, TO_CHAR (A.TTIME,'MM'), COUNT (*)FROM XTBILL2011 AGROUP, BY, CUBE (A.VPD_COMPID, TO_CHAR (A.TTIME,'MM'));--2) cube: can summaries and subtotals do not need to remove some.SELECT, A.VPD_COMPID, TO_CHAR (A.TTIME,'MM'), COUNT (*)FROM XTBILL2011 AGROUP, BY, A.VPD_COMPID, CUBE (TO_CHAR (A.TTIME,'MM'));3, GROUPING SETS- Description: focus only on some dimensions of the single packet, subtotal--group, by, grouping, sets (a, B, c) are equivalent to group,by, a, group, by, B, group, by, C- these three groups of union all results--1)SELECT, A.VPD_COMPID, TO_CHAR (A.TTIME,'MM'), COUNT (*) FROM XTBILL2011 AGROUP, BY, GROUPING, SETS (A.VPD_COMPID, TO_CHAR(A.TTIME,'MM'));--2) partial grouping sets grouping- sum based on group by, only pay attention to the subtotal SELECT, A.DWDH, A.YEAR, A.TYPEID, COUNT (*)FROM XTYWBILL AGROUP, BY, A.DWDH, GROUPING, SETS (A.YEAR, A.TYPEID); SELECT, A.VPD_COMPID, TO_CHAR (A.TTIME,'MM'), COUNT (*) FROM XTBILL2011 AGROUP, BY, A.VPD_COMPID, GROUPING, SETS (TO_CHAR(A.TTIME,'MM'));4, CUBE, ROLLUP as the parameters of GROUPING SETS--grouping sets operations are grouped only on single columns without providing aggregate functionality, and if grouping sets is required, aggregate functionality is provided,- then you can use rollup or cube as the parameters of the grouping sets, such as the following statement to provide aggregate functionality:SELECT, A.VPD_COMPID, TO_CHAR (A.TTIME,'MM'), AS, TTIME, COUNT (*)FROM XTBILL2011 AGROUP, BY, GROUPING, SETS (ROLLUP (A.VPD_COMPID), ROLLUP (TO_CHAR (A.TTIME,'MM'));This statement yields two total rows, because rollup or cube is the parameter of grouping sets, which is equivalent to eachUnion all for --rollup and cube operations. So the above statement is equivalent to:SELECT, A.VPD_COMPID, NULL, AS, TTIME, COUNT (*)FROM XTBILL2011 AGROUP BY ROLLUP (A.VPD_COMPID)UNION ALLSELECT, NULL, TO_CHAR (A.TTIME,'MM'), COUNT (*)FROM XTBILL2011 AGROUP, BY, ROLLUP (TO_CHAR (A.TTIME,'MM'));5, combination column grouping brief introduction:- grouping methods: rollup (a, B, c), <=>group, by, a, B, C, group, by, a, B, group, by, null- grouping methods: rollup (a, (B, c)), <=>group, by, a, B, C, group, by, a, group, by, null- grouping mode: rollup (a, B),汇总(C)< = >组,B、C组,B;;组,C组由;组;C组为空;——分组方式:汇总(A,B),(C)分组集< = >组,B、C组,C;C 组的;——分组方式:汇总(一),汇总(B),汇总(C)<= >组由;组B;C组;组的,B组,C;;组B、C;A,B,C组;组由空6、分组函数——为了区别哪些是小计,分组函数派上用场了!选择a.vpd_compid,to_char(a.ttime,'mm '),计数(*),分组(a.vpd_compid),分组(to_char(a.ttime,'mm ')),解码(分组(a.vpd_compid),1,“所有单位',a.vpd_compid)vpd_compid,解码(to_char(a.ttime,'mm '),1,“所有月份',to_char(a.ttime,'mm '))时间从xtbill2011一组汇总(a.vpd_compid,to_char(a.ttime,'mm '));——过滤某些分组结果选择a.vpd_compid,to_char(a.ttime,'mm '),计数(*),分组(a.vpd_compid),分组(to_char(a.ttime,'mm ')),解码(分组(a.vpd_compid),1,“所有单位',a.vpd_compid)vpd_compid,解码(to_char(a.ttime,'mm '),1,“所有月份',to_char(a.ttime,'mm '))时间从xtbill2011一组汇总(a.vpd_compid,to_char(a.ttime,'mm '))具有分组(a.vpd_compid)= 1或分组(to_char(a.ttime,'mm '))= 0;7、grouping_id函数——可用汇总或立方体与grouping_id组合运用,过滤出想要的分组统计信息选择a.vpd_compid,to_char(a.ttime,'mm”),grouping_id (a.vpd_compid,to_char(a.ttime,'mm ')),计数(*)从xtbill2011一集团通过立方体(a.vpd_compid,to_char(a.ttime,'mm '))有grouping_id(a.vpd_compid,to_char(a.ttime,'mm '))= 2;——1,2,3,0——grouping_id(A,B,C)过滤分组结果分组级别位向量grouping_id结果A,B,C 0 0 0 0A,B 0 0 1 10,1,1,3汇总1 1 1 78、group_id函数——判断重复的分组选择a.vpd_compid,to_char(a.ttime,'mm”)为时间,group_id() ID,计数(*)从xtbill2011一通过分组套组(汇总(a.vpd_compid),汇总(to_char(a.ttime,'mm ')))有group_id() = 0;9、实例应用说明:下拉表;创建表T(order_date日期--订购日期order_no号--订购号order_book VARCHAR2(10),--订购书籍order_fee号--订单总金额order_num数);插入T选择to_date('2010-05-01 ','yyyy-mm-dd ')+水平,trunc(dbms_random。
ORALCE函数LAG和LEAD分析函数详解在Oracle数据库中,LAG(和LEAD(是两个非常有用的分析函数,它们用于在查询结果集中访问前一行和后一行的数据。
LAG(函数允许我们在当前行之前的行中访问数据,而LEAD(函数允许我们在当前行之后的行中访问数据。
这两个函数可以在查询语句中作为窗口函数使用,提供了分析和比较结果集中数据的功能。
LAG(函数语法如下:LAG (expr [, offset [, default]]) OVER ( [ PARTITION BY expr ] ORDER BY expr)LEAD(函数语法如下:LEAD (expr [, offset [, default]]) OVER ( [ PARTITION BY expr ] ORDER BY expr)其中,expr是要访问的列或表达式,offset是向前或向后的偏移量(默认为1),default是可选的,表示当无法找到有效的偏移量时返回的默认值。
PARTITION BY和ORDER BY子句是可选的,用于定义分区和排序的方式。
例如,假设我们有一个名为employees的表,其中包含员工的姓名、职位和薪水信息。
我们可以使用LAG(函数来查找每个员工的上一个员工的职位:SELECT employee_name, job_title,LAG(job_title) OVER (ORDER BY employee_name) ASprevious_job_titleFROM employees;这个查询将返回一个结果集,其中包含员工姓名、职位和上一个职位的信息。
如果没有上一个职位,则LAG(函数将返回NULL。
类似地,我们可以使用LEAD(函数来查找每个员工的下一个员工的职位:SELECT employee_name, job_title,LEAD(job_title) OVER (ORDER BY employee_name) ASnext_job_titleFROM employees;这个查询将返回一个结果集,其中包含员工姓名、职位和下一个职位的信息。
Oracle分析函数与分组关键字的用法以下是我以前工作中做报表常用的几个函数,在此分享一下,希望对大家有帮助。
(一)分析函数●row_numberPurposeROW_NUMBER is an analytic function. It assigns a unique number to each row to which it is applied (either each row in the partition or each row returned by the query), in the ordered sequence of rows specified in the order_by_clause, beginning with 1.You cannot use ROW_NUMBER or any other analytic function for expr. That is, you can use other built-in function expressions for expr, but you cannot nest analytic functions.按部门分组后根据工资排序,序号rn特征:连续、无并列select t.*, row_number() over(partitionby t.deptno orderby sal desc) rn from emp t;●rankPurposeRANK calculates the rank of a value in a group of values. Rows with equal values for the ranking criteria receive the same rank. Oracle then adds the number of tied rows to the tied rank to calculate the next rank. Therefore, the ranks may not be consecutive numbers.•As an aggregate function, RANK calculates the rank of a hypothetical row identified by the arguments of the function with respect to a given sort specification. The arguments of the function must all evaluate to constant expressions within each aggregate group, because they identify a single row within each group. The constant argument expressions and the expressions in the ORDER BY clause of the aggregate match by position. Therefore, the number of arguments must be the same and their types must be compatible.As an analytic function, RANK computes the rank of each row returned from a query with respect to the other rows returned by the query, based on the values of the value_exprs in the order_by_clause.按部门分组后根据工资排序,序号rn特征:不连续、有并列select t.*, rank() over(partitionby t.deptno orderby sal desc) rn from emp t;dense_rankPurposeDENSE_RANK computes the rank of a row in an ordered group of rows. The ranks are consecutive integers beginning with 1. The largest rank value is the number of unique values returned by the query. Rank values are not skipped in the event of ties. Rows with equal values for the ranking criteria receive the same rank.As an aggregate function, DENSE_RANK calculates the dense rank of a hypothetical row identified by the arguments of the function with respect to a given sort specification. The arguments of the function must all evaluate to constant expressions within each aggregate group, because they identify a single row within each group. The constant argument expressions and the expressions in the order_by_clause of the aggregate match by position. Therefore, the number of arguments must be the same and types must be compatible.As an analytic function, DENSE_RANK computes the rank of each row returned from a query with respect to the other rows, based on the values of the value_exprs in the order_by_clause.按部门分组后根据工资排序,序号rn特征:连续、有并列select t.*, dense_rank() over(partitionby t.deptno orderby sal desc) rn from emp t;(二)分组函数根据查询结果观察三者的区别,grouping sets用起来更灵活。
ORACLE_分析函数大全1.SUM:计算指定列的总和。
用法:SUM(column) OVER (PARTITION BY expression ORDER BY expression)2.AVG:计算指定列的平均值。
用法:AVG(column) OVER (PARTITION BY expression ORDER BY expression)3.COUNT:计算指定列的记录数。
用法:COUNT(column) OVER (PARTITION BY expression ORDER BY expression)4.MAX:计算指定列的最大值。
用法:MAX(column) OVER (PARTITION BY expression ORDER BY expression)5.MIN:计算指定列的最小值。
用法:MIN(column) OVER (PARTITION BY expression ORDER BY expression)6.FIRST_VALUE:计算指定列的第一个值。
用法:FIRST_VALUE(column) OVER (PARTITION BY expression ORDER BY expression)ST_VALUE:计算指定列的最后一个值。
用法:LAST_VALUE(column) OVER (PARTITION BY expression ORDER BY expression)8.LEAD:返回指定行后的值。
用法:LEAD(column, offset, default) OVER (PARTITION BY expression ORDER BY expression)G:返回指定行前的值。
用法:LAG(column, offset, default) OVER (PARTITION BY expression ORDER BY expression)10.RANK:计算指定列的排名(相同值有相同的排名,相同排名后续排名跳过)。
Oracle分析函数RANK(),ROW_NUMBER(),LAG()等的使⽤⽅法ROW_NUMBER() OVER (PARTITION BY COL1 ORDER BY COL2)表⽰根据COL1分组,在分组内部根据 COL2排序⽽这个值就表⽰每组内部排序后的顺序编号(组内连续的唯⼀的)RANK() 类似,不过RANK 排序的时候跟派名次⼀样,可以并列2个第⼀名之后是第3名LAG 表⽰分组排序后,组内后⾯⼀条记录减前⾯⼀条记录的差,第⼀条可返回 NULLBTW: EXPERT ONE ON ONE 上讲的最详细,还有很多相关特性,⽂档看起来⽐较费劲row_number()和rownum差不多,功能更强⼀点(可以在各个分组内从1开时排序)rank()是跳跃排序,有两个第⼆名时接下来就是第四名(同样是在各个分组内)dense_rank()l是连续排序,有两个第⼆名时仍然跟着第三名。
相⽐之下row_number是没有重复值的lag(arg1,arg2,arg3):arg1是从其他⾏返回的表达式arg2是希望检索的当前⾏分区的偏移量。
是⼀个正的偏移量,时⼀个往回检索以前的⾏的数⽬。
arg3是在arg2表⽰的数⽬超出了分组的范围时返回的值。
SQL> set pagesize 100;SQL> select rownum from emp;ROWNUM----------1234567891011121314已选择14⾏。
已⽤时间: 00: 00: 00.10SQL> select deptno,row_number() over(partition by deptno order by sal) from emp order by deptno;DEPTNO ROW_NUMBER()OVER(PARTITIONBYDEPTNOORDERBYSAL)---------- ---------------------------------------------10 12320 1234530 123456已选择14⾏。
Oracle递归查询与常⽤分析函数 最近学习oracle的⼀些知识,发现⾃⼰sql还是很薄弱,需要继续学习,现在总结⼀下哈。
(1)oracle递归查询 start with ... connect by prior ,⾄于是否向上查询(根节点)还是向下查询(叶节点),主要看prior后⾯跟的字段是否是⽗ID。
向上查询:select * from test_tree_demo start with id=1 connect by prior pid=id 查询结果: 向下查询:select * from test_tree_demo start with id=3 connect by prior id=pid 如果要进⾏过滤,where条件不能放在connect by 后⾯,如下:select * from test_tree_demo where id !=4 start with id=1 connect by prior pid=id (2)分析函数- over( partition by ) 数据库中的数据如下:select * from testemp1 select deptno,ename,sal,sum(sal)over() deptsum from testemp1 如果over中不加任何条件,就相当于sum(sal),显⽰结果如下: ⼀般over都是配合partition by order by ⼀起使⽤,partition by 就是分组的意思。
下⾯看个例⼦:按部门分组,同个部门根据姓名进⾏⼯资累计求和。
select deptno,ename,sal,sum(sal)over(partition by deptno order by ename) deptsum from testemp1,显⽰如下: 其实统计各个部门的薪⽔总和,可以使⽤group by实现,select deptno,sum(sal) deptsum from testemp1 group by deptno,结果如下: 但是,使⽤group by 的时候查询出来的字段必须是分组的字段或者聚合函数。
--每一个值占总数的百分比
SELECT x, y, z,round(z/sum(z) over()*100,2)||'%' propn , sum(z) over() sum FROM t1;
--每一个值占分组的百分比
SELECT x, y, z,round(z/sum(z) over(partition by x)*100,2)||'%' propn , sum(z) over(partition by x) sum FROM t1;
--以x分区,按y排序累计取和
SELECT x, y, z, sum(z) over(partition by x order by y desc) sum FROM t1;
--以x分区,按z降序,每个分区取前两个
select *
from (select x,
y,
z,
s,
dense_rank() over(partition by x order by z desc) r1,
rank() over(partition by x order by z desc) r2,
count(*) over(partition by x order by z desc, y range unbounded preceding) r3 from (SELECT x, y, z, sum(z) over(partition by x) s
FROM t1
order by 4 desc, z desc))
where r3 < 3
order by z desc, x
/*
语法:
function_name(<argument>,<argument>,...)
over(<partition-clause><order-by-clause><windowing-clause>)
函数名(参数)
over关键字( :over关键字用于区分普通聚集函数和分析函数,必选
partition子句:将结果集分区分组,当分区变化时重新计数
ORDER BY子句:数据在分区内是如何存储的,会直接影响一些分析函数
windowing子句:一个定义变化或固定的数据窗口方法,用于分析函数计数
range窗口:根据where条件将行集中到一起,如range 5 preceding,产生一个滑动窗口,在分区内拥有所有当前行以前的5行集合,只能用于数值和日期,order by只能有一列
order by sal range 1000 preceding
row窗口:是物理单元,包括在窗口中的行的物理数
order by row 5 preceding
包含6行,当前行以及前面的5行,“前面”是指order by后的
)
*/
select deptno,
empno,
sum(sal) over(partition by deptno) dept_sum, --部门工资总和
sum(sal) over() all_sum, --全部工资总和
sum(sal) over(partition by deptno order by sal) running_sum, --按工资排序累加
row_number() over(partition by deptno order by sal) dept_seq --部门内工资排名
from emp;
select deptno,
ename,
sal,
--开窗子句,必须有order by,可以通过范围range、与当前行的偏移量来确定开窗sum(sal) over(partition by deptno order by ename rows 2 preceding) sliding_total,
--默认的开窗范围是一个固定范围,从分区第一行到当前行
sum(sal) over(partition by deptno order by ename range unbounded preceding) sliding_total
from emp
order by deptno, ename;
--range开窗子句
select ename,
sal,
hiredate,
hiredate - 100 windowtop,
first_value(ename) over(order by hiredate asc range 100 preceding) ename_prec,
first_value(hiredate) over(order by hiredate asc range 100 preceding) hiredate_prec from emp
order by hiredate asc;
--row开窗
select ename,
sal,
hiredate,
first_value(ename) over(order by hiredate asc rows 5 preceding) ename_prec,
first_value(hiredate) over(order by hiredate asc rows 5 preceding) hiredate_prec
from emp
order by hiredate asc;
--分析函数
--cume_dist:返回一行在组的位置,大于0,小于等于1,1/3,2/3/,3/3,必须order by
--percent_rank:与cume_dist相似,对一组内特定行来说,计算行号时先减1,然后除以n-1,n为组内所有行数,如果排序重复则序号相同
select deptno,
ename,
sal,
cume_dist() over(partition by deptno order by sal),
percent_rank() over(partition by deptno order by sal)
--dense_rank:根据order by子句排序后,计算当前行与其他行的相对位置,从1开始累加,排名有并列
--rank:和dense_rank相似,但rank有跳跃,相同的值序号相同
select deptno,
ename,
sal,
dense_rank() over(partition by deptno order by sal) drank,
rank() over(partition by deptno order by sal) r
from emp t;
--first_value、last_value:返回组中第一个、最后一个值,加了order by开窗和不加差别很大select deptno,
ename,
sal,
first_value(ename) over(partition by deptno order by sal) fname,
last_value(ename) over(partition by deptno order by sal) lname
from emp t;
--row_number:返回一组中的一行的偏移量,产生按特定标准排序的行号
select deptno,
ename,
sal,
row_number() over(partition by deptno order by sal desc) rn
from emp t;
--ntile:将组内分成表达式的散列值,ntile(5),将组内数据平均分成5份,并从1开始编号,如果不能平分,则按递减顺序分配
select deptno,
ename,
sal,
ntile(2) over(partition by deptno order by sal desc) rn
from emp t;
--lag、lead:lag可以访问组中其他行而不用自连接;lead可以访问组中当前行之后的所有行而不用自连接
select deptno,
ename,
sal,
lag(ename,1) over(partition by deptno order by sal desc) la,
lead(ename,1) over(partition by deptno order by sal desc) le
from emp t;
--sum、avg、count、max、min和普通的聚集函数用法相同
--其他
--1、分析函数目前还无法直接在plsql中使用,plsql的sql引擎至今无法理解分析函数,但可以使用动态游标来搞定
--。