row_number()over(partition by col1 order by col2)表示根据col1分组,在分组内部根据col2排序,而此函数计算的值就表示每组内部排序后的顺序编号(组内连续的唯一的)。 与rownum的区别在于:使用rownum进行排序的时候是先对结果集加入伪劣rownum然后再进行排序,而row_number()在包含排序从句后是先排序再计算行号码。
一、oracle中rownum
用于从查询返回的行的编号,返回的第一行分配的是1,第二行是2,依此类推,这个伪字段可以用于限制查询返回的总行数,而且rownum不能以任何表的名称作为前缀。
1、rownum 对于等于某值的查询条件
如果希望找到学生表中第一条学生的信息,可以使用rownum=1作为条件。但是想找到学生表中第二条学生的信息,使用rownum=2结果查不到数据。因为rownum都是从1开始,但是1以上的自然数在rownum做等于判断是时认为都是false条件,所以无法查到rownum = n(n>1的自然数)。
sql> select rownum,id,name from student where rownum=1; --有记录 sql> select rownum,id,name from student where rownum =2; --无记录
2、rownum对于大于某值的查询条件
如果想找到从第二行记录以后的记录,当使用rownum>2是查不出记录的,可以使用以下的子查询方法来解决。注意子查询中的rownum必须要有别名,否则还是不会查出记录来,这是因为rownum不是某个表的列,如果不起别名的话,无法知道rownum是子查询的列还是主查询的列。
sql>select * from(select rownum no ,id,name from student) where no>2; --有记录 sql> select * from(select rownum,id,name from student)where rownum>2; --无记录
3、rownum对于小于某值的查询条件
如果想找到第三条记录以前的记录,当使用rownum<3是能得到两条记录的。显然rownum对于rownum 1的自然数)的条件认为是成立的,所以可以找到记录。
sql> select rownum,id,name from student where rownum <3; --有记录
4、rownum和排序
oracle中的rownum的是在取数据的时候产生的序号,所以想对指定排序的数据去指定的rowmun行数据就必须注意了。
sql> select rownum ,id,name from student order by name;
rownum id name ---------- ------ --------------------------------------------------- 3 200003 李三 2 200002 王二 1 200001 张一 4 200004 赵四
可以看出,rownum并不是按照name列来生成的序号。是按照记录插入时的顺序给记录排的号,rowid也是顺序分配的。为了解决这个问题,必须使用子查询
sql> select rownum ,id,name from (select * from student order by name);
rownum id name ---------- ------ --------------------------------------------------- 1 200003 李三 2 200002 王二 3 200001 张一 4 200004 赵四
二、oracle中row_number()
1、row_number() over (order by col_1[,col_2 …])
按照col_1[,col_2 …]排序,返回排序后的结果集,并且为每一行返回一个不相同的值。
2、row_number() over (partition by col_n[,col_m …] order by col_1[,col_2 …])
先按照col_n[,col_m …进行分组,再在每个分组中按照col_1[,col_2 …]进行排序(升序),最后返回排好序后的结果集
oracle中row_number()实例
1.使用row_number()函数进行编号,如
select email,customerid, row_number() over(order by psd) as rows from qt_customer
原理:先按psd进行排序,排序完后,给每条数据进行编号。
2.在订单中按价格的升序进行排序,并给每条记录进行排序代码如下:
select did,customerid,totalprice,row_number() over(order by totalprice) as rows from op_order
3、统计每一个客户最近下的订单是第几次下的订单。
with tabs as ( select row_number() over(partition by customerid order by totalprice) as rows,customerid,totalprice, did from op_order )
select max(rows) as '下单次数',customerid from tabs group by customerid
4、在使用over等开窗函数时,over里头的分组及排序的执行晚于“where,group by,order by”的执行。
select row_number() over(partition by customerid order by insdt) as rows, customerid,totalprice, did from op_order where insdt>'2011-07-22'
以上代码是先执行where子句,执行完后,再给每一条记录进行编号。
三、row_number()与rownum的区别
使用rownum进行排序的时候是先对结果集加入伪劣rownum然后再进行排序,而row_number()在包含排序从句后是先排序再计算行号码。
if opportunity doesn’t knock, build a door
rownum,rowid,row_number()及oracle分页查询
1.rownum和rowid都是伪列,但两者的根本是不同的,rownum是根据sql查询出来的结果给每行分配一个逻辑编号,不同的sql也就会导致rownum不同,但是rowid是物理结构上的,在每条记录insert到时,就会有一个唯一的物理记录。rowid可以说是物理存在的,表示记录在表空间中的一个唯一位置id,在db中唯一。只要记录没被搬动过,rowid是不变的。rowid相对于表来说相当于一般列。
rownum常用语分页查询,rowid则常用语去除重复记录。
2.rownum是对结果集加的一个伪列,即先查到结果集之后再加上去的一个列(先有结果集)。简单的说,rownum是对符合条件结果的序列号。总是从1开始排起,所以选出的结果中不能没有1而有其他大于1的值。
也可以理解为rownum是oracle数据库从数据文件或缓冲区中读取数据的顺序。它取得第一条记录则rownum为1,
第2条为2。如果使用>,>=,=,between…and这些条件,因为从缓冲区或数据文件中得到的第一条记录的rownum
为1,则被删除,接着取下条,可是rownum依旧为1,有被删除,便没有了数据。
case1:
sql> select * from emp where rownum between 2 and 5; empno ename job mgr hiredate sal comm deptno ----- ---------- --------- ----- ----------- --------- --------- ------
case2:
sql> select * from emp where rownum<>3; empno ename job mgr hiredate sal comm deptno ----- ---------- --------- ----- ----------- --------- --------- ------ 7369 smith clerk 7902 1980/12/17 800.00 20 7499 allen salesman 7698 1981/2/20 1600.00 300.00 30
case3:
sql> select * from emp where rownum>0; empno ename job mgr hiredate sal comm deptno ----- ---------- --------- ----- ----------- --------- --------- ------ 7369 smith clerk 7902 1980/12/17 800.00 20 7499 allen salesman 7698 1981/2/20 1600.00 300.00 30 7521 ward salesman 7698 1981/2/22 1250.00 500.00 30 7566 jones manager 7839 1981/4/2 2975.00 20 7654 martin salesman 7698 1981/9/28 1250.00 1400.00 30 7698 blake manager 7839 1981/5/1 2850.00 30 7782 clark manager 7839 1981/6/9 2450.00 10 7788 scott analyst 7566 1987/4/19 3000.00 20 7839 king president 1981/11/17 5000.00 10 7844 turner salesman 7698 1981/9/8 1500.00 0.00 30 7876 adams clerk 7788 1987/5/23 1100.00 20 7900 james clerk 7698 1981/12/3 950.00 30 7902 ford analyst 7566 1981/12/3 3000.00 20 7934 miller clerk 7782 1982/1/23 1300.00 10 14 rows selected
case4:
sql> select * from emp where rownum between 1 and 3; empno ename job mgr hiredate sal comm deptno ----- ---------- --------- ----- ----------- --------- --------- ------ 7369 smith clerk 7902 1980/12/17 800.00 20 7499 allen salesman 7698 1981/2/20 1600.00 300.00 30 7521 ward salesman 7698 1981/2/22 1250.00 500.00 30
3.rownum和row_numbe() over:
使用rownum进行排序的时候是先对结果集加入伪列rownum然后再进行排序,而row_number()在包含排序从句后是先排序再计算行号码
case:
order by:
sql> select a.*,rownum from emp a order by a.ename; empno ename job mgr hiredate sal comm deptno rownum ----- ---------- --------- ----- ----------- --------- --------- ------ ---------- 7876 adams clerk 7788 1987/5/23 1100.00 20 11 7499 allen salesman 7698 1981/2/20 1600.00 300.00 30 2 7698 blake manager 7839 1981/5/1 2850.00 30 6 7782 clark manager 7839 1981/6/9 2450.00 10 7 7902 ford analyst 7566 1981/12/3 3000.00 20 13 7900 james clerk 7698 1981/12/3 950.00 30 12 7566 jones manager 7839 1981/4/2 2975.00 20 4 7839 king president 1981/11/17 5000.00 10 9 7654 martin salesman 7698 1981/9/28 1250.00 1400.00 30 5 7934 miller clerk 7782 1982/1/23 1300.00 10 14 7788 scott analyst 7566 1987/4/19 3000.00 20 8 7369 smith clerk 7902 1980/12/17 800.00 20 1 7844 turner salesman 7698 1981/9/8 1500.00 0.00 30 10 7521 ward salesman 7698 1981/2/22 1250.00 500.00 30 3 14 rows selected
row_number() over(order by )
sql> select a.*,row_number() over(order by a.ename) from emp a; empno ename job mgr hiredate sal comm deptno row_number()over(orderbya.enam ----- ---------- --------- ----- ----------- --------- --------- ------ ------------------------------ 7876 adams clerk 7788 1987/5/23 1100.00 20 1 7499 allen salesman 7698 1981/2/20 1600.00 300.00 30 2 7698 blake manager 7839 1981/5/1 2850.00 30 3 7782 clark manager 7839 1981/6/9 2450.00 10 4 7902 ford analyst 7566 1981/12/3 3000.00 20 5 7900 james clerk 7698 1981/12/3 950.00 30 6 7566 jones manager 7839 1981/4/2 2975.00 20 7 7839 king president 1981/11/17 5000.00 10 8 7654 martin salesman 7698 1981/9/28 1250.00 1400.00 30 9 7934 miller clerk 7782 1982/1/23 1300.00 10 10 7788 scott analyst 7566 1987/4/19 3000.00 20 11 7369 smith clerk 7902 1980/12/17 800.00 20 12 7844 turner salesman 7698 1981/9/8 1500.00 0.00 30 13 7521 ward salesman 7698 1981/2/22 1250.00 500.00 30 14 14 rows selected
4.
case1:在最外层控制分页的最小值和最大值
select * from (select a.*, rownum rn from gas_ca.a_card_meter_pay a where a.purch_gas_time between to_date('2015/1/1', 'yyyy/mm/dd') and to_date('2016/1/1', 'yyyy/mm/dd') and a.org_no like '1009%') where rn between 10 and 20;
case2:
select * from (select rownum rn, a.* from gas_ca.a_card_meter_pay a where a.purch_gas_time between to_date('2015/1/1', 'yyyy/mm/dd') and to_date('2016/1/1', 'yyyy/mm/dd') and a.org_no like '1009%' and rownum <= 20) where rn >= 10;
对于case1和case2,绝大多数情况下,case2要比第一个查询效率高得多。
因为在cbo优化模式下,oracle可以将外层的查询条件推到内层查询中,以提高内层查询的执行效率。对于第二份语句,第二层的查询条件where rownum<=40就可以被oracle推入到内层查询中,这样oracle查询的结果一旦查过rownum限制的条件,就终止查询将结果返回。而第一个语句,oracle无法将第三层的条件推到最内层(即使推到最内层也没有意义,因为不知道rn代表什么)。
case3:有order by 的写法(较高效率)
select t1.*, rn from (select rownum rn, t.* from (select * from gas_ca.a_card_meter_pay a where a.purch_gas_time between to_date('2015/1/1', 'yyyy/mm/dd') and to_date('2016/1/1', 'yyyy/mm/dd') and a.org_no like '1009%' order by a.purch_gas_time) t where rownum <= 20) t1 where rn >= 10;
case4:将查询条件放置最外层
select * from (select t.*, rownum rn from (select * from gas_ca.a_card_meter_pay a where a.purch_gas_time between to_date('2015/1/1', 'yyyy/mm/dd') and to_date('2016/1/1', 'yyyy/mm/dd') and a.org_no like '1009%' order by a.purch_gas_time) t) t1 where t1.rn between 10 and 20;
oracle中的rownum排序及row_number()排序的区别
oracle中常用的是通过rownum来分页,下面来讨论下rownum分页的原理,rownum分页排序和row_number()函数分页排序的区别。
菜鸟第一次用rownum容易犯的错:
select * from emp where rownum>=5 and rownum<=10
执行后返回的结果集是空的。因为rownum是oracle预处理字段,默认标序是1,只有记录集已经满足条件后才会进行后续编号。这样你查询emp表时遍历第一条数据时rownum是1,不符合条件,继续遍历到第二条数据rownum仍为1,仍不符合条件,直至遍历完所有数据,都无数据返回。所以正确的写法是:
select * from (select rownum r,emp.* from emp where rownum<=10)e where e.r>=5
来简单解释下,首先此语句中select rownum r,emp.* from emp where rownum<=10被执行后当做一个视图(这里说下什么时候查询是一个视图什么时候叫子查询,在from后面的嵌套查询是视图,在where后的嵌套查询是子查询),这个视图中的数据:包括emp表中rownum从1到10的数据,和一个真实列r列(可理解为此时rownum伪列已插入到视图中被当做真实列),然后e.r表示查询这个视图中列r数字大于5的记录。若你不写e.r而是写rownum>=5依旧没有数据返回,是因为此时再写rownum是查询视图时重新生成伪列rownum了,而未用那个真实列r。就会犯上面的第一个错误。
下面继续说通过rownum分页和row_number()函数的区别。
我们如果想查得通过empno排序后的分页数据,看几条sql:
sql1:
select * from (select rownum rr,emp.* from emp where rownum<=10 order by empno)v where v.rr>=5
sql2:
select * from (select rownum rr,e.* from (select * from emp order by empno)e where rownum<=10)v where v.rr>=5
sql3:
select * from (select row_number() over(order by empno) rr,emp.ename from emp)v where rr between 5 and 10
执行后发现都能返回结果集,但是sql1返回的结果集却不是我们想要的。
将sql1中的子查询提出来看:
select rownum rr,emp.* from emp where rownum<=10 order by empno
这条语句parse的顺序是先执行from语句,再执行where再执行order by。where rownum<=10执行完后会随机取出10条数据,这10条数据的rownum是1到10,再对这10条数据根据进行排序。这样就不是我们想得到的。
sql2,sql3执行后返回的结果都是我们想要的。sql2是现在子查询中排完序再进行rownum的筛选。
总结下,rownum排序和row_number()的区别:使用rownum进行排序的时候是先对结果集加入伪列rownum后再进行排序(如sql1的结果),而row_number()在通过over()里的排序过后再对每列加上一个数字,从以上三条sql可看出,rownum排序用到了起码三层嵌套执行效率上不如row_number().