SQLServer 优化SQL语句 in 和not in的替代方案

但是用in的sql性能总是比较低的,从sql执行的步骤来分析用in的sql与不用in的sql有以下区别:

sql试图将其转换成多个表的连接,如果转换不成功则先执行in里面的子查询,再查询外层的表记录,如果转换成功则直接采用多个表的连接方式查询。由此可见用in的sql至少多了一个转换的过程。一般的sql都可以转换成功,但对于含有分组统计等方面的sql就不能转换了。 推荐在业务密集的sql当中尽量不采用in操作符

not in 此操作是强列推荐不使用的,因为它不能应用表的索引。推荐用not exists 或(外连接+判断为空)方案代替

  在数据库中有两个表,一个是当前表info(id,pname,remark,impdate,upstate),一个是备份数据表bakinfo(id,pname,remark,impdate,upstate),将当前表数据备份到备份表去,就涉及到not in 和in 操作了:

  首先,添加10万条测试数据


复制代码 代码如下:

create procedure adddata

as

declare @id int

set @id=0

while(@id<100000)

begin

insert into dbo.info(id,pname,remark,impdate,upstate)

values(@id,convert(varchar,@id)+’0′,’abc’,getdate(),0)

set @id=@id+1

end

exec adddata

使用not in 和in操作:


复制代码 代码如下:

set statistics time on

go

–备份数据

insert into bakinfo(id,pname,remark,impdate,upstate)

select id,pname,remark,impdate,upstate from dbo.info

where id not in(select id from dbo.bakinfo)

go

set statistics time off

此操作执行时间:


复制代码 代码如下:

sql server 分析和编译时间:

cpu 时间 = 0 毫秒,占用时间 = 3 毫秒。

sql server 执行时间:

cpu 时间 = 453 毫秒,占用时间 = 43045 毫秒。

(100000 行受影响)

sql server 分析和编译时间:

cpu 时间 = 0 毫秒,占用时间 = 1 毫秒。

–更改当前表状态

update info set upstate=1 where id in(select id from dbo.bakinfo)

  此操作执行时间:


复制代码 代码如下:

sql server 分析和编译时间:

cpu 时间 = 62 毫秒,占用时间 = 79 毫秒。

sql server 执行时间:

cpu 时间 = 188 毫秒,占用时间 = 318 毫秒。

(100000 行受影响)

sql server 分析和编译时间:

cpu 时间 = 0 毫秒,占用时间 = 1 毫秒。

–删除当前表数据

delete from info where upstate=1 and id in(select id from dbo.bakinfo)

  此操作执行时间:


复制代码 代码如下:

sql server 分析和编译时间:

cpu 时间 = 183 毫秒,占用时间 = 183 毫秒。

sql server 执行时间:

cpu 时间 = 187 毫秒,占用时间 = 1506 毫秒。

(100000 行受影响)

sql server 分析和编译时间:

cpu 时间 = 0 毫秒,占用时间 = 1 毫秒。

  使用join连接替代方案:


复制代码 代码如下:

set statistics time on

go

–备份数据

insert into bakinfo(id,pname,remark,impdate,upstate)

select id,pname,remark,impdate,upstate from

(select info.id,info.pname, info.remark, info.impdate,info.upstate, bakinfo.id as bakid

from info left join

bakinfo on info.id = bakinfo.id ) as t

where t.bakid is null and t.upstate=0

go

set statistics time off;

  此操作执行时间:


复制代码 代码如下:

sql server 分析和编译时间:

cpu 时间 = 247 毫秒,占用时间 = 247 毫秒。

sql server 执行时间:

cpu 时间 = 406 毫秒,占用时间 = 475 毫秒。

(100000 行受影响)

sql server 分析和编译时间:

cpu 时间 = 0 毫秒,占用时间 = 1 毫秒。

–更改当前表状态

update info set upstate=1

from info inner join

bakinfo on info.id = bakinfo.id

  此操作执行时间:


复制代码 代码如下:

sql server 分析和编译时间:

cpu 时间 = 4 毫秒,占用时间 = 4 毫秒。

sql server 执行时间:

cpu 时间 = 219 毫秒,占用时间 = 259 毫秒。

(100000 行受影响)

sql server 分析和编译时间:

cpu 时间 = 0 毫秒,占用时间 = 1 毫秒。

–删除当前表数据


复制代码 代码如下:

delete from info

from info inner join

bakinfo on info.id = bakinfo.id

where info.upstate=1

  此操作执行时间:


复制代码 代码如下:

sql server 分析和编译时间:

cpu 时间 = 177 毫秒,占用时间 = 177 毫秒。

sql server 执行时间:

cpu 时间 = 219 毫秒,占用时间 = 550 毫秒。

(100000 行受影响)

sql server 分析和编译时间:

cpu 时间 = 0 毫秒,占用时间 = 1 毫秒。

  可以看出使用join方案比使用not in 和in执行时间要短很多了

(0)
上一篇 2022年3月21日
下一篇 2022年3月21日

相关推荐