SQLServer Execpt和not in 性能区别

主要讲 except 和 not in 的性能上的区别。

复制代码代码如下:

create table tb1(id int)

create table tb2(id int)

begin tran

declare @i int = 500

while @i > 0

begin

insert into dbo.tb1

values ( @i — v – int

)

set @i = @i -1

end

commit我测试的时候tb1 是1000，tb2 是500

复制代码代码如下:

dbcc freesystemcache (‘all’,’default’);

set statistics io on

set statistics time on

select * from tb1 except select * from tb2;

select * from tb1 where id not in(select id from tb2);–得不到任何值

set statistics io off

set statistics time off

执行计划：

复制代码代码如下:

select * from tb1 except select * from tb2;

|–merge join(right anti semi join, merge:([master1].[dbo].[tb2].[id])=([master1].[dbo].[tb1].[id]), residual:([master1].[dbo].[tb1].[id] = [master1].[dbo].[tb2].[id]))

|–sort(distinct order by:([master1].[dbo].[tb2].[id] asc))

| |–table scan(object:([master1].[dbo].[tb2]))

|–sort(distinct order by:([master1].[dbo].[tb1].[id] asc))

|–table scan(object:([master1].[dbo].[tb1]))

复制代码代码如下:

select * from tb1 where id not in(select id from tb2);–得不到任何值

|–hash match(right anti semi join, hash:([master1].[dbo].[tb2].[id])=([master1].[dbo].[tb1].[id]), residual:([master1].[dbo].[tb1].[id]=[master1].[dbo].[tb2].[id]))

|–table scan(object:([master1].[dbo].[tb2]))

|–nested loops(left anti semi join)

|–nested loops(left anti semi join, where:([master1].[dbo].[tb1].[id] is null))

| |–table scan(object:([master1].[dbo].[tb1]))

| |–top(top expression:((1)))

| |–table scan(object:([master1].[dbo].[tb2]))

|–row count spool

|–table scan(object:([master1].[dbo].[tb2]), where:([master1].[dbo].[tb2].[id] is null))

sql server 执行时间:

cpu 时间 = 0 毫秒，占用时间 = 0 毫秒。

(500 行受影响)

表 ‘tb1’。扫描计数 1，逻辑读取 2 次，物理读取 0 次，预读 0 次，lob 逻辑读取 0 次，lob 物理读取 0 次，lob 预读 0 次。

表 ‘tb2’。扫描计数 1，逻辑读取 1 次，物理读取 0 次，预读 0 次，lob 逻辑读取 0 次，lob 物理读取 0 次，lob 预读 0 次。

(6 行受影响)

(1 行受影响)

sql server 执行时间:

cpu 时间 = 0 毫秒，占用时间 = 528 毫秒。

(500 行受影响)

表 ‘worktable’。扫描计数 0，逻辑读取 0 次，物理读取 0 次，预读 0 次，lob 逻辑读取 0 次，lob 物理读取 0 次，lob 预读 0 次。

表 ‘tb2’。扫描计数 3，逻辑读取 1002 次，物理读取 0 次，预读 0 次，lob 逻辑读取 0 次，lob 物理读取 0 次，lob 预读 0 次。

表 ‘tb1’。扫描计数 1，逻辑读取 2 次，物理读取 0 次，预读 0 次，lob 逻辑读取 0 次，lob 物理读取 0 次，lob 预读 0 次。

(10 行受影响)

(1 行受影响)

sql server 执行时间:

cpu 时间 = 16 毫秒，占用时间 = 498 毫秒。

sql server 执行时间:

cpu 时间 = 0 毫秒，占用时间 = 0 毫秒。

结论：通过较多数据和较少数据的测试，在较少数据的情况下 not in 比 except 性能好，但是在较多数据情况下 execpt 比 not in 出色。

看执行计划可以得知如何在 tb1 和tb2 上建立索引,那么except 的执行计划开可以得到优化。

如果大家有兴趣可以看看 not exists 的执行计划。建议：

大家不要迷信测试结果，因为所有的性能都是和执行计划密切相关的。而执行计划和统计数据又密不可分。

所以过度的迷信测试结果，可能会对生产库造成性能的影响达不到预期的性能效果。

SQLServer Execpt和not in 性能区别

相关推荐