sql server中死锁排查的全过程分享

前言

记得以前客户在使用软件时，有偶发出现死锁问题，因为发生的时间不确定，不好做问题的重现，当时解决问题有点棘手了。

死锁的四个必要条件：

互斥条件(mutual exclusion)：资源不能被共享，只能由一个进程使用。
请求与保持条件(hold and wait)：已经得到资源的进程可以再次申请新的资源。
非剥夺条件(no pre-emption)：已经分配的资源不能从相应的进程中被强制地剥夺。
循环等待条件(circular wait)：系统中若干进程组成环路，该环路中每个进程都在等待相邻进程正占用的资源。

现总结下查看死锁的常用二种方式：

第一种是图形化监听：

sqlserver –>工具–> sql server profiler 登录后在跟踪属性中选择如下图：

监听到的死锁图形如下图

这里的描述大致是：有二个进程一个进程id是96，另一个id是348. 系统自动kill 掉了进程id:96,保留了进程id:348 的事务commit。

上面死锁是由于批量更新出现pag范围锁，双方进程在同一分区索引资源上。id96，348都请求想获取更新锁(u)，各占排它锁(x)不释放，直到锁超时。

第二种是使用日志跟踪（errorlog）

以全局方式打开指定的跟踪标记

dbcc traceon(1222,-1)

dbcc traceon(1204,-1)

使用 exec master..xp_readerrorlog 查看日志。由于记录的死锁信息太多，贴出几个重点说下（红色加粗表示）

deadlock encountered .... printing deadlock information
wait-for graph
null
node:1 
page: 7:1:6229275 cleancnt:2 mode:ix flags: 0x3
grant list 3:
owner:0x00000004e99b7880 mode: ix flg:0x40 ref:1 life:02000000 spid:219 ecid:0 xactlockinfo: 0x0000000575c7e970
spid: 219 ecid: 0 statement type: update line #: 84
input buf: language event: exec proc_pub_stockdataimport
requested by: 
restype:lockowner stype:'or'xdes:0x0000000c7a905d30 mode: u spid:64 batchid:0 ecid:59 taskproxy:(0x0000000e440aafe0) value:0x8d160240 cost:(0/0)
null

node:2 
page: 7:1:5692366 cleancnt:2 mode:u flags: 0x3
grant list 3:
owner:0x0000000d12099b80 mode: u flg:0x40 ref:0 life:00000001 spid:64 ecid:0 xactlockinfo: 0x000000136b4758f0
spid: 64 ecid: 0 statement type: update line #: 108
input buf: rpc event: proc [database id = 7 object id = 907150277]

——– node:1 部分显示的几个关键信息：

page 7:1:6229275 （所在数据库id 7， 1分区， 6229275行数）

mode: ix 锁的模式意向排它锁

spid: 219 进程id

event: exec proc_pub_stockdataimport 执行的存储过程名

——-node:2 部分显示的几个关键信息

page 7:1:5692366 （所在数据库id 7， 1分区，5692366行数）

mode:u 锁的模式更新锁

rpc event: proc 远程调用

spid: 64 进程id

victim resource owner:
restype:lockowner stype:'or'xdes:0x0000000c7a905d30 mode: u spid:64 batchid:0 ecid:59 taskproxy:(0x0000000e440aafe0) value:0x8d160240 cost:(0/0)
deadlock-list
deadlock victim=process956f4c8
process-list
process id=process956f4c8 taskpriority=0 logused=0 waitresource=page: 7:1:6229275 waittime=2034 ownerid=2988267079 transactionname=update 
lasttranstarted=2018-04-19t13:54:00.360 xdes=0xc7a905d30 lockmode=u schedulerid=24 kpid=1308 status=suspended spid=64 sbid=0 ecid=59 priority=0 trancount=0 
lastbatchstarted=2018-04-19t13:53:58.033 lastbatchcompleted=2018-04-19t13:53:58.033 clientapp=.net sqlclient data provider hostname=vmserver76 hostpid=16328 
isolationlevel=read committed (2) xactid=2988267079 currentdb=7 locktimeout=4294967295 clientoption1=671088672 clientoption2=128056
executionstack
frame procname=test.dbo.proc_cnofstock line=108 stmtstart=9068 stmtend=9336 sqlhandle=0x03000700c503123601ba25019ca800000100000000000000
update dbo.pub_stock
set updatetime=getdate()
from pub_stock a
join pub_platfromstocktemp b on a.guid=b.stockguid

从上面的信息能看到kill 掉的是进程id是process956f4c8，

进程spid=64

lockmode=u 获取更新锁

isolationlevel=read committed

executionstack 执行的堆信息：

存储名 procname=test.dbo.proc_cnofstock

语句 update dbo.pub_stock set updatetime=getdate() ..

clientapp 发起事件的来源

最后总结避免死锁的解决方法

按同一顺序访问对象。

优化索引,避免全表扫描,减少锁的申请数目.

避免事务中的用户交互。

使用基于行版本控制的隔离级别。

将事务默认隔离级别的已提交读改成快照

set transaction isolation level snapshot

使用nolock去掉共享锁,但死锁发生在u锁或x锁上，则nolock不起作用

升级锁颗粒度(页锁，表锁), 以阻塞还代替死锁

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，如果有疑问大家可以留言交流，谢谢大家对www.887551.com的支持。

sql server中死锁排查的全过程分享

相关推荐