前言
在一次系統迭代后用戶投訴說無法成功登陸系統,經過測試重現和日志定位,最后發現是由於用戶在ui上進行了某些操作后,觸發了堆棧溢出異常,導致數據庫里的用戶登陸信息表的數據被鎖住,無法釋放。這個表里存放的是用戶的session信息。
雖然后來解決了問題,但是數據庫里這個用戶登錄信息表里被lock住的數據始終無法釋放,這導致用戶永遠無法登陸成功,需要手動跑SQL把鎖去掉才行。
殺掉指定進程
PostgreSQL提供了兩個函數:pg_cancel_backend()和pg_terminate_backend(),這兩個函數的輸入參數是進程PID,假定現在要殺死進程PID為20407的進程,使用方法如下:
select pg_cancel_backend(20407);
--或者執行這個函數也可以:
select pg_terminate_backend(20407);
這兩個函數區別如下:
pg_cancel_backend()
- 只能關閉當前用戶下的后台進程
- 向后台發送SIGINT信號,用於關閉事務,此時session還在,並且事務回滾
pg_terminate_backend()
- 需要superuser權限,可以關閉所有的后台進程
- 向后台發送SIGTERM信號,用於關閉事務,此時session也會被關閉,並且事務回滾
那么如何知道有哪些表、哪些進程被鎖住了?可以用如下SQL查出來:
select * from pg_locks a
join pg_class b on a.relation = b.oid
join pg_stat_activity c on a.pid = c.pid
where a.mode like '%ExclusiveLock%';
這里查的是排它鎖,也可以精確到行排它鎖或者共享鎖之類的。這里有幾個重要的column:a.pid是進程id,b.relname是表名、約束名或者索引名,a.mode是鎖類型。
殺掉指定表指定鎖的進程
select pg_cancel_backend(a.pid) from pg_locks a
join pg_class b on a.relation = b.oid
join pg_stat_activity c on a.pid = c.pid
where b.relname ilike '表名'
and a.mode like '%ExclusiveLock%';
--或者使用更加霸道的pg_terminate_backend():
select pg_terminate_backend(a.pid) from pg_locks a
join pg_class b on a.relation = b.oid
join pg_stat_activity c on a.pid = c.pid
where b.relname ilike '表名'
and a.mode like '%ExclusiveLock%';
另外需要注意的是,pg_terminate_backend()會把session也關閉,此時sessionId會失效,可能會導致系統賬號退出登錄,需要清除掉瀏覽器的緩存cookie(至少我們系統遇到的情況是這樣的)。
