Skip to content

Commit 18dbaee

Browse files
committedMar 14, 2013
移除 SETNX 中带有竞争条件的加锁算法,感谢王文尧的提醒:
http://redis.readthedocs.org/en/latest/string/setnx.html#comment-828789724
1 parent 8d5c32e commit 18dbaee

File tree

1 file changed

+28
-43
lines changed

1 file changed

+28
-43
lines changed
 

‎string/setnx.rst

Lines changed: 28 additions & 43 deletions
Original file line numberDiff line numberDiff line change
@@ -35,46 +35,31 @@ SETNX
3535
redis> GET job # 没有被覆盖
3636
"programmer"
3737

38-
模式:将 SETNX 用于加锁(locking)
39-
----------------------------------------
40-
41-
.. warning:: 已经证实这个加锁算法带有竞争条件,在特定情况下会造成错误,请不要使用这个加锁算法,具体请参考 `http://huangz.iteye.com/blog/1381538 <http://huangz.iteye.com/blog/1381538>`_ 。
42-
43-
`SETNX`_ 可以用作加锁原语(locking primitive)。比如说,要对关键字(key) ``foo`` 加锁,客户端可以尝试以下方式:
44-
45-
``SETNX lock.foo <current Unix time + lock timeout + 1>``
46-
47-
如果 `SETNX`_ 返回 ``1`` ,说明客户端已经获得了锁, ``key`` 设置的unix时间则指定了锁失效的时间。之后客户端可以通过 ``DEL lock.foo`` 来释放锁。
48-
49-
如果 `SETNX`_ 返回 ``0`` ,说明 ``key`` 已经被其他客户端上锁了。如果锁是非阻塞(non blocking lock)的,我们可以选择返回调用,或者进入一个重试循环,直到成功获得锁或重试超时(timeout)。
50-
51-
**处理死锁(deadlock)**
52-
53-
上面的锁算法有一个问题:如果因为客户端失败、崩溃或其他原因导致没有办法释放锁的话,怎么办?
54-
55-
这种状况可以通过检测发现——因为上锁的 ``key`` 保存的是 unix 时间戳,假如 ``key`` 值的时间戳小于当前的时间戳,表示锁已经不再有效。
56-
57-
但是,当有多个客户端同时检测一个锁是否过期并尝试释放它的时候,我们不能简单粗暴地删除死锁的 ``key`` ,再用 `SETNX`_ 上锁,因为这时竞争条件(race condition)已经形成了:
58-
59-
* C1 和 C2 读取 ``lock.foo`` 并检查时间戳, `SETNX`_ 都返回 ``0`` ,因为它已经被 C3 锁上了,但 C3 在上锁之后就崩溃(crashed)了。
60-
* C1 向 ``lock.foo`` 发送 :ref:`DEL` 命令。
61-
* C1 向 ``lock.foo`` 发送 `SETNX`_ 并成功。
62-
* C2 向 ``lock.foo`` 发送 :ref:`del` 命令。
63-
* C2 向 ``lock.foo`` 发送 `SETNX`_ 并成功。
64-
* 出错:因为竞争条件的关系,C1 和 C2 两个都获得了锁。
65-
66-
幸好,以下算法可以避免以上问题。来看看我们聪明的 C4 客户端怎么办:
67-
68-
* C4 向 ``lock.foo`` 发送 `SETNX`_ 命令。
69-
* 因为崩溃掉的 C3 还锁着 ``lock.foo`` ,所以 Redis 向 C4 返回 ``0`` 。
70-
* C4 向 ``lock.foo`` 发送 :ref:`GET` 命令,查看 ``lock.foo`` 的锁是否过期。如果不,则休眠(sleep)一段时间,并在之后重试。
71-
* 另一方面,如果 ``lock.foo`` 内的 unix 时间戳比当前时间戳老,C4 执行以下命令:
72-
73-
``GETSET lock.foo <current Unix timestamp + lock timeout + 1>``
74-
75-
* 因为 :ref:`GETSET` 的作用,C4 可以检查看 :ref:`GETSET` 的返回值,确定 ``lock.foo`` 之前储存的旧值仍是那个过期时间戳,如果是的话,那么 C4 获得锁。
76-
* 如果其他客户端,比如 C5,比 C4 更快地执行了 :ref:`GETSET` 操作并获得锁,那么 C4 的 :ref:`GETSET` 操作返回的就是一个未过期的时间戳(C5 设置的时间戳)。C4 只好从第一步开始重试。
77-
78-
| 注意,即便 C4 的 :ref:`GETSET` 操作对 ``key`` 进行了修改,这对未来也没什么影响。
79-
80-
.. warning:: 为了让这个加锁算法更健壮,获得锁的客户端应该常常检查过期时间以免锁因诸如 :ref:`DEL` 等命令的执行而被意外解开,因为客户端失败的情况非常复杂,不仅仅是崩溃这么简单,还可能是客户端因为某些操作被阻塞了相当长时间,紧接着 :ref:`DEL` 命令被尝试执行(但这时锁却在另外的客户端手上)。
38+
..
39+
模式:将 SETNX 用于加锁(locking)
40+
----------------------------------------
41+
.. warning:: 已经证实这个加锁算法带有竞争条件,在特定情况下会造成错误,请不要使用这个加锁算法,具体请参考 `http://huangz.iteye.com/blog/1381538 <http://huangz.iteye.com/blog/1381538>`_ 。
42+
`SETNX`_ 可以用作加锁原语(locking primitive)。比如说,要对关键字(key) ``foo`` 加锁,客户端可以尝试以下方式:
43+
``SETNX lock.foo <current Unix time + lock timeout + 1>``
44+
如果 `SETNX`_ 返回 ``1`` ,说明客户端已经获得了锁, ``key`` 设置的unix时间则指定了锁失效的时间。之后客户端可以通过 ``DEL lock.foo`` 来释放锁。
45+
如果 `SETNX`_ 返回 ``0`` ,说明 ``key`` 已经被其他客户端上锁了。如果锁是非阻塞(non blocking lock)的,我们可以选择返回调用,或者进入一个重试循环,直到成功获得锁或重试超时(timeout)。
46+
**处理死锁(deadlock)**
47+
上面的锁算法有一个问题:如果因为客户端失败、崩溃或其他原因导致没有办法释放锁的话,怎么办?
48+
这种状况可以通过检测发现——因为上锁的 ``key`` 保存的是 unix 时间戳,假如 ``key`` 值的时间戳小于当前的时间戳,表示锁已经不再有效。
49+
但是,当有多个客户端同时检测一个锁是否过期并尝试释放它的时候,我们不能简单粗暴地删除死锁的 ``key`` ,再用 `SETNX`_ 上锁,因为这时竞争条件(race condition)已经形成了:
50+
* C1 和 C2 读取 ``lock.foo`` 并检查时间戳, `SETNX`_ 都返回 ``0`` ,因为它已经被 C3 锁上了,但 C3 在上锁之后就崩溃(crashed)了。
51+
* C1 向 ``lock.foo`` 发送 :ref:`DEL` 命令。
52+
* C1 向 ``lock.foo`` 发送 `SETNX`_ 并成功。
53+
* C2 向 ``lock.foo`` 发送 :ref:`del` 命令。
54+
* C2 向 ``lock.foo`` 发送 `SETNX`_ 并成功。
55+
* 出错:因为竞争条件的关系,C1 和 C2 两个都获得了锁。
56+
幸好,以下算法可以避免以上问题。来看看我们聪明的 C4 客户端怎么办:
57+
* C4 向 ``lock.foo`` 发送 `SETNX`_ 命令。
58+
* 因为崩溃掉的 C3 还锁着 ``lock.foo`` ,所以 Redis 向 C4 返回 ``0`` 。
59+
* C4 向 ``lock.foo`` 发送 :ref:`GET` 命令,查看 ``lock.foo`` 的锁是否过期。如果不,则休眠(sleep)一段时间,并在之后重试。
60+
* 另一方面,如果 ``lock.foo`` 内的 unix 时间戳比当前时间戳老,C4 执行以下命令:
61+
``GETSET lock.foo <current Unix timestamp + lock timeout + 1>``
62+
* 因为 :ref:`GETSET` 的作用,C4 可以检查看 :ref:`GETSET` 的返回值,确定 ``lock.foo`` 之前储存的旧值仍是那个过期时间戳,如果是的话,那么 C4 获得锁。
63+
* 如果其他客户端,比如 C5,比 C4 更快地执行了 :ref:`GETSET` 操作并获得锁,那么 C4 的 :ref:`GETSET` 操作返回的就是一个未过期的时间戳(C5 设置的时间戳)。C4 只好从第一步开始重试。
64+
| 注意,即便 C4 的 :ref:`GETSET` 操作对 ``key`` 进行了修改,这对未来也没什么影响。
65+
.. warning:: 为了让这个加锁算法更健壮,获得锁的客户端应该常常检查过期时间以免锁因诸如 :ref:`DEL` 等命令的执行而被意外解开,因为客户端失败的情况非常复杂,不仅仅是崩溃这么简单,还可能是客户端因为某些操作被阻塞了相当长时间,紧接着 :ref:`DEL` 命令被尝试执行(但这时锁却在另外的客户端手上)。

0 commit comments

Comments
 (0)
Please sign in to comment.