@@ -35,46 +35,31 @@ SETNX
35
35
redis> GET job # 没有被覆盖
36
36
"programmer"
37
37
38
- 模式:将 SETNX 用于加锁(locking)
39
- ----------------------------------------
40
-
41
- .. warning :: 已经证实这个加锁算法带有竞争条件,在特定情况下会造成错误,请不要使用这个加锁算法,具体请参考 `http://huangz.iteye.com/blog/1381538 <http://huangz.iteye.com/blog/1381538>`_ 。
42
-
43
- `SETNX `_ 可以用作加锁原语(locking primitive)。比如说,要对关键字(key) ``foo `` 加锁,客户端可以尝试以下方式:
44
-
45
- ``SETNX lock.foo <current Unix time + lock timeout + 1> ``
46
-
47
- 如果 `SETNX `_ 返回 ``1 `` ,说明客户端已经获得了锁, ``key `` 设置的unix时间则指定了锁失效的时间。之后客户端可以通过 ``DEL lock.foo `` 来释放锁。
48
-
49
- 如果 `SETNX `_ 返回 ``0 `` ,说明 ``key `` 已经被其他客户端上锁了。如果锁是非阻塞(non blocking lock)的,我们可以选择返回调用,或者进入一个重试循环,直到成功获得锁或重试超时(timeout)。
50
-
51
- **处理死锁(deadlock) **
52
-
53
- 上面的锁算法有一个问题:如果因为客户端失败、崩溃或其他原因导致没有办法释放锁的话,怎么办?
54
-
55
- 这种状况可以通过检测发现——因为上锁的 ``key `` 保存的是 unix 时间戳,假如 ``key `` 值的时间戳小于当前的时间戳,表示锁已经不再有效。
56
-
57
- 但是,当有多个客户端同时检测一个锁是否过期并尝试释放它的时候,我们不能简单粗暴地删除死锁的 ``key `` ,再用 `SETNX `_ 上锁,因为这时竞争条件(race condition)已经形成了:
58
-
59
- * C1 和 C2 读取 ``lock.foo `` 并检查时间戳, `SETNX `_ 都返回 ``0 `` ,因为它已经被 C3 锁上了,但 C3 在上锁之后就崩溃(crashed)了。
60
- * C1 向 ``lock.foo `` 发送 :ref: `DEL ` 命令。
61
- * C1 向 ``lock.foo `` 发送 `SETNX `_ 并成功。
62
- * C2 向 ``lock.foo `` 发送 :ref: `del ` 命令。
63
- * C2 向 ``lock.foo `` 发送 `SETNX `_ 并成功。
64
- * 出错:因为竞争条件的关系,C1 和 C2 两个都获得了锁。
65
-
66
- 幸好,以下算法可以避免以上问题。来看看我们聪明的 C4 客户端怎么办:
67
-
68
- * C4 向 ``lock.foo `` 发送 `SETNX `_ 命令。
69
- * 因为崩溃掉的 C3 还锁着 ``lock.foo `` ,所以 Redis 向 C4 返回 ``0 `` 。
70
- * C4 向 ``lock.foo `` 发送 :ref: `GET ` 命令,查看 ``lock.foo `` 的锁是否过期。如果不,则休眠(sleep)一段时间,并在之后重试。
71
- * 另一方面,如果 ``lock.foo `` 内的 unix 时间戳比当前时间戳老,C4 执行以下命令:
72
-
73
- ``GETSET lock.foo <current Unix timestamp + lock timeout + 1> ``
74
-
75
- * 因为 :ref: `GETSET ` 的作用,C4 可以检查看 :ref: `GETSET ` 的返回值,确定 ``lock.foo `` 之前储存的旧值仍是那个过期时间戳,如果是的话,那么 C4 获得锁。
76
- * 如果其他客户端,比如 C5,比 C4 更快地执行了 :ref: `GETSET ` 操作并获得锁,那么 C4 的 :ref: `GETSET ` 操作返回的就是一个未过期的时间戳(C5 设置的时间戳)。C4 只好从第一步开始重试。
77
-
78
- | 注意,即便 C4 的 :ref:`GETSET` 操作对 ``key`` 进行了修改,这对未来也没什么影响。
79
-
80
- .. warning :: 为了让这个加锁算法更健壮,获得锁的客户端应该常常检查过期时间以免锁因诸如 :ref:`DEL` 等命令的执行而被意外解开,因为客户端失败的情况非常复杂,不仅仅是崩溃这么简单,还可能是客户端因为某些操作被阻塞了相当长时间,紧接着 :ref:`DEL` 命令被尝试执行(但这时锁却在另外的客户端手上)。
38
+ ..
39
+ 模式:将 SETNX 用于加锁(locking)
40
+ ----------------------------------------
41
+ .. warning:: 已经证实这个加锁算法带有竞争条件,在特定情况下会造成错误,请不要使用这个加锁算法,具体请参考 `http://huangz.iteye.com/blog/1381538 <http://huangz.iteye.com/blog/1381538>`_ 。
42
+ `SETNX`_ 可以用作加锁原语(locking primitive)。比如说,要对关键字(key) ``foo`` 加锁,客户端可以尝试以下方式:
43
+ ``SETNX lock.foo <current Unix time + lock timeout + 1>``
44
+ 如果 `SETNX`_ 返回 ``1`` ,说明客户端已经获得了锁, ``key`` 设置的unix时间则指定了锁失效的时间。之后客户端可以通过 ``DEL lock.foo`` 来释放锁。
45
+ 如果 `SETNX`_ 返回 ``0`` ,说明 ``key`` 已经被其他客户端上锁了。如果锁是非阻塞(non blocking lock)的,我们可以选择返回调用,或者进入一个重试循环,直到成功获得锁或重试超时(timeout)。
46
+ **处理死锁(deadlock)**
47
+ 上面的锁算法有一个问题:如果因为客户端失败、崩溃或其他原因导致没有办法释放锁的话,怎么办?
48
+ 这种状况可以通过检测发现——因为上锁的 ``key`` 保存的是 unix 时间戳,假如 ``key`` 值的时间戳小于当前的时间戳,表示锁已经不再有效。
49
+ 但是,当有多个客户端同时检测一个锁是否过期并尝试释放它的时候,我们不能简单粗暴地删除死锁的 ``key`` ,再用 `SETNX`_ 上锁,因为这时竞争条件(race condition)已经形成了:
50
+ * C1 和 C2 读取 ``lock.foo`` 并检查时间戳, `SETNX`_ 都返回 ``0`` ,因为它已经被 C3 锁上了,但 C3 在上锁之后就崩溃(crashed)了。
51
+ * C1 向 ``lock.foo`` 发送 :ref:`DEL` 命令。
52
+ * C1 向 ``lock.foo`` 发送 `SETNX`_ 并成功。
53
+ * C2 向 ``lock.foo`` 发送 :ref:`del` 命令。
54
+ * C2 向 ``lock.foo`` 发送 `SETNX`_ 并成功。
55
+ * 出错:因为竞争条件的关系,C1 和 C2 两个都获得了锁。
56
+ 幸好,以下算法可以避免以上问题。来看看我们聪明的 C4 客户端怎么办:
57
+ * C4 向 ``lock.foo`` 发送 `SETNX`_ 命令。
58
+ * 因为崩溃掉的 C3 还锁着 ``lock.foo`` ,所以 Redis 向 C4 返回 ``0`` 。
59
+ * C4 向 ``lock.foo`` 发送 :ref:`GET` 命令,查看 ``lock.foo`` 的锁是否过期。如果不,则休眠(sleep)一段时间,并在之后重试。
60
+ * 另一方面,如果 ``lock.foo`` 内的 unix 时间戳比当前时间戳老,C4 执行以下命令:
61
+ ``GETSET lock.foo <current Unix timestamp + lock timeout + 1>``
62
+ * 因为 :ref:`GETSET` 的作用,C4 可以检查看 :ref:`GETSET` 的返回值,确定 ``lock.foo`` 之前储存的旧值仍是那个过期时间戳,如果是的话,那么 C4 获得锁。
63
+ * 如果其他客户端,比如 C5,比 C4 更快地执行了 :ref:`GETSET` 操作并获得锁,那么 C4 的 :ref:`GETSET` 操作返回的就是一个未过期的时间戳(C5 设置的时间戳)。C4 只好从第一步开始重试。
64
+ | 注意,即便 C4 的 :ref:`GETSET` 操作对 ``key`` 进行了修改,这对未来也没什么影响。
65
+ .. warning:: 为了让这个加锁算法更健壮,获得锁的客户端应该常常检查过期时间以免锁因诸如 :ref:`DEL` 等命令的执行而被意外解开,因为客户端失败的情况非常复杂,不仅仅是崩溃这么简单,还可能是客户端因为某些操作被阻塞了相当长时间,紧接着 :ref:`DEL` 命令被尝试执行(但这时锁却在另外的客户端手上)。
0 commit comments