|
Redisson杂谈
379 一.Redisson 简介Redisson 是一个基于 Netty 通信框架的高性能 Redis 客户端, 实现了分布式和可扩展的 Java 数据结构,提供很多分布式相关操作服务以及大量便利的工具方法,让开发者可以把精力放在开发业务,避免重复造轮子。二.Redisson 优点1.通信框架基于 Netty,使用多路复用。吞吐量高。2.兼容支持 Redis 集群模式,Reids 哨兵模式等,天然适配分布式服务。3.提供多种分布式对象的封装,如:Bloom Filter,Object Bucket,Bitset,AtomicLong, 和 HyperLogLog 等。4.提供分布式锁实现包括:RedissonFairLock 公平锁,RedissonLock 非公平锁,RedissonRedLock 红锁(基于红锁算法, 当集群中大多数( N/2 + 1 )加锁成功了,则认为加锁成功,目前已被弃用,Redisson 官方不再建议使用)。三.RedissonLock 分布式锁相关部分源码解析RedissonLock 作为分布式锁,实现了可重入锁。阻塞锁,非阻塞锁。并且 Redisson 存在看门狗机制,可以对未手动设置超时时间的锁实现自动续期。1.Trylock 加锁加锁代码逻辑/**** @param waitTime 获取锁的最大等待时间,默认 -1,* @param leaseTime 锁的过期时间,默认 -1* @param unit* @param threadId* @return*/private RFuture tryAcquireOnceAsync(long waitTime, long leaseTime, TimeUnit unit, long threadId) { RFuture acquiredFuture; if (leaseTime > 0) { //若手动设置了锁的过期时间,则加锁时以当前传入过期时间为准 //执行Lua脚本,加锁 acquiredFuture = tryLockInnerAsync(waitTime, leaseTime, unit, threadId,RedisCommands.EVAL_NULL_BOOLEAN); } else { //若未手动设置,则默认过期时间等于配置的lockWatchdogTimeout,lockWatchdogTimeout默认为30s。 //然后执行Lua脚本,加锁 acquiredFuture = tryLockInnerAsync(waitTime, internalLockLeaseTime, TimeUnit.MILLISECONDS, threadId, RedisCommands.EVAL_NULL_BOOLEAN); } CompletionStage f = acquiredFuture.thenApply(acquired -> { //lock acquired //若锁成功获取到 if (acquired) { if (leaseTime > 0) { internalLockLeaseTime = unit.toMillis(leaseTime); } else { //若未手动设置过期时间,则执行看门狗任务,自动续期 scheduleExpirationRenewal(threadId); } } return acquired; }); return new CompletableFutureWrapper(f);}加锁 Lua 脚本如下:if (redis.call('exists', KEYS[1]) == 0) then " + "redis.call('hincrby', KEYS[1], ARGV[2], 1); " + "redis.call('pexpire', KEYS[1], ARGV[1]); " + "return nil; " + "end; " + "if (redis.call('hexists', KEYS[1], ARGV[2]) == 1) then " + "redis.call('hincrby', KEYS[1], ARGV[2], 1); " + "redis.call('pexpire', KEYS[1], ARGV[1]); " + "return nil; " + "end; " + "return redis.call('pttl', KEYS[1]);其中 KEYS[1] 是锁逻辑名称,ARGV[1] 是 key 的过期时间,ARGV[2]是锁的线程级别名称( uuid + 线程id ,uuid 是每个 Redisson 客户端创建时唯一生成的)。由此可看出,锁利用 Hash 结构实现,其中 Hash 的 key 是锁的逻辑名称,field 是锁的线程级别名称,value 是锁的重入次数。加锁 Lua 脚本的含义:先判断当前逻辑锁名称的 key 是否存在,若不存在,在 Hash 结构中设置这个锁,锁重入次数加 1,然后给 key 设置一个过期时间,最后返回 null。若存在,并且已经被当前线程持有,就锁可重入次数加 1,并且重新设置 key 的过期时间,最后返回 null,若当前锁被其他线程持有,返回 key 剩余过期时间。2.Lock 阻塞锁Lock 阻塞锁与 Trylock 底层调用代码基本一致。多了一个等待锁被其他线程释放后,重新尝试加锁的过程。代码如下:private void lock(long leaseTime, TimeUnit unit, boolean interruptibly) throws InterruptedException { long threadId = Thread.currentThread().getId(); Long ttl = tryAcquire(-1, leaseTime, unit, threadId); // lock acquired if (ttl == null) { return; } //订阅释放锁消息 CompletableFuture future = subscribe(threadId); pubSub.timeout(future); RedissonLockEntry entry; if (interruptibly) { entry = commandExecutor.getInterrupted(future); } else { entry = commandExecutor.get(future); } try { while (true) { //重新尝试取锁 ttl = tryAcquire(-1, leaseTime, unit, threadId); // lock acquired if (ttl == null) { break; } // waiting for message, if (ttl >= 0) { try { //当锁仍然被其他线程占有时,调用 //java.util.concurrent.Semaphore#tryAcquire方法进行信号量阻塞, //当线程阻塞等待时间超过最大超时时间(ttl即锁的key的剩余存活时间) //或者 监听到锁释放消息后,信号量被释放后,线程不再阻塞 entry.getLatch().tryAcquire(ttl, TimeUnit.MILLISECONDS); } catch (InterruptedException e) { if (interruptibly) { throw e; } entry.getLatch().tryAcquire(ttl, TimeUnit.MILLISECONDS); } } else { if (interruptibly) { //尝试从信号量获取一个许可 entry.getLatch().acquire(); } else { entry.getLatch().acquireUninterruptibly(); } } } } finally { //取消订阅锁释放消息 unsubscribe(entry, threadId);}大致流程如下:1.先获取锁,若获取锁成功,直接返回。2.若获取失败,订阅释放锁消息。3.进入 while 循环,重新尝试获取锁。若获取锁成功,则跳出循环,并不再订阅释放锁消息。4.若重新获取锁失败,进行信号量阻塞,直到锁被其他占有线程释放(监听锁释放消息的监听器中,有唤醒信号量的逻辑)或者到达阻塞超时时间,然后继续这个 while 循环。3.Unlock 解锁代码如下public RFuture unlockAsync(long threadId) { //执行解锁lua脚本 RFuture future = unlockInnerAsync(threadId); CompletionStage f = future.handle((opStatus, e) -> { //取消看门狗任务 cancelExpirationRenewal(threadId); if (e != null) { throw new CompletionException(e); } if (opStatus == null) { IllegalMonitorStateException cause = new IllegalMonitorStateException ("attempt to unlock lock, not locked by current thread by node id: " + id + " thread-id: " + threadId); throw new CompletionException(cause); } return null; }); return new CompletableFutureWrapper(f);}1.其中解锁 Lua 脚本如下:if (redis.call('hexists', KEYS[1], ARGV[3]) == 0) then " + "return nil;" + "end; " + "local counter = redis.call('hincrby', KEYS[1], ARGV[3], -1); " + "if (counter > 0) then " + "redis.call('pexpire', KEYS[1], ARGV[2]); " + "return 0; " + "else " + "redis.call('del', KEYS[1]); " + "redis.call('publish', KEYS[2], ARGV[1]); " + "return 1; " + "end; " + "return nil;其中 KEYS[1] 为锁的逻辑名称,KEYS[2] 为通道名称,ARGV[1] 为 0, ARGV[2] 为锁的过期时间,默认 30s,ARGV[3] 为锁的线程级别名称。解锁 Lua 脚本含义:解锁时,先判断当前锁是否被当前线程持有,若不是,则返回 null。若是,锁的可重入次数 减1。然后继续判断锁的可重入次数是否大于 0,若大于 0,继续给这个锁 key 续期 30s,并且最后返回 0。若不大于 0,删除这个锁的 key,并向指定通道发布这个解锁消息,并且返回 1。2.如果这个锁有看门狗任务在定时续期,当解锁成功时会取消这个定时续期任务。4.看门狗机制当某个锁内的任务的执行时间不可预估时,可能执行时间很长,也可能很短。此时若直接设置一个固定的锁过期时间,可能会导致任务执行时间远远大于锁的过期时间,导致任务还未执行完成,但是锁已经过期了。那其他线程又可以获取到锁,然后执行该任务了,最终导致线程安全问题。为应对这种情况,定期给锁续期的看门狗机制出现了。代码://真正看门狗续期任务private void renewExpiration() { ExpirationEntry ee = EXPIRATION_RENEWAL_MAP.get(getEntryName()); if (ee == null) { return; } //创建一个延时任务,底层实现是netty时间轮。当每过了lockWatchdogTimeout/3的时间,执行该任务 Timeout task = commandExecutor.getConnectionManager().newTimeout(new TimerTask() { @Override public void run(Timeout timeout) throws Exception { ExpirationEntry ent = EXPIRATION_RENEWAL_MAP.get(getEntryName()); if (ent == null) { return; } Long threadId = ent.getFirstThreadId(); //若当前锁已经被当前线程释放,则锁不再续期 if (threadId == null) { return; } //调用Lua脚本,判断当前锁是否被当前线程占有,若是则返回true, //并且重新设置key的过期时间,默认30s CompletionStage future = renewExpirationAsync(threadId); future.whenComplete((res, e) -> { if (e != null) { log.error("Can't update lock " + getRawName() + " expiration", e); EXPIRATION_RENEWAL_MAP.remove(getEntryName()); return; } //当锁仍然被当前线程占有,说明业务代码还在执行,则递归调用续期任务 if (res) { // reschedule itself log.info("续期任务执行"+ "threadId:" +threadId); renewExpiration(); } else { //否则移除该续期任务,直接在EXPIRATION_RENEWAL_MAP移除ExpirationEntry cancelExpirationRenewal(null); } }); } }, internalLockLeaseTime / 3, TimeUnit.MILLISECONDS); ee.setTimeout(task);}当没有显式指定锁过期时间时候,就默认 key 过期时间 30s,然后定时任务每 10 秒( lockWatchdogTimeout/3 )进行一次调用,执行锁续期动作,若这个线程还持有这个锁,就对这个线程持有的锁进行续期操作(通过 pexpire 续期 key 30s),若途中持有锁的线程 手动被 unlock 或者机器宕机才会取消这个任务。否则会一直续期。四.总结Redisson 作为一个 Redis 客户端,基于 Redis、Lua 和 Netty 建立起了一套完善的分布式解决方案,比如分布式锁的实现,分布式对象的操作等。本文主要简单讲述了在 Redisson 中分布式锁的实现。其实在 Redisson 中还有很多值得深挖的点。比如:Redisson 中使用了大量 Netty 的特性。大家有兴趣的话,可以仔细研究一下。五.参考文章https://github.com/redisson/redisson/wikihttps://cloud.tencent.com/developer/article/1500854
|
|