闷骚闷秀▼ 2017▼ redis replication java 代码

M006.Redis-replicator 设计与实现

Redis-replicator 设计与实现，及redis replication协议讲解。

@陈宝仪 / 2017-12-10 / CC-BY-SA-3.0

Redis-replicator的设计动机
Redis-replicator的设计与实现
Redis replication的协议简析
设计可插拔式API以及开发中的取舍
总结
Q&A

在开讲之前，有两个材料可能需要大家提前预习一下，以便更轻松的了解此次分享的内容。

1. Redis-replicator的设计动机

在之前的开发中，经常有如下的需求

Redis数据的跨机房同步
异构数据的迁移；比如Redis到mysql，MQ

1.1 Redis数据的跨机房同步

Redis跨机房同步传统的方式通常采取双写的方式，这样会生产一种非常难以维护的用户代码；稍微好一点的做法是提炼出一个中间层。但也难以保证同时双写成功，因此又需要作复杂的异常处理，并且降低了程序的响应时间。除了双写的方式，还有一种方式是利用Redis自身的replication协议，让一台机器成为另一台机器的slave，用此种方式来同步数据；这种方式的问题是，双机房中必须有一个是master，一个是slave。在切换的过程中，需要作slave提升等处理，变相增加了运维难度。而且一般在集群环境中，用户常常期望两个机房各一个独立集群，而不是两个机房组成一个混合集群（这样出问题切换方便些），并且保持两个独立集群之间数据是同步的。
如下图所示：

1.2 异构数据的迁移；比如Redis到mysql，MQ

上面一段属于同构数据迁移，再来说异构数据迁移，现实需求中，有可能会有异构迁移的情况，比如Redis每日数据量很大，需要把一些数据以文件或者数据库存储的方式落盘（mysql， MQ， SSDB..），每日异地备份等等，如果还是采用双写等方式处理的话，又会有代码扩张，维护困难等上述提过的问题。
如下图所示：

1.3 如何用Redis-replicator来实现需求

在以上的需求中，催生了我开发Redis-replicator的动机。这个工具完美实现了Redis replication协议，并把RDB以及AOF解析成为一个一个的事件供用户消费，并且支持Redis4.0的新特性以及新命令。如果用Redis-replicator来实现上述需求的话，可以不干扰用户态的代码，单独用这个工具实现中间件来进行异构，同构数据同步备份等任务。
如下图所示：

2. Redis-replicator的设计与实现

2.1 Redis-replicator的架构图

那么讲完了动机，我们可以探寻一下Redis-replicator的实现。Redis-replicator的架构如下所示

2.2 Redis-replicator的样例代码

通用的代码如下：

Replicator replicator = new RedisReplicator("redis://127.0.0.1:6379")；
replicator.addRdbListener(new RdbListener.Adaptor() {
    // 解析RDB事件
    @Override
    public void handle(Replicator replicator, KeyValuePair<?> kv) {
        System.out.println(kv)；
    }
})；
replicator.addCommandListener(new CommandListener() {
    // 解析AOF实时命令
    @Override
    public void handle(Replicator replicator, Command command) {
        System.out.println(command)；
    }
})；
replicator.open()；

这里稍微对代码做一下解释，首先是Redis的URI表示redis://127.0.0.1:6379，这种表示通过socket进行在线的实时数据同步，不但支持在线实时同步，而且Redis-replicator也可以进行离线的RDB以及AOF文件的解析，相应的URI修改为redis:///path/to/dump.rdb或redis:///path/to/appendonly.aof，其余的代码保持不变。 RdbListener表示监听RDB事件，CommandListener表示监听AOF事件。所以我们可以仅仅更改URI来做到远程同步和文件解析之间的自由切换。

2.3 Redis-replicator的源码目录结构及源码导读

在对架构和样例代码有一定了解之后，我们来了解一下源码的目录结构和一些关键的class
源码结构如下图所示

上图中cmd包和AOF事件相关，比如在同步完RDB数据之后master写入了一条这样的命令set foo bar，就会产生一条Command并触发CommandListener。(重点类有Command，CommandParser，CommandListener，ReplyParser)

event包包含了RDB事件与AOF事件的基类Event，以及包含两个自定义事件PreFullSyncEvent和PostFullSyncEvent，这两个自定义事件标记了全量数据同步的开始和结束（增量同步不触发这两个标记事件）

io，net，util包与Redis-replicator的网络传输以及内部用数据结构相关，不多做介绍。

rdb包和RDB事件相关，会把RDB的数据流解析成一个一个KeyValuePair并触发RdbListener。同时这个包也包含了Module解析和自定义RDB解析器相关的类。（重点的类有KeyValuePair，Module，ModuleParser，RdbVisitor，RdbParser）

还有根目录下的一些重点类：ReplicatorListener包含用户所有可以注册的监听器，Configuration包含一切可配置的参数，Replicator是实现replication协议的重要接口。

3. Redis replication的协议简析

讲到这里，就再仔细说一下Redis-replication协议，很多同学以为这个协议很复杂，实现起来很困难。但实际上如果仔细了解这个协议的话，即使用Java这种略臃肿的语言，在3000行内也可以实现一个完整的同步协议（Redis-replicator第一版5000行代码）。我鼓励大家也去用不同语言来实现Redis的同步协议，以丰富Redis的工具链。

具体的协议格式是一个非严格（这里的非严格是指AOF的格式有可能不是标准格式，因为有可能在两个AOF命令之间插入\n）的AOF格式；第一个AOF是同步命令的回复，第二个AOF命令很特殊，是一个RESP Bulk String，其内包含了RDB格式。其余的AOF就是master的实时命令。了解AOF格式的话请参照https://redis.io/topics/protocol，关于增量同步还是全量同步返回的格式也有不同如下图所示:

3.1 第一个AOF

第一个AOF是同步命令的回复，在同步之前我们要发送同步命令，比如2.8版本之前我们要发送SYNC， 2.8之后我们要发送PSYNC repl-id repl-offset开启PSYNC同步，repl-id占40字节，不知道repl-id的情况下发送?， repl-offset表示同步的offset，不知道offset的情况下发送-1，回复的话有可能是如下形式：+FULLRESYNC repl-id offset\r\n或者+CONTINUE\r\n或者Redis-4.0引入的PSYNC2回复+CONTINUE repl-id\r\n

3.2 第二个AOF

上面我们说第二个AOF是一个RESP Bulk String；那么其符合$payload\r\nRDB(注意结尾没有\r\n)这样的形式，payload表示要传输的rdb大小，内容的话就是一个完整的RDB文件。关于RDB文件的格式，我做了一个RDB data format wiki供大家详细了解，在此不做赘述。稍微需要注意的是如果redis-server开启了repl-diskless-sync = yes那么这个格式会稍有变化。在https://redis.io/topics/protocol 文档中RESP Bulk String还有一种没有提到的格式用在同步协议中； $EOF:<40 bytes delimiter>\r\nRDB<40 bytes delimiter>，此时的payload变成EOF:<40 bytes delimiter>所以在实现同步协议的时候需要注意。第二点需要注意的是如果master产生的RDB特别巨大的时候，在同步RDB之前会发送连续的\n以此来维持与slave的连接。所以同步格的数据流有可能是这样的:
+FULLRESYNC 8de1787ba490483314a4d30f1c628bc5025eb761 2443808505\r\n\n\n\n\n\n\n$payload\r\nRDB<其他AOF命令>

3.3 其他的AOF

参照https://redis.io/topics/protocol进行解析

3.4 心跳

在RDB传输完之后如果master端没有其他要同步的命令时，master会定时发送PING命令给replicator
在RDB传输完之后replicator要记录传输的字节数当作offset，定时给master发送REPLCONF ACK offset。

4. 设计可插拔式API以及开发中的取舍

4.1 设计可插拔式API

我们从第二节的代码中可以用很简单的方式与Redis master实现同步，这小节我们主要讲Redis-replicator的扩展性，从以下几个方面来详细说明

当Redis-server版本升级到比如4.2，有STREAM相关的新命令时如何扩展
当处理比如超过本机内存的大KV如何扩展
当加载Redis-4.0新特性Module（比如rejson）时如何扩展

先讨论第一点；当升级Redis-server有新的命令而Redis-replicator不支持时，可以使用命令扩展。写一个命令解析器并注册进Redis-replicator中即可handle新的命令；一个详细的例子在CommandExtensionExample

再讨论第二点；由于Redis-replicator默认是把KV完全读到内存再交由用户处理的，当处理比如超过本机内存的大KV时，会引发OOM。一个比较好的方法是以迭代的方式来处理大KV。在Redis-replicator中，可以注册自己的RDB解析器来应对这种情况，一个好消息是此工具已经内置了处理大KV的RDB解析器ValueIterableRdbVisitor ，与此相关的例子在HugeKVSocketExample

再讨论第三点；加载自定义Module时，可以实现自定义的Module parser并注册到Redis-replicator中，实现Module扩展，一个相关的例子在ModuleExtensionExample。

总结设计可插拔式API的重点是要求平等对待内建(built-in)API和外部API。Redis-replicator只提供了一个同步协议的大框架，其内的命令解析，RDB解析，Module解析都是可插拔的，这样可以提供最大的灵活性给用户。

4.2 开发中的取舍

在此小节我要谈三个方面

无绪
兼容
依赖

4.2.1 无绪

最近我读完一本书很有启发，书名叫<软件框架设计的艺术>:

书中提到了一个叫无绪的概念；大意是当你依赖一个库，可以不用深入了解这个库的内部实现，就可直接根据API上手使用，并做出相对可靠的应用程序。对这个概念我深以为然，但是这本书是我写完Redis-replicator之后才读到的，有一些不一致为了兼容性已经不可更改（有兴趣的朋友可以找一找代码存在的问题），但总体上根据Redis-replicator提供的文档以及example和对issue的快速回应以及修改可以让依赖此库风险可控。

4.2.2 兼容

同样还是<软件框架设计的艺术>这本书，提到了一个兼容性问题。书中有一句话：**API就如同恒星，一旦出现，便与我们永恒共存**。大意就是一个API在被用户发现并使用了之后，就尽量不要做不兼容的修改，做出不兼容修改用户升级时会产生运行时错误等等问题，降低用户对一个库的好感度。长此不兼容的修正后，用户极有可能选择放弃这个库。我举一个在Redis-replicator中存在的例子。

用户实现自己的RDB解析器时需要继承RdbVisitor 这个类，这个类如果被设计成接口， Redis每增加一个存储结构，这个接口就要增加一个方法，即使用户没用到这么高版本的Redis也要对实现类进行修改。设计成抽象类的话，每次升级Redis-replicator，不会对用户代码造成影响，仅仅在同时升级了Redis-server的时候才会出现异常。

4.2.3 依赖

开发基础库上选择依赖一定要更加谨慎。因为java的jar hell等原因，在一个稍微复杂的系统中，出现循环依赖，以及依赖同一个包的不同版本这种情况会经常发生。比如在一个工程中经常有多个版本的slf4j-api，netty。在不实际运行的话很难发现问题。第二点就是在设计公共库涉及写日志时，最好不要依赖具体的log实现，要尽量依赖log的API（commons-logging, slf4j-api等）。一个不好的例子是

<dependency>
    <groupId>org.apache.zookeeper</groupId>
    <artifactId>zookeeper</artifactId>
    <version>3.4.11</version>
</dependency>

这个包经常用在zookeeper客户端中比如curator-client，然而这个包依赖了一个很低版本的log4j实现库，导致实际应该依赖log的API变成依赖于log的实现库，如果用户选择的是logback这种实现库来写日志的话，会有一些冲突，需要各种桥接来做work around。在Redis-replicator中，唯一依赖的jar包是commons-logging，尽最大程度保证用户与自己的工程依赖的兼容性。

5. 总结

以上就是我此次分享。限于分享篇幅和分享重点，并没有展现Redis-replicator的全部功能，比如此工具还可以做RDB及AOF文件的拆分与合并，RDB格式转redis的dump格式(和dump命令得到的格式一致)，以及RDB与AOF文件的备份和Redis-4.0混合格式的支持等。最后感谢微信群主@鹏程。欢迎关注并star Redis-replicator。

6. Q&A

Q: 这个后续的开发计划是什么？
A: 后续计划是支持redis-4.2，以及增加failover能力和jdk9支持。
  
  
Q: Redis-replicator性能怎么样？
A: 性能比唯品汇c语言实现的Redis迁移工具略慢，纯解析大概能达到80%左右的性能。
   但是因为这个工具的速度也取决于消费事件的速度，如果消费慢的话，会阻塞Redis-server或者Redis-server给主动断开连接。
  
  
Q: 我提问的问题可能跨过此中间件的本身了，我更关注于场景。对于跨机房的场景,平均数据延迟有多大，
   在多大数据量的情况下如何保证延迟降到最低？在出现网络抖动的情况如何避免数据的丢失？
A: 跨机房平均延迟的话有很多相关性，不仅仅和Redis-replicaor相关，还和网络速度等等因素相关。
   这个工具能尽量做到解析不会影响跨机房同步。再来说出现抖动的情况， 在Redis-server端参数配置合理的情况下，如果出现
   网络抖动，那么Redis-replicator会尽量采取部分同步来进行重试，如果在Redis-server的backlog之外的话，会全量同步重连。
  
  
Q: 可以基于AOF文件合并生成RDB文件吗？对内存的占用是否会造成OOM问题？
A: AOF文件转RDB这个工具还做不到，但反过来自己扩展一些代码可以做到RDB转AOF。
   在分享中特意有这个OOM的实践，因为有用户成功用这个工具同步8GB单KV，单实例30GB的Redis，
   就是因为可以自定义RDB解析器，把KV转成迭代的方式减小占用内存。
  
  
Q: 消费慢，有统计过过达到多大的并发量？以及当消费慢对redis性能影响有数据统计吗？
A: 消费慢的行为和Redis slave的行为一致，比如某台Redis slave消费慢，有可能产生无限重连的情况，
   这里redis-replicator和slave的行为是保持一致的，可能需要调整一些参数比如
   repl-backlog-size，repl-backlog-ttl，repl-ping-slave-periods。
  
  
Q: 有因为各种原因中断后进行retry的功能吗？
A: 有断线重联，而且是尽量以避免全量同步的方式重联。并且有标记event来监测到是否是全量同步。

《M006.Redis-replicator 设计与实现》 Redis-replicator 设计与实现，及redis replication协议讲解。

题图：Customized keyboard made by Leon.