Redis的持久化存储
Redis中的持久化策略
当出现Redis宕机时,我们需要做的是重启redis,尽快让他对外提供服务,缓存==全部无法命中==,在redis里根本找不到数据,这时候就会出现==缓存雪崩==的问题。所有的请求,都没有在Redis中命中,就会去MySQL数据库这种数据源头中找,一下子MySQL无法承受高并发,那么系统将直接宕机。这个时候MySQL宕机,因为没办法从MySQL中将缓存恢复到Redis中,因为Redis中的数据是从MySQL中来的。
RDB持久化机制
原理
RDB持久化是指在指定的时间间隔内将内存中的数据集快照写入磁盘。 是默认的持久化方式,这种方式是就是将内存中数据以快照的方式写入到二进制文件中,默认的文件名为dump.rdb。
简单来说RDB:就是将Redis中的数据,每个一段时间,进行数据的全量备份。

持久化过程
Redis会单独创建(fork)一个子进程来进行持久化,会==先==将数据==写==入到一个临时文件中,待持久化过程都结束了,再用这个==临时文件替换上次持久化好==的文件。整个过程中,主进程是不进行任何IO操作的,这就确保了极高的性能如果需要进行大规模数据的恢复,且对于数据恢复的完整性不是非常敏感,那RDB方式要比AOF方式更加的高效。RDB的缺点是==最后一次持久化后的数据可能丢失==。

既然RDB机制是通过把某个时刻的所有数据生成一个快照来保存,那么就应该有一种触发机制,是实现这个过程。对于RDB来说,提供了三种机制:save、bgsave、自动化。我们分别来看一下。
三种触发方式
save触发方式
该命令会阻塞当前Redis服务器,执行save命令期间,Redis不能处理其他命令,直到RDB过程完成为止。具体流程如下:

执行完成时候如果存在老的RDB文件,==就用新的替换掉旧的==。我们的客户端可能都是几万或者是几十万,这种方式显然不可取。
bgsave触发方式
执行该命令时,Redis会在后台异步进行快照操作,快照同时还可以响应客户端请求。具体流程如下:

具体操作是Redis进程执行fork操作创建子进程,RDB持久化过程由子进程负责,完成后自动结束。阻塞只发生在fork阶段,一般时间很短。基本上 Redis 内部所有的RDB操作都是采用 bgsave 命令。
自动触发
自动触发是由我们的配置文件来完成的。在redis.conf配置文件中,里面有如下配置,我们可以去设置:
①save: 这里是用来配置触发 Redis的 RDB 持久化条件,也就是什么时候将内存中的数据保存到硬盘。比如“save m n”。表示m秒内数据集存在n次修改时,自动触发bgsave。
-
默认如下配置:
#表示 900 秒内如果至少有 1 个 key 的值变化,则保存 save 900 1 #表示 300 秒内如果至少有 10 个 key 的值变化,则保存 save 300 10 #表示 60 秒内如果至少有 10000 个 key 的值变化,则保存 save 60 10000 -
不需要持久化,那么你可以注释掉所有的 save 行来停用保存功能。
②stop-writes-on-bgsave-error : 默认值为yes。当启用了RDB且最后一次后台保存数据失败,Redis是否停止接收数据。这会让用户意识到数据没有正确持久化到磁盘上,否则==没有人会注意到灾难(disaster)发生了==。如果Redis重启了,那么又可以重新开始接收数据了。
③rdbcompression ; 默认值是yes。对于存储到磁盘中的快照,可以设置是否进行压缩存储。
④rdbchecksum : 默认值是yes。在存储快照后,我们还可以让redis使用CRC64算法来进行数据校验,但是这样做会增加大约10%的性能消耗,如果希望获取到==最大的性能提升==,可以关闭此功能。
⑤dbfilename : 设置快照的文件名,默认是 dump.rdb;
⑥dir: 设置快照文件的存放路径,这个配置项一定是个目录,而不能是文件名。
我们可以修改这些配置来实现我们想要的效果。因为第三种方式是配置的,所以我们对前两种进行一个对比:
| 命令 | save | bgsave |
|---|---|---|
| IO类型 | 同步 | 异步 |
| 阻塞 | 是 | 是(阻塞发生在fork) |
| 复杂度 | O(n) | O(n) |
| 优点 | 不会消耗额外内存 | 不阻塞客户端命令 |
| 缺点 | 阻塞客户端命令 | 需要fork,消耗内存 |
Fork
- Fork的作用是复制一个与当前进程==一样的进程==。新进程的所有数据(变量、环境变量、程序计数器等)数值都和原进程一致,但是是一个全新的进程,并作为==原进程的子进程==。
- 在Linux程序中,
fork()会产生一个和父进程完全相同的子进程,但子进程在此后多会exec系统调用,出于效率考虑,Linux中引入了“==写时复制技术==”. - 一般情况父进程和子进程会共用同一段物理内存,只有进程空间的各段的内容要发生变化时,才会将父进程的内容复制一份给子进程。
恢复
- 先通过config get dir查询rdb文件的目录
- 将
*.rdb的文件拷贝到别的地方。 - rdb的恢复
- 先把备份的文件拷贝到工作目录下cp dump2.rdb dump.rdb
- 启动Redis,备份数据会直接加载
AOF持久化机制
全量备份总是耗时的,有时候我们提供一种更加高效的方式AOF,工作机制很简单,redis会将每一个收到的写命令都通过write函数追加到文件中。
==以日志的形式来记录每个写操作(增量保存)==,将Redis执行过的所有写指令记录下来(==读操作不记录==),==只许追加文件但不可以改写文件==,redis启动之初会读取该文件重新构建数据,换言之,redis 重启的话就根据日志文件的内容将写指令从前到后执行一次以完成数据的恢复工作
原理

每当有一个写命令过来时,就直接保存在我们的AOF文件中。
持久化过程
- 客户端的请求写命令会被append追加到AOF缓冲区内;
- AOF缓冲区根据AOF 持久化策略[always,everysec,no]将操作 sync同步到磁盘的AOF文件中;
- AOF文件大小超过重写策略或手动重写时,会对AOF文件rewrite重写,压缩AOF文件容量;
- Redis 服务重启时,会重新load加载AOF文件中的写操作达到数据恢复的目的;
文件重写
重写压缩
AOF采用文件追加方式,文件会越来越大,为避免出现此种情况,新增了重写机制,当AOF文件的大小超过所设定的阈值时,Redis就会启动AOF文件的内容压缩,只保留可以恢复数据的最小指令集.可以使用命令bgrewriteaof。

重写时机
如果Redis的==AOF当前大小>=base_size+base_size*100%==(默认)且当前==大小>=64mb==(默认)的情况下,Redis会对AOF进行重写。
auto-aof-rewrite-percentage:设置重写的基准值,文件达到100%时开始重写(文件是原来重写后文件的2倍时触发)auto-aof-rewrite-min-size:设置重写的基准值,最小文件64MB。达到这个值开始重写
原理
AOF的方式也同时带来了另一个问题。持久化文件会变的越来越大。为了压缩aof的持久化文件。redis提供了bgrewriteaof命令。将内存中的数据以命令的方式保存到临时文件中,同时会fork出一条新进程来将文件重写。

重写aof文件的操作,==并没有读取旧的aof文件==,而是将整个内存中的数据库内容用命令的方式重写了一个新的aof文件,这点和快照有点类似。
AOF文件持续增长而过大时,会fork出一条新进程来将文件重写(也是先写临时文件最后再rename),==redis4.0版本后的重写,是指上就是把rdb的快照,以二级制的形式附在新的aof头部,作为已有的历史数据,替换掉原来的流水账操作==。
三种触发机制
- 每修改同步(always):同步持久化,每次发生数据变更会被立即记录到磁盘,==性能较差但数据完整性比较好==;
- 每秒同步(everysec):异步操作,每秒记录 如果一秒内宕机,本秒数据丢失;
- 不同步(no):redis不主动进行同步,把==同步时机交给操作系统==
| 命令 | always | everysec | no |
|---|---|---|---|
| 优点 | 不丢失数据 | 每一秒fsync | 不用管 |
| 缺点 | IO开销大,一般的SATA盘只有几百TPS | 丢一秒数据 | 不可控 |
- ==QPS(TPS)==:系统吞吐量。
- ==TPS==即每秒处理事务数,包括:”用户请求服务器”、”服务器自己的内部处理”、”服务器返回给用户”,这三个过程,每秒能够完成N个这三个过程,TPS也就是3;
- ==QPS==基本类似于TPS,但是不同的是,对于一个页面的一次访问,形成一个TPS;但一次页面请求,可能产生多次对服务器的请求,服务器对这些请求,就可计入QPS之中。
AOF异常恢复
- 修改默认的appendonly no,改为yes
- 备份被写坏的AOF文件。
- 如遇到AOF文件损坏,通过
/usr/local/bin/redis-check-aof --fix appendonly.aof进行恢复。 - 恢复:重启redis,然后重新加载
AOF和RDB各有什么优缺点
RDB 的优势和劣势
-
优势
- RDB文件紧凑,全量备份,非常适合用于进行备份和灾难恢复。
- 生成RDB文件的时候,redis主进程会fork()一个子进程来处理所有保存工作,主进程不需要进行任何磁盘IO操作。
- RDB 在恢复大数据集时的速度比 AOF 的恢复速度要快。
- 对数据完整性和一致性要求不高时更适合使用。
- 节约磁盘空间。
-
劣势
- Fork的时候,内存中的数据被克隆了一份,大致2倍的膨胀性考虑。
- 虽然Redis在fork时使用了==写时拷贝技术==,但是如果数据庞大时还是比较消耗性能。
- 只有进程空间的各段的内容要发生变化时,才会将父进程的内容复制一份给子进程。
- 当进行快照持久化时,会开启一个子进程专门负责快照持久化,子进程会拥有父进程的内存数据,父进程修改内存子进程不会反应出来,==所以在快照持久化期间修改的数据不会被保存==,如果在持久化的过程中发生了断电或者宕机,因为RDB是在==执行完成时候==判断是否存在老数据并替换的,所以老数据不会丢失,新的数据会丢失。
AOF的优势和劣势
-
优点
- AOF可以更好的保护数据不丢失,一般AOF会每隔1秒,通过一个后台线程执行一次fsync操作,最多丢失1秒钟的数据。
- AOF日志文件没有任何磁盘寻址的开销,写入性能非常高,文件不容易破损。
- AOF日志文件即使过大的时候,出现后台重写操作,也不会影响客户端的读写。
- AOF日志文件的命令通过非常可读的方式进行记录,这个特性非常适合做灾难性的误删除的紧急恢复。比如某人不小心用flushall命令清空了所有数据,只要这个时候后台rewrite还没有发生,那么就可以立即拷贝AOF文件,将最后一条flushall命令给删了,然后再将该AOF文件放回去,就可以通过恢复机制,自动恢复所有数据。
-
缺点
- 对于同一份数据来说,AOF日志文件通常比RDB数据快照文件更大。
- AOF开启后,支持的写QPS会比RDB支持的写QPS低,因为AOF一般会配置成每秒fsync一次日志文件,当然,每秒一次fsync,性能也还是很高的。
- 以前AOF发生过bug,就是通过AOF记录的日志,进行数据恢复的时候,没有恢复一模一样的数据出来。
如何选择
选择的话,两者加一起才更好。因为两个持久化机制你明白了,剩下的就是看自己的需求了,需求不同选择的也不一定,但是通常都是结合使用(每个一个大的时间进行一次RDB持久化,小的时间里一直进行AOF持久化)。
| 命令 | EDB | AOF |
|---|---|---|
| 启动优先级 | 低(得有一部分数据之后再开始备份) | 高(开始写数据就开始记录) |
| 体积 | 小 | 大 |
| 恢复速度 | 快(一波) | 慢(一条一条日志进行执行) |
| 数据安全性 | 丢数据 | 根据策略决定 |
| 轻重 | 重 | 轻 |
==注意==:AOF和RDB同时开启,系统默认取AOF的数据(数据不会存在丢失)
- 如果对数据不敏感,可以选单独用RDB。
- 不建议单独用AOF,因为可能会出现Bug。
- 如果只是做纯内存缓存,可以都不用。
Redis的RDB-AOF混合持久化策略
背景
重启 Redis 时,我们很少使用 RDB 来恢复内存状态,因为会丢失大量数据。我们通常使用 AOF 日志重放。
但是重放 AOF 日志性能相对 RDB 来说要慢很多,这样在 Redis 实例很大的情况下,启动需要花费很长的时间。
Redis4.0 为了解决这个问题,带来了一个新的持久化选项 — ==混合持久化==。
原理
如果开启了混合持久化,AOF 在重写时,不再是单纯将内存数据转换为 RESP 命令写入 AOF 文件,而是将重写这一刻之前的内存做 RDB 快照处理并且将 RDB 快照内容和增量的 AOF 修改内存数据的命令存在一起,都写入新的 AOF 文件,新的文件一开始不叫 appendonly.aof,等到重写完新的 AOF 文件才会进行改名,覆盖原有的 AOF 文件,完成新旧两个 AOF 文件的替换。
于是在 Redis 重启的时候,可以先加载 RDB 的内容,然后再重放增量 AOF 日志就可以完全替代之前的 AOF 全量文件重放,因此重启效率大幅得到提升

Redis持久化对于生产环境的意义
故障发生时会怎么样?
如何应对故障的发生?
Redis持久化的意义,在于故障恢复,也属于高可用的一个环节。 当存放在内存中数据,会因为Redis的突然挂掉,而导致数据丢失。而这会在Redis成功启动之后造成缓存雪崩。

Redis的持久化,就是将内存中的数据,持久化到磁盘上中。
通过持久化将数据存储在磁盘中,然后定期同步和备份到一些云存储服务上去。这样在启动之后就可以使用磁盘上的数据快速恢复缓存。