缓存穿透、缓存击穿和缓存雪崩
缓存穿透
缓存穿透的概念很简单,用户想要查询一个数据,发现redis内存数据库没有,也就是缓存没有命中,于是向持久层数据库查询。发现也没有,于是本次查询失败。当用户很多的时候,缓存都没有命中,于是都去请求了持久层数据库。这会给持久层数据库造成很大的压力,这时候就相当于出现了缓存穿透。
1、解决方案–缓存空对象
当存储层不命中后,即使返回的空对象也将其缓存起来,同时会设置一个过期时间,==之后再访问这个数据将会从缓存中获取==,保护了后端数据源 。

但是这种方法会存在两个问题:
- 如果空值能够被缓存起来,这就意味着缓存需要更多的空间存储更多的键,因为这当中可能会有很多的空值的键;
- 即使对空值设置了过期时间,还是==会存在缓存层和存储层的数据会有一段时间窗口的不一致==,这对于需要保持一致性的业务会有影响;
- 比如实时性比较强的数据,存储层更新了,缓存层还没有过期。
2、解决方案–布隆过滤器
布隆过滤器是一种数据结构,垃圾网站和正常网站加起来全世界据统计也有几十亿个。网警要过滤这些垃圾网站,总不能到数据库里面一个一个去比较吧,这就可以使用布隆过滤器。
假设我们存储一亿个垃圾网站地址。可以先有一亿个二进制比特,然后网警用八个不同的随机数产生器(F1,F2, …,F8) 产生八个信息指纹(f1, f2, …, f8)。接下来用一个随机数产生器 G 把这八个信息指纹映射到 1 到1亿中的八个自然数 g1, g2, …,g8。最后把这八个位置的二进制全部设置为一。过程如下:

有一天网警查到了一个可疑的网站,想判断一下是否是XX网站,首先将可疑网站通过哈希映射到1亿个比特数组上的8个点。如果8个点的其中有一个点不为1,则可以判断该元素一定不存在集合中。
那这个布隆过滤器是如何解决redis中的缓存穿透呢?很简单首先也是对所有可能查询的参数以hash形式存储,当用户想要查询的时候,使用布隆过滤器发现不在集合中,就直接返回不存在,不再对持久层查询。
使用布隆过滤器能够对访问的请求起到了一定的初筛作用,避免了因数据不存在引起的查询压力。

缓存击穿
缓存击穿是指同一缓存失效导致大量请求直接到了数据库。一般会存在于访问频繁的热点缓存,缓存过期致使大量请求到数据查询同一数据,持续的大并发就穿破缓存,直接请求数据库,从而导致缓存击穿,就像在一个屏障上凿开了一个洞。
不同场景下的解决方式可如下:
- 若缓存的数据是基本不会发生更新的,则可尝试将该热点数据设置为永不过期。
- 若缓存的数据更新不频繁,且缓存刷新的整个流程耗时较少的情况下,则可以采用基于 Redis、zookeeper 等分布式中间件的分布式互斥锁,或者本地互斥锁以保证仅少量的请求能请求数据库并重新构建缓存,其余线程则在锁释放后能访问到新缓存。
- 若缓存的数据更新频繁或者在缓存刷新的流程耗时较长的情况下,可以利用定时线程在缓存过期前主动地重新构建缓存或者延后缓存的过期时间,以保证所有的请求能一直访问到对应的缓存。
缓存雪崩
缓存雪崩是指同一时间大量缓存失效,导致大量请求直接到了数据库。 于是所有的请求都会达到存储层,存储层的调用量会暴增,造成存储层也会挂掉的情况。

事前解决方案–redis高可用
这个思想的含义是,既然redis有可能挂掉,那我多增设几台redis,这样一台挂掉之后其他的还可以继续工作,其实就是搭建的集群。
事前解决方案–本地缓存+限流降级
用户发送一个请求,系统 A 收到请求后,先查本地 ehcache 缓存,如果没查到再查 Redis。如果 ehcache 和 Redis 都没有,再查数据库,将数据库中的结果,写入 ehcache 和 Redis 中。
限流组件,可以设置每秒的请求,有多少能通过组件,剩余的未通过的请求,怎么办? 走降级 !可以返回一些默认的值,或者友情提示,或者空值。
这个解决方案的思想是,在缓存失效后,通过加锁或者队列来控制读数据库写缓存的线程数量。比如对某个key只允许一个线程查询数据和写缓存,其他线程等待。
事后解决方案–数据预热
数据加热的含义就是在正式部署之前,我先把可能的数据先预先访问一遍,这样部分可能大量访问的数据就会加载到缓存中。在即将发生大并发访问前手动触发加载缓存不同的key,设置不同的过期时间,让==缓存失效的时间点尽量均匀==。
应对缓存雪崩,最简单有效的方式就是对于不同缓存尽量错开失效时间!
缓存崩溃重启之后从磁盘上加载数据,快速恢复缓存数据。
总结
- 缓存穿透:某个数据在缓存层和存储层都没了,请求还一直传到持久层。
- 缓存击穿:热点数据在缓存层过期,在这一瞬间,大并发到达了持久层。
- 缓存雪崩:缓存层崩了,所有请求到达持久层,导致持久层也崩了。