目录
redis 经常用于系统中的缓存,这样可以解决目前 io 设备无法满足互联网应用海量的读写请求的问题。
一、缓存穿透
缓存穿透是指缓存和数据库中都没有的数据,而用户不断发起请求,如发起 id 为-1 的数据或者特别大的不存在的数据。有可能是黑客利用漏洞攻击从而去压垮应用的数据库。
1. 常见解决方案
对于缓存穿透问题,常见的解决方案有以下三种:
- 验证拦截:接口层进行校验,如鉴定用户权限,对 id 之类的字段做基础的校验,如 id<=0 的字段直接拦截;
- 缓存空数据:当数据库查询到的数据为空时,也将这条数据进行缓存,但缓存的有效性设置得要较短,以免影响正常数据的缓存;
copypublic student getstudentsbyid(long id) { // 从redis中获取学生信息 student student = redistemplate.opsforvalue() .get(string.valueof(id)); if (student != null) { return student; } // 从数据库查询学生信息,并存入redis student = studentdao.selectbystudentid(id); if (student != null) { redistemplate.opsforvalue() .set(string.valueof(id), student, 60, timeunit.minutes); } else { // 即使不存在,也将其存入缓存中 redistemplate.opsforvalue() .set(string.valueof(id), null, 60, timeunit.seconds); } return student; }
使用布隆过滤器:布隆过滤器是一种比较独特数据结构,有一定的误差。当它指定一个数据存在时,它不一定存在,但是当它指定一个数据不存在时,那么它一定是不存在的。
2. 布隆过滤器
布隆过滤器是一种比较特殊的数据结构,有点类似与 hashmap,在业务中我们可能会通过使用 hashmap 来判断一个值是否存在,它可以在 o(1)时间复杂度内返回结果,效率极高,但是受限于存储容量,如果可能需要去判断的值超过亿级别,那么 hashmap 所占的内存就很可观了。
而 bloomfilter 解决这个问题的方案很简单。首先用多个 bit 位去代替 hashmap 中的数组,这样的话储存空间就下来了,之后就是对 key 进行多次哈希,将 key 哈希后的值所对应的 bit 位置为 1。
当判断一个元素是否存在时,就去判断这个值哈希出来的比特位是否都为 1,如果都为 1,那么可能存在,也可能不存在(如下图 f)。但是如果有一个 bit 位不为 1,那么这个 key 就肯定不存在。
注意:bloomfilter 并不支持删除操作,只支持添加操作。这一点很容易理解,因为你如果要删除数据,就得将对应的 bit 位置为 0,但是你这个 key 对应的 bit 位可能其他的 key 也对应着。
3. 缓存空数据与布隆过滤器的比较
上面对这两种方案都进行了简单的介绍,缓存空数据与布隆过滤器都能有效解决缓存穿透问题,但使用场景有着些许不同;
- 当一些恶意攻击查询查询的 key 各不相同,而且数量巨多,此时缓存空数据不是一个好的解决方案。因为它需要存储所有的 key,内存空间占用高。并且在这种情况下,很多 key 可能只用一次,所以存储下来没有意义。所以对于这种情况而言,使用布隆过滤器是个不错的选择;
- 而对与空数据的 key 数量有限、key 重复请求效率较高的场景而言,可以选择缓存空数据的方案。
二、缓存击穿
缓存击穿是指当前热点数据存储到期时,多个线程同时并发访问热点数据。因为缓存刚过期,所有并发请求都会到数据库中查询数据。
解决方案
- 将热点数据设置为永不过期;
- 加互斥锁:互斥锁可以控制查询数据库的线程访问,但这种方案会导致系统的吞吐量下降,需要根据实际情况使用。
copypublic string get(key) { string value = redis.get(key); if (value == null) { // 代表缓存值过期 // 设置3min的超时,防止del操作失败的时候,下次缓存过期一直不能 load db if (redis.setnx(key_mutex, 1, 3 * 60) == 1) { // 代表设置成功 value = db.get(key); redis.set(key, value, expire_secs); redis.del(key_mutex); } else { // 这个时候代表同时候的其他线程已经load db并回设到缓存了,这时候重试获取缓存值即可 sleep(50); get(key); // 重试 } } else { return value; } }
三、缓存雪崩
缓存雪崩发生有几种情况,比如大量缓存集中在或者缓存同时在大范围中失效,出现了大量请求去访问数据库,从而导致 cpu 和内存过载,甚至停机。
一个简单的雪崩过程:
- redis 集群产生了大面积故障;
- 缓存失败,此时仍有大量请求去访问 redis 缓存服务器;
- 在大量 redis 请求失败后,这些请求将会去访问数据库;
- 由于应用的设计依赖于数据库和 redis 服务,很快就会造成服务器集群的雪崩,最终导致整个系统的瘫痪。
解决方案
- 【事前】高可用缓存:高可用缓存是防止出现整个缓存故障。即使个别节点,机器甚至机房都关闭,系统仍然可以提供服务,redis 哨兵(sentinel) 和 redis 集群(cluster) 都可以做到高可用;
- 【事中】缓存降级(临时支持):当访问次数急剧增加导致服务出现问题时,我们如何确保服务仍然可用。在国内使用比较多的是 hystrix,它通过熔断、降级、限流三个手段来降低雪崩发生后的损失。只要确保数据库不死,系统总可以响应请求,每年的春节 12306 我们不都是这么过来的吗?只要还可以响应起码还有抢到票的机会;
- 【事后】redis 备份和快速预热:redis 数据备份和恢复、快速缓存预热。
到此这篇关于浅谈redis 缓存的三大问题及其解决方案的文章就介绍到这了,更多相关redis 缓存问题内容请搜索www.887551.com以前的文章或继续浏览下面的相关文章希望大家以后多多支持www.887551.com!