1.什么是redis
redis 是一个基于内存的高性能key-value数据库。整个数据库统统加载在内存当中进行操作,定期通过异步操作把数据库数据flush到硬盘上进行保存。因为是纯内存操作,redis的性能非常出色,每秒可以处理超过 10万次读写操作,是已知性能最快的key-value db。
2.为什么用redis/为什么用缓存
(1)高性能
假如用户第一次访问数据库中某些数据,这个过程会比较慢,因为是从硬盘上读取的,将用户访问的数据存放在缓存中,这样下一次访问这些数据的时候就会直接从缓存中获取,操作缓存是直接操作内存,所以速度相当快,如果数据库中的数据对应的数据改变后,同步改变缓存中相应的数据即可。
(2)高并发
直接操作缓存能够承受的请求是远远大于直接访问数据库的,所以把数据库中的部分数据转移到缓存中去,这样用户的一部分请求会直接到缓存中而不会经过数据库。
3.redis支持数据类型
redis 有 5 种基础数据结构,分别为:string (字符串)、list (列表)、set (集合)、hash (哈希) 和 zset (有序集合)。
string字符串:
格式: set key value
string类型是二进制安全的。意思是redis的string可以包含任何数据。比如jpg图片或者序列化的对象 。
string类型是redis最基本的数据类型,一个键最大能存储512mb。
hash(哈希)
格式: hmset name key1 value1 key2 value2
redis hash 是一个键值(key=>value)对集合。
redis hash是一个string类型的field和value的映射表,hash特别适合用于存储对象。
list(列表)
redis 列表是简单的字符串列表,按照插入顺序排序。你可以添加一个元素到列表的头部(左边)或者尾部(右边)
格式: lpush name value
在 key 对应 list 的头部添加字符串元素
格式: rpush name value
在 key 对应 list 的尾部添加字符串元素
格式: lrem name index
key 对应 list 中删除 count 个和 value 相同的元素
格式: llen name
返回 key 对应 list 的长度
set(集合)
格式: sadd name value
redis的set是string类型的无序集合。
集合是通过哈希表实现的,所以添加,删除,查找的复杂度都是o(1)。
zset(sorted set:有序集合)
格式: zadd name score value
redis zset 和 set 一样也是string类型元素的集合,且不允许重复的成员。
不同的是每个元素都会关联一个double类型的分数。redis正是通过分数来为集合中的成员进行从小到大的排序。
zset的成员是唯一的,但分数(score)却可以重复。
4.什么是redis持久化?redis持久化有哪几种持久方式?优缺点是什么?
redis是基于内存操作的,内存断电即失,redis持久化就是把内存的数据写到磁盘中去,防止服务器宕机,内存数据丢失。redis持久化提供两个两种方式rdf(默认)和aof。
rdb:
redis把数据快照存放在磁盘上的二进制文件中,文件名为dump.rdb。你可以配置redis的持久化策略,例如数据集中每n秒钟有超过m次更新,就将数据写入磁盘;或者你可以手工调用命令save或bgsave。
当redis意外宕机,会丢失部分数据。
aof:
aof(append-only-file)持久化即记录所有变更数据库状态的指令,以append的形式追加保存到aof文件中。在服务器下次启动时,就可以通过载入和执行aof文件中保存的命令,来还原服务器关闭前的数据库状态。
对于相同的数据来说,aof文件大小通常要大于rdb文件。aof持久化以日志的形式记录服务器所处理的每一个写、删除操作,查询操作不会记录,以文本的方式记录,可以打开文件看到详细的操作记录。所以redis意外宕机,redis只会丢失最后一次数据。
5.什么是缓存穿透?如何避免?
一般的缓存系统,都是按照key去缓存查询,如果不存在对应的value,就应该去后端系统查找(比如db)。一些恶意的请求会故意查询不存在的key,请求量很大,就会对后端系统造成很大的压力。这就叫做缓存穿透。
如何避免?
1:对查询结果为空的情况也进行缓存,缓存时间设置短一点,或者该key对应的数据insert了之后清理缓存。
2:对一定不存在的key进行过滤。可以把所有的可能存在的key放到一个大的bitmap中,查询时通过该bitmap过滤。
6.什么是缓存击穿?如何避免
对于设置了过期时间的 key,缓存在某个时间点过期的时候,恰好这时间点对这个 key 有大量的并发请求过来,这些请求发现缓存过期一般都会从后端 db 加载数据并回设到缓存,这个时候大并发的请求可能会瞬间把 db 压垮。
解决方案:
i.使用互斥锁:当缓存失效时,不立即去 load db,先使用如 redis 的 setnx 去设置一个互斥锁,当操作成功返回时再进行 load db 的操作并回设缓存,否则重试 get 缓存的方法。
同时保证对于每个key同时只有一个线程去查询后端,其他线程没有获得锁的权限,只需要等待即可。
ii 永远不过期:物理不过期,但逻辑过期(后台异步线程去刷新)。
7.什么是缓存雪崩?如何避免
设置缓存时采用了相同的过期时间,导致缓存在某一时刻同时失效,请求全部转发到 db, db 瞬时压力过重雪崩。与缓存击穿的区别:雪崩是很多 key,击穿是某一个key 缓存。
解决方案:
将缓存失效时间分散开,比如可以在原有的失效时间基础上增加一个随机值,比如 1-5 分钟随机,这样每一个缓存的过期时间的重复率就会降低,就很难引发集体失效的事件。
8.redis为什么单线程还这么快?
redis是将所有数据全部放在内存中的,所以说使用单线程去操作效率就是最高的。多线程会产生cpu上下文切换,将会是比较耗时的操作。对于内存系统来说,如果没有上下文切换效率就是最高的。
9、redis内存淘汰机制(mysql里有2000w数据,redis中只存20w的数据,如何保证redis中的数据都是热点数据)
redis 内存数据集大小上升到一定大小的时候,就会施行数据淘汰策略(回收策略)。redis 提供 6种数据淘汰策略:
volatile-lru:从已设置过期时间的数据集(server.db[i].expires)中挑选最近最少使用的数据淘汰
volatile-ttl:从已设置过期时间的数据集(server.db[i].expires)中挑选将要过期的数据淘汰
volatile-random:从已设置过期时间的数据集(server.db[i].expires)中任意选择数据淘汰
allkeys-lru:从数据集(server.db[i].dict)中挑选最近最少使用的数据淘汰
allkeys-random:从数据集(server.db[i].dict)中任意选择数据淘汰
no-enviction(驱逐):当内存数据不足以容纳新写入的数据时。新写入操作时就会报错。
10.redis主从复制
是指将一台redis服务器的数据,复制到其他的redis服务器。前者称为主节点(master/leader),后者称为从结点(slave/follower);数据的复制是单向的,只能由主节点到从结点。master以写为主,slave以读为主。
11.redis事务
redis事务的本质是一组命令的集合,一个事务中所有命令都会被序列化,在事务执行过程中,会按照顺序执行。
redis单条命令保证原子性,但是redis事务中不保证原子性,不并且redis事务没有隔离级别的概念。
redis事务命令:
开启事务(multi)
执行事务(exec)
放弃事务(discard)