前言

Redis 提供了 5 种数据结构。理解每种数据结构的特点,对于 Redis 的 开发运维 非常重要,同时掌握 Redis 的 单线程命令处理 机制,会使 数据结构 和 命令 的选择事半功倍。

深入剖析Redis系列:Redis数据结构与全局命令概述

接下来的几篇文章,将从如下几个方面介绍 Redis 的几种数据结构,命令使用及其应用场景。

  • 预备知识:几个简单的 全局命令,数据结构 和 内部编码,单线程命令 处理机制分析。
  • 数据结构特性:5 种 数据结构 的特点、命令使用、应用场景。
  • 数据管理:键管理、遍历键、数据库管理。

正文

1. 预备知识

在介绍 5 种 数据结构 之前,需要先了解 Redis 的一些 全局命令、数据结构 和 内部编码、单线程命令处理机制。

  1. Redis 的命令有 上百个,理解 Redis 的一些机制,会发现这些命令有很强的 通用性。
  2. Redis 不是万金油,有些 数据结构 和 命令 必须在 特定场景 下使用,一旦 使用不当可能对 Redis 本身 或者 应用本身 造成致命伤害。

2. 全局命令

Redis 有 5 种 数据结构,它们是 键值对 中的 值,对于 键 来说有一些通用的命令。

2.1. 查看所有键

keys *

下面插入了 3 对字符串类型的键值对:

127.0.0.1:6379> set hello world 
 
OK 
 
127.0.0.1:6379> set java jedis 
 
OK 
 
127.0.0.1:6379> set python redis-py 
 
OK

命令会将所有的键输出:

127.0.0.1:6379> keys * 
 
1) "python" 
 
2) "java" 
 
3) "hello"

2.2. 键总数

dbsize

下面插入一个 列表类型 的 键值对(值是 多个元素 组成):

127.0.0.1:6379> rpush mylist a b c d e f g 
 
(integer) 7

dbsize 命令会返回当前数据库中 键的总数。

127.0.0.1:6379> dbsize 
 
(integer) 4

dbsize 命令在 计算键总数 时 不会遍历 所有键,而是直接获取 Redis 内置的键总数变量,所以 dbsize 命令的 时间复杂度 是 O(1)。而 keys 命令会 遍历 所有键,所以它的 时间复杂度 是 O(n),当 Redis 保存了 大量键 时,线上环境 禁止 使用。

2.3. 检查键是否存在

exists key

如果键存在则返回 1,不存在则返回 0:

127.0.0.1:6379> exists java 
 
(integer) 1 
 
127.0.0.1:6379> exists not_exist_key 
 
(integer) 0

2.4. 删除键

del key

del 是一个 通用命令,无论值是什么 数据结构 类型,del 命令都可以将其 删除。

127.0.0.1:6379> del java 
 
(integer) 1 
 
127.0.0.1:6379> exists java 
 
(integer) 0 
 
127.0.0.1:6379> del not_exist_key 
 
(integer) 0 
 
127.0.0.1:6379> exists not_exist_key 
 
(integer) 0

返回结果为 成功删除 的 键的个数,假设删除一个 不存在 的键,就会返回 0。

2.5. 键过期

expire key seconds

Redis 支持对 键 添加 过期时间,当超过过期时间后,会 自动删除键,例如为键 hello 设置 10 秒过期时间:

127.0.0.1:6379> set hello world 
 
OK 
 
127.0.0.1:6379> expire hello 10 
 
(integer) 0

ttl 命令会返回键的 剩余过期时间,它有 3 种返回值:

  • 大于等于 0 的整数:表示键 剩余 的 过期时间。
  • 返回 -1:键 没设置 过期时间。
  • 返回 -2:键 不存在。

可以通过 ttl 命令观察 键 hello 的 剩余过期时间:

# 还剩7秒

127.0.0.1:6379> ttl hello(integer) 
 
(integer) 7

...

# 还剩1秒

127.0.0.1:6379> ttl hello(integer) 
 
(integer) 1

# 返回结果为-2,说明键hello已经被删除

127.0.0.1:6379> ttl hello(integer) 
 
(integer) -2 
 
127.0.0.1:6379> get hello 
 
(nil)

2.6. 键的数据结构类型

type key

例如键 hello 是的值 字符串类型,返回结果为 string。键 mylist 的值是 列表类型,返回结果为 list。如果键不存在,则返回 none。

127.0.0.1:6379> set a b 
 
OK 
 
127.0.0.1:6379> type a 
 
string 
 
127.0.0.1:6379> rpush mylist a b c d e f g 
 
(integer) 7 
 
127.0.0.1:6379> type mylist 
 
list

3. 数据结构和内部编码

type 命令实际返回的就是当前 键 的 数据结构类型,它们分别是:string(字符串)、hash(哈希)、list(列表)、set(集合)、zset(有序集合),但这些只是 Redis 对外的 数据结构。如图所示:

深入剖析Redis系列:Redis数据结构与全局命令概述

对于每种 数据结构,实际上都有自己底层的 内部编码 实现,而且是 多种实现。这样 Redis 会在合适的 场景 选择合适的 内部编码,如图所示:

深入剖析Redis系列:Redis数据结构与全局命令概述

image

可以看到,每种 数据结构 都有 两种以上 的 内部编码实现。例如 list 数据结构 包含了 linkedlist 和 ziplist 两种 内部编码。同时有些 内部编码,例如 ziplist,可以作为 多种外部数据结构 的内部实现,可以通过 object encoding 命令查询 内部编码:

127.0.0.1:6379> object encoding hello 
 
"embstr" 
 
127.0.0.1:6379> object encoding mylist 
 
"quicklist"

可以看到键 hello 对应值的 内部编码 是 embstr,键 mylist 对应值的 内部编码 是 ziplist。

Redis 这样设计有两个好处:

  • 其一:可以改进 内部编码,而对外的 数据结构 和 命令 没有影响。例如 Redis3.2 提供的 quicklist,结合了 ziplist 和 linkedlist 两者的优势,为 列表类型 提供了一种 更加高效 的 内部编码实现。
  • 其二:不同 内部编码 可以在 不同场景 下发挥各自的 优势。例如 ziplist 比较 节省内存,但是在列表 元素比较多 的情况下,性能 会有所 下降,这时候 Redis 会根据 配置,将列表类型的 内部实现 转换为 linkedlist。

4. 单线程架构

Redis 使用了 单线程架构 和 I/O 多路复用模型 来实现 高性能 的 内存数据库服务。那为什么 单线程 还能这么快,下面分析原因:

4.1. 纯内存访问

Redis 将所有数据放在 内存 中,内存的 响应时长 大约为 100 纳秒,这是 Redis 达到 每秒万级别 访问的重要基础。

4.2. 非阻塞I/O

Redis 使用 epoll 作为 I/O 多路复用技术 的实现,再加上 Redis 自身的 事件处理模型 将 epoll 中的 连接、读写、关闭 都转换为 事件,从而不用不在 网络 I/O 上浪费过多的时间,如图所示:

深入剖析Redis系列:Redis数据结构与全局命令概述

image

4.3. 单线程避免线程切换和竞态产生的消耗

采用 单线程 就能达到如此 高的性能,那么不失为一种不错的选择,因为 单线程 能带来几个好处:

  • 单线程 可以简化 数据结构和算法 的实现,开发人员不需要了解复杂的 并发数据结构。
  • 单线程 避免了 线程切换 和 竞态 产生的消耗,对于服务端开发来说,锁和线程切换通常是性能杀手。
单线程 的问题:对于 每个命令 的 执行时间 是有要求的。如果某个命令 执行过长,会造成其他命令的 阻塞,对于 Redis 这种 高性能 的服务来说是致命的,所以 Redis 是面向 快速执行 场景的数据库。

小结

本文堆 Redis 的几种 数据结构 进行了概述,介绍了几个简单的 全局命令,数据结构 和 内部编码 以及 单线程命令 处理机制分析。


发布评论
IT序号网

微信公众号号:IT虾米 (左侧二维码扫一扫)欢迎添加!

深入剖析Redis系列: Redis集群模式搭建与原理详解知识解答
你是第一个吃螃蟹的人
发表评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。