news 2026/6/23 15:54:19

Redis篇1——Redis深度剖析:从 5 种对象到 6 大底层结构

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Redis篇1——Redis深度剖析:从 5 种对象到 6 大底层结构

做后端开发这么久,Redis 肯定没少用。但你有没有想过,当我们敲下SET name "Redis"或者ZADD rank 100 "Player1"时,内存里到底发生了什么?

很多人会问:“Redis 底层是用 C 语言写的吗?”

答案是肯定的:是的,Redis 是由 C 语言编写的。正因为 C 语言可以直接操作内存,Redis 才能在性能上做到如此极致。

但有意思的是,Redis 并没有直接使用 C 语言自带的字符串或链表,而是自己造了一套轮子。这就引出了另一个核心概念:Redis 的“两层皮”架构

今天我们就来聊聊 Redis 的5 种外层数据类型到底是如何映射到6 种底层数据结构上的。


一、 为什么要有“两层皮”?

我们在写代码时,操作的是Redis 对象(Object),也就是大家熟知的:String、List、Hash、Set、ZSet。

但在 Redis 内部,它并不会傻乎乎地只用一种方式存数据。它非常“鸡贼”(聪明),遵循一个核心原则:

数据少时,死抠内存(用紧凑型结构);数据多时,追求速度(用索引型结构)。

所以,理解 Redis 的关键,不在于死记硬背,而在于理解这种动态切换的逻辑。我们将底层的核心结构归纳为6 种(如果不算被淘汰的,主要就是这 6 大金刚)。


二、 6 大底层数据结构详解

1. SDS:简单动态字符串 (Simple Dynamic String)

  • 这是什么:它是 String 类型的基石。

  • 为什么要造轮子:C 语言原本的字符串(以\0结尾)有两个大毛病:一是获取长度要遍历,慢;二是容易缓冲区溢出,不安全。

  • 长什么样:

    你就把它想象成一个带计数器的数组。

    Plaintext
    [ len: 5 | free: 2 | buf: "Redis\0.." ]

    它记录了当前长度len,所以获取长度是 O(1) 的;而且它预分配了空间,防止频繁申请内存。

2. IntSet:整数集合

  • 这是什么:当你用SADD往 Set 里只存整数,且数量不多时,Redis 会用这个。

  • 长什么样:

    这就是一个排序好的整数数组。

    Plaintext
    [1, 5, 9, 12, 20]

    因为是有序的,查找时使用二分查找,虽然比哈希表慢一点点,但非常非常省内存,因为没有指针开销。

3. Dict:字典 (哈希表)

  • 这是什么:这是 Redis 的骨架。Hash、Set、ZSet 的大数据存储都靠它。

  • 长什么样:

    标准的 数组 + 链表 结构,用来解决哈希冲突。

  • 它的绝活:渐进式 Rehash。

    它内部有两个哈希表 ht[0] 和 ht[1]。当需要扩容时,它不会一次性把所有数据搬过去(那样会卡死主线程),而是每次增删改查时顺手搬一点,后台再搬一点,不知不觉就完成了扩容。

4. ZipList / Listpack:压缩列表 / 紧凑列表

  • 这是什么:这是 Redis 省内存的神器。

  • 长什么样:

    别被“列表”两个字骗了,它在物理内存上其实是一整块连续的内存条(像数组)。

    Plaintext
    [总长度|尾偏移|元素1|元素2|元素3|结尾]

    它没有指针(指针在 64 位系统很占地),而是直接挨着存数据。

  • 重要更新

    • ZipList:老版本用的,有个致命缺陷叫“连锁更新”(改一个元素长度,后面全得跟着改)。

    • Listpack:Redis 7.0 引入的接班人。结构类似,但去掉了导致连锁更新的字段。现在新版 Redis 里的 Hash 和 ZSet 小数据底层都换成这个了。

5. QuickList:快速列表

  • 这是什么:List(列表)对象的专用底层。

  • 长什么样:

    它是“链表”和“压缩列表”的混血儿。

    普通的链表指针太多太费内存,ZipList 太长了插入又慢。QuickList 就在中间取了个平衡:

    宏观上是一个双向链表,但链表的每个节点里,存的不是一个数据,而是一整块 ZipList/Listpack。

6. SkipList:跳表

  • 这是什么:ZSet(有序集合)的灵魂。

  • 长什么样:

    你可以把它理解为**“多层级的高速公路”**。

    普通链表查找要从头遍历。跳表在链表上面加了几层索引(Level)。

    • L3: 1 -> 50 -> 100

    • L2: 1 -> 10 -> 20 -> ... -> 50

    • L1: 1 -> 2 -> 3 -> ...

      查找时,先走上层大步跳跃,快到了再下层精细查找。效率直逼二叉树,但实现简单得多。


三、 终极映射:对象 vs 结构

了解了这 6 大结构,我们最后把它们和 5 大对象对应起来,这就是面试的满分答案

如果你用这个命令...数据少/小时 (省内存)数据多/大时 (高性能)
String(SET)int(纯数字)SDS
List(LPUSH)QuickListQuickList
Hash(HSET)Listpack(旧:ZipList)Dict
Set(SADD)IntSetDict
ZSet(ZADD)Listpack(旧:ZipList)Dict + SkipList

总结一下

Redis 的设计哲学其实就两句话:

  1. 能省则省:数据少的时候,用连续内存(Listpack, IntSet),没有指针开销。

  2. 该快则快:数据多的时候,上重型索引(Dict, SkipList),保证高并发下的响应速度。

搞懂了这 6 种结构和这种动态切换的逻辑,Redis 的底层对你来说就是透明的了。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/23 20:14:54

14、Linux 系统 I/O 设备管理与驱动详解

Linux 系统 I/O 设备管理与驱动详解 1. I/O 架构概述 计算机正常工作需要数据路径来实现 CPU、RAM 和 I/O 设备之间的信息流动,这些数据路径统称为总线,是计算机内部的主要通信通道。常见的总线类型有 ISA、EISA、PCI 和 MCA 等。 总线实际上由三种专用总线组成: - 数据…

作者头像 李华
网站建设 2026/6/23 22:17:11

15、Linux磁盘缓存机制解析

Linux磁盘缓存机制解析 1. 磁盘缓存概述 磁盘缓存是一种软件机制,能让系统将原本存于磁盘的数据保存在RAM中,从而使后续对这些数据的访问无需再访问磁盘,可快速完成。除了VFS用于加速文件路径名转换为对应inode的dentry缓存外,Linux主要使用两种磁盘缓存:缓冲区缓存(bu…

作者头像 李华
网站建设 2026/6/23 22:17:17

16、深入理解文件访问机制:从读写操作到内存映射与直接I/O

深入理解文件访问机制:从读写操作到内存映射与直接I/O 在操作系统中,文件访问是一个核心且复杂的操作,涉及虚拟文件系统(VFS)抽象、块设备处理以及磁盘缓存的使用。下面将详细探讨文件的读写操作、内存映射以及直接I/O传输等关键概念。 1. 文件读写操作 1.1 读写系统调…

作者头像 李华
网站建设 2026/6/23 22:17:17

17、Linux内存交换与页面回收机制解析

Linux内存交换与页面回收机制解析 1. 交换机制概述 交换机制主要有两个目的:一是扩展进程实际可用的地址空间,二是增加动态RAM的容量以加载进程。例如,当程序的数据结构所需空间超过可用RAM大小时,交换区能让程序正常加载运行;当用户同时运行多个大内存应用程序时,交换…

作者头像 李华
网站建设 2026/6/23 12:55:03

18、深入解析Ext2与Ext3文件系统

深入解析Ext2与Ext3文件系统 1. Ext2文件系统概述 Unix类操作系统使用多种文件系统,每个文件系统的实现方式不同。早期Linux基于Minix文件系统,后来出现的扩展文件系统(Ext FS)性能不佳。1994年引入的第二扩展文件系统(Ext2),具备高效、健壮的特点,成为最广泛使用的L…

作者头像 李华
网站建设 2026/6/23 22:18:45

20、Unix系统中的进程通信机制详解

Unix系统中的进程通信机制详解 在Unix系统中,用户模式进程之间的同步和数据交换是一个重要的话题。由于用户模式进程需要依赖内核来实现进程间的同步和通信,因此了解相关的机制和系统调用是非常必要的。下面将详细介绍Unix系统中几种常见的进程通信机制。 1. 进程通信概述 …

作者头像 李华