内存管理与淘汰策略深度解析

面试开场白

面试官：Redis 内存满了会怎么样？有哪些淘汰策略？

你：Redis 内存达到 maxmemory 上限后，根据 maxmemory-policy 配置决定行为。默认 noeviction 直接拒绝写入；常用缓存策略有 allkeys-lru（淘汰最久未访问的 key）和 allkeys-lfu（淘汰访问频率最低的 key）；如果要保护部分数据不被淘汰，可以用 volatile-lru 只在有 TTL 的 key 中淘汰。

面试官：那 Redis 的 LRU 是精确 LRU 吗？为什么这样设计？

这个追问考察是否真正理解了 Redis 的工程权衡。能说出”近似 LRU”和采样机制的，证明深入研究了底层实现。

链式追问一：过期键删除策略

Q1：Redis 的过期键是怎么删除的？必考

回答要点：

两种策略配合：

策略	触发时机	优点	缺点
惰性删除	访问 key 时检查是否过期	CPU 友好（只检查访问的 key）	内存不友好（过期 key 不访问就不删）
定期删除	每隔一段时间随机扫描	平衡 CPU 和内存	可能遗漏部分过期 key

惰性删除流程：

客户端 GET key
  │
  ↓
Redis 检查 key 是否存在
  ├─ 不存在 → 返回 nil
  └─ 存在 → 检查是否过期
             ├─ 未过期 → 返回 value
             └─ 已过期 → 删除 key，返回 nil

定期删除流程：

# 伪代码
def active_expire_cycle():
    for db in all_databases:
        # 每次随机抽取 20 个设置了 TTL 的 key
        keys = random_sample(db.expires, 20)
        expired_count = 0
        for key in keys:
            if is_expired(key):
                delete(key)
                expired_count += 1

        # 自适应：如果过期比例 > 25%，继续扫描
        if expired_count / len(keys) > 0.25:
            continue_scanning(db)

为什么不选定时删除？

定时删除（TTL 到期立即删除）：
  - 需要为每个 key 维护一个定时器
  - 100 万个 key = 100 万个定时器
  - 定时器本身占用大量内存
  - 大量 key 同时过期时，CPU 飙升
  → 内存和 CPU 开销都不可接受 ❌

性能数据：

测试场景：100 万个 key，设置 10 秒 TTL
- 定时删除：需要维护 100 万个定时器，内存占用约 100MB
- 惰性 + 定期：无额外内存开销，定期删除 CPU 占用约 5%

测试场景：10 万个 key 同时过期
- 定时删除：触发 10 万次定时器回调，CPU 飙升到 100%
- 定期删除：分批处理，CPU 平稳，约 10%

本质一句话：惰性删除保证访问时的正确性，定期删除防止内存泄漏，两者结合实现 CPU 和内存的平衡。

Q2：一个 key 设置了 10 秒 TTL，10 秒后一定会被删除吗？高频

详细解析：

不一定会立即删除，取决于访问情况：

场景1：10 秒后有客户端访问
┌──────────────────────────────────┐
│ T0: SET key "value" EX 10        │
│ T10: key 过期（但内存中仍存在）    │
│ T11: 客户端 GET key              │
│      → 惰性删除触发，立即删除      │
│      → 返回 nil                  │
└──────────────────────────────────┘

场景2：10 秒后没有客户端访问
┌──────────────────────────────────┐
│ T0: SET key "value" EX 10        │
│ T10: key 过期（但内存中仍存在）    │
│ T10.1: 定期删除扫描到该 key       │
│        → 删除 key                │
└──────────────────────────────────┘

场景3：定期删除也未扫到
┌──────────────────────────────────┐
│ T0: SET key "value" EX 10        │
│ T10: key 过期                    │
│ T20: 定期删除仍未扫到该 key       │
│      → key 仍在内存中（内存泄漏）│
│ T30: 客户端 GET key              │
│      → 惰性删除触发，删除 key     │
└──────────────────────────────────┘

实际影响：

EXPIRE/TTL 命令查到的过期时间是精确的：
  TTL key → 返回剩余秒数（-2 表示已过期，-1 表示永不过期）

EXISTS 返回值：
  过期后 EXISTS 返回 0（即使 key 仍在内存中）
  → Redis 内部标记了过期状态

GET 行为：
  过期后 GET 返回 nil
  → 触发惰性删除，实际删除 key

定期删除的扫描频率：

# redis.conf
hz 10  # 每秒执行 10 次定期删除（每 100ms 一次）
dynamic-hz yes  # 根据连接数动态调整 hz

代码示例：

SET mykey "value" EX 10
TTL mykey  -- 返回 10（剩余 10 秒）

-- 等待 10 秒
TTL mykey  -- 返回 -2（已过期）
EXISTS mykey  -- 返回 0（不存在）
GET mykey  -- 返回 nil（触发惰性删除）

本质一句话：过期 key 不保证立即删除，但保证访问时返回正确结果（惰性删除），最终会被定期删除清理。

链式追问二：内存淘汰策略

Q3：Redis 有哪些内存淘汰策略？生产环境推荐哪个？必考

回答要点：

8 种淘汰策略：

策略	淘汰范围	策略说明	适用场景
`noeviction`	不淘汰	直接拒绝写入	数据不能丢失，如消息队列
`allkeys-lru`	所有 key	淘汰最久未访问的	纯缓存，访问均匀 ⭐推荐
`allkeys-lfu`	所有 key	淘汰访问频率最低的	有明显热点数据 ⭐推荐
`allkeys-random`	所有 key	随机淘汰	几乎不用
`volatile-lru`	有 TTL 的 key	淘汰最久未访问的	部分数据不能丢
`volatile-lfu`	有 TTL 的 key	淘汰访问频率最低的	部分数据不能丢
`volatile-ttl`	有 TTL 的 key	淘汰 TTL 最短的	业务数据有明确优先级
`volatile-random`	有 TTL 的 key	随机淘汰	几乎不用

策略选择指南：

纯缓存场景（所有数据可重新生成）：
  ├─ 访问模式均匀 → allkeys-lru
  └─ 有明显热点 → allkeys-lfu

混合存储（部分数据不能丢）：
  ├─ 重要数据不设 TTL → volatile-lru（只淘汰非重要数据）
  └─ 所有数据都有 TTL → volatile-ttl（按 TTL 排序）

严格数据安全：
  └─ noeviction + 业务层限流 + 监控告警

配置示例：

# redis.conf
maxmemory 4gb                    # 设置内存上限
maxmemory-policy allkeys-lru     # 淘汰策略
maxmemory-samples 5              # LRU/LFU 采样数量

性能对比：

测试场景：100 万个 key，内存上限 80%，写入 20 万新 key
- noeviction：拒绝写入，写入失败率 100%
- allkeys-lru：淘汰 20 万旧 key，写入成功率 100%，命中率 85%
- allkeys-lfu：淘汰 20 万旧 key，写入成功率 100%，命中率 92%（热点场景）
- volatile-lru：淘汰 20 万有 TTL 的 key，写入成功率 100%，保护无 TTL 数据

本质一句话：纯缓存用 allkeys-lru 或 allkeys-lfu，混合存储用 volatile-lru，严格数据安全用 noeviction + 监控。

Q4：volatile-lru 和 allkeys-lru 有什么区别？如何选择？高频

详细解析：

核心差异：

volatile-lru：
  淘汰范围：只在设置了 TTL 的 key 中淘汰
  保护对象：无 TTL 的 key（永久数据）
  风险：如果所有 key 都有 TTL → 等同于 allkeys-lru
        如果所有 key 都无 TTL → 无 key 可淘汰 → OOM

allkeys-lru：
  淘汰范围：在所有 key 中淘汰（包括无 TTL 的 key）
  保护对象：无
  优势：简单直接，适合纯缓存场景

场景对比：

场景1：纯缓存（用户 Session、商品详情页）
  所有数据都可再生 → 用 allkeys-lru
  例：缓存 100 万个商品详情，内存满时淘汰最旧的商品

场景2：混合存储（缓存 + 业务数据）
  ├─ 缓存数据（商品详情）→ 设置 TTL
  ├─ 业务数据（分布式锁、限流计数）→ 不设 TTL
  → 用 volatile-lru，只淘汰缓存，保护业务数据

场景3：错误配置示例
  业务数据（分布式锁）+ 缓存数据（商品详情）
  ├─ 所有 key 都设了 TTL → volatile-lru 会淘汰业务数据！❌
  └─ 正确做法：业务数据不设 TTL，缓存数据设 TTL

代码示例：

-- 场景：混合存储
SET lock:order:1001 "uuid-xxx" NX EX 30    -- 分布式锁（有 TTL）
SET cache:user:1001 "json_data" EX 3600    -- 缓存（有 TTL）
SET config:max_size "1000"                  -- 配置（无 TTL，永久保存）

-- volatile-lru 淘汰策略
-- 只会淘汰 lock:order:* 和 cache:user:*（有 TTL）
-- config:max_size 永远不会被淘汰（无 TTL）

-- allkeys-lru 淘汰策略
-- 可能淘汰 config:max_size（如果很久没访问）
-- 业务异常！❌

性能数据：

测试场景：100 万 key，50% 有 TTL，内存满
- volatile-lru：只淘汰 50 万有 TTL 的 key，保护 50 万永久数据
- allkeys-lru：淘汰所有 key 中最旧的，可能淘汰永久数据

风险：
  volatile-lru + 所有 key 都有 TTL → 淘汰所有 key → 业务数据丢失
  volatile-lru + 所有 key 都无 TTL → 无法淘汰 → OOM

本质一句话：volatile-lru 用 TTL 区分”可淘汰”和”不可淘汰”，适合混合存储场景；allkeys-lru 适合纯缓存场景。

链式追问三：近似 LRU 实现

Q5：Redis 的 LRU 为什么是”近似 LRU”而不是精确 LRU？高频

回答要点：

精确 LRU 的代价：

# 精确 LRU 数据结构（双向链表 + 哈希表）
class LRUCache:
    def __init__(self):
        self.cache = {}           # 哈希表：key → node
        self.head = Node()         # 双向链表头
        self.tail = Node()         # 双向链表尾
        self.head.next = self.tail
        self.tail.prev = self.head

    def get(self, key):
        node = self.cache[key]
        # 移动到链表头部（最近访问）
        self.remove(node)
        self.add_to_head(node)
        return node.value

    def put(self, key, value):
        if key in self.cache:
            # 更新并移到头部
            node = self.cache[key]
            node.value = value
            self.remove(node)
            self.add_to_head(node)
        else:
            # 新节点加到头部
            node = Node(key, value)
            self.cache[key] = node
            self.add_to_head(node)

    def evict(self):
        # 淘汰链表尾部（最久未访问）
        node = self.tail.prev
        self.remove(node)
        del self.cache[node.key]

精确 LRU 的内存开销：

每个 key 需要额外存储：
  - 双向链表节点：2 个指针（prev + next）= 16 字节
  - 哈希表指针：1 个指针 = 8 字节
  总计：24 字节/key

示例：100 万个 key
  - 额外内存：24MB × 100 万 = 24GB
  - 占用 Redis 内存约 50% ❌

Redis 的近似 LRU：

核心思路：不维护全局排序，只在淘汰时随机采样

实现：
  每个 redisObject 有一个 24 位的 lru 字段：
    ┌────────────────────────────────┐
    │ type (4b) │ enc (4b) │ lru (24b) │ ...
    └────────────────────────────────┘
                          ↑ 记录最后访问时间（秒级）

  淘汰时：
    1. 随机采样 N 个 key（默认 5 个）
    2. 找到 lru 值最小的（最久未访问）
    3. 删除该 key

采样数量对精度的影响：

采样数量	接近精确 LRU 的程度	额外开销
3 个	约 70%	极低
5 个（默认）	约 85%	低
10 个	约 95%	中
20 个	约 98%	高

性能对比：

测试场景：100 万个 key，淘汰 10 万个
- 精确 LRU：命中率 100%，内存开销 24GB，每次访问需移动节点
- 近似 LRU（采样 5）：命中率 85%，内存开销 24MB，无额外开销
- 近似 LRU（采样 10）：命中率 95%，内存开销 24MB，淘汰时略慢

结论：近似 LRU 用 15% 的命中率损失，换来 1000 倍的内存节省。

本质一句话：精确 LRU 需要双向链表，内存开销巨大；近似 LRU 只需 24 位时间戳，通过随机采样在精度和内存间取得平衡。

Q6：maxmemory-samples 设置多少合适？越大越好吗？中频

详细解析：

采样数量 vs 性能：

采样 3 个：
  - 淘汰速度：极快（遍历 3 个 key）
  - 精度：约 70%（可能淘汰不太旧的 key）
  - 适用：内存充足，淘汰频率低

采样 5 个（默认）：
  - 淘汰速度：快
  - 精度：约 85%（足够好）
  - 适用：大多数场景

采样 10 个：
  - 淘汰速度：中等
  - 精度：约 95%（接近精确 LRU）
  - 适用：热点数据明显，对命中率要求高

采样 20 个：
  - 淘汰速度：慢（遍历 20 个 key）
  - 精度：约 98%
  - 适用：极端场景，几乎不用

性能测试：

测试场景：100 万 key，每秒淘汰 1000 个 key
- 采样 5 个：淘汰耗时约 0.5ms/千次，命中率 85%
- 采样 10 个：淘汰耗时约 1ms/千次，命中率 95%
- 采样 20 个：淘汰耗时约 2ms/千次，命中率 98%

结论：
  采样从 5 增加到 10，命中率提升 10%，性能下降约 50%。
  采样从 10 增加到 20，命中率提升 3%，性能下降约 100%。

推荐：大多数场景用默认值 5，热点明显场景用 10。

配置示例：

# redis.conf
maxmemory-samples 5  # 默认值，适合大多数场景

# 如果业务对命中率要求极高（如商品详情页缓存）
maxmemory-samples 10

本质一句话：maxmemory-samples 默认 5 已足够好，调到 10 可提升命中率，但性能下降明显，需根据业务权衡。

链式追问四：LFU 淘汰策略

Q7：LFU 和 LRU 的区别是什么？各自适合什么场景？高频

回答要点：

核心差异：

LRU（Least Recently Used）：
  淘汰标准：最近一次访问时间
  特点：保护最近访问的 key，不管历史访问频率
  盲点：一个 key 昨天访问了 100 万次，今天一次没访问，LRU 会保护它（因为最近访问过）

LFU（Least Frequently Used）：
  淘汰标准：历史访问频率
  特点：保护高频访问的 key，不管最近访问时间
  盲点：一个历史热点 key 已经不再访问，LFU 仍保护它（频率高）

场景对比：

场景	LRU 表现	LFU 表现	推荐
新闻资讯（时效性强）	✅ 新新闻热门，旧新闻淘汰	⚠️ 旧新闻频率高，不淘汰	LRU
商品详情页（有爆款）	⚠️ 爆款商品可能被淘汰	✅ 爆款商品持续热门	LFU
用户 Session	✅ 活跃用户保护，僵尸用户淘汰	⚠️ 历史活跃用户不淘汰	LRU
推荐系统（热点明显）	⚠️ 热点可能被淘汰	✅ 热点始终保护	LFU

代码示例：

场景：商品详情页缓存
商品 A（爆款）：昨天访问 100 万次，今天访问 10 次
商品 B（新品）：今天访问 100 次

LRU 策略：
  如果商品 A 今天未访问，商品 B 今天访问
  → 淘汰商品 A（最近访问时间旧）❌

LFU 策略：
  商品 A 频率：100 万 + 10 = 1000010
  商品 B 频率：100
  → 淘汰商品 B（频率低）✅

LFU 的衰减机制：

问题：历史热点 key 不再访问，但频率高，永不淘汰
解决：LFU 频率随时间衰减

Redis 的 LFU 实现：
  lru 字段（24 位）分为两部分：
    ┌──────────────────┬────────────┐
    │ 16 位：上次衰减时间│ 8 位：频率  │
    └──────────────────┴────────────┘

  每次访问时：
    1. 根据上次衰减时间，计算应该衰减多少
       衰减量 = (当前时间 - 上次衰减时间) / lfu-decay-time
       默认 lfu-decay-time = 1（每分钟衰减 1）
    2. 频率 = max(0, 频率 - 衰减量)
    3. 按 Morris 概率递增频率

性能数据：

测试场景：缓存 10 万个商品详情页，访问模式为"爆款商品持续热门"
- allkeys-lru：命中率 75%（爆款商品可能被淘汰）
- allkeys-lfu：命中率 92%（爆款商品持续保护）

测试场景：缓存 10 万篇新闻，访问模式为"新新闻热门，旧新闻冷门"
- allkeys-lru：命中率 88%（新新闻保护，旧新闻淘汰）
- allkeys-lfu：命中率 70%（旧新闻频率高，不淘汰）

本质一句话：LRU 适合时效性强的场景（新闻、Session），LFU 适合有明显热点的场景（爆款商品），LFU 需衰减机制防止历史热点不淘汰。

Q8：LFU 的概率计数器是什么？为什么不用精确计数？加分

详细解析：

Morris 概率计数原理：

# 精确计数
counter = 0
def increment():
    counter += 1  # 每次访问 +1

# Morris 概率计数
counter = 0
def increment():
    if counter == 255:  # 最大值
        return 255
    # counter 越大，递增概率越小
    base_val = (counter - 5) * lfu_log_factor + 1
    if random() < 1.0 / base_val:
        counter += 1

为什么用概率计数？

问题1：精确计数需要的位数
  100 万次访问 → 需要 20 位（2^20 = 1048576）
  1 亿次访问 → 需要 27 位
  → 每个 key 需要 27 位存储计数器，内存开销大

问题2：Redis 只给了 8 位
  lru 字段共 24 位：
    - 16 位存上次衰减时间
    - 8 位存频率（0~255）
  → 8 位如何表示百万级访问？

解决：Morris 概率计数
  用 8 位（0~255）表示约 1000 万次访问
  - counter = 10 → 约 100 次访问
  - counter = 100 → 约 10 万次访问
  - counter = 255 → 约 1000 万次访问

Morris 计数表：

counter 值	对应访问次数（lfu_log_factor=10）
0	0
10	约 100
50	约 1 万
100	约 10 万
150	约 100 万
200	约 500 万
255	约 1000 万

递增概率计算：

# lfu_log_factor = 10（默认值）
def increment(counter):
    if counter == 255:
        return 255
    base_val = (counter - 5) * 10 + 1
    if random() < 1.0 / base_val:
        return counter + 1
    return counter

# 示例：
counter = 0:  base_val = (0-5)*10 + 1 = -49 → 概率 100%（必定递增）
counter = 10: base_val = (10-5)*10 + 1 = 51 → 概率 1/51 ≈ 2%
counter = 100: base_val = (100-5)*10 + 1 = 951 → 概率 1/951 ≈ 0.1%

性能对比：

测试场景：统计 100 万个 key 的访问频率
- 精确计数（27 位）：内存开销 100 万 × 27b ≈ 3.4MB
- 概率计数（8 位）：内存开销 100 万 × 8b ≈ 1MB

误差：
- 精确计数：0%
- 概率计数：约 5%（可接受，LFU 只需相对频率）

本质一句话：LFU 用 Morris 概率计数器，用 8 位表示百万级访问，通过”counter 越大，递增概率越小”的对数增长，极致节省内存。

链式追问五：内存优化实战

Q9：生产中 Redis 内存持续增长，该怎么排查？实战

场景示例：

现象：
  - Redis 内存从 2GB 持续增长到 8GB
  - maxmemory 设置为 10GB，快满了
  - 业务响应变慢

排查步骤：

# 1. 查看内存使用情况
redis-cli INFO memory
# 重点关注：
#   used_memory: 8589934592        (8GB)
#   used_memory_rss: 9663676416     (OS 分配 9GB)
#   mem_fragmentation_ratio: 1.12   (碎片率 1.12，正常)
#   maxmemory: 10737418240          (10GB)

# 2. 查看淘汰策略
redis-cli CONFIG GET maxmemory-policy
# 1) "maxmemory-policy"
# 2) "noeviction"   ← 问题！不淘汰，内存会持续增长

# 3. 查看 key 数量和类型
redis-cli DBSIZE
# (integer) 5000000   (500 万个 key)

redis-cli INFO keyspace
# db0:keys=5000000,expires=1000000,avg_ttl=3600000
# 500 万个 key，只有 100 万设置了 TTL

# 4. 扫描大 key
redis-cli --bigkeys
# -------- summary -------
# Biggest string found 'user:session:1001' has 1048576 bytes (1MB)
# Biggest hash found 'user:profile:1001' has 10000 fields
# 1000 keys with 1MB+ string values

# 5. 查看是否有内存泄漏（过期 key 未删除）
redis-cli DEBUG SLEEP 0.1  # 暂停 0.1 秒，触发过期删除
redis-cli INFO keyspace
# db0:keys=4800000,expires=950000  (删除了 20 万过期 key)

常见问题和解决：

问题1：淘汰策略为 noeviction
  解决：改为 allkeys-lru 或 volatile-lru
  redis-cli CONFIG SET maxmemory-policy allkeys-lru

问题2：大量 key 未设置 TTL
  解决：为缓存数据设置 TTL
  redis-cli --scan --pattern "cache:*" | xargs redis-cli EXPIRE {} 3600

问题3：存在大 key（String > 1MB，Hash > 5000 字段）
  解决：拆分大 key
  - 大 Hash：按字段分组
  - 大 String：压缩或分块

问题4：内存碎片率高（> 1.5）
  解决：开启碎片整理（Redis 4.0+）
  redis-cli CONFIG SET activedefrag yes

监控指标：

关键指标：
  - used_memory / maxmemory > 80% → 告警
  - mem_fragmentation_ratio > 1.5 → 碎片整理
  - evicted_keys > 0 → 淘汰频繁，考虑扩容
  - expired_keys 增长过快 → TTL 设置不合理

本质一句话：内存持续增长排查步骤：查内存使用 → 查淘汰策略 → 查 key 数量和 TTL → 查大 key → 查内存碎片。

Q10：如何发现和处理 Redis 中的大 key？实战

场景示例：

现象：
  - Redis 偶尔出现延迟峰值（几百毫秒）
  - 网络带宽占用高
  - 集群模式下某个节点内存占用远高于其他节点

发现大 key：

# 方法1：redis-cli --bigkeys（推荐）
redis-cli --bigkeys
# 扫描所有 key，报告各类型的最大 key

# 方法2：redis-cli --memkeys（Redis 7.0+）
redis-cli --memkeys
# 按内存占用排序，报告最大的 key

# 方法3：MEMORY USAGE 命令
redis-cli MEMORY USAGE user:profile:1001
# (integer) 1048576  (1MB)

# 方法4：RDB 分析工具
redis-rdb-tools --command memory dump.rdb > memory.csv
# 分析 RDB 文件，生成 CSV 报告

大 key 的危害：

危害1：网络传输慢
  GET big_key (10MB) → 传输耗时约 100ms（100Mbps 网络）
  客户端超时或阻塞

危害2：内存分配/释放耗时
  DEL big_key → 同步释放 10MB 内存，耗时约 50ms
  主线程阻塞

危害3：集群数据倾斜
  big_key 在节点 A，节点 A 内存占用远高于其他节点
  导致节点 A 提前触发淘汰或 OOM

处理方案：

# 方案1：删除大 key（必须用 UNLINK，不要用 DEL）
UNLINK big_key  -- 异步删除，立即返回，后台慢慢清理

# 方案2：拆分大 Hash
# 原来的大 Hash：user:1001 有 10000 个字段
HGETALL user:1001  -- 返回 10000 个字段，耗时 200ms

# 拆分后：
HSET user:1001:profile name "Alice" age 30    -- 基本信息
HSET user:1001:settings theme "dark" lang "zh" -- 设置
HSET user:1001:stats login_count 100         -- 统计

# 方案3：压缩大 String
# 原来的大 String：HTML 片段，1MB
SET cache:page:1001 "<html>...</html>"

# 压缩后：
import gzip
compressed = gzip.compress(html_bytes)  # 压缩到 100KB
redis.set("cache:page:1001", compressed)

# 方案4：分块存储大 List
# 原来的大 List：logs 有 100 万条日志
LRANGE logs 0 -1  -- 返回 100 万条，耗时 5 秒

# 分块后：
LPUSH logs:20240301 "log1" "log2" ...
LPUSH logs:20240302 "log3" "log4" ...
# 按日期分块，每块最多 1000 条

删除大 key 的正确姿势：

# ❌ 错误：用 DEL（同步删除，阻塞主线程）
redis-cli DEL big_key
# 主线程阻塞数百毫秒

# ✅ 正确：用 UNLINK（异步删除）
redis-cli UNLINK big_key
# 立即返回，后台线程清理

# ✅ 正确：对于 Hash/List/Set，分批删除
# Hash 示例
for field in $(redis-cli HKEYS big_hash); do
  redis-cli HDEL big_hash $field
done
redis-cli DEL big_hash

# List 示例
while [ $(redis-cli LLEN big_list) -gt 0 ]; do
  redis-cli LTRIM big_list 1000 -1  # 每次删除前 1000 个
done
redis-cli DEL big_list

性能对比：

测试场景：删除 10MB 的 String key
- DEL：主线程阻塞约 100ms
- UNLINK：立即返回，后台清理约 50ms

测试场景：删除 10000 字段的 Hash
- DEL：主线程阻塞约 200ms
- UNLINK：立即返回，后台清理约 150ms
- 分批删除（每次删 100 字段）：主线程阻塞约 2ms × 100 次 = 200ms（分散）

本质一句话：大 key 用 --bigkeys 或 MEMORY USAGE 发现，用 UNLINK 异步删除，用拆分、压缩、分块等方式预防。

总结

核心要点回顾

过期键删除：惰性删除（访问时检查）+ 定期删除（随机扫描），平衡 CPU 和内存
8 种淘汰策略：纯缓存用 allkeys-lru/lfu，混合存储用 volatile-lru，数据安全用 noeviction
近似 LRU：不维护全局排序，随机采样 5~10 个 key，用 24 位时间戳，极致省内存
LFU + 衰减：用 Morris 概率计数器（8 位表示百万级访问），随时间衰减防止历史热点不淘汰
大 key 处理：UNLINK 异步删除，拆分 Hash，压缩 String，分块 List

面试高频考点

<Badge text="必考" variant="danger" /> Redis 的过期键是怎么删除的？
<Badge text="必考" variant="danger" /> 内存满了会怎样？有哪些淘汰策略？
<Badge text="必考" variant="danger" /> volatile-lru 和 allkeys-lru 的区别？如何选择？
<Badge text="高频" variant="tip" /> 为什么用近似 LRU 而不是精确 LRU？
<Badge text="高频" variant="tip" /> LFU 和 LRU 的区别？各自适合什么场景？
<Badge text="高频" variant="tip" /> maxmemory-samples 设置多少合适？
<Badge text="实战" variant="caution" /> Redis 内存持续增长，怎么排查？
<Badge text="实战" variant="caution" /> 如何发现和处理大 key？
<Badge text="加分" variant="success" /> LFU 的概率计数器原理？为什么用 8 位？