Redis 中的 LFU 算法源码解析

发布于:2025-03-29 ⋅ 阅读:(83) ⋅ 点赞:(0)

Redis 的 LFU(Least Frequently Used,最不经常使用)淘汰算法主要用于 maxmemory-policy 设置为 allkeys-lfuvolatile-lfu 时,以最少使用频率的键进行淘汰。其核心实现涉及到 访问频率计数时间衰减机制,源码主要集中在 src/server.csrc/evict.c 文件中。

1. LFU 计数存储

Redis 采用 8-bit 的 LRU 字段 来存储访问频率计数,存储在 robj 结构体的 lru 字段中:

struct redisObject {
    unsigned type:4;
    unsigned encoding:4;
    unsigned lru:LRU_BITS; // 用于 LRU/LFU 计算
    int refcount;
    void *ptr;
};

其中 lru 变量的 8-bit 空间被拆分:

  • 前 6-bitcounter):用于存储访问计数,最大值 63。
  • 后 2-bitclock):用于时间衰减计算。

2. 访问计数的计算

LFU 计数在每次访问键时都会递增,但递增方式不是简单 +1,而是使用 对数增长 方式,避免某些键因高访问量而垄断:

unsigned long LFUDecrAndReturn(robj *o) {
    unsigned long counter = LFUGetCounter(o);
    if (counter == 0) return 0;
    if (rand() % (counter + 1) == 0) counter--;
    LFUSetCounter(o, counter);
    return counter;
}
  • 计数增长时:
    int LFUIncrAndReturn(robj *o) {
        unsigned long counter = LFUGetCounter(o);
        if (counter < 63) {
            if (rand() % (counter + 1) == 0) counter++;
        }
        LFUSetCounter(o, counter);
        return counter;
    }
    
    这意味着:
    • 初始时计数增长较快 (1 → 2 → 3…)
    • 计数越高,增长概率越低(符合 对数曲线
    • 这样可以防止某些高访问量键长期存活。

3. LFU 访问频率的衰减

由于有些数据可能短期内访问频繁,但长期不再被访问,因此 Redis 采用了 时间衰减机制

  • 1 分钟 递减一次访问计数。
  • 使用 2-bit 记录最近访问的时间 lfu_clock,每隔 60s 触发 衰减
    #define LFU_INIT_VAL 5 // 初始访问计数
    unsigned long LFUDecrAndReturn(robj *o) {
        unsigned long counter = LFUGetCounter(o);
        if (counter == 0) return 0;
        if (rand() % (counter + 1) == 0) counter--;
        LFUSetCounter(o, counter);
        return counter;
    }
    
    • 该方法会按照一定概率减少计数,确保 近期访问过的键不会轻易被淘汰,而 长时间未访问的键会逐步淘汰

4. 淘汰策略

maxmemory 超出时,Redis 需要淘汰一部分数据,LFU 主要执行:

  • 遍历数据,找到访问计数最小的键。
  • 采用 volatile-lfuallkeys-lfu 进行数据删除:
    evictionPoolPopulate(dict *sample_dict) {
        // 从字典中随机采样 N 个键
        for (i = 0; i < EVPOOL_SIZE; i++) {
            lfu = LFUGetCounter(entry);
            if (lfu < min_lfu) {
                min_lfu = lfu;
                min_entry = entry;
            }
        }
        // 淘汰访问次数最少的
        dictDelete(sample_dict, min_entry);
    }
    
  • 采用 近似随机采样,而不是遍历所有键,提高效率。

5. 关键总结

  • 存储方式:使用 robj.lru 变量的 8-bit 空间存储访问计数和时间信息。
  • 访问计数增长:采用对数增长策略,防止单个键因访问量过大而占用内存。
  • 时间衰减:每分钟对访问频率计数进行衰减,确保长期未访问的键被淘汰。
  • 淘汰策略:采样多个键,找到访问计数最少的键进行删除。

Redis 的 LFU 机制相比 LRU 更适用于热点数据访问场景,避免了某些短期流行的键占用大量缓存,同时也能让真正的 高频访问数据 存活更久。


网站公告

今日签到

点亮在社区的每一天
去签到