

LevelDB 辅助工具类

数新智能科技号

2025-08-18

导读：开篇解析 Bloom Filter 在数据检索中的高效过滤机制，继而阐释 LRU 缓存对提升访问性能的关键作用。同时涵盖其他实用工具类的功能特性，辅以参考资料佐证。通过多维度剖析，为理解 LevelD

line-height: 1.75em;letter-spacing: 1.5px;font-size: 14px;color: rgb(51, 51, 51);background: none;">

本文聚焦《LevelDB 辅助工具类》，系统梳理其核心组件。开篇解析 Bloom Filter 在数据检索中的高效过滤机制，继而阐释 LRU 缓存对提升访问性能的关键作用。同时涵盖其他实用工具类的功能特性，辅以参考资料佐证。通过多维度剖析，为理解 LevelDB 底层优化逻辑提供清晰指引。

Bloom Filter

代码位于：util/bloom.cc
接口位于：include/leveldb/filter_policy.h

接口中的三个函数：

构造函数

这里的k_是哈希函数的个数，固定为 1 - 30
bits_per_key 表示每个元素使用的位个数
布隆过滤器的存储空间大小m，哈希函数个数k和元素总的个数n之间存在如下一个计算公式

创建过滤器

向上取整，为 8的倍数，然后将 bloom filter 函数个数，push 到 dst 中
遍历 n 个元素，对每个元素计算哈希值
这里并没有计算k个哈希，而是只计算了一次，获得了一个原始值h
之后遍历k次，然后计算h的增量
这样的话，效率会高很多，而且准确率也不差

查找的匹配函数

也是类似的
读取出 bloom filter的数据，以及长度，构建出 array 数组
首先计算出 hash值然后遍历k次，也就是k个函数，然后跟创建的时候类似
通过h % bits，就得到了具体的位下标
然后看看数组中的这一位是否设置为1，非1直接返回 false
否则计算增量，如果k次计算都满足，则返回 true

布隆过滤器的使用，两个类

FilterBlockBuilder，创建布隆过滤器，并写入到 SSTable中
FilterBlockReader，读取元数据块，调用 BloomFilterPolicy 检查是否匹配

FilterBlockBuilder

首先调用 Add，将 key进去，将所有的key直接拼在一起，比如 aa、bb、cc、dd，拼在一起就是aabbccdd，中间没有分割
记录没每个key的起始位置，根据每个key的起始位置，前后相减，就得到了长度
根据起始位置和长度，就封装出了 Slice，将这些 key都临时保存
如果数据超过了 2K，则生成布隆过滤器，也就是调用 policy_->CreateFilter 创建
传入的是之前生成的三个参数
std::vector tmp_keys_、std::string result_、num_keys

FilterBlockReader

首先构建出布隆过滤器
然后根据 key的偏移量，计算出这个key，封装为 Slice，调用 KeyMayMatch 进行判断

LRU缓存

包含了四个关键类

LRUHandle
HandleTable
LRUCache
ShardedLRUCache

ShardedLRUCache 是对 LRUCache 的封装，包含了 16个 LRUCache，目的是减少锁粒度

其查找函数如下：

HashSlice 就是根据 key 返回一个 hash值 Shard，则取这个 hash 值的高 4位，这样就可以找到对应的 LRUCache 了

LRUHandle 是双链表的节点

fbab-4453-bb50-737e38cd5073.png" data-type="png" data-w="1080" type="block" src="https://cdn.10100.com/content/20251217/dcd01619-fbab-4453-bb50-737e38cd5073.png">