大数跨境
0
0

搜索引擎索引之索引更新策略

搜索引擎索引之索引更新策略 SEO实战营
2017-01-11
22
导读:动态索引通过在内存中维护临时索引,可以实现对动态文档和实时搜索的支持。但是服务器内存总是有限的,随着新加入系统的文档越来越多,临时索引消耗的内存也会随之增加。

搜索引擎索引更新策略详解

动态索引与内存管理

动态索引通过内存维护临时索引来支持实时搜索,但随着文档增多,需合理更新策略以释放内存[1]。常见的索引更新策略有:完全重建、再合并、原地更新及混合策略。

完全重建策略(Complete Re-Build):新增文档达到一定量时,将新老文档合并后重新建立索引,替代旧索引响应查询。此策略适合小文档集,主流商业搜索引擎多采用[2]

图 3-16 完全重建策略

再合并策略(Re-Merge):新增文档进入系统时,维护临时倒排索引。当内存满时,将增量索引与老索引合并生成新索引,提高合并效率。但在处理未变化的单词时耗时[3]

图 3-17 再合并策略

原地更新策略(In-Place):避免重写未变索引信息,直接在老索引追加数据,但因磁盘管理和迁移成本,实际效率低于再合并策略[4]

图 3-19 原地更新策略

混合策略(Hybrid):根据单词特性分类采用不同策略,优化性能[5]

【声明】内容源于网络
0
0
SEO实战营
不断创造SEO黑科技,做全方位SEO守护者!
内容 2166
粉丝 3
SEO实战营 不断创造SEO黑科技,做全方位SEO守护者!
总阅读79.6k
粉丝3
内容2.2k