第1章 搜索引擎中的效率问题
1.1 引言
1.2 背景和意义
1.3 主要研究内容
1.4 组织结构
第2章 信息检索与搜索引擎
2.1 信息检索
2.2 搜索引擎
2.3 倒排索引与检索模型
第3章 倒排索引压缩与查询相关背景知识
3.1 现代硬件体系结构
3.2 倒排索引结构
3.3 倒排索引的压缩算法
3.3.1 面向整数的压缩算法
3.3.2 面向分块的压缩算法
3.3.3 基于SIMD的压缩算法
3.4 倒排链表的求交算法
3.4.1 多倒排链求交算法
3.4.2 搜索算法
3.5 倒排链表的排序查询
3.5.1 相关性模型
3.5.2 两种基本的查询处理方式
3.5.3 top-k查询处理算法研究现状
3.6 本章小结
第4章 基于空间最优划分的倒排索引压缩算法
4.1 引言
4.2 基于近似划分的分块压缩算法
4.2.1 基于DAG的倒排链表划分策略
4.2.2 ExtendedAFOR压缩算法
4.2.3 最优划分的VSEncoding压缩算法
4.3 自启发式划分的Elias-Fano索引压缩算法
4.3.1 分块Elias-Fano索引
4.3.2 线性划分策略
4.4 实验测试与结果分析
4.4.1 基于近似划分的分块压缩算法测试
……
第5章 混合索引在双权重标准下的时空均衡压缩算法
第6章 基于并行指令集的倒排链快速求交算法
第7章 排序查询算法的剪枝加速优化技术
第8章 总结与展望
参考文献
展开