搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
搜索引擎的数据压缩与查询优化
0.00     定价 ¥ 30.00
图书来源: 浙江图书馆(由浙江新华配书)
此书还可采购25本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787567305991
  • 作      者:
    作者:宋省身|责编:刘璟珺
  • 出 版 社 :
    国防科技大学出版社
  • 出版日期:
    2022-11-01
收藏
作者简介
  宋省身,1990年出生于河南濮阳,博士毕业于国防科技大学计算机学院,现任国防科技大学前沿交叉学科学院副教授,研究方向为数据分析、信息检索与自然语言处理,承担和参与多项信息检索相关科研课题研究,以首作者发表论文十余篇、申请专利多项。
展开
内容介绍
本书深入浅出地介绍了搜索引擎中倒排索引结构的发展简史以及常用的结构设计和压缩算法、查询算法,并基于作者的研究成果,介绍了几种索引压缩和查询的完整解决方案。本书主要面向信息检索专业方向的研究生、从事搜索引擎相关工作和其他对搜索技术感兴趣的人群。读者除了可从书中获取严谨的理论知识,还可以依照其中的方法重现试验,用于搭建测试平台或者实际使用。本书旨在抛砖引玉,以期为应对信息检索面临的挑战提供参考。
展开
目录
第1章 搜索引擎中的效率问题
1.1 引言
1.2 背景和意义
1.3 主要研究内容
1.4 组织结构

第2章 信息检索与搜索引擎
2.1 信息检索
2.2 搜索引擎
2.3 倒排索引与检索模型

第3章 倒排索引压缩与查询相关背景知识
3.1 现代硬件体系结构
3.2 倒排索引结构
3.3 倒排索引的压缩算法
3.3.1 面向整数的压缩算法
3.3.2 面向分块的压缩算法
3.3.3 基于SIMD的压缩算法
3.4 倒排链表的求交算法
3.4.1 多倒排链求交算法
3.4.2 搜索算法
3.5 倒排链表的排序查询
3.5.1 相关性模型
3.5.2 两种基本的查询处理方式
3.5.3 top-k查询处理算法研究现状
3.6 本章小结

第4章 基于空间最优划分的倒排索引压缩算法
4.1 引言
4.2 基于近似划分的分块压缩算法
4.2.1 基于DAG的倒排链表划分策略
4.2.2 ExtendedAFOR压缩算法
4.2.3 最优划分的VSEncoding压缩算法
4.3 自启发式划分的Elias-Fano索引压缩算法
4.3.1 分块Elias-Fano索引
4.3.2 线性划分策略
4.4 实验测试与结果分析
4.4.1 基于近似划分的分块压缩算法测试
……

第5章 混合索引在双权重标准下的时空均衡压缩算法
第6章 基于并行指令集的倒排链快速求交算法
第7章 排序查询算法的剪枝加速优化技术
第8章 总结与展望

参考文献
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证