第1章 搜索引擎概述
1.1 搜索引擎的概念、原理及历史与发展
1.1.1 搜索引擎的概念
1.1.2 搜索引擎的原理
1.2 搜索引擎的历史与发展趋势
1.2.1 搜索引擎的发展史
1.2.2 搜索引擎的发展趋势
1.3 搜索引擎的分类
1.3.1 全文搜索引擎
1.3.2 目录索引搜索引擎
1.3.3 元搜索引擎
1.3.4 分布式搜索引擎
1.4 搜索引擎的关键技术
1.4.1 信息收集和存储技术
1.4.2 信息预处理技术
1.4.3 信息索引技术
1.5 主要搜索引擎介绍
1.5.1 谷歌搜索
1.5.2 雅虎搜索
1.5.3 百度搜索
1.5.4 北大天网搜索
1.6 小结
思考题
第2章 搜索引擎基础
2.1 搜索引擎的体系结构
2.1.1 搜索器
2.1.2 索引器
2.1.3 检索器
2.1.4 用户接口
2.2 搜索引擎的工作原理
2.2.1 网页搜集
2.2.2 网页处理
2.2.3 查询服务
2.3 搜索引擎的数据结构
2.3.1 存储结构
2.3.2 信息库
2.3.3 文本索引
2.3.4 词典
2.3.5 采样表
2.3.6 前向索引
2.3.7 后向索引
2.4 元搜索引擎
2.4.1 元搜索引擎的基本构成
2.4.2 元搜索引擎的分类
2.4.3 常用元搜索引擎介绍
2.4.4 元搜索引擎的特点
2.4.5 主要技术指标
2.5 个性化搜索引擎
2.5.1 系统模块及其功能
2.5.2 个性化搜索引擎的关键技术
2.6 智能搜索引擎
2.6.1 智能搜索引擎特征
2.6.2 智能搜索引擎主要技术
2.7 小结
思考题
第3章 网页抓取技术
3.1 搜索引擎爬虫
3.1.1 网络爬虫工作原理
3.1.2 开源网络爬虫简介
3.1.3 网页信息的抓取
3.2 搜索引擎爬虫的关键技术
3.2.1 网页抓取优先策略
3.2.2 深度优先策略
3.2.3 广度优先策略
3.2.4 最佳优先策略
3.2.5 不重复抓取策略
3.2.6 网页重访策略
3.2.7 网页抓取提速策略
3.2.8 Robots协议
3.3 小结
思考题
第4章 网页信息预处理技术
第5章 信息索引技术
第6章 信息查询与评价技术
第7章 多媒体信息检索技术
第8章 搭建基于Lucene的搜索引擎
第9章 搭建基于Nutch的搜索引擎
参考文献
展开