第1章搜索引擎的历史和现状
1.1 搜索引擎的历史
1.2搜索引擎的分类
1.3搜索引擎的现状
1.4世界主要搜索引擎介绍
1.4.1Google
1.4.2百度
1.4.3 Technorati
1.4.4 A11theweb
1.4.5 Ask.com
1.4.6 MSN Search
小结
参考文献
第2章数据挖掘
2.1 数据挖掘概览
2.1.1 为什么要做数据挖掘
2.1.2数据挖掘的任务
2.1.3 关联挖掘和分析
2.1.4多子类
2.1.5聚类分析
2.1.6序列模式分析
2.1.7偏差分析
2.2 数据挖掘的常用技术
2.2.1 人工神经网络
2.2.2统计分析
小结
参考文献
第3章搜索引擎的数据结构
3.1 存储结构
3.1.1 四种基本存储方法
3.2 索引
3.2.1 倒排索引
3.3结构化查询语言
3.4海量数据系统
小结
参考文献
第4章 搜索引擎的基本结构
4.1 网络爬虫
4.2 排序
4.2.1 网页的权重
4.2.2向量空间模型VSM
4.2.3扩展相关信息
4.3 索引系统
4.4缓存机制
小结
参考文献
第5章 搜索引擎爬虫
5.1 深度优先与广度优先
5.1.1 网页链接情况概览
5.1.2取得有效的网贾文字
……
第6章搜索引擎索引系统
第7章分布式搜索引擎设计
第8章Goog1e搜索引擎的结构
第9章中文分词
第10章分类与聚类
第11章内容消重和SPAM消除
第12章图像搜索引擎
附录
展开