揭开搜索引擎的奥秘,全中文索引
前言Ⅲ
第1章网络搜索引擎简介1
1 1信息检索简史1
1 2传统信息检索回顾5
1 3网络信息检索9
第2章网络爬行、索引建立和查询处理15
2 1网络爬行15
2 2内容索引19
2 3查询处理21
第3章通过欢迎度对网页排名25
3 11998年的情景25
3 2两篇论文26
3 3查询无关性30
第4章谷歌PageRank的数学31
4 1PageRank的原始求和公式32
4 2求和方程的矩阵表示33
4 3迭代过程问题34
4 4一点关于马尔可夫链理论的介绍36
4 5基本模型的早期修正36
4 6PageRank向量的计算39
4 7谷歌矩阵的谱定理及其证明45
第5章PageRank模型中的参数47
5 1α因子47
5 2超链接矩阵H48
5 3跳转矩阵E49
第6章PageRank的敏感性57
6 1对α的敏感性57
6 2对H的敏感性62
6 3对vT的敏感性63
6 4其他敏感性分析63
6 5有关敏感性的定理和证明66
第7章作为线性系统的PageRank问题71
7 1(I-αS)的性质71
7 2(I-αH)的性质72
7 3PageRank稀疏线性系统的证明73
第8章PageRank大规模实现中的问题75
8 1存储问题75
8 2收敛准则79
8 3精度79
8 4悬挂结点80
8 5对后退按钮建模84
第9章加速PageRank计算89
9 1一种自适应的幂法89
9 2外插90
9 3聚合94
9 4其他数值方法97
第10章更新PageRank向量99
10 1两类更新问题及其发展历程100
10 2重启幂法101
10 3使用近似聚合进行近似更新102
10 4精确聚合104
10 5精确聚合与近似聚合的比较105
10 6利用迭代聚合进行更新107
10 7确定划分109
10 8结论111
第11章HITS网页排名方法115
11 1HITS算法115
11 2HITS的实现117
11 3HITS的收敛性119
11 4HITS示例120
11 5HITS的优点与缺点122
11 6HITS与文献统计学的关系123
11 7查询无关的HITS124
11 8加速HITS126
11 9HITS的敏感性126
第12章网页排名的其他链接方法131
12 1SALSA131
12 2混成排名方法135
12 3基于流量的排名136
第13章网络信息检索的未来139
13 1垃圾信息139
13 2个性化142
13 3聚类142
13 4智能体143
13 5趋势与时间敏感搜索144
13 6隐私和审查146
13 7图书馆分类方式147
13 8数据融合148
第14章网络信息检索资源149
14 1入门阶段的资源149
14 2用于严肃的科学研究的资源150
第15章数学指南153
15 1线性代数153
15 2佩隆弗罗贝尼乌斯定理167
15 3马尔可夫链175
15 4佩隆补186
15 5随机补192
15 6设限194
15 7聚合195
15 8去聚合198
第16章术语汇编201
参考文献207
索引218
“(对)于任何希望深究PageRank如何运作的人而言,我都会向他们推荐《网页排名PR值及其他》。”
——斯蒂芬 H怀尔德斯特洛姆(Stephen HWildstrom),《商业周刊》
“(本书)对PageRank及相关的搜索引擎算法进行了综合而广博的介绍,并用一种平易近人的方式一一写来。”
——乔纳森(Jonathan),《时代·高等教育副刊》
“(一本)对搜索引擎如何运作感兴趣的人们的必读之作。”
——迈克尔 W贝里(Michael WBerry),《SIAM评论》
“(一部)优秀的作品。”
——伊安 D高登(Ian DGondon),《图书馆学报》
“如果我现在还正在修读或讲授线性代数的课程,那这本书将对我助益匪浅。”
——埃德盖斯特纳(Ed Gerstner),《自然·物理》
“《网页排名PR值及其他》对于任何希望了解搜索引擎细节的人——学生或专业人士——而言,都会是一次不错的阅读体验。”
——詹姆斯·亨德勒(James Hendler),《今日物理》