搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
信息检索:算法与启发式方法
0.00    
图书来源: 浙江图书馆(由图书馆配书)
  • 配送范围:
    全国(除港澳台地区)
  • ISBN:
    9787115235756
  • 作      者:
    (美)David A. Grossman,(美)Ophir Frieder著
  • 出 版 社 :
    人民邮电出版社
  • 出版日期:
    2010
收藏
内容介绍
    本书是“信息检索”课程的优秀教材,书中对信息检索的概念、原理和算法进行了详细介绍,内容主要包括检索模型与算法、检索实用策略、跨语言信息检索、查询处理、融合结构化数据和文本、并行信息检索以及分布式信息检索等,并给出了阐述算法的大量实例。<br>    本书有一定的广度和深度,而且所有的内容都用当前的技术阐述,是高等院校计算机及信息管理等专业本科生和研究生的理想教材,对信息检索领域的科研和技术人员也是很好的参考书。
展开
精彩书摘
    8.4 P2P信息系统
    现在,我们来关注一个新兴的领域,它是互联网领域和信息检索的交叉领域,即P2P体系结构。P2P体系结构是分布式环境,根据其定义,认为网络上的每个节点都是潜在的信息源(服务器),也是需求信息的客户端(客户端),同时也是信息传播的中间路由器(路由器)。每个节点都是独立的,而且系统以纯粹无中心的方式运行。而在信息检索系统领域,所提供的资源都是以可检索数据的形式呈现的。
    P2P系统最主要的特点就在于其天然的随机性以及耐久性。P2P系统可以从容地处理系统中节点的加入与离开。这些节点提供的资源都可以根据需要在系统中动态添加或者删除。此外,单一节点的故障不会导致整个系统崩溃。
    P2P运动的起源通常要归功于Napster(它是一个音乐文件共享系统),尽管Napster实际上依靠的还是依据中心集中式方式而实现的。也就是说,Napster并不是以完全无中心的形式存在的,因此,这并不是一个纯粹意义上的P2P体系。但是,Napster确实为用户提供了P2P的功能,因为用户可以与他人动态地共享文件。Napster从性能和可靠性的角度看存在一些争议,除此之外,Napster的集中式实现模式最终也注定了它会遇到法律问题。现在,Napster再也不能以其原来的形式存在了。Napster的灭亡给P2P技术爱好者带来了教训。作为回应,他们创建了Gnutella协议[V0.4,2004],这是真正的P2P,是许多当今P2P研究的基础。(Gnutella协议[V0.6,20041的后续版本也存在,并扩展了P2P的体系结构,引入了层次结构。该协议及其应用稍后讨论。)
    基于Gnutella(版本0.4)协议的系统一般只提供了最原始的搜索能力。也就是说,它们一般依赖于名称精确搜索,而名称精确搜索往往通过子串匹配来实现。具体来说,如果查询中的所有词是某个文件元数据的子串,那么查询就匹配该文件。匹配的文件按照其元数据与查询的相似度进行分组,最终返回到客户端。目前,我们还没有可为大家接受的方法来对这些分组进行排序。用户选择其中的一组结果,从相应的服务器下载相关文件[Rohrs,2000;Rohrs,2001]。
    大多数基于Gnutella协议(版本0.4)建立的P2P信息检索系统依然存在其他问题,其中包括:网络全局泛滥问题、搜索结果不确定而且精度差。因为从定义上看,P2P信息检索系统是无中心的,所以对于每一个检索请求,信息将被发送到所有有可能含有相关文档的节点上。因为每个节点搜索与文档排序的计算能力是有限的,所以任何潜在的相关文档都会发送到请求的节点上。给定潜在相关文档的数目,结果信息的网络总流量一般会大大高于已有的网络资源。这种情况就称为网络全局泛滥。为了减少信息传输量,文献[Yu等人,2003]研究了一种结果过滤和合并的技术,而且节点一般都会收集邻居节点的信息。因此,查询请求节点所需的潜在结果到达中间节点时,只将合并和过滤过的结果返回到请求节点。层次P2P网络的最新合并技术可参见文献[Lu和Callan,2004]。
    ……
展开
目录
第1章  引言<br>第2章  检索模型与算法<br>2.1  向量空间模型<br>2.2  概率检索模型<br>2.3  语言模型<br>2.4  推理网络<br>2.5  扩展布尔检索<br>2.6  LSI<br>2.7  神经网络<br>2.8  遗传算法<br>2.9  模糊集检索<br>2.10  本章小结<br>2.11  练习题<br>第3章  检索实用策略<br>3.1  相关反馈<br>3.2  聚类<br>3.3  基于段落的检索<br>3.4  n元语法<br>3.5  回归分析<br>3.6  同义词表<br>3.7  语义网络<br>3.8  语言解析<br>3.9  本章小结<br>3.10  练习<br>第4章  CLIR<br>4.1  简介<br>4.2  跨越语言障碍<br>4.3  跨语言检索模型与算法<br>4.4  跨语言检索实用策略<br>4.5  本章小结<br>4.6  练习题<br>第5章  检索效率优化<br>5.1  倒排索引<br>5.2  查询处理<br>5.3  签名文件<br>5.4  重复文档检测<br>5.5  本章小结<br>5.6  练习题<br>第6章  结构化数据与文本的融合<br>6.1  关系模型回顾<br>6.2  相关工作进展<br>6.3  信息检索作为关系应用<br>6.4  使用关系模式进行半结构化搜索<br>6.5  多维数据模型<br>6.6  协同器<br>6.7  本章小结<br>6.8  练习题<br>第7章  并行信息检索<br>第8章  分布式信息检索<br>第9章  总结与下一步研究方向<br>参考文献<br>索引
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证