搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
Web搜索
0.00    
图书来源: 浙江图书馆(由图书馆配书)
  • 配送范围:
    全国(除港澳台地区)
  • ISBN:
    9787040278170
  • 作      者:
    郭军[著]
  • 出 版 社 :
    高等教育出版社
  • 出版日期:
    2009
收藏
作者简介
    郭军,教授,现任北京邮电大学信息与通信工程学院院长,日本东北学院大学博士、博士生导师。主要学术兼职包括国家自然科学基金委员会信息科学部学科评审组成员、北京市科学技术奖评审专家组成员、北京市计算机与控制学科高级职称评审组副组长、中国人工智能学会理事、中国自动识别协会专家组成员、中文信息处理学会理事等。主要社会兼职包括北京市政协委员、北京市高级知识分子联谊会理事、中共中央统战部信息员等。<br>    现主要从事Web搜索、模式识别、网络管理等方面的研究。在SCIENCE、IEEE Trans.on PAMI、IEICE Trans、ICPR、IOOV、SIGIR等模式识别、计算机视觉以及信息检索领域国际顶级刊物和会议上发表了多篇论文。出版著作6部,其中《网络管理》一书被评为首批(2004年)北京市精品教材。
展开
内容介绍
    《Web搜索》内容包括导论、文本检索、图像检索、音频检索、信息过滤、信息推荐以及发展前沿。对Web搜索的基本概念进行定义,阐述其科学价值和研究状况,根据Web搜索所涵盖的检索、过滤以及推荐技术,论述其中的核心问题、基本概念和基本方法,并介绍Web搜索若干新的研究方向。<br>    《Web搜索》的最大特点是将Web上的信息检索、过滤和推荐等技术定义为Web搜索,使其具有比较宽泛的内涵。将Web检索、过滤和推荐统一在一个体系中,既符合这三项技术发展的现状和趋势,又便于读者进行系统的学习和研究。另外,《Web搜索》紧跟近年来的最新研究进展,具有显著的先进性和独特性。<br>    《Web搜索》可以作为信息、通信、计算机类研究生或高年级本科生的教材和教学参考书,也可作为专业技术人员的阅读和培训资料。
展开
精彩书评
    本书最主要的特色是将信息“检索”、“过滤”和“推荐”一并考虑,具有前瞻性意义;另外一个特色是在讨论搜索的时候,不仅考虑了传统上为主的文本,也一并考虑了当前越来越重要的图像视频和语音的检索问题,很好地结合了作者的研究工作领域特长。<br>    ——李晓明<br>    <br>    随着网络技术的发展和普及,Web搜索技术也变得越来越重要。现在的互联网上,信息——包括文本、图像、视频和语音信息——可以说已经非常丰富,关键是让用户方便快捷地找到这些信息。这正是本书所探讨的主要内容。<br>    ——马少平
展开
精彩书摘
    Web搜索广阔的应用领域、巨大的社会经济作用以及高度的技术挑战性使其充满了科学研究价值。<br>    第一,Web搜索所研究的是一个崭新的科学问题,即如何在无边的动态的Web信息中寻找最符合用户需求的信息。这个问题不仅在尺度上空前巨大,而且约束条件非常不确定。因为系统通常难以了解用户真正的信息需求。用户总是希望以最简单的提问或最便捷的操作,如输入少量关键字的方式来表达自己的请求,因而系统得到的指示是十分笼统和模糊的。我们应该认识到,Web搜索在计算规模和约束的不确定性方面已经将人类的科学研究带到了一个新高度。<br>    第二,Web搜索既要考虑信息的客观性,又要考虑信息的主观性。所谓信息的客观性,是指信息的数据形式在Web中是客观存在的,不论面对哪个主体(用户),承载信息的数据都是相同的。而信息的主观性是指同样的数据给用户提供的信息(量)是不同的。一篇介绍摄影常识的文章对初学者来说可能“很有信息量”,而对一个摄影师来说信息量几乎为零。在Web搜索中,上述客观性因素和主观性因素都会影响搜索结果的正确性(质量)。这种特点在普通的自然科学研究中是很少见的,因此引起了人们更大的研究兴趣。<br>    第三,Web搜索强有力地带动了相关学科,特别是智能学科的发展。智能学科中的自然语言理解、模式识别、机器学习、数据挖掘等在Web搜索中找到了巨大的发展空间,近年来已经形成了空前高涨的研究热潮。例如文本分类、多媒体识别、海量数据挖掘、在线增量机器学习、在线分类和聚类、信息抽取、信息摘要、命名实体识别等研究都紧密地与Web搜索联系了起来。商用搜索引擎的智能化趋势也正是在这些研究的基础上形成的。甚至可以预期Web搜索将成为一个大面积涵盖智能学科的新兴独立学科。
展开
目录
    第1章 导论<br>    1.1 Web搜索的定义<br>    1.2 Web搜索的发展背景<br>    1.3 Web搜索的挑战性<br>    1.4 Web搜索的科学价值<br>    1.5 Web搜索的研究状况<br>    1.6 本书的内容<br>    <br>    第2章 文本检索<br>    2.1 引言<br>    2.2 Web信息采集<br>    2.2.1 Crawler的基本原理<br>    2.2.2 Crawler的工作效率<br>    2.2.3 Crawler的难题<br>    2.3 文本的保存与索引<br>    2.3.1 预处理<br>    2.3.2 文本的保存<br>    2.3.3 文本的索引<br>    2.3.4 索引词的选取<br>    2.4 检索模型<br>    2.4.1 Boolean模型<br>    2.4.2 VSM<br>    2.4.3 概率模型<br>    2.5 网页排序<br>    2.6 查询重构<br>    2.6.1 用户相关反馈<br>    2.6.2 自动局部分析<br>    2.6.3 自动全局分析<br>    2.7 文本聚类<br>    2.7.1 区分法<br>    2.7.2 生成法<br>    2.8 文本分类<br>    2.8.1 K-NN分类器<br>    2.8.2 Bayes分类器<br>    2.8.3 最大熵分类器<br>    2.8.4 区分式分类器<br>    2.9 特征选择<br>    2.9.1 包含算法<br>    2.9.2 排除算法<br>    2.1 0特征变换<br>    2.1 0.1 自组织映射<br>    2.1 0.2 潜语义标号<br>    小结<br>    习题<br>    <br>    第3章 图像检索<br>    3.1 引言<br>    3.2 图像检索的发展过程<br>    3.3 文本自动标注<br>    3.3.1 基于二维多粒度隐:Markov模型的二类标注<br>    3.3.2 有监督的多类标注SMI<br>    3.4 物体识别<br>    3.4.1 星群模型<br>    3.4.2 异构星状模型<br>    3.5 文字识别<br>    3.5.1 引言<br>    3.5.2 离线文字识别系统<br>    3.5.3 非线性归一化<br>    3.5.4 余弦整形变换<br>    3.5.5 方向线素特征抽取<br>    3.5.6 渐进式计算的马氏距离分类器<br>    3.5.7 基于模具的文字切分<br>    3.6 人脸检测与识别<br>    3.6.1 Adaboost人脸检测算法<br>    3.6.2 常见的人脸识别算法<br>    3.6.3 非限定性人脸识别算法<br>    3.7 视频检索<br>    3.7.1 概述<br>    3.7.2 镜头切分<br>    3.7.3 视频摘要<br>    小结<br>    习题<br>    <br>    第4章 音频检索<br>    4.1 引言<br>    4.2 声学特征抽取<br>    4.2.1 时域特征抽取<br>    4.2.2 频域特征抽取<br>    4.3 HMM模型<br>    4.3.1 基本概念与原理<br>    4.3.2 3个基本问题及其经典算法.<br>    4.4 连续语音识别系统<br>    4.4.1 基于HMM的语音识别统一框架<br>    4.4.2 声学模型<br>    4.4.3 语言模型<br>    4.4.4 解码器<br>    4.5 语音关键词发现技术<br>    4.5.1 基于垃圾模型的关键词发现<br>    4.5.2 语音关键词发现中的核心问题<br>    4.5.3 一个侧重确认的语音关键词发现系统<br>    4.6 语音词汇检测技术<br>    4.6.1 混淆网络<br>    4.6.2 一个基于音节混淆网络的STD系统<br>    4.7 非语音音频检索<br>    4.7.1 概述<br>    4.7.2 声学模型<br>    4.7.3 语义模型<br>    4.7.4 声学空间与语义空间的联系<br>    4.8 音乐检索<br>    4.8.1 概述<br>    4.8.2 哼唱检索<br>    4.8.3 基于语义描述的音乐标注及检索<br>    小结<br>    习题<br>    <br>    第5章 信息过滤<br>    5.1 引言<br>    5.2 基本方法<br>    5.2.1 基于Bayes分类器的过滤<br>    5.2.2 基于向量距离分类器的过滤<br>    5.2.3 基于k近邻分类器的过滤<br>    5.2.4 基于SVM的过滤<br>    5.2.5 系统性能评价<br>    5.3 模型学习<br>    5.3.1 生成式与区分式学习<br>    5.3.2 降维变换<br>    5.3.3 半监督学习<br>    5.3.4 演进式学习<br>    5.4 垃圾邮件及垃圾短信过滤<br>    5.4.1 垃圾邮件过滤系统<br>    5.4.2 垃圾短信的过滤<br>    5.5 话题检测与跟踪系统<br>    5.5.1 报道分割<br>    5.5.2 事件检测<br>    5.5.3 事件跟踪<br>    小结<br>    习题<br>    <br>    第6章 信息推荐<br>    6.1 引言<br>    6.2 关联规则挖掘的基本算法<br>    6.2.1 基本定义<br>    6.2.2 Apfiofi关联规则挖掘算法<br>    6.2.3 基于FPT的算法<br>    6.3 可信关联规则及其挖掘算法<br>    6.3.1 相关定义<br>    6.3.2 用邻接矩阵求2项可信集<br>    6.3.3 由k项可信集生成(k+1)项可信集<br>    6.3.4 基于极大团的可信关联规则挖掘算法<br>    6.4 基于FPT的超团模式快速挖掘算法<br>    6.4.1 相关定义<br>    6.4.2 基于FPT的超团模式和极大超团模式挖掘<br>    6.5 协同过滤推荐的基本算法<br>    6.6 基于局部偏好的协同过滤推荐算法<br>    6.7 基于个性化主动学习的协同过滤<br>    6.8 面向排序的协同过滤<br>    小结<br>    习题<br>    <br>    第7章 发展前沿<br>    7.1 内网检索及对象检索<br>    7.2 基于文档的专家检索<br>    7.2.1 基于文档的专家表示<br>    7.2.2 基于文档的专家检索<br>    7.3 对象检索及信息抽取<br>    7.3.1 对象检索的基本概念<br>    7.3.2 信息抽取<br>    7.4 基于Web的对象检索<br>    7.5 博客检索<br>    7.6 TREC中的博客观点检索<br>    7.7 文本情感分析<br>    7.7.1 文本情感分析中的特征抽取<br>    7.7.2 情感分类模型<br>    小结<br>    习题<br>    参考文献
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证