销书升级,原书是国内第一本讲解搜索引擎开发的畅销书
超值,提供了价值上万元的大型数码产品搜索引擎开发案铡,可直接应用于项目
版本最新,采用了最新的Heritrix-1.140版、HTMLParser1.6.0版、DWR2.0.5版
实践性强,用案例的方式讲解,便于读者实践
注重原理讲解,提供了结构框图和流程图,讲解搜索引擎的原理
《开发自己的搜索引擎:Lucene+Heritrix(第2版)》在第1版的基础上做了以下改变:
重新组织了实例中开发前期的准备内容,涉及信息来源准备、基本开发环境准备、工程总体框架和配置信息管理等。
升级了内核代码版本,使用Heritrix-1.14.0版本,并增加了网络爬虫Heritrix代码工程导人和配置的详细步骤。
升级了实例代码,解决了因来源网站内容变更而导致的部分代码无法执行的问题。
增加了对网页内容分析的概述和基本说明,便于读者理解相关代码和内容。
HTMLParser升级到1.6.0版本。为了适应网站代码的修改,变动了其中的正则分析代码和网页解析代码。
更新了实例中与文档组织和存储相关的内容,并根据所分析网站页面内容的变化,升级了其中的部分代码。
升级交互篇和用户Web界面中的核心代码为DWR2.0.5版本,并针对目前的主流技术,对搜索引擎交互方式进行分析和介绍,还增加了代码的部分图例说明。
展开