本书全面而系统地介绍与网络爬虫程序相关的理论知识,并包含大量的实践操作案例。
本书共分为8章。第1章以自动化框架为基础,介绍网络爬虫程序的入门开发实践。第2章深入讲解网页内容的处理、解析技术和数据提取方法。第3章讨论验证码识别技术以及如何有效绕过验证码的策略。第4章涉及网络抓包技术及其对抗策略。第5章深入探讨JavaScript代码的混淆技术与逆向分析方法。第6章专注于移动端应用程序的数据爬取技术及相关逆向分析技术。第7章介绍构建分布式网络爬虫系统所需的关键技术。第8章通过实战案例,展示分布式网络爬虫系统设计与实现的思路。通过学习本书,读者将显著提升网络爬虫系统的设计与实现能力,并增强对网页代码及移动端应用程序代码的逆向分析水平。
本书的内容不仅涵盖理论知识,还注重实践操作,适合广大网络爬虫程序开发爱好者阅读。同时,本书也适合作为培训机构和学校的教学参考用书。
展开