本书配备源代码和700分钟视频讲解,结合理论与实践,从AST这一个知识点出发,由浅入深,带领读者掌握反爬虫AST的原理,并帮助读者培养解决实际问题的能力。
AST是目前爬虫领域的热点。
《反爬虫AST原理与还原混淆实战(微课视频版)/清华科技大讲堂》从AST这一个知识点出发,由浅入深,带领读者掌握反爬虫AST的原理,并帮助读者培养解决实际问题的能力。
《反爬虫AST原理与还原混淆实战(微课视频版)/清华科技大讲堂》共11章,分为四部分。首部分(第1~4章)介绍开发环境的搭建方法、Web调试的必备技巧以及爬虫与反爬虫的基本知识;第二部分(第5~6章)讲解混淆JavaScript代码的手工逆向方法与JavaScript代码安全防护的原理;第三部分(第7~8章)讲解AST的原理与API的使用方法;第四部分(第9~11章)以AST为基础,讲解自动化的JavaScript代码防护与还原方案,并带领读者进行实战训练。
《反爬虫AST原理与还原混淆实战(微课视频版)/清华科技大讲堂》适合作为计算机培训的教材,也可供安全开发人员、爬虫初学者以及想要在爬虫领域进阶的人员学习。
第1章 搭建开发环境
1.1 Node.js环境搭建
1.1.1 Node.js安装配置
1.1.2 Babel安装
1.1.3 Visual Studio Code安装配置
1.2 Python环境配置
1.2.1 Python3.7 安装
1.2.2 requests请求库安装
1.2.3 bs4解析库安装
1.3 Fiddler抓包工具
1.4 AST Explorer网站在线生成抽象语法树
1.5 小结
1.6 习题
第2章 Web网站的调试与抓包分析
2.1 Chrome开发者工具
2.1.1 Elements面板
2.1.2 Console面板
2.1.3 Sources面板
2.1.4 Network面板
2.1.5 Application面板
2.2 JS逆向调试技巧
2.2.1 善用搜索
2.2.2 查看请求调用堆栈
2.2.3 XHR请求断点
2.2.4 Console插桩
2.2.5 堆内存函数调用
2.2.6 复制Console面板输出
2.3 本地覆盖
2.3.1 Chrome local override
2.3.2 Fiddler自动响应
2.4 Ajax-hook
2.4.1 Ajax-hook源码分析
2.4.2 Ajax-hook拦截
2.5 网易易盾滑块验证码调试分析
2.6 小结
2.7 习题
……
第3章 爬虫与反爬虫
第4章 常规反爬虫技术
第5章 混淆JS手动逆向方法
第6章 JS代码安全防护原理
第7章 AST抽象语法树的原理与实现
第8章 AST的API详解
第9章 AST自动化JS防护方案
第10章 AST自动化JavaScript还原方案
第11章 AST还原JS实战
——rOysue独立安卓安全研究员
★和岳阳认识两年来,一直非常佩服他的爬虫能力,更让人赞赏的是,他能将复杂的逻辑、知识通过各种方法拆解,让所有人都能轻松理解。技术能力和教学能力的精进都需要天赋与努力结合,岳阳文理综合的背景完美地将这两个方面融合了起来。对于希望在反爬虫方向精进的读者,这本书是一个非常好的切入点。
——毕滢清华大学学生创客空间协会创始人
★本书由浅入深,叙述了JavaScript逆向的发展和对抗,从开发者、逆向等多维角度去思考并且详细介绍了AST混淆等技巧值得学习。
——珍惜逆向工作从业者
★卓斌的课程由浅入深,既能各维度地补充基础知识,也能深入底层原理。他擅长用通俗易懂的方式来讲解各种复杂性专题,深得学生喜爱,讲课能力一绝。
——许炜资深爬虫工程师