搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
AI编程班(Python×ChatGPT网络爬虫从入门到精通)
0.00     定价 ¥ 89.00
图书来源: 浙江图书馆(由浙江新华配书)
此书还可采购25本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787576333602
  • 作      者:
    编者:李杰臣|责编:江立
  • 出 版 社 :
    北京理工大学出版社
  • 出版日期:
    2024-01-01
收藏
畅销推荐
内容介绍
网络爬虫是人们从互联网中收集宝贵信息的重要工具之一。然而,许多人可能因为缺乏编程知识或技术难度而望而却步。本书旨在解决这一问题,通过结合ChatGPT人工智能技术和爬虫技巧,使得爬取网络数据变得轻松易行。 本书以易于理解的语言,深入浅出地介绍了爬虫和ChatGPT的相关基础知识,以及如何将它结合起来,实现更智能、更精准的数据收集和处理。全书包含Python入门、ChatGPT基础、网页的初步分析、静态网页的爬取、动态网页的爬取、爬虫数据的处理和分析、爬虫技术进阶综合实战:财经数据爬取、综合实战:社交媒体数据爬取、综合实战:电商数据爬取、综合实战:人力资源数据爬取和综合实战:媒体文件下载共12个章节的内容。 无论是初学者还是有一定经验的开发者,本书都提供了一个全面的指南,教会其如何借助ChatGPT技术让爬虫在信息的海洋中游刃有余。
展开
目录
第1章 Python入门
1.1 安装Python编程环境
1.2 管理第三方模块
1.3 在代码中导入模块
1.4 测试Python编程环境
1.5 变量的命名和赋值
1.6 Python的基本数据类型:数字、字符串
1.7 Python的基本数据类型:列表、字典
1.8 Python的运算符
1.9 Python的控制语句:if语句
1.10 Python的控制语句:for语句
1.11 Python的控制语句:while语句
1.12 Python的控制语句:try/except语句
1.13 Python控制语句的嵌套
1.14 Python的自定义函数
第2章 AI辅助编程基础
2.1 初识AI工具
2.2 与AI工具对话的基本操作
2.3 设计提示词的原则和技巧
2.4 利用AI工具解读和修改代码
2.5 利用AI工具分析报错信息
2.6 利用AI工具阅读技术文档
第3章 网页的初步分析
3.1 查看网页源代码:右键快捷菜单
3.2 查看网页源代码:开发者工具
3.3 认识常见的HTML标签
3.4 剖析网页的结构
3.5 判断网页的类型
第4章 静态网页的爬取
4.1 用Requests模块获取静态网页的源代码
4.2 正则表达式的基础知识
4.3 分析网页源代码并编写正则表达式
4.4 用正则表达式从网页源代码中提取数据
4.5 CSS选择器的基础知识
4.6 分析网页源代码并编写CSS选择器
4.7 用BeautifulSoup模块从网页源代码中提取数据
4.8 用Requests模块下载文件
4.9 静态网页爬取实战1:单页爬取
4.10 静态网页爬取实战2:多页爬取
第5章 动态网页的爬取
5.1 搭建Selenium模块的运行环境
5.2 用Selenium模块获取网页源代码
5.3 操控浏览器:用XPath定位网页元素
5.4 操控浏览器:用CSS选择器定位网页元素
5.5 操控浏览器:自动向下滚动页面
5.6 操控浏览器:自动下载文件
5.7 操控浏览器:切换标签页
5.8 操控浏览器:切换至