搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
数据清洗(微课视频版)/大数据与人工智能技术丛书
0.00     定价 ¥ 49.80
图书来源: 浙江图书馆(由浙江新华配书)
此书还可采购25本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787302577478
  • 作      者:
    编者:黄源//何婕|责编:王冰飞//吴彤云
  • 出 版 社 :
    清华大学出版社
  • 出版日期:
    2021-08-01
收藏
畅销推荐
内容介绍
本书的编写目的是向读者介绍数据清洗技术的基本概念与应用。全书共10章,分别为数据清洗概述、文件格式、Web数据抽取、网络爬虫、Kettle数据清洗、数据迁移、文本数据处理、Python数据清洗、DataCleaner数据分析与清洗以及数据清洗综合实训。本书将理论与实践操作相结合,通过大量的案例帮助读者快速了解和应用数据清洗相关技术,并对书中重要的、核心的知识点加大练习力度,以达到熟练应用的目的。 本书可作为高等学校大数据、人工智能、云计算等专业的教材,可也作为大数据爱好者的参考书。
展开
目录
第1章 数据清洗概述
1.1 数据清洗基础
1.1.1 数据清洗的定义
1.1.2 数据清洗的原理
1.1.3 数据清洗的流程
1.1.4 数据清洗的常用方法
1.1.5 数据清洗的评估描述
1.1.6 数据清洗中的常用评测数据集
1.2 数据质量与数据仓库
1.2.1 数据质量的定义
1.2.2 常见的数据质量问题
1.2.3 数据质量与数据清洗
1.2.4 数据仓库与ETL
1.2.5 数据映射
1.2.6 主数据与元数据
1.3 数据清洗中的统计基础
1.3.1 描述性统计
1.3.2 推论统计
1.3.3 随机变量
1.4 数据清洗环境与常用工具
1.4.1 数据清洗环境介绍
1.4.2 数据清洗常用工具
1.5 本章小结
1.6 实训
习题1
第2章 文件格式
2.1 文件格式概述
2.2 Kettle中文件格式的转换
2.2.1 文本文件转换
2.2.2 CSV文件转换
2.2.3 XML文件转换
2.2.4 JSON文件转换
2.2.5 Excel文件转换
2.2.6 生成记录转换
2.3 本章小结
2.4 实训
习题2
第3章 Web数据抽取
3.1 Web数据抽取基础
3.2 Web数据抽取的实现
3.2.1 Kettle数据抽取原理
3.2.2 Kettle数据抽取实现
3.3 本章小结
3.4 实训
习题3
第4章 网络爬虫
4.1 网络爬虫基础
4.2 Python3网络爬虫实现
4.2.1 urllib模块
4.2.2 Requests库
4.2.3 BeautifulSoup库
4.3 Python3网络爬虫实例
4.3.1 urllib实例
4.3.2 requests实例
4.4 本章小结
4.5 实训
习题4
第5章 Kettle数据清洗
5.1 Kettle数据清洗概述
5.2 Kettle数据清洗实现
5.2.1 清洗简单数据
5.2.2 清洗复杂数据
5.3 本章小结
5.4 实训
习题5
第6章 数据迁移
6.1 数据迁移概述
6.2 数据迁移实现技术
6.2.1 基于主机的迁移方式
6.2.2 备份恢复的迁移方式
6.2.3 基于存储的迁移方式
6.2.4 基于文件系统的迁移方式
6.2.5 基于数据库的迁移方式
6.3 数据迁移实现
6.3.1 数据库安装与使用
6.3.2 Kettle数据迁移
6.4 本章小结
6.5 实训
习题6
第7章 文本数据处理
7.1 文本分词
7.2 文本数据处理方法
7.3 jieba分词的应用
7.3.1 jieba概述
7.3.2 jieba应用实例
7.4 本章小结
7.5 实训
习题7
第8章 Python数据清洗
8.1 Python数据清洗概述
8.1.1 Python数据清洗相关库
8.1.2 Python数据清洗库的安装
8.2 NumPy使用
8.2.1 数组的创建与使用
8.2.2 计算模块与随机模块的使用
8.2.3 NumPy数据清洗实例
8.3 Pandas使用
8.3.1 Pandas数据类型概述
8.3.2 Pandas数据类型应用
8.3.3 Pandas数据清洗
8.4 matplotlib使用
8.4.1 matplotlib的介绍
8.4.2 matplotlib的应用
8.5 Python数据清洗实例
8.5.1 清洗内部数据
8.5.2 清洗外部数据
8.6 本章小结
8.7 实训
习题8
第9章 DataCleaner数据分析与清洗
9.1 DataCleaner简介
9.1.1 DataCleaner概述
9.1.2 DataCleaner界面认识
9.2 DataCleaner应用
9.2.1 认识DataCleaner
9.2.2 DataCleaner数据分析实例
9.3 本章小结
9.4 实训
习题9
第10章 数据清洗综合实训
10.1 Python数据分组与显示
10.2 Python数据清洗与显示
10.3 Kettle分组排序
10.4 Kettle模糊匹配
参考文献
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证