第1 章 什么是数据科学 1
第1 单元 数据分析步骤 2
第2 单元 数据获取途径 3
第3 单元 报告的结构 4
轮到你了 5
第2 章 数据科学的Python 核心 6
第4 单元 理解基本的字符串函数 6
第5 单元 选择合适的数据结构 8
第6 单元 通过列表推导式理解列表 9
第7 单元 使用计数器 10
第8 单元 使用文件 11
第9 单元 上网 12
第10 单元 使用正则表达式实现模式匹配 13
第11 单元 globbing 文件名与其他字符串 17
第12 单元 Pickling 和Unpickling 数据 18
轮到你了 18
第3 章 使用文本数据 20
第13 单元 处理HTML 文件 20
第14 单元 处理CSV 文件 24
第15 单元 读取JSON 文件 25
第16 单元 处理自然语言中的文本 27
轮到你了 31
第4 章 使用数据库 33
第17 单元 设置MySQL 数据库 33
第18 单元 使用MySQL 数据库:命令行 36
第19 单元 使用MySQL 数据库:pymysql 39
第20 单元 改善文档存储:MongoDB 41
轮到你了 44
第5 章 使用表格形式的数值数据 45
第21 单元 创建数组 46
第22 单元 转置和重排 48
第23 单元 索引和切片 49
第24 单元 广播 51
第25 单元 揭秘通用函数 52
第26 单元 理解条件函数 54
第27 单元 数组的聚合与排序 54
第28 单元 将数组用作集合 56
第29 单元 数组的保存和读取 57
第30 单元 生成合成正弦波 57
轮到你了 59
第6 章 使用series 和frame 61
第31 单元 pandas 数据结构 62
第32 单元 数据重塑 67
第33 单元 处理缺失数据 72
第34 单元 组合数据 75
第35 单元 数据的排序和描述 78
第36 单元 数据转换 82
第37 单元 掌握pandas 的文件读写功能 87
轮到你了 90
第7 章 使用网络数据 91
第38 单元 概念剖析 91
第39 单元 网络分析序列 94
第40 单元 使用networkx 95
轮到你了 101
第8 章 绘图 103
第41 单元 使用PyPlot 进行基本绘图 104
第42 单元 了解其他绘图类型 106
第43 单元 精通绘图装饰 107
第44 单元 用pandas 绘图 109
轮到你了 111
第9 章 概率与统计 113
第45 单元 回顾概率分布 113
第46 单元 回顾统计度量 115
第47 单元 以Python 的方式完成统计 117
轮到你了 120
第10 章 机器学习 122
第48 单元 设计预测实验 122
第49 单元 线性回归拟合 124
第50 单元 用k 均值聚类实现数据分组 129
第51 单元 在随机决策森林中生存 131
轮到你了 133
附录1 扩展阅读 135
附录2 单星项目的解决方案 137
参考文献 146
展开