算法一直在计算科学和计算实践中发挥着重要作用。除了传统计算之外,使用算法解决现实问题的能力是开发人员和程序员必须具备的一项重要技能。
本书带你了解各种算法设计技术,通过实例探索如何实现不同类型的算法。知识点众多但简单易学,专为初学者准备——忽略对算法细节的讨论,仅给出每个算法的思想和原理,将重点放在如何用Python进行算法实现和算法性能的比较与分析上。读者通过学习本书,可以迅速了解算法的概念,掌握如何用开源包实现各种算法,并理解它们的性能、应用领域和局限性,进而对算法在计算机科学和各种应用领域中的作用有整体了解。
本书致力于利用算法求解实际问题,分为三部分。第一部分介绍算法的核心内容,探讨什么是算法、如何设计算法,同时学习在算法中使用的数据结构,还深入讲解排序算法、查找算法和求解图问题的算法。第二部分讨论各种机器学习算法,包括无监督机器学习算法和传统监督学习算法,详细讨论一些自然语言处理算法,以及推荐引擎。第三部分讨论更高级的算法,重点讨论密码算法和大规模算法,还探讨在算法实现时应该考虑的实际因素。此外,本书还包含一些案例分析(如天气预测、推文聚类和电影推荐引擎),用来说明如何才能最佳地应用这些算法。
译者序
前言
关于作者
关于审校者
第一部分 基础与核心算法
第1章 算法概述2
11 什么是算法2
12 描述算法逻辑4
121 理解伪代码4
122 使用代码片段6
123 制定执行计划6
13 Python包简介7
131 Python包8
132 通过Jupyter Notebook执行Python9
14 算法设计技术10
141 数据维度11
142 计算维度12
15 性能分析13
151 空间复杂度分析13
152 时间复杂度分析14
153 性能评估14
154 选择算法15
155 大O记号15
16 验证算法19
161 精确算法、近似算法和随机算法19
162 可解释性20
17 小结20
第2章 算法中的数据结构21
21 Python中的数据结构21
211 列表22
212 元组26
213 字典27
214 集合28
215 数据帧30
216 矩阵32
22 抽象数据类型33
221 向量33
222 栈34
223 队列36
224 栈和队列背后的基本思想37
225 树38
23 小结40
第3章 排序算法和查找算法41
31 排序算法简介41
311 在Python中交换变量42
312 冒泡排序42
313 插入排序44
314 归并排序46
315 希尔排序48
316 选择排序50
32 查找算法简介51
321 线性查找52
322 二分查找52
323 插值查找53
33 实际应用54
34 小结56
第4章 算法设计57
41 算法设计基本概念57
411 第一点—所设计算法是否能产生预期的结果58
412 第二点—所设计算法是否是获取结果的最佳方法58
413 第三点—所设计算法在更大的数据集上表现如何61
42 理解算法策略61
421 分治策略62
422 动态规划策略64
423 贪心算法64
43 实际应用—求解TSP65
431 使用蛮力策略66
432 使用贪心算法68
44 PageRank算法70
441 问题定义70
442 实现PageRank算法70
45 了解线性规划73
46 实例—用线性规划实现产量规划73
47 小结76
第5章 图算法77
51 图的表示77
511 图的类型79
512 特殊类型的边81
513 自我中心网络82
514 社交网络分析82
52 网络分析理论简介83
521 理解最短路径83
522 创建邻域84
523 理解中心性度量85
524 用Python计算中心性指标87
53 理解图的遍历88
531 广度优先搜索89
532 深度优先搜索92
54 实例—欺诈分析93
541 进行简单的欺诈分析96
542 瞭望塔欺诈分析法97
55 小结99
第二部分 机器学习算法
第6章 无监督机器学习算法102
61 无监督学习简介102
611 数据挖掘生命周期中的无监督学习103
612 无监督学习的当前研究趋势105
613 实例106
62 理解聚类算法107
621 量化相似性107
622 分层聚类113
623 评估聚类效果115
624 聚类算法的应用115
63 降维116
631 主成分分析116
632 主成分分析的局限性118
64 关联规则挖掘119
641 实例119
642 市场购物篮分析119
643 关联规则120
644 排序规则122
645 关联分析算法123
65 实例—聚类相似推文127
651 主题建模128
652 聚类128
66 异常检测算法129
661 基于聚类的异常检测129
662 基于密度的异常检测129
663 基于支持向量机的异常检测129
67 小结130
第7章 传统监督学习算法131
71 理解监督机器学习131
711 描述监督机器学习132
712 理解使能条件134
713 区分分类器和回归器134
72 理解分类算法135
721 分类器挑战性问题135
722 评估分类器139
723 分类器的各个阶段142
724 决策树分类算法143
725 理解集成方法146
726 逻辑回归149
727 支持向量机算法151
728 理解朴素贝叶斯算法153
729 各种分类算法的胜者156
73 理解回归算法156
731 回归器挑战性问题156
732 线性回归158
733 回归树算法162
734 梯度提升回归算法163
735 各种回归算法的胜者163
74 实例—预测天气164
75 小结166
第8章 神经网络算法167
81 理解人工神经网络168
82 人工神经网络的演化169
83 训练神经网络171
831 解析神经网络结构171
832 定义梯度下降172
833 激活函数173
84 工具和框架178
841 Keras178
842 理解TensorFlow181
843 理解神经网络的类型183
85 迁移学习185
86 实例—用深度学习实现欺诈检测186
87 小结189
第9章 自然语言处理算法190
91 自然语言处理简介190