1. 凝聚知名图像处理专家8年深度学习算法的研究心得和实践经验。
2. 中科院研究员鲁华祥、阿里达摩院计算机视觉大模型负责人赵德丽等专家力荐。
3. 全面、深入介绍基于深度学习的图像识别技术与应用,深入介绍图像识别的核心算法与12个经典案例,重点突出计算机视觉领域的多项新技术研究成果。
4. 印刷精美:采用全彩印刷,能更好地呈现图像的色彩和各种细节。
5. 内容全面、新颖:涵盖深度学习与图像识别的核心技术与应用,并重点介绍多项新技术研究成果,给出多个重要领域的应用实践代码。
6. 讲解深入:在对内容横向扩展的同时,还进一步从纵向挖掘,力争把知识讲深、讲透。
7. 讲解准确、细致:对涉及的概念和算法等理论知识给出准确的描述,并通过大量的示意图、表和详细的步骤呈现技术细节。
8. 框架流行、易用:涉及的所有案例均采用流行和易用的PyTorch框架实现,容易上手。
9. 理论和实践紧密结合,案例典型:不仅对理论知识进行阐述,而且结合12个切合实际开发的典型案例进行实践,学习效果更好。
10. 编排科学:章节顺序编排合理,符合读者的学习和认知规律,学习梯度较为平滑。
第1章 神经网络与卷积神经网络基础 1
1.1 神经网络的生物基础与数学模型 1
1.1.1 神经元 1
1.1.2 感知机 3
1.1.3 多层感知机与反向传播算法 7
1.2 卷积神经网络基础 11
1.2.1 卷积的概念 12
1.2.2 卷积神经网络的基本概念 13
1.2.3 卷积神经网络的基本结构 17
1.3 总结 21
参考文献 22
第2章 深度学习优化基础 23
2.1 激活函数 23
2.1.1 S型函数 24
2.1.2 ReLU函数 25
2.2 参数初始化 31
2.2.1 简单初始化 31
2.2.2 标准初始化 31
2.2.3 Xavier与MSRA初始化 32
2.2.4 初始化方法的使用 32
2.3 标准化方法 33
2.3.1 什么是标准化 33
2.3.2 批次标准化 34
2.3.3 层标准化 37
2.3.4 实例标准化 37
2.3.5 组标准化 38
2.3.6 权重标准化 39
2.3.7 标准化方法的自动搜索 39
2.3.8 标准化的有效性问题 39
2.4 学习率与最优化 40
2.4.1 学习率策略 40
2.4.2 梯度下降法与动量法 45
2.4.3 Adagrad算法 46
2.4.4 Adadelta与RMSprop算法 47
2.4.5 Adam算法 47
2.4.6 牛顿法、拟牛顿法与共轭梯度法 48
2.5 正则化方法与泛化 48
2.5.1 过拟合与欠拟合 49
2.5.2 参数正则化 49
2.5.3 提前停止 50
2.5.4 模型集成 51
2.5.5 训练样本扩充 52
2.6 深度学习主流开源框架 52
2.6.1 Caffe简介 53
2.6.2 TensorFlow简介 53
2.6.3 PyTorch简介 54
2.6.4 Theano简介 55
2.6.5 Keras简介 55
2.6.6 MXNet简介 55
2.6.7 Chainer简介 56
2.7 总结 56
参考文献 57
第3章 深度学习中的数据使用方法 60
3.1 深度学习通用数据集的发展 60
3.1.1 MNIST数据集 60
3.1.2 CIFAR10和CIFAR100数据集 61
3.1.3 PASCAL数据集 63
3.1.4 ImageNet数据集 63
3.1.5 Microsoft COCO数据集 64
3.2 常见计算机视觉任务数据集 65
3.2.1 人脸数据集 65
3.2.2 自动驾驶数据集 75
3.2.3 医学数据集 77
3.3 数据收集、清洗与整理 81
3.3.1 数据收集 81
3.3.2 数据清洗与整理 83
3.4 数据标注 85
3.4.1 数据标注类型 85
3.4.2 数据标注方法 85
3.5 数据增强 87
3.5.1 单样本图像处理数据增强 88
3.5.2 多样本图像处理数据增强 92
3.5.3 自动化数据增强 94
3.5.4 数据生成增强 94
3.6 数据可视化 95
3.6.1 低维数据可视化 96
3.6.2 高维数据可视化 97
3.7 总结 99
参考文献 99
第4章 图像分类 101
4.1 图像分类基础 101
4.1.1 单标签图像分类问题 102
4.1.2 深度学习图像分类经典模型 104
4.1.3 优化目标 108
4.1.4 评测指标 110
4.2 多标签图像分类 111
4.2.1 多标签图像分类问题 111
4.2.2 多标签图像分类模型 112
4.2.3 多标签图像分类评估指标 113
4.3 细粒度图像分类 114
4.3.1 基于语义子区域的模型 114
4.3.2 基于高维特征的模型 116
4.4 半监督与无监督图像分类 117
4.4.1 基本问题与解决思路 117
4.4.2 半监督分类模型 119
4.4.3 无监督分类模型 120
4.4.4 自监督分类模型 121
4.5 其他图像分类问题的典型难题 122
4.5.1 类别不均衡问题 122
4.5.2 样本过少问题 123
4.5.3 零样本识别问题 123
4.6 简单表情图像分类实战 124
4.6.1 项目背景 124
4.6.2 数据预处理 126
4.6.3 网络结构配置 128
4.6.4 基于PyTorch的项目实践 130
4.6.5 基于Caffe的项目实践 137
4.6.6 项目总结 146
4.7 鸟类细粒度图像分类实战 147
4.7.1 项目背景 147
4.7.2 模型搭建 148
4.7.3 模型训练 151
4.7.4 项目总结 152
4.8 总结 152
参考文献 153