信阅平台

编辑推荐

奇虎360人工智能研究院/陌陌深度学习实验室资深工程师力作

凝聚作者6余年的深度学习研究心得，业内4位大咖鼎力推荐

涵盖深度学习核心理论、数据与模型可视化、模型压缩与优化等内容

详解图像分类、图像分割和目标检测的三大核心技术和八大经典案例

如何使用好数据？

深度学习的核心优化技术有哪些？

如何做好图像分类任务？

如何做好图像分割任务？

如何做好目标检测任务？

如何对数据和模型进行可视化分析？

如何压缩和优化一个工业级深度学习模型？

如何理解分类和回归等任务的损失函数？

如何在微信小程序上部署模型？

……

通过阅读本书，你将了解这些复杂问题背后的原理，甚至你都可以自己解决这些问题。

业内4位大咖力荐：

鲁华祥中科院半导体研究所研究员

陈强 360人工智能研究院技术副总监

邱学侃作业盒子AI算法科学家

杨世才浙江大学计算机系博士后

本书核心内容：

理论基础

神经网络与卷积神经网络基础

卷积神经网络核心理论技术

开源框架简介

图像识别核心知识

数据集的发展与使用

数据和模型可视化

模型压缩与优化

损失函数

图像分类

图像分割

目标检测

本书8大经典案例：

人脸表情分类

鸟类细粒度分类

人脸属性分割

人像分割

猫脸检测

TensorFlow可视化应用

MobileNet语义分割模型压缩

微信小程序部署

展开

作者简介

言有三真名龙鹏。2012年本科毕业于华中科技大学，后保研至中国科学院并于2015年毕业。先后在奇虎360人工智能研究院和陌陌深度学习实验室从事与计算机视觉相关的工作，积累了丰富的传统图像处理算法和深度学习项目实战经验。运营微信公众号《有三AI》，内容覆盖深度学习的理论、实战经验、开源框架、模型架构，以及深度学习在各应用领域的技术分析，还提供国内外AI研究院的核心技术报导及AI工程师成长路线的完整规划。在知乎上开设专栏《有三AI学院》和其他子方向专栏。在GitChat和网易云课堂上开设若干图文和视频课程。

展开

内容介绍

本书全面介绍了深度学习在图像处理领域中的核心技术与应用。书中不但重视基础理论的讲解，而且从第4章开始的每章都提供了一到两个不同难度的案例供读者实践，读者可以在已有代码的基础上进行修改和改进，从而加深对所学知识的理解。

本书共10章，首先从深度学习的基础概念开始，介绍了神经网络的基础知识和深度学习中的优化技术；然后系统地介绍了深度学习中与数据相关的知识，包括经典数据集的设计、数据集的增强以及数据的获取与整理；接着重点针对图像开发领域，用3章内容系统地介绍了深度学习在图像分类、图像分割和目标检测3个领域的核心技术与应用，这些内容的讲解均结合实战案例展开；另外，还对深度学习中损失函数的发展、数据和模型的可视化以及模型的压缩和优化进行了详细介绍，为读者设计和训练更加实用的模型提供了指导；最后以微信小程序平台为依托，介绍了微信小程序前后端开发技术，完成了深度学习的模型部署，让本书的内容形成了一个完整的闭环。

本书理论与实践结合，深度与广度兼具，特别适合深度学习领域的相关技术人员与爱好者阅读，尤其适合基于深度学习的图像从业人员阅读，以全方位了解深度学习在图像领域中的技术全貌。另外，本书还适合作为相关培训机构的深度学习教材使用。

展开

精彩书评

本书是一个在深度学习图像识别领域工作多年的有为青年，根据自身经历和经验，以理论结合案例的形式系统讲述该领域各大方向研究方法的好书，值得大家阅读。

——中国科学院半导体研究所研究员鲁华祥

一个好的算法工程师必然需要扎实的理论基础和丰富的实战经验。本书介绍了计算机视觉领域近几年的一些新进展，并翔实地阐述了如何完成一些工业界实用且通用的视觉任务。想要成为计算机视觉算法工程师的读者，可以将本书作为教材系统阅读，跟随作者的引领，在实践中提高自己的能力。

——360人工智能研究院技术副总监陈强

深度学习在过去的几年间多次刷新了图像识别与分析领域的技术高度，深刻改变了该领域的技术方法论。言有三的这本书是一个很好的敲门砖，对图像识别领域中多个实际任务的数据集、任务目标、基本方法和工具框架都进行了详细介绍。读者朋友可以通过阅读本书快速理解深度学习的基础概念和理论，并能够根据相关的实战案例介绍亲自动手实践，从而提高学习效率，提升学习效果。

——作业盒子AI算法科学家邱学侃

本书涵盖了深度学习在图像识别领域的诸多内容，行文风格简洁，内容通俗易懂，案例丰富，实用性很强，适合没有相关基础但对深度学习和图像识别研究感兴趣的初学者阅读和实践，也适合对相关技术方向感兴趣的从业人员参考和借鉴。

——浙江大学计算机系博士后杨世才

展开

前言
第1章神经网络基础1
1.1 神经网络的生物基础与数学模型1
1.1.1 神经元1
1.1.2 感知机2
1.1.3 BP算法6
1.2 卷积神经网络基础10
1.2.1 卷积神经网络的基本结构11
1.2.2 卷积与权值共享13
1.2.3 感受野与池化14
第2章深度学习优化基础17
2.1 深度学习主流开源框架17
2.1.1 Caffe简介18
2.1.2 TensorFlow简介18
2.1.3 PyTorch简介19
2.1.4 Theano简介20
2.1.5 Keras简介20
2.1.6 MXNet简介21
2.1.7 Chainer简介21
2.2 网络优化参数22
2.2.1 常用激活函数22
2.2.2 参数初始化方法26
2.2.3 最优化方法27
2.2.4 归一化方法31
2.2.5 正则化方法33
第3章深度学习中的数据36
3.1 深度学习通用数据集的发展36
3.1.1 MNIST数据集36
3.1.2 CIFAR10和CIFAR100数据集37
3.1.3 PASCAL数据集38
3.1.4 ImageNet数据集38
3.1.5 Microsoft COCO数据集39
3.2 常见的计算机视觉任务数据集40
3.2.1 人脸数据集40
3.2.2 自动驾驶数据集52
3.2.3 医学数据集55
3.3 数据增强59
3.3.1 有监督数据增强60
3.3.2 无监督数据增强63
3.4 数据的收集与标注65
3.4.1 数据收集65
3.4.2 数据标注67
3.4.3 数据清洗与整理68
第4章图像分类70
4.1 图像分类基础70
4.1.1 图像分类问题70
4.1.2 深度学习图像分类发展简史72
4.1.3 评测指标与优化目标75
4.1.4 图像分类的挑战76
4.2 移动端实时表情分类实战77
4.2.1 项目背景78
4.2.2 数据预处理80
4.2.3 项目方案82
4.2.4 模型训练与测试84
4.2.5 项目总结88
4.3 细粒度图像分类实战89
4.3.1 项目背景89
4.3.2 项目方案90
4.3.3 模型训练与测试92
4.3.4 参数调试97
4.3.5 项目总结102
第5章图像分割103
5.1 传统图像分割方法103
5.1.1 阈值法103
5.1.2 区域生长法与超像素105
5.1.3 图切割105
5.1.4 活动轮廓模型106
5.2 深度学习图像分割109
5.2.1 基本流程110
5.2.2 反卷积110
5.2.3 多尺度与感受野112
5.2.4 CRF方法113
5.2.5 Image Matting与图像融合114
5.3 移动端实时图像分割项目115
5.3.1 项目背景115
5.3.2 项目方案116
5.3.3 模型训练与总结126
5.4 一个实时肖像换背景项目127
5.4.1 项目背景127
5.4.2 项目方案128
5.4.3 模型训练与测试134
5.4.4 项目总结138
第6章目标检测139
6.1 目标检测基础139
6.1.1 检测窗口选择140
6.1.2 特征提取141
6.1.3 分类器142
6.1.4 V-J人脸检测算法143
6.2 深度学习目标检测方法145
6.2.1 Selective search与R-CNN146
6.2.2 RoI Pooling与SPPNet147
6.2.3 Fast R-CNN与Faster R-CNN149
6.2.4 YOLO方法152
6.2.5 SSD方法154
6.2.6 目标检测中的关键技术155
6.3 实战Faster-R-CNN目标检测157
6.3.1 项目背景157
6.3.2 py-faster-rcnn框架解读157
6.3.3 模型定义与分析170
6.3.4 模型训练与测试180
6.3.5 项目总结183
第7章数据与模型可视化185
7.1 数据可视化185
7.1.1 低维数据可视化185
7.1.2 高维数据可视化187
7.2 模型可视化190
7.2.1 模型结构可视化190
7.2.2 模型权重可视化198
7.2.3 特征图可视化201
7.3 可视化案例202
7.3.1 项目背景202
7.3.2 数据接口定义204
7.3.3 网络结构定义205
7.3.4 可视化代码添加207
7.3.5 可视化训练指标207
第8章模型压缩209
8.1 模型压缩方法209
8.1.1 模型设计压缩210
8.1.2 网络剪枝与量化213
8.1.3 张量分解216
8.1.4 模型蒸馏与迁移学习216
8.2 模型压缩实战218
8.2.1 网络分析220
8.2.2 输入尺度和第一层卷积设计224
8.2.3 网络宽度与深度压缩226
8.2.4 弥补通道损失228
8.2.5 总结230
第9章损失函数231
9.1 分类任务损失231
9.1.1 什么是0-1 loss231
9.1.2 熵与交叉熵loss231
9.1.3 softmax loss及其变种232
9.1.4 KL散度237
9.1.5 Hinge loss简介237
9.1.6 Exponential loss与Logistic loss237
9.1.7 多标签分类任务loss238
9.2 回归任务损失238
9.2.1 L1 loss与L2 loss238
9.2.2 L1 loss与L2 loss的改进239
9.3 常见图像任务与loss使用240
9.3.1 图像基础任务240
9.3.2 风格化与图像复原，超分辨重建240
9.3.3 生成对抗网络241
9.3.4 总结245
第10章模型部署与上线246
10.1 微信小程序前端开发246
10.1.1 小程序的技术特点与定位246
10.1.2 Web前端基础248
10.1.3 小程序开发工具251
10.1.4 小程序前端目录252
10.1.5 小程序前端开发254
10.2 微信小程序服务端开发260
10.2.1 域名注册与管理260
10.2.2 服务端框架简介261
10.2.3 算法搭建与实现262
10.3 Caffe环境配置264
10.3.1 依赖库安装264
10.3.2 Caffe编译安装266

展开