第1章 深度学习与计算机视觉基础知识
1.1 深度学习与人工智能
1.1.1 人工智能历史回顾
1.1.2 深度学习原理及其应用简介
1.2 计算机视觉及其应用场景简介
1.3 开始之前的准备工作
1.3.1 代码工具准备
1.3.2 相关数学工具准备
第2章 神经网络模型:原理、模型与流程
2.1 神经网络模型的基本原理
2.1.1 神经元与人工神经网络
2.1.2 梯度下降与反向传播算法(BP算法)
2.1.3 神经网络的正则化策略
2.2 卷积神经网络与注意力机制
2.2.2 注意力机制与Vision Transformer
2.3 神经网络模型训练和推理的一般流程
2.3.1 训练流程:数据增强、优化器与策略调整器
2.3.2 推理流程:测试时增强与量化部署
第3章 语义分割算法原理
3.1 语义分割任务概述
3.1.1 语义分割的目标与传统方案
3.1.2 语义分割的难点
3.1.3 语义分割的度量指标
3.1.4 语义分割的应用场景
3.2 语义分割的代表性模型
3.2.1 FCN:从图像分类到像素级分割
3.2.2 Unet和Unet++:U刑对称业解码网故及其增强版
3.2.3 DeepLab系列:基于空洞卷积的分割网络
3.2.4 PSPNet:金字塔池化的特征融合
3.2.5 OCRNet:如何利用目标上下文信息
3.2.6 Segmenter:基于Transformer的端到端分割
3.2.7 PointRend;针对物体边缘分割的优化
3.2.8 Segment Anything:prompt驱动的分割大模型
3.3 小样本、弱监督和交互式语义分割
3.3.1 小样本分割任务与模型
3.3.2 弱监督语义分割任务与模型
3.3.3 交互式分割任务与模型
第4章 语义分割项目实战
4.1 DeepLabV3+网络的宠物分割识别
4.1.1 任务描述与数据集准备
4.1.2 代码库基本情况说明
4.1.3 相关配置文件配置与训练
4.1.4 基线网络训练效果测试
4.1.5 实验优化与结果分析
4.2 Unet++的视网膜血管分割
4.2.1 任务描述与数据集准备
4.2.2 数据读取代码修改
4.2.3 模型训练与效果测试
4.3 Segment Anything基于prompt的分割
4.3.1 Segment Anything代码库简介
4.3.2 本地配置与分割功能测试
4.3.3 基于SAM的交互式分割代码开发与实验
第5章 目标检测算法原理
5.1 目标检测任务概述
5.1.1 目标检测方法的发展
5.1.2 目标检测的难点
5.1.3 目标检测方法的评价准则
5.1.4 目标检测的应用场景
5.2 目标检测经典模型
5.2.1 R-CNN:从传统方法到CNN方法
5.2.2 SPP-net:空间金字塔池化网络
5.2.3 Fast R-CNN和Faster R-CNN:R-CNN的进化
5.2.4 YOLO:单阶段目标检测器的代表模型
5.2.5 SSD:多尺度预测目标检测器
5.2.6 FPN:特征金宇塔用于目标检测
5.2.7 RetinaNet;样本均衡问题与Focal Loss
5.2.8 Mask R-CNN:RolAlign与实例分割
5.2.9 无锚框的目标检测范式:ConerNet、CenterNet和FCOS
5.2.10 YOLO的进化:从v2到v
5.2.11 DETR:基于Transformer的检测框预测
5.3 小目标检测与旋转目标检测
5.3.1 小目标检测任务与方案
5.3.2 旋转目标检测任务与模型
第6章 目标检测项目实战
6.1 实战一:基于YOLOv8的口罩人脸检测
6.1.1 YOLOv8代码库简介
6.1.2 任务简述与数据集获取
6.1.3 模型训练与效果评估
6.2 实战二:Faster R-CNN交通车辆检测识别
6.2.1 任务与数据集概述
6.2.2 MMDetection代码库简介与配置
6.2.3 Faster R-CNN训练与结果验证
6.3 实战三:实时手势检测识别流程搭建实验
6.3.1 任务目标与整体流程
6.3.2 数据采集标注与数据集准备
6.3.3 模型训练与导出
6.3.4 实时手势监测与识别demo测试
后记
参考文献
展开