第1章 绪论
第2章 用于图像分类的三流卷积神经网络
2.1 引言
2.2 用于图像分类的三流卷积神经网络模型
2.2.1 模型结构
2.2.2 特征提取学习方法
2.2.3 分类器融合方法
2.3 实验与分析
2.3.1 实验数据集
2.3.2 实验设置
2.3.3 实验结果
2.4 本章小结
第3章 浅层特征融合与语义信息增强的目标检测模型
3.1 引言
3.2 基于浅层特征融合和语义信息增强的目标检测方法
3.2.1 浅层特征增强模块
3.2.2 特征融合模块
3.2.3 上下文信息增强模块
3.2.4 感受野增强模块
3.2.5 损失函数
3.3 实验数据集及参数配置
3.3.1 实验数据集
3.3.2 评估标准
3.3.3 实验设置
3.4 实验结果及分析
3.4.1 PASCALVOC2007的检测结果
3.4.2 MSCOCO2017的检测结果
3.4.3 上下文信息增强模块的可视化
3.4.4 测试结果的比较
3.4.5 消融实验
3.4.6 效率分析
3.5 本章小结
第4章 用于交通标志检测的多维特征交互学习
4.1 引言
4.2 相关工作
4.2.1 小目标检测
4.2.2 注意力机制
4.2.3 自注意力机制
4.3 方法
4.3.1 VisioSignNet概述
4.3.2 LGIM模块
4.3.3 ECSI模块
4.3.4 损失函数
4.4 实验结果与分析
4.4.1 数据集与评估指标
4.4.2 VisioSignNet在TT100K数据集上与先进算法的比较
4.4.3 VisioSignNet在GTSDB数据集上与先进算法的比较
4.4.4 消融实验
4.5 本章小结
第5章 基于上下文和浅层空间编解码网络的图像语义分割方法
5.1 引言
5.2 相关工作
5.3 本书所提出的方法
5.3.1 网络结构概述
5.3.2 混合扩张卷积模块
5.3.3 残差金字塔特征提取模块
5.3.4 链式反置残差模块
5.3.5 残差循环卷积模块
5.4 实验
5.4.1 实验设置
5.4.2 CamVid数据集上的结果
5.4.3 SUNRGB-D数据集上的结果
5.4.4 Cityscapes数据集上的结果
5.4.5 消融实验
5.5 本章小结
第6章 用于骨架动作识别的多维动态拓扑图卷积网络
6.1 引言
6.2 方法
6.2.1 图卷积网络
6.2.2 动态图计算
6.2.3 MD2TL-GCN概述
6.2.4 纯粹节点拓扑结构学习图卷积
6.2.5 动态时序特异性拓扑学习图卷积
6.2.6 通道特异性拓扑学习图卷积
6.2.7 多尺度时间维卷积模块MS-TC
6.2.8 多流MD2TL-GCN
6.3 实验
6.3.1 数据集与实验设置
6.3.2 消融实验
6.3.3 多流融合模型
6.3.4 与其他先进骨架动作识别算法的比较
6.4 结论
第7章 特征采样运动信息增强的动作识别方法
7.1 引言
7.2 方法
7.2.1 LGMeNet网络结构
7.2.2 MFS采样模块
7.2.3 LME模块
7.2.4 GME模块
7.3 实验
7.3.1 数据集
7.3.2 实现细节
7.3.3 消融实验
7.3.4 与其他先进方法的比较
7.4 本章小结
第8章 注意力-边缘交互的光学遥感图像显著性目标检测
8.1 引言
8.2 相关工作
8.2.1 语义增强网络
8.2.2 边缘辅助网络
8.2.3 语义-边缘辅助网络
8.3 方法
8.3.1 多尺度注意力交互模块
8.3.2 语义指导的融合模块
8.3.3 损失函数
8.4 实验
8.4.1 实验设置
8.4.2 实验结果及分析
8.4.3 消融实验
8.5 讨论
8.6 本章小结
第9章 用于密集预测任务的分层多任务学习网络
9.1 引言
9.2 相关工作
9.2.1 多尺度特征融合
9.2.2 多任务信息交互
9.3 提出的方法
9.3.1 HirMTL概述
9.3.2 特征传播和连接模块
9.3.3 任务自适应多尺度特征融合模块
9.3.4 MFF模块
9.3.5 非对称信息对比模块
9.3.6 多任务学习损失函数
9.4 实验
9.4.1 实验设置
9.4.2 与其他先进算法的比较
9.4.3 不同任务依赖关系的研究
9.4.4 消融实验
9.5 本章小结
展开