第1章 绪论
1.1 研究背景
1.2 问题与挑战
1.3 主要研究内容
1.4 本文的组织结构
第2章 场景文本检测算法综述
2.1 简介
2.2 场景文本检测和识别过程概述
2.3 场景文本检测和识别算法分类
2.3.1 基于传统机器学习的场景文本检测和识别算法
2.3.2 基于深度学习的场景文本检测和识别算法
2.4 文本检测和识别的评价指标
2.5 文本检测和识别的数据集
2.5.1 ICDAR数据集
2.5.2 SVT数据集
2.5.3 IIIT数据集
2.5.4 KAIST数据集
2.5.5 CTW数据集
2.5.6 RCTW-17数据集
2.5.7 ICPR MWI 2018数据集
2.5.8 Total-Text数据集
2.5.9 Google FSNS数据集
2.5.10 COCO-TEXT数据集
2.5.11 Synthetic数据集
2.6 总结
第3章 基于融合网络的TSFnet模型
3.1 问题形成
3.2 相关研究
3.2.1 基于回归的模型
3.2.2 基于分割的模型
3.3 TSFnet
3.4 实验
3.4.1 评价指标
3.4.2 参数设置
3.4.3 结果与分析
3.5 本章小结
第4章 结合区域建议网络与注意力网络的Mnet算法
4.1 问题形成
4.2 相关研究
4.2.1 基于回归的模型
4.2.2 基于分割的模型
4.2.3 两阶段检测模型
4.3 Mnet
4.3.1 Scale-RPN
4.3.2 回归网络
4.3.3 分割网络
4.3.4 注意力网络
4.4 实验
4.4.1 评价指标
4.4.2 参数设置
4.4.3 实验对比与分析
4.5 本章小结
第5章 场景文本检测与识别应用
5.1 卡证文字检测与识别
5.1.1 证件文字检测与识别
5.1.2 银行卡文字检测与识别
5.1.3 名片文字检测与识别
5.1.4 营业执照文字检测与识别
5.2 票据文字检测与识别
5.3 汽车场景文字检测与识别
5.3.1 车牌检测与识别
5.3.2 汽车VIN码检测与识别
5.4 文档文字检测与识别
5.5 自然场景文字检测识别
后记:总结与展望
参考文献
展开