本书由真正从事自动驾驶感知实践的资深专家撰写,由真实落地经验总结,系统讲解从3D目标检测到BEV融合感知的完整技术体系,内容涵盖基础理论、核心算法与工程实践,为读者进行感知系统开发提供全链路指导。
全书共7章。第1章全面介绍摄像头、激光雷达、毫米波雷达与超声波雷达的硬件组成、工作原理及应用场景,奠定传感器技术基础。第2章讲解针孔相机模型、畸变模型、鱼眼相机与双目相机模型,为图像处理与目标检测提供理论支撑。第3章深入解析3D目标检测算法,包括单目测距、单目3D检测及基于点云的方法,如SMOKE、MonoFlex、MonoDETR、PointPillars和CenterPoint,展现其在自动驾驶中的关键作用。第4章聚焦时间同步技术与摄像头、多传感器联合标定方法,确保多源数据的时空一致性,为数据融合提供保障。第5章介绍卡尔曼滤波、匈牙利算法及其改进方法,结合后融合策略与Apollo平台的融合方案,系统讲解后融合感知的实际应用。第6章围绕BEV融合感知技术,涵盖LSS、BEVDet、BEVDet4D、DETR3D、Sparse4D v1和BEVFormer等前沿算法,展示基于几何与网络变换的最新进展。第7章关注BEV感知的工程化落地,结合开源数据集、TensorRT加速与BEVDet4D实战,提供从算法到部署的完整实现路径。
展开