基于激光雷达3D点云的目标检测、多目标跟踪等算法是利用深度学习相关算法进行解决相应问题的,本书的第七章对深度学习进行了基础的讲解,主要是人工神经网络、卷积神经网络、ViT模型等进行了介绍,对于我这种深度学习小白来说,无疑撬开了我对深度学习相关基础的认知,。
激光点云的3D目标检测通常是指在点云中识别车辆、行人等目标,并给出其尺寸、位置和朝向等信息。雷达目标检测的分类方法如下所示:
本书介绍的常用的具有代表性的3D目标检测算法有MLP架构的PointNET网络算法、PointNET++网络算法、PointRCNN网络算法、基于体素的VoxelNet网络算法、PointPillars网络算法、基于深度图的RangeDet网络算法、多视角特征融合的MVF网络算法等。
每种算法有各自的优势和不足,例如: PointRCNN网络是将基于原始点云进行特征提取的方式嵌入二阶段检测架构的一次成功尝试,且该网络模型背后的将车辆位置和朝向问题等效为“分类+回归”问题的思想也被后续许多算法借鉴。但是该网络模型的流程相对比较复杂,在KITTI数据集中,该网络模型对每帧点云进行推理的耗时为0.1秒左右,较难达到实时性要求。
VoxelNet网络结构清晰,且检测性能也有较大提升,然而,由于其引入了3D卷积,VoxelNet 网络模型的推理速度较慢,很难满足智能驾驶感知模块的实时性要求。而PointPillars网络却有较好的实时性和检测性能。
总之,通过对个网络算法的公式、原理推导和图形化说明,让我对这些深度学习网络算法及在3D激光点云的应用有了了解和认识。