GGF：用于旋转不变点云理解的全局几何特征

肖云哲; 李富; 王浩天; 杨绍武

doi:10.1007/s11390-024-3276-4

摘要:

研究背景 三维扫描技术的出现和进步使得三维点云数据变得广泛可用，并促进了大量基于三维点云的计算机视觉应用的发展，如机器人操作、自动驾驶和虚拟现实。但是，由于观察场景的视角差异或是场景中物体姿态不同，使三维点云在不同参考坐标系下的坐标表示受旋转平移的影响，而在深度网络特征学习过程中保持旋转不变性是理解三维点云的关键。数据增强的预处理操作可以提高点云深度网络对旋转点云的理解能力，然而这也导致冗余的预训练过程会降低网络性能并加重预训练的开销。目前的研究提出了一些具有旋转不变理解能力的点云深度模型。但是，这类方法为实现旋转不变的点云理解往往需要设计专用的特征学习网络，而不兼容通用点云网络结构。这导致通用点云网络难以处理受旋转平移影响的三维点云数据。

目的本文研究解决在不进行额外的网络结构调整或者数据增强操作的前提下，消除通用点云网络对旋转平移变化敏感的方法，从而提高通用点云网络处理旋转变化点云的适用性。

方法本文设计了一种浅层特征并称为全局几何特征（Global Geometric Feature, GGF），作为实现通用点云理解网络旋转不变性的有效解决方案。全局几何特征以计算相互距离的高次幂及根的方式描述空间点之间的几何关系，并将其提取为分布式的逐点描述特征。全局几何特征可以即插即用地应用于通用点云网络，为此本文提出了若干种全局几何特征在通用点云网络中的应用方式，包括作为网络输入、卷积应用、注意力机制的位置编码。同时，本文在理论上证实了全局几何特征的旋转不变性、描述有效性以及可控的计算开销。

结果本文在多个点云任务上通过大量的实验衡量了全局几何特征的效果。在三维点云分类任务中，本文发现全局几何特征提高了通用点云网络对ModelNet40数据集预训练中未见姿态点云的分类精度，并且分类效果比数据增强提高了0.3%~2%。一些通用点云网络应用全局几何特征后，分类效果甚至超越了专用旋转不变点云理解的深度网络。在三维点云分割任务中，本文发现通用点云网络应用全局几何特征后，对ShapeNet数据集预训练中未见姿态点云的分割效果达到了使用这些点云数据进行预训练的相同水平。在三维点云配准任务中，本文发现全局几何特征作为注意力机制的位置编码在点云配准任务中能够提高配准精度。在真实点云数据集3DMatch和3DLoMatch上，应用全局几何特征在关键指标上提高了1~2个百分点；在合成点云数据集ModelNet40上，应用全局几何特征大幅提高了原先基础的80%以上。本文通过改变点云的分辨率，验证了全局几何特征在稀疏点云中也不会损失性能。同时，本文验证了全局几何特征相比其他一些旋转不变描述特征在相同条件下有更好的性能表现。

结论本文提出了一种即插即用的全局几何特征消除通用点云理解网络中的固有旋转敏感性，并在理论上证实了全局几何特征的旋转不变性、描述有效性以及可控的计算开销。全局几何特征显著提高了通用点云网络对于旋转平移点云的理解能力，这证明设计逐点的浅层特征是解决旋转不变点云理解的可行解决方案。这种方式不仅能够保留通用点云网络本身较强的特征学习能力，避免额外的网络结构设计，而且无需进行数据增强。

Abstract: Most 3D vision tasks related to point cloud understanding require rotation-invariant solutions. However, existing deep learning techniques for point clouds do not always ensure rotation invariance, and achieving rotation invariance necessitates data augmentation or professional networks, which is not feasible for generic point cloud understanding tasks. To address this issue, we propose a plug-and-play feature called Global Geometric Feature (GGF), as an effective and efficient solution achieving rotation invariance for generic point cloud understanding networks. GGF extracts a distributed global description by capturing geometric relationships between points and projecting the point cloud into a rotation-invariant feature space. We find that GGF can be directly integrated into a variety of point cloud understanding tasks without network modification. Our experimental evaluation shows that GGF can improve the performance of generic point cloud networks for rotation-invariant understanding without data augmentation and is comparable to dedicated rotation-invariant methods.

GGF：用于旋转不变点云理解的全局几何特征

GGF: Global Geometric Feature for Rotation-Invariant Point Cloud Understanding