注:本文谨代表笔者观点,水平有限,若有不足及疏忽之处,诚请批评指正
Abstract
提出一个RGB-based的实时目标检测和6D姿态估计pipeline。这个新型3D的目标朝向估计(orientation estimation)方法基于去噪自编码器的一个变体,其采用域随机(Domain Randomization)在3D模型的模拟视图上训练,称之为Augmented Autoencoder。与现有方法相比,它的优势在于:无需真实、带姿态标注的训练数据;可泛化至多种测试传感器,并能够内在地(inherently)处理目标与视图的对称性问题。不需学习一个从输入图像到目标姿态的显式映射,本方法给出了目标朝向的隐式表征(implicit representations),由隐空间(latent space)的样本定义。基于 T-LESS 和 LineMOD 数据集的实验表明所提的方法不仅比类似的基于模型的方法有更好的表现,而且表现也接近目前顶级的、需要真实的姿态标注图像的方法。