六维物体位姿估计是一个关键的计算机视觉问题,广泛应用于机器人学(如抓取和物体操纵)。经典的六维位姿估计工作侧重于实例级位姿估计,即对少数已知物体估计六维位姿且一般需要物体的CAD模型。尽管实例级位姿估计技术在某些受控环境中已有不少的应用,但这种局限于特定已知物体实例的算法不能泛化到新的物体实例,因此限制了它们在日常物体感知方面的应用。在本次报告中,我将介绍一系列将物体六维位姿估计问题从实例级推广到类别级的工作,包括1)NOCS (CVPR19 oral)估计刚性物体的类别级六维位姿;2)ANCSH (CVPR20 oral)估计多关节物体的类别级六维位姿;3)CAPTRA(ICCV21 oral)追踪刚性和多关节类物体的类别级物体位姿;4)ESSCOP(NeurIPS21)利用SE3等变性进行自监督的类别级物体位姿学习。这些工作对发展有泛化能力的具身视觉提供了思路。
王鹤