基于局部凹凸性进行目标分割

摘要
如何对场景进行适当的三维分割仍然是一个难题。
尽管目前阶段的方法持续提高基准性能,但是他们依旧变得越来越复杂。
例如在合并分类器链中需要大量的人工标注,作为一个替代的方法,我们提出一个新的高效的不需要模型和训练的方法将点云分割为物体块。该算法依据体素栅格将场景分割为毗邻的图的面片。图中的边被分类为凸的或凹的,使用对这些斑块的局部几何结构操作的简单准则的新组合。这样,图被划分为局部凸连通子图,这些子图以高精度表示对象部分。
此外,我们还提出了一种新的深度相关体素网格来处理点云中远距离点密度的下降。这改善了分割,允许使用固定参数的巨大不同的场景。该算法实现简单,无需任何训练数据,生成的结果可与包含高级概念的分类、学习和模型拟合的最新方法相媲美。

1.Introduction and State-of-the-Art
尽管已有几十年的历史,将场景分割成物体仍然是计算机视觉中最具挑战性的课题之一。为了解决这个问题,最近的方法经常使用层次结构,即创建一个从小的局部超级像素到大规模区域的自底向上的排列顺序。作为可选择的方式,研究者也严格要求自上而下的方式。首先是使用多尺度滑动窗口检测器进行粗分割,后来发展到基于对象部分的细粒度分割和检测。这两种搜索途径自然导致了一种组合自下而上的层次结构和自上而下物体和块的检测方法。尽管这些方法在复杂环境下也取得了很好的效果,但是通过数据集,是他们失去了大量的不需要学习的方法。一般来说,迄今为止最强大的方法是使用经过训练的分类筛选器进行分割。这意味着,这些方法无法运用到没有被训练过的任何场景,对每一个测试的环境需要获取特定的数据集。
本文研究了一种不需要模型和学习的自下而上的RGB-D点云的分割。特别是,我们将重点放在杂乱的场景划分为基本对象部分,而不需要训练数据。作为将场景分割为基本部分的一般规则的灵感,我们着力物理方面的研究,大部分体现在2D图像上,这表明凹凸性之间的过渡将指示物体之间或者物体的部分之间的分割。虽然这一特性在机器视觉中得到了一定程度的应用,但成功的可能性仍然有限,最近的研究还视图将这一特性与额外的,通常是非常复杂的特征相结合,以实现良好的场景划分。因此,这表明从2D直接根据传统的,几何定义的凹凸性转换是不太可能获得比较好的3D分割效果。
本文的主要工作如下:首先,在第二节中,我们提出了我们的分割算法,并将其各个步骤可视化。在第三节我们评估我们的方法,将其与其他方法对比并讨论结果。最后。第四节将总结我们的发现。这一方法的源码在PCL中免费提供。
2.Methods
我们的主要目标是将场景构为“可命名”的对象部分,而无需进行训练或分类。由于心理研究表明物体的最低层次分解与三维凹凸关系密切相关,我们提出了一种算法,可以稳定识别点云中的局部凸性的区域。
2.1Building the Surface-Patch Adjacency Graph
为了构件面片连接图,我们使用体素云连接分割VoxelCloudConnectivity Segmentation(VCCS),一种将三维点云数据分割成块的新方法,称为超体素分割(超像素的3D模拟),体素云连接分割采用K-Means的局部区域生长变体聚类生成各自的超体素,也可用于确定生成的产提速本身的邻接性。超级体素是从一组种子点生长出来的,这些种子点在网格上以分辨率Rseed分布在空间中。从种子点开始的扩展由距离度量控制,这一度量是在一个特征空间汇总由空间距离,颜色,法向量组成。本文只对形状特征感兴趣,我们只使用空间信息(权重Ws=1),法线信息(权重(Ws=4)。此外,我们还通过修改曲面法线的计算方式扩展了VCCS算法。有两个变化:首先,我们不适应简单的半径搜索,而是使用邻接图来决定哪些邻近点包含在正常计算中(具体来说,我们使用邻接点和邻接点的邻接点)。其次,我们使用了Boulch和Marlet的概率正态方法,这两点使得法线冯家明显,也使得产生的超体素具有更加明显的边缘。
2.2Locally Convex Connected Patches(LCCP)
局部凸连通片(LCCP)接下来我们通过分析两个超体素之间的联系是否是凸性的(valid)还是凹性的(invaild)来分隔超体素近邻图。
扩展凸性准则(CC)考虑了两个毗邻的超体素,从曲面法线与连接他们的质心的向量之间的关系可以推断出这两个超体素之间连接是凸性的还是凹性的。
区域增长
最后,通过区域生长划分获得的凸度图,过程如下:首先,选择和标记任意的种子超体素,然后区域生长将种子标签传播到和它相邻的且具有凸边关系的超体素上(因为凸的认为是一个物体,进行合并),直到和相邻体素都属于凸边关系则停止生长。然后该过程再以新的种子开始,直到所有超体素被标记。以这种方式确定所有超体素的凹凸性关系。(凸边合并,凹边分割)需要指出的是我们的标准(所有的分类结果顺序)是可以交换的,所以输出的结果与种子点的选择无关。
去噪
含有噪声的表面法线(以边界为主)将导致凸性分类错误并且将连接的表面错误地分割开来。这种噪声很小,可以在后续的处理步骤中被滤除。对每一个分割,我们检查该聚类是否包含至少n_filter个超体素。如果一个分割的尺寸不超过我们设置的滤波的阈值,就把它合并到周围最大尺寸的分割结果上。一直执行这个步骤,直到没有比n_filter更少的分割结果。在这篇文献中,我们将阈值n_filter=3。
2.3Depth Dependent Voxel Grid(DDVG)
截止到目前,我们已经描述了分割的主要算法。接下来,我们介绍一种普遍适用的深度变换,它改进了这种具体的分析,还可以用于各种各样的图像分析。这里我们解决了基于VCCS的体素网格明显的缺点,,从RGBD相机观测到的结果有一个明显的缺点—店的密度问题。因此,场景几何的细节会随着到星际的距离而迅速减少。此外,噪声会随着到相机的距离呈现二次增长,导致了几何特性的质量进一步退化。这种点密度随深度的变化,在获取小场景的细节和避免背景噪声之间去了一个折中。这一问题很普遍,所以以一个固定值读单视角获取的点云进行操作的算法都具有这个问题。
我们提出一种补偿方式,以补偿随着深度值z得增加而引起的点云密度和quantization下降的问题。
4Conclusion
在这项工作中,我么提出并评估了一种在3D点云上运行的新颖的,无序模型和学习的自底向上的分割算法。尽管我们的算法旨在对对象进行分割,但我们在两个著名的基准测试中获得了最新的结果:对象细分数据库和纽约大学室内数据集。后者之所以特别有趣,有两个原因:首先,所有已发布的结果都需要学习(需要带注释的地面真相)以及颜色信息。相反,我们的方法是第一个不需要这两个信息的已发布算法。其次,地面真相将场景任意划分为“完整”的对象,因此将对象分割为它们的各个部分将降低总体得分。尽管如此,我们还得到了与最先进水平相当的结果。无需学习的方法具有多种优点,其中最重要的就是不需要创建新的训练数据和附带注释的真实图像。这不仅意味着该方法可以作为自动引导过程的第一步直接应用,还可以用于任意未知场景或由新设备获取的场景。


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部