ICLR2023 | 阿卜杜拉国王科技大学最新发布,3D表示新网络:多视图+点云!

作者:HT  | 来源:3D视觉工坊

在公众号「3D视觉工坊」后台,回复「原论」即可获取论文pdf。

添加微信:dddvisiona,备注:SLAM,拉你入群。文末附行业细分群。

多视图投影方法在 3D 分类和分割等 3D 理解任务上表现出了良好的性能。然而,目前尚不清楚如何将这种多视图方法与广泛使用的 3D 点云相结合

人类视觉系统更接近于使用多个视角的间接方法来理解3D物体,而不是直接处理3D数据。相比之下,间接方法通常通过渲染对象或场景的多个2D视图,并使用基于2D图像的传统架构来处理每个图像。人类视觉系统更接近于这种多视图间接方法,因为它接收到的是渲染图像流,而不是显式的3D数据。

引入了Voint cloud这个新的3D数据表示形式,并设计了VointNet 模型来学习和处理这种表示。Voint cloud将每个3D点表示为从多个视角提取的特征集合,以融合点云表示的紧凑性和多视图表示的自然感知能力。

作者通过定义在Voint级别的池化和卷积操作,构建了Voint neural network (VointNet ),并利用该网络在Voint空间学习3D表示。

简介

多视图投影方法在 3D 分类和分割等


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部