CVPR 2019 《Cross-Modal Relationship Inference for Grounding Referring Expressions》论文笔记

目录

  • 简介
  • 动机
  • 方法
  • 实验

简介

下载链接

动机

已有方法不能准确地、一致地表示两种模态(referring expressions、object proposals)的上下文关系,具体为:

  • 要么不能准确建模,要么不能达到跨模态的高阶一致性。
  • 计算出的pairwise visual differences只能代表同类对象之间、instance-level的差异。
  • 要么不支持关系建模,要么只考虑一阶关系。
  • 由于多阶关系是结构化的信息,现有的上下文编码器无法对其建模。

方法

以regions为结点构图,将结点和word对齐,再进行图卷积。


实验

在RefCOCO、RefCOCO+和RefCOCOg上的实验结果:

Ablation study:


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部