dert论文笔记(二)

在这里插入图片描述把这个编码器的自注意给可视化出来。我们在每个牛身上找一个基准点,然后我们用这个点和图像上其他点算自注意力,我们会发现他已经做的很好了。已经接近实力分割里面的mask的形状。我们在这个基础上去做decoder 或者目标检测 或者实力分割 任务 都会简单很多。
在这里插入图片描述decoder中也自注意力机制,我们把每个物体自注意力用用不同颜色表现出来。
encorder学的是全局特征,能基本把物体分开,但是这还不够 decoder就是把边缘这些头 尾巴这些给区分开
在这里插入图片描述
object query的可视化。在coco验证集里面得到的输出框可视化出来。n=100 这里只是20个object query。绿色的代表小的bbx 红色代表大的横向的bbxc蓝色代表竖向的大的bbx.其实object query 就是像问问题的人一样。

##总结
他是一个全新的做目标检测的框架,主要利用了transforms和二分图匹配,实现了端到端学习的网络,在coco上和fast rcnn打成平手。在全景分割上取得了更好的结果。因为他的简单应用性 他有很大的潜力应用到别的任务上。


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部