I-O-U you should know

2023-08-28 02:37:19

文章目录

SmoothL1->IoU->GIoU->DIoU->CIoU Loss
- SmoothL1
- IoU LOSS
- GIoU LOSS
- Distance-IoU Loss(DIOU)
- Complete-IoU(CIOU)

SmoothL1->IoU->GIoU->DIoU->CIoU Loss

SmoothL1

由微软rgb大神在Fast RCNN论文提出
设x为真实值与预测值之间的差

$L1\_LOSS = |x|$
缺点：
1） $L1\_LOSS$ 损失函数在0处不可导；
2） $L1\_LOSS$ 对x的导数为常数，在训练后期，x很小时，如果learning rate 不变，损失函数会在稳定值附近波动，很难收敛到更高的精度。
$L2\_LOSS = |x|^2$
缺点：
$L2\_LOSS$ 损失函数对x>1时的导数，其导数也非常大，给予二次方倍的惩罚，对离群点比较敏感，受其影响较大，可能梯度爆炸。
$\text{Smooth}{L_1}(x) =\left \{ \begin{array}{c} 0.5x^2 & if \mid x \mid <1 \\ \mid x \mid - 0.5 & otherwise \end{array} \right.$
综合二者的有点，规避二者的缺点，完美。

在这里插入图片描述
三种方式的缺点：
上面的三种Loss用于计算目标检测的Bounding Box Loss时，独立的求出4个点的Loss，然后进行相加得到最终的Bounding Box Loss，这种做法的假设是4个点是相互独立的，实际是有一定相关性的。实际评价框检测的指标是使用IOU，这两者是不等价的，多个检测框可能有相同大小的 $Smooth_{L_1}(x)$ LOSS，但IOU可能差异很大，为了解决这个问题就引入了IOU LOSS。
在这里插入图片描述

IoU LOSS

由旷视提出，发表于2016 ACM。也可在我博客中找到具体的解读。

在这里插入图片描述 缺点：
1）当预测框和目标框不相交时，IoU(A,B)=0时，不能反映A,B距离的远近，此时损失函数不可导，IoU Loss 无法优化两个框不相交的情况。
2）假设预测框和目标框的大小都确定，只要两个框的相交值是确定的，其IoU值是相同时，IoU值不能反映两个框是如何相交的。
如：
在这里插入图片描述于是GIOU LOSS 被提出。

GIoU LOSS

由斯坦福学者提出，发表于CVPR2019

在这里插入图片描述 缺点：

在这里插入图片描述当目标框完全包裹预测框的时候，IoU和GIoU的值都一样，此时GIoU退化为IoU, 无法区分其相对位置关系；此时作者提出的DIoU，加入了中心点归一化距离，所以可以更好地优化此类问题。

位置暴露了缺点，于是DIOU LOSS 被提出。
在这里插入图片描述

Distance-IoU Loss(DIOU)

Distance-IoU Loss 论文地址
在这里插入图片描述
$DIOU=IOU-(d/c)^2$

在这里插入图片描述
上述损失函数中，b，bgt分别代表了anchor框和目标框的中心点，且p代表的是计算两个中心点间的欧式距离。c代表的是能够同时覆盖anchor和目标框的最小矩形的对角线距离。因此DIoU中对anchor框和目标框之间的归一化距离进行了建模。直观的展示如下图所示。

特点及缺点：
1）尺度不变性；
2）当两个框完全重合时DIOU=0；
3）当2个框不相交时，仍然可以为边界框计算损失，并提供移动方向。
4）DIoU Loss可以直接优化2个框直接的距离，比GIoU Loss收敛速度更快
5）对于目标框包裹预测框的这种情况，DIoU Loss可以收敛的很快，而GIoU Loss此时退化为IoU Loss收敛速度较慢；

Complete-IoU(CIOU)

$CIOU=IOU-(d/c)^2-av$
论文考虑到bbox回归三要素中的长宽比还没被考虑到计算中，因此，进一步在DIoU的基础上提出了CIoU。其惩罚项如下面公式：
在这里插入图片描述
CIoU的惩罚项是在DIoU的惩罚项基础上加了一个影响因子av,

a 为权重
在这里插入图片描述

experiment:

在这里插入图片描述
【完结】

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

上一篇 > what do i want?
下一篇 > wantyou 5.03

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce