《Gaussian YOLOv3》论文笔记

2023-08-18 17:38:50

参考代码：Gaussian_YOLOv3
关键代码解释：Gaussian YOLOv3：一个更强的YOLOv3，现已开源！

1. 概述

导读：这篇文章着力于解决自动驾驶检测任务最后结果中的假阳性检测结果问题，文章在YOLOv3网络的坐标回归上引入一组高斯参用于表示坐标的不确定性（目标置信度与分类置信度并不能很好表征检测框的置信度），并且根据这个需求重新设计网络损失函数，从而网络在假阳性检测结果上有所好转，即是这个重新设计的网络可以输出检测结果的定位不确定性，从而在检测的过程中使用这个属性就可以减少错误的检测结果，这个改进的网络在文章中被称为Gaussian YOLOv3。在性能表现上相比原始版本的YOLOv3在KITTI与berkeley deep dirve（BDD）数据集上分别提升了3.09和3.5的mAP，对于TP与FP性能也分别有所提升，同时保持了42FPS（输入分辨率为512*512）的检测速率。

在这篇文章中通过对坐标回归引入高斯回归量（高斯分布的均值与方差），代表的是坐标回归的不确定性，并且对损失函数进行了重新设计，这些回归量可以通过网络进行回归估计得到的，在后面的结果中使用这些估计出来的参数辅助提升检测的精度。

回顾YOLOv1版本的检测模型，它是在最后特征图划分的区域上寻找落在区域中的目标的中心，实现对应寻找并进行回归目标，这样使其处理简单，运算速度也够快。v2的版本在v1的基础上对于卷积层添加BN操作，引入anchor box，变尺度图像输入，更好的backboe网络上进行改进。而v3是主要引入了类似FPN的多尺度特征融合与检测模块，从而适应不同大小的目标，并且其backbone引入了残差连接的结构优化backbone，其结构见下图1所示：
在这里插入图片描述

2. 网络设计

2.1 在YOLOv3中引入定位不确定性预测

在YOLOv3模型中输出包含三部分的内容： $t_x,t_y,t_w,t_h)$ 它表示一个检测框结果，当前框是否为目标的置信度，当前框的分类置信度。但是对检测框的坐标确定性却没有显式的表达，这篇文章也是从这个角度进行优化从而排除一些错误的检测结果。对于一组数据 $x$ 其对应的高斯分布拟合为：
$p(y|x)=N(y;u(x),\sum(x))$
而对于每一个检测框的回归值使用高斯进行不确定性描述，则对于每个检测框的坐标使用特征图上去预估其分布的均值与方差，则改进之后的网络检测头输出可以描述为图2中所示的情况（替换了原有的检测框输出，换成高斯估计量）：
在这里插入图片描述
因而按照上面的思路就会对边界框回归的4个变量进行不确定估计，也就是上面说到的高斯参数（表达检测框的4个分量均值与方差），即是： $\hat{u}_{tx},\hat{\sum}_{tx},\hat{u}_{ty},\hat{\sum}_{ty},\hat{u}_{tw},\hat{\sum}_{tw},\hat{u}_{th},\hat{\sum}_{th}$

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

上一篇 > python 2d-gaussian fitting
下一篇 > Gaussian Embedding

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce

《Gaussian YOLOv3》论文笔记

1. 概述

2. 网络设计

2.1 在YOLOv3中引入定位不确定性预测

相关文章