nanodet阅读：（1）概述

2023-11-23 21:39:48

一、前言

出于某些需要，阅读一下anchor-free模型的代码，因为之前用过nanodet，对其印象深刻，所以重温一下代码。好记性不如烂笔头，多记录、多总结、多分享。
正如作者博客说的：NanoDet总体而言没有特别多的创新点，是一个纯工程化的项目，主要的工作就是将目前学术界的一些优秀论文，落地到移动端的轻量级模型上。

二、正文

1. 模型整体特点
模型之所以轻量，是因为作者用了
① 轻量的backbone ：经典轻量级模型，如mobilenet, shufflenet等；
② 轻量的FPN ：完全去掉PAN中的所有卷积，只保留1x1卷积来进行特征通道维度的对齐，上采样和下采样均使用插值来完成；
③ 轻量的head ：深度卷积、减少卷积个数与维度、边框回归和分类共享同一组卷积。
此外还因为作者选择了
① 合适的损失函数GFocal Loss；
② 合适的正负样本定义方法ATSS；
③ 轻量但性能不弱的backbone；
④ 成熟的模型架构 backbone + pan + head；
⑤ head不共享权重(检测头非常轻量的情况下，共享权重会降低其泛化能力);

使得模型虽然轻量，但性能不差。

2. nanodet anchor 大小及生成。
nanodet虽说是anchor-free路线，但还是有anchor的，其作用主要体现在训练时的正负样本定义（ATSS）阶段，其他时候只会用到anchor的中心坐标（如计算bbox时）。

def get_single_level_center_point(self, featmap_size, stride, dtype, device, flatten=True):"""Generate pixel centers of a single stage feature map.:param featmap_size: height and width of the feature map:param stride: down sample stride of the feature map:param dtype: data type of the tensors:param device: device of the tensors:param flatten: flatten the x and y tensors:return: y and x of the center points"""h, w = featmap_size# 加 0.5, 输出 anchor 中心坐标x_range = (torch.arange(w, dtype=dtype, device=device) + 0.5) * stridey_range = (torch.arange(h, dtype=dtype, device=device) + 0.5) * stridey, x = torch.meshgrid(y_range, x_range)if flatten:y = y.flatten()x = x.flatten()return y, xdef get_grid_cells(self, featmap_size, scale, stride, dtype, device):  """Generate grid cells of a feature map for target assignment.:param featmap_size: Size of a single level feature map.:param scale: Grid cell scale.:param stride: Down sample stride of the feature map.:param dtype: Data type of the tensors.:param device: Device of the tensors.:return: Grid_cells xyxy position. Size should be [feat_w * feat_h, 4]"""cell_size = stride * scale  # anchor 的边长。scale = 5 超参# 生成 anchor 中心坐标y, x = self.get_single_level_center_point(featmap_size, stride, dtype, device, flatten=True)# 生成 anhcor 左上右下坐标grid_cells = torch.stack([x - 0.5 * cell_size,  # 在 cell 中心坐标处放了一个方形 anchor，宽为 cell_sizey - 0.5 * cell_size,x + 0.5 * cell_size,y + 0.5 * cell_size,],dim=-1,)return grid_cells

从上面代码可以看出，nanodet的anchor有三个特点：
① 形状单一，每个输出层上都是正方形anchor；
② 数量少，每个输出层上只有一种anchor，总体的anchor数目少了很多；
③ 尺寸单一，输出层上的anchor只有一种尺寸——stride * scale。

由此产生疑惑：为什么anchor的形状要设置为正方形？
个人理解：因为anchor的主要作用是在正负样本分类时，如果设置为W > H的形状，对W < H形状的ground truth可能会匹配不佳。反之亦然，所以干脆设置成正方形的形状，无论是 W < H形状的还是 W > H形状的ground truth，都能兼顾到。

三、后言

仓促之下写成，如有遗漏，还请指正，谢谢！
此外，本系列一共三篇，另有：
nanodet阅读：（2）正负样本定义(ATSS)；
nanodet阅读：（3）Loss计算及推理部分。

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

上一篇 > 初学JAVA项目（二、打砖块）
下一篇 > 软件设计模式与设计原则概述

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce

nanodet阅读：（1）概述

一、前言

二、正文

三、 后言

相关文章

三、后言