All mistakes are not equal: Comprehensive Hierarchy Aware Multi-label Predictions (CHAMP)

2023-10-24 12:25:15

abstract

这篇论文考虑层级多标签分类（HMC）已存在的问题：每个样本可以存在多个标签；标签基于一颗领域内的层级树。基于所有错误不平等的直觉，我们提出Comprehensive hierarchy aware multi-label predictions（CHAMP），根据层次结构树的严重性对错误预测进行惩罚。基于此的单标签的工作有，而多标签的工作很少，主要原因是没有明确的先验方法来量化多标签设置中错误预测的严重性。多模态（text、audio、image）做实验。
因为没有办法直接量化预测值和真实值之间的距离，所以多标签一直用BCE做loss损失，本论文引入简单的距离公式解决这一问题，且效果提升较多。

preliminaries and problem setting

${(x_i,y_i):i=1,...,n\}$ 有标签的训练样本，其中 $x_i\in|R^d$ 是输入样本， $y_i\in \{0,1\}^L$ 是对应的标签向量，L是标签的数量。
$\tau$ 是包含L个节点的层级树
目标是训练一个预测模型 $\zeta$ 以x为输入，输出一个L维的向量 $\bar y\in[0,1]^L$ ，给定阈值以后，将 $\bar y$ 给出最后的输出。

metrics

precision、recall、AUPRC（area under the precision-recall curve）、precison@K、F1@K
介绍几个概念，将会帮助后续量化错误预测的严重性
树上的两个节点 $j,j^{'}\in |L|$ ， $dist(j,j^{'})$ 代表两个节点之间的距离
树上的节点集合 $S\subseteq|L|$ , $\equiv \min_{j^{'}\in S} dist(j,j^{'})$
标签 $j^{'}$ 的影响范围是--------没看懂，幸好没影响我后续的理解。。。

method

BCE $L_{x,y}(\tau)=-\sum_{j=1}^L\{y_j\log\bar y_j+(1-y_j)\log (1-\bar y_j)\}$
修改版的BCE $\tilde L_{x,y}(\tau)=-\sum_{j=1}^L\{y_j\log\bar y_j+(1+s_S(j))(1-y_j)\log (1-\bar y_j)\}$ ，其中S是真实标签 $S=\{j^{'}:y_{j^{'}}=1\}$ ， $s_S(j)$ 代表了标签j的假阳预测的严重性。
给了两种严重性的定义方式：hard 和soft，其中 $dist_{max}=max_{k,k^{'}\in |L|}dist(k,k^{'})$
$s_S^{hard}(j)=\beta \frac {dist(j,S)}{dist_{max}}$ ，只考虑与最近的真实标签的距离
$s_S^{soft}(j)=\beta \frac {dist_{harmonic}(j,S)}{dist_{max}}$ ，考虑所有的真实标签的距离
其中 $dist_{harmonic}(j,S)=\frac {|S|}{\sum_{j^{'}\in S}dist(j,j^{'})^{-1}}$
在这里插入图片描述
这张图里面不理解不同颜色的圈，但是不影响计算。。
而且右侧dist(8,6)应该是dist(8,9)
真实标签是2、6、9，预测标签是8
8和9的距离是7、9，所以dist(8,9)=2
8和2的距离是7、0、1、2，所以dist(8,2)=4
8和6的距离是7、0、1、3、6，所以dist(8,6)=5，所以 $dist_{hard}(8,\{2,6,9\})=2$
最大距离是10与6之间的距离9、7、0、1、3、6，所以 $dist_{max}=6$
这样就可以算出 $s^{hard}_{\{2、6、9\}}(8)=2/6$

$dist_{harmonic}(j,S)=\frac{3}{\frac{1}{2}+\frac{1}{4}+\frac{1}{5}}=\frac {60}{19}$
这样就可以算出 $s^{soft}_{\{2、6、9\}}(8)=(60/19)/6$

Results

code

论文中提供了tensorflow版本的代码，但是缺少get_distance部分的代码，我按照自己的理解，简单进行了实现

def get_distance(node1, node2, kid2parent):i = 1tmp = [node1, node2]while node1 in dict_kid2parent:i = i + 1node1 = dict_kid2parent[node1]tmp.append(node1)j = 1while node2 in dict_kid2parent:j = j + 1node2 = dict_kid2parent[node2]tmp.append(node2)b = dict(Counter(tmp))num = len([key for key,value in b.items()if value > 1])return i + j - num*2dict_idx2labels = {1:"N_2", 2:'N_3', 3:'N_4', 4:'N_5', 5:'N_6', 6:'N_7', 7:"N_8", 8:"N_9", 9:"N_10", 10:"N_11", 0:"N_1"}
dict_kid2parent = {'N_10':'N_9', 'N_11':'N_9', 'N_9':'N_7', 'N_8':'N_7', "N_5":"N_3", "N_6":"N_3", "N_3":"N_1", "N_4":"N_1", "N_2":"N_1"}
get_distance('N_8', 'N_9', dict_kid2parent)
#2

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

上一篇 > Croc Champ 2013 - Round 2 C. Cube Problem
下一篇 > ChAMP 分析甲基化芯片数据-EpiMod篇

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce

All mistakes are not equal: Comprehensive Hierarchy Aware Multi-label Predictions (CHAMP)

abstract

preliminaries and problem setting

metrics

method

Results

code

相关文章