详解GCN原理-公式推导

2023-08-17 18:41:45

GNN survey

convolution

如何graph domain 上做convolution 是最近最热门的研究方向。

总的来说有两种卷积的方法： Spectral and non-spectral (spatial)

spectral Network

通过对图的拉普拉斯矩阵做特征分解，将它定义在傅里叶 domain上。

在深入解释之前，先看一些有关图的定义，以下都是针对无向图所做的说明

在这里插入图片描述

对于图 $G$ ,可以用它其中的节点 $V$ 和边 $E$ 来对他进行定义。

矩阵 $A$ 是图的邻接矩阵，反应了节点之间有无连接。

$D$ 代表了图的度矩阵，表示了每个节点有多少个度，即有多少条边和它相连接， $D$ 为对角矩阵

$f$ 代表了一中映射，可以节点转换为信号。

在这里插入图片描述

当给了一张图：

我们有了它的邻接矩阵 $A$ 和度矩阵 $D$

在这里插入图片描述

计算拉普拉斯矩阵，其实很简单就是 $D - A$ :

在这里插入图片描述

然后对 $L$ 做spectral decomposition ，又称特征分解。因为 $L$ 是对称矩阵，所以可以得到以下的分解形式：
$L=U\Lambda\ U^T$
其中 $\Lambda$ 是特征值的对角矩阵， $U$ 是一个由特征向量组成的向量。

$\Lambda=diag(\lambda_0,...,\lambda_{n-1}), U=[\mu_0,..,\mu_{n-1}],正交的$ 。

在这里插入图片描述

假设 $f=[4,2,4,-3]^T$ ,我们来研究 $L f$ 代表了什么意思：
$L f = (D - A) f = D f - A f$

在这里插入图片描述

我们只关注于第一个结点 $v_0$ ，根据上图我们可以看到，结果 $a$ 就是结点 $v_0$ 和它的两个邻居结点 $v_1,v_2$ 信号的差值。

那么就有下式的成立：

在这里插入图片描述

如果 $f^TLf$ 表示相邻结点之间能量的话，那么如果信号的频率越高，则相邻的两个信号之间的差值就越大，能量也就会越大。

而特征值 $\lambda$ ,就是一种频率的反映

在这里插入图片描述

Vertex domain 转换成 spectral domain

给定一个图的结点的signal $x$ ,则经过傅里叶转换到频域上的 $\hat x=U^Tx$

在这里插入图片描述

其实就是乘上不同频率 $\lambda$ 上的特征值，得到这个信号在不同频率上的大小是多少：

在这里插入图片描述

怎么转换回去呢？spectral domain 转换成 Vertex domain

就是将每一个频率下对应的信号，和对应特征向量中的值相乘：

在这里插入图片描述

右边一列是在不同特征值下的特征向量的分布情况，下面的那一行不同频率下的值。

现在我们知道了 vertex和spectral domain 互相转换的方法

**如果我们在spectral 转换成 vertex的时候，改变转换时乘上的参数，改成一个 $g_\theta(\Lambda)$ 一个关于 $\theta 的函数$ ** 。

然后我们希望通过这个 $g_\theta$ 转换成我们想要的label，那么这个过程就是可以通过神经网络进行训练的。

在这里插入图片描述

现在我们明确了我们想找的filter $g_\theta(\Lambda)$ ,使得：
$\hat y=g_\theta(\Lambda) \hat x$

$\Rightarrow g_\theta(\Lambda) U^Tx$

两边同时成一个 U
$U\hat y=U g_\theta(\Lambda)U^TX$
合并一下：
$y=U\hat y=U g_\theta(\Lambda)U^TX=g_\theta(U\Lambda U^T)X=g_\theta(L)x$
上述的 $g_\theta(.)$ 可以是任意的一个函数，比如:

在这里插入图片描述

根据泰勒展开式会有上述的形式，但是这样会出现一个问题1，就是学习的复杂度太高了： $O (n)$

还有另外一个问题2：

当 $g_\theta=L^2$ 的时候：

在这里插入图片描述

$L^2$ 代表着与结点距离为2的邻居结点的信息， $L^n$ 则代表着距离为n。如果当n越来越大，那么图中的每一个结点会和其他的所有结点相关，这个就违反了局部性 localized。

使用ChebNet去解决上述的两种问题

我们使用一个可以被循环计算的多项式函数来拟合L

在这里插入图片描述

综上，GCN的最终形态会被写成：

在这里插入图片描述
参考
视频:https://www.youtube.com/watch?v=M9ht8vsVEw8&t=1913s
PPT:http://speech.ee.ntu.edu.tw/~tlkagk/courses/ML2020/GNN.pdf

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce

详解GCN原理-公式推导

GNN survey

convolution

spectral Network

相关文章