Adaptive Graph Convolutional Recurrent Network for Traffic Forecasting

2023-10-19 01:19:24

研究问题

自适应捕捉交通流时间序列中的时空依赖问题

背景动机

当前的大多数深度学习方法基于共享参数模型（不同节点对应同一卷积），由于每条道路的具体情况不一样，这种方式无法捕捉细粒度的数据模式
现存方法要求根据距离或相似度预先定义一个图来捕捉空间相关性，这个图不一定能完善地表示空间依赖

模型思想

设计节点自适应参数学习(NAPL)模块，分解传统GCN中的参数，根据节点嵌入从所有节点共享的权重池和偏差池生成特定节点参数以捕获节点特定模式
设计数据自适应图生成(DAGG)模块，自动推断不同序列之间的相互依赖关系
提出一种自适应图卷积递归网络(AGCRN)，基于这两个模块和RNN架构自动捕获交通序列的细粒度时空关联。

符号定义

N个节点在t个时刻的时间序列可以表示为 $\mathcal{X}=\left\{\boldsymbol{X}_{:, 0}, \boldsymbol{X}_{:, 1}, \ldots, \boldsymbol{X}_{:, t}, \ldots\right\}$ ，其中 $\boldsymbol{X}_{:, t}=\left\{x_{1, t}, x_{2, t}, \ldots, x_{i, t}, \ldots x_{N, t}\right\}^{T} \in R^{N \times 1}$ ，目标是学习一个预测函数，使得

$\left\{\boldsymbol{X}_{:, t+1}, \boldsymbol{X}_{:, t+2}, \ldots, \boldsymbol{X}_{:, t+\boldsymbol{\tau}}\right\}=\mathcal{F}_{\boldsymbol{\theta}}\left(\boldsymbol{X}_{:, \boldsymbol{t}}, \boldsymbol{X}_{:, t-1}, \ldots, \boldsymbol{X}_{:, t-\boldsymbol{T}+1} ; \mathcal{G}\right)$

其中 $\mathcal{G}=(\mathcal{V}, \mathcal{E}, \boldsymbol{A})$

模型结构

节点自适应参数学习(NAPL)模块

传统GCN的计算公式如下

$Z=\left(\boldsymbol{I}_{\boldsymbol{N}}+\boldsymbol{D}^{-\frac{1}{2}} \boldsymbol{A} \boldsymbol{D}^{-\frac{1}{2}}\right) \boldsymbol{X} \boldsymbol{\Theta}+\mathbf{b}$

假设 $\in R^{N \times N}$ ， $\in R^{N \times C}$ ， $\Theta \in R^{C \times F}$ , $\in R^{N \times F}$ 可以看到，所有节点的特征都经过共同的参数 $\Theta$ 处理后从C维变成了F维。为了获取节点特异的参数，一个直观的想法是令 $\Theta \in R^{N \times C \times F}$ ,但这样会在N较大的情况下引入过多参数。因此，作者采取了矩阵分解的技巧，令 $E_G \in R^{N \times d}, W_G \in R^{d \times C \times d}$ ，GCN计算公式变为

$Z=\left(I_{N}+D^{-\frac{1}{2}} A D^{-\frac{1}{2}}\right) X E_{\mathcal{G}} W_{\mathcal{G}}+E_{\mathcal{G}} b_{\mathcal{G}}$

数据自适应图生成(DAGG)模块

第一次见到这么简单的自学习公式，特点是矩阵和自己的转置相乘可以直接得到一个对称矩阵，不过其他论文有时候假设的是具有非对称性

$\boldsymbol{D}^{-\frac{1}{2}} \boldsymbol{A} \boldsymbol{D}^{-\frac{1}{2}}=\operatorname{softmax}\left(\operatorname{ReL} U\left(\boldsymbol{E}_{\boldsymbol{A}} \cdot \boldsymbol{E}_{\boldsymbol{A}}^{\boldsymbol{T}}\right)\right)$

自适应图卷积递归网络(AGCRN)

重写GRU计算过程

在这里插入图片描述

实验部分

对比实验

在这里插入图片描述

消融实验

在这里插入图片描述

评价

这篇论文设计的比较巧妙的地方在于对传统图卷积的共享参数部分做了矩阵分解，从而获得节点特异性的参数。

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

上一篇 > 用于交通预测的自适应图卷积递归网络
下一篇 > 从三篇经典论文看时空数据挖掘任务中的自适应图学习

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce

Adaptive Graph Convolutional Recurrent Network for Traffic Forecasting

研究问题

背景动机

模型思想

符号定义

模型结构

实验部分

评价

相关文章