week1_读书报告

读书报告

一、摘要重述

传统的推荐只关注于利用目标用户的单一行为而忽略了其他辅助行为。早期的行为推荐工作是通过区分不同行为来提取有用的信息,强调行为间的差异性。然而,这样却忽略了不同行为之间的共性, 同时也会存在有限的监督信号问题。在本文中, 我们提出一种新的用于多行为推荐的自监督图协同滤波模型S-MBRec。首先对每个行为执行GCNs以学习用户和物品嵌入。然后设计一个有监督的任务,区分不同行为的重要性,以捕获嵌入之间的差异,同时提出一种星型对比学习任务,捕获目标和辅助行为之间的嵌入共性,以缓解监督信号的稀疏性,减少辅助行为之间的冗余,提取最关键的信息。最后,我们对上述两项任务进行了联合优化。实验结果表明S-MBRec模型占优。

二、陈述Figure2(对图进行描述)

图2 S-MBRec的模型架构

Figure2: The model architecture of S-MBRec

S-MBRec模型架构如图所示,首先最左边定义了多行为图G,图G中左半边的三个蓝色圆点表示用户节点,右半边的红色圆点表示物品节点,用户与物品节点之间以三种不同颜色的线相连,表示有三种不同的行为。根据不同行为将图G拆分成三类子图G1、G2、G3,其中G1表示目标行为子图,G2和G3表示辅助行为子图,对每一个子图执行GCNs操作以获得每个行为子图下的节点嵌入,分别得到嵌入矩阵X1、X2、X3,其中X1为目标行为嵌入矩阵,X2和X3均为辅助行为嵌入矩阵。

然后设置了两个任务:自适应监督任务和星型自监督任务,图中用虚线框分隔为上下两部分。上方进行自适应监督任务,首先为用户u的第k个行为设计对应的语义融合系数auk (k=1,2,3),然后得到该行为下的用户嵌入矩阵XUk (k=1,2,3),接着集成所有行为以生成用户u的最终表示eu,对物品嵌入矩阵XIk的列向量之间进行串联操作以生成物品i的最终表示ei,最后使用成对贝叶斯个性化排名(BPR)损失优化eu和ei两个模块得到监督任务的损失函数Lst。下方进行星型自监督任务,首先将目标行为的嵌入矩阵X1与辅助行为嵌入矩阵X2进行对比学习,得到对比损失函数Lsst_2user和Lsst_2item,与辅助行为嵌入矩阵X3进行对比学习,得到对比损失函数Lsst_3user和Lsst_3item,然后通过组合用户和项目下的所有损失函数以得到自监督任务的损失函数Lsst

最后通过公式公式

联合优化了推荐模型以对上述两项任务进行结合,得到最终的损失函数L,其中Θ表示两个任务中的所有可训练参数,λ和μ分别表示控制自监督任务和L2正则化比例的超参数。

三、心得体会

刚开始接触全英文的科研论文,阅读过程还是比较艰难,里面的很多词汇都晦涩难懂,让我开始相信英文水平不是过了四六级就能够检验的,好在如今的时代有各类翻译软件来帮助我们理解,这也从另一角度证明了在以前那个连翻译软件都没有的时代,能在学术科研方面搞出一定名堂的肯定是个很厉害的角色。
本次读书报告重点在于理清作者的思路,我们可以用what-why-how来理一下作者的一个大概逻辑:

  1. what——要研究的是什么?
    研究一种新的多行为推荐模型,名为S-MBRec。
  2. why——为什么要研究新的模型?
    因为早期的模型准确度不够/新的模型准确度高——总之就是现阶段的模型是可以得到优化的。
  3. how——具体是怎么做的呢?
    详细说明参见第二部分,但最终的优化还是会落实到算法和代码部分。

其实第一周的任务总的来说还不算太难,难的还是后面的代码复现的部分,相当于刚开始给了你手套和砖头,告诉你要从楼梯运到几楼,而后面爬楼梯就是最累的部分,对我们刚刚接触的本科生来说亦是最难的部分,但是如果能够坚持下来一点一点地去实现一个新的科研成果,一定会有一种与科研大牛一起为人类做贡献的感觉,这也正是科研的魅力吧。


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部