SIGIR'22 | 推荐系统:图对比学习视图生成新思路

火山方舟向量数据库大模型

picture.image

关注我们,一起学习~

title:Are Graph Augmentations Necessary? Simple Graph Contrastive Learning for Recommendation

link:https://arxiv.org/pdf/2112.08679.pdf

code:https://github.com/Coder-Yu/QRec

from:SIGIR 2022

  1. 导读

本文是针对图对比学习在推荐系统中的应用而提出的相关方法SimGCL。通常做对比学习的时候,需要对数据进行增广,得到相同数据的不同视图(view),然后进行对比学习,对于图结构也是一样,需要对用户-商品二部图进行结构扰动从而获得不同视图,然后进行对比学习最大化不同图扩充之间的节点表征一致性。本文通过实验表明

  • 基于对比学习的推荐模型中,对比学习通过学习更统一的用户,商品表征来隐式的减轻流行度偏差;
  • 图增强只起到了很小的作用

因此,本文提出一种简单的对比学习方法,放弃之前的图增强方法,将均匀噪声添加到embedding空间,从而形成对比视图。虽然本文是针对图对比学习的,但是也许对其他情况的对比学习也有借鉴意义。

  1. SimGCL

2.1 总览

本文的总体结构是图+对比学习,基模型采用LightGCN。总体损失函数表示为,其中L_rec为用户和商品embedding经过LightGCN后得到的表征,然后通过BPR损失函数计算损失。L_cl表示对比损失,这里采用流行的infoNCE损失函数, 本文的重点在于如何构建节点embedding的不同视图以进行对比学习 。因此下文中主要介绍本文的主要创新之处,即如何构建不同视图,而对于其他基础部分如BPR损失,infoNCE损失,LightGCN等不再介绍。

2.2 动机

在SGL[1]上作者进行了如下实验,探究图结构扰动在图对比学习中的作用,ND为节点dropout,ED为边dropout,RW为随机游走,WA不进行数据增广(这里两个视图都用原始embedding)。可以发现,不进行数据增广的情况下,只比增强低一点,说明其作用很小。picture.image以往的做法修改图结构是耗时又麻烦的,作用还小,因此作者考虑是否可以在embedding空间中进行操作。通过添加随机噪声增加一部分扰动,实现快速高效的数据增广。

2.3 方法

给定节点i,他的embedding表示为,则其增广过程表示如下,其中,这个约束用于控制噪声的大小,并且对应的向量在半径为的球上,,sign(x),x<0则输出-1,大于0则输出1,第二个约束要求,和应该在同一个超八分圆中,这样添加噪声不会导致新的有很大的偏差,导致有效正样本较少。均匀分布。由于旋转足够小,增强表示保留了原始表示的大部分信息,同时也保留了一些方差。

,picture.image以LightGCN为图编码器进行消息传播,在每次传播的过程中加入噪声,最后将每一层的输出求均值进行池化。公式如下,其中A表示邻接矩阵。

代码:

  
def perturbed\_LightGCN\_encoder(self,emb,adj,n\_layers):  
        all_embs = []  
        for k in range(n_layers):  
            emb = tf.sparse_tensor_dense_matmul(adj, emb)  
            random_noise = tf.random.uniform(emb.shape)  
            emb += tf.multiply(tf.sign(emb),tf.nn.l2_normalize(random_noise, 1)) * self.eps  
            all_embs.append(emb)  
        all_embs = tf.reduce_mean(all_embs, axis=0)  
        return tf.split(all_embs, [self.num_users, self.num_items], 0)  

  1. 结果

picture.imageimage.png文献

[1] Jiancan Wu, Xiang Wang, Fuli Feng, Xiangnan He, Liang Chen, Jianxun Lian, and Xing Xie. 2021. Self-supervised graph learning for recommendation. In Proceedings of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval. 726–735

交流群:点击“联系作者”--备注“研究方向-公司或学校”

欢迎|论文宣传|合作交流

往期推荐

[picture.image

SIGIR'22「微软」新闻推荐三连](https://mp.weixin.qq.com/s?__biz=MzkxNjI4MDkzOQ==&mid=2247490965&idx=1&sn=ee3afeeae2e625feae3d5f67a054e41f&chksm=c1531e91f6249787fc4b7aa95b829595d5362a6a48a97106bb0250b40a9bc0e23146564b8b19&scene=21#wechat_redirect)

[picture.image

干货!建模过程中需要注意什么?](https://mp.weixin.qq.com/s?__biz=MzkxNjI4MDkzOQ==&mid=2247490948&idx=1&sn=fca2934204da7c8b9e846059007cd868&chksm=c1531e80f62497966fede612f6bea259f031bdc08537ca8fe680377b346ad01a47e6ed983242&scene=21#wechat_redirect)

[picture.image

ICDE'22「华为」MISS:多兴趣自监督学习框架用于点击率预估](https://mp.weixin.qq.com/s?__biz=MzkxNjI4MDkzOQ==&mid=2247490936&idx=1&sn=3fed2a86495824186b586ce3632067c4&chksm=c1531e7cf624976a5202f15665f6ed730077e08f632dd9487a5e1c4bee5b9192f43a60bfa7bf&scene=21#wechat_redirect)

picture.image

长按关注,更多精彩

picture.image

picture.image

点个在看你最好看

0
0
0
0
关于作者

文章

0

获赞

0

收藏

0

相关资源
大规模高性能计算集群优化实践
随着机器学习的发展,数据量和训练模型都有越来越大的趋势,这对基础设施有了更高的要求,包括硬件、网络架构等。本次分享主要介绍火山引擎支撑大规模高性能计算集群的架构和优化实践。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论