SIGIR'21短文「阿里」考虑用户信息交互的CTR预估模型

picture.image

点击蓝字关注,提升学习效率

picture.image image.png

Deep User Match Network for Click-Through Rate Prediction

https://dl.acm.org/doi/pdf/10.1145/3404835.3463078

01

背景

picture.image

本文为SIGIR21的一篇短文,主要考虑的是通常我们在做ctr等预估的时候只考虑item之间的关系,比如用户的历史点击序列和目标item之间的关系,从而反映用户的兴趣。但是忽略了用户之间的关系,本文主要就是构建了user-to-user的模块DUMN来做用户匹配。

我们之前的一篇去躁的文章的方法也叫DUMN,小伙伴们不要搞错了。‍‍本文的创新点其实比较简单,进行用户表征和用户相似度计算也比较简单,但是从最终的实验结果来看,效果还是不错的,因此也可以给我们在实践中提供一些思路。

02

方法

picture.image

picture.image上图为DUMN的总体框架图。表示用户行为序列,即用户u点击过的item的序列,序列中的元素包含item的各种特征,表示序列长度;表示item的交互序列,即item m交互过的用户的序列,表示和item m交互的用户的特征,表示用户u1的行为序列;最终的预测模型为,其中c为上下文特征。

2.1 Deep User Match Network

DUMN主要由embedding layer,User Representation Layer,User Match Layer组成。embedding layer在这里不在赘述,操作方式比较类似,不是本文的主要创新点。通过embedding layer可以得到,它们分别表示用户u的embedding,target item的embedding,上下文的embedding,用户行为序列,item交互序列,为u1的行为序列,表示用户u1的embedding。

2.1.1 User Representation Layer

picture.image用户表征层的结构如上图所示,主要用户为每个用户生成统一的表征。简单起见,本文将用户画像的embedding和用户的兴趣进行结合从而得到用户的表征,可以发现这里的结构和DIN的结构是有点相似的。通过注意力机制发掘用户对item的兴趣,然后再结合用户画像得到最终的embedding。公式如下:

上面的公式还是比较显而易见的,从注意力机制到加权到拼接,这里就不详细解释了。

2.1.2 User Match Layer

这部分,作者采用余弦相似度比较用户表征的相似性,公式如下:

在该部分,本文采用将目标用户的表征和交互序列中的用户表征进行相似度求解,得到,其中k表示序列中的第k个用户。然后对交互序列中的表征加权求和,得到下式:

并且可以得到用户和交互序列的总相似度:

2.2 Output Layer

将一系列的表征进行拼接后,通过全连接层进行计算,其中过的W和b就都是权重和偏置,这里就不多说了。最终经过交叉熵损失函数来计算损失。

03

实验结果

picture.image

从实验结果中,我们可以发现效果还是存在明显的提升的,可见虽然只是进行了简单的改动,加入了用户的相似度比较,并且计算方式也比较简单,但是效果还是比较明显的。picture.image

往期推荐

【基础】Dropout和Batch Norm原理与使用

SIGIR'21「华为」双塔模型中的CBNS负采样方法

推荐系统(二十二)——SIGIR'21「阿里」淘宝APP上的召回方法

推荐学习交流群:联系作者--备注:研究方向-公司或学校

扫描二维码

获取更多精彩

秋枫学习笔记

picture.image

picture.image

分享

picture.image

收藏

picture.image

点赞

picture.image

在看

0
0
0
0
评论
未登录
暂无评论