SIGIR'21短文「阿里」考虑用户信息交互的CTR预估模型

picture.image

点击蓝字关注，提升学习效率

picture.image image.png

Deep User Match Network for Click-Through Rate Prediction

https://dl.acm.org/doi/pdf/10.1145/3404835.3463078

背景

picture.image

本文为SIGIR21的一篇短文，主要考虑的是通常我们在做ctr等预估的时候只考虑item之间的关系，比如用户的历史点击序列和目标item之间的关系，从而反映用户的兴趣。但是忽略了用户之间的关系，本文主要就是构建了user-to-user的模块DUMN来做用户匹配。

我们之前的一篇去躁的文章的方法也叫DUMN，小伙伴们不要搞错了。‍‍本文的创新点其实比较简单，进行用户表征和用户相似度计算也比较简单，但是从最终的实验结果来看，效果还是不错的，因此也可以给我们在实践中提供一些思路。

方法

picture.image

picture.image 上图为DUMN的总体框架图。表示用户行为序列，即用户u点击过的item的序列，序列中的元素包含item的各种特征，表示序列长度；表示item的交互序列，即item m交互过的用户的序列，表示和item m交互的用户的特征，表示用户u1的行为序列；最终的预测模型为，其中c为上下文特征。

2.1 Deep User Match Network

DUMN主要由embedding layer，User Representation Layer，User Match Layer组成。embedding layer在这里不在赘述，操作方式比较类似，不是本文的主要创新点。通过embedding layer可以得到，它们分别表示用户u的embedding，target item的embedding，上下文的embedding，用户行为序列，item交互序列，为u1的行为序列，表示用户u1的embedding。

2.1.1 User Representation Layer

picture.image 用户表征层的结构如上图所示，主要用户为每个用户生成统一的表征。简单起见，本文将用户画像的embedding和用户的兴趣进行结合从而得到用户的表征，可以发现这里的结构和DIN的结构是有点相似的。通过注意力机制发掘用户对item的兴趣，然后再结合用户画像得到最终的embedding。公式如下：