关注我们,一起学习~
标题:A Deep Behavior Path Matching Network for Click-Through Rate Prediction
地址:https://arxiv.org/pdf/2302.00302.pdf
代码:https://github.com/Ethan-Yys/DBPMaN
会议:WWW 2023
公司:美团
-
导读
用户行为不仅包含不同种类的商品反馈,有时还暗示用户决策的认知线索。为了理解用户决策背后的心理过程,本文提出了行为路径,并提出将用户的当前行为路径与历史行为路径相匹配,以预测应用程序上的用户行为。此外,设计了用于行为路径匹配的深度神经网络,并解决了行为路径建模中的三个难题:稀疏性、噪声干扰和行为路径的精确匹配。利用对比学习来增强用户行为路径,提供行为路径自激活以减轻噪声的影响,并采用两级匹配机制来识别最合适的候选。
-
方法
2.1 总览
用户行为序列 ,U表示用户集合,对于每一个用户u,他的序列表示为,b为用户的行为,序列长度为T。作者采用了过去一年用户的交互商品,序列中的行为是交互的商品id,交互类型(点击,曝光,下单),距今时间以及相对位置等。
用户点击序列 ,即把交互类型为点击的拿出来组成一个序列
用户行为路径 ,对于在点击序列中的交互行为,令表示在序列s中对应的行为,m(i)表示点击发生时,他在s中的位置。与点击行为相关的用户行为路径表示为,这是一个子序列,即点击前发生了那些行为,这些行为对最终的点击是有意义的。
行为路径序列 ,行为路径包含了各种行为(点击,曝光,下单等),并且对于每个点击行为提取其对应的前面经历的子序列得到对应的用户行为路径p,构成路径序列。本文所提的方法DBPMaN包含embedding层和三个模块,分别是路径增强模块(PEM),路径匹配模块(PMM),路径增广模块(PAM)。
2.2 Path Enhancing Module (PEM)
对于一个行为路径和对应的点击行为,embedding层得到这些交互对应的embedding,。计算行为路径中交互的embedding和最终点击embedding之间的关系并对前序行为加权,组成新的序列,公式如下,其中a()为MLP
通过计算得到行为路径中每个交互的embedding后,通过拼接得到(ps:这里的concat不是在向量维度而是axis=0,只是把前面的s数组转变为可以输入mlp的矩阵),再将此输入MLP得到打分,这里的打分相当于是对每个输入mlp后,经过softmax得到打分。
基于打分,选取topk的交互,将这些选取后的交互embedding进行拼接得到,对每个点击对应的前序都进行上述操作可得到增强后的行为路径embedding。
2.3 路径匹配模块(PMM)
对于一个用户,在用户行为序列中可能存在大量的行为路径。然而,其中只有少数与当前行为路径相似,这可以表明用户当前的兴趣。 PMM旨在搜索k个与当前行为路径最相似的行为路径,然后获得相应的k个点击行为,这k个点击行为被认为对用户当前的兴趣有很大贡献 。
给定一个增强后的历史行为路径embedding和当前的增强路径,计算每个历史路径embedding和当前路径的相似性打分g,其中表示哈达玛积。
得到相似性分数后,取打分topk的历史路径和对应的点击行为,得到k个点击行为。并且对于被选取的每个历史巨鲸embedding,乘对应的相似性打分得到调整后的embedding,公式如下,其中filter(score, embedding, k)通过打分进行排序后选取topk的embedding和加权。
所有选择的点击行为都应该对用户当前的兴趣做出不同的贡献。计算行为路径对应的点击embedding和目标点击embedding之间的相似度,加权后得到对应的点击embedding矩阵。
最终将拼接进行预测。
2.4 路径增广模块 PAM
此外,PAM旨在通过对比学习来学习更精确和信息丰富的行为路径embedding。具体来说,mask每个历史行为路径以获得两个增强路径,并将它们送到embedding层和PEM中以计算它们的嵌入,然后通过将InfoNCE损失作为对比损失,将源自同一行为路径的embedding拉近。
-
结果
image.png
交流群:点击“联系 作者”--备注“研究方向-公司或学校”
欢迎|论文宣传|合作交流
往期推荐
[KDD'22「华为」CausalInt:因果干预用于多场景推荐系统
2023-02-12
[AAAI 2023 | 推荐系统,多任务学习,因果推断相关论文整理
2023-02-10
[纯干货,无广告 | 搜广推算法必备学习资源
2023-02-04
[基础知识(二)pandas 时间序列数据处理
2023-01-30
长按关注,更多精彩
点个在看你最好看
