推荐系统(五)——SIGIR'21用反事实推断缓解点击诱饵。还在为标题党烦躁吗?也许他能帮到你

picture.image

Clicks can be Cheating: Counterfactual Recommendation for Mitigating Clickbait Issue

https://dl.acm.org/doi/pdf/10.1145/3404835.3462962

本文将用到以下相关知识:

反事实推断

TE、NDE、TIE

背景

在生活中,无论我们用什么软件(购物、资讯等),都会遇到这样的情况:看到的封面和标题跟点进去的内容不匹配,即标题党。而这些欺骗性的信息会使用户体检变差,而因为用户之前由于标题点击了item,会使得模型在学习,推荐的时候也会推荐这类item,这就造成了恶心循环。

本文主要通过构建因果图来缓解标题党这类不良item对用户体验造成的损害,主要贡献如下:

  • 强调通过仅使用点击数据来缓解 点击诱饵(标题党) 问题的重要性,并利用新的因果图来制定推荐流程
  • 在推荐中引入反事实推理来缓解点击诱饵问题,并提出了一个反事实推荐框架,该框架可应用于任何以项目特征为输入的推荐模型( 易集成

方法

本文所用理论与MACR框架中所用理论一样,都是采用反事实推断,并且涉及TE,NDE,TIE等相关知识,这里不再赘述,不熟悉的小伙伴可到MACR中阅读。不过MACR是用于纠正流行性偏差的,本文方法是针对“标题党”的,并且构建过程也存在一些区别,下面我们详细展开。

因果图

picture.image

原始的因果图如图a所示,我们在做推荐的时候,仅考虑单纯融合 曝光特征(exposure feature)和内容特征(content feature) ,将融合后的特征和用户特征结合用于预测推荐分数。而上述过程忽略了用户看到标题、封面等信息时对点击的直接影响,因此作者构建了新的因果图(图b)。

picture.image

通过反事实推断,我们可以得到图c,d

picture.image picture.image,fi为特征融合函数

框架设计

评分函数 picture.image 的设计

为了方便使用,以及减少对现有模型的修改,做到易集成性,作者并没有直接将u,i,e作为输入,而是late-fusion的方式:picture.image是一种融合策略,采用MUL的方式:

picture.image

训练过程

训练采用多任务的方式训练,损失函数如下:

picture.image

picture.image

推理阶段

推理阶段分别得到picture.image然后计算TIE。

picture.image

因为在训练的时候没有将picture.image。在预测推理过程中,用均值来替代当前(u,i)对应的预测值。

更多内容:

推荐系统(四)——因果效应uplift model系列模型S-Learner,T-Learner,X-Learner

推荐系统(三):推荐系统中常见多任务模型MMOE,ESMM,CGC,AITM

有问题的小伙伴可以联系我

0
0
0
0
评论
未登录
暂无评论