Clicks can be Cheating: Counterfactual Recommendation for Mitigating Clickbait Issue
本文将用到以下相关知识:
背景
在生活中,无论我们用什么软件(购物、资讯等),都会遇到这样的情况:看到的封面和标题跟点进去的内容不匹配,即标题党。而这些欺骗性的信息会使用户体检变差,而因为用户之前由于标题点击了item,会使得模型在学习,推荐的时候也会推荐这类item,这就造成了恶心循环。
本文主要通过构建因果图来缓解标题党这类不良item对用户体验造成的损害,主要贡献如下:
- 强调通过仅使用点击数据来缓解 点击诱饵(标题党) 问题的重要性,并利用新的因果图来制定推荐流程
- 在推荐中引入反事实推理来缓解点击诱饵问题,并提出了一个反事实推荐框架,该框架可应用于任何以项目特征为输入的推荐模型( 易集成 )
方法
本文所用理论与MACR框架中所用理论一样,都是采用反事实推断,并且涉及TE,NDE,TIE等相关知识,这里不再赘述,不熟悉的小伙伴可到MACR中阅读。不过MACR是用于纠正流行性偏差的,本文方法是针对“标题党”的,并且构建过程也存在一些区别,下面我们详细展开。
因果图
原始的因果图如图a所示,我们在做推荐的时候,仅考虑单纯融合 曝光特征(exposure feature)和内容特征(content feature) ,将融合后的特征和用户特征结合用于预测推荐分数。而上述过程忽略了用户看到标题、封面等信息时对点击的直接影响,因此作者构建了新的因果图(图b)。
通过反事实推断,我们可以得到图c,d
,fi为特征融合函数
框架设计
评分函数
的设计
为了方便使用,以及减少对现有模型的修改,做到易集成性,作者并没有直接将u,i,e作为输入,而是late-fusion的方式:是一种融合策略,采用MUL的方式:
训练过程
训练采用多任务的方式训练,损失函数如下:
推理阶段
推理阶段分别得到然后计算TIE。
因为在训练的时候没有将。在预测推理过程中,用均值来替代当前(u,i)对应的预测值。
更多内容:
推荐系统(四)——因果效应uplift model系列模型S-Learner,T-Learner,X-Learner
推荐系统(三):推荐系统中常见多任务模型MMOE,ESMM,CGC,AITM
有问题的小伙伴可以联系我
