推荐系统（五）——SIGIR'21用反事实推断缓解点击诱饵。还在为标题党烦躁吗？也许他能帮到你

picture.image

Clicks can be Cheating: Counterfactual Recommendation for Mitigating Clickbait Issue

https://dl.acm.org/doi/pdf/10.1145/3404835.3462962

本文将用到以下相关知识：

反事实推断

TE、NDE、TIE

背景

在生活中，无论我们用什么软件（购物、资讯等），都会遇到这样的情况：看到的封面和标题跟点进去的内容不匹配，即标题党。而这些欺骗性的信息会使用户体检变差，而因为用户之前由于标题点击了item，会使得模型在学习，推荐的时候也会推荐这类item，这就造成了恶心循环。

本文主要通过构建因果图来缓解标题党这类不良item对用户体验造成的损害，主要贡献如下：

强调通过仅使用点击数据来缓解 点击诱饵（标题党） 问题的重要性，并利用新的因果图来制定推荐流程
在推荐中引入反事实推理来缓解点击诱饵问题，并提出了一个反事实推荐框架，该框架可应用于任何以项目特征为输入的推荐模型（ 易集成 ）

方法

本文所用理论与MACR框架中所用理论一样，都是采用反事实推断，并且涉及TE，NDE，TIE等相关知识，这里不再赘述，不熟悉的小伙伴可到MACR中阅读。不过MACR是用于纠正流行性偏差的，本文方法是针对“标题党”的，并且构建过程也存在一些区别，下面我们详细展开。

因果图

picture.image

原始的因果图如图a所示，我们在做推荐的时候，仅考虑单纯融合 曝光特征（exposure feature）和内容特征（content feature） ，将融合后的特征和用户特征结合用于预测推荐分数。而上述过程忽略了用户看到标题、封面等信息时对点击的直接影响，因此作者构建了新的因果图（图b）。

picture.image