WWW'23「腾讯」在推荐系统中使用停留时间重新加权点击行为

picture.image

关注我们，一起学习~

标题：Reweighting Clicks with Dwell Time in Recommendation

地址：https://arxiv.53yu.com/pdf/2209.09000.pdf

会议：WWW 2023

公司：腾讯

导读

点击行为是推荐中使用最广泛的用户反馈。然而，在训练中同等对待每一次点击可能会受到标题和内容不匹配的影响（即标题党），因此无法准确地捕捉用户对item的真实满意度。停留时间可以被视为用户每次点击偏好的高质量量化指标，而现有的推荐模型并没有充分探索停留时间的建模。本文专注于在推荐中使用停留时间重新加权点击。首先定义了一个名为valid read的新行为，它有助于通过停留时间为不同的用户和item选择高质量的点击实例。接下来，提出了一个标准化的停留时间函数，用于重新加权训练中的点击信号以进行推荐。

方法

2.1 停留时间建模的探讨

基于现有的文献，直接优化原始停留时间将不可避免地引导模型过度强调总持续时间长的item，使得重度用户和长时常item主导了模型训练。本文的想法是，使用推荐系统的用户的中心需求是获取信息。因此，回到停留时间、信息增益和用户偏好之间关系的本质，并得出以下假设：

（A1）相同停留时间 给出的正反馈对于不同的item和用户来说相对等效 ，因为它们通常意味着对每个人都公平的相同宝贵时间成本。
（A2）用户需要最短的停留时间才能开始从item中获取信息 。停留时间太短意味着很少（或没有）收益。
（A3）当当前停留时间足够长时 ，信息增益将随着停留时间的增加而逐渐减小 。

2.2 有效阅读

有效阅读（Valid Read）是高质量的点击行为，可以更好地反映用户的真实偏好，这是通过本工作中的停留时间自然选择的。为了更深入地了解停留时间，作者绘制了不同日志停留时间的点击数趋势。如图2左图所示，停留时间的log近似高斯分布，其中；令为主要的停留时间范围。近19%的点击行为停留时间短于15秒，近15%的点击行为超过200秒。根据上述假设A2和A3，停留时间太短或过长的点击行为应在点击重新加权中降级。 picture.image 可以通过设置阈值来直接获取valid read。但是，仅仅依靠阈值来定义有效阅读将忽略轻度用户和短时item的重要行为信息。因此，本文定义了三种点击行为：