关注我们,一起学习~
标题:Reweighting Clicks with Dwell Time in Recommendation
地址:https://arxiv.53yu.com/pdf/2209.09000.pdf
会议:WWW 2023
公司:腾讯
-
导读
点击行为是推荐中使用最广泛的用户反馈。然而,在训练中同等对待每一次点击可能会受到标题和内容不匹配的影响(即标题党),因此无法准确地捕捉用户对item的真实满意度。停留时间可以被视为用户每次点击偏好的高质量量化指标,而现有的推荐模型并没有充分探索停留时间的建模。本文专注于在推荐中使用停留时间重新加权点击。首先定义了一个名为valid read的新行为,它有助于通过停留时间为不同的用户和item选择高质量的点击实例。接下来,提出了一个标准化的停留时间函数,用于重新加权训练中的点击信号以进行推荐。
-
方法
2.1 停留时间建模的探讨
基于现有的文献,直接优化原始停留时间将不可避免地引导模型过度强调总持续时间长的item,使得重度用户和长时常item主导了模型训练。本文的想法是,使用推荐系统的用户的中心需求是获取信息。因此,回到停留时间、信息增益和用户偏好之间关系的本质,并得出以下假设:
- (A1)相同停留时间 给出的正反馈对于不同的item和用户来说相对等效 ,因为它们通常意味着对每个人都公平的相同宝贵时间成本。
- (A2)用户需要最短的停留时间才能开始从item中获取信息 。停留时间太短意味着很少(或没有)收益。
- (A3)当当前停留时间足够长时 ,信息增益将随着停留时间的增加而逐渐减小 。
2.2 有效阅读
有效阅读(Valid Read)是高质量的点击行为,可以更好地反映用户的真实偏好,这是通过本工作中的停留时间自然选择的。为了更深入地了解停留时间,作者绘制了不同日志停留时间的点击数趋势。如图2左图所示,停留时间的log近似高斯分布,其中;令为主要的停留时间范围。近19%的点击行为停留时间短于15秒,近15%的点击行为超过200秒。根据上述假设A2和A3,停留时间太短或过长的点击行为应在点击重新加权中降级。可以通过设置阈值来直接获取valid read。但是,仅仅依靠阈值来定义有效阅读将忽略轻度用户和短时item的重要行为信息。因此,本文定义了三种点击行为:
- 停留时间大于秒,作者采用的阈值时
- 用户在本周点击次数小于7次
- 用户在该item上的停留时长大于10%的该item的历史行为中的停留时长
为了避免噪声,进一步消除所有停留时间少于5秒的点击,以确保有效读取的最小可用性。
2.3 标准化的停留时间函数
基于假设A2和A3,停留时间函数应具有以下两个特性C1和C2:
- 设计的停留时间函数曲线应陡峭,早期梯度较大(尤其是在有效读取阈值附近), 指导模型有效区分有效读取和无效点击。
- 当停留时间太长时,曲线应该很平缓
从而设计了如下函数,TN是标准化后的停留时间,T为原始的停留时间,整体的变化曲线如图2右边所示。其中offset为,使得在阈值附近的梯度最大。
2.4 点击加权
在点击重新加权中,采用了一个多任务学习(MTL)框架,用于有效读取预测和加权有效读取预测任务。具体来说,进行共享底部,以在两个任务中共享原始用户/商品特征。
对于有效读取分支来说,采用MLP对原始用户和商品特征进行处理后,预测点击概率,损失函数如下,为有效点击,为无效点击或未点击集合。
对于加权的有效阅读分支,采用标准化后的停留时间对用户-商品对进行加权,采用MLP来预测点击概率,损失函数如下,
总损失函数为
-
实验结果
分别对比“单纯的ctr预测”,“ctr预测和log的停留时间预测构成的多任务”,“有效阅读和log停留时间多任务预测”,“有效阅读和标准化停留时长加权多任务”
[WWW2023 | 推荐系统,因果推断论文集锦
2023-03-19
[WWW 2023 | 自监督多模态推荐系统
2023-03-17
[NIPS「Intel」多任务学习中的多目标优化问题
2023-03-12
[腾讯 | 基于提示学习(prompt learning)进行序列推荐和冷启动
2023-03-05
长按关注,更多精彩
点个在看你最好看
