抖音 | 建模用户兴趣时钟用于流媒体推荐 - 文章 - 开发者社区

picture.image

关注我们，一起学习

标题: Interest Clock: Time Perception in Real-Time Streaming Recommendation System

地址：https://arxiv.org/pdf/2404.19357

公司：抖音

会议：SIGIR 2024

用户偏好在一天中遵循动态模式，例如，在上午8点，用户可能更喜欢阅读新闻，而在晚上8点，他们可能更喜欢看电影。时间建模旨在使推荐系统能够感知时间变化，以捕捉用户随时间的动态偏好。本文提出了一种有效且通用的方法——兴趣时钟 来感知推荐系统中的时间信息。

兴趣时钟首先将用户的时间感知偏好编码为时钟（小时级个性化特征），然后使用高斯分布将其平滑并聚合到根据当前时间嵌入的最终兴趣时钟中，用于最终预测。通过使用兴趣时钟结合基本模型，线上用户活跃天数和应用程序持续时间分别提高了+0.509%和+0.758%。

2.方法

2.1 特征工程

对于时间特征，比较直接的方法就是将时间信息离散化后学习对应的emb，然后拼接日和时的emb。但作者希望对时间感知的个性化偏好进行编码。

将一天划分为24个桶，表示一天中的24小时。
根据用户在过去30天中某个小时的消费数据计算用户的时间感知偏好。例如，获得用户在过去30天中7:00到8:00生成的所有样本，每个样本都有多个标签（例如，喜欢、跳过、完成、不喜欢）和许多特征（例如，流派、情绪、语言）。每个特征的得分计算如下，其中表示对应行为的样本数

基于上式，计算给定特征（包括流派、情绪和语言等）在某个小时的得分，并且top3得分的用作时间感知特征。时间感知特征（例如流派）的emb表示为，同理可以得到情绪和语言的时间感特征。

picture.image

兴趣时钟的目标是使模型能够感知流式推荐系统中的时间信息。通过特征提取过程，将用户的时间感知个性化偏好编码到时钟中，即小时级特征。通常可以利用两种简单的方法来聚合兴趣时钟特征，（1）将24小时的兴趣emb拼接到一个emb中，（2）根据当前请求时间t, 为模型提供相应的兴趣emb 。

但这两种方案都有一定的问题，第一种方法依赖于通过优化过程对每个小时级别特征的重要性进行自适应学习，但作者发现深度模型很难自适应地学习特征权重，因为该模型会过拟合当前时间，并忘记流系统中其他时间的信息。而对于第二种方法，模型只能看到当前时间的兴趣，每个时间用户的兴趣都会发生突然的变化。

本文提出了高斯兴趣时钟 ，将24小时的时间感知emb与经验高斯分布相聚合。兴趣时钟emb表示为下式，其中反应的时不同小时的兴趣与当前时间的时间间隔， 这个思路就是结合了前面的两种方案，在聚合emb的时候考虑了时间间隔，并且距离当前时间越近的兴趣emb权重也越大。

picture.image

交流群：点击“联系作者”--备注“研究方向-公司或学校”

欢迎|论文宣传|合作交流

往期推荐

WWW'24 | 用相似用户和item增强点击率预估

长按关注，更多精彩

点个在看你最好看

picture.image