SIGIR'24 | 打破长度障碍：LLM增强的长文本用户行为CTR预测 - 文章 - 开发者社区

picture.image

关注我们，一起学习

标题: Breaking the Length Barrier: LLM-Enhanced CTR Prediction in Long Textual User Behaviors

地址：https://arxiv.org/pdf/2403.19347.pdf

公司：蚂蚁

会议：SIGIR 2024

导读 =======

LLM4CTR在训练推理中主要存在以下问题：LLM在处理长文本用户行为时的效率很低，随着用户序列的增长，LLM的效率无法对数十亿用户和商品进行训练。

本文提出了行为聚合分层编码（BAHE）来提高基于LLM的CTR建模的效率。BAHE提出了一种新的分层架构，将用户行为的编码与行为间交互解耦。

首先，为了防止相同用户行为的重复编码产生计算冗余，BAHE使用LLM的预训练浅层从用户序列中提取最细粒度的原子用户行为emb，并将其存储在离线数据库中。
然后，LLM的更深、可训练的层学习复杂的行为间交互，生成用户emb。这种分离允许高级用户表征的学习独立于低级行为编码，从而显著降低计算复杂性。
最后，将这些细化的用户emb与对应的商品emb结合到CTR模型中，计算CTR得分。

省流：

用户之间可能存在相同行为，比如都"购买星巴克"，用LLM的浅层对这些行为做离线编码存储在数据库，这样不同用户的重复行为就不需要重复编码了；通过编码和聚合后，行为编码为d维这样可以使得我们可以用更长的序列，因为本来一个行为是K个d维的token，现在变成了一个，存储的编码相当于是一个emb table，对于不同的行为直接去查找，然后再LLM深层进行行为之间的交互
行为有多种，比如点击，购买等，不同行为组成不同的行为序列，对于不同的行为序列可以并行执行上面的步骤得到对应的emb，然后拼接得到用户emb

2.方法

picture.image