MLoRA:多域LoRA在CTR预估中的应用

推荐算法机器学习数据库

picture.image

关注我们,一起学习

标题: MLoRA: Multi-Domain Low-Rank Adaptive Network for Click-Through Rate Prediction

地址:https://arxiv.org/pdf/2408.08913

会议:RecSys 2024

代码:https://github.com/gaohaining/MLoRA

学校,公司:西北工业,阿里

  1. 导读 =======

文本主要针对多领域(multi-domain)的ctr预估提出对应的解决方法。传统的CTR预测模型在多域推荐场景中面临着数据稀疏和跨域数据分布不同 的问题。现有的多域推荐方法为每个域引入了特定的域模块,这在一定程度上解决了这些问题,但通常会显著增加模型参数并导致训练不足。

本文提出了一种用于CTR预测的多域低秩自适应网络(MLoRA),为每个域引入了一个专门的LoRA模块,提高模型在多域CTR预测任务中的性能,并能够应用于各种深度学习模型。

tl;dr: 本文基本是采用了lora方法,对lora方法本身基本没有创新,算是一种lora方法在推荐方法中的应用,也具有一定的借鉴意义,感兴趣的小伙伴可以扫一眼,哈哈。

2.方法

picture.image

alt text

2.1 Low-Rank Adaptor

LoRA是比较流行的大模型微调方法,简单介绍下,对于满秩的训练参数,假设训练后的参数是W',则微调是在学习,表达如下,

当为特定任务微调大模型时,满秩矩阵通常具有相当大的参数冗余,秩, 可以表示为下式,其中,,

为了确保在训练开始时为零,A用高斯分布初始化,B用零初始化。因此,LoRA的正向传递可以表示为:

2.2 MLoRA

在训练CTR模型时,需要拟合两个部分:可泛化的公共信息和个性化的独特信息 。因此,预测目标可以表达为下式,

考虑到单个域的稀疏性,可以使用使用低秩矩阵作为模型L(x)的参数来学习每个域的个性化信息。表达为下式,t表示第t个域

MLoRA将模型的每一层分为公共部分和个性化部分,而不是将模型视为一个整体。单层可以表示为:

与NLP模型不同,CTR模型通常在层之间的网络宽度是不同的,因此在不同层之间的秩r在设计时是不同的。本文设计了一个温度系数α来计算r

训练的时候也和大模型类似是两阶段的,先用大量数据来预训练(笔者理解是比如用所有域的数据来训练主网络),预训练阶段学习公共信息,然后用mlora微调训练不同域的信息。

3 实验

picture.image

alt text

交流群:点击“联系 作者”--备注“研究方向-公司或学校”

欢迎|论文宣传|合作交流

往期推荐

CIKM'24 | OptDist: 学习最优分布进行LTV预估

HMDN:用于点击率预测的分层多分布网络

KDD24 PolygonGNN:多边形几何形状的表征学习

ECUP:上下文增强的全链路uplift建模

长按关注,更多精彩

点个在看你最好看

picture.image

0
0
0
0
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论