WWW'22「Meta」MetaBalance:动态调整辅助任务的梯度提升多任务推荐系统性能

火山方舟向量数据库大模型

picture.image

关注我们,一起学习~

title:MetaBalance: Improving Multi-Task Recommendations via Adapting Gradient Magnitudes of Auxiliary Tasks

link:https://arxiv.org/pdf/2203.06801v1.pdf

code:https://github.com/facebookresearch/MetaBalance

from:WWW 2022

  1. 导读

在推荐场景中使用多任务学习,通常会遇到严重的优化不平衡问题。

  • 一方面,一个或多个辅助任务 可能比目标任务具有更大的影响 ,甚至主导网络权重 ,导致目标任务的推荐精度降低。
  • 另一方面,一个或多个辅助任务的影响可能太弱 ,无法帮助目标任务。
  • 这种不平衡在整个训练过程中动态变化,并在同一网络的不同部分发生变化。

本文提出了一种新的方法:MetaBalance,该方法对辅助任务的梯度依据目标任务的梯度进行缩放,并且在缩放的同时保留一部分自身的梯度,从而缓解辅助任务梯度过大过小的问题。

  1. 问题定义

令θ表示共享参数,这类参数是被目标任务和辅助任务共同优化的,损失函数可以表示为下式,

然后利用损失函数的梯度来更新参数θ,表示如下,用表示目标网络的梯度,用表示辅助任务的梯度,表示正则项的梯度。

  1. 方法

3.1 调整辅助任务梯度幅度

主任务和辅助任务梯度幅度的不平衡会对整体任务带来负面影响,MetaBalance通过三种策略和放松因子对梯度进行动态的、自适应的调整。

基础版伪代码如下,主要包括四个步骤:

  • 分别计算主任务和辅助任务的梯度,,;
  • 在第 5 行中,可以选择减小幅度大于目标梯度的辅助梯度,或者放大幅度较小的辅助梯度,或者同时应用这两种策略。可以根据目标任务的验证性能来选择策略。
  • 将辅助梯度标准化为单位向量,然后和目标梯度相乘得到新的辅助梯度
  • 更新参数

picture.image image.png

  • 优点 :通过标准化后与目标梯度相乘使得目标任务和辅助任务的梯度能够在相同的量级上,缓解辅助任务梯度过大或过小的问题。
  • 缺点 :辅助梯度是依据主任务梯度生成的,但是主任务的梯度未必是准确的或最优的,因此定义了一个放松因子来控制辅助梯度向主梯度的靠近程度。

3.2 调整幅度接近度

本文设置了一个放松因子r来控制辅助梯度向主梯度的靠近程度,r为超参数,公式如下,

上式可以改写为下式,当时,r越大,w越大;反之,r越大,w越小。

并且利用梯度的移动平均来替代原来的即时梯度,从而考虑梯度之间的方差,公式如下,

伪代码如下,picture.image

  1. 结果

picture.image image.png

流群:点击“联系作者”--备注“研究方向-公司或学校”

欢迎干货投稿|论文宣传|合作交流

往期推荐

[picture.image

WWW'22 | GDNS:基于增益的动态负采样方法用于推荐系统](https://mp.weixin.qq.com/s?__biz=MzkxNjI4MDkzOQ==&mid=2247490673&idx=1&sn=0b991f8f718ea470370c5f58db079281&chksm=c1531f75f6249663ffe789e25bd9b63a9e3643ef03196883d9b775453d0a2eddb912fc0e13ff&scene=21#wechat_redirect)

[picture.image

WWW'22「华为」CPR Loss:交叉成对排序损失对推荐系统纠偏](https://mp.weixin.qq.com/s?__biz=MzkxNjI4MDkzOQ==&mid=2247490641&idx=1&sn=df4fd8acf12b8bf28ecc0703f5f11789&chksm=c1531f55f6249643757ab4ef6d22a9347882dc81408a56ebeabdccea6ee09911c321c98a077f&scene=21#wechat_redirect)

[picture.image

AAAI'22「腾讯」多任务推荐系统中的跨任务知识蒸馏](https://mp.weixin.qq.com/s?__biz=MzkxNjI4MDkzOQ==&mid=2247490616&idx=1&sn=af0d34e0673bfde89d528da60b59a26e&chksm=c1531f3cf624962add8eafbcc2f47070252d7354a299b02aedfcd87233305c163f66b26eef04&scene=21#wechat_redirect)

picture.image

长按关注,更多精彩

picture.image

picture.image

点个在看你最好看

0
0
0
0
关于作者

文章

0

获赞

0

收藏

0

相关资源
字节跳动客户端性能优化最佳实践
在用户日益增长、需求不断迭代的背景下,如何保证 APP 发布的稳定性和用户良好的使用体验?本次分享将结合字节跳动内部应用的实践案例,介绍应用性能优化的更多方向,以及 APM 团队对应用性能监控建设的探索和思考。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论