HAMUR：为多域推荐（MDR）设计适配器缓解参数干扰和分布差异的影响 - 文章 - 开发者社区

picture.image

关注我们，一起学习

标题：HAMUR: Hyper Adapter for Multi-Domain Recommendation

地址：https://arxiv.org/pdf/2309.06217.pdf

代码：https://github.com/Applied-Machine-Learning-Lab/HAMUR， https://gitee.com/mindspore/models/tree/master/research/recommend/HAMUR

会议：CIKM 2023

学校，公司：香港城市大学，华为

1.导读

话说多域推荐中一直存在这两个问题:

大多数MDR模型都采用了在域之间明确共享参数的方法，从而导致域之间的相互干扰。
其次，由于领域之间的分布差异，现有方法中静态参数的使用限制了它们适应不同领域的灵活性。

为解决上述问题，本文提出了HAMUR模型，它由两个部分组成：（1）域特定适配器，可以集成到各种现有的多域主干模型中，主要用于捕获域特定信息（2）域共享超网络，它隐式捕获域之间的共享信息，并动态生成适配器的参数

主要过程是经过超网络来捕获域共享信息, 并降低域相互干扰的同时未后续域特定适配器生成对应的参数, 域适配器基于超网络生成的参数使得域d分支在考虑了共享信息的同时去捕获域d中的特定信息. 方法的设计不复杂, 详见第二部分.

2.方法

picture.image 如图所示是HAMUR方法的结构图，如导读中所述，主要是两个部分：域特定适配器单元和域共享超网络。

域特定适配器单元（图中黄色部分） ：为了 捕捉域个性化 ，本文设计了瓶颈形状组件，除了从适配器的开始到结束建立的跳跃连接之外，它还包括四层，向下投影层、非线性层、向上投影层和域规范化层。

域共享超网络 ：为了解决 域偏差的问题 ，本文提出了共享超网络，用于为域适配器生成参数。为了提高计算效率，采用了矩阵低秩分解方法，将目标矩阵分解为三个矩阵的乘积。超网络输入为具有域信息的实例(x, p) 并生成实例级域表征矩，其中x是样本，p表示域索引。生成适配器参数的权重矩阵表示为, , 和然后与矩阵相乘，获得两个在域d的参数矩阵和, 这两个矩阵在后续用于域特定适配器进行映射.

2.1 域特定适配器单元

正如前面所述，这里总共包含四层，向下映射层，非线性层，向上投影和域规范化层。向下映射和向上映射就是线性层，映射参数来自超网络，向下映射层的参数为, 向上映射层的映射参数为, 其中s远小于h. 非线性层为sigmoid函数. 域规范化层采用batch norm, 在多域CTR预测的情况下，数据分布在每个单独的域中是局部独立同分布的（IID）。因此，针对不同的域d需要采用单独的BN参数γ和β, 表达如下,

则域适配器层的整体表达为