KDD'22「阿里」DESCN:端到端的X-Learner?

小程序计算容器

picture.image

关注我们,一起学习~

标题:DESCN: Deep Entire Space Cross Networks for Individual Treatment Effect Estimation

链接:https://arxiv.org/pdf/2207.09920.pdf

代码:https://github.com/kailiang-zhong/DESCN

会议:KDD 2022

公司:阿里

  1. 导读

本文主要是针对因果推断中的因果效应估计提出的方法,传统上,ITE 是通过在各自的样本空间中分别对实验组和对照组的响应函数进行建模来预测的。然而,这种方法在实践中通常会遇到两个问题:由于干预偏差导致实验组和对照组之间的分布不同;以及样本量的不平衡。本文提出了深度整个空间交叉网络(DESCN)从端到端的角度进行建模。DESCN通过交叉网络以多任务学习的方式捕获干预的倾向、响应和隐藏干预效果的综合信息。

本文的特点是在X-learner的基础上,基于多任务学习的思想,构建了一种同x-learner思想的端到端的学习方式,针对干预偏差估计倾向性分数,针对数据不平衡采用X的方式。

  1. 方法

2.1 问题定义

令观察样本为,y,x,w分别表示效果outcome,即标签;样本特征;是否被干预。被干预的倾向性得分估计表示为。令和分别表示实验组和对照组的样本。本文方法在以下三个假设下进行:

  • 一致性:如果样本i被施加干预,则可以观察到一致的相关潜在输出
  • 可忽略性:没有其他未观察到的混杂因子
  • 重叠:干预的施加是不确定的,即存在倾向性分数

干预的响应TR和对照的响应CR可以表示为下式,则ITE可以估计为,通过建模估计得到,从而得到估计。

在这过程中主要会面临两个问题

  • 干预偏差 :即存在倾向性分数,实验组和对照组的分布存在差异
  • 数据不平衡 :即实验组和对照组的样本量存在显著差异

2.2 ESN

picture.image如图1a所示为ESN网络,和以往的two model类型的模型将实验组和对照组样本分别建模为两个模型不同,ESN是将倾向性分数,实验组,对照组的建模放在一个模型中,通过共享层对不同的数据提取embedding。然后,对于每个数据计算倾向性得分π,对实验组数据进入干预分支得到ESTR,对于对照组数据进入对照分支得到ESCR 。从而可以得到以下损失函数,

合并后得到:

2.3 X-network

如图1b所示为X-network,是基于X-learner改进得到的端到端学习方法,整体流程有点类似于将X-learner组合为一个端到端的学习方式。通过共享层后,左右两个分支分别对干预组数据和对照组数据进行建模,中间的PTE(Pseudo Treatment Effe)得到为干预带来的隐藏的效果(其实这里建模的就是X-learner中的D,不熟悉X-learner的小伙伴网上有很多资料),然后结合反事实,即干预的数据如果没有干预的话可以得到什么样的效果,反之亦然,公式如下,看公式应该会更清晰一些。文中的意思是可以放大uplift信号,使得学习过程更容易,不过笔者在代码中并为看到这步,是直接,当然也可能是我看错了,欢迎指正。

2.4 DESCN

DESCN就是将上面两者结合,结构如图1c,总体损失函数如下,

  1. 结果

picture.image image.png

交流群:点击“联系作者”--备注“研究方向-公司或学校”

欢迎|论文宣传|合作交流

往期推荐

[CIKM'22 [上交,阿里] HEROES:用于全空间多任务学习的多尺度用户行为网络

2022-08-07

picture.image](https://mp.weixin.qq.com/s?__biz=MzkxNjI4MDkzOQ==&mid=2247492773&idx=1&sn=8a23ee925b64cb36288a2d3a87ed5c2b&chksm=c150e7a1f6276eb7dcf8b5491f47ea5a21094c8a7698606c4f61a3e4b9c462ac9f02a489adf8&scene=21#wechat_redirect)

[KDD'22|序列推荐:多行为超图增强的Transformer

2022-08-03

picture.image](https://mp.weixin.qq.com/s?__biz=MzkxNjI4MDkzOQ==&mid=2247492674&idx=1&sn=e2314de2fb278c402a641c9418f6afd9&chksm=c150e746f6276e50bceb76402dc43336cfc7920b546a0c118028126501eb4232a6fe95bb870e&scene=21#wechat_redirect)

[RecSys'22|CARCA:交叉注意力感知上下文和属性进行推荐

2022-07-28

picture.image](https://mp.weixin.qq.com/s?__biz=MzkxNjI4MDkzOQ==&mid=2247492648&idx=1&sn=419e03d229f431195d8121037a3d3313&chksm=c150e72cf6276e3a5b29dc997e7b695e4fea0e1e603d006f1855239e52c8f97f454ccf628de5&scene=21#wechat_redirect)

[KDD 2022 搜广推论文合集

2022-07-22

picture.image](https://mp.weixin.qq.com/s?__biz=MzkxNjI4MDkzOQ==&mid=2247492619&idx=1&sn=0e00d500a0fbd9de056c6744a6068c09&chksm=c150e70ff6276e19069ab91cf503b831748b32c048ab91498fafb55b9e8346c965bdc4521243&scene=21#wechat_redirect)

picture.image

长按关注,更多精彩

picture.image

picture.image

动动小手吧

0
0
0
0
关于作者

文章

0

获赞

0

收藏

0

相关资源
火山引擎大规模机器学习平台架构设计与应用实践
围绕数据加速、模型分布式训练框架建设、大规模异构集群调度、模型开发过程标准化等AI工程化实践,全面分享如何以开发者的极致体验为核心,进行机器学习平台的设计与实现。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论