因果推断(四)——后门调整、前门调整、逆概率加权

技术
[因果推断(三)](http://mp.weixin.qq.com/s?__biz=MzkxNjI4MDkzOQ==&mid=2247483761&idx=1&sn=bb9704f7a5f848f5181979e6f38eb011&chksm=c1530275f6248b632b04be5f9ad75fb4383dff499dc900819302a227d29f54de85bfc0a18ad9&scene=21#wechat_redirect)中,我们介绍了  **干预** 的相关概念,在本文中,我们对一些方法进行介绍,这些方法可用于利用干预分析变量之间的因果关系。  

picture.image

因果推断(三)中,我们得出了调整公式,如上式。假设PA为A节点的所有父节点的集合,则上式可以修改为

picture.image

其中b为PA所有可能的取值

picture.image 后门调整

回顾  **后门准则** 的定义:对于X到Y的路径中,如果Z集合中的节点不是X的后代节点,并且以Z为条件会  **阻断所有** X和Y之间的后门路径,则Z满足(X,Y)的  **后门准则** 。如果B满足后门准则,则后门调整公式就是我们在前面所推出的调整公式。通过该公式可以计算出C和A之间的因果关系。

picture.image

picture.image前门调整

  • 前门准则的定义
  • D阻断了A到C之间的所有路径
  • D到C之间的后门路径都被A阻断
  • A到D之间没有未阻断的路径

则D满足A到C的前门准则。

picture.image

[因果推断(三)](http://mp.weixin.qq.com/s?__biz=MzkxNjI4MDkzOQ==&mid=2247483761&idx=1&sn=bb9704f7a5f848f5181979e6f38eb011&chksm=c1530275f6248b632b04be5f9ad75fb4383dff499dc900819302a227d29f54de85bfc0a18ad9&scene=21#wechat_redirect)的辛普森悖论中我们用到了小夏开店的例子,其因果图为上图的左子图,现在我们将其修改为右子图。多了一个点击的情况。还是沿用小夏开店的例子,假设我们需要分析被宣传(A)和购买(C)之间的因果关系,那么我们可能会想到后门调整,用到上述的调整公式,但是如果此处我们无法获取性别(B)的相关数据,此时我们就无法采用后门调整了,这里我们可以采用前门调整。

此处我们可以用过A->D,D->C这样一个前向的过程来分析因果关系。

  • A对D的因果效应可以表示为picture.image,因为这条路径不存在混杂,所以不需要考虑去除混杂的情况。
  • D->C的因果效应分析中,存在混杂(A,B)。由于B未知,所以这里采用A来去除混杂,公式如下就是后门调整。

picture.image

这里给出  **混杂** 的定义,具体例子可以看[因果推断(二)](http://mp.weixin.qq.com/s?__biz=MzkxNjI4MDkzOQ==&mid=2247483734&idx=1&sn=d548148c2de7783ea8ca89ad2e8c9a64&chksm=c1530252f6248b440ef29b5eb713309df4c860a871e2699a7145c18d92b9f8e55cd0e8834a74&scene=21#wechat_redirect)。  **定义** :1. E与D相关,2. 以D为条件时,E与C相关,3. E不在D到C的因果关系路径中。则称E为混杂因子。


得到了A->D和D->C的因果效应后,我们通过前门调整来分析A->C的因果效应。

picture.image

这里可以看成是A->D和D->C这两个过程在不同a的值时的因果效应的乘积

picture.image逆概率加权

仍然以小夏开店为例,以上图的左子图为例

picture.image

左右同乘P(D|A)得到:

picture.image

除以这个条件概率,相当于去除了性别(B)导致的偏差,也就相当于去除了混杂,不过这边我们需要知道a,b,c的全概率。

  **逆概率加权** 也是在推荐系统中去除数据偏差的热门方法,后续我们会进行介绍。  

picture.image 更多内容:

因果推断(一)

因果推断(二)——混杂因子,D-分离,后门准则

因果推断(三)——结构因果模型、干预、辛普森悖论

有问题的小伙伴可以在公众号留言

更多内容可前往我的csdn博客和牛客博客,在公众号回复“博客”即可

0
0
0
0
关于作者

文章

0

获赞

0

收藏

0

相关资源
云原生环境下的日志采集存储分析实践
云原生场景下,日志数据的规模和种类剧增,日志采集、加工、分析的多样性也大大增加。面对这些挑战,火山引擎基于超大规模下的 Kubernetes 日志实践孵化出了一套完整的日志采集、加工、查询、分析、消费的平台。本次主要分享了火山引擎云原生日志平台的相关实践。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论