手机浏览器扫描二维码访问
2.4结构因果模型(SCM)
2.4.1基本定义[5][11]
这是一种基于因果图(casualgraph),构建各类因子间因果关系的方法。该方法可以将因果图转为结构化等式(structuralequations),并通过do算子干预因果图,打破混淆因子干扰,完成因果发现。
那什么是因果图呢,这是一个有向无环图(DAG),节点表示因子,有向边表示因果关系和大小。如下图(a)是SCM的一个示例。其中t为treatment(即要分析的“因”),y是目标,x是混淆因子。显然,x的存在干扰了分析t对y的影响,作者提出通过do算子去除混淆因子x对treatment的影响,这也是SCM做因果分析的关键。
那具体是怎么实现的呢?我们需要先了解因果图里的经典结构
2.4.2网络结构与前后门准则[11][12]
三种经典的图结构
当我们分析X和Y的因果关系时,如果存在其他变量Z,则它们的关系不外乎以下三种图结构。
链式(a):X->Z->Y。有且
叉式(b):X<-Z->Y。同链式有且
V式(c):X->Z<-Y。有且
那么针对这三种图结构,如何输出X变化对Y的影响呢?我们的重点是如何“过滤”变量Z对分析的干扰(这也是因果识别的目标)
2.后门准则:该准则对应叉式的图结构
后门标准(后门准则):如果变量集Z满足:①不包含X的子孙节点;②阻断了X到Y的所有后门路径。则称Z满足(X,Y)的后门准则
后门调整:基于后门路径,通过干预do算子消除混淆因子的影响,仅使用已知的数据分布,估计变量之间的因果效应
3.前门准则:该准则对应链式结构
前门标准(前门准则):如果变量集Z满足:①阻断了X到Y的所有路径;②X到Z之间没有未阻断的路径(X到Z不存在后门路径);③Z到Y之间的所有后门路径都被X阻断。则称Z满足(X,Y)的前门准则
前门调整:和后门调整类似,通过do算子去除前门路径(链式)的影响
2.4.3示例说明[13]
这两个准则应该如何使用呢?这里提供一个case
背景:有一种药物,对于男士群体而言,使用该药物后发病率降低。对于女士群体而言,使用该药物后发病率也会降低。但是,对男女人群一起统计,则结论相反
假设T=1表示服药,T=0表示未服药,Y=1表示发病的概率,Y=0表示未发病的概率。显然P(Y=1∣T=1)=0.78<P(Y=1∣T=0)=0.83,这是因为没有考虑混淆变量“性别”的影响,出现了辛普森悖论。
如下图,通过后门调整,去除掉性别对服药的干扰。则最终P(Y=1∣do(X=1))=0.832>P(Y=1∣do(X=0))=0.781,说明服用此药物确实可以降低发病率。
后面调整的计算逻辑如下:
2.4.4因果识别
当前SCM模型更多用于因果识别,这是因果推断伴生的研究课题。其目标是从一系列的因子里,找出各因子间的因果相关性并输出因果图,则后续可根据casualgraph分析两两因子间的相互影响,揭示因子对结果的多层传递性影响。举个例子[14],我们研究影响产品销量的因素时,可能存在产品价格、产品属性、门店信息、市场竞争情况等因子需要考虑。我们可以构建多个类似下图的因果图模型,然后通过do算法实现干预,判断各因子间存在的因果关系,最终输出概率最大的因果图作为识别的结果[15][16]。本文主要关注因果推断,因果识别不做展开讨论,更多示例可参考相关文章[17]
2.5潜在结果模型(RCM)[11]
RCM关注的是干预前后的期望变化,即2.2所述的Treatmenteffect。该模型不考虑分析所有因子的因果性,只关注treatment和output之间的因果强弱,因此也不需要构建完整了因果图,而是假设treatment和output外的其他因子均为混淆因子,构建粗略的因果图,通过预测反事实的结果,并于观测对比来完成因果推断。
该模型的期望输出分为四种(ATEATTCATEITE),可根据业务需求选择。对于for单个研究对象的反事实推断,模型的目标是计算每一个样本i的因果效应,即=(T=1)?(T=0)。以3.3服药和康复的case为例,T=是否服药,Y=是否康复。我们知道,一个人是无法同时观测到吃药和不吃药对康复的影响,SCM也无法推测服药对某个用户的价值。而RCM则会根据数据形态(即用户属性、历史表现以及混淆因子“年龄”等)预测实际未发生的行为将产生的结果,从而推断出ITE。同理可得出ATE、ATT、CATE。
因为业界很多时候关注的是单个treatment因子的价值,所以RCM往往是业界的首选。
2.5.1基本假设
RCM存在如下3个基本假设[18]:
稳定单元干预值假设(StableUnitTreatmentValueAssumption,SUTVA):任意单元的潜在结果都不会因为其他单元的干预发生改变而改变,且对于每个单元,其所接受的每种干预不存在不同的形式或版本,也不会导致不同的潜在结果。以吃药康复的例子解释这里的两层含义,其一是你吃不吃药不影响我是否康复;其二是每种干预是唯一的,吃药不存在吃很多、吃很少的情况,统一药量,要考虑药量就要设置不同的干预值(即此时干预变量不能只是0和1)
喜欢觉醒失败后我回山里种田请大家收藏:()觉醒失败后我回山里种田
穿书后,让疯批反派跪地说爱我! 被知青抛下后,我在80年代暴富 带着快递驿站穿年代 病娇妹妹爱上温柔姐姐 浪痞 我末影女王!实名表白Him大人 满门炮灰读我心,全家杀疯了 哭包小同桌又在哄校霸好好学习 嫡妹非要换亲,我救忠烈成团宠 莲花楼:险象环生 大唐之盛世大柱国 遮天经 仙旅星海 将门毒妃一睁眼,禁欲战王被休了 西瓜吃西瓜 黑篮:霸网B技 奥特:我是平成老大哥 太傅大人每日想当皇后想疯了 重生九八:预知未来暴富惊呆校花 丑小鸭进城,摇身一变成豪门千金
关于人在木叶生性纯良的我被系统逼上了邪路穿越火影世界,开局觉醒系统!呦,生性纯良的宿主呦!作为一个正常的男人,你怎么能眼睁睁的看着宇智波富岳那个混蛋老牛吃嫩草!一向宇智波美琴表白,俘获佳人芳心奖励S级忍术一门(随机)二生性纯良的宿主呦!只有愚蠢的人才会做选择,强夺一血奖励写轮眼三门忍术熟练度提升一级(随即)望着远处自己下属那纯真的神情,藤原哲也看着水中自己的倒影陷入了沉思。这一血,自己究竟是要,还是不要?...
关于林家有女整治家风种田宅斗大女主无金手指无cp脾气暴躁一言不合就咬人村中有四霸恶狗公羊大鹅和林三丫林瑶睁开眼就目睹了家徒四壁,那叫一个寒酸。再睁眼又目睹了泼妇骂街,得不想动嘴打一顿就好了。从此林家三丫性情大变一言不合就开撕。重男轻女的偏心祖母,心思深沉祖父,独木难支的后娘,软弱无能的亲爹。上有两个任人欺辱的姐姐,下有两个后娘生的弟妹,更有恶毒叔伯一窝好吃懒做筛子精,真真是极品凑了一堆。从此...
关于足坛之开局点满任意球什么?竟然把任意球点满了,我明明点的是传球呀!!!沦为皇马队饮水机管理员的江浩,在一场国家德比最后时刻登场,以两粒直接任意球破门方式开始传奇人生。弗洛伦蒂诺我这辈子最大的错误,便是把江浩卖给巴伦西亚。齐达内我很幸运,江浩没有出生在我们那个年代。C罗江浩是历史最佳,我不如他。贝尔难以想象,我竟然会在速度上被人碾压。拉莫斯这家伙不是惧怕对抗吗,怎么铲不动?梅西...
关于万里追狼白龙,它不是龙,也不是马,它是一条白色的狗,是60年代华北地区某村的一条狗王。在那个狼灾泛滥的时代,白龙在主人福哥的照料下,历经坎坷,从一条小狗崽成长为一条勇猛的狗王,并和村里的狗一起担负起守卫村庄的责任。由此与村庄周围的狼群结仇,几番恶战,斗智斗勇。。。...
关于异能学校之遇上恋爱脑大佬选修课总是遇到女主被迫恋爱脑的魔修大佬vs表面小白实则腹黑爱玩的欧皇新生!简介一高考后准备报考的褚星禾,某天突然接到电话请问是褚星禾同学吗?这里是关山岭职业技术专修学院考生你好,这里是玄天宗职业技法大学招生办褚同学你好,这里是魔神机械设计学院招生办这不妥妥的诈骗电话吗?什么妖魔鬼怪的野鸡学校都打电话过来招生。听听这名字,褚星禾能信吗?当然不能!!!然而她还是被迫入学了。没人告诉她还有入学考试,怎么还有人上学带刀枪剑炮水晶球啊?这都算了!为什么入学考试是闯鬼屋?躲丧尸?跳大神越来越离谱了,得亏褚星禾从小见惯妖魔鬼怪,不然真得被创飞。简介二通识实践课就跟着魔修大佬一起选!结课巨快!为什么?他每个副本都得杀妻证道,主打就是一个大道无情!你进去老公还没喊出来,人就噶掉了!嘎嘎快。还有这种好事?褚星禾第一个冲了!然而她遇到的怎么不太一样?谁能来告诉她,为什么这个魔修大佬只会哭唧唧找老婆,甩都甩不开?...
关于诸天带着随身空间到了四合院世界陈琦莫名穿越,来到一片湖心岛,发现拥有空间之后,并感应到世界种子,按其要求吸收物质供给小世界之种,然后就被排斥到四合院世界,开局城门口,因为衣服新颖而被误认为富家公子而被放行,进入城内遇到还在卖包子的未成年何雨柱,阻止了他被人骗,改变了他获得外号的命运,从而改变了主角的命运从其身上获得了气运,得到了一定的庇护避免了被四合院世界排斥而赶出世界。之后陈琦靠着何雨柱的帮助进入了四合院租了院子安定下来,靠着小世界的养殖种植能力,通过何大清介绍给丰泽园供应食材,之后开肉铺,接手杂货铺,开商行,买地,生意越做越大,于是很多事情很多人也纷至沓来,蝴蝶效应直接造成何大清成了丰泽园二厨,并再娶了。而陈琦只想收集这个世界的各种动植物然后去诸天寻找永生。持续的获取气运使得小世界内开始出现了生成中的四合院世界的信标传送门,完成之后就可以在离开这个世界之后就可以随时回到四合院世界。现在开启了荒野大镖客2救赎的第一幕第一个世界,四合院,第1章124章第二世界,荒野西部大镖客2125章第三世界,港综第四个世界待定。...