打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
因果推断的圣杯还是占星术?充满争议的工具变量法之应用|开学第23讲再论工具变量法的寻找、检验与前沿
在因果推断中处理内生性问题的方法包括工具变量( instrumental variable,IV) 、面板固定效应模型( fixed effects model,FE) 、倾向值匹配( propensity score matching,PSM) 、双重差分(DID)、断点回归(RDD)等等。何以说工具变量是定量分析中因果推断的“圣杯”? 这是因为,好的工具变量非常难以寻觅,寻找它的逻辑和数据挖掘过程充满艰辛、难以驾驭,甚至往往需要研究者的灵感。但它在模型上的简洁性,它对社会科学想象力、逻辑力和诠释力的要求,既为定量分析提供了因果推断的重要武器,也让分析的过程充满趣味和奇思妙想(陈云松,2012)。计量经济学只有一种性,内生性!Jesus!寻找到一个好的工具变量可以直接在MIT博士毕业,可见找工具变量是一件有挑战性的事情
在某人看来,找工具变量是一项有趣的智力活动,除了需要一个人有经济学的素养和逻辑,还需要这个人知识面广,自然、地理、人文、世俗智慧和经验等,通常,这跟一个人熟悉的领域,由长期观察和思考产生的洞见有关。当然还需要一点运气,学术不是苦思冥想,也许做一个梦,喝一杯下午茶,灵感就闪现了。这不是占星术吧?!

工具变量的假设条件:

y = β0 + β1x1 + βX2 + ε (1)
这里y为被解释变量,x1为自变量,或者解释变量,也即“因变量”。X2 为外生控制项向量( 也即一组假定为外生的其他控制变量,例如年龄、性别等等) ,ε则为误差项。如果ε与x1不相关,那么我们可以利用OLS 模型对方程进行无偏估计。然而,如果一个重要变量x2被模型(1) 遗漏了,且x1和x2也相关,那么对β1的OLS 估计值就必然是有偏的。此时,x1被称作“内生”的解释变量,这就是 “内生性”问题。有一个方法就是找工具变量Z。

变量Z可以作为变量x的有效工具变量,当满足:工具变量必须外生 ,即, Cov(z,u) = 0,工具变量必须与内生变量x相关,即, Cov(z,x) ≠0。

Cov(z,u) = 0无法验证,Cov(z,x) ≠0可以验证。 Cov(z,x) ≠0验证被称之为弱工具变量检验,弱工具变量的有偏比OLS更严重。
Cov(z,u) = 0无法验证,我们只能依赖常识和经济理论,这需要理论修养和积累。争议由此而产生....,历史上得以让大牛成名的著名IV后来陆续被证明是有问题的IV!
检验是否Cov(z,x) ≠0的回归有时被称为两阶段最小二乘法2sls的第一阶段回归。需要指出的2sls并不是直接用工具变量z代替内生变量x1,而是用若干工具变量和外生x对内生x1进行回归,然后根据回归得到x1的预测值,带人第二阶段。由于不同阶段残差的问题,千万不要自己手动去做两个阶段的回归,而是直接用stata的2sls的命令,作为二代命令ivreg2包含多种检验,而最新的与高维回归合成的命令功能更强大,它融合了多重固定效应和聚类标准误,使用参见本公众号的推文:
扩展工具变量多重高维固定效应面板回归程序包在线或离线安装|开学第15讲Stata包离线install代码
扩展工具变量多重高维固定效应面板回归命令与注意事项
如果基础不够扎实,关于到底选择面板固定效应还是随机效应?固定效应设几重到哪个维度?多重嵌套聚类到哪个维度?为什么,欢迎参加以下课程学习:
精品课程 | Python数据挖掘与Stata应用能力提升与实证前沿寒假工作坊
历史上一些著名的工具变量确实让人拍案叫绝:
example1:河流数量与科举考试和学校教育质量
科举废除对社会流动性和革命的影响—河流数量
Bai Ying and Jia Ruixue(2014,working paper)研究晚清废除科举对社会流动性和革命的影响,其基本逻辑是科举废除使得原本依赖于科举作为上升通道的知识分子不得不以参加革命的方式来完成社会阶层的流动,而这一效应在原本就教育发达,科举盛行的地方体现得更为显著。为此,文章统计了有记载的同盟会等革命团体的成员的地域分布来说明这一点。文章主要是用科举名额来体现科举废除前各地通过科举实现社会流动的依赖性,而这个名额是以地域和对应人口来进行划分的。而且是非线性的不规则的划分。文章使用双差分法(DID),为了避免省略变量的影响,必须找一个在科举废除前后都不变化而且跟科举名额有关的变量来做工具变量。两位作者的一个巧思是使用该地域内的小河流的数目,逻辑是县城一般是依河而建,小河流数基本上体现了县的数量,而科举名额与县的数量相关,且小河流的数量在科举废除前后并不变化。这个工具变量的使用十分的巧妙。还有哪些有趣的工具变量,点击文末 阅读原文。
城市河流的数目与学区个数
学区竞争与教育质量。是否一个城市学区越多,学区间竞争越激烈,越有利于提高教育质量?内生性问题:在学区形成过程中,效率高的学区会变得更大,或许兼并相邻学区。Hoxby (2000)使用一个城市河流数目作为该城市学区个数的工具变量。历史上,如果一个城市的河流越多,则妨碍交通的自然障碍越多,导致城市设立更多的学区;故河流数目满足相关性。另一方面,河流数目很可能不会直接影响教育质量,故满足外生性。
example2:警察人数与犯罪率
警察人数越多,执法力度越大,则犯罪率应该越低。但警察人数是内生变量,如果某城市的犯罪率很高,则市政府通常会增加警察人数。Levitt (1997)使用“市长选举的政治周期”作为犯罪率(包括7 种类型的犯罪)的工具变量。在任市长在竞选连任时,为拉选票,会增加警察人数,故满足相关性。另一方面,选举周期一般以机械的方式确定,除了对警察人数有影响外,不会单独地对犯罪率起作用,故满足外生性。
example3:地理因素与国际贸易
国际贸易与经济增长。实证研究国际贸易对经济增长的促进作用,面临内生解释变量的问题,因为经济增长可反作用于国际贸易。Frankel and Romer (1999)使用地理因素作为工具变量。首先,国际贸易受地理因素的影响(比如,距离较近的国家之间的贸易量较大),故满足相关性。其次,地理因素对经济增长的影响可能仅仅通过国际贸易这个渠道来实现
example4:降雨量与看电视和小儿自闭症
看电视过多引发小儿自闭症?Waldman et al (2006, 2008)研究过多观看电视是否引发小儿自闭症。但有自闭倾向的儿童可能更经常看电视,存在双向因果关系。Waldman et al (2006, 2008)使用降雨量作为电视观看时间的工具变量。二者存在相关性,即降雨越多的地区,人们呆在室内的时间越长,故看电视时间也越长;而降雨量很可能是外生的(只通过看电视时间而影响被解释变量)。
一些有趣的工具变量——从阿西莫格鲁的论文说起
占星术吗?充满争议的工具变量
在制度经济学研究中,我们关心的是制度对一国的人均收入有无影响。但制度往往是内生的,或者说是选择性的( 例如,好的制度也许总在人均收入高的国家或地区产生) 。只有找到制度的工具变量,才能让人信服地证明制度的力量。阿西莫格鲁等在一项经典研究( Acemogluet al.,2001) 中,把殖民地时代一个国家的自然死亡率作为该国当今制度的工具变量。其理由非常巧妙: 如果该地区当年的死亡率高,那么欧洲殖民者就相对不愿定居下来,从而在当地建立起更具掠夺性的“坏”制度。由于制度的“路径依赖”,殖民时代的制度显然和现在的制度关系密切。因此,历史上的死亡率作为工具变量,应该和当今制度紧密相关,而一百年前的死亡率作为一种自然生理现象,又和目前的人均收入没有直接关系。虽然后来人们对这个工具变量产生了怀疑,但是毛咕噜太能忽悠了,不知怎么这个几乎无效的工具变量成了他的一个成名作品。
现代经济史研究中工具变量使用非常有意思,主要原因是历史研究的数据量和数据种类有极大的限制,不得不在可用的数据中寻找各种各样的工具变量,这其中又以Acemoglu大神最富名气和争议性。Acemoglu那篇著名的关于制度与经济增长的论文,把殖民时代的死亡率作为工具变量,但如果其他影响经济增长的因素通过影响殖民时代的制度来影响殖民时代的死亡率,那么死亡率这个工具变量不还是和残差项相关吗?这是用说理的方法与毛咕噜的Arguing之一。
相对于由直觉基准获得的工具变量,使用有条理的变量(机器学习)获得更强大的第一阶段,并具有相应的合理精确的第二阶段估计,这表明高维技术可以有效地补充研究人员在IV估计中选择工具变量的直觉设置。Belloni等(2012) 用机器学习方法实打实地验证了毛咕噜依靠直觉忽悠了一个动听的故事,但是他的工具变量却不是有效的...

机器学习筛选的有效工具变量:

local morSel `r(selected)' ;

di '`morSel'' ;

africa

弱工具变量检验、近似外生与非完美工具变量、机器学习与工具变量|开学第12讲IV关键与前沿问题

也不要只说毛咕噜,另一个计量大神安格斯特也一样受到后来学者的质疑,当时他的工具变量也是被说的天花乱坠,不知怎么让人迷失了双眼,也就是亮瞎了眼睛!Angrist 和Krueger( 1991) 用出生季度作为教育的工具变量估计教育收益率,估计结果显示工具变量( Instrumental variables, IV) 与普通最小二乘( OLS) 方法的估计结果几乎没有显著差异,他们因此推断用OLS 估计得到的教育收益率存在的偏差可能并不大。Bound 等( 1995) 使用同样的数据复制了Angrist 和Krueger( 1991) 的研究,根据IV 估计第一阶段回归外部工具变量联合显著的F统计量和partial R2 值,认为出生季度与受教育年限之间只有很小的相关性,因此是弱工具变量(郭冬梅等,2014)。

没有完美的工具变量,怎么办?

工具变量(IV)回归是确定某个处理变量对某个结果变量的因果效应的有力工具。识别依赖于排他性约束:IV只通过感兴趣的处理变量的途径影响结果。这一假设经常是有争议的,不能进行正式的检验。因此,毫不奇怪的是,研究人员花费了大量时间和精力来说服他们的读者,使他们相信所提出的IV满足所维持的假设(Conley等人,2012年)。

近年来,有两种方法被广泛应用于检测和调查违反排他性约束的敏感性。首先,从Bound和Jaeger(2000)开始,由Altonji等人(2005)和Angrist等人(2010)推广。研究人员进行辅助回归作为排他性约束的非正式测试。直觉是,在第一阶段(即IV对处理变量的影响)为零的子样本中,如果满足排他性假设,简约形式(即IV对结果变量的影响)也应为零。这种非正式的测试,此后称为零第一阶段测试,永远无法验证排他性假设,但建立了排他性假设满足的信心。第二个进展是Conley等人的工作(2012),他提出了“貌似外生的”方法。以违反排他性假设的先验信息为条件,该方法允许研究IV估计量的稳健性。两种方法都是重要的贡献,并且越来越受欢迎以使IV估计更加透明和可靠。然而,当独立应用时,这两种方法都有局限性。当不能拒绝零简约形式的影响时,零第一阶段测试是一个令人信服的证据,但当拒绝时,迫使研究人员放弃IV。很有可能,当在零第一阶段测试中发现违反排他性约束时,许多看起来很有前途的IVs最终都会被闲置。同时,如果研究者有违反排他性约束的先验信息,但是没有提供如何获得可信先验的指导,则近似外生方法是非常有用的。因此,在缺乏可靠先验信息的情况下(例如,Dincecco和Prado,2012,Ding等人,2009和Nunn和Wantchekon,2011),当前仅使用近似外生方法的作为广义刷敏感度分析。零第一阶段测试和貌似外生方法的综合是克服这两种方法局限性的一种强大组合。毕竟,尽管传统的貌似外生方法没有提供任何关于如何选择基本输入参数的指导,但零第一阶段测试给出了所需输入参数的直接估计。另一方面,如果零第一阶段测试表明违反了排他性约束,则可使用貌似外生的方法纠正这些违反

Kippersluis等(2018)用两个例子来说明,其中在一个例子中,IV对结果的直接影响大到足以使因果关系从零变得不可区分;在另一个例子中,IV对结果的直接影响是不显著的,使得我们的纠正可以说是肤浅的。这些例子构成了极端的情况,相信会有许多中间的情况,在这些情况下,这一程序可以给IV第二次生命,即这些IV似乎是有希望的,可它们原先在怀疑或发现违反排除限制的情况下都是被废除的,或者是最终无功而返的。

放松工具变量排他性假设的Stata操作原理与应用Stata包的离线安装代码|开学第13讲IV前沿与扩展IV多重固定效应包安装
弱工具变量检验、近似外生与非完美工具变量、机器学习与工具变量|开学第12讲IV关键与前沿问题
如果基础不够扎实,还有疑惑,欢迎参加以下课程学习:
精品课程 | Python数据挖掘与Stata应用能力提升与实证前沿寒假工作坊


本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
路径分析为啥在商科研究如此流行, 真可以厘清因果效应么?
工具变量法(三):IV真的外生吗?
MR | 第2期.工具变量怎么选,在文章中怎么写?
工具变量(IV)
互助问答第81期: 关于xtivreg2命令工具变量弱识别检验问题
你真的看懂数据新闻了吗?
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服