未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
不可不知的断点回归 (RDD)经典案例和实用技能

目录

第一部分  经典论文分析

(1)数据描述与模型分析

(2)断点处连续性检验

(3)断点给定随机分布检验

第二部分  断点回归检验参考变量分布

第三部分  断点回归模型选择:精确or模糊

第四部分  精确断点回归操作应用

第五部分  模糊断点回归操作应用
第六部分  经典论文推荐

断点回归分析被认为是最接近随机实验的检验方法,能够缓解参数估计的内生性问题,近来在越来越多的研究中得到使用。现有资料已经对断点回归方法的基本原理和效应识别进行了较为广泛的介绍,但对阶数选择和稳健性检验等问题的仍相对较少涉及。本文将基于Stata软件来系统介绍断点回归方法的图形观测、效应识别和有效性和稳健性检验。限于篇幅,本文将内容限定于清晰断点回归方法(Sharp Regression Discontinuity Design ),且只考虑只有一个断点和一个分配变量的问题。

第一部分  经典论文分析


根据贫困标准,利用stata地图数据绘制的贫困县分布图,直观显示贫困县主要集中在内陆地区和山区,这也与现实中我们的贫困地区分布极度接近。

(1)数据描述与模型分析

下图绘出了1992年县人均收入与断点之间的第一阶段关系及其被评定为贫困县的概率。可以看到,在断点附近,评定为贫困县的可能性存在一个明显的变化,

下图显示了一个县人均收入对数的变化情况,即人均收入(相对于1992年的资格门槛),变化在“±500元”区间带宽的变化情况,预测的结果在断点上有显而易见的差距。

(2)断点处连续性检验

断点回归的基本假设是,只有在断点附近各县的是否评定为贫困县才会发生变化。所有其他县级因素随着变量的变化都是连续的。图6通过图像清晰显示了各预设不连续县域特征在断点处的连续性。

(3)断点给定随机分布检验

在资格门槛给定的情况下,可能会违背连续性假设(McCrary,2007)。下图给出了1992年农村人均收入的直方图,贫困线的密度没有明显的跳跃,这表明在断点附近的贫困程度随机分布。

第二部分  断点回归检验参考变量分布

这里检验内生分组,即主要检验配置变量,其实就是RD中个体是否将自行进入断点两侧,决定是否进入实验的,并是否存在某种跳跃性的变化。如果存在内生分组,个体将自行进入实验,导致在断点两侧的分布不均匀,这样分组变量x的密度函数f(x)在x=c处不连续,出现左右极限不相等的情况。

McCrary(2008)提出了一种核密度函数的检验方法(命令是DCdensity,介绍见下述操作),将参考变量划分成不同的区间并计算各区间中的个体数量,如果个体能够操纵参考变量,我们将能观测到断点左右个体数量有较大差别,比如很多个体通过操纵到了断点的右侧,那么,在断点右侧的区间中个体数量可能将大大超过断点左侧区间中个体的数量,利用带宽选择和曲线拟合方法,可以检验在断点处c是否存在跳跃 。










































//Example code of how to use DCdensity.ado//First put DCdensity.ado in your ado folder//if you dont know where your ado folder is//issue//sysdir//at the Stata promptcapture log closelog using DCdensity_example, text replaceclearset mem 2Gset more offset seed 1234567
set obs 10000gen Z=invnorm(uniform())DCdensity Z, breakpoint(0) generate(Xj Yj r0 fhat se_fhat) graphname(DCdensity_example.eps)capture program drop dogprogram define dog, rclass{ syntax [, n(real 500)] drop _all set obs `n' gen Z=invnorm(uniform()) //gen r0=0 in 1 //DCdensity Z, breakpoint(0) generate(Xj Yj r0 fhat se_fhat) nograph DCdensity Z, breakpoint(0) generate(Xj Yj r0 fhat se_fhat) nograph local h=r(bandwidth)/2 drop Xj Yj r0 fhat se_fhat DCdensity Z, breakpoint(0) h(`h') generate(Xj Yj r0 fhat se_fhat) nograph return scalar bandwidth=r(bandwidth) return scalar theta=r(theta) return scalar se_theta=r(se) ereturn clear}endsimulate, reps(1000): doggen t=theta/se_theta//2 views regarding the issue of normal approximationkdensity t, normalqnorm tlog close

从图中可以看出,断点两侧密度函数估计值的置信区间有很大一部分重叠,故断点两侧的密度函数不存在显著差异。

第三部分  断点回归模型选择:精确or模糊

按照在断点处个体得到处理效应概率的变化特征可以分为两种类型(即断点回归可以分为两种类型):一种类型是精确断点回归设计 (sharp regressiondiscontinuity design, 以下简称SRD) , 其特征是在断点 (也就是上面所说的临界点) X=c处,个体接受政策干预的概率从0跳跃到1;另一种是模糊断点回归设计 (fuzzy regression discontinuity, 以下简称FRD) ,其特征是在断点X=c处, 个体接受政策干预的概率从a变为b, 其中a≠b,0<a<b<1。



g ranwin=(d>=0) tab  ranwin win

此处,分组变量d的断点是0,生成新虚拟变量ranwin,若ranwin与处理变量win完全相等,则属于精确断点回归,否则属于模糊断点回归。此处,是精确断点回归。

第四部分  精确断点回归操作应用





ssc install rd, replace**选择最优窗宽:设置不同带宽,并通过图形选择-**从默认的3种窗宽mbw(100,50,200)中,选一个最优的rd lne d, gr bdep oxline


**直接选择默认的带宽以及三角核进行断点回归,命令为 rd lne d, gr mbw(100)

第五部分  模糊断点回归操作应用





**现在生成一个新的处理变量randwin,使得randwin不完全由分组变量d所决定。set seed 20181203g byte randwin=cond(uniform()<.1,1-win, win) tabulate randwin win

结果显示randwin与win基本相同,但不完全相同,说明randwin不完全由分组变量d所决定。



**使用最优带宽与默认的三角核进行模糊断点回归rd lne randwin d, mbw(100)


**含协变量的断点回归rd lne randwin d, gr mbw(100) covar(i votpop black  blucllr farmer fedwrkr  forborn manuf  unemplyd union urban veterans)

第六部分  经典论文推荐

这篇文章由清华大学的李宏彬、北京大学的陈玉宇和另外两位作者共同完成。发表在《美国国家科学院院刊》(PNAS)的一篇论文,向已经逐渐意识到空气污染危害的中国民众再次展现了残酷的现实:以淮河为界,烧煤供暖的中国北方地区空气污染水平高于中国南方,北方5亿居民因严重的空气污染,平均每人失去5年寿命。使用的方法就是断点回归(RD)。

空气污染造成的结果,淮河两岸的人均寿命差异则是惊人的5年。

同时,不考虑空气污染,用其他变量预测出来的人均寿命则几乎没有差别。这说明了连续性假设是成立的,淮河两岸的两个十分接近的地区几乎拥有相同的特征。作者还发现,淮河以北的超额死亡率,正是由和空气污染相关的心肺疾病相关,并进而与空气总悬浮物相关,而与谋杀、自杀等因素无关。

将供暖线平移做稳健性检验,结果表明只有在真实供暖线才有区别,其他假设的线在95%置信区间内都包括了0。

作者给出结论:烧煤将使空气总悬浮物大幅度上升,并使中国北方地区的居民人均寿命降低5年。该文亦引起一些争论。

经典论文题目:

Newevidence on the impact of sustained exposure to air pollution on lifeexpectancy from China’s Huai River Policy

论文网站链接:

https://www.pnas.org/content/early/2017/09/05/1616784114

论文数据以及程序

https://www.pnas.org/content/early/2017/09/05/1616784114/tab-figures-data

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP阅读全文并永久保存 更多类似文章
猜你喜欢
类似文章
RDD断点回归, Stata程序百科全书式的宝典
有趣的经济学第39期:在中国,读重点大学能改变命运吗?
断点回归设计国内外研究综述
调试asp.net C#程序,如何设置断点,监视变量?
互助问答第27期:面板数据的stata设置问题
高达seed
更多类似文章 >>
生活服务
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!