双重差分法(DID)
差分法的局限
经济学家常关心某政策实施后的效应,比如对于收入的作用。最简单的做法是比较处理组(即受政策影响的地区或个体)的前后差异,这称为“差分估计量”(difference estimator),即将处理组(treatment group)政策实施后的样本均值,减去政策实施前的样本均值。然而,由于宏观经济环境也随时间而变(时间效应),故政策实施地区的前后差异未必就是处理效应(treatment effects)。
双重差分法
为了解决差分法的局限性,常用方法是寻找适当的控制组(control group),即未实施政策的地区,作为处理组的反事实(counterfactual)参照系。具体来说,可将未受政策影响的控制组之前后变化视为纯粹的时间效应,即
综合以上两个差分,即将处理组的前后变化减去控制组的前后变化,可得到对于政策处理效应更为可靠的估计:
这就是所谓的双重差分估计量(Difference in Differences,简记DD或DID),因为它是处理组差分与控制组差分之差。该法最早由Ashenfelter(1978)引入经济学,而国内最早的应用或为周黎安、陈烨(2005)。
一般双重差分回归
更一般地,可在面板模型中加入个体固定效应、时间固定效应,以及其它控制变量:
其中,为个体固定效应,为时间固定效应,为一系列控制变量,而为暂时性冲击(transitory shock)。
不难看出,上式就是“双向固定效应模型”(two-way fixed effects),因为它既包括个体固定效应(),也包括时间固定效应();只不过多了双重差分法的关键变量,即交互项(政策虚拟变量:policy dummy)。在具体回归中,个体固定效应可通过加入个体虚拟变量来实现(即LSDV法,或进行组内离差变换,within transformation);而时间效应可通过加入每期的时间虚拟变量(time dummies)来实现。
举个例子:在进行DID分析时,treat,post系数为负,两者的交乘项treat*post为正说明什么?
如果预计treat组在政策发生前的Y本来就更高,treat系数为正;如果预计随着时间推移,Y会提高,post为正;如果预计treat组随着政策发生后的Y高于untreat组,treat*post的系数为正。
如果treat系数为负,说明政策发生变化前的Y本来更低;post为负,意思是没有政策的话,所有样本的Y随着时间下降,treat*post的系数为正的话,说明随着政策发生后treat相比untreat组的Y下降更慢。
双重差分法的假定
为了使用OLS一致地估计方程,需要作以下两个假定。
假定1:此模型设定正确。特别地,无论处理组还是控制组,其时间趋势项都是。此假定即“平行趋势假定”(parallel trend assumption)。
假定2:暂时性冲击与政策虚拟变量不相关。这是保证双向固定效应为一致估计量(consist estimator)的重要条件。
在此,可以允许个体固定效应与政策虚拟变量相关(可通过双重差分或组内变换消去,或通过LSDV法控制)。DID允许根据个体特征()进行选择,只要此特征不随时间而变;这是DID的最大优点,即可以部分地缓解因 “选择偏差”(selection bias)而导致的内生性(endogeneity)。
双重差分法的优越性
相对于静态比较法,双重差分法不是直接对比样本在政策前后的均值变化,而是使用个体数据进行回归,从而判断政策的影响是否具有显著的统计意义。相对于传统办法,双重差分法能够避免政策作为解释变量所存在的内生性问题,即有效控制了被解释变量和解释变量之间的相互影响效应。如果样本是面板数据,那么双重差分模型不仅可以利用解释变量的外生性,而且可以控制不可观测的个体异质性对被解释变量的影响。因此,双重差分法既能控制样本之间不可观测的个体异质性,又能控制随时间变化的不可观测总体因素的影响,因而能得到对政策效果的无偏估计。同时,我们在使用该方法时也应做到恰当运用,主要需注意内生性、控制组受影响、样本异质性及概念混淆等问题。否则将产生一定的负面影响,甚至使政策评估出现偏差乃至完全相反的结论(陈林、伍海军,2015)。
联系客服