打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
不做固定效应就拒稿?

导读:在利用面板数据做经济学研究时,我们经常会遇到审稿人控制个体固定效应的要求,而个体固定效应模型不显著时通常会遭遇拒稿。针对面板数据是否必须使用个体固定效应模型这一问题,本人认为,控制个体固定效应在统计上总是比不控制要稳健,估计出来的系数更加无偏和一致,但控制固定效应的同时会牺牲变量的一部分变异性,使得有效信息量减少,对于某些研究问题可能不适用。最后提供了一些解决方案。

1.故事背景

前天在一个学者群里看到一个争论议题,感觉很有意思,分享一下。这个议题是关于面板数据是不是必须使用个体固定效应的问题。一部分群友认为面板数据不使用个体固定效应就应该被拒稿,另一部分群友则不同意该观点,由此引发了争论。目前国内审稿人似乎对个体固定效应情有独钟,甚至很多大佬级经济学家也曾发表过类似不使用固定效应就拒稿的观点。本人曾有一篇使用截面数据的文章,在投稿过程中也遇到过此类要求(这个真的没法做)。那么个体固定效应是否非做不可呢?这两天查了一点资料,发表一下个人看法,如有不对之处,欢迎批评指正!

2.面板数据与个体固定效应模型

众所周知,面板数据是包含个体(i)和时间(t)两个维度的数据集,按个体分组,一个n×T的数据集可以将样本分成n个小组,每个小组包含T个时间上的观测值,样本的总变异性可以分解成组内差异和组间差异,根据邱嘉平老师(2020)的观点,样本总体变异性近似等于组内变异性和组间变异性。

图片来源于《因果计量实用计量方法》

个体固定效应模型属于变截距面板数据模型中的一种(李子奈和叶阿忠,2012),该模型认为每个个体的截距项都不同,如果采用传统上一视同仁的方法,会将该截距归入残差项,当其与自变量X相关时模型会产生内生性,因此需要单独提取出来。一般建模的时候使用最小二乘虚拟变量法(LSDV)建模,即为每个个体设置一个虚拟变量引入模型,参数估计的时候一般使用个体组内差分法估计。Stata代码是: xtreg y x , fe 或者reg y x i.id两者等价。

图片来源于《高级应用计量经济学》

个体固定效应的好处是可以一次将不随时间变化的可观测和不可观测遗漏变量的影响都吸收掉(数学上可以理解为所有这些变量都可以被设置的哑变量线性表出),大大减少了模型的内生性,使得估计出来的系数更有可能是无偏或一致的。但与此同时也付出了一定的代价,那就是自变量的组间变异性也会被吸收掉。而变异性恰恰是模型估计的重要信息来源。举例来说,如果我们看到x变化y也跟着变,那么估计系数就容易得多;但如果x不变,y也不变,我们没有信息,就没法估计系数,一般变异性越大,信息量就越多。本人认为固定效应模型实质上是一个用信息量去换取统计上无偏和一致估计的做法。由于组间差异被吸收,固定效应模型估计出来的系数实际上是组内差分估计量,而如果某个变量组内(时间上)变异性很小,或者样本的时间维度很短,那么用固定效应模型很难得到结果。因此固定效应模型更适用于“瘦长型”数据集,时间维度上变异性足够大;“矮胖型”数据集由于损失的信息量太多,一般不容易得到结果。

图片来源于《因果计量实用计量方法》

此外,个人认为是否控制固定效应还需要根据研究问题具体讨论。首先,要承认,使用个体固定效应估计的系数统计性质上总是更好的,因为它识别的是更干净的因果关系。举个例子来说,我们研究公司给员工交养老金是否会吸引求职者的问题,如果我发现在每个公司组内,每次这家公司给员工多交养老金,求职者就会增加,那么我当然更有信心说他们是因果关系,因为公司还是那家公司,大部分外部条件都是一样的。但问题是,如果同一家公司,每年交的养老金都差不多,变化不大怎么办?没法估计啊!这个时候我们就可以利用变量的组间变异性,我们发现,养老金交的多的公司求职者总是比交的少的公司求职者多,那么我们也可以得出结论,但是这个结果可能受很多混杂因素影响,例如工资待遇、行业等等,当然这些都可以控制。如果说,一个研究问题恰恰需要充分利用变量的组间变异性,那么个体固定效应可能就不太合适。无偏一致虽好,可不要贪杯哦。

3.如何回应这个问题

个人认为遇到审稿人要求用个体固定效应模型,但是又做不显著时,可以用以下几招:

1.根据研究问题去argue,说明变量的组间变异性对自己的研究问题很重要,并且将变量的变异性分解成组间变异性和组内变异性,看看信息量主要来源于哪个。

2.加控制变量,使用固定效应模型的好处无非就是可以缓解遗漏变量的问题,那当然就可以通过加控制变量的方法解决,某些不可观测因素找不到直接衡量的指标就找代理变量,一直加,加到审稿人无话可说。毕竟我也可以说个体固定效应模型过度控制了。

3.说明自己的数据集时间维度比较短,固定效应模型可能不适用。

4.如果可以的话,参考李子奈和叶阿忠(2012)第178页,做F检验,说明控制了现有变量后,不应该再使用变截距面板模型(如果检验能通过)。

图片来源于《高级应用计量经济学》

参考书目:

邱嘉平.2020.《因果推断实用计量方法》.上海财经大学出版社.

李子奈和叶阿忠.2012.《高级应用计量经济学》.清华大学出版社.

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
笔记 | 杂谈控制固定效应这件事
互助问答第499期:关于个体层面数据构建面板双向固定效应模型问题
求助:面板数据模型的选择?
面板数据固定效应 vs. 随机效应
计量利器之stata面板数据处理
双重差分/倍分法did分类及数据要求
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服