打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
Stata:断点回归分析

断点回归由Thistlewaite and Campbell(1960)首次使用,但直到1990年代末才引起经济学家的重视。

Thistlethwaite、Campbell于1960年首次提出使用断点回归设计研究处理效应, 在该文中他们的目的是研究奖学金对于未来学业的影响, 学生是否获得奖学金取决于考试的分数。由于奖学金由学习成绩决定,故成绩刚好达到获奖标准与差一点达到的学生具有可比性。如果考试分数大于获奖标准分数, 则进入处理组;如果考试分数小于获奖标准分数, 则进入控制组。因此处理变量在获奖标准分数处形成了一个断点, 该研究设计的主要思想是可以利用靠近这一断点附近的样本来有效估计处理效应。

Angrist and Lavy(1999)在研究班级规模对成绩的影响时,利用以色列教育系统的一项制度进行断点回归;该制度限定班级规模的上限为40名学生,一旦超过40名学生(比如41名学生),则该班级被一分为二。

此后30年, 该方法并未引起学术界的重视,直到1990年以后, 断点回归设计开始被应用于各种领域,并且近年来成为因果分析和政策评估领域最重要的研究方法。

Hahn et al(2001)提供了断点回归在计量经济学理论基础。目前,断点回归在教育经济学、劳动经济学、健康经济学、政治经济学以及区域经济学的应用仍方兴未艾。参见Imbens and Lemieux(2008),Van Der Klaauw(2008)以及Lee and Lemieux(2010)的文献综述。

断点回归相关中文综述和介绍详见断点回归:3篇中文综述和介绍,分别为

新“拟随机实验”方法的兴起——断点回归及其在经济学中的应用、

断点回归设计:基本逻辑、方法、应用述评、断点回归设计方法应用的研究综述

1
断点回归命令rd介绍

断点回归的基本命令是rd,首先我们输入如下命令进行安装,下载安装方法为:

ssc install rd, replace

语法格式为:
rd y d x, z0 (real) strineq mbw (numlist) graph bdep oxline kernel (rectangle) cov (varlist) x(varlist)

语法含义为:

其中mbw(numlist) 用来指定最优带宽的倍数,默认值为mbw(50 100 200)

z0(real) 用来指定断点的位置,默认值为z0(0),即断点为原点,如果此处省去D,则为精确断点回归,并根据分组变量X来计算处理变量 

graph 根据每一带宽,画出局部线性回归图 

bdep 根据画图来考察断点回归估计量对带宽的依赖性 

oxline表示在此图的默认带宽上画出一条直线,以便识别 

kernel(rectangle)表示使用均匀核(矩阵核),默认使用三角核 

covar(varlist) 表示用来指定加入局部线性回归的协变量 

x(varlist) 表示检验这些协变量在断点处是否存在跳跃(估计跳跃值和显著性)

2
前提检验

首先我们导入数据,输入命令如下:

use vote.dta, clear

在进行断点回归(RD)设计时,样本数据需要满足一定的前提条件,比如,断点两侧除断点(Cutoff)处理效应外,其他因素需保持平衡(滑)以及不存在Selective Sorting。

而断点回归的前提假设:Wi的条件密度在X=c0处连续。另外进行断点分析前,需要首先考察变量分组变量是否有内生分组的存在,意思就是样本个体事先知道分组原则等信息,然后通过自身选择来选择是否进入处理组,这样的内生分组将导致断点回归失效。即进行断点回归之后,我们还需要对其设定进行检验。具体来说,我们需要检验配置变量(assignment variable/running variable/forcing variable)是否被操纵。最直接的方法是绘制配置变量的直方图,观察频数在不同bin中的变化。由于bin的宽度要尽量小,这样来看,绘制密度函数曲线进行检验是更好的方法。McCrary (2008) 为判断密度函数是否存在断点提供了正规的检验。其基本句式是:

本文提供一种基于断点两侧样本分布密度来进行检验的方法:McCrary(2008)。它主要通过考察分布变量的密度函数在断点处是否连续进而实现检验样本是否存在选择性偏误,主要分为两步检验:第一步,将分组变量在断点处两侧尽量等距离细分,并计算每组的标准化频率;第二步,使用三角核估计进行局部线性回归,并计算密度函数估计值,然后检验密度函数在断点c处是否连续。

McCrary(2008)可以通过非官方命令DCdensity来实现,其中DC表示Discontinuity,可以来检验分组变量的密度函数在断点处是否连续。依此判断,是否存在内生分组问题。

该命令的下载地址为:https://eml.berkeley.edu/~jmccrary/DCdensity/ 

然后将该命令的DCdensity.ado下载安装或者复制到C:\ado\plus,Mac系统的需要自己sysdir查询外部命令安装路径,自行复制下载。命令语法格式为:

DCdensity assign_var,breakpoint(#) generate(Xj Yj r0 fhat se_fhat) graphname(filename) 

其中,assign_var 为分组变量,必选项breakpoint(#)用来指定断点位置,generate(Xj Yj r0 fhat se_fhat)用来指定输出变量名,graphname用来命名指定密度函数图。


检验分组变量的密度函数是否在断点处不连续。我们可以输入如下的命令进行McCrary检验,
DCdensity d, breakpoint(0) generate(Xj Yj r0 fhat se_fhat) graphname (DCdensity_example.png)

可以看出断点两侧密度函数估计值的置信区间有很大部分重叠,所以断点两侧的密度函数不存在显著差异,检验结果为不存在内生分组,可以继续进行断点回归分析。



3
精确断点回归

3.1、回归分析

首先直接进行线性回归

上述回归分析结果,虽然win表示当选了,会增加lne的支出,但是不显著

3.2、选择最优窗宽:设置不同带宽,并通过图形选择-

从默认的3种窗宽mbw(100,50,200)中,选一个最优的

rd lne d, gr bdep oxline

mbw(50),即最优窗宽的0.5倍

mbw(100),即最优窗宽的1倍

mbw(200),即最优窗宽的2倍

最优带宽

3.3、也可以直接选择默认的带宽以及三角核进行断点回归,命令为 

rd lne d, gr mbw(100)

上面结果说明拥有民主党派候选人当选的选区,并不能显著的增加联邦政府开支

3.4、也可以加入变量进行断点回归,命令为 

rd lne d, mbw(100) cov(i votpop black blucllr farmer fedwrkr forborn manuf unemplyd union urban veterans)

进行断点回归,还需要对其进行检验,检验协变量在断点处的条件密度是否存在跳跃


4
模糊断点回归操作应用
模糊断点回归

现在生成一个新的处理变量randwin,使得randwin不完全由分组变量d所决定。

set seed 20181203g byte randwin=cond(uniform()<.1,1-win, win) tabulate randwin win

结果显示randwin与win基本相同,但不完全相同,说明randwin不完全由分组变量d所决定。

下面使用最优带宽与默认的三角核进行模糊断点回归。

含协变量的断点回归

rd lne randwin d, gr mbw(100) covar(i votpop black  blucllr farmer fedwrkr  forborn manuf  unemplyd union urban veterans)



5
2020暑假Stata课程

在学术圈如果是做应用计量(特别是横截面数据、面板数据),Stata是不二之选,因为不管是管理数据还是跑回归,实在太太太方便了。现在主流期刊的应用微观计量文章里面能用到的模型stata几乎都有,而且其中的绝大多数都是用stata做的。而且最大的优点是,简单! 

Stata 与 SPSS、SAS 并称为当今三大统计软件。与后者相比,Stata 体积小巧、简单易懂且功能强大。Stata 把 EViews, SPSS 的傻瓜式菜单和 SAS 的命令、编程完美结合起来,所以它一推出就受到了初学者和高级用户的普遍欢迎。Stata 不仅在统计方面功能齐全,其在计量分析领域更是有着深刻影响,以至于有人一言以蔽之:“ 关于学习 Stata 的意义,大家只需知道:目前,Stata 是计量经济学,特别是微观计量经济学的主流软件。






为了帮助小伙伴们快速掌握stata,我们特别推出2020年暑假stata学术提升计划!  
2020年暑假Stata初高级研讨班            
时间:2020年7月25日-7月28日(四天)  

学员福利: 一次报名学习未达目标者,可以再次申请线上免费学。更多福利请继续阅读!零基础的小白,文科生,再也不担心自己学不会了,不给自己撤退理由!
   
   




     

截至目前,计量经济学服务中心已经在西安、北京、上海、广州等地成功举办了14场stata初高级班,由于种种原因,很多学员一直想学却没有学,2020,给自己一个勇敢的理由,一起来佩奇各种计量经济学学术技能。


学习优势:

重软件操作、重实战是课程一直以来的优势与好评。控制人数的小班教学以确保每一位学员真正学到操作技能。

理论与软件并重,手把手教学,零基础起步,小白也能学会的Stata研讨班!

重要的事情说三遍,我们课程手把手带大家操作学习,并提供完整do文档以及数据、讲义、资料书等,手把手教学和操作学习!


课程简要大纲:

零基础起步,高级计量及Stata应用远程班,采用线上的授课模式进行授课。以理论 软件 案例 操作 讲解答疑的模式,初级 高级课程,涵盖数据管理 横截面 时间序列 面板数据 门限回归 倾向匹配得分 空间计量等专题,帮助你建立系统的计量体系,具体内容如下:

Class 1. A Quick Tour of Stata

  • stata简介Why Stata?/what is stata

  • 软件界面The Stata Interface/What Stata looks like

  • 参考书籍推荐Textbooks

  • log工作日志和do文档What to do first?Set a working directory/Keeping track of things(Do-files and log-files )

  • 命令以及帮助the command & Getting Help(包括help的使用以及ssc install 、findit等外部命令获取和使用)

Class 2. DATABASE MANIPULATION数据管理

  • 导入导出 Import and Export

  • 面板数据、时间数据、官方数据Time series data &Panel data & Example Datasets

  • 变量以及数据Variable and data types/Indicator or data variables

  • 数据管理Data management

  • 排序Order, aorder, and move

  • 变量标签Variable Labels and Notes

  • 文字变量处理之数据类型转换Converting strings to numerics and vice versa(encode 、decode、 destring、 tostring 等)

  • 数据横向合并和纵向合并Append and merge(merge,包括一对一、一对多、多对一等合并,append、cross、joinby等,)

  • 数据生成Generating new variables

  • 描述分析Describing the data (summarize)

  • 基础命令Basic commands(table tabulate)

  • tabstat命令

  • CSMAR及中经网数据库复杂的使用技巧

Class 3. 相关分析Correlation analysis(相关分析简介、相关命令corr、pwcorr、pwcorr_a等应用介绍、分析结果输出等)

Class 4.  回归分析Estimation

  • 线性回归模型估计方法OLS

  • 回归估计标准流程应用讲解估

  • 估计系数统计推断

  • 假设检验(多重共线性、自相关、异方差等)

  • Stata与Word、Excel结合的估计结果输出等

  • 主题范文讲解

Class 5. 时间序列

  • 平稳性检验

  • 协整检验

  • 格兰杰检验

  • 课程总结以及论文讲解

Class 6&7. 静态面板与动态面板数据

  • 面板数据描述性分析

  • 面板数据平稳性检验

  • 静态面板数据回归分析:随机效应模型和固定效应模型、Hausman检验

  • 动态面板模型

Class 8. 门限回归

  • 包括横截面与面板模型的门限回归,主讲xthreg、xtthres、threshold等命令,并与Eviews软件对比,让大家对门限回归有一个全面的了解。

  • 门限回归理论介绍

  • 门限回归操作流程图

  • 门限回归操作以及结果解释等

  • 论文讲解以及课程总结

Class 9. 内生性问题专题I:倾向匹配得分

  • 倾向匹配得分简介、为何使用 PSM ?、传统的配对方法、配对过程中的两个核心问题、匹配方法、优缺点

  • 倾向匹配得分建模流程图

  • PSM操作命令及其具体应用

  • 论文讲解

  • 课程总结

Class 10. 内生性问题专题II:合成控制法

Class 11. 结果输出Extracting results

  • Post summary statistics(summarize、tabstat)

  • Post correlation coefficients (pwcorr、correlate、logout )

  • Coefficients/equations

  • Basic syntax and usage

  • estout、esttab、estadd and other useful Stata commands

  • Standard errors, p-values, and summary statistics

  • Use with Word/Rtf/Excel/LaTeX

  • Other Advanced Examples(esttab、outreg2、logout等)

Class  12. 经济金融数据库(国泰安数据库、中经网)使用技巧

Class  13. 论文写作专题(从源头数据处理到分析)

Class  14. 空间计量经济学模型(横截面空间计量模型与面板空间模型,包括空间自相关检验、空间效应检验、SAR、SEM模型以及空间面板随机与固定效应检验等)

  • 空间计量发展概述

  • 空间回归模型动因

  • 空间效应

  • 空间权重矩阵

  • 空间相关性度量

  • 空间计量模型简介、流程图、识别检验、判别准则等

  • 横截面空间计量模型及stata应用

  • 面板空间计量模型及stata应用(面板固定效应与随机效应等检验)

Class  15. 空间计量经济学及Stata应用(包括基于stata16的空间数据汇总、空间设定、权重矩阵创建、estat moran、横截面以及空间计量模型等)

远程学员礼包:

1,课程互动以及微信群等答疑;

2,学术学习资料大礼包一份;

3,课后赠送三个配套精品课程视频:《零基础学空间计量:空间计量及Geoda、stata应用》 初级班视频《零基础学stata,让每一个文科生都成为计量高手》 高级班视频《高级量化回归分析:让每一个文科生都能学会回归分析》,全网累计1000人订阅,价值1000元;

4,一次报名学习未达目标者,可以再次申请线上免费学。后续相同课程现场班可以五折优惠参加。

立体化的服务体系,真正保障学有所成!

1、系统化的知识体系。14场线下班成功举办的经验积累,知识点精细,学习成长路径更放心;

2、在线直播。授课以直播形式,能够及时答疑,互动性更强,感受线下课堂学习氛围

3、学习保障。一次报名学习未达目标者,可以再次申请线上免费学。

4、课后答疑。有学习上的疑问,可与老师1对1沟通解答。

5、零基础起步,理论与软件并重,手把手教学,小白也能学会的计量班。

课程详情:

远程班形式:远程在线直播,实时互动,一共4天

开课时间:

2020年7月25日-7月28日(四天)

参会人数:限额60人,报名成功与否以实际付款为准,不接受口头报名。

价格:原价4000元 /3600元 (学生价,仅限全日制本科生和硕士在读);

授课形式:老师讲授指导、学员操作练习、线上答疑解惑。

课程资料:提供PPT、课程讲义以及完整的do文档等。


优惠信息:

缴费成功后都享受如下优惠

1.同一单位3人以上报名,9折优惠;

2.同一单位5人以上报名,8折优惠(前2项优惠不能叠加)


学习目标:

1、掌握计量经济学及Stata操作,能够运用Stata完成复杂的数据处理工作,并熟练运用Stata完成写作;      
     

2、了解常用模型的思路、原理和建模方法,从源头数据库等数据下载、搜集、整理、管理,到stata数据操作,培养数据分析能力;

3、通过中心精心准备的do文档讲义来完成学习,并实现do文档中现成命令的可复制性(只需要修改部分do文档命令的变量,就可以一键实现数据分析和数据管理的结果,具有复制性),然后根据相关计量经济学知识学习,能够独立完成计量经济学模型建模以及实证分析!


学习对象:

经济及社科类青年教师、博士生、硕士生、高年级本科生。(1 Stata爱好学习者。2  经济管理以及人文社科领域人员、各类市场调查公司、咨询公司、互联网公司和科研机构需要进行数据处理的人士。)  

报名咨询方式:

支持网络付款以及对公转账

报名流程    

1、电话咨询,给予反馈,确认报名信息。

2、交费(微信、支付宝或者对公转账等),报名前请确认信息。

3、开课前发送培训通知以及软件准备,电子版预习资料等。

4、开课后领取发票及邀请函。 

支付方式:

对公转款(转款时务必在摘要中注明姓名学校和联系方式) 

开户名:陕西经纶教育科技有限公司 

开户行:招行西安科技路支行 

银行卡号:129909261610116

网络付款:扫描下方二维码立即报名哦

▲(学生价)扫码报名

▲(教师)扫码报名

相关单位:

主办方:计量经济学服务中心

协办方:陕西经纶教育科技有限公司

            西安造梦信息技术有限公司


注意事项:

1、即日起接受报名,具体报名截止日期根据实际招生而定,人员招满将关闭报名通道。

2、如人数满20人,即可开班;若报名人数不够20人,本次训练营自动取消,学员所缴纳报名费全额返还。

3、如您报名后有事不能参加,请及时告知!2020年6月15日17:00之后不再接受退费,但可以转其他时间段下次免费学习。

4、本次会议可提供增值税普通发票,如需开具(请联系微信:Xindream1992),并根据自己单位财务部门要求填写抬头和类目信息(一旦开具不能重开),发票类目为:会议服务费、信息服务费、培训费、会议费、咨询费等,报名时可以直接任选其一,其他类目无法开具。

5、会议邀请函通知及报名咨询等直接联系王老师。请学员自己网络搜索下载stata15.0/16.0。本次会议最终解释权归计量经济学服务中心所有。

在线咨询:

王老师

电话:18710973211

微信:Xindream1992

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
疫情期计量课程免费开放!面板数据, 因果推断, 时间序列分析与Stata应用
掌握高级计量经济学的核心方法及Stata操作_陈强老师主讲
一分钟看完计量经济学!!!------开学后的计量笔记
大咖周末聊|陈强老师来了!对!他来了!(下)
面板门限回归(xthreg)
关于学习计量经济学的一点(a little)经验
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服