打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
CSMAR数据处理的常用技巧 |Stata应用

CSMAR数据库,相信很多金融、财会背景的朋友非常熟悉。本文的目的旨在帮助大家梳理CSMAR数据库常用的数据处理技巧,以飨读者。


1、如果我们的下载的格式是excel的话,那么我们可以使用如下的格式导入进Stata:


import excel using \path\file.xls,clear first


如果是股票价格或收益率数据,CSMAR通常会以多个excel的格式存取,通常来讲下载下来的变量名分别为:file,file1,file2...


我们可以采用如下的命令来批量读入:


forvalue i=1(1)n{

import excel using \path\file`i'.xls,clear first

save data`i',replace

}


import excel using \path\file.xls,clear first

save data,clear


use data,clear

forvalue i=1(1)n{

append using data`i'

}

save data,replace


2、财务数据变量的删减


(1)保留A股


A股股票的代码为0(深市A股、中小板)、6(沪市A股)、3(创业板)。


(2)提取年份\保留年报


gen year=real(substr(Accper,1,4))

gen month=real(substr(Accper,6,2))


大部分情况下,我们仅需要年度的财务指标。


keep if year==12


(3)保留合并报表(我们通常不需要母公司报表)


(4)缺失值处理


删除缺失值:drop if missing(var1 var2 var3 var4)


把缺失值处理成0:

foreach v of varlist var1 var2 var3 var4{

replace `v'=0 if `v'==.

}


(5)对主要的变量进行winsor处理


我们可以首先下载winsor2,ssc install winsor2


以1%截尾为例:winsor2 var1 var2 var3 var4, cut(1,99)


(6)批量命名变量


rename (a b c d) (var1 var2 var3 var4)


3、各个数据文件的匹配


通常来讲我们使用股票代码(stkcd)和(year)来匹配各个数据文件,假定我们有 a b c d e五个数据集,那么匹配的命令为:


use a,clear

foreach file in b c d e{

merge 1:1 stkcd year using `file'

drop _m

}

save newdata,replace


4、回归结果的导出


可以参见,我们之前的文章(stata技巧 | 如何优雅地做个回归?)。


后台不断有读者索要公众号推文Stata程序,考虑到人力有限,很难面面俱到。不妨请我们喝杯咖啡,我们也把先前的程序批量整理,统一发送。


先前包含Stata程序的文章有:


1、比特币,人民币汇率和套利 | Stata应用

2、基于财务指标的银行股轮动回测 | Stata应用

3、面板tobit模型的固定效应和随机效应|Stata相关

4、房价还会继续上涨吗?|Stata应用

5、Stata应用 | 如何进行量化策略回测?

6、Stata应用 | 新浪和微博被均衡定价了吗?


原文链接为我们的微店,所有Stata程序均已打包,售价为50元。如果您有意索要程序(codes为付款日以前所有的Stata程序),请在微店内付款,并留下您的邮箱地址。我们会在付款后的24小时内将程序发到您的邮箱。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
数据转置pro之sxpose2
猴子也能看懂的stata傻瓜入门教程
互助问答第12期:截面数据的控制变量选取
学长教你论文实证(14):stata数据合并
【更新版】Stata如何做1000次安慰剂检验(Placebo Test)?
reshape命令一文读懂!
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服