云端课程重磅来袭,
突破空间障碍,
学习随心所欲,
内容更丰富,
服务更贴心,
价格更亲民,
Stata编程技术训练营报名啦!!!
爬虫俱乐部将于2020年7月11日至14日在线上举行Stata编程技术7月训练营,课程全部采用最新版Stata16软件(提供Stata16试用版,试用期一个月)进行教学,课程通过案例教学模式,旨在帮助大家在短期内掌握Stata的基本命令、编程、数据处理以及结果输出等技术,同时针对最新版Stata中的实用新功能也会做出详细介绍,包括框架功能(frame:读入多个数据集)等等。专题式的讲解使你能在短时间内掌握Stata的精髓,精选的实例和详实的配套资料能让你在课后快速拓展所学,并能够编写一些实用的Stata程序,为进一步学习和科研打下扎实的基础。同时,此次云端课程提供录播,提供线上答疑。
自创立以来,本团队开发了多个便捷高效的Stata命令,如cntrade、cnintraday、cnar等可以让用户快速获取中国股票日交易、日内分时数据、中国上市公司财务数据;chinagcode和chinaaddress实现了中文地址和经纬度的相互转换,reg2docx、t2docx、sum2docx和corr2docx使结果输出更加简洁,subinfile让网页内容分析和内容抓取异常简单……同时,团队也培养了众多优秀学生,向香港大学、香港理工大学、香港岭南大学和澳门大学等知名高校输送了一批高质量的研究助理,包括薛原、徐鑫、刘贝贝、李子健、赵一、周鹏、司海涛、张计宝、宋凯、潘铖等。由于技术精湛和工作勤奋受到用人单位的一致称赞。
迄今,武汉字符串数据科技有限公司已开展近20期线下培训活动,曾应邀在武汉大学、华中科技大学、厦门大学、中央财经大学、中南财经政法大学、西南财经大学、石河子大学、兰州财经大学、华中农业大学、郑州大学、新疆财经大学、西南政法大学、河南大学、长沙理工大学、南京信息工程大学、福州大学、华侨大学、湖北大学和湖北经济学院等高校举办Stata编程培训与实证研究方法分享,场场爆满座无虚席。
我们会继续努力,以培养学生、技术研发为己任,在少量盈利的基础上,努力将公益事业做好,传播实证技术和数据分析方法、开发数据分析的工具等,造福于学术界!
授课老师简介
李春涛:香港大学博士,中南财经政法大学金融学院教授、博士生导师;主要研究领域是公司治理和企业创新,在《经济研究》、《管理世界》、《中国工业经济》、《金融研究》、《会计研究》、Stata journal、Journal of Comparative Economics等主流期刊上发表学术论文50余篇。李老师是Stata统计软件的资深用户,有20多年的Stata编程经验,他有十多名学生正在或曾经在海外名校从事研究助理工作。
薛原:曾任香港大学经济金融学院研究助理,现为华中科技大学管理学院博士生,香港岭南大学研究助理,爬虫俱乐部资深成员,擅长Stata和Python编程及网络爬虫技术。与李老师合作开发了cnar、cngcode、cnaddress、cnintraday、cnstock、subinfile、reg2docx、sum2docx、wordconvert等重要命令,实现了中国上市公司数据的命令化模块下载、中文地址与经纬度之间的转换,实证结果的格式化集成输出等。曾在《金融研究》等国内顶级期刊发表过论文,并有文章被《Stata Journal》接收。
闫续文:爬虫俱乐部资深会员,中南财经政法大学金融学院博士生(申请审核),曾任香港岭南大学海外研究项目研究助理。擅长Stata编程、数据处理及网络爬虫技术,长期讲授结果输出方法。在《中国工业经济》、《财政研究》发表学术论文两篇。
课程大纲
第一部分:数据读入与Stata16的多框架数据系统
1) 熟悉界面
2) 多框架系统的基本原理
3) 读入多个数据
4) 寻求帮助(在线帮助、搜索帮助等)
5) DOS命令(cd、dir、erase、rm、shell等)
6) shellout调用其它系统应用
7) copy命令(文件操作、网页源代码获取等)
8) Stata常用30个命令介绍
9) 日期定义(日期格式设置、日期函数等)
10) 函数(字符串函数、随机函数、编程函数等)
11) egen函数与常见统计量
12) txt、csv、excel等格式文件读入
13) Wind交易数据整理案例
14) 基金经理变更数据整理案例
第二部分:宏与循环
1) local与global概念与基本操作
2) 宏扩展函数
3) while、foreach、forvalue循环
4) 跳出循环的continue 和continue, break
5) 批量处理多个目录下的多个文件(fs命令)
6) 批量处理多个变量的多个取值(levelsof命令)
7) 读入Excel文件的多个sheet
8) NBER工作论文下载案例
9) 上交所年报抓取综合案例
10) 新浪财经公告信息抓取案例
11) CSMAR交易和财务数据整理案例
第三部分:数据库操作
1) 数据的纵向合并、横向合并与长宽变换
2) insobs增加观测值
3) expand
4) fillin
5) 工企数据库运用案例
6) Wind财务数据整理案例
7) 美国流行歌曲目录整理案例
8) 起死回生命令(preserve与restore)
9) CSSCI期刊目录整理案例
10) label命令介绍
11) labelsof、label 的宏扩展函数
12) 字符串处理(关键词、替换、提取等)
第四部分:Post命令
1) Stata 16之前的post命令工作原理
2) 定义post
a) 找朋友的案例
3) 用post计算股价同步性和Beta
4) 基于网络数据的事件研究
5) 股本变更数据整理案例
6) Frame post的工作原理
a) 使用frame计算同步性
b) 使用frame实现事件研究
c) 使用frame link替代merge
d) 使用多框架frame 替代事件研究中的矩阵
e) 使用frame 替代 preserve restore
第五部分:回归分析及结果输出
1) putdocx命令输出内容至word文档
a) 编辑docx文件中的文字内容
b) 输出并编辑表格内容
c) 输出内存中的list结果
d) 输出矩阵
e) 输出绘图
2) putdocx命令相关案例
a) 输出十进位制下的汉字unicode编码
b) 结合常用汉字生成随机汉字组成的段落
c) 爬取并输出陕西省人大代表信息
d) 添加footnote
e) 横页(Landscape)和竖页(portrait)交替出现
f) 添加段落
g) 从文本文件中添加内容
3) 实证结果输出
a) 描述性统计信息:sum2docx
b) 分组均值t检验:t2docx
c) 相关系数矩阵:corr2docx
d) 回归结果:reg2docx
4) 实证结果输出完整展示
第六部分:网络数据
1) 上市公司公告的抓取
2) 上市公司高管任职信息抓取
3) 深交所信息披露考评数据抓取
4) 港股交易数据抓取