中国银行业竞争数据爬虫

 数据采集     |      2018-12-13 15:59
 
 
 

项目简介

 
 
 

   
关于金融市场或者银行的研究,往往需要了解一个地区银行业竞争的程度,可能用到的指标包括人均银行分支机构的数量、前五大银行分支机构数量占比的赫芬达尔指数、是否存在外资银行和是否有外地城商行(农商行)分支机构入住等。计算这些指标的前提是了解每年年末的银行分支机构数量。目前尚没有公开的机构数量统计数据,更没有年么银行分制机构列表,但是银监会公布了每一个银行分支机构批准设立的具体信息,比如2018年9月9日,黑龙江省银监局批准设立了中国工商银行股份有限公司哈尔滨爱建支行,相关的信息通过如下的网页公布:

   http://xukezheng.cbrc.gov.cn/ilicence/showLicenceInfo.do?state=3&id=00712910  

每一个机构退出也会在该网站公布,比如花旗银行(中国)有限公司上海徐家汇支行,于2018年9月7日退出,相关公告见如下网页:

http://xukezheng.cbrc.gov.cn/ilicence/showLicenceInfo.do?state=7&id=00187537

根据机构设立和退出的时间,我们可以计算出每个银行分支机构存续的时间,这可以借助于Stata的post命令实现。

但是要根据上述数据计算每个地区年末的分支机构数量,或者给每个分支机构确定一个所在的地区,则需要对每个分支机构的地址进行分析。对于后期的公告,每个机构所在的地市已经给出,但是所在的县区则需要进行地址分析。这需要我们借助于中国行政区划数据库和正则表达式来实现。