项目简介
衡量市场竞争的指标主要采取赫芬达尔指数,现有度量银行业竞争的方法主要使用省级层面的商业银行分支机构数目构造银行业竞争程度的指标,难以深入刻画相同省份内部的差异。我们采取中国银监会披露的全国所有商业银行分支机构的金融许可证查询信息来构造银行业竞争程度的指标,以期更好的刻画相同省份内各个地级市的银行业竞争程度。
项目计划
经过爬虫俱乐部技术核心团队的讨论,为了更准确、快捷的刻画银行业竞争程度,我们从数据结构分析、STATA软件编程、银行竞争指数刻画等多角度的处理银行业竞争数据。
首先,爬虫俱乐部成员对数据源进行深入了解,团队对中国银监会网站披露的商业银行分支机构的金融许可证信息的数据结构、变量信息的分析,了解数据信息包括所有银行每一家分支机构的批准成立时间、办公地点等信息。从1954年至今约有400多万条信息,手工整理相当耗时。基于此我们运用网络爬虫技术,寻找网址的规律,编写STATA程序,搜集所有商业银行的相关信息。其次,我们运用STATA的正则表达式提取办公地点所在省市以及强大的数据预处理功能,整理出年份—地级市的银行分支机构面板数据。最后,为了多维度的刻画地级市银行业竞争程度,我们参考了赫芬达尔指标的计算方法构造地级市内商业银行的赫芬达尔竞争指数。
除此之外,中国的金融体系以国有银行为主体,银行业竞争的加剧实际上也意味着国有银行垄断地位的削弱,因此市辖区内五大银行的分支机构数目占比刻画了银行业的垄断程度。我们也采取此方法度量银行业竞争程度。
项目结果
爬虫俱乐部技术团队准确的得到400多万条中国银监会网站披露的商业银行分支机构信息,并有效的运用赫芬达尔指数与国有银行垄断指数刻画银行业竞争程度,为学术研究与地区金融发展项目提供有力的数据支持。