北大法宝数据爬虫

 数据采集     |      2018-09-20 17:20



 
 
 

项目简介

 
 
 

       大数据时代的法学研究、法与经济学研究都严重依赖于数据的可得性。中国的判案文书数据无疑为法学、社会学、经济学等领域的研究提供了珍贵的素材。近年来涌现出了一批基于判案文书的研究,但是有关数据的获取却一直困扰着广大的学者。面对数千万条的判案文书数据,完全手工收集无疑是难以实现的。

受某某大学某位教授委托,爬虫俱乐部通过Stata编程,利用学校购买的北大法宝数据库,系统地收集某一类案件的判案文书,在不违背数据库使用原则的情况下,逐渐积累了2010-2016年间发生的全部故意杀人罪全部数据,故意伤害罪一审数据,共计46万余条数据。
 

       这些数据可以用来编制地区治安指数、法制指数等,利用这些数据,我们可以研究一个地方治安状况对其投资环境的影响,对其资产定价的影响等。