食药监管局数据爬虫

 数据采集     |      2018-09-20 17:20

 

 
 
 

项目简介

 
 
 

        民以食为天, 优质的食品能够增进消费者福利(Hudson & Hudson, 2008), 劣质的食品却是疾病和死亡的根源。 美国统计数据显示, 仅 2011 年就有 12.7 万人因为不当饮食而住院治疗,其中 3037 人死于食品问题(Morris, 2011)。 对于中国,食品安全问题已经成为“久治不愈”的“顽疾”,成为与社会民生高度关联的转型期中国社会问题的一个缩影(刘瑞明等,017)。以 2008 年的三鹿“毒奶粉”(大头婴儿)事件为例,该事件造成至少 6 名婴儿死亡和9.4 万婴幼儿出现营养疾病甚至残疾 (Spencer, 2009)。

        毒奶粉的社会危害,远远不止是死亡、疾病或残疾,此后出现并且一直持续到今天的国人大量从香港、日本和澳洲等地抢购奶粉, 以及由此事迫使香港和澳洲政府出台限购奶粉政策的现象足以表明劣质食品巨大而深远的社会危害。 保障人民群众“舌尖上的安全”, 给老百姓一个满意的交代,已成为摆在中国政府面前的重要任务之一,是对党执政能力的重要考验(习近平, 2013)

        缺乏反映食品质量的微观数据是目前量化食品安全研究的难点。 本项目试图运用网络爬虫技术挖掘国家和省级食药监局的抽检报告信息,刻画食品企业的产品质量, 为食品安全的量化研究开辟了一条新的通道。为此,我们通过Stata编程,抓取国家食品药品安全监督管理总局数据中心的国家和各省食品抽检结果数据共计150万余条。抽检合格产品数据包括标称生产企业名称、标称生产企业地址、被抽样单位名称、被抽样单位所在省份、食品名称、规格型号、生产日期、分类、公告日期等信息。抽检不合格产品数据包括标称生产企业名称、标称生产企业地址、被抽样单位名称、被抽样单位地址、食品名称、规格型号、生产日期、不合格项目、分类、公告日期、商标等信息。
        本数据为食品药品的相关研究开辟了一条全新的通道。