原文:使用java爬取国家统计局的12位行政区划代码

前言: 本文基于j ee的原始url进行都写,解析指定内容时也是使用很傻的形式去查找指定格式的字符串来实现的。 更优雅的方式是可以使用apache的HttpClient和某些文档模型将HTML字符串构建成doc来进行解析。 目前已经修改代码适配最新的 年的抓取。 爬取的原因:统计局网站提供的页面并按照:省 市 县 镇 村 这样的层次关系来组织页面,人工去获取所有的代码工作量大而繁琐,遂有了下面很粗 ...

2014-01-23 09:50 12 5632 推荐指数:

查看详情

国家统计局2020年行政区划分数据

参考:https://blog.csdn.net/qlx119/article/details/105289974 在MySQL中创建tab_citys数据表: 创建xzqh.py的pyton脚本: 如果提示缺少相应的库,可以使用pip进行安装: pip ...

Fri Jan 08 17:32:00 CST 2021 0 706
一下国家统计局行政区划代码C#

目前NBS上有2015-2018四个年度的代码信息,写一个控制台程序一下县级行政区下的代码使用HttpWebRequest+HttpWebResponse获取html,使用HtmlAgilityPack类库解析HTML。 使用POST请求,请求头带Cookie信息,否则会被反机制挡死 ...

Mon Apr 15 01:08:00 CST 2019 0 1128
使用C#获取统计局行政区划代码

统计局官网提供了每年最新的PAC代码,方便大家查询,但没有提供完整版的下载,于是"手工"把它复制下来了。 http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/ 此工具有两个关键点: 1、Get函数中要注意编码问题,要去读取它是什么编码方式 ...

Sun Dec 20 03:59:00 CST 2020 0 360
抓取国家统计局全国区划代码

最近工作中需要用到全国区划代码,感觉国家统计局提供的数据比较权威,而且也算比较新(截止到2014年10月31日),所以打算把这些数据抓下来。 这是国家统计局提供的查询页面:http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2014 ...

Sat May 14 00:11:00 CST 2016 0 3211
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM