原文:使用java爬取國家統計局的12位行政區划代碼

前言: 本文基於j ee的原始url進行都寫,解析指定內容時也是使用很傻的形式去查找指定格式的字符串來實現的。 更優雅的方式是可以使用apache的HttpClient和某些文檔模型將HTML字符串構建成doc來進行解析。 目前已經修改代碼適配最新的 年的抓取。 爬取的原因:統計局網站提供的頁面並按照:省 市 縣 鎮 村 這樣的層次關系來組織頁面,人工去獲取所有的代碼工作量大而繁瑣,遂有了下面很粗 ...

2014-01-23 09:50 12 5632 推薦指數:

查看詳情

國家統計局2020年行政區划分數據

參考:https://blog.csdn.net/qlx119/article/details/105289974 在MySQL中創建tab_citys數據表: 創建xzqh.py的pyton腳本: 如果提示缺少相應的庫,可以使用pip進行安裝: pip ...

Fri Jan 08 17:32:00 CST 2021 0 706
一下國家統計局行政區划代碼C#

目前NBS上有2015-2018四個年度的代碼信息,寫一個控制台程序一下縣級行政區下的代碼使用HttpWebRequest+HttpWebResponse獲取html,使用HtmlAgilityPack類庫解析HTML。 使用POST請求,請求頭帶Cookie信息,否則會被反機制擋死 ...

Mon Apr 15 01:08:00 CST 2019 0 1128
使用C#獲取統計局行政區划代碼

統計局官網提供了每年最新的PAC代碼,方便大家查詢,但沒有提供完整版的下載,於是"手工"把它復制下來了。 http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/ 此工具有兩個關鍵點: 1、Get函數中要注意編碼問題,要去讀取它是什么編碼方式 ...

Sun Dec 20 03:59:00 CST 2020 0 360
抓取國家統計局全國區划代碼

最近工作中需要用到全國區划代碼,感覺國家統計局提供的數據比較權威,而且也算比較新(截止到2014年10月31日),所以打算把這些數據抓下來。 這是國家統計局提供的查詢頁面:http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2014 ...

Sat May 14 00:11:00 CST 2016 0 3211
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM