全國火車高鐵站及車次數據爬蟲(內含100W+數據,免費領取!)


具體代碼丟了

思路如下:

  • 所需工具:Python、VBA、Arcgis、高德地圖API
  • 數據來源:不記得了,之前爬過盛名火車站的,但是查了下,並不全。
  • 數據日期:這里的火車數據更新截止到2018-7月,可能以后還有新的火車站建設,有需要再搞
  • 數據總量:100W+吧,沒仔細數

 

在相關網站上把各省各地的火車數據爬取下來,我爬完后是這個樣

再通過一段VBA代碼整理了一下,變成如下這樣

可以具體到各地到各地的火車數據了,要克服的困難有:將上面的數據做成數據透視表的時候

數據透視表會按拼音順序排列,這樣的排列出來的火車數據是錯誤的,我想到的辦法是在

火車車站名前加上1 、2、3這樣的數字,便可解決。最后去掉即可

共有將近80W,還是挺多的

有了全國各地到各地的火車數據還不夠

我還想把各地到各地的火車數據轉化成各市到各市的

這里要用到一個叫Arcgis的地圖工具

在這之前需要將各地的火車站轉換成高德地圖坐標,高德地圖API提供了這么一個功能

用Python寫一段代碼即可實現,自己可以去高德地圖開發者平台看看,挺簡單的,不寫具體的了

完成后如下:

接着在放到Arcgis里面操作

說實話,這個Arcgis自己琢磨了一天才會弄,有點無語,但是挺好用,蠻神奇

這里只列了高鐵的數據,高鐵的車型號一般為:G D C

以下就是各城市到各城市的高鐵數據了

然后就完成了

數據列表如下:

  • 全國火車及高鐵車次源數據
  • 全部火車車次匯總
  • 高鐵車次源數據(就是把第一個sheet數據里的G D C車型的給提煉出來)
  • 高鐵車次匯總
  • 城市-城市 的高鐵源數據
  • 城市-城市 高鐵車次匯總
  • 各高鐵站經緯度(火車站也有)

共計應該有100W+吧

 

19.7.11更新

打算爬今年的數據了,其實不難的,按照步驟一步步來就okay了

加微信公眾號:AInnee

(第二個字母是大寫的i)發送“高鐵數據+你微信號”,后台會加你並免費發你數據哦。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM