具體代碼丟了
思路如下:
- 所需工具:Python、VBA、Arcgis、高德地圖API
- 數據來源:不記得了,之前爬過盛名火車站的,但是查了下,並不全。
- 數據日期:這里的火車數據更新截止到2018-7月,可能以后還有新的火車站建設,有需要再搞
- 數據總量:100W+吧,沒仔細數
在相關網站上把各省各地的火車數據爬取下來,我爬完后是這個樣
再通過一段VBA代碼整理了一下,變成如下這樣
可以具體到各地到各地的火車數據了,要克服的困難有:將上面的數據做成數據透視表的時候
數據透視表會按拼音順序排列,這樣的排列出來的火車數據是錯誤的,我想到的辦法是在
火車車站名前加上1 、2、3這樣的數字,便可解決。最后去掉即可
共有將近80W,還是挺多的
有了全國各地到各地的火車數據還不夠
我還想把各地到各地的火車數據轉化成各市到各市的
這里要用到一個叫Arcgis的地圖工具
在這之前需要將各地的火車站轉換成高德地圖坐標,高德地圖API提供了這么一個功能
用Python寫一段代碼即可實現,自己可以去高德地圖開發者平台看看,挺簡單的,不寫具體的了
完成后如下:
接着在放到Arcgis里面操作
說實話,這個Arcgis自己琢磨了一天才會弄,有點無語,但是挺好用,蠻神奇
這里只列了高鐵的數據,高鐵的車型號一般為:G D C
以下就是各城市到各城市的高鐵數據了
然后就完成了
數據列表如下:
- 全國火車及高鐵車次源數據
- 全部火車車次匯總
- 高鐵車次源數據(就是把第一個sheet數據里的G D C車型的給提煉出來)
- 高鐵車次匯總
- 城市-城市 的高鐵源數據
- 城市-城市 高鐵車次匯總
- 各高鐵站經緯度(火車站也有)
共計應該有100W+吧
19.7.11更新
打算爬今年的數據了,其實不難的,按照步驟一步步來就okay了
加微信公眾號:AInnee
(第二個字母是大寫的i)發送“高鐵數據+你微信號”,后台會加你並免費發你數據哦。