- Excel下,數據-獲取數據-自網站輸入網站,即可選擇想要抓取的數據。
- 抓取數據要定期更新,可以找到刷新-鏈接屬性,設置刷新頻率。
- 數據抓取需要網頁自帶表格,無表格則要用爬蟲工具或更深入知識。
獲取豆瓣電影
使用excel爬取豆瓣網 https://movie.douban.com/coming 即將要上映電影的數據,並快速將數據保存到excel單元格中。
點擊“數據-獲取數據-自其他來源-自網站”或者直接點擊"數據-自網站"。
獲取股票實時行情
這次要獲取股票實時行情數據 http://q.10jqka.com.cn/
相比獲取豆瓣要上映電影有點不一樣,獲取股票實時行情需要每一分鍾都要自動更新數據。
同理我們和獲取豆瓣電影即將上映電影數據操作一樣
將股票實時行情數據保存在excel數據表格中后,右擊表格,可以看到表格中有個"刷新"按鈕。可以通過點擊"刷新"使excel重新獲取網頁上的表單數據。(學習的時候是晚上十點多,已經收市,點擊刷新表格數據沒有發生變化)
可以通過"數據"-"全部刷新"-“鏈接屬性”-"查詢屬性",設置excel自動刷新表單頻率,就可以實現excel自動刷新表單上的數據。
對比excel和爬蟲一樣的編程語言去爬取網站內上數據,excel有一個比較大的缺點,excel只能爬取網站上表格類型的數據,不能爬取結構化的數據。