如何寫公式抓取網頁數據


您可能聽說過使用Python開發網頁爬蟲工具,但您可能不知道在表格中也能通過寫公式抓取網頁數據吧,今天我給大家分享一個GetTableByIdW()網頁抓公式。

下面以某網頁表格數據抓取為例,講解抓取過程。如下圖所示,需在表格中抓取圖片中紅框標注的表格數據,並每隔5秒鍾自動刷新一次。

 

第一步,查找表格id
使用谷歌瀏覽器打開網頁,找到表格任意一個單元格,右鍵,在彈出的菜單中單擊“檢查”,在彈出的窗體中,找到table標記的id屬性,本例中,id的值是flex_cb。

第二步,寫網頁抓取公式
在表格中寫網頁抓取公式=GetTableByIdW($B$1,$B$2)獲得表格的全部數據,當做數據源,用作進一步拆分。

 

第三步,設置循環抓取任務
使用打開Excel瀏覽器,設置循環網頁抓取任務。

 


第四步,拆分數據
網頁抓取公式返回的表格數據是純數據,每一行使用兩個分號隔開,每一個單元格使用一個分號隔開,如下圖所示。

 

寫公式=Split2Array($B$3,";;",C8),從源數據中按照兩個分號拆分行數據,其中C8表示行號,從0開始。

 

寫公式=Split2Array($D8,";",E$6),從源每行數據中按照分號拆分單元格數據,其中E$6表示單元格序號,從0開始。

 

寫好上述公式后,整行向下拖動公式,獲得整張表的數據。

第五步,自動刷新數據
在表格中任意一個單元格,寫公式=AutoRefresh(5),表示每隔5秒鍾重新計算一下當前表格中的公式,以便達到每隔5秒鍾自動刷新數據的目的。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM