利用后裔采集器快速采集文本數據(以京東為例)


1.對於列表類型的網頁

對於有分頁功能的網頁,要抓取列表中的數據,可以點擊“自動識別”,軟件會嘗試自動識別列表。

如果自動識別效果不符合您的要求,您可以通過“手動點選列表”來修改識別結果

手動點選列表的操作步驟如下:

第一步:點擊“手動點選列表”的選項

第二步:點擊網頁中列表的第一行的第一個元素

第三步:點擊網頁中列表的第二行的第一個元素

2.出現未提取到有效數據的問題處理方法

解決方案:

首先進行預處理,需要先進行一步點擊操作

技巧:點擊查看網頁

參考文獻:
http://www.houyicaiji.com/?type=post&pid=888

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM