利用后裔采集器快速采集文本数据(以京东为例)


1.对于列表类型的网页

对于有分页功能的网页,要抓取列表中的数据,可以点击“自动识别”,软件会尝试自动识别列表。

如果自动识别效果不符合您的要求,您可以通过“手动点选列表”来修改识别结果

手动点选列表的操作步骤如下:

第一步:点击“手动点选列表”的选项

第二步:点击网页中列表的第一行的第一个元素

第三步:点击网页中列表的第二行的第一个元素

2.出现未提取到有效数据的问题处理方法

解决方案:

首先进行预处理,需要先进行一步点击操作

技巧:点击查看网页

参考文献:
http://www.houyicaiji.com/?type=post&pid=888

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM