01 UIPath抓取網頁數據並導出Excel(非Table表單)


上次轉載了一篇《UIPath抓取網頁數據並導出Excel》的文章,因為那個導出的是table標簽中的數據,所以相對比較簡單。現實的網頁中,有許多不是通過table標簽展示的,那又該如何處理呢,今天我就介紹如何導出這樣的網頁數據。這次我們選取的是網站是:https://www.51job.com/。

一、准備階段:

1、打開網站

2、在搜索中,輸入需要查找的關鍵字,這里我查找的條件是“Java開發工程師+成都”,進入的頁面如下:

3、通過F12,我們可以看到,這里數據展示用的並不是table表單。

因此我們要換一種方式來獲取此類的數據。

4、打開uipath,新建一個項目Get51JobData。

二、核心步驟:

1、點擊菜單中的“數據抓取”圖標。

2、點擊“下一步”,選擇圖中框選部分。

注意:因為不是表單,所以不能直接選取一行。而且選取一行還可能會出問題。

3、這時進入一個新的界面:

在這一步驟中,繼續點擊“下一步”。

4、選擇同列的其它項,注意此外不能選擇其它列。

此時選中的情況如下:

5、“數據抓取”界面如下:

在這里根據自己的需求修改相應的信息:

6、然后點擊“下一步”,進行預覽數據界面。

在此界面若是有疑問,可以點擊“返回”進行修改。

在本界面中,最大結果條數,可以自行修改。

7、若是只提取這些數據,可以點擊“完成”,就可以了,此處我們把相關的數據都進行提取,點擊右下方的“提出相關數據”,繼續進行提取,這次提取的是公司名稱。

8、選擇公司名稱

選擇后,會出現一個同選取“職位名”一樣的界面,

我們按上面的操作,點擊下一步;

 

9、進行第二個選擇

​10、提取向導出現和第一個選擇類似的界面,

11、在界面中修改相關信息

12、點擊“下一步”,再次進行預覽界面:

​可以看到,公司名已經提取,因為這次沒有選擇提取URL,所以也就沒有相關的URL數據了。

 

13、按照上面的步驟,繼續選擇“工作地點”、“薪資”、“發布時間”等等列。

14、最終選擇的預覽數據如下:

此處,我提取100條。然后點“確定”。

15、彈出獲取多面數據的提示:

點擊選擇 “是”,在頁面有那么多數據的情況下,會為你提取到足夠的數據。

16、完成之后的界面如下:

17、對於抓取條數及相關其它參數,可以在如下圖所示的右邊進行設置。

三、其它操作

1、寫excel文件,拖入一個“寫入范圍”的控件

2、進行相關設置:

3、設置excel寫入時,設置寫入表頭。

4、運行剛剛寫完的工程

 

5、最后生成的結果:

 

結語:

若是大家在操作的過程中,遇到什么問題,可以在評論區給我留言。 也可以關注我的微信公眾號:IT人的成長

 

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM