上次轉載了一篇《UIPath抓取網頁數據並導出Excel》的文章,因為那個導出的是table標簽中的數據,所以相對比較簡單。現實的網頁中,有許多不是通過table標簽展示的,那又該如何處理呢,今天我就介紹如何導出這樣的網頁數據。這次我們選取的是網站是:https://www.51job.com/。
一、准備階段:
1、打開網站
2、在搜索中,輸入需要查找的關鍵字,這里我查找的條件是“Java開發工程師+成都”,進入的頁面如下:
3、通過F12,我們可以看到,這里數據展示用的並不是table表單。
因此我們要換一種方式來獲取此類的數據。
4、打開uipath,新建一個項目Get51JobData。
二、核心步驟:
1、點擊菜單中的“數據抓取”圖標。
2、點擊“下一步”,選擇圖中框選部分。
注意:因為不是表單,所以不能直接選取一行。而且選取一行還可能會出問題。
3、這時進入一個新的界面:
在這一步驟中,繼續點擊“下一步”。
4、選擇同列的其它項,注意此外不能選擇其它列。
此時選中的情況如下:
5、“數據抓取”界面如下:
在這里根據自己的需求修改相應的信息:
6、然后點擊“下一步”,進行預覽數據界面。
在此界面若是有疑問,可以點擊“返回”進行修改。
在本界面中,最大結果條數,可以自行修改。
7、若是只提取這些數據,可以點擊“完成”,就可以了,此處我們把相關的數據都進行提取,點擊右下方的“提出相關數據”,繼續進行提取,這次提取的是公司名稱。
8、選擇公司名稱
選擇后,會出現一個同選取“職位名”一樣的界面,
我們按上面的操作,點擊下一步;
9、進行第二個選擇
11、在界面中修改相關信息
12、點擊“下一步”,再次進行預覽界面:
13、按照上面的步驟,繼續選擇“工作地點”、“薪資”、“發布時間”等等列。
14、最終選擇的預覽數據如下:
此處,我提取100條。然后點“確定”。
15、彈出獲取多面數據的提示:
點擊選擇 “是”,在頁面有那么多數據的情況下,會為你提取到足夠的數據。
16、完成之后的界面如下:
17、對於抓取條數及相關其它參數,可以在如下圖所示的右邊進行設置。
三、其它操作
1、寫excel文件,拖入一個“寫入范圍”的控件

2、進行相關設置:
3、設置excel寫入時,設置寫入表頭。
4、運行剛剛寫完的工程
5、最后生成的結果:
結語:
若是大家在操作的過程中,遇到什么問題,可以在評論區給我留言。 也可以關注我的微信公眾號:IT人的成長