Python + Selenium +Chrome 批量下載網頁代碼修改【新手必學】

本文轉載自查看原文 2020-02-16 17:29 970 Python

Python + Selenium +Chrome 批量下載網頁代碼修改
主要修改以下代碼可以調用本地的 user-agent.txt 和 cookie.txt
來達到在登陸狀態下批量打開並下載網頁，以網頁 ID 來保存為網頁文件名

PS:很多人在學習Python的過程中，往往因為遇問題解決不了或者沒好的教程從而導致自己放棄，為此我建了個Python全棧開發交流.裙：一久武其而而流一思（數字的諧音）轉換下可以找到了，里面有最新Python教程項目可拿,不懂的問題有老司機解決哦，一起相互監督共同進步

導入 webdriver

from selenium import webdriver

讀取本地文件中的 URL 鏈接

address = ‘./url.txt’
fp = open(address, ‘r’)
lines = fp.readlines()
print (‘【URL 鏈接】:% s’, lines)

調用環境變量指定的 PhantomJS 瀏覽器創建瀏覽器對象

driver = webdriver.PhantomJS()

driver = webdriver.Chrome()

如果沒有在環境變量指定 PhantomJS 位置

driver = webdriver.PhantomJS(executable_path=”./phantomjs”))

for data in lines:

get 方法會一直等到頁面被完全加載，然后才會繼續程序，通常測試會在這里選擇 time.sleep (2)

driver.get(data)

向下滾動 10000 像素

js = “document.body.scrollTop=10000”

js=”var q=document.documentElement.scrollTop=10000”

執行 JS 語句

driver.execute_script(js)

查看頁面快照

driver.save_screenshot(“csdn.png”)

print (‘執行中。。。’)

關閉瀏覽器

driver.quit()
print (‘執行結束。。。’)

關閉文件流

fp.close()

總結：有很多人在學習Python的過程中，往往因為遇問題解決不了或者沒好的教程從而導致自己放棄，為此我建了個Python全棧開發交流.裙：一久武其而而流一思（數字的諧音）轉換下可以找到了，里面有最新Python教程項目可拿,不懂的問題有老司機解決哦，一起相互監督共同進步
本文的文字及圖片來源於網絡加上自己的想法,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯系我們以作處理。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 用Python給頭像加上聖誕帽，新手必學 Python自動輸入【新手必學】學習Python的正確姿勢，新手必學 Python 3.8 新功能【新手必學】使用Python批量更新服務器文件【新手必學】 Python棧溢出【新手必學】新手程序員必學的代碼編程技巧 2020最新Python 爬蟲入門實戰項目，新手必學 Python學習筆記—自動化部署【新手必學】 Python爬蟲之cookie的獲取、保存和使用【新手必學】