python的selenium如何下載pdf文件


1.近期下載一些數據,涉及到pdf文件,因一些原因,需要用到selenium,希望不是在瀏覽器中打開pdf,而是下載這個文件

chromedrive.exe版本要匹配你當前的chrome瀏覽器版本(https://npm.taobao.org/mirrors/chromedriver/)

# -*- coding: utf-8 -*-
import time
import re
import io
from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains

import sys
reload(sys)
sys.setdefaultencoding("utf-8") 

option = webdriver.ChromeOptions()
option.add_experimental_option("excludeSwitches", ['enable-automation'])
option.add_experimental_option('prefs',  {
    "download.default_directory": "D:\\edesk\\outtask\\AIopt\\AIOPTjiaofu\\lunwen",
    "download.prompt_for_download": False,
    "download.directory_upgrade": True,
    "plugins.always_open_pdf_externally": True  #這句配置很重要
    }
) 
driver = webdriver.Chrome(chrome_options=option)  
wait = ui.WebDriverWait(driver,20)


driver.get("https://xxxxx1-s2.0-S2095495621000383-main.pdf") 
time.sleep(10)
driver.set_window_size(width=1000, height=800, windowHandle="current")
flag = False
if not flag:
    #可以手動輸入一次密碼,后面訪問均有cookie
    raw_input('login:')
print "login!!!"
time.sleep(10) 
driver.get("https://xxxxx1-s2.0-S2095495621000383-main.pdf") 
time.sleep(20)  
print "download!!!"
driver.quit()

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM