一、安裝selenium
二、下載谷歌瀏覽器驅動
1、去http://chromedriver.storage.googleapis.com/index.html下載chromedriver.exe(根據chrome的版本下載對應的)
2、將下載好的chromedriver.exe解壓后放到指定目錄
三、安裝圖片文字OCR識別-tesseract-ocr4.00.00
1、軟件下載網址https://github.com/tesseract-ocr/tesseract/wiki/4.0-with-LSTM#400-alpha-for-windows
選擇4.0.0-alpha for Windows下面Windows Installer made with MinGW-w64 from UB Mannheim,點擊UB Mannheim進入另一網頁。
2、進到網址:https://github.com/UB-Mannheim/tesseract/wiki
點擊tesseract-ocr-setup-4.0.0-alpha.20170804.exe,下載4.0版本的軟件
根據系統版本不同下載32位或64位的版本
3、找到下載的文件,單擊安裝
4、記住安裝路徑:
5、復制安裝地址D:\Program Files (x86)\Tesseract-OCR 添加到系統環境變量中。
進入控制台輸入tesseract -v進行測試安裝成功與否
四、安裝pytesseract
以上都做好后,開始安裝pytesseract ,進入DOS環境輸入:pip install pytesseract進行安裝
安裝成功:
五、編寫python代碼
未完待續。。。。。。