背景
爬取數據的過程中難免遇到登錄的問題,為了繞過登錄,保存cookie是常見的的解決方法.在遇到有驗證碼的問題時,無疑增加了獲取cookie的難度.該python包,解決你的實際問題,避免了購買雲打碼或者自己搭建機器學習,訓練模型的過程,話不多說,直接進入主題.
環境要求
目前已經支持python3.8以下的了,python3.8以上毫無問題。
調用方法
pip install ddddocr
如何使用
import ddddocr
ocr = ddddocr.DdddOcr()
with open('test.png', 'rb') as f:
img_bytes = f.read()
res = ocr.classification(img_bytes)
print(res)
參數說明
DdddOcr 接受兩個參數:
參數名 |
默認值 |
說明 |
use_gpu |
False |
Bool 是否使用gpu進行推理,如果該值為False則device_id不生效 |
device_id |
0 |
int cuda設備號,目前僅支持單張顯卡 |
classification參數:
參數名 |
默認值 |
說明 |
img |
0 |
bytes 圖片的bytes格式 |
我試了試很不錯,而且是cpu的情況下,幾毫秒返回結果。
我的驗證碼如下:

想要學習Python基礎知識的,掃描右上角二維碼關注作者的公眾號,回復"專輯"倆字.進行知識的獲取
