基於百度雲的OCR識別（Python）

本文轉載自查看原文 2019-07-05 23:27 1029 Python進階版

2019年7月3日早上，在百度AI開發者大會上，一個來自山西的青年，將一瓶礦泉水澆在了同樣來自山西的李彥宏身上。

可以回顧一下 https://b23.tv/av57665929/p1 ，着實讓人一驚，這么大的會議上既然讓人這么容易接近大佬。

（圖片來源網絡）

OCR識別准備工作

百度雲真的是測試接口的天堂，免費接口很多，當然有量的限制，但個人使用是完全夠用的，什么人臉識別、MQTT服務器、語音識別等等，應有盡有吧

看看OCR識別免費的量

第一步：

創建一個文字識別的應用，也就是向百度雲申請一個文字識別的用戶接口

第二步：

打開技術文檔，基本涵蓋了當今流行的編程語言

https://cloud.baidu.com/doc/OCR/s/ejwvxzls6/

第三步：

安裝OCR Python SDK，OCR Python SDK目錄結構

├── README.md
├── aip                   //SDK目錄
│   ├── __init__.py       //導出類
│   ├── base.py           //aip基類
│   ├── http.py           //http請求
│   └── ocr.py //OCR
└── setup.py              //setuptools安裝

支持Python版本：2.7.+ ,3.+

安裝命令：

在win10環境下通過cmd安裝后需要關掉當前cmd窗口，重新打開cmd窗口進行命令執行python程序方可正確實現

pip install baidu-aip

測試代碼

通用文字識別

from aip import AipOcr

#更換為自己的注冊信息
APP_ID = '---'
API_KEY = '---'
SECRET_KEY = '---'

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)#創建連接
fp=open("tu2.png","rb").read()#打開並讀取文件內容
res=client.basicGeneral(fp)#普通
#print(res)

#將所有的文字都合並到一起
strx=""
for tex in res["words_result"]:#遍歷結果
    strx+=tex["words"]#每一行
print(strx)#輸出內容

通用文字識別（高精度版）

from aip import AipOcr

#更換為自己的注冊信息
APP_ID = '---'
API_KEY = '---'
SECRET_KEY = '---'

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)#創建連接
fp=open("tu2.png","rb").read()#打開並讀取文件內容
#res=client.basicGeneral(fp)#普通
res=client.basicAccurate(fp)#高精度
#print(res)

#將所有的文字都合並到一起
strx=""
for tex in res["words_result"]:#遍歷結果
    strx+=tex["words"]#每一行
print(strx)#輸出內容

URL圖片地址方式

from aip import AipOcr

#更換為自己的注冊信息
APP_ID = '----'
API_KEY = '----'
SECRET_KEY = '-----'

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)#創建連接
url = "https://img2018.cnblogs.com/blog/1485202/201907/1485202-20190705210445649-2093672772.png"
res=client.basicGeneralUrl(url)#普通
#print(res)

#將所有的文字都合並到一起
strx=""
for tex in res["words_result"]:#遍歷結果
    strx+=tex["words"]
print(strx)#輸出內容

注意

圖片格式（image）：

圖像數據，base64編碼，要求base64編碼后大小不超過4M，最短邊至少15px，最長邊最大4096px,支持jpg/png/bmp格式

URL格式（url）：

圖片完整URL，URL長度不超過1024字節，URL對應的圖片base64編碼后大小不超過4M，最短邊至少15px，最長邊最大4096px,支持jpg/png/bmp格式，當image字段存在時url字段失效

語言設置（language_type）

識別語言類型，默認為CHN_ENG

可設置：- CHN_ENG：中英文混合；- ENG：英文；- POR：葡萄牙語；- FRE：法語；- GER：德語；- ITA：意大利語；- SPA：西班牙語；- RUS：俄語；- JAP：日語；- KOR：韓語；

圖像倒置設置（detect_direction）

是否檢測圖像朝向，默認不檢測，即：false。朝向是指輸入圖像是正常方向、逆時針旋轉90/180/270度。可選值包括:- true：檢測朝向；- false：不檢測朝向

是否檢測語言（detect_language）

是否檢測語言，默認不檢測。當前支持（中文、英語、日語、韓語），值為flase或者true

是否返回識別結果中每一行的置信度（probability）

值為flase或者true

參數添加舉例

""" 如果有可選參數 """
options = {}
options["detect_direction"] = "true"
options["detect_language"] = "true"

""" 帶參數調用網絡圖片文字識別, 圖片參數為遠程url圖片 """
client.webImageUrl(url, options)

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 python實現百度OCR圖片識別 python 使用百度AI實現OCR文字識別基於百度OCR的圖片文字識別百度OCR識別示例百度Ocr文字識別 Python調用百度OCR識別API實現文字圖片識別實現百度ocr識別認證【文字，證件等識別】百度OCR文字識別-身份證識別百度OCR文字識別-身份證識別 python截圖+百度ocr（圖片識別）+ 百度翻譯（可選擇翻譯語言）