Python通過百度Ai識別圖片中的文字


版本:python3.7

工作中有需要識別圖片中的漢字,查看了半天大神們的博客,但沒找到完全可以用的源碼,經過自己的實踐,以下源碼可以實現:

創建應用 
首先你需要登錄百度AI,選擇文字識別,創建一個應用,會生成 應用名稱、AppID、API Key、Secret Key 這些東西,下面我們代碼是需要用到APP_ID、API_Key 和 Secret_Key ,然后安裝百度的包:baidu-aip

圖片我個人保存在了filePath 路徑里,當然這個圖片也可以是從其他地方讀取。

如果正則表達式不太會,可以參考:http://www.cnblogs.com/wenmaoyu/archive/2011/07/21/2113124.html

# -*- coding: UTF-8 -*-
from aip import AipOcr
import re

# 定義常量
APP_ID = '***' # 百度生成的
API_KEY = '***'
SECRET_KEY = 'g7grgiXHKf9Rbv1u7frxyOsh39mdayYs'

# 初始化AipFace對象
aipOcr = AipOcr(APP_ID, API_KEY, SECRET_KEY)

# 讀取圖片
filePath = "D:\QQ129.png"

def get_file_content(filePath):
with open(filePath, 'rb') as fp:
return fp.read()


# 定義參數變量
options = {
'detect_direction': 'true',
'language_type': 'CHN_ENG',
}

# 調用通用文字識別接口
result = aipOcr.basicAccurate(get_file_content(filePath), options) #basicAccurate是高精度版,識別率高, basicGeneral是普通識別版
print(result)

world=re.findall(r'[\u4e00-\u9fa5]',str(result)) #通過正則表達式識別漢字
print(world)
for each in world:
print(each)


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM