python-使用百度AipOcr實現表格文字圖片識別

本文轉載自查看原文 2020-04-04 01:37 5284 Python日常筆記

注：本博客中的代碼實現來自百度問答：https://jingyan.baidu.com/article/c1a3101ef9131c9e646deb5c.html

代碼運行環境：win10 python3.7

需要aip庫，使用pip install baidu-aip即可

（1）目的

通過百度AipOcr庫，來實現識別圖片中的表格，並輸出問表格文件。

（2）實現

仿照百度問答：https://jingyan.baidu.com/article/c1a3101ef9131c9e646deb5c.html，實現了以下代碼：

 1 # encoding: utf-8
 2 import os
 3 import sys
 4 import requests
 5 import time
 6 import tkinter as tk
 7 from tkinter import filedialog
 8 from aip import AipOcr
 9  
10 # 定義常量
11 APP_ID = 'xxxxxx'
12 API_KEY = 'xxxxxxxxxxxxxxxxxxxxxx'
13 SECRET_KEY = 'xxxxxxxxxxxxxxxxxxxxxxxxx'
14 # 初始化AipFace對象
15 client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
16  
17 # 讀取圖片
18 def get_file_content(filePath):
19     with open(filePath, 'rb') as fp:
20         return fp.read()
21 
22 
23 #文件下載函數
24 def file_download(url, file_path):
25     r = requests.get(url)
26     with open(file_path, 'wb') as f:
27         f.write(r.content)
28 
29 
30 if __name__ == "__main__":    
31     root = tk.Tk()
32     root.withdraw()
33     data_dir = filedialog.askdirectory(title='請選擇圖片文件夾') + '/'
34     result_dir = filedialog.askdirectory(title='請選擇輸出文件夾') + '/'
35     num = 0
36     for name in os.listdir(data_dir):
37         print ('{0} : {1} 正在處理：'.format(num+1, name.split('.')[0]))
38         image = get_file_content(os.path.join(data_dir, name))
39         res = client.tableRecognitionAsync(image)
40         # print ("res:", res)
41         if 'error_code' in res.keys():
42             print ('Error! error_code: ', res['error_code'])
43             sys.exit()
44         req_id = res['result'][0]['request_id']    #獲取識別ID號
45 
46         for count in range(1, 20):    #OCR識別也需要一定時間，設定10秒內每隔1秒查詢一次
47             res = client.getTableRecognitionResult(req_id)    #通過ID獲取表格文件XLS地址
48             print(res['result']['ret_msg'])
49             if res['result']['ret_msg'] == '已完成':
50                 break    #雲端處理完畢，成功獲取表格文件下載地址，跳出循環
51             else:
52                 time.sleep(1)
53 
54         url = res['result']['result_data']
55         xls_name = name.split('.')[0] + '.xls'
56         file_download(url, os.path.join(result_dir, xls_name))
57         num += 1
58         print ('{0} : {1} 下載完成。'.format(num, xls_name))
59         time.sleep(1)

（3）實現效果

識別的表格圖片為：

實現的效果為（注：表格的格式人為調整過，但內容沒人為修改）：

可以看出，識別的精度還是很高的，只有“Fellow”識別為了“Fel1low”。

（4）其它

百度智能雲應用創建鏈接：https://console.bce.baidu.com/ai/?_=1585935093810#/ai/ocr/app/list，創建了一個應用之后，就可以獲得APP_ID、API_KEY、SECRET_KEY。

百度智能雲文字識別接口說明：https://cloud.baidu.com/doc/OCR/s/3k3h7yeqa。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 python+百度實現批量識別圖片上的文字 python 使用百度AI實現OCR文字識別用百度文字識別實現圖片文本識別 Python調用百度OCR識別API實現文字圖片識別 Python通過百度Ai識別圖片中的文字調用百度AI進行圖片文字識別（Python）百度api識別圖片文字 python調用百度ocr接口，實現圖片內文字識別基於百度OCR的圖片文字識別用百度AI的OCR文字識別結合PHP實現了圖片的文字識別功能