注:本博客中的代碼實現來自百度問答:https://jingyan.baidu.com/article/c1a3101ef9131c9e646deb5c.html
代碼運行環境:win10 python3.7
需要aip庫,使用pip install baidu-aip即可
(1)目的
通過百度AipOcr庫,來實現識別圖片中的表格,並輸出問表格文件。
(2)實現
仿照百度問答:https://jingyan.baidu.com/article/c1a3101ef9131c9e646deb5c.html,實現了以下代碼:
1 # encoding: utf-8 2 import os 3 import sys 4 import requests 5 import time 6 import tkinter as tk 7 from tkinter import filedialog 8 from aip import AipOcr 9 10 # 定義常量 11 APP_ID = 'xxxxxx' 12 API_KEY = 'xxxxxxxxxxxxxxxxxxxxxx' 13 SECRET_KEY = 'xxxxxxxxxxxxxxxxxxxxxxxxx' 14 # 初始化AipFace對象 15 client = AipOcr(APP_ID, API_KEY, SECRET_KEY) 16 17 # 讀取圖片 18 def get_file_content(filePath): 19 with open(filePath, 'rb') as fp: 20 return fp.read() 21 22 23 #文件下載函數 24 def file_download(url, file_path): 25 r = requests.get(url) 26 with open(file_path, 'wb') as f: 27 f.write(r.content) 28 29 30 if __name__ == "__main__": 31 root = tk.Tk() 32 root.withdraw() 33 data_dir = filedialog.askdirectory(title='請選擇圖片文件夾') + '/' 34 result_dir = filedialog.askdirectory(title='請選擇輸出文件夾') + '/' 35 num = 0 36 for name in os.listdir(data_dir): 37 print ('{0} : {1} 正在處理:'.format(num+1, name.split('.')[0])) 38 image = get_file_content(os.path.join(data_dir, name)) 39 res = client.tableRecognitionAsync(image) 40 # print ("res:", res) 41 if 'error_code' in res.keys(): 42 print ('Error! error_code: ', res['error_code']) 43 sys.exit() 44 req_id = res['result'][0]['request_id'] #獲取識別ID號 45 46 for count in range(1, 20): #OCR識別也需要一定時間,設定10秒內每隔1秒查詢一次 47 res = client.getTableRecognitionResult(req_id) #通過ID獲取表格文件XLS地址 48 print(res['result']['ret_msg']) 49 if res['result']['ret_msg'] == '已完成': 50 break #雲端處理完畢,成功獲取表格文件下載地址,跳出循環 51 else: 52 time.sleep(1) 53 54 url = res['result']['result_data'] 55 xls_name = name.split('.')[0] + '.xls' 56 file_download(url, os.path.join(result_dir, xls_name)) 57 num += 1 58 print ('{0} : {1} 下載完成。'.format(num, xls_name)) 59 time.sleep(1)
(3)實現效果
識別的表格圖片為:
實現的效果為(注:表格的格式人為調整過,但內容沒人為修改):
可以看出,識別的精度還是很高的,只有“Fellow”識別為了“Fel1low”。
(4)其它
百度智能雲應用創建鏈接:https://console.bce.baidu.com/ai/?_=1585935093810#/ai/ocr/app/list,創建了一個應用之后,就可以獲得APP_ID、API_KEY、SECRET_KEY。
百度智能雲文字識別接口說明:https://cloud.baidu.com/doc/OCR/s/3k3h7yeqa。