什么是OCR?
OCR英文全稱是Optical Character Recognition,中文叫做光學字符識別。它是利用光學技術和計算機技術把印在或寫在紙上的文字讀取出來,並轉換成一種計算機能夠接受、人又可以理解的格式。文字識別是計算機視覺研究領域的分支之一,而且這個課題已經是比較成熟了,並且在商業中已經有很多落地項目了。比如漢王OCR,百度OCR,阿里OCR、有道OCR、科大訊飛等等。其實我們自己也能感受到,OCR技術確實也在改變着我們的生活:比如一個手機APP就能幫忙掃描名片、身份證,並識別出里面的信息;汽車進入停車場、收費站都不需要人工登記了,都是用車牌識別技術;我們看書時看到不懂的題,拿個手機一掃,APP就能在網上幫你找到這題的答案。此次因某些需求需測試當前比較常見的各個OCR文字識別的識別率,所以總結該文檔僅供參考!
具體測試圖片的實例 由於都是網圖,就不粘貼出來了,自己可以去網上找關於印刷體(印刷體中文、英文、中英文混合)、手寫體(中文、英文、中英文混合)的圖片以供測試。
測試日期為2021年4月。
一、騰訊雲OCR文字識別
官方地址:https://cloud.tencent.com/product/ocr-catalog
需完成實名認證、開通文字處理。直接使用微信登錄完成相關要求即可。
免費次數:首次申請有1000次免費次數。但只有當月有效,也就是說哪怕你3月29日開通,到4月份也就失效了。
具體API概覽:https://cloud.tencent.com/document/product/866/33515
默認接口請求頻率限制:10次/秒
需新建API密鑰生成 SecretId和SecretKey。具體使用示例官網有介紹,可根據自己具體所用開發語言選擇不同的示例。
本人測試示例:通用印刷體識別(高精度版)、通用手寫體識別、英文識別
1、英文識別(對應接口類EnglishOCR) 只能識別到英文,無法識別中文(是一點都識別不了)
針對純手寫英文個人感覺在60%左右吧
2、通用印刷體識別(高精度版 對應接口類GeneralAccurateOCR) 能識別中英文
針對手寫英文識別率估算65%左右 英文可識別空格標點符號等
針對手寫中文識別率95%左右
針對印刷體中英文識別率90%以上
針對多題型(機打、手寫、中英混合)識別率60%吧
3、通用手寫體識別(對應接口類GeneralHandwritingOCR) 缺陷:英文識別不了空格標點符號等
針對手寫英文識別率估算50%左右 英文識別不了空格標點符號等
針對手寫中文識別率95%左右
針對印刷體中英文識別率90%吧
針對多題型(機打、手寫、中英混合)識別率60%吧
返回json格式,DetectedText參數為具體識別內容。
具體返回參數說明:https://cloud.tencent.com/document/api/866/33527#TextGeneralHandwriting
返回示例如:
優點:文檔較豐富
缺點:調用比較耗時、識別率一般
如果要使用騰訊雲的話建議使用通用印刷體識別(高精度版)
二、百度雲OCR文字識別
官網地址:https://cloud.baidu.com/product/ocr_general
API文檔:https://cloud.baidu.com/doc/OCR/s/jk9m7mj1l
可使用百度賬號登錄然后創建應用並生成Access Token。AccessToken在API文檔中有相關鏈接
具體免費政策:根據不同接口有不同限制,從50到500不等
具體示例在API文檔中也有介紹具體返回json格式,讀取的內容參數為word
返回示例如:
本人測試實例三種:試卷分析與識別、手寫文字識別、通用文字識別(高精度版)
針對手寫英文識別率 手寫文字識別最好75%
針對手寫中文識別率 都在90%左右
針對印刷體中英文數字混合識別率 都在90%以上
針對多類型(機打、手寫、中英混合)識別 手寫文字識別最好60%多吧
優點:文檔豐富、使用不復雜
缺點:調用比較耗時、識別率一般
如果要用百度雲Ocr建議使用 手寫文字識別
三、有道雲Ocr文字識別
官網地址:https://ai.youdao.com/product-ocr-hand.s
需創建應用和應用ID、應用密鑰
具體費用政策:無免費體驗次數,但注冊時會返50元具體調用會從這50元中扣
本人測試示例:整題識別(含公式)、通用文字識別
針對手寫英文識別率 都還可以80%是有的
針對手寫中文識別率 都可以80%
針對印刷體中英文數字混合識別率 都還可以90%
針對多類型(機打、手寫、中英混合)識別率 60%吧
返回json格式,text參數為具體讀取內容
具體返回示例如:
優點:暫時想不出來
缺點:不是太友好,官方給的實例有的都是錯的。調用返回錯誤消息比較模糊
四、阿里雲OCR文字識別
官方地址:https://www.aliyun.com/activity/bigdata/ocrprodpromotionjuly
用支付寶掃碼登錄,需實名認證,購買后直接使用AppCode調用接口即可
單用戶限制10QPS
免費政策:500次
本人測試實例:印刷文字識別-試卷識別/OCR文字識別、印刷文字識別-答題卡主觀題識別
針對手寫英文識別率 印刷文字識別-試卷識別/OCR文字識別沒法用識別率非常低、印刷文字識別-答題卡主觀題識別一樣拉,跟騰訊雲一樣識別不了空格和標點符號
針對手寫中文識別率 都還可以80-90%
針對印刷體中英文數字混合識別率 都還可以80%
針對多類型(機打、手寫、中英混合)識別率 70%
返回json格式,word參數為返回的文本
返回示例如:
優點:針對多題型識別率還可以
缺點:太雜了,不友好。找個東西都需要好久。針對純手寫英文還是算了吧
五、漢王OCR文字識別
在阿里雲里面可直接找到,用法跟純阿里雲差不多
免費政策:0元/20次
本人測試實例:漢王通用文本識別、漢王手寫體識別
針對手寫英文識別率 都還可以90%
針對手寫中文識別率 都還可以80%是有的
針對印刷體中英文數字混合識別率 都還可以90%
針對多類型(機打、手寫、中英混合)識別率 都還可以70%
返回示例如:
優點:兩種方式識別都差不多,比較穩定
缺點:感覺調用時長是最長的
綜上所述:
最普通、中庸的:有道雲
比較穩定的:漢王
比較友好的:百度
免費次數最少的:漢王和阿里
針對手寫英文識別率 阿里最差,漢王相比其他略好些(個人感覺)。其他的都還可以 70%是有的
針對手寫中文識別率 騰訊雲的英文識別外,其他識別率也都在90%
針對印刷體中英文數字混合識別率 都還可以基本都在90%左右
針對多類型(機打、手寫、中英混合)的識別率 漢王=>阿里>百度>騰訊=有道
另:由於某些原因科大訊飛的OCR暫未測試,據朋友測試后反饋科大訊飛的識別率能好一些,略優於漢王。
以上為本人測試總結,僅供參考!
才疏學淺,相關文檔等僅供自我總結,如有相關問題可留言交流謝謝。