各常見OCR圖片文字識別對比總結


什么是OCR?

OCR英文全稱是Optical Character Recognition,中文叫做光學字符識別。它是利用光學技術和計算機技術把印在或寫在紙上的文字讀取出來,並轉換成一種計算機能夠接受、人又可以理解的格式。文字識別是計算機視覺研究領域的分支之一,而且這個課題已經是比較成熟了,並且在商業中已經有很多落地項目了。比如漢王OCR,百度OCR,阿里OCR、有道OCR、科大訊飛等等。其實我們自己也能感受到,OCR技術確實也在改變着我們的生活:比如一個手機APP就能幫忙掃描名片、身份證,並識別出里面的信息;汽車進入停車場、收費站都不需要人工登記了,都是用車牌識別技術;我們看書時看到不懂的題,拿個手機一掃,APP就能在網上幫你找到這題的答案。此次因某些需求需測試當前比較常見的各個OCR文字識別的識別率,所以總結該文檔僅供參考!

具體測試圖片的實例  由於都是網圖,就不粘貼出來了,自己可以去網上找關於印刷體(印刷體中文、英文、中英文混合)、手寫體(中文、英文、中英文混合)的圖片以供測試。

測試日期為2021年4月。

 一、騰訊雲OCR文字識別

官方地址:https://cloud.tencent.com/product/ocr-catalog

需完成實名認證、開通文字處理。直接使用微信登錄完成相關要求即可。

免費次數:首次申請有1000次免費次數。但只有當月有效,也就是說哪怕你3月29日開通,到4月份也就失效了。

具體API概覽:https://cloud.tencent.com/document/product/866/33515

默認接口請求頻率限制:10次/秒

需新建API密鑰生成 SecretId和SecretKey。具體使用示例官網有介紹,可根據自己具體所用開發語言選擇不同的示例。

 

本人測試示例:通用印刷體識別(高精度版)、通用手寫體識別、英文識別

1、英文識別(對應接口類EnglishOCR) 只能識別到英文,無法識別中文(是一點都識別不了)

針對純手寫英文個人感覺在60%左右吧

2、通用印刷體識別(高精度版 對應接口類GeneralAccurateOCR) 能識別中英文

針對手寫英文識別率估算65%左右  英文可識別空格標點符號等

針對手寫中文識別率95%左右

針對印刷體中英文識別率90%以上

針對多題型(機打、手寫、中英混合)識別率60%吧

3、通用手寫體識別(對應接口類GeneralHandwritingOCR)   缺陷:英文識別不了空格標點符號等

針對手寫英文識別率估算50%左右  英文識別不了空格標點符號等

針對手寫中文識別率95%左右

針對印刷體中英文識別率90%吧

針對多題型(機打、手寫、中英混合)識別率60%吧

 

返回json格式,DetectedText參數為具體識別內容。

具體返回參數說明:https://cloud.tencent.com/document/api/866/33527#TextGeneralHandwriting

返回示例如:

 

優點:文檔較豐富

缺點:調用比較耗時、識別率一般

如果要使用騰訊雲的話建議使用通用印刷體識別(高精度版)

 

二、百度雲OCR文字識別

官網地址:https://cloud.baidu.com/product/ocr_general

API文檔:https://cloud.baidu.com/doc/OCR/s/jk9m7mj1l

可使用百度賬號登錄然后創建應用並生成Access Token。AccessToken在API文檔中有相關鏈接

 

具體免費政策:根據不同接口有不同限制,從50到500不等

具體示例在API文檔中也有介紹具體返回json格式,讀取的內容參數為word

返回示例如:

 

本人測試實例三種:試卷分析與識別、手寫文字識別、通用文字識別(高精度版)

針對手寫英文識別率   手寫文字識別最好75%

針對手寫中文識別率   都在90%左右

針對印刷體中英文數字混合識別率   都在90%以上

針對多類型(機打、手寫、中英混合)識別   手寫文字識別最好60%多吧

 

優點:文檔豐富、使用不復雜

缺點:調用比較耗時、識別率一般

如果要用百度雲Ocr建議使用  手寫文字識別

 

三、有道雲Ocr文字識別

官網地址:https://ai.youdao.com/product-ocr-hand.s

需創建應用和應用ID、應用密鑰

 

 

具體費用政策:無免費體驗次數,但注冊時會返50元具體調用會從這50元中扣

本人測試示例:整題識別(含公式)、通用文字識別

針對手寫英文識別率  都還可以80%是有的

針對手寫中文識別率  都可以80%

針對印刷體中英文數字混合識別率  都還可以90%

針對多類型(機打、手寫、中英混合)識別率  60%吧

返回json格式,text參數為具體讀取內容

具體返回示例如:

 

優點:暫時想不出來

缺點:不是太友好,官方給的實例有的都是錯的。調用返回錯誤消息比較模糊

四、阿里雲OCR文字識別

官方地址:https://www.aliyun.com/activity/bigdata/ocrprodpromotionjuly

用支付寶掃碼登錄,需實名認證,購買后直接使用AppCode調用接口即可

單用戶限制10QPS

免費政策:500次

本人測試實例:印刷文字識別-試卷識別/OCR文字識別、印刷文字識別-答題卡主觀題識別

針對手寫英文識別率   印刷文字識別-試卷識別/OCR文字識別沒法用識別率非常低、印刷文字識別-答題卡主觀題識別一樣拉,跟騰訊雲一樣識別不了空格和標點符號

針對手寫中文識別率   都還可以80-90%

針對印刷體中英文數字混合識別率   都還可以80%

針對多類型(機打、手寫、中英混合)識別率   70%

 

返回json格式,word參數為返回的文本

返回示例如:

 

優點:針對多題型識別率還可以

缺點:太雜了,不友好。找個東西都需要好久。針對純手寫英文還是算了吧

 

五、漢王OCR文字識別

在阿里雲里面可直接找到,用法跟純阿里雲差不多

https://market.aliyun.com/products/57124001/cmapi00035425.html?spm=5176.2020520132.101.3.25887218RT04tL#sku=yuncode2942500001

免費政策:0元/20次

本人測試實例:漢王通用文本識別、漢王手寫體識別

針對手寫英文識別率  都還可以90%

針對手寫中文識別率  都還可以80%是有的

針對印刷體中英文數字混合識別率  都還可以90%

針對多類型(機打、手寫、中英混合)識別率  都還可以70%

 返回示例如:

 

優點:兩種方式識別都差不多,比較穩定

缺點:感覺調用時長是最長的

 

綜上所述:

最普通、中庸的:有道雲

比較穩定的:漢王

比較友好的:百度

免費次數最少的:漢王和阿里

 

針對手寫英文識別率   阿里最差,漢王相比其他略好些(個人感覺)。其他的都還可以 70%是有的
針對手寫中文識別率   騰訊雲的英文識別外,其他識別率也都在90%
針對印刷體中英文數字混合識別率   都還可以基本都在90%左右
針對多類型(機打、手寫、中英混合)的識別率   漢王=>阿里>百度>騰訊=有道

另:由於某些原因科大訊飛的OCR暫未測試,據朋友測試后反饋科大訊飛的識別率能好一些,略優於漢王。

 以上為本人測試總結,僅供參考!

 

才疏學淺,相關文檔等僅供自我總結,如有相關問題可留言交流謝謝。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM