http://www.cnblogs.com/Charltsing/p/OneNoteOCRAPI.html
OneNote2013 OCR API調用使用說明
2019.4.17
使用說明:
1、安裝干凈的Office 2013,再安裝Office 2013 sp1。不要安裝其它OneNote更新(特別是KB3115256)。
2、在OneNote歷史記錄里面的筆記本回收站,選中禁用此筆記本的歷史記錄,如果有多個筆記本,最好都禁用。
3、確認OneNote里面至少有一個筆記本(notebook)和一個分區(section)。這個應該OneNote默認提供的。然后新建一個頁面檢查插入圖片之后,是否可以從圖片中獲得文本,能獲取說明OneNote OCR功能正常。
4、打開OneNoteAPI.xlsm,運行VBA代碼TestOcrB或者TestOCR,觀察立即窗口輸出是否正確。
5、API函數第一次運行耗時會略長(因為要啟動OneNote),之后識別速度會正常。
6、在I7 CPU測試識別速度:小圖片大約幾十毫秒,大圖片可能會上千毫秒。
7、需要簡體OneNote2013 Sp1,其它版本不支持(由於OneNote對象庫不能嵌入,需要重新編譯才能支持其他版本)。
運行環境說明:
1、只支持簡體中文版的OneNote2013,並具備至少一個Notebook(筆記本)和一個Section(分區),API運行時會在某個分區上面創建page,插入圖片識別后刪除。
2、禁用筆記本歷史記錄,(因為每次OCR都要創建一個page,禁用回收站可以避免文檔加載變慢或出現其它錯誤。)
3、由於OneNote的原因,多次運行可能會在某個分區殘留多個名為"無標題頁"的page,可以調用API命令清除。
4、如果安裝了多個版本的Office(不建議這么做),應保證office2013 sp1為最后安裝版本。
5、程序需要.net 4.0環境https://www.microsoft.com/zh-CN/download/details.aspx?id=17718
6、目前只支持簡體中文版,其它語言版本需要修改代碼。
可能的錯誤:
1、提示緩沖區溢出。請增加Buffersize。
2、返回的識別文本長度為0。請增加延時。(程序第一次運行耗時會略長,之后會正常。)
3、Excel突然閃退。這與OneNote有關,請增加延時。如果無效請卸載Office2013,重新安裝干凈的版本及SP1,不要使用精簡版的Office 2013。
4、小圖片始終無法識別。請在OneNote里面檢查是否識別功能處於禁用狀態,如果無法選擇中文,請重新安裝或者修復Office2013或者卸載更新。2016年7月25日OneNote的一個更新可能會造成這個問題(KB3115256)。
5、任何時候,如果發現OCR識別錯誤,請先檢查OneNote插入此圖片之后獲取文本功能是否正常。
如何卸載Windows更新
Windows 10:在更新歷史記錄里面,點擊卸載更新,選擇KB3115256
****************************************
4月21日測試:
OneNote2013 SP1沒有問題(如果想識別小圖片,請不要安裝KB3115256)。
OneNote2016 簡體中文版可以使用(16.0.4266.1001),但是無法識別小圖片。
Office365和Office2019已經不再提供OneNote2016的功能,取代的是OneNote for Windows10
****************************************
下載 無需安裝部署,直接運行。
**********
聯系QQ:564955427
QQ群:550672198(驗證信息:Onenote OCR)