OCR-Form-Tools項目試玩記錄(一)本地部署


OCR-Form-Tools是微軟的一個開源代碼庫,包含微軟表單識別和OCR服務相關的多種工具。Github倉庫地址

目前,表單標注工具(OCR Form Labeling Tool)是首個發布到本該倉庫的工具。這篇博客記錄了我嘗試在本地部署並運行該工具的過程。

方案一:使用官方Docker鏡像(推薦)

官方提供了已經構築好的docker鏡像,如果本地配置了docker環境可以直接拉取並使用。這里參考官方文檔

配置docker環境的方法可以參考docker官網

# pull image
docker pull mcr.microsoft.com/azure-cognitive-services/custom-form/labeltool

# run image
docker run -it -p 3000:80 mcr.microsoft.com/azure-cognitive-services/custom-form/labeltool eula=accept

訪問本地3000端口即可看到頁面。

需要注意,對於windows/macosx下使用Docker Toolbox的情況,docker運行在虛擬機上,所以需要訪問虛擬機的3000端口才能看到頁面(比如我的是http://192.168.99.100:3000/)。使用新版的docker desktop則沒有這個問題

方案二:本地編譯

代碼在手,直接編譯並運行這個項目也是可行的。考慮到這個工具的主體是一個react前端應用,我們需要借助npm等工具完成編譯。

安裝nodejs和npm

這個項目使用npm進行依賴管理,因此我們首先需要安裝npm。

windows用戶可以從nodejs中文網下載。安裝軟件會自動完成環境變量配置等工作,直接按提示一路到底即可。

對於linux用戶直接使用apt安裝即可

sudo apt install nodejs npm -y

安裝完畢后檢查

node -v
npm -v

這里我的node版本是v10.16.0,npm版本是6.9.0,根據項目文檔,node版本最好>=10.0,如果已經安裝了更低版本的node可以考慮升級

(可選)配置npm鏡像源為國內源

國內訪問npm自帶的官方軟件源一般較慢,難以下載依賴,因此我們可以將源換為國內源。

一個國內常用的開源鏡像是淘寶NPM鏡像

換源方法可以參考這篇博客:https://blog.csdn.net/bird3014/article/details/93538860

安裝依賴並構築應用

編譯的工作參照倉庫README說明即可。拉取代碼

git clone https://github.com/microsoft/OCR-Form-Tools.git
cd OCR-Form-Tools

安裝依賴。這一步時間較長,可以先去喝杯咖啡

npm install

編譯並打包

npm run build

最后運行即可,如果成功會自動彈出瀏覽器並訪問本地3000端口。

npm run react-start


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM