OCR-Form-Tools是微軟的一個開源代碼庫,包含微軟表單識別和OCR服務相關的多種工具。Github倉庫地址
目前,表單標注工具(OCR Form Labeling Tool)是首個發布到本該倉庫的工具。這篇博客記錄了我嘗試在本地部署並運行該工具的過程。
方案一:使用官方Docker鏡像(推薦)
官方提供了已經構築好的docker鏡像,如果本地配置了docker環境可以直接拉取並使用。這里參考官方文檔
配置docker環境的方法可以參考docker官網
# pull image
docker pull mcr.microsoft.com/azure-cognitive-services/custom-form/labeltool
# run image
docker run -it -p 3000:80 mcr.microsoft.com/azure-cognitive-services/custom-form/labeltool eula=accept
訪問本地3000端口即可看到頁面。
需要注意,對於windows/macosx下使用Docker Toolbox的情況,docker運行在虛擬機上,所以需要訪問虛擬機的3000端口才能看到頁面(比如我的是http://192.168.99.100:3000/)。使用新版的docker desktop則沒有這個問題
方案二:本地編譯
代碼在手,直接編譯並運行這個項目也是可行的。考慮到這個工具的主體是一個react前端應用,我們需要借助npm等工具完成編譯。
安裝nodejs和npm
這個項目使用npm進行依賴管理,因此我們首先需要安裝npm。
windows用戶可以從nodejs中文網下載。安裝軟件會自動完成環境變量配置等工作,直接按提示一路到底即可。
對於linux用戶直接使用apt安裝即可
sudo apt install nodejs npm -y
安裝完畢后檢查
node -v
npm -v
這里我的node版本是v10.16.0,npm版本是6.9.0,根據項目文檔,node版本最好>=10.0,如果已經安裝了更低版本的node可以考慮升級
(可選)配置npm鏡像源為國內源
國內訪問npm自帶的官方軟件源一般較慢,難以下載依賴,因此我們可以將源換為國內源。
一個國內常用的開源鏡像是淘寶NPM鏡像
換源方法可以參考這篇博客:https://blog.csdn.net/bird3014/article/details/93538860
安裝依賴並構築應用
編譯的工作參照倉庫README說明即可。拉取代碼
git clone https://github.com/microsoft/OCR-Form-Tools.git
cd OCR-Form-Tools
安裝依賴。這一步時間較長,可以先去喝杯咖啡
npm install
編譯並打包
npm run build
最后運行即可,如果成功會自動彈出瀏覽器並訪問本地3000端口。
npm run react-start