安裝:
Windows:
1,下載安裝包:點擊下載。
2,安裝。安裝過程中注意勾選所需語言包,否則默認只解析英文。
3,將根目錄添加進環境變量。
4,cmd輸入命令測試安裝結果。
# 查看版本 tesseract -v # 查看支持的語言列表 tesseract --list-langs
Linux:
1,下載Tesseract-OCR源碼包:點擊下載。
2,下載Leptonica源碼包:點擊下載。
3,分別解壓縮兩個源碼包,得到如下所示:
4,安裝依賴:
yum install -y autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel
5,安裝Leptonica:
cd leptonica-1.81.1
./configure --prefix=/usr/local/leptonica
make
make install
6,配置Leptonica環境變量:
vim /etc/profile
# 加入以下文本 PKG_CONFIG_PATH=$PKG_CONFIG_PATH:/usr/local/leptonica/lib/pkgconfig export PKG_CONFIG_PATH CPLUS_INCLUDE_PATH=$CPLUS_INCLUDE_PATH:/usr/local/leptonica/include/leptonica export CPLUS_INCLUDE_PATH C_INCLUDE_PATH=$C_INCLUDE_PATH:/usr/local/leptonica/include/leptonica export C_INCLUDE_PATH LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/leptonica/lib export LD_LIBRARY_PATH LIBRARY_PATH=$LIBRARY_PATH:/usr/local/leptonica/lib export LIBRARY_PATH LIBLEPT_HEADERSDIR=/usr/local/leptonica/include/leptonica export LIBLEPT_HEADERSDIR
source /etc/profile
7,安裝Tesseract-OCR:
cd tesseract-5.0.0-alpha-20210401/
./autogen.sh
./configure --prefix=/usr/local/tesseract
make
make install
8,配置Tesseract-OCR環境變量:
vim /etc/profile
# 加入以下文本 PATH=$PATH:/usr/local/tesseract/bin export PATH
source /etc/profile
9,測試安裝結果:
# 查看版本 tesseract -v
10,下載語言包:點擊下載,並解壓至share/tessdata。
11,檢測支持語言:
# 查看支持的語言列表 tesseract --list-langs
測試使用
# 使用簡體中文+英文語言包,識別1.jpg並將內容輸出至test.txt tesseract 1.jpg test -l chi_sim+eng
測試圖片:
測試結果: