安装:
Windows:
1,下载安装包:点击下载。
2,安装。安装过程中注意勾选所需语言包,否则默认只解析英文。
3,将根目录添加进环境变量。
4,cmd输入命令测试安装结果。
# 查看版本 tesseract -v # 查看支持的语言列表 tesseract --list-langs
Linux:
1,下载Tesseract-OCR源码包:点击下载。
2,下载Leptonica源码包:点击下载。
3,分别解压缩两个源码包,得到如下所示:
4,安装依赖:
yum install -y autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel
5,安装Leptonica:
cd leptonica-1.81.1
./configure --prefix=/usr/local/leptonica
make
make install
6,配置Leptonica环境变量:
vim /etc/profile
# 加入以下文本 PKG_CONFIG_PATH=$PKG_CONFIG_PATH:/usr/local/leptonica/lib/pkgconfig export PKG_CONFIG_PATH CPLUS_INCLUDE_PATH=$CPLUS_INCLUDE_PATH:/usr/local/leptonica/include/leptonica export CPLUS_INCLUDE_PATH C_INCLUDE_PATH=$C_INCLUDE_PATH:/usr/local/leptonica/include/leptonica export C_INCLUDE_PATH LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/leptonica/lib export LD_LIBRARY_PATH LIBRARY_PATH=$LIBRARY_PATH:/usr/local/leptonica/lib export LIBRARY_PATH LIBLEPT_HEADERSDIR=/usr/local/leptonica/include/leptonica export LIBLEPT_HEADERSDIR
source /etc/profile
7,安装Tesseract-OCR:
cd tesseract-5.0.0-alpha-20210401/
./autogen.sh
./configure --prefix=/usr/local/tesseract
make
make install
8,配置Tesseract-OCR环境变量:
vim /etc/profile
# 加入以下文本 PATH=$PATH:/usr/local/tesseract/bin export PATH
source /etc/profile
9,测试安装结果:
# 查看版本 tesseract -v
10,下载语言包:点击下载,并解压至share/tessdata。
11,检测支持语言:
# 查看支持的语言列表 tesseract --list-langs
测试使用
# 使用简体中文+英文语言包,识别1.jpg并将内容输出至test.txt tesseract 1.jpg test -l chi_sim+eng
测试图片:
测试结果: