OCR技術淺析-tesserOCR（3）

Pagesegmode 值有：

0 =定向和腳本檢測（OSD）只。

1 =利用OSD進行自動頁面分割。

2 =自動頁面分割，但沒有OSD或OCR

3 =全自動頁面分割，但沒有OSD。（默認）

4 =假設一列可變大小的文本。

5＝假定垂直對齊文本的單一均勻塊。

6 =假設一個統一的文本塊。

7 =將圖像視為單個文本行。

8 =將圖像視為單個單詞。

9＝將圖像作為循環中的單個單詞處理。

10 =將圖像視為單個字符。

語言包和模式必須在配置文件之前。

4.php使用tesseract

git上已有開源的php類庫實現了tesserOCR的方法 https://github.com/thiagoalessio/tesseract-ocr-for-php

Comporser 安裝 Comporser requir thiagoalessio/tesseract_ocr

其實只需要執行 exec 就可以。

<?php

new TesseractOCR('multi-languages.png')

->lang('eng', 'jpn', 'por') //使用語言包

->whitelist(range('A', 'Z')) //固定范圍

 ->run();

剛安裝好的tesserOCR猶如初生的嬰兒，識別能力並不強，可以下載官方提供的語言包（非系統語言包）或自己訓練

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 AI時代的OCR識別技術淺析 python3學習--安裝OCR識別庫tesserocr OCR技術實現流程 OCR技術初識 OCR圖像識別技術-Asprise OCR OCR技術之阿里雲產品 Python重構ocr的cnocr中文ocr識別技術 Greenplum技術淺析 SLB技術原理淺析淺析CPU中斷技術