項目名稱:PaddleOCR
項目作者:PaddlePaddle
開源許可協議:Apache-2.0
項目地址:https://gitee.com/paddlepaddle/PaddleOCR
項目簡介
PaddleOCR 旨在打造一套豐富、領先、且實用的 OCR 工具庫,助力使用者訓練出更好的模型,並應用落地。
PaddleOCR 是基於飛槳的 OCR 工具庫,包含總模型僅8.6M的超輕量級中文 OCR,單模型支持中英文數字組合識別、豎排文本識別、長文本識別。同時支持多種文本檢測、文本識別的訓練算法。
項目特性
- 超輕量級中文OCR模型,總模型僅8.6M
- 單模型支持中英文數字組合識別、豎排文本識別、長文本識別
- 檢測模型DB(4.1M)+識別模型CRNN(4.5M)
- 使用通用中文OCR模型
- 多種預測推理部署方案,包括服務部署和端側部署
- 多種文本檢測訓練算法,EAST、DB
- 多種文本識別訓練算法,Rosetta、CRNN、STAR-Net、RARE
- 可運行於Linux、Windows、MacOS等多種系統
效果展示



算法介紹
1.文本檢測算法

2.文本識別算法

3.端到端 OCR 算法
數據集
PaddleOCR 還為開發者們提供了多種數據集和工具供大家選擇使用
- 通用中英文OCR數據集
- 手寫中文OCR數據集
- 垂類多語言OCR數據集
- 常用數據標注工具
- 常用數據合成工具
有一說一,這次百度開源的這款 OCR 工具集確實非常不錯,如果你對它也感興趣,想要了解更多信息的話,那么就點擊下方了解更多前往項目主頁看看吧。