大廠開源真香,百度開源的超輕量級OCR工具庫強大且實用


項目名稱:PaddleOCR

項目作者:PaddlePaddle

開源許可協議:Apache-2.0

項目地址:https://gitee.com/paddlepaddle/PaddleOCR

項目簡介

PaddleOCR 旨在打造一套豐富、領先、且實用的 OCR 工具庫,助力使用者訓練出更好的模型,並應用落地。

PaddleOCR 是基於飛槳的 OCR 工具庫,包含總模型僅8.6M的超輕量級中文 OCR,單模型支持中英文數字組合識別、豎排文本識別、長文本識別。同時支持多種文本檢測、文本識別的訓練算法。

項目特性

  • 超輕量級中文OCR模型,總模型僅8.6M
    • 單模型支持中英文數字組合識別、豎排文本識別、長文本識別
    • 檢測模型DB(4.1M)+識別模型CRNN(4.5M)
  • 使用通用中文OCR模型
  • 多種預測推理部署方案,包括服務部署和端側部署
  • 多種文本檢測訓練算法,EAST、DB
  • 多種文本識別訓練算法,Rosetta、CRNN、STAR-Net、RARE
  • 可運行於Linux、Windows、MacOS等多種系統

效果展示

大廠開源真香,百度開源的超輕量級OCR工具庫強大且實用

 

大廠開源真香,百度開源的超輕量級OCR工具庫強大且實用

 

大廠開源真香,百度開源的超輕量級OCR工具庫強大且實用

 

算法介紹

1.文本檢測算法

大廠開源真香,百度開源的超輕量級OCR工具庫強大且實用

 

2.文本識別算法

大廠開源真香,百度開源的超輕量級OCR工具庫強大且實用

 

3.端到端 OCR 算法

 

數據集

PaddleOCR 還為開發者們提供了多種數據集和工具供大家選擇使用

  • 通用中英文OCR數據集
  • 手寫中文OCR數據集
  • 垂類多語言OCR數據集
  • 常用數據標注工具
  • 常用數據合成工具

 

有一說一,這次百度開源的這款 OCR 工具集確實非常不錯,如果你對它也感興趣,想要了解更多信息的話,那么就點擊下方了解更多前往項目主頁看看吧。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM