文本檢測數據集以及標簽形式說明


文本檢測數據集以及標簽形式說明

icdar15系列,帶角度的四邊形標簽

 

 

 

打開標簽文件,每行為一個文本框坐標以及語言類型,文字,###代表模糊不清

形式,是四邊形的四個點的坐標。

 

ctw1500系列任意形狀的數據集標簽

 

 

每行共32個數字,前四個數字為該彎曲文本在整張圖上的矩形框坐標值,

剩下的28個值為14個點,為相對於矩形框左上角得誤差補償即為與左上角坐標所形成的差值,形成封閉的彎曲文本框,

其計算方式可以簡單的理解為:

1.將前4個坐標值的矩形框從原圖中截取出來(左上右下4個點)

2.在截取之后的圖中取14個點的坐標值

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM