文本检测数据集以及标签形式说明


文本检测数据集以及标签形式说明

icdar15系列,带角度的四边形标签

 

 

 

打开标签文件,每行为一个文本框坐标以及语言类型,文字,###代表模糊不清

形式,是四边形的四个点的坐标。

 

ctw1500系列任意形状的数据集标签

 

 

每行共32个数字,前四个数字为该弯曲文本在整张图上的矩形框坐标值,

剩下的28个值为14个点,为相对于矩形框左上角得误差补偿即为与左上角坐标所形成的差值,形成封闭的弯曲文本框,

其计算方式可以简单的理解为:

1.将前4个坐标值的矩形框从原图中截取出来(左上右下4个点)

2.在截取之后的图中取14个点的坐标值

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM