CTW1500數據集介紹


官網

https://ctwdataset.github.io/

數據標注格式

每行共32個數字,前四個數字為該彎曲文本在整張圖上的矩形框坐標值,剩下的28個值為14個點,為相對於矩形框左上角得誤差補償即為與左上角坐標所形成的差值,形成封閉的彎曲文本框,其計算方式可以簡單的理解為:

1.將前4個坐標值的矩形框從原圖中截取出來

2.在截取之后的圖中取14個點的坐標值
————————————————
版權聲明:本文為CSDN博主「tumi678」的原創文章,遵循CC 4.0 BY-SA版權協議,轉載請附上原文出處鏈接及本聲明。
原文鏈接:https://blog.csdn.net/tumi678/article/details/97752544

查看標注結果

# -*- encoding: utf-8 -*-
"""
@date: 2021/3/30 10:43 上午
@author: xuehuiping
"""

from PIL import Image, ImageDraw

label_file_name = '/Users/xuehuiping/data/ctw1500/train/text_label_curve/0005.txt'

img_file_name = '/Users/xuehuiping/data/ctw1500/train/text_image/0005.jpg'

im = Image.open(img_file_name)
draw = ImageDraw.Draw(im)  # 實例化一個對象

lines = open(label_file_name).readlines()
for line in lines:
    # print(line)
    cells = line.strip().split(',')
    tmp = cells[4:]
    xy = []
    for i in range(len(tmp)):
        if i % 2 == 0:
            xy.append(int(tmp[i]) + int(cells[0]))
        else:
            xy.append(int(tmp[i]) + int(cells[1]))
    # print(xy)
    draw.polygon(
        xy, fill=(0, 255, 0))

im.show()

數據舉例


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM