官網
數據標注格式
每行共32個數字,前四個數字為該彎曲文本在整張圖上的矩形框坐標值,剩下的28個值為14個點,為相對於矩形框左上角得誤差補償即為與左上角坐標所形成的差值,形成封閉的彎曲文本框,其計算方式可以簡單的理解為:
1.將前4個坐標值的矩形框從原圖中截取出來
2.在截取之后的圖中取14個點的坐標值
————————————————
版權聲明:本文為CSDN博主「tumi678」的原創文章,遵循CC 4.0 BY-SA版權協議,轉載請附上原文出處鏈接及本聲明。
原文鏈接:https://blog.csdn.net/tumi678/article/details/97752544
查看標注結果
# -*- encoding: utf-8 -*-
"""
@date: 2021/3/30 10:43 上午
@author: xuehuiping
"""
from PIL import Image, ImageDraw
label_file_name = '/Users/xuehuiping/data/ctw1500/train/text_label_curve/0005.txt'
img_file_name = '/Users/xuehuiping/data/ctw1500/train/text_image/0005.jpg'
im = Image.open(img_file_name)
draw = ImageDraw.Draw(im) # 實例化一個對象
lines = open(label_file_name).readlines()
for line in lines:
# print(line)
cells = line.strip().split(',')
tmp = cells[4:]
xy = []
for i in range(len(tmp)):
if i % 2 == 0:
xy.append(int(tmp[i]) + int(cells[0]))
else:
xy.append(int(tmp[i]) + int(cells[1]))
# print(xy)
draw.polygon(
xy, fill=(0, 255, 0))
im.show()