【自然场景文本检测】TextMountain: Accurate Scene Text Detection via Instance Segmentation


推荐阅读EAST论文,二篇论文比较相似

论文地址:https://arxiv.org/abs/1811.12786

概述:损失函数由三部分组成

 

1 TS:预测文本/非文本

该损失函数采用交叉熵,利用了OHEM

2 TCBP:预测文字山峰

 

 

 

这二个式子主要保证离哪条边越近,其中相对越小

 

3 TCD:预测文字方向

 

 这式子主要保证离哪条边越近,其方向向量权重越大

 

 论文显示在rctw2017数据集上表现不错,结果如下:

 

在代码实现上没什么难度,只是训练速度很慢

 训练效果:

 TCBP

 TCD

左侧实际标签,右侧预测标签 

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM