推薦閱讀EAST論文,二篇論文比較相似
論文地址:https://arxiv.org/abs/1811.12786
概述:損失函數由三部分組成
1 TS:預測文本/非文本
該損失函數采用交叉熵,利用了OHEM
2 TCBP:預測文字山峰
這二個式子主要保證離哪條邊越近,其中相對越小
3 TCD:預測文字方向
這式子主要保證離哪條邊越近,其方向向量權重越大
論文顯示在rctw2017數據集上表現不錯,結果如下:
在代碼實現上沒什么難度,只是訓練速度很慢
訓練效果:
TCBP
TCD
左側實際標簽,右側預測標簽