我這里是由於數據整理錯誤導致的,同一標注區域重復2次送入模型,具體如下:
1 0 0.798046875 0.5555555555555556 0.04296875 0.03611111111111111 2 0 0.931640625 0.6173611111111111 0.06953125 0.07083333333333333 3 0 0.869140625 0.5777777777777777 0.06171875 0.05277777777777778 4 0 0.837890625 0.5791666666666667 0.05546875 0.05555555555555555 5 0 0.798046875 0.5555555555555556 0.04296875 0.03611111111111111 6 0 0.931640625 0.6173611111111111 0.06953125 0.07083333333333333 7 0 0.869140625 0.5777777777777777 0.06171875 0.05277777777777778 8 0 0.837890625 0.5791666666666667 0.05546875 0.05555555555555555
上述為1張圖片的標注數據,1-4行和5-8行重復。
訓練過程中,批輸出的loss初期逐漸減少至一定值后出現快速增長,最后變成nan.
這個原因還不太清晰,個人感覺是相同的數據導致梯度變化變為0,導致了梯度消失。
