在進行訓練時,將圖像原原本本地作為input進行訓練是難以實現的,所以往往有以下兩種處理方案:
- Centercrop
- 分塊
分塊處理
對於分塊,我們可以進行不同的等分,以下對512 * 512 pixel的圖像及其所對應的target進行兩種嘗試:
4 * 4分塊,即生成的input是128 * 128 pixel的8 * 8分塊,即生成的input是64 * 64 pixel的


訓練結果比較

可以看出,通過128*128進行分塊的數據集可以在網絡的訓練上表現出更好地效果,因為更大的輸入使得網絡能學習到更多的特征,有益於網絡參數的訓練。
所以,在算力允許的情況下,應該盡量的用大的圖像進行輸入訓練。
