如何設計神經網絡結構


  1. start small
  2. gradually increase the model size
  3. small parameter, deep is better than wider; deep network is hard to optimize, 使用resnet的思想進行優化
  4. kernel size : 3*3 and 1*1 work the best
  5. stride :
    1. 保留空間分辨率使用 stride = 1
    2. 下采樣使用stride = 2
    3. 上采樣使用stride = 1 or 2
  6. batch Size:
    1. 通常使用32為batch
    2. Noisy gradient : larger batch
    3. local minima : smaller batch
  7. 划分數據集
    1. 大的數據集如10W+: 99% train 1% test and valid
    2. 小的數據集如1W: 80% train 20% test and valid


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM