caffe 中如何打亂訓練數據

本文轉載自查看原文 2018-05-06 10:20 882 機器學習/深度學習

第一：

可以選擇在將數據轉換成lmdb格式時進行打亂；

設置參數--shuffle=1；（表示打亂訓練數據）

默認為0，表示忽略，不打亂。

打亂的目的有兩個：防止出現過分有規律的數據，導致過擬合或者不收斂。

在caffe中可能會使得，在模型進行測試時，每一個測試樣本都輸出相同的預測概率值。

或者，直接打亂訓練文件的標簽文件：train.txt

方法如下：

1）將 train_160309-train.txt按行打亂，每行內容則保持不變，命令：

cd 存放文件的路徑
awk 'BEGIN{ 100000*srand();}{ printf "%s %s\n", rand(), $0}' train_160309-train.txt |sort -k1n | awk '{gsub($1FS,""); print $0}'

2）但這樣處理后只是在屏幕上輸出顯示，如果需要將輸出寫入新的文本train.txt，則在末尾加上 | tee train.txt：

sudo awk 'BEGIN{ 100000*srand();}{ printf "%s %s\n", rand(), $0}' train_160309-train.txt |sort -k1n | awk '{gsub($1FS,""); print $0}' | tee train.txt

3）如果不需要在屏幕上輸出顯示，直接將輸出寫入新的文本train.txt，則在末尾將 | tee 換作 > 即可：

sudo awk 'BEGIN{ 100000*srand();}{ printf "%s %s\n", rand(), $0}' train_160309-train.txt |sort -k1n | awk '{gsub($1FS,""); print $0}' > train.txt

附：

參考：https://blog.csdn.net/u010555688/article/details/50475739

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Caffe-windows上訓練自己的數據 Caffe上用SSD訓練和測試自己的數據 [caffe(一)]使用caffe訓練mnist數據集 caffe學習三：使用Faster RCNN訓練自己的數據 CAFFE中訓練與使用階段網絡設計的不同_1 用caffe訓練openpose過程中，出現異常 caffe:自己搭建網絡來訓練從零到一：caffe-windows(CPU)配置與利用mnist數據集訓練第一個caffemodel 在docker容器中python3.5環境下使用DIGITS訓練caffe模型 [caffe(二)]Python加載訓練caffe模型並進行測試2