均值是所有訓練樣本的均值,減去之后再進行訓練會提高其速度和精度。
1、caffe下的均值
數據格式是二進制的binaryproto,作者提供了計算均值的文件compute_image_mean,
計算均值時調用:
sudo build/tools/compute_image_mean examples/mnist/mnist_train_lmdb examples/mnist/mean.binaryproto
生成的均值文件保存在mean_binaryproto。
2、python格式下的均值(.npy)
需要首先將其轉為二進制的,然后再轉成python格式下的,用一個python腳本來實現。
#!/usr/bin/env python import numpy as np import sys,caffe if len(sys.argv)!=3: print "Usage: python convert_mean.py mean.binaryproto mean.npy" sys.exit() blob = caffe.proto.caffe_pb2.BlobProto() bin_mean = open( sys.argv[1] , 'rb' ).read()//讀入mean.binaryproto
blob.ParseFromString(bin_mean)//解析文件內容到blob //將blob中的均值轉化為.py格式,array的shape(mean_number,channel,height,width)
arr = np.array( caffe.io.blobproto_to_array(blob) ) //選擇其中一組均值(?),保存
npy_mean = arr[0] np.save( sys.argv[2] , npy_mean )
將其保存為convert_mean.py,調用
sudo python convert_mean.py mean.binaryproto mean.npy
得到python下的文件mean.npy
參考:http://www.cnblogs.com/denny402/p/5102328.html
http://blog.csdn.net/hyman_yx/article/details/51732656
3、caffe.proto
在2中,出現了caffe.proto,其中定了很多結構化的數據,比如conv層啊,pool層啊。Protobuf是用於數組存儲和交換的,
比如一部分寫數據進行存儲,另一部分進行讀寫,為了方便操作,將其定義共同的結構化據。
具體可參考:http://blog.csdn.net/qq_16055159/article/details/45115359/