caffe 教程

本文轉載自查看原文 2015-12-06 17:26 2102

Caffe是一個清晰而高效的深度學習框架，本文詳細介紹了caffe的優勢、架構，網絡定義、各層定義，Caffe的安裝與配置，解讀了Caffe實現的圖像分類模型AlexNet，並演示了CIFAR-10在caffe上進行訓練與學習。

Caffe是一個清晰而高效的深度學習框架，其作者是博士畢業於UC Berkeley的賈揚清，目前在Google工作。

Caffe是純粹的C++/CUDA架構，支持命令行、Python和MATLAB接口；可以在CPU和GPU直接無縫切換：

1	`Caffe::set_mode(Caffe::GPU);`

Caffe的優勢

上手快：模型與相應優化都是以文本形式而非代碼形式給出。
Caffe給出了模型的定義、最優化設置以及預訓練的權重，方便立即上手。
速度快：能夠運行最棒的模型與海量的數據。
Caffe與cuDNN結合使用，測試AlexNet模型，在K40上處理每張圖片只需要1.17ms.
模塊化：方便擴展到新的任務和設置上。
可以使用Caffe提供的各層類型來定義自己的模型。
開放性：公開的代碼和參考模型用於再現。
社區好：可以通過BSD-2參與開發與討論。

回到頂部

Caffe的網絡定義

Caffe中的網絡都是有向無環圖的集合，可以直接定義：

 
                name:  
                "dummy-net" 
               
 
                layers {<span><span>name: <span> 
                "data" 
                …< 
                /span 
                >< 
                /span 
                >< 
                /span 
                >} 
               
 
                layers {<span><span>name: <span> 
                "conv" 
                …< 
                /span 
                >< 
                /span 
                >< 
                /span 
                >} 
               
 
                layers {<span><span>name: <span> 
                "pool" 
                …< 
                /span 
                >< 
                /span 
                >< 
                /span 
                >} 
               
 
                layers {<span><span>name: <span> 
                "loss" 
                …< 
                /span 
                >< 
                /span 
                >< 
                /span 
                >} 
               

回到頂部

數據及其導數以blobs的形式在層間流動。

回到頂部

Caffe的各層定義

Caffe層的定義由2部分組成：層屬性與層參數，例如

 
                name: 
                "conv1" 
               
                type 
                :CONVOLUTION 
               
                bottom: 
                "data" 
               
                top 
                : 
                "conv1" 
               
                convolution_param{ 
               
                num_output:<span>20 
               
                kernel_size:5 
               
                stride:1 
               
                weight_filler{ 
               
                type 
                :  
                "<span style=" 
                color:  
                #c0504d;">xavier</span>" 
               
                } 
               
                }

這段配置文件的前4行是層屬性，定義了層名稱、層類型以及層連接結構（輸入blob和輸出blob）；而后半部分是各種層參數。

Blob

Blob是用以存儲數據的4維數組，例如

對於數據：Number*Channel*Height*Width
對於卷積權重：Output*Input*Height*Width
對於卷積偏置：Output*1*1*1

回到頂部

訓練網絡

網絡參數的定義也非常方便，可以隨意設置相應參數。

甚至調用GPU運算只需要寫一句話：

1	`solver_mode:GPU`

Caffe 深度學習框架上手教程

Caffe的安裝與配置

Caffe需要預先安裝一些依賴項，首先是CUDA驅動。不論是CentOS還是Ubuntu都預裝了開源的nouveau顯卡驅動（SUSE沒有這種問題），如果不禁用，則CUDA驅動不能正確安裝。以Ubuntu為例，介紹一下這里的處理方法，當然也有其他處理方法。

生成mnist-train-leveldb/ 和 mnist-test-leveldb/，把數據轉化成leveldb格式：

訓練網絡:

 
                # sudo vi/etc/modprobe.d/blacklist.conf 
               
                # 增加一行 ：blacklist nouveau 
               
                sudoapt-get --purge remove xserver-xorg-video-nouveau    
                #把官方驅動徹底卸載： 
               
                sudoapt-get --purge remove nvidia-*     
                #清除之前安裝的任何NVIDIA驅動 
               
                sudo 
                service lightdm stop     
                #進命令行，關閉Xserver 
               
                sudo 
                kill 
                all Xorg

回到頂部

安裝了CUDA之后，依次按照Caffe官網安裝指南安裝BLAS、OpenCV、Boost即可。

回到頂部

Caffe跑跑MNIST試試

在Caffe安裝目錄之下，首先獲得MNIST數據集：

1 2	`cd` `data` `/mnist` `sh get_mnist.sh`

生成mnist-train-leveldb/ 和 mnist-test-leveldb/，把數據轉化成leveldb格式：

1 2	`cd` `examples` `/lenet` `sh create_mnist.sh`

訓練網絡:

1	`sh train_lenet.sh`

Caffe 深度學習框架上手教程

回到頂部

讓Caffe生成的數據集能在Theano上直接運行

不論使用何種框架進行CNNs訓練，共有3種數據集：

Training Set：用於訓練網絡
Validation Set：用於訓練時測試網絡准確率
Test Set：用於測試網絡訓練完成后的最終正確率

Caffe生成的數據分為2種格式：Lmdb和Leveldb

它們都是鍵/值對（Key/Value Pair）嵌入式數據庫管理系統編程庫。
雖然lmdb的內存消耗是leveldb的1.1倍，但是lmdb的速度比leveldb快10%至15%，更重要的是lmdb允許多種訓練模型同時讀取同一組數據集。
因此lmdb取代了leveldb成為Caffe默認的數據集生成格式。

Google Protocol Buffer的安裝

Protocol Buffer是一種類似於XML的用於序列化數據的自動機制。
首先在Protocol Buffers的中下載最新版本：
https://developers.google.com/protocol-buffers/docs/downloads
解壓后運行：

 
                . 
                /configure 
               
                $  
                make 
               
                $  
                make 
                check 
               
                $  
                make 
                install 
               
                pip installprotobuf

添加動態鏈接庫

1	`export` `LD_LIBRARY_PATH=` `/usr/local/lib` `:$LD_LIBRARY_PATH`

Lmdb的安裝

1	`pip` `install` `lmdb`

要 parse（解析）一個protobuf類型數據，首先要告訴計算機你這個protobuf數據內部是什么格式（有哪些項，這些項各是什么數據類型的決定了占用多少字節，這些項可否重復，重復幾次），安裝protobuf這個module就可以用protobuf專用的語法來定義這些格式（這個是.proto文件）了，然后用protoc來編譯這個.proto文件就可以生成你需要的目標文件。
想要定義自己的.proto文件請閱讀：
https://developers.google.com/protocol-buffers/docs/proto?hl=zh-cn

編譯.proto文件

1	`protoc--proto_path=IMPORT_PATH --cpp_out=DST_DIR --java_out=DST_DIR--python_out=DST_DIR path` `/to/file` `.proto`

 
                --proto_path 也可以簡寫成-I 是.proto所在的路徑 
               
                輸出路徑： 
               
                --cpp_out 要生成C++可用的頭文件，分別是***.pb.h（包含申明類）***.pb.cc（包含可執行類），使用的時候只要include “***.pb.h” 
               
                --java_out 生成java可用的頭文件 
               
                --python_out 生成python可用的頭文件，**_pb2.py，使用的時候 
                import 
                **_pb2.py即可 
               
                最后一個參數就是你的.proto文件完整路徑。

回到頂部

Caffe (CNN, deep learning) 介紹

Caffe -----------Convolution Architecture For Feature Embedding (Extraction)

Caffe 是什么東東？
- CNN (Deep Learning) 工具箱
- C++ 語言架構
- CPU 和GPU 無縫交換
- Python 和matlab的封裝
- 但是，Decaf只是CPU 版本。
為什么要用Caffe？
- 運算速度快。簡單友好的架構用到的一些庫：
- Google Logging library (Glog): 一個C++語言的應用級日志記錄框架，提供了C++風格的流操作和各種助手宏.
- lebeldb(數據存儲)：是一個google實現的非常高效的kv數據庫，單進程操作。
- CBLAS library（CPU版本的矩陣操作）
- CUBLAS library (GPU 版本的矩陣操作)
Caffe 架構

Caffe 深度學習框架上手教程

預處理圖像的leveldb構建
輸入：一批圖像和label （2和3）
輸出：leveldb （4）
指令里包含如下信息：
- conver_imageset （構建leveldb的可運行程序）
- train/ （此目錄放處理的jpg或者其他格式的圖像)
- label.txt (圖像文件名及其label信息)
- 輸出的leveldb文件夾的名字
- CPU/GPU (指定是在cpu上還是在gpu上運行code)
CNN網絡配置文件
- Imagenet_solver.prototxt （包含全局參數的配置的文件）
- Imagenet.prototxt （包含訓練網絡的配置的文件）
- Imagenet_val.prototxt （包含測試網絡的配置文件）

回到頂部

Caffe深度學習之圖像分類模型AlexNet解讀

在imagenet上的圖像分類challenge上Alex提出的alexnet網絡結構模型贏得了2012屆的冠軍。要研究CNN類型DL網絡模型在圖像分類上的應用，就逃不開研究alexnet，這是CNN在圖像分類上的經典模型（DL火起來之后）。

在DL開源實現caffe的model樣例中，它也給出了alexnet的復現，具體網絡配置文件如下 train_val.prototxt

接下來本文將一步步對該網絡配置結構中各個層進行詳細的解讀（訓練階段）：

各種layer的operation更多解釋可以參考 Caffe Layer Catalogue

從計算該模型的數據流過程中，該模型參數大概5kw+。

conv1階段DFD（data flow diagram）：
conv2階段DFD（data flow diagram）：
conv3階段DFD（data flow diagram）：
conv4階段DFD（data flow diagram）：
conv5階段DFD（data flow diagram）：
fc6階段DFD（data flow diagram）：
fc7階段DFD（data flow diagram）：
fc8階段DFD（data flow diagram）：

caffe的輸出中也有包含這塊的內容日志，詳情如下：

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

 
                I0721 10:38:15.326920  4692 net.cpp:125] Top shape: 256 3 227 227 (39574272) 
               
                I0721 10:38:15.326971  4692 net.cpp:125] Top shape: 256 1 1 1 (256) 
               
                I0721 10:38:15.326982  4692 net.cpp:156] data does not need backward computation. 
               
                I0721 10:38:15.327003  4692 net.cpp:74] Creating Layer conv1 
               
                I0721 10:38:15.327011  4692 net.cpp:84] conv1 <- data 
               
                I0721 10:38:15.327033  4692 net.cpp:110] conv1 -> conv1 
               
                I0721 10:38:16.721956  4692 net.cpp:125] Top shape: 256 96 55 55 (74342400) 
               
                I0721 10:38:16.722030  4692 net.cpp:151] conv1 needs backward computation. 
               
                I0721 10:38:16.722059  4692 net.cpp:74] Creating Layer relu1 
               
                I0721 10:38:16.722070  4692 net.cpp:84] relu1 <- conv1 
               
                I0721 10:38:16.722082  4692 net.cpp:98] relu1 -> conv1 ( 
                in 
                -place) 
               
                I0721 10:38:16.722096  4692 net.cpp:125] Top shape: 256 96 55 55 (74342400) 
               
                I0721 10:38:16.722105  4692 net.cpp:151] relu1 needs backward computation. 
               
                I0721 10:38:16.722116  4692 net.cpp:74] Creating Layer pool1 
               
                I0721 10:38:16.722125  4692 net.cpp:84] pool1 <- conv1 
               
                I0721 10:38:16.722133  4692 net.cpp:110] pool1 -> pool1 
               
                I0721 10:38:16.722167  4692 net.cpp:125] Top shape: 256 96 27 27 (17915904) 
               
                I0721 10:38:16.722187  4692 net.cpp:151] pool1 needs backward computation. 
               
                I0721 10:38:16.722205  4692 net.cpp:74] Creating Layer norm1 
               
                I0721 10:38:16.722221  4692 net.cpp:84] norm1 <- pool1 
               
                I0721 10:38:16.722234  4692 net.cpp:110] norm1 -> norm1 
               
                I0721 10:38:16.722251  4692 net.cpp:125] Top shape: 256 96 27 27 (17915904) 
               
                I0721 10:38:16.722260  4692 net.cpp:151] norm1 needs backward computation. 
               
                I0721 10:38:16.722272  4692 net.cpp:74] Creating Layer conv2 
               
                I0721 10:38:16.722280  4692 net.cpp:84] conv2 <- norm1 
               
                I0721 10:38:16.722290  4692 net.cpp:110] conv2 -> conv2 
               
                I0721 10:38:16.725225  4692 net.cpp:125] Top shape: 256 256 27 27 (47775744) 
               
                I0721 10:38:16.725242  4692 net.cpp:151] conv2 needs backward computation. 
               
                I0721 10:38:16.725253  4692 net.cpp:74] Creating Layer relu2 
               
                I0721 10:38:16.725261  4692 net.cpp:84] relu2 <- conv2 
               
                I0721 10:38:16.725270  4692 net.cpp:98] relu2 -> conv2 ( 
                in 
                -place) 
               
                I0721 10:38:16.725280  4692 net.cpp:125] Top shape: 256 256 27 27 (47775744) 
               
                I0721 10:38:16.725288  4692 net.cpp:151] relu2 needs backward computation. 
               
                I0721 10:38:16.725298  4692 net.cpp:74] Creating Layer pool2 
               
                I0721 10:38:16.725307  4692 net.cpp:84] pool2 <- conv2 
               
                I0721 10:38:16.725317  4692 net.cpp:110] pool2 -> pool2 
               
                I0721 10:38:16.725329  4692 net.cpp:125] Top shape: 256 256 13 13 (11075584) 
               
                I0721 10:38:16.725338  4692 net.cpp:151] pool2 needs backward computation. 
               
                I0721 10:38:16.725358  4692 net.cpp:74] Creating Layer norm2 
               
                I0721 10:38:16.725368  4692 net.cpp:84] norm2 <- pool2 
               
                I0721 10:38:16.725378  4692 net.cpp:110] norm2 -> norm2 
               
                I0721 10:38:16.725389  4692 net.cpp:125] Top shape: 256 256 13 13 (11075584) 
               
                I0721 10:38:16.725399  4692 net.cpp:151] norm2 needs backward computation. 
               
                I0721 10:38:16.725409  4692 net.cpp:74] Creating Layer conv3 
               
                I0721 10:38:16.725419  4692 net.cpp:84] conv3 <- norm2 
               
                I0721 10:38:16.725427  4692 net.cpp:110] conv3 -> conv3 
               
                I0721 10:38:16.735193  4692 net.cpp:125] Top shape: 256 384 13 13 (16613376) 
               
                I0721 10:38:16.735213  4692 net.cpp:151] conv3 needs backward computation. 
               
                I0721 10:38:16.735224  4692 net.cpp:74] Creating Layer relu3 
               
                I0721 10:38:16.735234  4692 net.cpp:84] relu3 <- conv3 
               
                I0721 10:38:16.735242  4692 net.cpp:98] relu3 -> conv3 ( 
                in 
                -place) 
               
                I0721 10:38:16.735250  4692 net.cpp:125] Top shape: 256 384 13 13 (16613376) 
               
                I0721 10:38:16.735258  4692 net.cpp:151] relu3 needs backward computation. 
               
                I0721 10:38:16.735302  4692 net.cpp:74] Creating Layer conv4 
               
                I0721 10:38:16.735312  4692 net.cpp:84] conv4 <- conv3 
               
                I0721 10:38:16.735321  4692 net.cpp:110] conv4 -> conv4 
               
                I0721 10:38:16.743952  4692 net.cpp:125] Top shape: 256 384 13 13 (16613376) 
               
                I0721 10:38:16.743988  4692 net.cpp:151] conv4 needs backward computation. 
               
                I0721 10:38:16.744000  4692 net.cpp:74] Creating Layer relu4 
               
                I0721 10:38:16.744010  4692 net.cpp:84] relu4 <- conv4 
               
                I0721 10:38:16.744020  4692 net.cpp:98] relu4 -> conv4 ( 
                in 
                -place) 
               
                I0721 10:38:16.744030  4692 net.cpp:125] Top shape: 256 384 13 13 (16613376) 
               
                I0721 10:38:16.744038  4692 net.cpp:151] relu4 needs backward computation. 
               
                I0721 10:38:16.744050  4692 net.cpp:74] Creating Layer conv5 
               
                I0721 10:38:16.744057  4692 net.cpp:84] conv5 <- conv4 
               
                I0721 10:38:16.744067  4692 net.cpp:110] conv5 -> conv5 
               
                I0721 10:38:16.748935  4692 net.cpp:125] Top shape: 256 256 13 13 (11075584) 
               
                I0721 10:38:16.748955  4692 net.cpp:151] conv5 needs backward computation. 
               
                I0721 10:38:16.748965  4692 net.cpp:74] Creating Layer relu5 
               
                I0721 10:38:16.748975  4692 net.cpp:84] relu5 <- conv5 
               
                I0721 10:38:16.748983  4692 net.cpp:98] relu5 -> conv5 ( 
                in 
                -place) 
               
                I0721 10:38:16.748998  4692 net.cpp:125] Top shape: 256 256 13 13 (11075584) 
               
                I0721 10:38:16.749011  4692 net.cpp:151] relu5 needs backward computation. 
               
                I0721 10:38:16.749022  4692 net.cpp:74] Creating Layer pool5 
               
                I0721 10:38:16.749030  4692 net.cpp:84] pool5 <- conv5 
               
                I0721 10:38:16.749039  4692 net.cpp:110] pool5 -> pool5 
               
                I0721 10:38:16.749050  4692 net.cpp:125] Top shape: 256 256 6 6 (2359296) 
               
                I0721 10:38:16.749058  4692 net.cpp:151] pool5 needs backward computation. 
               
                I0721 10:38:16.749074  4692 net.cpp:74] Creating Layer fc6 
               
                I0721 10:38:16.749083  4692 net.cpp:84] fc6 <- pool5 
               
                I0721 10:38:16.749091  4692 net.cpp:110] fc6 -> fc6 
               
                I0721 10:38:17.160079  4692 net.cpp:125] Top shape: 256 4096 1 1 (1048576) 
               
                I0721 10:38:17.160148  4692 net.cpp:151] fc6 needs backward computation. 
               
                I0721 10:38:17.160166  4692 net.cpp:74] Creating Layer relu6 
               
                I0721 10:38:17.160177  4692 net.cpp:84] relu6 <- fc6 
               
                I0721 10:38:17.160190  4692 net.cpp:98] relu6 -> fc6 ( 
                in 
                -place) 
               
                I0721 10:38:17.160202  4692 net.cpp:125] Top shape: 256 4096 1 1 (1048576) 
               
                I0721 10:38:17.160212  4692 net.cpp:151] relu6 needs backward computation. 
               
                I0721 10:38:17.160222  4692 net.cpp:74] Creating Layer drop6 
               
                I0721 10:38:17.160230  4692 net.cpp:84] drop6 <- fc6 
               
                I0721 10:38:17.160238  4692 net.cpp:98] drop6 -> fc6 ( 
                in 
                -place) 
               
                I0721 10:38:17.160258  4692 net.cpp:125] Top shape: 256 4096 1 1 (1048576) 
               
                I0721 10:38:17.160265  4692 net.cpp:151] drop6 needs backward computation. 
               
                I0721 10:38:17.160277  4692 net.cpp:74] Creating Layer fc7 
               
                I0721 10:38:17.160286  4692 net.cpp:84] fc7 <- fc6 
               
                I0721 10:38:17.160295  4692 net.cpp:110] fc7 -> fc7 
               
                I0721 10:38:17.342094  4692 net.cpp:125] Top shape: 256 4096 1 1 (1048576) 
               
                I0721 10:38:17.342157  4692 net.cpp:151] fc7 needs backward computation. 
               
                I0721 10:38:17.342175  4692 net.cpp:74] Creating Layer relu7 
               
                I0721 10:38:17.342185  4692 net.cpp:84] relu7 <- fc7 
               
                I0721 10:38:17.342198  4692 net.cpp:98] relu7 -> fc7 ( 
                in 
                -place) 
               
                I0721 10:38:17.342208  4692 net.cpp:125] Top shape: 256 4096 1 1 (1048576) 
               
                I0721 10:38:17.342217  4692 net.cpp:151] relu7 needs backward computation. 
               
                I0721 10:38:17.342228  4692 net.cpp:74] Creating Layer drop7 
               
                I0721 10:38:17.342236  4692 net.cpp:84] drop7 <- fc7 
               
                I0721 10:38:17.342245  4692 net.cpp:98] drop7 -> fc7 ( 
                in 
                -place) 
               
                I0721 10:38:17.342254  4692 net.cpp:125] Top shape: 256 4096 1 1 (1048576) 
               
                I0721 10:38:17.342262  4692 net.cpp:151] drop7 needs backward computation. 
               
                I0721 10:38:17.342274  4692 net.cpp:74] Creating Layer fc8 
               
                I0721 10:38:17.342283  4692 net.cpp:84] fc8 <- fc7 
               
                I0721 10:38:17.342291  4692 net.cpp:110] fc8 -> fc8 
               
                I0721 10:38:17.343199  4692 net.cpp:125] Top shape: 256 22 1 1 (5632) 
               
                I0721 10:38:17.343214  4692 net.cpp:151] fc8 needs backward computation. 
               
                I0721 10:38:17.343231  4692 net.cpp:74] Creating Layer loss 
               
                I0721 10:38:17.343240  4692 net.cpp:84] loss <- fc8 
               
                I0721 10:38:17.343250  4692 net.cpp:84] loss <- label 
               
                I0721 10:38:17.343264  4692 net.cpp:151] loss needs backward computation. 
               
                I0721 10:38:17.343305  4692 net.cpp:173] Collecting Learning Rate and Weight Decay. 
               
                I0721 10:38:17.343327  4692 net.cpp:166] Network initialization  
                done 
                . 
               
                I0721 10:38:17.343335  4692 net.cpp:167] Memory required  
                for 
                Data 1073760256

CIFAR-10在caffe上進行訓練與學習

使用數據庫：CIFAR-10

60000張 32X32 彩色圖像 10類，50000張訓練，10000張測試

Caffe 深度學習框架上手教程

准備

在終端運行以下指令：

 
                cd 
                $CAFFE_ROOT 
                /data/cifar10 
               
 
                . 
                /get_cifar10 
                .sh 
               
 
                cd 
                $CAFFE_ROOT 
                /examples/cifar10 
               
 
                . 
                /create_cifar10 
                .sh 
               

其中CAFFE_ROOT是caffe-master在你機子的地址

運行之后，將會在examples中出現數據庫文件./cifar10-leveldb和數據庫圖像均值二進制文件./mean.binaryproto

Caffe 深度學習框架上手教程

模型

該CNN由卷積層，POOLing層，非線性變換層，在頂端的局部對比歸一化線性分類器組成。該模型的定義在 CAFFE_ROOT/examples/cifar10 directory’s cifar10_quick_train.prototxt中，可以進行修改。其實后綴為prototxt很多都是用來修改配置的。

Caffe 深度學習框架上手教程

訓練和測試

訓練這個模型非常簡單，當我們寫好參數設置的文件cifar10_quick_solver.prototxt和定義的文件cifar10_quick_train.prototxt和cifar10_quick_test.prototxt后，運行 train_quick.sh或者在終端輸入下面的命令：

1 2	`cd` `$CAFFE_ROOT` `/examples/cifar10` `.` `/train_quick` `.sh`

即可，train_quick.sh是一個簡單的腳本，會把執行的信息顯示出來，培訓的工具是train_net.bin,cifar10_quick_solver.prototxt作為參數。

然后出現類似以下的信息：這是搭建模型的相關信息

 
                I0317 21:52:48.945710 2008298256 net.cpp:74] Creating Layer conv1 
               
                I0317 21:52:48.945716 2008298256 net.cpp:84] conv1 <- data 
               
                I0317 21:52:48.945725 2008298256 net.cpp:110] conv1 -> conv1 
               
                I0317 21:52:49.298691 2008298256 net.cpp:125] Top shape: 100 32 32 32 (3276800) 
               
                I0317 21:52:49.298719 2008298256 net.cpp:151] conv1 needs backward computation.

接着：

 
                0317 21:52:49.309370 2008298256 net.cpp:166] Network initialization  
                done 
                . 
               
                I0317 21:52:49.309376 2008298256 net.cpp:167] Memory required  
                for 
                Data 23790808 
               
                I0317 21:52:49.309422 2008298256 solver.cpp:36] Solver scaffolding  
                done 
                . 
               
                I0317 21:52:49.309447 2008298256 solver.cpp:47] Solving CIFAR10_quick_train

之后，訓練開始

 
                I0317 21:53:12.179772 2008298256 solver.cpp:208] Iteration 100, lr = 0.001 
               
                I0317 21:53:12.185698 2008298256 solver.cpp:65] Iteration 100, loss = 1.73643 
               
                ... 
               
                I0317 21:54:41.150030 2008298256 solver.cpp:87] Iteration 500, Testing net 
               
                I0317 21:54:47.129461 2008298256 solver.cpp:114] Test score  
                #0: 0.5504 
               
                I0317 21:54:47.129500 2008298256 solver.cpp:114] Test score  
                #1: 1.27805

其中每100次迭代次數顯示一次訓練時lr(learningrate),和loss（訓練損失函數），每500次測試一次，輸出score 0（准確率）和score 1（測試損失函數）

當5000次迭代之后，正確率約為75%，模型的參數存儲在二進制protobuf格式在cifar10_quick_iter_5000

然后，這個模型就可以用來運行在新數據上了。

其他

另外，更改cifar*solver.prototxt文件可以使用CPU訓練，

1 2	`# solver mode: CPU or GPU` `solver_mode: CPU`

可以看看CPU和GPU訓練的差別。

主要資料來源：caffe官網教程

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Caffe安裝教程(原創) caffe—ssd安裝教程 Caffe C++使用教程 virtualenv 下安裝caffe教程運行caffe自帶的mnist實例教程 caffe2 教程入門（python版） Ubuntu16.04安裝配置Caffe教程(GPU版) 深度學習-Windows平台下的Caffe編譯教程 Ubuntu-安裝-theano+caffe-超詳細教程 ubuntu16.04+caffe+GPU+cuda+cudnn安裝教程