1.關於Keras
1)簡介
Keras是由純python編寫的基於theano/tensorflow的深度學習框架。
Keras是一個高層神經網絡API,支持快速實驗,能夠把你的idea迅速轉換為結果,如果有如下需求,可以優先選擇Keras:
a)簡易和快速的原型設計(keras具有高度模塊化,極簡,和可擴充特性)
b)支持CNN和RNN,或二者的結合
c)無縫CPU和GPU切換
2)設計原則
a)用戶友好:Keras是為人類而不是天頂星人設計的API。用戶的使用體驗始終是我們考慮的首要和中心內容。Keras遵循減少認知困難的最佳實踐:Keras提供一致而簡潔的API, 能夠極大減少一般應用下用戶的工作量,同時,Keras提供清晰和具有實踐意義的bug反饋。
b)模塊性:模型可理解為一個層的序列或數據的運算圖,完全可配置的模塊可以用最少的代價自由組合在一起。具體而言,網絡層、損失函數、優化器、初始化策略、激活函數、正則化方法都是獨立的模塊,你可以使用它們來構建自己的模型。
c)易擴展性:添加新模塊超級容易,只需要仿照現有的模塊編寫新的類或函數即可。創建新模塊的便利性使得Keras更適合於先進的研究工作。
d)與Python協作:Keras沒有單獨的模型配置文件類型(作為對比,caffe有),模型由python代碼描述,使其更緊湊和更易debug,並提供了擴展的便利性。
2.Keras的模塊結構
3.使用Keras搭建一個神經網絡
4.主要概念
1)符號計算
Keras的底層庫使用Theano或TensorFlow,這兩個庫也稱為Keras的后端。無論是Theano還是TensorFlow,都是一個“符號式”的庫。符號計算首先定義各種變量,然后建立一個“計算圖”,計算圖規定了各個變量之間的計算關系。
符號計算也叫數據流圖,其過程如下(gif圖不好打開,所以用了靜態圖,數據是按圖中黑色帶箭頭的線流動的):
2)張量
張量(tensor),可以看作是向量、矩陣的自然推廣,用來表示廣泛的數據類型。張量的階數也叫維度。
0階張量,即標量,是一個數。
1階張量,即向量,一組有序排列的數
2階張量,即矩陣,一組向量有序的排列起來
3階張量,即立方體,一組矩陣上下排列起來
4階張量......
依次類推
重點:關於維度的理解
假如有一個10長度的列表,那么我們橫向看有10個數字,也可以叫做10維度,縱向看只能看到1個數字,那么就叫1維度。注意這個區別有助於理解Keras或者神經網絡中計算時出現的維度問題。
3)數據格式(data_format)
目前主要有兩種方式來表示張量:
a) th模式或channels_first模式,Theano和caffe使用此模式。
b)tf模式或channels_last模式,TensorFlow使用此模式。
下面舉例說明兩種模式的區別:
對於100張RGB3通道的16×32(高為16寬為32)彩色圖,
th表示方式:(100,3,16,32)
tf表示方式:(100,16,32,3)
唯一的區別就是表示通道個數3的位置不一樣。
4)模型
Keras有兩種類型的模型,序貫模型(Sequential)和函數式模型(Model),函數式模型應用更為廣泛,序貫模型是函數式模型的一種特殊情況。
a)序貫模型(Sequential):單輸入單輸出,一條路通到底,層與層之間只有相鄰關系,沒有跨層連接。這種模型編譯速度快,操作也比較簡單
b)函數式模型(Model):多輸入多輸出,層與層之間任意連接。這種模型編譯速度慢。
5.第一個示例
這里也采用介紹神經網絡時常用的一個例子:手寫數字的識別。
在寫代碼之前,基於這個例子介紹一些概念,方便大家理解。
PS:可能是版本差異的問題,官網中的參數和示例中的參數是不一樣的,官網中給出的參數少,並且有些參數支持,有些不支持。所以此例子去掉了不支持的參數,並且只介紹本例中用到的參數。
1)Dense(500,input_shape=(784,))
a)Dense層屬於網絡層-->常用層中的一個層
b) 500表示輸出的維度,完整的輸出表示:(*,500):即輸出任意個500維的數據流。但是在參數中只寫維度就可以了,比較具體輸出多少個是有輸入確定的。換個說法,Dense的輸出其實是個N×500的矩陣。
c)input_shape(784,) 表示輸入維度是784(28×28,后面具體介紹為什么),完整的輸入表示:(*,784):即輸入N個784維度的數據
2)Activation('tanh')
a)Activation:激活層
b)'tanh' :激活函數
3)Dropout(0.5)
在訓練過程中每次更新參數時隨機斷開一定百分比(rate)的輸入神經元,防止過擬合。
4)數據集
數據集包括60000張28×28的訓練集和10000張28×28的測試集及其對應的目標數字。如果完全按照上述數據格式表述,以tensorflow作為后端應該是(60000,28,28,3),因為示例中采用了mnist.load_data()獲取數據集,所以已經判斷使用了tensorflow作為后端,因此數據集就變成了(60000,28,28),那么input_shape(784,)應該是input_shape(28,28,)才對,但是在這個示例中這么寫是不對的,需要轉換成(60000,784),才可以。為什么需要轉換呢?
如上圖,訓練集(60000,28,28)作為輸入,就相當於一個立方體,而輸入層從當前角度看就是一個平面,立方體的數據流怎么進入平面的輸入層進行計算呢?所以需要進行黃色箭頭所示的變換,然后才進入輸入層進行后續計算。至於從28*28變換成784之后輸入層如何處理,就不需要我們關心了。(喜歡鑽研的同學可以去研究下源代碼)。
並且,Keras中輸入多為(nb_samples, input_dim)的形式:即(樣本數量,輸入維度)。
5)示例代碼
from keras.models import Sequential model.add(Dense(500)) # 隱藏層節點500個 model.add(Dense(10)) # 輸出結果是10個類別,所以維度是10 ''' ''' model.fit(X_train,Y_train, batch_size=200, epochs=50, shuffle=True, verbose=0, validation_split=0.3) ''' result_max = numpy.argmax(result, axis = 1) result_bool = numpy.equal(result_max, test_max) |