tensorflow 是一個google開源的深度學習的框架,執行性能良好,值得使用。
caffe,caffe2 通過配置就可以拼湊一個深度學習框架,大大簡化流程但也依賴大量的開源庫,性能也不錯。2013開始面世,很有活力的一個框架。
keras 這個一個積木式的框架,有很多現成的函數 可以直接拿來用,開發速度杠杠的,就是缺少靈活性。
MXNet 是一個全功能,靈活可編程和高擴展性的深度學習框架,可能學術上用的比較多吧!
Torch 是一個facebook在維護的框架,靈活性也很大,不過要lua語言結合使用;
CNTK微軟推出的一個深度學習框架,可以在window上執行,性能據說是最優的,可是使用者不多,可能是市場都被主流的幾個占有了;
Deeplearning4j java的一個深度學習庫,不甚了解;
Theano 是一個很古老的框架,在研究室就開始使用,性能比較差,速度最慢的,生產環境不會用的,只是現在有些研究室還在用。
其他:
SciKit-learn 是老牌的開源 Python 算法框架
openCV 是一個圖片及視覺算法的框架
=============================================================
最要建議就是學學:
tensorflow + caffe(caffe2)
其實想深入研究原理也可以簡單使用
numpy + matplotlib
===============================================================
tensorflow的運行規律,就是步驟了:
1, 創建tensorflow變量,初始變量,用於執行的的
2, 設置操作的配置
3, 初始化tensorflow 例子
4, 創建tensorflow session (session是執行引擎)
5, 執行session 即運行你的例子
==============================================================
以上是tensorflow使用的一般步驟,接下來就一個線性回歸的例子來,我們先分拆各個代碼塊來講解,然后把把代碼塊合並成一個大的例子。在看tensorflow這個例子,你最好有一些深度學習的基礎,以免看得一頭霧水。
(1) loss函數的計算:
y_hat = tf.constant(36,name=’y_hat’) y = tf.constant(39,name=’y’) loss = tf.Variable((y-y_hat)**2,name=’loss’) init = tf.global_variables_initializer() with tf.Session() as session: session.run(init) # 初始化全局變量 print(session.run(loss)) # 執行計算 打印出最好loss的值
(2) 計算返回的機制
a = tf.constant(2) b= ft.constant(2) c=tf.multiply(a,b) print(c) # 返回結果 Tensor("Mul_1:0", shape=(), dtype=int32) sess=tf.session() print(sess.run(c)) #返回20
(3) 設置容器,然后通過函數賦值,進行計算
x = tf.placeholder(tf.init64,name=’x’) print(sess.run(2*x,feed_dict={x:3})) #把字典里的值 賦值給我2*x sess.close()
===========================================
2,線性回歸計算 函數塊
2.1 線性函數的計算
Y=WX+b (X:是一個隨機變量,b是一個偏差變量)
預說明:
tf.matmul(..,..) 是矩陣階乘的工具
tf.add(..,..) 矩陣加法函數
np.random.randn(..) 隨機生成正太隨機數
def linear_function() np.random.seed(1) X=tf.constant(np.random.randn(3,1),name=”X”) W=tf.constant(np.random.randn(4,3),name=”W”) b = tf.constant(np.random.randn(4,1),name=”b”) Y=tf.add(tf.matmul(W,X),b) Sess = tf.Session() result=sess.run(Y) sess.close() return result print(“result=”+str(linear_function()))
運行結果:
result = [[-2.15657382]
[ 2.95891446]
[-1.08926781]
[-0.84538042]]
2.2 計算sigmoid
如果你學了深度學習一定知道sigmoid 是什么,其實也是數學里的一個函數:y= 1/(1+e^(-x))
在tensorflow里有專門的sigmoid函數
1) tf.placeholder(tf.float32,name=””)
2) tf.sigmoid(..)
3) sess.run(…,feed_dict={x:z})
方法1 :
Sess = tf.Session()
result =sess.run(…,feed_dict ={…})
sess.close()
方法2:
With tf.Session as sess: #會自動關閉session
result = sess.run(..,feed_dict = {…})
def sigmoid(z): x = tf.placeholder(tf.float32,name = “x”) sigmoid = tf.sigmoid(x) with tf.Session() as sess: result = sess.run(sigmoid,feed_dict = {x:z}) return result
2.3 損失函數 (成本函數)
在tensorflow 函數里,你可能會用到:
tf.nn.sigmoid_cross_entropy_with_logits(logits=….,lables=…)
def cost(logits,labels): z = tf.placeholder(tf.float32,name=”z”) y= tf.placeholder(tf.float32,name=”y”) cost = tf.nn.sigmoid_cross_entropy_with_logits(logits=z, labels=y) sess.close() return cost #測試 logits = sigmoid(np.array([0.2,0.4,0.7,0.9])) cost = cost(logits, np.array([0,0,1,1])) print ("cost = " + str(cost))
# 輸出結果:
cost = [ 1.00538719 1.03664076 0.41385433 0.39956617]
2.4 分類映射
把y向量映射成矩陣,然后通過矩陣判斷分類,tensorflow有現成的函數:
tf.one_hot(labels,depth,axis)
def one_hot_matrix(labels,C): depth = tf.constant(value=C,name=”C”) one_hot_matrix = tf.one_hot(labels,depth,axis=0) sess = tf.Session() one_hot = sess.run(one_hot_matrix) sess.close() return one_hot
小測:
labels = np.array([1,2,3,0,2,1]) one_hot = one_hot_matrix(labels, C = 4) print ("one_hot = " + str(one_hot))
2.5 初始化矩陣
tf.ones(shape) 跟 numpy的numpy.ones() 差不多
def ones(shape): ones = tf.ones(3) sess = tf.Session() ones = tf.run(ones) sess.close() return ones print(“ones =”+str(ones([3]))) #輸出 ones [1,1,1]
先講到這里,不想篇幅太長。
參考:吳恩達教學視頻及其課件 http://mooc.study.163.com/smartSpec/detail/1001319001.htm