import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data
#下載MINIST數據集
mnist = input_data.read_data_sets('MNIST_data', one_hot=True)
#表示輸入任意數量的MNIST圖像,每一張圖展平成784維的向量
#placeholder是占位符,在訓練時指定
x = tf.placeholder(tf.float32, [None, 784])
#初始化W,b矩陣
W = tf.Variable(tf.zeros([784,10]))
b = tf.Variable(tf.zeros([10]))
#tf.matmul(X,W)表示x乘以W
y = tf.nn.softmax(tf.matmul(x, W) + b)
#為了計算交叉熵,我們首先需要添加一個新的占位符用於輸入正確值
y_ = tf.placeholder("float", [None,10])
#交叉熵損失函數
cross_entropy = -tf.reduce_sum(y_*tf.log(y))
#模型的訓練,不斷的降低成本函數
#要求TensorFlow用梯度下降算法(gradient descent algorithm)以0.01的學習速率最小化交叉熵
train_step = tf.train.GradientDescentOptimizer(0.01).minimize(cross_entropy)
#在運行計算之前,需要添加一個操作來初始化我們創建的變量
init = tf.initialize_all_variables()
#在Session里面啟動我模型,並且初始化變量
sess = tf.Session()
sess.run(init)
#開始訓練模型,循環訓練1000次
for i in range(50):
#隨機抓取訓練數據中的100個批處理數據點
batch_xs, batch_ys = mnist.train.next_batch(100)
#然后我們用這些數據點作為參數替換之前的占位符來運行train_step
sess.run(train_step, feed_dict={x: batch_xs, y_: batch_ys})
#檢驗真實標簽與預測標簽是否一致
correct_prediction = tf.equal(tf.argmax(y,1), tf.argmax(y_,1))
#計算精確度,將true和false轉化成相應的浮點數,求和取平均
accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float"))
#計算所學習到的模型在測試數據集上面的正確率
print(sess.run(accuracy, feed_dict={x: mnist.test.images, y_: mnist.test.labels}))
