#-*- coding: utf-8 -*- #使用神經網絡算法預測銷量高低 import pandas as pd #參數初始化 inputfile = 'data/sales_data.xls' data = pd.read_excel(inputfile, index_col = u'序號') #導入數據 #數據是類別標簽,要將它轉換為數據 #用1來表示“好”、“是”、“高”這三個屬性,用0來表示“壞”、“否”、“低” data[data == u'好'] = 1 data[data == u'是'] = 1 data[data == u'高'] = 1 data[data != 1] = 0 x = data.iloc[:,:3].as_matrix().astype(int) y = data.iloc[:,3].as_matrix().astype(int) print(x) print(y) from keras.models import Sequential from keras.layers.core import Dense, Activation,Dropout #通過.add()方式一層層添加(一個add為一層) model = Sequential() model.add(Dense(64, input_shape=(3,)))#添加64節點的全連接 model.add(Dropout(0.5))##dropoutdropout是指在深度學習網絡的訓練過程中,對於神經網絡單元,按照一定的概率將其暫時從網絡中丟棄 model.add(Dense(64, activation='relu'))#以Relu函數為激活函數 model.add(Dropout(0.5)) model.add(Dense(1, activation='sigmoid'))#以sigmoid函數為激活函數 model.compile(loss='binary_crossentropy', optimizer='rmsprop', metrics=['accuracy']) #編譯模型。由於我們做的是二元分類,所以我們指定損失函數為binary_crossentropy,以及模式為binary #另外常見的損失函數還有mean_squared_error、categorical_crossentropy等,請閱讀幫助文件。 #求解方法我們指定用adam,還有sgd、rmsprop等可選 model.fit(x, y, nb_epoch = 1000, batch_size = 10) #訓練模型,學習一千次 yp = model.predict_classes(x).reshape(len(y)) #分類預測 from cm_plot import * # 導入自行編寫的混淆矩陣可視化函數 cm_plot(y, yp).show()