使用TensorFlow的遞歸神經網絡（LSTM）進行序列預測

本文轉載自查看原文 2017-11-21 18:16 6545 機器學習

本篇文章介紹使用TensorFlow的遞歸神經網絡（LSTM）進行序列預測。作者在網上找到的使用LSTM模型的案例都是解決自然語言處理的問題，而沒有一個是來預測連續值的。

所以呢，這里是基於歷史觀察數據進行實數序列的預測。傳統的神經網絡模型並不能解決這種問題，進而開發出遞歸神經網絡模型，遞歸神經網絡模型可以存儲歷史數據來預測未來的事情。

在這個例子里將預測幾個函數：

正弦函數：sin

同時存在正弦函數和余弦函數：sin和cos

x＊sin(x)

首先，建立LSTM模型，lstm_model，這個模型有一系列的不同時間步的lstm單元（cell），緊跟其后的是稠密層。

def lstm_model(time_steps, rnn_layers, dense_layers=None):
     def lstm_cells(layers):
         if isinstance(layers[0], dict):
             return [tf.nn.rnn_cell.DropoutWrapper(tf.nn.rnn_cell.BasicLSTMCell(layer['steps']), layer['keep_prob'])
                     if layer.get('keep_prob') else tf.nn.rnn_cell.BasicLSTMCell(layer['steps'])
                     for layer in layers]
         return [tf.nn.rnn_cell.BasicLSTMCell(steps) for steps in layers]
     def dnn_layers(input_layers, layers):
         if layers and isinstance(layers, dict):
             return skflow.ops.dnn(input_layers,
                                   layers['layers'],
                                   activation=layers.get('activation'),
                                   dropout=layers.get('dropout'))
         elif layers:
             return skflow.ops.dnn(input_layers, layers)
         else:
             return input_layers
     def _lstm_model(X, y):
         stacked_lstm = tf.nn.rnn_cell.MultiRNNCell(lstm_cells(rnn_layers))
         x_ = skflow.ops.split_squeeze(1, time_steps, X)
         output, layers = tf.nn.rnn(stacked_lstm, x_, dtype=dtypes.float32)
         output = dnn_layers(output[-1], dense_layers)
         return skflow.models.linear_regression(output, y)
     return _lstm_model

所建立的模型期望輸入數據的維度與（batch size，第一個lstm cell的時間步長time_step，特征數量num_features）相關。
接下來我們按模型所能接受的數據方式來准備數據。

def rnn_data(data, time_steps, labels=False):
    """
    creates new data frame based on previous observation
      * example:
        l = [1, 2, 3, 4, 5]
        time_steps = 2
        -> labels == False [[1, 2], [2, 3], [3, 4]]
        -> labels == True [2, 3, 4, 5]
    """
    rnn_df = []
    for i in range(len(data) - time_steps):
        if labels:
            try:
                rnn_df.append(data.iloc[i + time_steps].as_matrix())
            except AttributeError:
                rnn_df.append(data.iloc[i + time_steps])
        else:
            data_ = data.iloc[i: i + time_steps].as_matrix()
            rnn_df.append(data_ if len(data_.shape) > 1 else [[i] for i in data_])
    return np.array(rnn_df)
def split_data(data, val_size=0.1, test_size=0.1):
    """
    splits data to training, validation and testing parts
    """
    ntest = int(round(len(data) * (1 - test_size)))
    nval = int(round(len(data.iloc[:ntest]) * (1 - val_size)))
    df_train, df_val, df_test = data.iloc[:nval], data.iloc[nval:ntest], data.iloc[ntest:]
    return df_train, df_val, df_test
def prepare_data(data, time_steps, labels=False, val_size=0.1, test_size=0.1):
    """
    Given the number of `time_steps` and some data.
    prepares training, validation and test data for an lstm cell.
    """
    df_train, df_val, df_test = split_data(data, val_size, test_size)
    return (rnn_data(df_train, time_steps, labels=labels),
            rnn_data(df_val, time_steps, labels=labels),
            rnn_data(df_test, time_steps, labels=labels))
def generate_data(fct, x, time_steps, seperate=False):
    """generate data with based on a function fct"""
    data = fct(x)
    if not isinstance(data, pd.DataFrame):
        data = pd.DataFrame(data)
    train_x, val_x, test_x = prepare_data(data['a'] if seperate else data, time_steps)
    train_y, val_y, test_y = prepare_data(data['b'] if seperate else data, time_steps, labels=True)
    return dict(train=train_x, val=val_x, test=test_x), dict(train=train_y, val=val_y, test=test

這將會創建一個數據讓模型可以查找過去time_steps步來預測數據。比如，LSTM模型的第一個cell是10 time_steps cell，為了做預測我們需要輸入10個歷史數據點。y值跟我們想預測的第十個值相關。
現在創建一個基於LSTM模型的回歸量。

regressor = skflow.TensorFlowEstimator(model_fn=lstm_model(TIMESTEPS, RNN_LAYERS, DENSE_LAYERS),
                                       n_classes=0,
                                       verbose=1,  
                                       steps=TRAINING_STEPS,
                                       optimizer='Adagrad',
                                       learning_rate=0.03,
                                       batch_size=BATCH_SIZE)

預測sin函數

X, y = generate_data(np.sin, np.linspace(0, 100, 10000), TIMESTEPS, seperate=False)
# create a lstm instance and validation monitor
validation_monitor = skflow.monitors.ValidationMonitor(X['val'], y['val'], n_classes=0,
                                                       print_steps=PRINT_STEPS,
                                                       early_stopping_rounds=1000,
                                                       logdir=LOG_DIR)
regressor.fit(X['train'], y['train'], validation_monitor, logdir=LOG_DIR)
# > last training steps
# Step #9700, epoch #119, avg. train loss: 0.00082, avg. val loss: 0.00084
# Step #9800, epoch #120, avg. train loss: 0.00083, avg. val loss: 0.00082
# Step #9900, epoch #122, avg. train loss: 0.00082, avg. val loss: 0.00082
# Step #10000, epoch #123, avg. train loss: 0.00081, avg. val loss: 0.00081

預測測試數據

mse = mean_squared_error(regressor.predict(X['test']), y['test'])
print ("Error: {}".format(mse))
# 0.000776

真實sin函數

預測sin函數

預測sin和cos混合函數

def sin_cos(x):
    return pd.DataFrame(dict(a=np.sin(x), b=np.cos(x)), index=x)
X, y = generate_data(sin_cos, np.linspace(0, 100, 10000), TIMESTEPS, seperate=False)
# create a lstm instance and validation monitor
validation_monitor = skflow.monitors.ValidationMonitor(X['val'], y['val'], n_classes=0,
                                                       print_steps=PRINT_STEPS,
                                                       early_stopping_rounds=1000,
                                                       logdir=LOG_DIR)
regressor.fit(X['train'], y['train'], validation_monitor, logdir=LOG_DIR)
# > last training steps
# Step #9500, epoch #117, avg. train loss: 0.00120, avg. val loss: 0.00118
# Step #9600, epoch #118, avg. train loss: 0.00121, avg. val loss: 0.00118
# Step #9700, epoch #119, avg. train loss: 0.00118, avg. val loss: 0.00118
# Step #9800, epoch #120, avg. train loss: 0.00118, avg. val loss: 0.00116
# Step #9900, epoch #122, avg. train loss: 0.00118, avg. val loss: 0.00115
# Step #10000, epoch #123, avg. train loss: 0.00117, avg. val loss: 0.00115

預測測試數據

mse = mean_squared_error(regressor.predict(X['test']), y['test'])
print ("Error: {}".format(mse))
# 0.001144

真實的sin_cos函數

預測的sin_cos函數

預測x*sin函數

def x_sin(x):
     return x * np.sin(x)
 X, y = generate_data(x_sin, np.linspace(0, 100, 10000), TIMESTEPS, seperate=False)
 # create a lstm instance and validation monitor
 validation_monitor = skflow.monitors.ValidationMonitor(X['val'], y['val'], n_classes=0,
                                                        print_steps=PRINT_STEPS,
                                                        early_stopping_rounds=1000,
                                                        logdir=LOG_DIR)
 regressor.fit(X['train'], y['train'], validation_monitor, logdir=LOG_DIR)
 # > last training steps
 # Step #32500, epoch #401, avg. train loss: 0.48248, avg. val loss: 15.98678
 # Step #33800, epoch #417, avg. train loss: 0.47391, avg. val loss: 15.92590
 # Step #35100, epoch #433, avg. train loss: 0.45570, avg. val loss: 15.77346
 # Step #36400, epoch #449, avg. train loss: 0.45853, avg. val loss: 15.61680
 # Step #37700, epoch #465, avg. train loss: 0.44212, avg. val loss: 15.48604
 # Step #39000, epoch #481, avg. train loss: 0.43224, avg. val loss: 15.43947

預測測試數據

mse = mean_squared_error(regressor.predict(X['test']), y['test'])
print ("Error: {}".format(mse))
# 61.024454351

真實的x*sin函數

預測的x*sin函數

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 拓端數據tecdat|使用Python中Keras的LSTM遞歸神經網絡進行時間序列預測使用tensorflow的lstm網絡進行時間序列預測深度學習筆記（一） tf.keras 構建lstm神經網絡進行時間序列預測 Pytorch循環神經網絡LSTM時間序列預測風速 TensorFlow(十一)：遞歸神經網絡（RNN與LSTM） Tensorflow 循環神經網絡基本 RNN 和 LSTM 網絡擬合、預測sin曲線 Tensorflow之基於LSTM神經網絡寫唐詩拓端tecdat|Python用LSTM長短期記憶神經網絡對不穩定降雨量時間序列進行預測分析拓端數據tecdat|matlab使用長短期記憶（LSTM）神經網絡對序列數據進行分類循環神經網絡LSTM RNN回歸：sin曲線預測