-
論文名稱
基於循環神經網絡的時序數據聚類算法及其並行化,王國瑞. -
研究對象
主要圍繞時序數據聚類問題,不同於已有的時序數據聚類方法,本文獻的研究是基於循環神經網絡的時序數據聚類方法,研究成果可用於金融股票數據分析。 -
研究動機
在時間序列數據挖掘領域,結合循環神經網絡將其應用在時間序列數據預測及聚類任務上。 -
文獻綜述
- 基於時間臨近度的時序聚類:主要在於序列相似性的衡量,利用不同的相似度計算方法進行聚類。
- 基於特征變換的時序聚類:基於特征變換的方法是將原始數據進行轉換得到新的特征數據,再利用聚類算法進行聚類。
- 基於模型的時序聚類:用模型對時序數據進行擬合,時間序列是否相似取決於模型相似情況,利用時間序列擬合時序預測模型參數,最后利用這些參數進行聚類。
-
研究方案設計
- 利用深度學習技術對時序數據進行處理,用RNN捕捉時序數據中的隱含依賴關系,進而聚類。
- LSTM對時間序列進行學習,得到全體隱藏層信息並利用平均池化降維,增強隱層表達能力,最后利用K-Means得到聚類結果。
- GRU進行學習,得到特征信息利用K-Means得到聚類結果。
-
使用數據集
Eamonn教授與其學生整理的UCR數據集,從中選取七組數據。 -
研究結論
-
學習心得
對論文整體結構進行梳理,本文研究基於循環神經的時序數據聚類方法,在XMind知識節點上,記錄了研讀筆記,根據思維導圖系統全面的學習,深究論文中尚未了解的知識,試着把論文研究結果在股票數據集上應用,繼續把這篇論文讀透。