眾所周知,在證券投資領域將涉及很多數據,因此,通過簡單的處理難以有效地分析各種公司股票之間的關系,而關聯規則挖掘可以很好的解決這個問題,它允許投資在大量數據中,發現企業股票的相關性,以進一步研究和分析。是股民的得力助手!
我們從2015年1月至2016年1月收集了香港部分上市公司的股票交易數據,作為分析主體,探討其間的潛在影響。
現在通過關聯規則分析挖掘出,當股價上漲的時候,另一股票的價格會隨着情況而上漲的情況。
首先,股票交易數據可視化,觀察股價之間的關系。 在IBM SPSS Modeler軟件中,我們使用網絡圖節點來分析上市公司股價上漲的潛在聯系,並找出其間的強關聯規則。
線段的粗細程度由線段兩端點的股票的價格同時上漲的天數決定,如果線段兩端的股票的價格同時上漲的實際情況的頻數越大,那么鏈接兩只股票間的線段就越粗。如果線段兩端的股票的價格同時上漲的實際情況的頻數越小,那么鏈接兩只股票間的線段就越細。從這一圖中很明顯的可以看出復興醫葯和白雲山之間有着很強的關聯。
提高閾值的網絡圖
得到基於 Apriori 算法的關聯規則的結果 :
關聯規則結果
第一行規則表明, 當該白雲山價格出現上漲的趨勢時,股票復星醫葯的股價很可能也會隨之上漲。原因是在股票的歷史交易數據中發現股票白雲山和股票復星醫葯 同時上漲的情況發生了 130 次,占總事件的 35%,在這些時候有 100%的時候股票白雲山的價格也發生了上漲。
但是預測對了就能掙錢嗎? 這個就不一定。 建立的是一種數學或者統計模型,它能表現出已有數據的一些規律,但是未來的數據是否遵循這種規律,是不一定的。尤其是外在環境變量太多,甚至有人為因素。風險的控制,資金管理,自我情緒的管理這些都也很重要。技術大牛們都說系統交易到最后都是對人性的考驗。