《BI那點兒事》數據挖掘各類算法——准確性驗證


准確性驗證示例1:——基於三國志11數據庫

數據准備:

挖掘模型:
依次為:Naive Bayes 算法、聚類分析算法、決策樹算法、神經網絡算法、邏輯回歸算法、關聯算法

提升圖:

依次排名為:
1. 神經網絡算法(92.69% 0.99)
2. 邏輯回歸算法(92.39% 0.99)
3. 決策樹算法(91.19% 0.98)
4. 關聯算法(90.60% 0.98)
5. 聚類分析算法(89.25% 0.96)
6. Naive Bayes 算法(87.61 0.96)

Naive Bayes算法——分類矩陣

說明:
其他類的538個樣本有482個預測正確,32個錯分為軍師類,24個錯分為將軍類,預測正確率為89.59%;
軍師20個樣本有13個預測正確,7個錯分為其他類,預測正確率為65%;
將軍112個樣本有92個預測正確,16個錯分為其他類,4個錯分為軍師類,預測正確率為82.14%。
聚類分析算法——分類矩陣

說明:
其他類的538個樣本有536個預測正確,2個錯分為將軍類,預測正確率為99.63%;
軍師20個樣本有0個預測正確,20個錯分為其他類,預測正確率為0%;
將軍112個樣本有62個預測正確,50個錯分為其他類,預測正確率為55.36%。
決策樹算法——分類矩陣

說明:
其他類的538個樣本有538個預測正確,預測正確率為100%;
軍師20個樣本有0個預測正確,20個錯分為其他類,預測正確率為0%;
將軍112個樣本有73個預測正確,39個錯分為其他類,預測正確率為65.18%。
神經網絡算法——分類矩陣

說明:
其他類的538個樣本有524個預測正確,5個錯分為軍師類,9個錯分為將軍類,預測正確率為97.40%;
軍師20個樣本有5個預測正確,15個錯分為其他類,預測正確率為25%;
將軍112個樣本有92個預測正確,20個錯分為其他類,預測正確率為82.14%。
邏輯回歸算法——分類矩陣

說明:
其他類的538個樣本有526個預測正確,6個錯分為軍師類,6個錯分為將軍類,預測正確率為97.77%;
軍師20個樣本有5個預測正確,15個錯分為其他類,預測正確率為25%;
將軍112個樣本有88個預測正確,24個錯分為其他類,預測正確率為78.57%。
關聯算法——分類矩陣

說明:
其他類的538個樣本有519個預測正確,19個錯分為軍師類,預測正確率為96.47%;
軍師20個樣本有0個預測正確,20個錯分為其他類,預測正確率為0%;
將軍112個樣本有88個預測正確,24個錯分為其他類,預測正確率為78.57%。
分類矩陣——預測正確率匯總分析:

 

其他

軍師

將軍

神經網絡算法

97.40%

25%

82.14%

邏輯回歸算法

97.77%

25%

78.57%

決策樹算法

100%

0%

65.18%

關聯算法

96.47%

0%

78.57%

聚類分析算法

99.63%

0%

55.36%

Naive Bayes 算法

89.59%

65%

82.14%

可以看出Naive Bayes 算法在預測軍師身份正確率最高,達到65%,決策樹算法、關聯算法、聚類分析算法為0%,神經網絡算法、邏輯回歸算法為25%;
決策樹算法在預測其他身份正確率最高,達到100%;
神經網絡算法、Naive Bayes 算法在預測將軍身份正確率並列,達到82.14%。

准確性驗證示例2:——基於個股數據
數據准備:



挖掘模型依次為:
StockClustering 聚類分析算法
StrockDecisionTrees 決策樹算法
StockNeuralNetWork 神經網絡算法
StockLogistic 邏輯回歸算法

提升圖:

依次排名為:
1. 邏輯回歸算法(49.73% 0.52)
2. 神經網絡算法(49.63% 0.53)
3. 聚類分析算法(48.13% 0.51)
4. 決策樹算法(47.28% 0.50)
聚類分析算法——分類矩陣:

說明:
持平的114個樣本有0個預測正確,91個錯分為跌,23個錯分為漲,預測正確率為0%;
跌的443個樣本有340個預測正確,103個錯分為漲,預測正確率為76.75%;
漲的380個樣本有111個預測正確,269個錯分為跌,預測正確率為29.21%。

決策樹算法——分類矩陣:

說明:
持平的114個樣本有0個預測正確,114個錯分為跌,預測正確率為0%;
跌的443個樣本有443個預測正確,預測正確率為100.00%;
漲的380個樣本有0個預測正確,380個錯分為跌,預測正確率為0%。

神經網絡算法——分類矩陣:

說明:
持平的114個樣本有0個預測正確,60個錯分為跌,54個錯分為漲,預測正確率為0%;
跌的443個樣本有277個預測正確,166個錯分為漲,預測正確率為62.53%;
漲的380個樣本有188個預測正確,192個錯分為跌,預測正確率為49.47%。

邏輯回歸算法——分類矩陣:

說明:
持平的114個樣本有0個預測正確,89個錯分為跌,25個錯分為漲,預測正確率為0%;
跌的443個樣本有380個預測正確,63個錯分為漲,預測正確率為85.78%;
漲的380個樣本有86個預測正確,294個錯分為跌,預測正確率為22.63%。

分類矩陣——預測正確率匯總分析:

 

持平

邏輯回歸算法

0%

85.78%

22.63%

神經網絡算法

0%

62.53%

49.47%

聚類分析算法

0%

76.75%

29.21%

決策樹算法

0%

100.00%

0%


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM