FP-TREE 算法,頻繁項集與關聯規則分析


使用場景如:

用戶頻道屬性分析 、用戶忠誠度分析 、用戶偏好路徑分析、 用戶偏好終端分析、 用戶訪問網站時間分析、 用戶瀏覽內容分析

 

例子:一用戶某次訪問網站的路徑示意圖

                   

ABCD    ABEGH    ABEGW   AOU   AOV

Apriori算法

        需要掃描多個事物數據集,增加IO開銷。會產生2的k次方頻繁項集。

 

FP-Tree算法

概念: 樹 鏈 節點 節點的前向路徑 單支 多支 條件基

 


若Tree為單支,則輸出整條單支和條件基BASE,支持度為單支中所有節點支持度的最小值。
 

  1. 若Tree為多支,先輸出項表頭HEAD中每項與條件基BASE的組合。然后,對於項表頭中的每一項,取出該項在Tree中的所有前向路徑,每條路徑的基礎支持度為該項的支持度。
  2. M條路徑共M行數據,將這M行數據重新生成Tree,返回算法步驟-3中的1。

 


 

 

 

--->流程參考


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM