R語言與關聯規則挖掘—購物籃分析

本文轉載自查看原文 2017-02-09 20:18 3085 R語言

名詞：

挖掘數據集：購物籃數據

挖掘目標：關聯規則

關聯規則：啤酒=>尿布（支持度0.02，置信度0.6）

支持度：所有數據中有2%的購物記錄包含了啤酒和尿布

置信度：所有包含啤酒的購物記錄里有60%包含尿布

最小支持度閾值和最小置信度閾值。

項集：項（商品）組成的集合

K-項集：k個項組成的集合

頻繁項集：滿足最小支持度的項集

強關聯規則：滿足最小支持閾值和最小置信度閾值的規則

步驟:

找出所有頻繁項集；由頻繁項集產生強關聯規則。

案例：

TID為購物記錄，List of item_ID為商品ID，如第T100條購物記錄中，包含商品I1,I2,I5。

最后推出的關聯規則有：

（以上圖片來源薛毅老師的《r modeling》）

R語言操作：

包：arules

數據集：Groceries（內置數據集）

函數：inspect：顯檢查，示一個的文集或一個術語文檔矩陣的詳細信息。查看數據。

apriori：提取關聯規則

代碼：

結果如下：

結果展示的即為每一種消費記錄推出同時購買某種商品的支持度和置信度。最右邊的lift參數表明該規則的可信度，如果等於1，嘖表明前面的商品與關聯商品是獨立的。lift值越大，表明規則越可信。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 如何做好關聯分析（購物籃分析） R語言關聯規則 Python編程代寫中的Apriori關聯算法-市場購物籃分析 R1（上）—R關聯規則分析之Arules包詳解 R1（下）—數據挖掘—關聯規則理論介紹與R實現關聯規則挖掘-Apriori算法 Weka關聯規則分析購物籃模型&Apriori算法數據挖掘：關聯規則的apriori算法在weka的源碼分析 Python數據挖掘—關聯—關聯規則