Python之關聯規則


可提前了解啤酒尿布的小故事

1)若兩個或者多個變量的取值之間存在某種規律性,就稱為關聯。

2)關聯規則是尋找在同一個事件中出現的不同項的相關性,比如在以西購買活動中所買不同商品的關聯性。(不用考慮具體的指標,只考慮頻繁)

3)”在購買計算機的顧客中,有30%的人也同時購買了打印機“-------兩者之間肯定是有一些相關性啊,就可以在營銷上運用這個規律。

編號 牛奶 果凍 啤酒 面包 花生醬
T1 1 1 0 0 1
T2 0 1 0 1 0
T3 0 1 1 0 0
T4 1 1 0 1 0
T5 1 0 1 0 0
T6 0 1 1 0 0
T7 1 0 1 0 0
T8 1 1 1 0 1
T9 1 1 1 0 0

 

一個樣本成為一個”事務“

每個事務有多個屬性來規定,這里的屬性稱為”項“

多個項組成的集合成為項集,比如:{牛奶}為一項集,{牛奶,果凍}為二項集

 

支持度:一個項集或者規則在所有事務中出現的頻率。

比如:某天100個顧客到商場買東西,其中有30個人同時購買了啤酒和尿布,那么上述的關聯規則的支持度為30%

 

置信度:確定Y在包含X的事務中出現的頻繁程度。

置信度反應了關聯規則的可信度,購買了項目集中X的商品的顧客同時也購買了Y中商品的可能信有多大

購買薯片的顧客當中有50%也購買了可樂,則置信度為50%

 

提升度(lift):物品集A的出現對物品集B的出現概率發生了多大的變化。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM