可提前了解啤酒尿布的小故事
1)若兩個或者多個變量的取值之間存在某種規律性,就稱為關聯。
2)關聯規則是尋找在同一個事件中出現的不同項的相關性,比如在以西購買活動中所買不同商品的關聯性。(不用考慮具體的指標,只考慮頻繁)
3)”在購買計算機的顧客中,有30%的人也同時購買了打印機“-------兩者之間肯定是有一些相關性啊,就可以在營銷上運用這個規律。
| 編號 | 牛奶 | 果凍 | 啤酒 | 面包 | 花生醬 |
| T1 | 1 | 1 | 0 | 0 | 1 |
| T2 | 0 | 1 | 0 | 1 | 0 |
| T3 | 0 | 1 | 1 | 0 | 0 |
| T4 | 1 | 1 | 0 | 1 | 0 |
| T5 | 1 | 0 | 1 | 0 | 0 |
| T6 | 0 | 1 | 1 | 0 | 0 |
| T7 | 1 | 0 | 1 | 0 | 0 |
| T8 | 1 | 1 | 1 | 0 | 1 |
| T9 | 1 | 1 | 1 | 0 | 0 |
一個樣本成為一個”事務“
每個事務有多個屬性來規定,這里的屬性稱為”項“
多個項組成的集合成為項集,比如:{牛奶}為一項集,{牛奶,果凍}為二項集
支持度:一個項集或者規則在所有事務中出現的頻率。
比如:某天100個顧客到商場買東西,其中有30個人同時購買了啤酒和尿布,那么上述的關聯規則的支持度為30%
置信度:確定Y在包含X的事務中出現的頻繁程度。
置信度反應了關聯規則的可信度,購買了項目集中X的商品的顧客同時也購買了Y中商品的可能信有多大
購買薯片的顧客當中有50%也購買了可樂,則置信度為50%
提升度(lift):物品集A的出現對物品集B的出現概率發生了多大的變化。
