花費 76 ms
數據挖掘之關聯分析一(基本概念)

許多商業企業運營中的大量數據,通常稱為購物籃事務(market basket transaction)。表中每一行對應一個事務,包含一個唯一標識TID。 利用關聯分析的方法可以發現聯系如關聯規則或頻 ...

Wed Aug 19 05:05:00 CST 2015 0 21064
數據挖掘之關聯分析二(頻繁項集的產生)

頻繁項集的產生 格結構(lattice structure)常常用來表示所有可能的項集。 發現頻繁項集的一個原始方法是確定格結構中每個候選項集的支持度。但是工作量比較大。另外有幾種方法可以降低產 ...

Wed Aug 19 05:58:00 CST 2015 0 18409
數據挖掘之關聯分析五(序列模式)

購物籃數據常常包含關於商品何時被顧客購買的時間信息,可以使用這種信息,將顧客在一段時間內的購物拼接成事務序列,這些事務通常基於時間或空間的先后次序。 問題描述 一般地,序列是元素(element ...

Thu Aug 20 03:41:00 CST 2015 3 8980
數據挖掘之關聯分析六(子圖模式)

子圖模式 頻繁子圖挖掘(frequent subgraph mining):在圖的集合中發現一組公共子結構。 圖和子圖 圖是一種用來表示實體集之間聯系的數據結構。 子圖,圖\(G' = (V ...

Fri Aug 21 00:12:00 CST 2015 0 8996
數據挖掘之關聯分析四(連續屬性處理)

處理連續屬性 挖掘連續屬性可能揭示數據的內在聯系,包含連續屬性的關聯規則通常稱作量化關聯規則(quantitative association rule)。 主要討論三種對連續數據進行關聯分析的方 ...

Wed Aug 19 04:39:00 CST 2015 0 6093
數據挖掘之關聯分析七(非頻繁模式)

非頻繁模式 非頻繁模式,是一個項集或規則,其支持度小於閾值minsup. 絕大部分的頻繁模式不是令人感興趣的,但其中有些分析是有用的,特別是涉及到數據中的負相關時,如一起購買DVD的顧客多半不會購買 ...

Fri Aug 21 21:43:00 CST 2015 0 4139
數據挖掘之關聯分析三(規則的產生)

規則產生 忽略那些前件和后件為空的規則,每個頻繁k項集能夠產生\(2(2^k-1)\)個關聯規則。將頻繁項集Y划分為兩個非空子集X和Y-X,使得\(X \to Y-X\)能滿足置信度閾值,就可以得到 ...

Wed Aug 19 06:20:00 CST 2015 0 4091
weka使用筆記1-FPGrowth注意事項和參數說明

weka是一個很好的數據挖掘實驗的工具,可以進行標准的數據挖掘的各種實驗,首先來說一下關聯規則的挖掘。 在linux環境下,在使用weka之前,要配置好環境變量,將weka目錄下的weka.jar的 ...

Sun Oct 21 01:28:00 CST 2012 5 2928

 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM