花費 12 ms
機器學習 —— 類不平衡問題與SMOTE過采樣算法

在前段時間做本科畢業設計的時候,遇到了各個類別的樣本量分布不均的問題——某些類別的樣本數量極多,而有些類別的樣本數量極少,也就是所謂的類不平衡(class-imbalance)問題。 ...

Mon Aug 15 21:01:00 CST 2016 2 40636
數據挖掘之關聯分析一(基本概念)

許多商業企業運營中的大量數據,通常稱為購物籃事務(market basket transaction)。表中每一行對應一個事務,包含一個唯一標識TID。 利用關聯分析的方法可以發現聯系如關聯規則或頻 ...

Wed Aug 19 05:05:00 CST 2015 0 21064
數據挖掘之關聯分析二(頻繁項集的產生)

頻繁項集的產生 格結構(lattice structure)常常用來表示所有可能的項集。 發現頻繁項集的一個原始方法是確定格結構中每個候選項集的支持度。但是工作量比較大。另外有幾種方法可以降低產 ...

Wed Aug 19 05:58:00 CST 2015 0 18409
國貨——達夢數據庫及在.Net 下的增刪改查

一,簡介 偶然看到了國產數據庫——達夢數據庫。頓時起了興趣,搗鼓了一番。 下面這段簡介摘自百度百科 達夢數據庫是武漢華工達夢數據庫有限公司推出的具有完全自主知識產權的高性能數據 ...

Wed Apr 11 22:07:00 CST 2012 48 10829
數據挖掘中分類和聚類的區別

1.分類 分類是數據挖掘中的一項非常重要的任務,利用分類技術可以從數據集中提取描述數據類的一個函數或模型(也常稱為分類器),並把數據集中的每個對象歸結到某個已知的對象類中。從機器學習的觀點,分類 ...

Thu Aug 22 17:05:00 CST 2013 0 14818
數據挖掘之關聯分析五(序列模式)

購物籃數據常常包含關於商品何時被顧客購買的時間信息,可以使用這種信息,將顧客在一段時間內的購物拼接成事務序列,這些事務通常基於時間或空間的先后次序。 問題描述 一般地,序列是元素(element ...

Thu Aug 20 03:41:00 CST 2015 3 8980
數據挖掘之關聯分析六(子圖模式)

子圖模式 頻繁子圖挖掘(frequent subgraph mining):在圖的集合中發現一組公共子結構。 圖和子圖 圖是一種用來表示實體集之間聯系的數據結構。 子圖,圖\(G' = (V ...

Fri Aug 21 00:12:00 CST 2015 0 8996
TF-IDF 文本相似度分析

  前陣子做了一些IT opreation analysis的research,從產線上取了一些J2EE server運行狀態的數據(CPU,Menory...),打算通過訓練JVM的數據來建立分類模 ...

Sat Mar 05 06:58:00 CST 2016 0 5429

 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM