前言:
由於自己是統計專業的,並且最近做的項目里邊涉及到了數據挖掘的知識點,所以就抽出時間來總結一下數據挖掘的知識點,如有不當之處希望各位讀者指正。
主要想講一講數據挖掘的概念以及關於數據的一些內容,相對來說,理論內容偏多,但加深對這些東西的認識會讓你在做數據挖掘時更有目的性。
1.數據挖掘
定義:在大型數據存儲庫中,自動地發現有用信息的過程。
數據挖掘的一般過程包括以下這幾個方面:
-
數據預處理
確定數據集后,就開始對數據進行預處理使得數據能夠為我們所用了。包括數據清理、數據集成、數據規約和數據變換方法。
-
數據挖掘
通常進行的特征的構造然后放到特定的模型中去計算,利用某種標准去評判不同模型或組合模型的表現,最后確定一個最合適的模型用於我們的后處理
-
后處理
后處理的過程相當於我們已經發現了那個我們想要找到的模式,我們會去應用它或者用合適的方式將其表示出來。
2.數據挖掘的一般過程
3.數據挖掘常見的一些算法
參考鏈接:https://blog.csdn.net/sinat_22594309/article/details/74923643