weka 學習總結


首先分享一個學習weka的網址:http://blog.csdn.net/yangliuy/article/details/7589306

(進入園子好多年,竟然是第一次寫東西,慚愧........好好學習)

1.weka介紹

我就用自己的話說說吧,weka是一個可視化的數據分析工具。對!可視化!感謝厲害的程序員們給我們帶來這么多的便利,可視化的工具確實很招人喜歡吶。簡單說下weka的極大功能模塊:首先,weka可以對數據進行預處理,比如說離散化、標准化等等,都是一個按鈕的事兒。在執行分類算法之前,weka還可以對屬性進行刪選,里面提供了不少篩選方法,比如主成分分析方法PCA,信息增益方法等,幫助我們篩選更有效的屬性,以此提高分類准確率。同時,weka提供了分類、聚類、關聯規則方法,不僅感嘆好好用啊,一些經典的、基本的機器學習方法都囊括了。最后一個是對數據集整體的可視化結果,分析了每個屬性的分布情況,用數值和柱形圖體現。

2.weka數據格式

使用weka之前需要准備好arff(Attribute-Relation File Format)格式的數據。這里我就分享一下如何將CSV轉換為arff.用Arffviewer打開你的CSV文件(注意:CSV文件必須要有屬性名,且類標簽的名字為“class”,我這里用excel打開本來沒有屬性名的csv,然后再給csv添加屬性名),然后將文件另存為arff即可。這樣就完成了csv到arff的轉換。

結果就是這樣。

2.演示

weka提供了很多機器學習算法,下面我演示的是用邏輯回歸方法對Iris數據集分類。首先進入“classify”界面,“choose”選擇分類算法,測試方法選擇的是10-交叉驗證。點擊“start”開始運行分類算法。郵編區域顯示的是分類結果,96%是分類准確率。

3.結束語

分享到這里,感謝瀏覽。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM