原文:輸入數據與ARFF文件--數據挖掘學習和weka使用(二)

我個人認為直接討論數據挖掘算法和weka的使用過於心急。我一開始就直接學習的數據挖掘方法,有些方法艱澀枯燥,我常常在思考的不是方法本身,而是 這是干什么的 。 在使用了weka后有些東西漸漸清晰,因為輸入和輸出給了人很直觀的感覺,再結合技術本身學習效率很高。 輸入主要有三類:概念 實例和屬性。 概念 概念簡單而言就是需要被處理的東西。它可以是分類學習中那個已經分類完成的樣本集。 你需要處理的東西可 ...

2012-03-30 00:21 7 25573 推薦指數:

查看詳情

Weka數據挖掘與機器學習系列之數據格式ARFF和CSV文件格式之間的轉換(五)

  不多說,直接上干貨! Weka介紹:   Weka是一個用Java編寫的數據挖掘工具,能夠運行在各種平台上。它不僅提供了可以直接用於數據挖掘的軟件,還提供了src代碼,使用者可以修改源代碼,進行二次開發。但是,由於其使用了Java虛擬機,導致其不適合處理大型數據 ...

Fri May 12 02:08:00 CST 2017 0 3036
weka數據挖掘拾遺(一)---- 生成Arff格式文件

一、什么是arff格式文件   1、arff是Attribute-Relation File Format縮寫,從英文字面也能大概看出什么意思。它是weka數據挖掘開源程序使用的一種文件模式。由於weka是個很出色的數據挖掘開源項目,所以使用的比較廣,這也無形中推廣了它的數據存儲格式 ...

Wed Feb 12 18:49:00 CST 2014 4 7035
數據挖掘簡述和weka介紹--數據挖掘學習weka使用(一)

寫在開篇 weka用了一些時日了,覺得真心不錯。功能很完善,而且是開源的。最重要的擴展方便,非常適合搞研究和做全國大學生數學建模之類的比賽。 我學習weka主要是看的一本數據挖掘weka使用的書,是英文的。國內有中文版…但是不想吐就不要看譯本吧,不知道是翻譯的人是怎么想的. 我寫博文的順序 ...

Thu Mar 29 21:31:00 CST 2012 10 11127
使用Weka進行數據挖掘

1.簡介 數據挖掘、機器學習這些字眼,在一些人看來,是門檻很高的東西。誠然,如果做算法實現甚至算法優化,確實需要很多背景知識。但事實是,絕大多數數據挖掘工程師,不需要去做算法層面的東西。他們的精力,集中在特征提取,算法選擇和參數調優上。那么,一個可以方便地提供這些功能的工具,便是十分必要 ...

Thu Feb 06 16:32:00 CST 2014 0 7248
數據預處理和weka.filters的使用--數據挖掘學習weka使用(三)

上一篇介紹了arff格式,這是weka專有格式,一般情況需要我們從其他數據源抽取或者獲得。weka支持從cvs轉化,也可以從數據庫中抽取,界面如下圖 weka安裝目錄有一個data目錄,里面有一些測試數據,可以用於測試和學習。 導入了數據僅僅是一個開始,我們還需要對數據進行預處理。 數據 ...

Tue Apr 03 00:08:00 CST 2012 3 26863
OneR算法和weka中OneR使用--數據挖掘學習weka使用(四)

OneR算法簡介 OneR又稱1-R,是1993出現的一種極為簡單的分類算法模型,它可以產生一個單層的決策樹。 OneR算法是一個簡單、廉價的方法,但是常常能夠獲得一個非常好的結果,用於描述數據中的結構。 OneR算法的使用非常廣泛,可以簡單的得到一個對數據的概括性了解,有時候甚至可以直接 ...

Sat Apr 14 19:22:00 CST 2012 0 5637
初試weka數據挖掘

的,另一個是我實驗時打開的。 一.引入 數據挖掘、機器學習這些字眼,在一些人看來,是 ...

Sat Sep 07 21:26:00 CST 2013 20 17515
數據挖掘學習02 - 使用weka的kmeans聚類分析

本文目的 weka是一套使用java開發的數據挖掘工具集合,提供GUI/CLI界面和Java API使用方式。所以,在學習和解決數據挖掘問題時,可以先嘗試用weka的GUI或CLI做出合適的分析,找到適當的算法,然后在將此算法集成到自己的項目中。最近在的項目中遇到了文本聚類的問題,kmeans ...

Tue Oct 16 05:12:00 CST 2012 3 19794
 
粵ICP備18138465號   © 2018-2026 CODEPRJ.COM