開始研究WEKA,一個開源java的數據挖掘工具。 HS沉寂這么多天,誰知道偏偏在我申請離職的時候給我安排了個任務,哎,無語。 於是,今天看了一天的Weka。 主要是看了HS提供的三個文章(E文,在google的幫助下看完的): http://www.ibm.com ...
開始研究WEKA,一個開源java的數據挖掘工具。 HS沉寂這么多天,誰知道偏偏在我申請離職的時候給我安排了個任務,哎,無語。 於是,今天看了一天的Weka。 主要是看了HS提供的三個文章 E文,在google的幫助下看完的 : http: www.ibm.com developerworks opensource library os weka index.html http: www.ibm. ...
2016-05-11 22:02 0 2012 推薦指數:
開始研究WEKA,一個開源java的數據挖掘工具。 HS沉寂這么多天,誰知道偏偏在我申請離職的時候給我安排了個任務,哎,無語。 於是,今天看了一天的Weka。 主要是看了HS提供的三個文章(E文,在google的幫助下看完的): http://www.ibm.com ...
的,另一個是我實驗時打開的。 一.引入 數據挖掘、機器學習這些字眼,在一些人看來,是 ...
一、實驗目標 理解數據挖掘的基本概念,掌握基於Weka工具的基本數據挖掘(分類、回歸、聚類、關聯規則分析)過程。 二、實驗內容 下載並安裝Java環境(JDK 7.0 64位)。 下載並安裝Weka 3.7版。 基於Weka的數據分類。 基於Weka的數據回歸 ...
1.簡介 數據挖掘、機器學習這些字眼,在一些人看來,是門檻很高的東西。誠然,如果做算法實現甚至算法優化,確實需要很多背景知識。但事實是,絕大多數數據挖掘工程師,不需要去做算法層面的東西。他們的精力,集中在特征提取,算法選擇和參數調優上。那么,一個可以方便地提供這些功能的工具,便是十分必要 ...
1.數據概述 本報告中采用的數據集來自於UCI經典數據集Adult,最初來源是由1994年Barry Becker的統計數據集,該數據集本來最初的主要任務是根據數據集中的相關屬性預測某個人的年收入是大於50K還是小於等於50K。本數據集一共有14個屬性用來預測 ...
寫在開篇 weka用了一些時日了,覺得真心不錯。功能很完善,而且是開源的。最重要的擴展方便,非常適合搞研究和做全國大學生數學建模之類的比賽。 我學習weka主要是看的一本數據挖掘和weka使用的書,是英文的。國內有中文版…但是不想吐就不要看譯本吧,不知道是翻譯的人是怎么想的. 我寫博文的順序 ...
我個人認為直接討論數據挖掘算法和weka的使用過於心急。我一開始就直接學習的數據挖掘方法,有些方法艱澀枯燥,我常常在思考的不是方法本身,而是“這是干什么的?”。 在使用了weka后有些東西漸漸清晰,因為輸入和輸出給了人很直觀的感覺,再結合技術本身學習效率很高。 輸入主要有三類:概念、實例和屬性 ...
回歸 回歸是最為簡單易用的一種技術,但可能也是最不強大(這二者總是相伴而來,很有趣吧)。此模型可以簡單到只有一個輸入變量和一個輸出變量(在 Excel 中稱為 Scatter 圖形,或 OpenOffice.org 內的 XYDiagram)。當然,也可以遠比此復雜,可以包括很多輸入變量。實際上 ...