本文將就caret包中的數據分割部分進行介紹學習。主要包括以下函數:createDataPartition(),maxDissim(),createTimeSlices(),createFolds(),createResample(),groupKFold()等 基於輸出結果的簡單分割 ...
在大數據如火如荼的時候,機器學習無疑成為了炙手可熱的工具,機器學習是計算機科學和統計學的交叉學科, 旨在通過收集和分析數據的基礎上,建立一系列的算法,模型對實際問題進行預測或分類。 R語言無疑為我們提供了很好的工具,它正是計算機科學和統計科學結合的產物,開源免費, 相對於Python Orange Canvas Weka Kinme這些免費的數據挖掘軟件來說,更容易上手,統計圖形也更加美觀。 今 ...
2016-03-08 10:13 1 12133 推薦指數:
本文將就caret包中的數據分割部分進行介紹學習。主要包括以下函數:createDataPartition(),maxDissim(),createTimeSlices(),createFolds(),createResample(),groupKFold()等 基於輸出結果的簡單分割 ...
from:http://www.zhizhihu.com/html/y2009/410.html 機器學習是計算機科學和統計學的邊緣交叉領域,R關於機器學習的包主要包括以下幾個方面: 1)神經網絡(Neural Networks): nnet包執行單隱層前饋神經網絡,nnet是VR包的一部分 ...
在進行數據挖掘時,我們並不需要將所有的自變量用來建模,而是從中選擇若干最重要的變量,這稱為特征選擇(feature selection)。本文主要介紹基於caret包的rfe()函數的特征選擇。 一種算法就是后向選擇,即先將所有的變量都包括在模型中,然后計算其效能(如誤差、預測精度)和變量重要 ...
caret包(Classification and Regression Training)是一系列函數的集合,它試圖對創建預測模型的過程進行流程化。本系列將就數據預處理、特征選擇、抽樣、模型調參等進行介紹學習。 本文將就caret包中的數據預處理部分進行介紹學習。主要包括以下函數 ...
本文介紹caret包中的建立模型及驗證的過程。主要涉及的函數有train(),predict(),confusionMatrix(),以及pROC包中的畫roc圖的相關函數。 建立模型 在進行建模時,需對模型的參數進行優化,在caret包中其主要函數命令是train ...
此書網上有英文電子版:Machine Learning with R - Second Edition [eBook].pdf(附帶源碼) 評價本書:入門級的好書,介紹了多種機器學習方法,全部用R相關的包實現,案例十分詳實,理論與實例結合。 目錄 第一章 機器學習簡介 第二章 數據 ...
R語言caret包中createFolds函數實現將向量隨機分組。 1、 2、 ...
目錄 1.基本概念 2.選擇機器學習算法 3.使用R進行機器學習 1.基本概念 機器學習:發明算法將數據轉化為智能行為 數據挖掘 VS 機器學習:前者側重尋找有價值的信息,后者側重執行已知的任務。后者是前者的先期准備 過程:數據——> ...