【文章推薦】R語言caret包的學習（三）--數據分割

原文：R語言caret包的學習（三）--數據分割

本文將就caret包中的數據分割部分進行介紹學習。主要包括以下函數：createDataPartition ，maxDissim ，createTimeSlices ，createFolds ，createResample ，groupKFold 等基於輸出結果的簡單分割 createDataPartition函數用於創建平衡數據的分割。如果函數中的參數y是一個因子向量，則對每一類隨機抽樣，並且 ...

2018-01-16 13:16 1 4108 推薦指數：

查看詳情

R語言caret包的學習（一）--數據預處理

caret包（Classification and Regression Training）是一系列函數的集合，它試圖對創建預測模型的過程進行流程化。本系列將就數據預處理、特征選擇、抽樣、模型調參等進行介紹學習。本文將就caret包中的數據預處理部分進行介紹學習。主要包括以下函數 ...

R語言caret包的學習（二）--特征選擇

在進行數據挖掘時，我們並不需要將所有的自變量用來建模，而是從中選擇若干最重要的變量，這稱為特征選擇（feature selection）。本文主要介紹基於caret包的rfe()函數的特征選擇。一種算法就是后向選擇，即先將所有的變量都包括在模型中，然后計算其效能（如誤差、預測精度）和變量重要 ...

R語言機器學習之caret包運用

在大數據如火如荼的時候，機器學習無疑成為了炙手可熱的工具，機器學習是計算機科學和統計學的交叉學科，旨在通過收集和分析數據的基礎上，建立一系列的算法，模型對實際問題進行預測或分類。 R語言無疑為我們提供了很好的工具，它正是計算機科學和統計科學結合的產物，開源免費 ...

R語言caret包的學習（四）--建立模型及驗證

本文介紹caret包中的建立模型及驗證的過程。主要涉及的函數有train()，predict()，confusionMatrix()，以及pROC包中的畫roc圖的相關函數。建立模型在進行建模時，需對模型的參數進行優化，在caret包中其主要函數命令是train ...

R語言caret包中createFolds函數

R語言caret包中createFolds函數實現將向量隨機分組。 1、 2、 ...

R語言：利用caret包中的dummyVars函數進行虛擬變量處理

dummyVars函數:dummyVars creates a full set of dummy variables (i.e. less than full rank parameterizati ...

R語言數據集分割

好在R和Python中有現成的數據集分割函數，避免手動寫函數導致划分比例不合理、訓練集與測試集的樣本的結構與總體不均衡的問題。 R語言中caTools包中的sample.split函數可以用來自動將原始數據集分割成訓練集和測試集。方法一 caTools中的sample.split函數 ...

R語言shiny包的學習

shiny是一個R語言中的網絡應用程序框架，可以將你的數據分析變成交互式的網絡應用(web apps)，簡單又實用。基本用法一個shiny應用可以分為兩部分：前端和后端，其實所有的shiny應用都是基於以下的模版：其中，fluidPage中主要有兩部分：輸入函數，和輸出 ...

原文：R語言caret包的學習（三）--數據分割

相關推薦

相關標簽