原文:R語言caret包的學習(四)--建立模型及驗證

本文介紹caret包中的建立模型及驗證的過程。主要涉及的函數有train ,predict ,confusionMatrix ,以及pROC包中的畫roc圖的相關函數。 建立模型 在進行建模時,需對模型的參數進行優化,在caret包中其主要函數命令是train。 x 行為樣本,列為特征的矩陣或數據框。列必須有名字 y 每個樣本的結果,數值或因子型 method 指定具體的模型形式,支持大量訓練模型 ...

2018-01-17 15:25 3 12350 推薦指數:

查看詳情

R語言caret學習(三)--數據分割

本文將就caret中的數據分割部分進行介紹學習。主要包括以下函數:createDataPartition(),maxDissim(),createTimeSlices(),createFolds(),createResample(),groupKFold()等 基於輸出結果的簡單分割 ...

Tue Jan 16 21:16:00 CST 2018 1 4108
R語言caret學習(二)--特征選擇

在進行數據挖掘時,我們並不需要將所有的自變量用來建模,而是從中選擇若干最重要的變量,這稱為特征選擇(feature selection)。本文主要介紹基於caret的rfe()函數的特征選擇。 一種算法就是后向選擇,即先將所有的變量都包括在模型中,然后計算其效能(如誤差、預測精度)和變量重要 ...

Tue Jan 16 21:14:00 CST 2018 0 5501
R語言機器學習caret運用

在大數據如火如荼的時候,機器學習無疑成為了炙手可熱的工具,機器學習是計算機科學和統計學的交叉學科, 旨在通過收集和分析數據的基礎上,建立一系列的算法,模型對實際問題進行預測或分類。 R語言無疑為我們提供了很好的工具,它正是計算機科學和統計科學結合的產物,開源免費 ...

Tue Mar 08 18:13:00 CST 2016 1 12133
R語言caret學習(一)--數據預處理

caret(Classification and Regression Training)是一系列函數的集合,它試圖對創建預測模型的過程進行流程化。本系列將就數據預處理、特征選擇、抽樣、模型調參等進行介紹學習。 本文將就caret中的數據預處理部分進行介紹學習。主要包括以下函數 ...

Tue Jan 16 02:45:00 CST 2018 0 4088
模型驗證方法——R語言

在數據分析中經常會對不同的模型做判斷 一、混淆矩陣法 作用:一種比較簡單的模型驗證方法,可算出不同模型的預測精度 將模型的預測值與實際值組合成一個矩陣,正例一般是我們要預測的目標。真正例就是預測為正例且實際也是正例(預測正確);假反例是實際是正例但模型錯誤預測成反例(即預測錯誤);假正例 ...

Mon Jul 22 08:51:00 CST 2019 0 1534
R語言shiny學習

shiny是一個R語言中的網絡應用程序框架,可以將你的數據分析變成交互式的網絡應用(web apps),簡單又實用。 基本用法 一個shiny應用可以分為兩部分:前端和后端,其實所有的shiny應用都是基於以下的模版: 其中,fluidPage中主要有兩部分:輸入函數,和輸出 ...

Mon Dec 04 05:54:00 CST 2017 0 987
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM