R代碼|基於特征重要性的特征排序代碼


前言:

我根據自己的科研方向和實際工作,在利用R語言解決數據,特征和模型三方面的問題時,會搜集到一些R代碼,利用【R語言】公眾號將其整理和歸總,分享給大家。一方面,希望這些R代碼能夠對大家解決實際問題有幫助或者啟示;另一方面,也希望大家嘗試從R代碼中學習和應用R語言。


 

基於特征重要性的特征排序代碼。

這個代碼可以用於指導特征選擇,特征選擇的策略:

1)Top-N策略;2)Top-percent策略。


# 導入R庫
library(mlbench)
library(caret)

# 加載數據集
data(PimaIndiansDiabetes)

# 設置訓練的控制參數,利用10-折交叉驗證的方法
control <- trainControl(method="cv", number=10)

# 訓練模型
model <- train(diabetes~., data=PimaIndiansDiabetes, method="lvq", preProcess="scale", trControl=control)

# 評估變量的變量重要性
importance <- varImp(model, scale=FALSE)

# 重要性描述結果
print(importance)

# 重要性可視化
plot(importance)

結果和可視化如下:

# load the libraries
library(mlbench)
library(caret)

# load the dataset
data(iris)

# prepare training scheme
control <- trainControl(method="cv", number=10)

# train the model
model <- train(Species~., data=iris, method="lvq", preProcess="scale", trControl=control)

# estimate variable importance
importance <- varImp(model, scale=FALSE)

# summarize importance
print(importance)

# plot importance
plot(importance)

結果和可視化如下:

代碼源自:

https://setscholars.net/2019/10/25/how-to-rank-feature-with-importance-in-r-feature-selection-in-r/

關於這段代碼,你有什么想法或者問題,請掃碼加我微信,大家交流和討論。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM