前言:
我根據自己的科研方向和實際工作,在利用R語言解決數據,特征和模型三方面的問題時,會搜集到一些R代碼,利用【R語言】公眾號將其整理和歸總,分享給大家。一方面,希望這些R代碼能夠對大家解決實際問題有幫助或者啟示;另一方面,也希望大家嘗試從R代碼中學習和應用R語言。
基於特征重要性的特征排序代碼。
這個代碼可以用於指導特征選擇,特征選擇的策略:
1)Top-N策略;2)Top-percent策略。
# 導入R庫
library(mlbench)
library(caret)
# 加載數據集
data(PimaIndiansDiabetes)
# 設置訓練的控制參數,利用10-折交叉驗證的方法
control <- trainControl(method="cv", number=10)
# 訓練模型
model <- train(diabetes~., data=PimaIndiansDiabetes, method="lvq", preProcess="scale", trControl=control)
# 評估變量的變量重要性
importance <- varImp(model, scale=FALSE)
# 重要性描述結果
print(importance)
# 重要性可視化
plot(importance)
結果和可視化如下:

# load the libraries
library(mlbench)
library(caret)
# load the dataset
data(iris)
# prepare training scheme
control <- trainControl(method="cv", number=10)
# train the model
model <- train(Species~., data=iris, method="lvq", preProcess="scale", trControl=control)
# estimate variable importance
importance <- varImp(model, scale=FALSE)
# summarize importance
print(importance)
# plot importance
plot(importance)
結果和可視化如下:

代碼源自:
https://setscholars.net/2019/10/25/how-to-rank-feature-with-importance-in-r-feature-selection-in-r/
關於這段代碼,你有什么想法或者問題,請掃碼加我微信,大家交流和討論。
