原文:从信用卡欺诈模型看不平衡数据分类(1)数据层面:使用过采样是主流,过采样通常使用smote,或者少数使用数据复制。过采样后模型选择RF、xgboost、神经网络能够取得非常不错的效果。(2)模型层面:使用模型集成,样本不做处理,将各个模型进行特征选择、参数调优后进行集成,通常也能够取得不错的结果。(3)其他方法:偶尔可以使用异常检测技术,IF为主

总结:不平衡数据的分类, 数据层面:使用过采样是主流,过采样通常使用smote,或者少数使用数据复制。过采样后模型选择RF xgboost 神经网络能够取得非常不错的效果。 模型层面:使用模型集成,样本不做处理,将各个模型进行特征选择 参数调优后进行集成,通常也能够取得不错的结果。 其他方法:偶尔可以使用异常检测技术,主要有IsolationForest,OneClassSVM,LocalOutl ...

2018-05-25 17:44 0 2122 推荐指数:

查看详情

欺诈模型数据不平衡

大部分内容来自:https://mp.weixin.qq.com/s/vAHTNidkZp6GprxK4ikysQ 解决数据不平衡方法: 整个流程: 注意事项: 评估指标:使用精确度(Precise Rate)、召回率(Recall Rate)、Fmeasure或ROC曲线 ...

Mon Aug 10 04:45:00 CST 2020 0 715
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM