原文:從信用卡欺詐模型看不平衡數據分類(1)數據層面:使用過采樣是主流,過采樣通常使用smote,或者少數使用數據復制。過采樣后模型選擇RF、xgboost、神經網絡能夠取得非常不錯的效果。(2)模型層面:使用模型集成,樣本不做處理,將各個模型進行特征選擇、參數調優后進行集成,通常也能夠取得不錯的結果。(3)其他方法:偶爾可以使用異常檢測技術,IF為主

總結:不平衡數據的分類, 數據層面:使用過采樣是主流,過采樣通常使用smote,或者少數使用數據復制。過采樣后模型選擇RF xgboost 神經網絡能夠取得非常不錯的效果。 模型層面:使用模型集成,樣本不做處理,將各個模型進行特征選擇 參數調優后進行集成,通常也能夠取得不錯的結果。 其他方法:偶爾可以使用異常檢測技術,主要有IsolationForest,OneClassSVM,LocalOutl ...

2018-05-25 17:44 0 2122 推薦指數:

查看詳情

欺詐模型數據不平衡

大部分內容來自:https://mp.weixin.qq.com/s/vAHTNidkZp6GprxK4ikysQ 解決數據不平衡方法: 整個流程: 注意事項: 評估指標:使用精確度(Precise Rate)、召回率(Recall Rate)、Fmeasure或ROC曲線 ...

Mon Aug 10 04:45:00 CST 2020 0 715
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM