多分類問題的評價指標


對於二分類問題,precision,recall,auc,f1_score的計算原理都比較熟悉,但是多分類問題的計算還是有一點小小的區別,在使用sklearn.metrics的時候需要注意一下;

對於sklearn.metrics下的roc_auc_score, precision_score, recall_score, f1_score的幾個參數需要設置:

sklearn.metrics.precision_score(y_true, y_pred, labels=None, pos_label=1, average=’binary’, sample_weight=None)

以precision_score為例,主要是average參數有幾種選擇:

binary:二分類

macro:每個標簽都計算precision,然后求平均,不考慮數據均衡問題

micro:計算全數據的precision

weighted,:每個標簽都計算precision,然后考慮各個類別數據量權重加權求和

samples:多標簽問題使用

所以在數據均衡情況下一般使用macro

 

f1_score 的計算公式 f1_score = (1+12) * p * r / 1* r + p

從公式中可以看出參數1其實是准確率和召回率的調和參數,小於1則提高准確率的權重,大於1則提高召回率的權重,因此在實際中也有F0.5-score, F2-score的使用


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM