原創博文,轉載請注明出處!
1.ROC曲線介紹
- ROC曲線適用場景
- 二分類任務中,positive和negtive同樣重要時,適合用ROC曲線評價
- ROC曲線的意義
- TPR的增長是以FPR的增長為代價
2.ROC曲線繪制
- 縱坐標為TPR
- TPR(True Positive Rate)真正確率,即模型正確識別正例的比例,TPR=TP/(TP+FN)
- 橫坐標為FPR
- FPR(False Positive Rate)假正確率,即模型錯誤將反例識別為正例的比例,FPR=FP/(FP+TN)
- ROC曲線的繪制過程
- 給定m個正例和n個反例。首先,根據學習器預測結果對樣本排序;然后,先把所有樣本均預測為反例,再一次將每個樣本划分為正例(閾值從大到小的過程)。
3.sklearn中roc曲線
1 from sklearn.metrics import roc_curve 2 tpr,fpr,thresholds = roc_curve(y_test,y_pred) 3 4 import matplotlib.pyplot as plt 5 plt.plot(fpr, tpr) 6 plt.xlim([0.0, 1.0]) 7 plt.ylim([0.0, 1.0]) 8 plt.title('ROC curve for diabetes classifier') 9 plt.xlabel('False Positive Rate (1 - Specificity)') 10 plt.ylabel('True Positive Rate (Sensitivity)') 11 plt.grid(True)