准確率 召回率 精確率 :
准確率->accuracy, 精確率->precision. 召回率-> recall. 三者很像,但是並不同,簡單來說三者的目的對象並不相同。
大多時候我們需要將三者放到特定的任務環境中才會更加明顯的感覺到三者的差異。
在介紹這些之前,我們先回顧一下我們的混淆矩陣。
- True Positive(真正, TP):將正類預測為正類數.
- True Negative(真負 , TN):將負類預測為負類數.
- False Positive(假正, FP):將負類預測為正類數 →→ 誤報 (Type I error).
- False Negative(假負 , FN):將正類預測為負類數 →→ 漏報 (Type II error)
1)精確率:
實際上非常簡單,精確率是對我們的預測結果而言的指標。其作用的主要范圍主要是在我們的預測結果中。對於實際結果集的大小,並不在精確率的考慮中。
2)召回率
召回率是針對我們原來的樣本而言的,它表示的是樣本中的正例有多少被預測正確了。那也有兩種可能,一種是把原來的正類預測成正類(TP),另一種就是把原來的正類預測為負類(FN)。
3)准確率(accuracy)
准確率(accuracy) =(TP+TN)/(TP+FN+FP+TN)
由上面三個公式可以看出來,我們三個指標所面向的目標集是不同的。其中很明顯看出來P是面向我們所選中的XP樣本,也就是說是面向我們的預測結果,而召回率面向的是之前中應該本選中的樣本,也就是本身的應該被選中的樣本集而言。而准確率則是面向的所有不該選中和應該被選中的樣本。
4)F1-Score:
從上面的P和R的公式中,很容易發現,兩者的存在可能會有一定的矛盾,很難實現雙高的情況,為了兼顧這兩個指標,我們提出了F1-Score:
其中還出現了其他的F系參數,如F貝塔等等。