精度評定中的准確率(Precision)和召回率(Recall)
在模式識別中,我們經常會使用到一些指標對目標識別或者影像分類的結果進行評價。
假設我們需要將一個樣本集分類為蘋果和非蘋果兩類,那么分類結果有四種情況:

第一種情況:True Positive,本來就是蘋果被分類成蘋果;
第二種情況:False Positive,本來不是蘋果被分類成蘋果;
第三種情況:False Negative,本來是蘋果被分類成非蘋果;
第四種情況:True Negative,本來不是蘋果被分類成為非蘋果。
True是指分類正確,False是指分類錯誤。
Positive是指被分類器分為蘋果(正樣本),Negative是指被分類器分為非蘋果(負樣本)。
這里我們引入三個指標來對分類器進行評價:
(1)准確率(Precision),又稱“精度”、“正確率”;
(2)召回率(Recall),又稱“查全率”;
(3)F1-Score,准確率和召回率的綜合指標。

一般來說,准確率和召回率反映了分類器性能的兩個方面,單一依靠某個指標並不能較為全面地評價一個分類器的性能。
假如分類器只將蘋果特征十分明顯、是蘋果的概率非常高的樣本分為蘋果,其余的樣本分為非蘋果,此時該分類器的准確率就會非常的高,但是它因為將所有疑似蘋果都錯誤分為非蘋果,召回率變得非常低。
假如分類器將所有可能為蘋果的樣本全部划分為蘋果,其余的樣本為非蘋果,此時該分類器的召回率會非常之高,但是它因為將所有可能為蘋果的樣本分為蘋果時引入了許多錯誤,准確率不可能高。
引入F1-Score作為綜合指標,就是為了平衡准確率和召回率的影響,較為全面地評價一個分類器。
有時候考慮到不同的需求,可能會更看重准確率或者召回率。這時我們可以引入F2-Score和F0.5-Score。包括F1-Score,這三個指標都來自以下定義,只是參數不同。

其中,F1-Score是指准確率和召回率一樣重要;
F2-Score是指召回率比准確率重要一倍;
F0.5-Score是指准確率比召回率重要一倍
