轉自http://hi.baidu.com/penghouwen/item/5615d9ac379254a229ce9db5
首先這幾個術語會高頻率得出現在論文的實驗部分,它是對實驗結果的描述,首先我想先解釋這幾個縮寫的含義:
precesion:查准率,即在檢索后返回的結果中,真正正確的個數占整個結果的比例。
recall:查全率,即在檢索結果中真正正確的個數 占整個數據集(檢索到的和未檢索到的)中真正正確個數的比例。
FN:False Negative,被判定為負樣本,但事實上是正樣本。
FP:False Positive,被判定為正樣本,但事實上是負樣本。
TN:True Negative,被判定為負樣本,事實上也是負樣本。
TP:True Positive,被判定為正樣本,事實上也是證樣本。
這里的正樣本和負樣本與檢索的關系就是:你認為為正樣本的應該都出現在檢索結果中,而你認為為負樣本的應該不出現在檢索結果中,但是你認為的和事實上的會有不一樣。
這里的四個縮寫曾經一度讓我很難記住,經過細想,發現這樣比較好記憶:把縮寫分為兩個部分,第一個字母(F,T)和第二個字母(P,N)。首先搞清楚第二個字母,即它是你認為該樣本的歸屬應該是怎樣(Positive or Negative);第一個字母即是對你的判斷進行的評價(False or True)。這里也許中文可能會有不好理解的地方,所以我想用英文來描述,可能更清晰:第二個字母:What's your judgement about the sample?;第一個字母:Is your judgement right(true) or not(false)?
那么有:
precesion = TP/(TP+FP) 即,檢索結果中,都是你認為應該為正的樣本(第二個字母都是P),但是其中有你判斷正確的和判斷錯誤的(第一個字母有T ,F)。
recall = TP/(TP+FN)即,檢索結果中,你判斷為正的樣本也確實為正的,以及那些沒在檢索結果中被你判斷為負但是事實上是正的(FN)。
