深入理解F1-score


本博客的截圖均來自zeya的post:Essential Things You Need to Know About F1-Score | by Zeya | Towards Data Science

 

F1-score的定義:准確率(precision)和召回率(recall)的調和平均(harmonic mean)

 

 

 

  這里主要理解一下為什么使用調和平均,從“調和”這個詞出發也可以知道,調和平均可以使得recall和precision之間的差距較小,否則F1會很小,這個很小的幅度比幾何平均、算數平均來的還要快,以下是三種平均值的定義:

 

 

 按照zeya的說法,如果我們瀏覽器搜索為什么F1分數使用調和平均,則會得到類似“調和平均會懲罰不相等的 數對 懲罰的更厲害”(harmonic mean penalises unequal values more)和“調和平均會懲罰極值”(harmonic mean punishes extreme values),具體理解調和平均相對於另外兩種平均的優勢可以看下圖:

 

此網址是上圖的動態圖:Online Graph Maker · Plotly Chart Studio

平面的兩個坐標軸是召回率和准確率,紫色的點是調和平均的值,綠色的點是幾何平均的值,紅色的點是算數平均的值,讓我們來看坐下角的值:

 

 

 

 

 

 

從上圖我們可以知道,對於相同的(precision=1,recall=0.05)數對,紫色的調和平均給的分數最低,也就是懲罰這種不平均、不平衡或是有極值的(准確率,召回率)數對懲罰的最厲害,從整體上看,紫色的最彎曲,意味着對於相同的(precision,recall)坐標,調和平均的分數不會比其他兩種高。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM