F1 score意義


 

一、四種平均算法

  • 平方平均數:Qn=√ [(a12+a22+...+an2)/n] ——>應用:標准差
  • 算術平均數:An=(a1+a2+...+an)/n ——>1階平均 ,是加權算數平均的一種特殊形式,缺點:容易受極端值影響
  • 幾何平均數:Gn=(a1·a2...an)1/n ——>
  • 調和平均數:Hn=n/(1/a1+1/a2+...+1/an) ——>-1階平均 ——>調和平均給予較小值更高的權重

關系滿足:調和平均Hn ≤ 幾何平均Gn ≤ 算數平均An ≤ 平方平均Qn

 

加權算術平均、加權幾何平均、算數-幾何平均等都是 基於以上4種進一步得來。

拓展1——>若有兩個正實數 x 和 y,那么其算數平均數列{an},幾何平均{bn}都會收斂,並收斂至同一實數,這個數稱為 x 和 y 的算術-幾何平均數,記為 M(x, y) 或 agm(x, y)。

拓展2——>加權算數平均

拓展3——>移動平均

原理:根據時間序列資料、逐項推移,依次計算包含一定項數的序時平均值,以反映長期趨勢的方法。

應用:當時間序列的數值由於受周期變動和隨機波動的影響,起伏較大,不易顯示出事件的發展趨勢時,使用移動平均法可以消除這些因素的影響,顯示出事件的發展方向與趨勢(即趨勢線),然后依趨勢線分析預測序列的長期趨勢。

 

拓展4——>加權調和平均 

β>1:召回率(Recall)影響更大,eg. F2

β<1:查准率(Precision)影響更大,eg. F0.5

β=1:得到 ,即 F1 score。

 

二、F1 score 

F1 score是一個平均數,選擇了最后一種調和平均數算法進行計算,對精確率P與召回率R 進行平均的一個結果;

公式: 

幾何意義:圖中的直線和各個機器學習PR曲線的交點表示recall和precision的一個“平衡點”,它是另外一種度量方式,即定義F1值

 

特點:就是會更多聚焦在較低的值,所以會對每個指標非常重視;

看harmony公式變形:Hn=2*a*b/(a+b);a+b恆等於1,a*b=a*(1-a)=-a^2+a; 令導數為-2a+1=0,a=0.5時值最大;Hn的最大值為0.5,從這里可以看出如果a+b有約束的情況下,a與b的值越接近Hn值越大;

在F1 sore這里,a與b不存在共同約束,只有0<=a<=1,0<=b<=1,所以最大值不只只是0.5。比如說Hn=2*1*1/(1+1)=1,這也是最完美的,此時,精確率與召回率都是100%;

 

 

 

【參考】

【1】算術平均、幾何平均、調和平均、平方平均和移動平均

β<1:查准率(Precision)影響更大,eg. F0.5

拓展4——>加權調和平均 

β>1:召回率(Recall)影響更大,eg. F2

 

 

β<1:查准率(Precision)影響更大,eg. F0.5

β=1:得到 ,即 F1 score


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM