機器學習：評價分類結果（F1 Score）

本文轉載自查看原文 2018-07-31 14:29 1153 機器學習算法

一、基礎

疑問1：具體使用算法時，怎么通過精准率和召回率判斷算法優劣？

根據具體使用場景而定：

例1：股票預測，未來該股票是升還是降？業務要求更精准的找到能夠上升的股票；此情況下，模型精准率越高越優。
例2：病人診斷，就診人員是否患病？業務要求更全面的找出所有患病的病人，而且盡量不漏掉一個患者；甚至說即使將正常人員判斷為病人也沒關系，只要不將病人判斷成健康人員就好。此情況，模型召回率越高越優。

疑問2：:有些情況下，即需要考慮精准率又需要考慮召回率，二者所占權重一樣，怎么中歐那個判斷？
方法：采用新的評價標准，F1 Score；

二、F1 Score

F1 Score：兼顧降准了和召回率，當急需要考慮精准率又需要考慮召回率，可查看模型的 F1 Score，根據 F1 Score 的大小判斷模型的優劣；

F1 = 2 * Precision * recall / (precision + recall)，是二者的調和平均值；

F1 是 precision 和 recall 的調和平均值；
調和平均值：如果 1/a = (1/b + 1/c) / 2，則稱 a 是 b 和 c 的調和平均值；
調和平均值特點：|b - c| 越大，a 越小；當 b - c = 0 時，a = b = c，a 達到最大值；
具體到精准率和召回率，只有當二者大小均衡時，F1 指標才高，

三、F1 Score 的使用

F1 Score 指標在 scikit-learn 中封裝在了 sklearn.metrics 模塊下的 f1_score() 方法中
```
from sklearn.metrics import f1_score

f1_score(y_test, y_log_predict)
# 0.8674698795180723
```

import numpy as np
from sklearn import datasets

digits = datasets.load_digits()
X = digits.data
y = digits.target.copy()

y[digits.target==9] = 1
y[digits.target!=9] = 0

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=666)

from sklearn.linear_model import LogisticRegression
log_reg = LogisticRegression()
log_reg.fit(X_train, y_train)
y_log_predict = log_reg.predict(X_test)

from sklearn.metrics import precision_score
precision_score(y_test, y_log_predict)
# 精准率：0.9473684210526315

from sklearn.metrics import recall_score
recall_score(y_test, y_log_predict)
# 召回率：0.8

from sklearn.metrics import f1_score
f1_score(y_test, y_log_predict)
# F1 Score 指標：0.8674698795180723

使用scikit-learn 中 sklearn.metrics 模塊下的 confusion_matrix()、precision_score()、recall_score()、f1_score() 方法時，所需要的參數都是 y_test、y_predict；

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 機器學習中的 precision、recall、accuracy、F1 Score 機器學習中的評價指標 (acc/precision/recall/F1/ROC/PR) 與相關接口 (sklearn) 機器學習分類算法評價指標【筆記】F1 score F1 score意義機器學習 F1-Score 精確率 - P 准確率 -Acc 召回率 - R 機器學習算法中的評價指標（准確率、召回率、F值、ROC、AUC等）機器學習常用性能度量中的Accuracy、Precision、Recall、ROC、F score等都是些什么東西？整理分類評價指標【TPR、TNR、pre、F1、混淆矩陣】機器學習算法評價指標