注:本文是人工智能研究網的學習筆記
准確率
accuracy_score:函數計算分類准確率,返回被正確分類的樣本比例(default)或者是數量(normalize=False)
在多標簽分類問題中,該函數返回子集的准確率,對於一個給定的多標簽樣本,如果預測得到的標簽集合與該樣本真正的標簽集合嚴格吻合,則subset accuracy =1.0否則是0.0
混淆矩陣
在機器學習中尤其是統計分類中,混淆矩陣(confusion matrix),也被稱為錯誤矩陣(error matrix)。
矩陣的每一列表達了分類器對於樣本的類別預測,二矩陣的每一行則表達了版本所屬的真實類別
之所以叫做’混淆矩陣‘,是因為能夠很容易的看到機器學習有沒有將樣本的類別給混淆了。

Table of confusion
在預測分析中(predictive analytics)中table of confusion有時也叫(confusion matrix)是一個兩行兩列的表,這個表報告了四個預測相關的事件發生的數量: false positive, False negative, true positve和false negative。這個表可以讓我們更加詳細的分析預測系統的性能,熱不是僅僅用一個准確率。
Accuracy是一個不可靠的分類器性能度量標准,因為當數據集中不同類的別的樣本數量分布不平衡的時候,它將會產生誤導人的結果。
比如說,如果數據集中有95個貓和5個狗,分類器會簡單的將其分為貓,這樣的准確率是95%。

最終的table of confusion是把所有的table of confusion平均組合起來的結果。


